Когда парсишь, надо ссылки, сначала удалить дубли, а потом брать по одной ссылки и с удалением, тогда дублей не будет, да и так можно попробовать дубли удалить
Тогда как вариант, старые которые спарсил уже, записывать в файл, и потом, когда новые спарсил, сравнить два списка, а в третьем списке, будет то чего еще у тебя на сайте. Сравнить после парсинга
C#:
List<string> bad = project.Lists["Ссылки из вебмастера"].ToList();//стопслова
List<string> mix = project.Lists["Ссылки из вебмастера новые"].ToList();//потенциальные счастливцы
var good =project.Lists["Новые ссылки"];//те, кото будем осчастливливать точно
List<string> kostyl = new List<string>();//важный элемент индусского кода
//блок очень сложного индусского кода
kostyl=mix.Except(bad).ToList();
foreach(string data in kostyl)
{good.Add(data);}
Нет так не получиться, может все перемешаться, надо разделитель статей или все в одну строку делать, так делай в одну строку, тогда точно все получиться, а дату статьи не парсить, может он вебмастер новости апает в ручную обновляет, или меняет урл, но статья от этого не меняется
У меня такое впечатление, что вопрос не в тему , здесь по моему начинающие зенноводы просят сделать какой нибудь шаблон , а вопрос не в тему вообще , так можно засрать весь топик.
У меня такое впечатление, что вопрос не в тему , здесь по моему начинающие зенноводы просят сделать какой нибудь шаблон , а вопрос не в тему вообще , так можно засрать весь топик.
У меня такое впечатление, что вопрос не в тему , здесь по моему начинающие зенноводы просят сделать какой нибудь шаблон , а вопрос не в тему вообще , так можно засрать весь топик.