Парсинг

Halver88

Новичок
Регистрация
15.09.2015
Сообщения
2
Благодарностей
0
Баллы
1
Доброго времени суток. Меня интересует следующий вопрос. Как запретить ZP парсить новости из ленты которые уже были спарсины и при следующем запуске работать ровно до того места где он закончил в прошлый раз.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 358
Благодарностей
9 094
Баллы
113
Доброго времени суток. Меня интересует следующий вопрос. Как запретить ZP парсить новости из ленты которые уже были спарсины и при следующем запуске работать ровно до того места где он закончил в прошлый раз.
заголовки или урлы тех новостей что спарсены можно записывать в файл..
при новом парсинге проверять вхождение заголовка (урла) в этом файле..
то есть получится, как бы, черный список..
 

Halver88

Новичок
Регистрация
15.09.2015
Сообщения
2
Благодарностей
0
Баллы
1
проверять вхождение заголовка (урла) в этом файле..
Спасибо! Подскажите пожалуйста каким екшеном это сделать?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 358
Благодарностей
9 094
Баллы
113
Спасибо! Подскажите пожалуйста каким екшеном это сделать?
файл привязать к списку одним из двух стандартных методов, проще в свойствах списка прописать файл..
после парсинга класть в список строку (заголовок или урл) экшеном Опреции над списком -> Добавить строку..
объединить список в переменную Операции над списком -> Объединить элементы списка -> Положить в переменную..

берем заголовк или урл очередной новости в переменную и с помощтю экшена Обработка текста -> Regex ищем вхождение в черном списке..
с помощью экшена IF сравниваем переменную полученную в предыдущем экшене с пустотой "{-Variable.var-}"!=""
если из IF по зеленой ветке выходит, то значит новая новость, если по красной, то старая..
 
  • Спасибо
Реакции: AloneSlamer и Zmaster

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)