Поиск и сравнение

  • Автор темы Автор темы Artproma
  • Дата начала Дата начала

Artproma

Client
Регистрация
01.07.2014
Сообщения
84
Реакции
12
Баллы
8
Необходимо парсить на постоянной основе некую автонаполняемую страницу.
Задача в следующем:
1. Нужно парсить новые публикации в таблицу (уже реализовано).
2. Каждый раз при парсинге нужно сравнивать по определенному параметру (например по названию), чтоб не парсить повторно. как это реализовать?
 
топорный вариант - складывать напарсенные в п.1 названия в дополнительный файл и в п.2 проверять новые названия на совпадение с теми, которые уже записаны в файле (содержимое файла берем в переменную и в ней ищем вхождение)..
менее топорный вариант - сравнивать с содержимым таблицы.. алгоритм: берем столбец с названиями из таблицы, сливаем все в переменную и ищем вхождение.. если вхождение не найдено, то значит у нас новая публикация..
 
Последнее редактирование:
  • Спасибо
Реакции: Artproma
Спасибо... сделал
 
топорный вариант - складывать напарсенные в п.1 названия в дополнительный файл и в п.2 проверять новые названия на совпадение с теми, которые уже записаны в файле (содержимое файла берем в переменную и в ней ищем вхождение)..
менее топорный вариант - сравнивать с содержимым таблицы.. алгоритм: берем столбец с названиями из таблицы, сливаем все в переменную и ищем вхождение.. если вхождение не найдено, то значит у нас новая публикация..

Можно подробнее описать весь процесс ? какие экшены использовать.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)