- Регистрация
- 24.11.2011
- Сообщения
- 149
- Благодарностей
- 57
- Баллы
- 28
Здравствуйте господа. Хочу состряпать простенького бота и хотелось бы спросить вашего совета, как лучше реализовать следующую задачу.
Есть сайт торговой площадки. У этого сайта есть страница, на которую выводятся все новые лоты.
Обновил страницу - увидел новые лоты. Обновил еще ра- еще раз увидел. Т.е. автоматического обновления этой страницы на сайте нет.
Все позиции представлены следующем образом.
название лота -> его изображение -> цена
Позиции идут одна за одной.
Фактически структура страницы напоминает выдачу ebai
Т.е. я могу спарсить по регулярным выражениям все товары и выбрать их названия.
Вот тут у меня и возникает проблема. Нужно сделать так, чтобы бот игнорировал определенные предметы.
Я планирую составить список вещей, которые бот должен игнорировать, но их будет много. Больше 50 точно.
Сверять каждую строчку из списка на странице со списком предметов из бан листа мне кажется очень долго и не особо эффективно, так как шаблон начнет тормозить через некоторое время.
Может есть какие-то другие способы решения этой задачи или просто проверять на наличие соответствий позиции на странице на позициям в бан листе и в зависимости от ответа принимать решения?
(у меня текущая версия программы 5,4. Если задачу можно решить только в более поздних версиях, то значица буду обновляться)
Есть сайт торговой площадки. У этого сайта есть страница, на которую выводятся все новые лоты.
Обновил страницу - увидел новые лоты. Обновил еще ра- еще раз увидел. Т.е. автоматического обновления этой страницы на сайте нет.
Все позиции представлены следующем образом.
название лота -> его изображение -> цена
Позиции идут одна за одной.
Фактически структура страницы напоминает выдачу ebai
Т.е. я могу спарсить по регулярным выражениям все товары и выбрать их названия.
Вот тут у меня и возникает проблема. Нужно сделать так, чтобы бот игнорировал определенные предметы.
Я планирую составить список вещей, которые бот должен игнорировать, но их будет много. Больше 50 точно.
Сверять каждую строчку из списка на странице со списком предметов из бан листа мне кажется очень долго и не особо эффективно, так как шаблон начнет тормозить через некоторое время.
Может есть какие-то другие способы решения этой задачи или просто проверять на наличие соответствий позиции на странице на позициям в бан листе и в зависимости от ответа принимать решения?
(у меня текущая версия программы 5,4. Если задачу можно решить только в более поздних версиях, то значица буду обновляться)