Парсер цен

Marika

Новичок
Регистрация
22.03.2015
Сообщения
13
Благодарностей
2
Баллы
3
Здравствуйте.

Есть список товаров, для которых нужно собрать "цены из интернета" - цифру-цену и адрес страницы, где этот товар продается.

Подскажите, куда копать. Регулярку для нахождения цены сделать очень проблематично(для меня), а разобрать все сайты по движку интернет-магазина и потом парсить цены - тоже не годный путь, у некоторых сайты самописные.
 

Lexicon

Client
Регистрация
27.12.2012
Сообщения
1 775
Благодарностей
901
Баллы
113
а ограничиться 10-20 донорами цен не получится? для того чтобы построить такой автопарсер это надо прилично себе голову поломать...
Но в общем и целом решение сведется к парсингу серпа, проще через xml проходу всех страниц и опеределения вероятности что данная страница является карточкой товара или содержит прайс-лист, а дальше вообще самое веселое - опеределить вероятность что вот этот конкретный блок содержит цену, ну и выбирать максимальный. Имхо в такой формулировке задача на зенке почти не решаема, ну в разумные сроки)))

Я бы все же смотрел на
парсинг выборки конкурентов
парсинг агрегаторов
в зависимости от товарной тематики - может у кого то микроразметка на страницах есть и оттуда можно удобно цены дернуть
 
  • Спасибо
Реакции: Marika

Marika

Новичок
Регистрация
22.03.2015
Сообщения
13
Благодарностей
2
Баллы
3
а ограничиться 10-20 донорами цен не получится?
Товары сильно разнообразные, от насосов до ноутбуков и мед принадлежностей, одна надежда на микроразметку.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)