Как спарить цены товаров на разных сайтах?

noble

Пользователь
Регистрация
09.10.2014
Сообщения
177
Благодарностей
10
Баллы
18
Доброго времени суток.
У меня есть куча сайтов с разной архитектурой представления цен, например:

Я собрал все ссылки и внес их в таблицу. Подскажите, может быть, есть универсальное решение, которое можно применить ко всем вышеуказанным сайтам чтобы регуляроно собирать цены?
 

Astraport

Client
Регистрация
01.05.2015
Сообщения
4 983
Благодарностей
4 433
Баллы
113
Вряд ли удастся найти универсальное решение с высокой степенью корректности собираемых данных.
Даже в рамках одного сайта не всегда возможно универсальное решение из-за разных карточек товаров.
 
  • Спасибо
Реакции: noble и doc

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113
решение: под каждый сайт писать свой парсер
 
  • Спасибо
Реакции: noble и doc

noble

Пользователь
Регистрация
09.10.2014
Сообщения
177
Благодарностей
10
Баллы
18
Всем пасибо за ответы.
 

ZULI

Client
Регистрация
09.09.2020
Сообщения
423
Благодарностей
165
Баллы
43
Даже в рамках одного сайта не всегда возможно универсальное решение из-за разных карточек товаров.
О да, на ozon в разных товарах название и цены в разных местах, с разными путями и классами, вот где универсальный подход :-))

P.S. может у кого есть решение? задолбался, раз 5 уже правил шаблон, пару дней поработает и потом на этих же товарах вываливается в ошибку. Видимо что-то делаю не то.
 

noble

Пользователь
Регистрация
09.10.2014
Сообщения
177
Благодарностей
10
Баллы
18
О да, на ozon в разных товарах название и цены в разных местах, с разными путями и классами, вот где универсальный подход :-))

P.S. может у кого есть решение? задолбался, раз 5 уже правил шаблон, пару дней поработает и потом на этих же товарах вываливается в ошибку. Видимо что-то делаю не то.


Подробнее опишите задачу.
У меня, к примеру, более 70 сайтов. Для каждого я создал шаблоны. Однако некоторые из сайтов имеют несколько товаров по одной и той же ссылке, и вот в этом заключается проблема
 

ZULI

Client
Регистрация
09.09.2020
Сообщения
423
Благодарностей
165
Баллы
43
Подробнее опишите задачу.
К примеру такой товар

тут ценник и заголовок по одному расположен, причем я пробовал делать привязку по xpath и по тэгам, оно день-два поработает и потом меняется

в этом товаре https://www.ozon.ru/product/shlepantsy-tamaris-833023752/ название и ценник вообще по другому размещены на странице

тут https://www.ozon.ru/product/sumka-telezhka-baudet-turizm-276496892/ вообще по третему.

и вроде как один сайт, но разные куски/разделы по разному формируются, как будто разные части сайта делают разные люди :-))

Пытаюсь подобрать xpath или тэги, через пару день-два все меняется. Возможно как-то по другому привязаться можно, хз.
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113
делай xpath через "или" в xpath или = | одна прямая палка
типа такого
xpath1 | xpath2 | xpath3
 
  • Спасибо
Реакции: kagorec

Konrod_m

Client
Регистрация
18.09.2014
Сообщения
1 697
Благодарностей
940
Баллы
113
К примеру такой товар
Пытаюсь подобрать xpath или тэги, через пару день-два все меняется. Возможно как-то по другому привязаться можно, хз.
Мобильную версию пробовали? Должно быть меньше вариантов..
 
  • Спасибо
Реакции: noble

noble

Пользователь
Регистрация
09.10.2014
Сообщения
177
Благодарностей
10
Баллы
18
То есть, вы постоянно ищете новые позиции.
Тогда нужно делать серию шаблонов с логикой if-else.
При проходе одной из веток нужно вносить соответствующую помету, что шаблон номер 3 работает для этой ссылки.
 

ZULI

Client
Регистрация
09.09.2020
Сообщения
423
Благодарностей
165
Баллы
43
делай xpath через "или" в xpath или = | одна прямая палка
типа такого
xpath1 | xpath2 | xpath3
А так было можно? Попробую.

Мобильную версию пробовали? Должно быть меньше вариантов.
Тоже вариант, опробую.

То есть, вы постоянно ищете новые позиции.
Тогда нужно делать серию шаблонов с логикой if-else.
При проходе одной из веток нужно вносить соответствующую помету, что шаблон номер 3 работает для этой ссылки.
И это мысль неплохая.

Спасибо всем, есть 3 идеи, нужно с каждой переспать поработать.
 
  • Спасибо
Реакции: noble

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113
  • Спасибо
Реакции: ZULI и kagorec

ZULI

Client
Регистрация
09.09.2020
Сообщения
423
Благодарностей
165
Баллы
43

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)