Подскажите логику парсинга

qwadra

Client
Регистрация
21.11.2017
Сообщения
264
Благодарностей
42
Баллы
28
Нужно спарсить все названия наушников и цену со всех страниц https://doctorhead.ru/catalog/naushniki_moscow/
Можно ли как то сразу парсить скопом с первой, второй и т.д страниц?
Или надо сперва собрать ссылки на все модели и оттуда уже парсить по 1 позиции?
 

TikTik

Client
Регистрация
26.08.2011
Сообщения
202
Благодарностей
22
Баллы
18
настраиваешь регулярку и парсишь сразу потом сохраняешь в удобном формате в файл

{-Variable.название-}{-Variable.цена-}
 

qwadra

Client
Регистрация
21.11.2017
Сообщения
264
Благодарностей
42
Баллы
28
настраиваешь регулярку и парсишь сразу потом сохраняешь в удобном формате в файл

{-Variable.название-}{-Variable.цена-}
А как я сразу 24 значения по переменным раскидаю?
 

oOmp

Client
Регистрация
22.01.2018
Сообщения
198
Благодарностей
94
Баллы
28
Это если совсем не заморачиваться
 

Вложения

  • Спасибо
Реакции: TikTik

TikTik

Client
Регистрация
26.08.2011
Сообщения
202
Благодарностей
22
Баллы
18
да если не париться и грубо вот через одно место ... , сам только учусь :D скопом да чет у меня ума пока не хваатает ) сайт кстати тормаз :(
 

Вложения

  • 29,5 КБ Просмотры: 100
  • Спасибо
Реакции: qwadra

qwadra

Client
Регистрация
21.11.2017
Сообщения
264
Благодарностей
42
Баллы
28
да если не париться и грубо вот через одно место ... , сам только учусь :D скопом да чет у меня ума пока не хваатает ) сайт кстати тормаз :(
Нафига вы пароль поставили?
 

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
C#:
var response = project.Variables["Response"].Value;

var list = new List<string>();

var regex = new Regex(@"(?<=<div\ class=""pi_base_info"">)[\w\W]*?(?=<div\ class=""prod_action\ show)");
regex.Matches(response).Cast<Match>().ToList().ForEach(m=>list.Add(m.Value.Replace("\r", "").Replace("\n", "")));

foreach (var line in list)
{
    var name = Regex.Match(line, @"(?<=head_name_item[^*>]+"">).*?(?=</a>)").Value.Trim();
    var price = Regex.Match(line, @"(?<=pi_price_cur[^*>]+"">).*?(?=\ \.)").Value.Trim();
 
    FileSystem.FileAppendString(project.Directory + "\\Result.txt", name + ":" + price, true);
}
------------------------------------------------------------------------

2019-05-17_163947.png
 
  • Спасибо
Реакции: qwadra и TikTik

TikTik

Client
Регистрация
26.08.2011
Сообщения
202
Благодарностей
22
Баллы
18

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113

TikTik

Client
Регистрация
26.08.2011
Сообщения
202
Благодарностей
22
Баллы
18
не надо пипи... только проверил все работает ничего в верхнем посте не редактировал
У одного пароль на архив у другова пароля нет но шаб не работает мистика :D
когда вылазиет долбаное окно чата сбивается работа ну можно это отключить
Показал всего лишь принцип я не собирался писать полностью работу за Автора:bm: так как сделал бы я имея минимум знаний в Zenno;-)
По страницам прыгать и т.д... это уже сам
 
Последнее редактирование:

ssXXXss

Client
Регистрация
23.12.2014
Сообщения
7 379
Благодарностей
2 041
Баллы
113
на хромовском движке не работает, пипи на скрине показано
 
  • Спасибо
Реакции: TikTik

TikTik

Client
Регистрация
26.08.2011
Сообщения
202
Благодарностей
22
Баллы
18
на хромовском движке не работает, пипи на скрине показано
c этого и надо было начинать.
по дефолту все летает и шуршит.
когда окно чата саппорта выпрыгнуло у меня тоже так было...
 
Последнее редактирование:

qwadra

Client
Регистрация
21.11.2017
Сообщения
264
Благодарностей
42
Баллы
28
Спасибо за ответы, ssXXXss в особенности, правда это слишком сложно для меня. Наколхозил вот так
колхоз.jpg
 

Вложения

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)