Спарсить таблицу

swap

Client
Регистрация
02.12.2014
Сообщения
11
Благодарностей
1
Баллы
3
Коллеги, прошу помочь )
Нужно спарсить таблицу. Объясните, пожалуйста, принцип. Желательно кубиками, с# не знаю.
Пока понимаю так. Сначала каждую строчку вытаскиваем регуляркой во временную переменную, потом из нее каждый столбец и все это засовываем куда надо (хочу в базу mysql). И так каждую строку. Или есть способ получше? Пока ковыряюсь с регуляркой и даже строку еще не удалось корректно вытащить )
А ниже еще потом нужно будет перейти на следующую страницу, это еще не думал как сделать.
Может примеры какие есть? Ютуб весь излазил, не нашел.
Благодарен каждому


2025-02-08_18-12-17.png
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 772
Благодарностей
1 365
Баллы
113
В целом, базово, да. Сперва находишь блок (начало и конец) каждой строки, их все собираешь, условно, в список. Затем этот список проходишь построчно (каждая строка в списке - строка из таблицы), в каждой отдельной строке находишь нужные тебе данные (тоже регулярками), раскладываешь в переменные. Потом эти переменные собираешь в нужный тебе вид.
Насчет следующей страницы. Просто смотри, какие "урлы", и дергай их get-запросами (хотя, может и через post формироваться). Без браузера. Будет стабильнее и быстрее. Пагинация обычно имеет хвост в конце урла, на край - смотри запросы, которые грузятся в браузере, там найти просто нужный запрос, в котором все данные, и посмотреть при клике на "следующую страницу", как выглядит запрос дальше. Там уже потом обычно номер страницы в запросе меняешь через увеличивающийся счетчик, и так идешь до конца.
 
  • Спасибо
Реакции: swap

swap

Client
Регистрация
02.12.2014
Сообщения
11
Благодарностей
1
Баллы
3
Спасибо,
Столкнулся с такой теперь проблемой. Таблица генерится видать скриптом на лету, потому ищу ее в исходниках страницы и не нахожу )
Идут стили, потом скрипты и сразу </body></html>
Все интереснее и интереснее )
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 772
Благодарностей
1 365
Баллы
113
Это какой-то внешний сервис? Или в ЛК Озона аналитика в каком-нить платном тарифе (внешне похоже на Озон)?
update. Вижу, страница "товары в поиске" в отчетах.
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 772
Благодарностей
1 365
Баллы
113
Спасибо,
Столкнулся с такой теперь проблемой. Таблица генерится видать скриптом на лету, потому ищу ее в исходниках страницы и не нахожу )
Идут стили, потом скрипты и сразу </body></html>
Все интереснее и интереснее )
Обычно, да. Т.е., если ты смотришь Source, то там вряд ли что будет. Надо либо брать DOM, либо смотреть в браузере, откуда подгружаются эти данные, и брать их оттуда напрямую.
 
  • Спасибо
Реакции: swap

swap

Client
Регистрация
02.12.2014
Сообщения
11
Благодарностей
1
Баллы
3
Это внутри кабинета продавца озона
Это какой-то внешний сервис? Или в ЛК Озона аналитика в каком-нить платном тарифе (внешне похоже на Озон)?
update. Вижу, страница "товары в поиске" в отчетах.
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 772
Благодарностей
1 365
Баллы
113
  • Спасибо
Реакции: swap

swap

Client
Регистрация
02.12.2014
Сообщения
11
Благодарностей
1
Баллы
3
Спасибо большое. Бегу разбираться )
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)