Как парсить данные, не переходя по ссылке?

dikiydi

Новичок
Регистрация
26.03.2024
Сообщения
3
Благодарностей
0
Баллы
1
Добрый день, недавно начал пользоваться программой, не могу разобраться, возможно ли как то получить данные со страницы не открывая ее?

Есть список пользователей на странице, в коде есть ссылки на их профили (прописаны на значках, что бы перейти в профиль). Начинаю парсить страницу, получаю ссылки на их профили, но можно ли как то получить данные не открывая их профили (условно имея просто ссылки), иначе приходится заходить отдельно в каждый профиль и уже оттуда получать данные, а так как сайт совсем унылый приходится ставить большие таймауты, что бы данные успевали прогружаться, что увеличивает время работы программы в разы (желательно на языке для чайников) Спасибо заранее
 

Ахилес

Client
Read only
Регистрация
11.11.2020
Сообщения
956
Благодарностей
392
Баллы
63
вот из твоего поста я спарсил дату регистрации и твой ник и ссылку на твой профиль.

121457


пока я не открою ссылку, других данных не будет у меня.
все браузеры работают по ссылкам, получая данные по каким то адрессам. они это делают автоматически и могут генерировать запросы в очень большом колличестве.

скорее всего нужные данные по спарсенным ссылкам можно получить обычным GET запросом, сгенерировав в паралельном выполнении сразу все ссылки полученные на первом этапе. это будет очень быстро.
но так как ты находишься в стадии знакомства со всем этим хозяйством, то тебе придется довольствоваться очень медленным браузером и переходить последовательно по каждой ссылке что бы получить нужные данные на каждый аккаунт :bn:

но зато есть стимул развиваться и повышая свой скил, создавать все более и более быстрые парсеры.
 
  • Спасибо
Реакции: dikiydi

dikiydi

Новичок
Регистрация
26.03.2024
Сообщения
3
Благодарностей
0
Баллы
1
вот из твоего поста я спарсил дату регистрации и твой ник и ссылку на твой профиль.

Посмотреть вложение 121457

пока я не открою ссылку, других данных не будет у меня.
все браузеры работают по ссылкам, получая данные по каким то адрессам. они это делают автоматически и могут генерировать запросы в очень большом колличестве.

скорее всего нужные данные по спарсенным ссылкам можно получить обычным GET запросом, сгенерировав в паралельном выполнении сразу все ссылки полученные на первом этапе. это будет очень быстро.
но так как ты находишься в стадии знакомства со всем этим хозяйством, то тебе придется довольствоваться очень медленным браузером и переходить последовательно по каждой ссылке что бы получить нужные данные на каждый аккаунт :bn:

но зато есть стимул развиваться и повышая свой скил, создавать все более и более быстрые парсеры.
Да, парсить данные на активной странице я уже научился, нужны именно данные со страниц, ссылки на которые я получаю...
По сути парсер рабочий у меня уже итак есть, сейчас как раз таки пытаюсь усовершенствовать его, буду разбираться, спасибо и на этом
 

Alexbrush

Client
Регистрация
20.11.2020
Сообщения
164
Благодарностей
144
Баллы
43
Да, парсить данные на активной странице я уже научился, нужны именно данные со страниц, ссылки на которые я получаю...
По сути парсер рабочий у меня уже итак есть, сейчас как раз таки пытаюсь усовершенствовать его, буду разбираться, спасибо и на этом
Возможно просто и сбор ссылок на профили и последующий сбор данных по ссылкам через Get запросы сделать - таким образом скорее всего унылость сайта по загрузке страницы не будет помехой и процесс пойдет быстрее.

Почти всегда подобный парсинг минимум в 2 шага. Сначала собираем страницы откуда парсим и после в цикле проходим по каждой и собираем данные. Не заходя на страницы, не угадать что внутри, если только это в ссылки не зашито параметрами, но такое редкость)
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)