Нужно спарсить все содержимое страницы, в DOM модели нет всех результатов

seowin

Client
Регистрация
02.05.2016
Сообщения
125
Благодарностей
11
Баллы
18
Помогите спарсить список альбомов исполнителей с Яндекс музыки.
Например, https://music.yandex.ru/artist/7002056/albums не получается спарсить все альбомы, их 47, а парсится всего лишь 20, в DOM модели всех альбомов нет.
Ранее с таким не сталкивался.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
21 588
Благодарностей
9 607
Баллы
113
Помогите спарсить список альбомов исполнителей с Яндекс музыки.
Например, https://music.yandex.ru/artist/7002056/albums не получается спарсить все альбомы, их 47, а парсится всего лишь 20, в DOM модели всех альбомов нет.
Ранее с таким не сталкивался.
Можно делать парсинг и прокручивать страницу и снова делать парсинг и потом очистить список/таблицу от дублей.
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 842
Благодарностей
1 468
Баллы
113
Зачем вообще парсить браузером, если можно получить запросом весь список сразу в JSON:

Причем, в ответе видишь, сколько всего альбомов, соответственно, столько страниц и проходишь,накручивая счетчик в page={тут}
Плюс можно делать большие выборки, чтобы делать меньше запросов. Т.е., делаем не pageSize=20, а pageSize=50
И т.д.
 
  • Спасибо
Реакции: one, Sergodjan и seowin

seowin

Client
Регистрация
02.05.2016
Сообщения
125
Благодарностей
11
Баллы
18
Можно делать парсинг и прокручивать страницу и снова делать парсинг и потом очистить список/таблицу от дублей.
Обычно всегда так и делал, но здесь код не менялся почему-то...
 

seowin

Client
Регистрация
02.05.2016
Сообщения
125
Благодарностей
11
Баллы
18
Зачем вообще парсить браузером, если можно получить запросом весь список сразу в JSON:

Причем, в ответе видишь, сколько всего альбомов, соответственно, столько страниц и проходишь,накручивая счетчик в page={тут}
Плюс можно делать большие выборки, чтобы делать меньше запросов. Т.е., делаем не pageSize=20, а pageSize=50
И т.д.
Благодарю!
Не знал что есть апи, тут намного проще тогда все решается.
 

Moonwalker

Client
Регистрация
16.03.2016
Сообщения
1 842
Благодарностей
1 468
Баллы
113
Благодарю!
Не знал что есть апи, тут намного проще тогда все решается.
Так не надо знать заранее, надо просто всегда смотреть в браузере список запросов на странице. Там нередко все нужное лежит прямо под рукой, и не надо будет выдумывать велосипед )) Я тоже не знал, открыл в браузере страницу по ссылке, нажал F12, обновил страницу )))
 
  • Спасибо
Реакции: j2082192

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)