- Регистрация
- 26.07.2016
- Сообщения
- 194
- Благодарностей
- 18
- Баллы
- 18
Добрый день. По работе делаю парсер сайта. Нужно взять все ссылки на ДВС со страницы https://parts.japancar.ru/?code=parts&mode=old&cl=search_partsoldng&cl_saler_one=668692&cl_partCode=0JTQktCYLjA5MQ_21 (потом пройтись по каждой ссылке и взять уже нужные мне данные). Парсер на вебе я написал. Сложность состоит в том (как я понимаю), что результат конечной таблицы (которая мне нужна) подгружается скриптом и если брать dom нужной страницы, то будет "Идет загрузка", поэтому приходится парсить в вебе. Ситуацию осложняет то что в многопотоке рано или поздно скрипт подгрузки ответов перестает отрабатывать и на странице появляется "Идет загрузка" пожизненно (дальше не грузит). Также на сайте стоит рекапча 3 (возможно она и не дает прогрузить необходимые данные скрипту). Предполагаю, мне надо сгенерировать какой-то токен, который даст мне полный DOM страницы, так как в консоли разработчика зачем-то повторно грузится эта же страница во вкладке network (или я что то не понял) с уже нужным мне DOM. Или второй вариант это решать каждый раз Recaptcha v3, когда она выскакивает, но я не пойму как мне вытащить данные из файла api.js через зенку (для того чтобы взять sitekey, а потом еще и action). Как заглядывать в файлы(скрипты) сайта через PM я так и не понял. Вообще, конечно, было бы круто понять оба варианта. Готов отблагодарить того, кто поможет решить мне эту проблему.
PS Судя по всему во вкладке network подгружает не второй раз а первый, просто тот дом что мне нужен. Видимо действительно надо что то передавать в гет запросе
PS Судя по всему во вкладке network подгружает не второй раз а первый, просто тот дом что мне нужен. Видимо действительно надо что то передавать в гет запросе
Последнее редактирование: