Выдача гугл

stanar

Client
Регистрация
19.12.2015
Сообщения
315
Благодарностей
157
Баллы
43
Подскажите, почему поиск гугл выдает только 30 страниц, хотя найденных гораздо больше?
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 715
Баллы
113
пример запроса?
 
  • Спасибо
Реакции: stanar

stanar

Client
Регистрация
19.12.2015
Сообщения
315
Благодарностей
157
Баллы
43
Да любой. Любое словосочетание выдает 30 страниц, парсер их проходит и все, дальше нет выдачи. Парсер нажимает не на номер страницы в поиске, а на кнопку следующие. Останавливается на 33. По запросу "кино" на рабочем месте выдает овер 40 и дальше, а дома только 30
 

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 226
Баллы
113
Это сделано чтобы затруднить парсинг.
Можно использовать библиотеки дополнительных слов/словосочетаний для более полного извлечения данных.
 
  • Спасибо
Реакции: stanar

stanar

Client
Регистрация
19.12.2015
Сообщения
315
Благодарностей
157
Баллы
43
Спасибо. Руками все просматривается, а не парсится... :(
 

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 451
Благодарностей
1 885
Баллы
113
Дома у Вас может стоят другие настройки таргетинга, чем на работе. Или другие какие фильтры. Потому и результаты разнятся.
 
  • Спасибо
Реакции: stanar

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 226
Баллы
113
Спасибо. Руками все просматривается, а не парсится... :(
Проблеме уже несколько лет.
При правильном подходе гуглу затруднительно определить происходит ли парсинг, или просмотр осуществляется вручную. Мера превентивная. Решается только так, или парсингом клонов поисковика.

P.S.: Благодарность принято выражать нажимая Мне нравится под полезными сообщениями :-)
 
  • Спасибо
Реакции: AmigoHarlamov и stanar

sevenoffer

Client
Регистрация
11.05.2016
Сообщения
32
Благодарностей
138
Баллы
33
  • Спасибо
Реакции: stanar

stanar

Client
Регистрация
19.12.2015
Сообщения
315
Благодарностей
157
Баллы
43
Прямой поиск или API?
Прямой. Через API другие результаты?
Хм, попробовал дома руками - пускает до 40 страницы и дальше. Похоже гугл видит парсинг. Буду пробовать эмуляции с паузами.
 

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 226
Баллы
113
Прямой. Через API другие результаты?
Хм, попробовал дома руками - пускает до 40 страницы и дальше. Похоже гугл видит парсинг. Буду пробовать эмуляции с паузами.
В случае с гуглом подход должен быть комплексным:
  1. По возможности используйте чистые IP.
  2. Используйте https соединение.
  3. Авторизуйтесь.
  4. Используйте случайные "человеческие" паузы (например, от 10 до 17 секунд - подбирается индивидуально)
Приведенные выше манипуляции не панацея, у гугля в рукаве слишком много данных для анализа аномальной активности.
Единственное, что реально работает - слиться с толпой :-)

Для многопоточного парсинга с данными предосторожностями понадобятся чистые прокси с привязкой к аккаунту на каждый поток.
 
  • Спасибо
Реакции: stanar

stanar

Client
Регистрация
19.12.2015
Сообщения
315
Благодарностей
157
Баллы
43
Парсю в один поток. (Парсю?)
Авторизован. Айпи чистый, домашний я бы сказал. Буду мутить паузы
 
  • Спасибо
Реакции: zortexx

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)