Парсер выдачи поисковика Yahoo

  • Автор темы Автор темы Hitachi
  • Дата начала Дата начала
Название тестового шаблона
Yahoo парсер test

Hitachi

Creators Template
Регистрация
25.09.2019
Сообщения
384
Реакции
348
Баллы
63
Описание

Шаблон переходит на сайт yahoo.com, вводит поисковой запрос в строку поиска, проверяет загрузку страницы, парсит ссылки, домен из ссылки и заголовки.
Если ссылка парсится как " r.search.yahoo.com...", через get-запрос получает реальную ссылку.
Переходит на следующую страницу, если это необходимо, проверяет загрузку новой страницы.
Таким образом парсит данные с заданного во входных настройках числа страниц.
Далее шаблон сохраняет результаты в файл и переходит к следующему запросу, пока они не закончатся.

Как пользоваться?

Во входных настройках ввести один или несколько поисковых запросов (каждый с новой строки), указать количество страниц поиска для парсинга.
Если необходимо использовать прокси, добавить их в файл Proxy.txt
Результаты будут сохранены в папку Results в таблицу с уникальным именем "запрос_дата_время" в формате "Домен;Заголовок:URL"
 
Категория
  1. Парсинг
Тип шаблона
Открытый
Многопоточность
Нет
Дата обновления
02.10.2020
Описание обновления
Теперь домен парсится со страницы поиска, а не из ссылки

Вложения

Последнее редактирование:

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)