- Регистрация
- 25.09.2019
- Сообщения
- 384
- Реакции
- 348
- Баллы
- 63
Описание
Шаблон переходит на сайт yahoo.com, вводит поисковой запрос в строку поиска, проверяет загрузку страницы, парсит ссылки, домен из ссылки и заголовки.
Если ссылка парсится как " r.search.yahoo.com...", через get-запрос получает реальную ссылку.
Переходит на следующую страницу, если это необходимо, проверяет загрузку новой страницы.
Таким образом парсит данные с заданного во входных настройках числа страниц.
Далее шаблон сохраняет результаты в файл и переходит к следующему запросу, пока они не закончатся.
Как пользоваться?
Во входных настройках ввести один или несколько поисковых запросов (каждый с новой строки), указать количество страниц поиска для парсинга.
Если необходимо использовать прокси, добавить их в файл Proxy.txt
Результаты будут сохранены в папку Results в таблицу с уникальным именем "запрос_дата_время" в формате "Домен;Заголовок:URL"
Шаблон переходит на сайт yahoo.com, вводит поисковой запрос в строку поиска, проверяет загрузку страницы, парсит ссылки, домен из ссылки и заголовки.
Если ссылка парсится как " r.search.yahoo.com...", через get-запрос получает реальную ссылку.
Переходит на следующую страницу, если это необходимо, проверяет загрузку новой страницы.
Таким образом парсит данные с заданного во входных настройках числа страниц.
Далее шаблон сохраняет результаты в файл и переходит к следующему запросу, пока они не закончатся.
Как пользоваться?
Во входных настройках ввести один или несколько поисковых запросов (каждый с новой строки), указать количество страниц поиска для парсинга.
Если необходимо использовать прокси, добавить их в файл Proxy.txt
Результаты будут сохранены в папку Results в таблицу с уникальным именем "запрос_дата_время" в формате "Домен;Заголовок:URL"
- Категория
- Парсинг
- Тип шаблона
- Открытый
- Многопоточность
- Нет
- Дата обновления
- 02.10.2020
- Описание обновления
- Теперь домен парсится со страницы поиска, а не из ссылки
Вложения
Последнее редактирование:


