Получить список сайтов из выдачи гугл

Serg24

Client
Регистрация
16.12.2017
Сообщения
51
Благодарностей
4
Баллы
8
Не нашел ответа,
есть тхт со списком запросов

задача пройтись по гуглу
https://www.google.com/search?q=запрос

и получить список сайтов в первой 10 (20)

Беда в том, что не знаю как получить весь список, а не только первое или Н-ное значение.

Можно конечно в цикле запустить или спарсить всю страницу и регуляркой найти все урл, потом удалить дубли.

Вопрос, есть ли красивое решение?
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Красивого и одновременно легкого для новичков решения НЕТ.
Придется либо регулярками в список добавлять, либо по xPath в список...
 
  • Спасибо
Реакции: Serg24

evgen2208

Client
Регистрация
12.10.2016
Сообщения
130
Благодарностей
162
Баллы
43
и получить список сайтов в первой 10 (20)
Это при работе через браузер. (правда для первой сотни а не 10/20, но думаю если цифру 100 заменить на нужно - должно все работать).

запрос в браузере вида:

https://www.google.ru/search?q={-Variable.key-}&oq={-Variable.key-}&num=100&start=0&lr=lang_ru
Код:
var tab = instance.ActiveTab;
HtmlElement s;

project.Lists["sites"].AddRange(
tab.FindElementsByTags("h3").Select(_s=>Regex.Match(_s.FindChildByTag("a",0).GetAttribute("href"),@"(?<=\://).+?(?=(/|$))").Value));
 

molotok

Client
Регистрация
17.04.2015
Сообщения
733
Благодарностей
358
Баллы
63
Парсит первую страницу в список
 

Вложения

  • Спасибо
Реакции: Walter_White

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)