Как быстро парсить заголовки <title> при помощи GET?

extazy-z

Новичок
Регистрация
04.08.2023
Сообщения
12
Благодарностей
0
Баллы
1
Добрый день. Помогите придумать решение.

У меня есть список из 40.000 ссылок, мне надо спарсить все заголовки <title>. Я знаю, что это можно сделать быстро при помощи GET-запросов, но не знаю как. Помогите пожалуйста - буду благодарен.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 407
Благодарностей
9 114
Баллы
113
Добрый день. Помогите придумать решение.

У меня есть список из 40.000 ссылок, мне надо спарсить все заголовки <title>. Я знаю, что это можно сделать быстро при помощи GET-запросов, но не знаю как. Помогите пожалуйста - буду благодарен.
Добрый день.

GET-запрос в этом случае простой - по адресу страницы получаете html-исходник страницы в выходную переменную и из этой переменной вторым действием парсите регуляркой title.

Регулярка: (?i)(?<=<title>)[\w\W]*?(?=</title>)
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)