Как парсить внутренние ссылки из переменной

nicos77777

Client
Регистрация
04.04.2013
Сообщения
333
Благодарностей
18
Баллы
18
Привет всем, хочу сделать шаблон на гет запросах и парсить внутренние ссылки. При этом не хочется использовать regexp и привести все ссылки к стандарту( все с корневым доменом или без). На форуме не нашел подходящего. Подскажите как можно было бы решить эту задачу? Заранее спасибо
 

Alexbrush

Client
Регистрация
20.11.2020
Сообщения
164
Благодарностей
144
Баллы
43
Постоянно собираю любые данные, в том числе и ссылки через связку get + regex.

Не совсем понимаю в чём проблема?
Может больше деталей.

Если надо без разбора все ссылки собирать, поставь в конструкторе что перед значение href=" и после того, что нужно собрать ". Так получишь все ссылки и абсолютные и относительные.
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 699
Благодарностей
1 078
Баллы
113
Привет всем, хочу сделать шаблон на гет запросах и парсить внутренние ссылки. При этом не хочется использовать regexp и привести все ссылки к стандарту( все с корневым доменом или без). На форуме не нашел подходящего. Подскажите как можно было бы решить эту задачу? Заранее спасибо
Хочется парсить сайты, но не хочется учить regexp? - Так не бывает.
 

nicos77777

Client
Регистрация
04.04.2013
Сообщения
333
Благодарностей
18
Баллы
18
Постоянно собираю любые данные, в том числе и ссылки через связку get + regex.

Не совсем понимаю в чём проблема?
Может больше деталей.

Если надо без разбора все ссылки собирать, поставь в конструкторе что перед значение href=" и после того, что нужно собрать ". Так получишь все ссылки и абсолютные и относительные.
Много мусора попадается. Ты можешь показать свой regexp для парсинга внутрених страниц?
 

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 699
Благодарностей
1 078
Баллы
113

nicos77777

Client
Регистрация
04.04.2013
Сообщения
333
Благодарностей
18
Баллы
18

zarufakis

Client
Регистрация
22.03.2019
Сообщения
1 699
Благодарностей
1 078
Баллы
113

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)