Парсинг ссылок с определенного блока на странице

timoxa949

Client
Joined
Nov 16, 2018
Messages
158
Reaction score
27
Points
28
Уважаемые,

Подскажите как спарсить ссылки с определенного блока <DIV> на странице? Собираю все ссылки посредством GET запроса, собирается все подряд. Как отфильтровать регуляркой не пойму.

Мне нужно спарсить ссылки на категории товаров в интернет-магазине, также на этой странице имеется блок контента уже с конкретными товарами (а они мне на этом этапе не нужны!).

Ссылки категорий имеют вид:
site.com/products/category
site.com/products/category1
site.com/products/category2

и т.д.

На странице также выводятся товары с ссылками вида:
site.com/products/category/tovar1
site.com/products/category/tovar2
и т.д.

Мне нужны именно категории. Заранее благодарен.
 

Чешир

Client
Joined
Jun 27, 2014
Messages
1,741
Reaction score
1,087
Points
113
ну, просто же)))
Сначала собрать все ссылки, потом из списка удалить ссылки которые не содержат
site.com/products/category ... типо всякие доставки и способы оплаты
Потом удалить те, которые содержат
/category/
 
  • Thank you
Reactions: timoxa949

timoxa949

Client
Joined
Nov 16, 2018
Messages
158
Reaction score
27
Points
28
ну, просто же)))
Сначала собрать все ссылки, потом из списка удалить ссылки которые не содержат
site.com/products/category ... типо всякие доставки и способы оплаты
Потом удалить те, которые содержат
/category/
Емае)) действительно просто) спасибо товарищ
 

Users Who Are Viewing This Thread (Total: 1, Members: 0, Guests: 1)