Как парсить ссылки без атрибутов и классов?

Victor

Client
Регистрация
22.06.2014
Сообщения
89
Благодарностей
4
Баллы
8
Нужно спарсить ссылки на страницы товаров магазина.
Там у ссылок нет никаких атрибутов и классов.
Как парсить в таком случае?
 

Astraport

Client
Регистрация
01.05.2015
Сообщения
4 983
Благодарностей
4 433
Баллы
113
Привязывайтесь к элементу с классом "photos", а ссылку парсите у его родителя.
Требуется знание C#
Либо через Xpath
 

Yuriy Zymlex

Moderator
Команда форума
Регистрация
24.10.2016
Сообщения
6 518
Благодарностей
3 370
Баллы
113
Всё там имеется. Проще через xPath, в дочерних элементах название товара и прочее. И href, кстати - атрибут.
По xPath:
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113
есть же
href
часть ссылки внутряка типа - каталог

46746



можно вообще вот так сделать :-)

46747
 

semafor

Client
Регистрация
27.12.2016
Сообщения
289
Благодарностей
404
Баллы
63
Ну я бы попробовал по xpath родителя

C#:
//список, нужно создать в проекте
var list = project.Lists["Имя_списка_который создали"];

//получаем все элементы a по указанному пути в коллекцию
HtmlElementCollection hcol = instance.ActiveTab.FindElementsByXPath(@"//div[contains(@class, 'icat')]/a"); // или второй вариант @"//div[@class='icat wl400']/a"

//сохраняем в список атрибуты href
for (int i=0;i<hcol.Count; i++)
{
    //получаем элемент коллекции
    HtmlElement he = hcol.GetByNumber(i);  
    //получаем его аттрибут href
    string href = he.GetAttribute("href");
    //сохраняем в список
    list.Add(href);
}
P.S. Код не проверял
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)