- Регистрация
- 16.08.2016
- Сообщения
- 39
- Благодарностей
- 3
- Баллы
- 8
Делаю так:
1. захожу на сайт
2. выдёргиваю контент в текстовую переменную:
Сделал xpath для тех элементов, которые нужно удалить:
//div[@class='t-blue t-rounded-top card-blue phone-full']
//div[@class='constr-card-price card-price l-w100 phone-full']
//div[@class='card-variations-list phone-full']
//div[@class='card-notice']
//div[@class='card-buttons']
//p/b[contains(text(), 'Материал размещен в разделах:')]/parent::*
//p/em[contains(text(), 'Цены в регионах могут отличаться от указанных')]/parent::*
А вот у этого:
//div[@class='cat-block-title is-closed']
Надо заменить DIV на H2
Через регулярки вложенные div-ы мешают удалить родительский div. Да и с xpath прямо одно удовольствие работать.
Нашёл вот такой способ. Но он сложноват.
Какой самый простой способ сделать это на xpath?
Предполагаю, что самый простой способ сохранить найденный фрагмент не в виде текста, а в виде html. А потом работать с ним каким-то методом. Но как это сделать?
Или ещё вариант - может сделать все нужные операции в tab, если это возможно. А потом уже выдернуть контентную область в текст. Только уже почищенную и с заменами.
1. захожу на сайт
2. выдёргиваю контент в текстовую переменную:
Код:
Tab tab = instance.MainTab;
HtmlElement he = tab.FindElementByXPath("//div[@class='content-white']",0);
var result = he.InnerHtml;
return result;
//div[@class='t-blue t-rounded-top card-blue phone-full']
//div[@class='constr-card-price card-price l-w100 phone-full']
//div[@class='card-variations-list phone-full']
//div[@class='card-notice']
//div[@class='card-buttons']
//p/b[contains(text(), 'Материал размещен в разделах:')]/parent::*
//p/em[contains(text(), 'Цены в регионах могут отличаться от указанных')]/parent::*
А вот у этого:
//div[@class='cat-block-title is-closed']
Надо заменить DIV на H2
Через регулярки вложенные div-ы мешают удалить родительский div. Да и с xpath прямо одно удовольствие работать.
Нашёл вот такой способ. Но он сложноват.
Какой самый простой способ сделать это на xpath?
Предполагаю, что самый простой способ сохранить найденный фрагмент не в виде текста, а в виде html. А потом работать с ним каким-то методом. Но как это сделать?
Или ещё вариант - может сделать все нужные операции в tab, если это возможно. А потом уже выдернуть контентную область в текст. Только уже почищенную и с заменами.
Вложения
-
17,4 КБ Просмотры: 158
Последнее редактирование: