- Регистрация
- 27.12.2016
- Сообщения
- 289
- Благодарностей
- 404
- Баллы
- 63
Добра всем!
Имеется такой набор — переменная с DOM, HtmlAgilityPack, списки с текстами, динамическое xpath-выражение и необходимость парсинга инфы.
Вот пример html, чтобы было понятно, почему не атрибуты а текст:
Xpath получается такой:
И он работает ровно до тех пор, пока в тексте не появляются всевозможные символы & ( ) . и т.д. Как только они появляются — кирдык, agility не находит ноду.
Пробовал реплейсить "&" на "" — не помогает, видимо такой текст уже отличается от исходного.
Удалять все что после злополучного спецсимвола не подходит, возможно появление чего-то типа "НаконечникиW&BV".
И вот как с этим жить?
Буду признателен за идею зеркалирования этого безобразия.
Имеется такой набор — переменная с DOM, HtmlAgilityPack, списки с текстами, динамическое xpath-выражение и необходимость парсинга инфы.
Вот пример html, чтобы было понятно, почему не атрибуты а текст:
HTML:
<ul>
<li>...</li>
<li>...</li>
<li>...</li>
<li>...</li>
<li>...</li>
<li>...</li>
<li>
<a href="/catalog/oborudovanie/st-nakonechnikiw-h/">Наконечники W&H</a>
</li>
</ul>
@//a[contains(text(),'"+catL1+"')]/following::ul/li/a[contains(text(),'"+catL2+"')]
И он работает ровно до тех пор, пока в тексте не появляются всевозможные символы & ( ) . и т.д. Как только они появляются — кирдык, agility не находит ноду.
Пробовал реплейсить "&" на "" — не помогает, видимо такой текст уже отличается от исходного.
Удалять все что после злополучного спецсимвола не подходит, возможно появление чего-то типа "НаконечникиW&BV".
И вот как с этим жить?
Буду признателен за идею зеркалирования этого безобразия.