- Регистрация
- 03.05.2016
- Сообщения
- 733
- Благодарностей
- 485
- Баллы
- 63
Всем привет, есть задача собрать блоки с текстом HtmlElement со странице(что бы в дальнейшем с ними взаимодействовать через эмуляцию) и очистить его от ненужного хлама.
Пример сайта https://ria.ru/
Написал такой код который с этим справляется, но фильтрует долго
Наткнулся на .AsParallel(), но через него результат не выдается
Подскажите, как ускорить фильтрацию коллекции HtmlElements
Пример сайта https://ria.ru/
Написал такой код который с этим справляется, но фильтрует долго
C#:
var result = tab.FindElementsByXPath("//div[text()]")
.Where(text => text.InnerText.Length > 50)
.Where(text => text.InnerText.Split('\n').Length < 2)
.ToList();
C#:
var asResult = tab.FindElementsByXPath("//div[text()]")
.AsParallel()
.Where(text => text.InnerText.Length > 50)
.Where(text => text.InnerText.Split('\n').Length < 2);
Последнее редактирование: