- Регистрация
- 30.05.2019
- Сообщения
- 479
- Благодарностей
- 200
- Баллы
- 43
Хочу вытащить заголовки не прибегая к браузеру. Get'ом тащу код страницы, естественно - в переменную.
Вопрос ещё тупее - есть ли аналог .FindElementByXPath() помимо Regex для парсинга заголовков (h1-6) из переменной? Или все же надо писать типа string regex = @"<h{1-6}любые_символы_и_пробелы>*?<h{1-6}> ?
Upd. Ещё идея в голову пришла - результат Get-запроса оформить как коллекцию элементов всех мастей. Тогда задача вроде как решится, но метода для этого я пока что не нашел. Ищу. Идеи и подсказки приветствуются.
Upd2. Кажется нашел. HtmlAgilityPack. Да/Нет?
Вопрос ещё тупее - есть ли аналог .FindElementByXPath() помимо Regex для парсинга заголовков (h1-6) из переменной? Или все же надо писать типа string regex = @"<h{1-6}любые_символы_и_пробелы>*?<h{1-6}> ?
Upd. Ещё идея в голову пришла - результат Get-запроса оформить как коллекцию элементов всех мастей. Тогда задача вроде как решится, но метода для этого я пока что не нашел. Ищу. Идеи и подсказки приветствуются.
Upd2. Кажется нашел. HtmlAgilityPack. Да/Нет?
C#:
var list = project.Lists["Список 1"];
string url = list[0]; //foreach(string item in list)
string res = ZennoPoster.HttpGet(url,"",@"utf-8",ZennoLab.InterfacesLibrary.Enums.Http.ResponceType.HeaderAndBody,30000,"",project.Profile.UserAgent,true,5,null,"",false); //url => item in foreach
Последнее редактирование: