Пишем парсеры в Zennoposter на C#. Инструкция для новичков от новичка часть 2

melutsk · 11.12.2019

Так по извращенному я не парсил еще))

Valandersi · 11.12.2019

Для тех кто только начинает осваивать c# хороший пример, спасибо

Supergrok · 11.12.2019

А я буду изучать, потому что хочу сам парсер себе написать. А можно видео запилить?

Phoenix78 · 11.12.2019

volody00 сказал(а):
видео модераторы не пропустили, из-за того что автор (т.е. я) периодически тупил и из-за этого затянул его на 30 мин. Переписывать не хочу. По шагам запускайте и смотрите, что происходит. если что спрашивайте

самокритично :-)

этот 12-й конкурс прям впечатляет. статья за статьей и все такие интересные :-)

DenisK · 11.12.2019

Спасибо, пригодится . 8-)

Valandersi · 12.12.2019

Пример с человечками хороший, реально на пальцах объяснил

alexkoba25 · 21.12.2019

киньте ссылку на первую статью

В прошлой статье я показал, как парсить на веб

пж

Чешир · 21.12.2019

Спасибо. Очень доходчиво. Даже коту, вроде меня, понятно. А для Хпата есть подобный плагин для Мозиллы (не люблю я Хрома, он говнюк)

limarkximus · 05.04.2020

а как к примеру спарсить толдько нужный блок? к примеру как на картинке..

название команд зачеркнул потому как они не важны и меняются.. в принципе как и другие координаты.. xpath будет везде одинаковый.. только у выделленного будет немного отличаться. так вот как можно спарсить только этот блок ?)

Phoenix78 · 05.04.2020

получить коллекцию по xpath и вытащить элемент по номеру в коллекции или прямо в xpath указать номер нужного элемента [3] например

limarkximus · 09.04.2020

Phoenix78 сказал(а):
получить коллекцию по xpath и вытащить элемент по номеру в коллекции или прямо в xpath указать номер нужного элемента [3] например

хм...

Phoenix78 · 09.04.2020

limarkximus сказал(а):
ну это если они местами и количеством не меняются не меняются...

ну так из скрина не видно уникальных элементов за что можно зацепиться, поэтому и привел как пример номер.

limarkximus · 09.04.2020

Phoenix78 сказал(а):
ну так из скрина не видно уникальных элементов за что можно зацепиться, поэтому и привел как пример номер.

да да.. это я по ходу тупанул.. в коллекцию я как понимаю сразу весь блок вписать же можно.... т.е от начала до конца .. а так как стил будет в некоторых оличаться он их и выпарсит верно? т.е нужные..
не поможешь как составить?

HTML:

<tr>
    <td class="sport tte bas" title="<div><b>Баскетбол</b></div>"><b>B</b></td>
    <td class="location"><div class="starts"><div class="tte" title="<div class='date_hint'><table><tr><td colspan='2'>От ввода прогноза: &nbsp; <b>43 мин. </b></td></tr><tr><td colspan='2'>До начала события: &nbsp; <b>2 ч. 0 м. </b><br /><br /></td></tr><tr><td>Введено:</td><td>9 апреля 2020, 09:15 &nbsp;Мск [GMT+3]</td></tr><tr><td>Событие:</td><td>9 апреля 2020, 12:00 &nbsp;Мск [GMT+3]</td></tr><tr><td>Интервал:</td><td><b>2 ч. 44 мин.</b> от ввода до события</td></tr></table></div>"><span class="input_icon_green"><b><span class="green">43 мин. </span></b></span> &nbsp; &nbsp;<span class="starts_icon_gray"><b>2 ч. 0 м. </b></span></div></div>Тайвань. SBL</td>
</tr>
</table>
<table>
<tr>
    <td class="event head">Событие</td>
    <td class="outcome head">Прогноз</td>
    <td class="stake tte head" title="Ставка, в процентах от банкролла">Размер</td>
    <td class="odds tte head" title="Коэффициент">Коэф.</td>
    <td class="book tte head" title="Букмекерская контора или биржа ставок">Контора</td>
</tr>
<tr>
    <td class="event"><a href="/sub/133661/prvzkbt.UN.L/picks/30031536/"><div class="event_main">Pauian - Bank of Taiwan</div><div class="event_aux">Включая овертайм</div></a></td>
    <td class="outcome tte" title="Тотал">ТМ 180.5</td>
    <td class="stake">1.00%</td>
    <td class="odds"><b>1.55</b></td>
    <!-- <td class="book tte  img_book" title="<b>Bwin</b>" ><b class="darkred tte help" title="<b>Bwin</b>">Bwin</b></td> -->
    <td class="book"><b class="darkred tte help" title="<b>Bwin</b>">Bwin</b></td>
</tr>
</table>

уникальное значение (т.е и начало ) <span class="input_icon_green"> второq блок <tr> ...
только тогда будет следующая проблема)) как почистить не нужное... тогда все в список а оттуда регулярками по идее..

Phoenix78 · 09.04.2020

лучше всю страницу скопируй , а то по одному элементу сложно ось выбрать

заготовка xpath : //span[contains(@class,'icon_green')]/ancestor::table
закинешь весь html, можно ось повыше взять

limarkximus · 09.04.2020

Phoenix78 сказал(а):
лучше всю страницу скопируй , а то по одному элементу сложно ось выбрать

заготовка xpath : //span[contains(@class,'icon_green')]/ancestor::table
закинешь весь html, можно ось повыше взять

не получается весь хтмл скинуть.. попробую сам.. спс)

Phoenix78 · 09.04.2020

limarkximus сказал(а):
не получается весь хтмл скинуть.. попробую сам.. спс)

запихай в файл текстовый и кинь в личку. ну или пробуй сам, после ancestor надо указать верхнего родителя. тоесть сначала ищет //span[contains(@class,'icon_green')] , а потом от найденого ищет наверх до указанного элемента. а потом можно добавить уже нужные пути xpath.

таким образом можно найти данные в соседней таблице цеплясь за данные из соседней верхней таблицы. например
//span[contains(@class,'icon_green')]/ancestor::body/table[2]//td[@class='odds']

body - это как пример, так как в моем примере ничего нет кроме как этого элемента.

Пишем парсеры в Zennoposter на C#. Инструкция для новичков от новичка часть 2

Client

Вложения

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)