- Регистрация
- 30.04.2018
- Сообщения
- 1 085
- Благодарностей
- 29
- Баллы
- 48
Всем привет помогите разобраться с парсингом, сайт какой то хитрый https://www.sofascore.com/ru/football/2024-08-04
Я решил пойти 2-мя путями что бы собрать все элементы- Страна, Лига, Команды и Счет, но везде вылезают сложности.
1 Вариант представлен на картинке
Если коротко то нашел уникальный teg hr, от него беру родительский элемент и от родительского элемента все div это и есть нужные мне игры, а в дочерних элементах лежит все что нужно. Но родительских элементов почему то 2, а когда кликаю на Show All то появляется 3-ий родительский элемент. НО появившиеся игры я не могу считать
Вот пути которые я использовал
// Родительский элемент
string XPath="//hr[contains(@class,'HorizontalDivide')]/parent::div";
// Так вытаскиваю название игр
HtmlElement htmMain=Tab1.FindElementByXPath(XPath,i);
HtmlElement htmTeg=htmMain.FindChildByXPath("./*",y);
HtmlElement htmCity=htmTeg.FindChildByXPath("./descendant::a",0);
HtmlElement htmCity2=htmCity.FindChildByXPath("./*[name()='bdi']",0);
2 Вариант
Решил попробовать GET запросом получить JJSON
https://www.sofascore.com/api/v1/sport/football/scheduled-events/2024-08-02
Но здесь все так же все хорошо до нажатия на Show All, дальше опять фигня получается
Если коротко то до нажатия на кнопку Show All, все хорошо париться, но после нажатия фигня получается
Я решил пойти 2-мя путями что бы собрать все элементы- Страна, Лига, Команды и Счет, но везде вылезают сложности.
1 Вариант представлен на картинке
Если коротко то нашел уникальный teg hr, от него беру родительский элемент и от родительского элемента все div это и есть нужные мне игры, а в дочерних элементах лежит все что нужно. Но родительских элементов почему то 2, а когда кликаю на Show All то появляется 3-ий родительский элемент. НО появившиеся игры я не могу считать
Вот пути которые я использовал
// Родительский элемент
string XPath="//hr[contains(@class,'HorizontalDivide')]/parent::div";
// Так вытаскиваю название игр
HtmlElement htmMain=Tab1.FindElementByXPath(XPath,i);
HtmlElement htmTeg=htmMain.FindChildByXPath("./*",y);
HtmlElement htmCity=htmTeg.FindChildByXPath("./descendant::a",0);
HtmlElement htmCity2=htmCity.FindChildByXPath("./*[name()='bdi']",0);
2 Вариант
Решил попробовать GET запросом получить JJSON
https://www.sofascore.com/api/v1/sport/football/scheduled-events/2024-08-02
Но здесь все так же все хорошо до нажатия на Show All, дальше опять фигня получается
Если коротко то до нажатия на кнопку Show All, все хорошо париться, но после нажатия фигня получается
Последнее редактирование: