Обработка текста

Jeronimo · 22.07.2019

Первым кубиком возьми все совпадения через регулярку (?<=<span\ class="uppercase">).*?(?=</a>) и помести их в переменную/список
Вторым кубиком удали из всех найденных совпадений тег через обработку текста

Metrix · 23.07.2019

Либо распарсить с помощью поиска элементов через XPath или CSSselector, есть инструменты из коробки в ProjectMaker.

Sergodjan · 23.07.2019

twisterrr сказал(а):
занимаюсь шаблоном парсера litres.ru , застрял на таком моменте, нужно вытащить названия жанров в список, проблема в том что первая буква идет через тег span.
подскажите как грамотно вытащить названия жанров из такой разметки ?

<li>Жанр: <a href="/knigi-priklucheniya/priklucheniya_knigi/" class="biblio_info__link">книги о приключениях</a>, <a href="/knigi-fentezi/lubov/" class="biblio_info__link">любовное фэнтези</a>, <a href="/knigi-uzhasy-mistika-trillery/mistika/" class="biblio_info__link">мистика</a>, <a href="/knigi-lubovnye-romany/ostrosyuzhetnyye/" class="biblio_info__link">остросюжетные любовные романы</a></li>

Как вариант можно так:

- Регуляркой спарсить в список
- Объединить список в переменную
- Почистить переменную от тегов 
- Очистить список
- Добавить переменную в список

Шаблон приложил.

Sergodjan · 23.07.2019

twisterrr сказал(а):
сразу в список http://prntscr.com/oivvg3

Какая то беда с сервисом скриншотов - нет картинки.
Вставляйте скриншоты прямо из буфера обмена в пост (в Расширенном редакторе поста).

Sergodjan · 23.07.2019

Отлично! в который раз убеждаюсь, что новый инструмент парсинга данных - замечательная штука. :-)

Поиск

Обработка текста

twisterrr

Client

Jeronimo

Client

twisterrr

Client

Metrix

Client

Sergodjan

Administrator

Вложения

twisterrr

Client

Sergodjan

Administrator

twisterrr

Client

Вложения

Sergodjan

Administrator

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)