Как спарсить повторяющиеся элементы

AntonFix

Client
Регистрация
21.09.2020
Сообщения
2
Благодарностей
0
Баллы
1
Всем привет.
С парсерами дружу, но пока новичок в Zennoposter.

Как спарсить в CSV-файл объявления на сайте: имя, возраст, город, текст?

Всего 20 страниц, на каждой по 10 объявлений.

Каждое объявление имеет повторяющиеся элементы с одинаковыми названиями:

HTML:
<table id="balk">
    <tr>
        <td id="balk">Marcan</td> <!-- Имя -->
        <td id="balk">52 jaar</td> <!-- Возраст -->
        <td id="balk">West-Vlaanderen - Brugge</td> <!-- Город -->
    </tr>
</table>

<div class='profile-container'>
    <div class='profile-title'>Naakt zonnen in prive tuin</div> <!-- Заголовок -->
    <div class="t">
        <div class="b">
            <div class="l">
                <div class="r">
                    <div class="bl">
                        <div class="br">
                            <div id="{7586BCD0-005F-4F76-B3DD-719747201D05}" class='profile-content'> <!-- Уникальный ID у каждого объявления, он не нужен -->
                                <!-- Текст объявления -->
                                Koppel jonge vijftigers stelt deze namiddag de tuin ter beschikking voor een koppel dat
                                graag eens volledig naakt wil zonnen in alle rust en discretie (meer hoeft niet, wij
                                blijven gerust op de achtergrond)
                            </div>
                        </div>
                    </div>
                </div>
            </div>
        </div>
    </div>
</div>

Как повторить парсинг 10 раз на каждой странице и перейти на следующую?

Спасибо за подсказки.
 

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 495
Благодарностей
1 304
Баллы
113
Всем привет.
С парсерами дружу, но пока новичок в Zennoposter.

Как спарсить в CSV-файл объявления на сайте: имя, возраст, город, текст?

Всего 20 страниц, на каждой по 10 объявлений.

Каждое объявление имеет повторяющиеся элементы с одинаковыми названиями:

HTML:
<table id="balk">
    <tr>
        <td id="balk">Marcan</td> <!-- Имя -->
        <td id="balk">52 jaar</td> <!-- Возраст -->
        <td id="balk">West-Vlaanderen - Brugge</td> <!-- Город -->
    </tr>
</table>

<div class='profile-container'>
    <div class='profile-title'>Naakt zonnen in prive tuin</div> <!-- Заголовок -->
    <div class="t">
        <div class="b">
            <div class="l">
                <div class="r">
                    <div class="bl">
                        <div class="br">
                            <div id="{7586BCD0-005F-4F76-B3DD-719747201D05}" class='profile-content'> <!-- Уникальный ID у каждого объявления, он не нужен -->
                                <!-- Текст объявления -->
                                Koppel jonge vijftigers stelt deze namiddag de tuin ter beschikking voor een koppel dat
                                graag eens volledig naakt wil zonnen in alle rust en discretie (meer hoeft niet, wij
                                blijven gerust op de achtergrond)
                            </div>
                        </div>
                    </div>
                </div>
            </div>
        </div>
    </div>
</div>

Как повторить парсинг 10 раз на каждой странице и перейти на следующую?

Спасибо за подсказки.
1. Выучить что такое xpath и как парсить через Xpath.
2. Выучить как разбить спаршенные данные по переменным.
3. Выучить как добавлять в таблицу записи из переменных.

Во всех данных вопросах поможет подобный поиск по форуму.
 
  • Спасибо
Реакции: AntonFix

AntonFix

Client
Регистрация
21.09.2020
Сообщения
2
Благодарностей
0
Баллы
1
1. Выучить что такое xpath и как парсить через Xpath.
2. Выучить как разбить спаршенные данные по переменным.
3. Выучить как добавлять в таблицу записи из переменных.

Во всех данных вопросах поможет подобный поиск по форуму.
Спасибо за ответ! Звучит немного как "я страдал - ты тоже должен страдать" :D

Обо всех пунктах имею достаточное представление - не профи, но с гуглением решаю задачи.

Отвечаю по каждому пункту "выучить-выучить-выучить":
1. Если каждое поле (тэг) имеет хотя бы разные id или названия стилей, то так умею. Не умею когда нет ничего внутри тэгов. Собственно в этом вопрос.
2. Воткнуть найденную область в переменные тоже умею.
3. Это работа с данными или со списками, тоже умею.

Я не понимаю как перейти к парсингу следующего объявления. Смотрел примеры других проектов, уроки, искал по запросу "zennoposter парсинг повторяющихся элементов" - нет внятного ответа.

У меня голова работает чуть по-другому - мне нужен именно 1 рабочий пример. Решил спросить здесь совета.

Раз выучил все пункты, то можешь пример с парсингом повторяющихся элементов без названия показать, пожалуйста? Необязательно на данном html-куске, на своем.

Буду очень благодарен за пример.
 

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 495
Благодарностей
1 304
Баллы
113
1. Если каждое поле (тэг) имеет хотя бы разные id или названия стилей, то так умею. Не умею когда нет ничего внутри тэгов. Собственно в этом вопрос.
Поэтому вам нужно изучить xpath, который позволит вам спарсить все что нужно.
Я не понимаю как перейти к парсингу следующего объявления.
Увы, тут сидят не телепаты, поэтому гадать в чем именно у вас проблема думаю мало кто сможет.
Раз выучил все пункты, то можешь пример с парсингом повторяющихся элементов без названия показать, пожалуйста? Необязательно на данном html-куске, на своем.
На этой же странице форума парсинг по xpath:
Код:
(//span[@class="reaction-text js-reactionText"]//bdi)[1]
(//span[@class="reaction-text js-reactionText"]//bdi)[2]
78200
 
Последнее редактирование:
  • Спасибо
Реакции: AntonFix

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)