Парсер контента

Kuralex

Client
Регистрация
22.09.2020
Сообщения
22
Благодарностей
1
Баллы
3
Здравствуйте.

Подскажите пожалуйста рабочий парсер контента с сайта, либо как сделать такой самостоятельно. Я пока на форуме нигде актуального и подходящего не нашел. Принцип работы очень простой:

1. Берет ссылку со списка.
2. Парсит контент.
3. Сохраняет в файл.

Я использую кубик "Article Extraction", но он тянет статью без заголовков.
Если делаю вручную, то получается с H1 и текстом, но без H2 и далее. Зато тянуться комментарии и прочая ерунда, которая абсолютно не нужна.

Как корректно настроить / сделать парсер, чтобы статья была 1 в 1 как у источника?
Большое спасибо.
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
  • Спасибо
Реакции: Sergodjan и Kuralex

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)