- Регистрация
- 22.09.2020
- Сообщения
- 22
- Благодарностей
- 1
- Баллы
- 3
Здравствуйте.
Подскажите пожалуйста рабочий парсер контента с сайта, либо как сделать такой самостоятельно. Я пока на форуме нигде актуального и подходящего не нашел. Принцип работы очень простой:
1. Берет ссылку со списка.
2. Парсит контент.
3. Сохраняет в файл.
Я использую кубик "Article Extraction", но он тянет статью без заголовков.
Если делаю вручную, то получается с H1 и текстом, но без H2 и далее. Зато тянуться комментарии и прочая ерунда, которая абсолютно не нужна.
Как корректно настроить / сделать парсер, чтобы статья была 1 в 1 как у источника?
Большое спасибо.
Подскажите пожалуйста рабочий парсер контента с сайта, либо как сделать такой самостоятельно. Я пока на форуме нигде актуального и подходящего не нашел. Принцип работы очень простой:
1. Берет ссылку со списка.
2. Парсит контент.
3. Сохраняет в файл.
Я использую кубик "Article Extraction", но он тянет статью без заголовков.
Если делаю вручную, то получается с H1 и текстом, но без H2 и далее. Зато тянуться комментарии и прочая ерунда, которая абсолютно не нужна.
Как корректно настроить / сделать парсер, чтобы статья была 1 в 1 как у источника?
Большое спасибо.