Обработка html текста

Дмитрий621985

Пользователь
Регистрация
03.06.2018
Сообщения
166
Благодарностей
6
Баллы
18
Здрасти подскажите инструменты обработки html текста, т.е. есть html текст со всеми тегами, нужно из него получить нормальный текст с переносами смайликами итд со всем содержимым что предусматривали теги в исходнике
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 100
Благодарностей
8 976
Баллы
113
Здрасти подскажите инструменты обработки html текста, т.е. есть html текст со всеми тегами, нужно из него получить нормальный текст с переносами смайликами итд со всем содержимым что предусматривали теги в исходнике
Варианты могут быть например такими:

- использовать макрос {-Page.Text-}
- использовать кубик "Анализ содержимого - Article Extraction"
93171
- использовать макрос {--Page.Dom} или {-Page.Source-} и удалять все html-теги регуляркой: <.*?> через кубик "Обработка текста - Замена (Regex)" на пустоту.

Также были обсуждения на форуме по этой тематике:

А также есть конкурсная статья: https://zennolab.com/discussion/threads/universalnyj-ehkstraktor-tm-kontenta-osnovnoj-stati-stranicy.75657/
 
  • Спасибо
Реакции: Alex.A

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)