- Регистрация
- 15.03.2016
- Сообщения
- 2
- Благодарностей
- 0
- Баллы
- 1
Как чистить текст регулярками, пытаюсь извлечь по ссылкам текста, но сайты разные, парсить пытаюсь через распознование контента, текст парсить но по мимо с ним много мусора и абзацев, слов с пробелами, короткими предложениями и текстами с анкоров, ссылки текстовые на источник статьи.. как это все вычистить?
Последнее редактирование: