- Регистрация
- 11.02.2015
- Сообщения
- 254
- Благодарностей
- 39
- Баллы
- 28
Помогите отчистить контент от мусора, от не нужных тегов в тексте.
Имею вот что:
Есть переменная
в которой находится мой контент, и мне надо убрать множественные конструкции которые мне просто не нужны.
Подскажите наиболее подходящий способ придать множественной обработке с помощью Replace либо как то еще???
Имею вот что:
Код:
// ------------------------------------------------------------- //
// Получаем content статьи;
// ------------------------------------------------------------- //
// Шаблон регулярного выражения;
pattern = @"(?<=<div\ id=""contentleft"">)[\w\W]*?(?=</div>)";
rgx = new Regex(pattern);
// Контент статьи;
var content = rgx.Match(article, 0);
// Чистим от мусора;
content = ..... (удалить теги h1)
content = ..... (удлаить теги ..)
content = ..... (удлаить теги ..)
PHP:
content
Подскажите наиболее подходящий способ придать множественной обработке с помощью Replace либо как то еще???
Последнее редактирование: