Вырезать всё, что между тегами

SnowWind

Client
Регистрация
10.10.2012
Сообщения
246
Благодарностей
35
Баллы
28
Привет, помогите с регуляркой, нужно вырезать всё что тег <div> внутри которого могут находится ещё теги <div> и всё, что находится между ним

Код:
текст
<div>
</div>
текст
или

Код:
текст
<div>
.....
<div>
.....
</div>
</div>
текст
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Код:
<div>[\w\W]*</div>
- эта регулярка ищет в тексте первый <div> и последний </div> и все что между ними. Но если верстка сложная, и есть еще доп пожелания, то лучше учите как искать содержание нужного <div> в коде через xPath. Это сложнее, но правильнее.
 

SnowWind

Client
Регистрация
10.10.2012
Сообщения
246
Благодарностей
35
Баллы
28
Код:
<div>[\w\W]*</div>
- эта регулярка ищет в тексте первый <div> и последний </div> и все что между ними. Но если верстка сложная, и есть еще доп пожелания, то лучше учите как искать содержание нужного <div> в коде через xPath. Это сложнее, но правильнее.
а как быть тогда с такой конструкцией?
Код:
<div>....</div>
ТЕКСТ
<div>....<div>....</div></div>
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
а как быть тогда с такой конструкцией?
Код:
<div>....</div>
ТЕКСТ
<div>....<div>....</div></div>
А что надо вырезать отсюда? Если получается надо все теги и их содержание вырезать, то должно слово "ТЕКСТ" остаться. Но здесь надо больше входных данных, разносторонних примеров, чтобы сделать регулярку, работающую однаково хорошо в разных условиях. Это сложно, так как регулярки напряму не предназначены для работы со сложным HTML-кодом (DOM-веревом). Я писал - копайте в сторону XPath. То есть образно: вы хотите отшлифовать алмаз, но в руках у вас только бензопила.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)