Здравствуйте!
Загрузил текстовый документ - http://u.to/ZalUBA
Текст с тегами что в нем есть, надо спарсить этот участок кода в переменную. Перед текстом должен быть "<p id="" class="p1"><span id="" class="s1">" без кавычек после искомого текста идет "</span><br></p> " без кавычек.
Но проблема в том, что в середине текста все равно остается мусор из тегов, и в место этого мусора хотел бы чтобы были абзацы <p></p>.
Как вариант можно очистить текст от тегов простой регуляркой <.*?>. Но потом не смогу очистить ненужный текст тот что не входил в теги что я указал.
Еще можно загнать в список, потом очищать ненужные теги обработкой текста но как скопировать все строки в переменную непонятно.
P.S. Может я не так делаю, извините если что пожалуйста. В конце концов мне всего надо спарсить определенный текст и внутри него есть теги span и p с классами, от которых тоже надо избавиться и вместо них сделать абзацы
Загрузил текстовый документ - http://u.to/ZalUBA
Текст с тегами что в нем есть, надо спарсить этот участок кода в переменную. Перед текстом должен быть "<p id="" class="p1"><span id="" class="s1">" без кавычек после искомого текста идет "</span><br></p> " без кавычек.
Но проблема в том, что в середине текста все равно остается мусор из тегов, и в место этого мусора хотел бы чтобы были абзацы <p></p>.
Как вариант можно очистить текст от тегов простой регуляркой <.*?>. Но потом не смогу очистить ненужный текст тот что не входил в теги что я указал.
Еще можно загнать в список, потом очищать ненужные теги обработкой текста но как скопировать все строки в переменную непонятно.
P.S. Может я не так делаю, извините если что пожалуйста. В конце концов мне всего надо спарсить определенный текст и внутри него есть теги span и p с классами, от которых тоже надо избавиться и вместо них сделать абзацы