К примеру на странице хтм кода текст:
<h2>текст</h2>
<p> текст текст текст текст текст текст </p>
<ol>
<li>текст</li>
<li>текст</li>
<li>текст</li>
<li>текст</li>
<li>текст</li>
</ol>
<p> текст текст текст текст текст текст текст текст </p>
<blockquote class="instagram-media" style="background: #FFF; border: 0; border-radius: 3px; box-shadow: 0 0 1px 0 rgba(0,0,0,0.5),0 1px 10px 0 rgba(0,0,0,0.15); margin: 1px; max-width: 658px; padding: 0; width: calc(100% - 2px);" data-instgrm-version="7">
<div style="padding: 8px;">
<p> текст текст текст текст текст текст </p>
<ul>
<li>текст</li>
<li>текст</li>
</ul>
<p> текст текст текст текст текст текст текст текст </p>
<h2>текст</h2>
<p> текст текст текст текст текст текст текст текст </p>
Нужно чтобы после обработки осталось все в своем порядке |
[TBODY]
[/TBODY]
и выглядело уже примерно так, чтобы все также как и на странице с которой парсится, только без лишних данных которые не нужны
<h2>текст</h2>
<p> текст текст текст текст текст текст </p>
<ol>
<li>текст</li>
<li>текст</li>
<li>текст</li>
<li>текст</li>
<li>текст</li>
</ol>
<p> текст текст текст текст текст текст текст текст </p>
<p> текст текст текст текст текст текст </p>
<ul>
<li>текст</li>
<li>текст</li>
</ul>
<p> текст текст текст текст текст текст текст текст </p>
<h2>текст</h2>
<p> текст текст текст текст текст текст текст текст </p>
Ну или парсить все что в тегах <P> <li> чтобы не было, что сначала парсит <P> а потом <li>, а чтобы в своем порядке как на странице собрало