при парсинге русского текста если не уточнять кодировку собирает нужный текст но не читабельный.
А при такой форме {-RegExp.RegExp-|-{-FieldData.FieldData-|-●2●2●1●7●5●8●-|-≡1≡9≡3≡1≡4≡3≡1≡0≡1≡3≡-}-|-(?<=\<h2\>)[\w\W]*?(?=\<\/h2\>)|(?<=name\'\)\"\>)[\w\W]*?(?=\<\/a\>)-|-all-|-cp1251}
результат весь исходный текст и сам макрос
{-RegExp.RegExp-|-
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
...
</body>
</html>
-|-(?<=\<h2\>)[\w\W]*?(?=\<\/h2\>)|(?<=name\'\)\"\>)[\w\W]*?(?=\<\/a\>)-|-all-|-cp1251}
пробовал заменять и на -utf8/utf-8/win1251
нет нужного результата.
.txt файлы генерируются.
Будьте любезны ! Подскажите как правильно прописать кодировку при работе с русским текстом и исходным текстом страницы.
Заранее благодарен
А при такой форме {-RegExp.RegExp-|-{-FieldData.FieldData-|-●2●2●1●7●5●8●-|-≡1≡9≡3≡1≡4≡3≡1≡0≡1≡3≡-}-|-(?<=\<h2\>)[\w\W]*?(?=\<\/h2\>)|(?<=name\'\)\"\>)[\w\W]*?(?=\<\/a\>)-|-all-|-cp1251}
результат весь исходный текст и сам макрос
{-RegExp.RegExp-|-
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
...
</body>
</html>
-|-(?<=\<h2\>)[\w\W]*?(?=\<\/h2\>)|(?<=name\'\)\"\>)[\w\W]*?(?=\<\/a\>)-|-all-|-cp1251}
пробовал заменять и на -utf8/utf-8/win1251
нет нужного результата.
.txt файлы генерируются.
Будьте любезны ! Подскажите как правильно прописать кодировку при работе с русским текстом и исходным текстом страницы.
Заранее благодарен