ZennoScript
Moderator
- Регистрация
- 04.03.2011
- Сообщения
- 4 451
- Благодарностей
- 1 885
- Баллы
- 113
удалить все теги при помощи макроса замены по регулярному выражению, которым поменять вот это \<.*?\> на пустое значение.
Это понятно,а как после названия зделать переход на новую строкуудалить все теги при помощи макроса замены по регулярному выражению, которым поменять вот это \<.*?\> на пустое значение.
Понял ,спасибо буду пробовать.Тогда надо сначала удалить теги, потом регуляркой взять текст до первой точки, дальше добавить {-String.Enter-} и потом остальной текст.
Cначала пропарсить текст такой регуляркой:чтобы вытащить ип и порт нужна регулярка.
<td><font color="#333333">222.88.40.6</font></td><td><font color="#333333">8080 </font></td><td><font color="#333333">
(\d{1,3}\.){3}\d{1,3}.*?(?= \<\/font\>)
</font></td><td><font color="#333333">
мне это надо в проксичекер вставить, там вроде только 3и регулярки нужны.Cначала пропарсить текст такой регуляркой:
Затем макросом замен заменить всеPHP:(\d{1,3}\.){3}\d{1,3}.*?(?= \<\/font\>)
на двоеточие :PHP:</font></td><td><font color="#333333">
Вот такая регулярка.<!--+++++++++++++++++++++++++++++++++++++++++++ 0 +++++++++++++++++++++++++++++++++++++++++++--->
<div class="box">
<h2>
Заводные игрушки
</h2>
</div>
<h3>
<a title="Крутящаяся Белка Сками" onclick="setCookieForOmniture('oz_mch', 'catalog_toy-catlst-sdef-name')" href="/context/detail/id/7017753/">
Крутящаяся Белка Сками</a>
</h3>
<!--+++++++++++++++++++++++++++++++++++++++++++ 0 +++++++++++++++++++++++++++++++++++++++++++--->
Результат нужен Текст без линков внутри <h2> и <h3> ( Заводные игрушки , Крутящаяся Белка Сками)
(?<=\<h2\>)[\w\W]*?(?=\<\/h2\>) --- это для <H2>,
- для <Н3> как вписать перенос строки и табуляцию между <h3> и <a title, </a> и </h3> ? \w\W ?
- как вписать множество знаков в одной строке <a title= ... /context/ ... > .*? ?
(?<=\<h3\>\w\W\<a title\=.*?\/context\/.*?\>)[\w\W]*?(?=\<\/a\>\w\W\<\/h3\>) --- это выражение не работает
кто знает будьте любезны, подскажите правильное решение
заранее благодарен
(?<=\<h3\>\r\s\<a title\=\").*?(?=\" onclick)
гранд мерсиВот такая регулярка.
PHP:(?<=\<h3\>\r\s\<a title\=\").*?(?=\" onclick)
У меня в ДОМ коде страницы все находится в одной строке - http://gyazo.com/1b2989ed66937992e44b7de78131dfbc а регулярка составлена с переводом строки, как в вашем примере кода.гранд мерси
но возможно какаято ошибка
ничего не находит
_http://www.ozon.ru/context/catalog/id/1133928/
это адрес исходной страницы
Что должен делать фильтр?есть фильтр для очистки английской текстовки в TextPipePro, но нужно ещё фильтры для польского, чешского, испанского, немецкого и др. европейских языков, сможете ли как-то изменить мой английский файл-фильтр под них?
Но из десяти линков оно выдёргивает только 5, а остальные почему-то нет. Подскажите как решить проблему?(?<=\<h3 class\=\"b-result__head\"\>\<a href\=\")http.*\/\"
<div class="title">
<a href="http://gameproj.ru/strategy/74-skachat-east-india-company-20.html">Скачать East India Company (2009/ENG) + UA-IX бесплатно</a>
</div>
\<a href\=\"http:\/\/gameproj\.ru\/.*\/\d+.*\.html\"\>.*\<\/a\>
[b][COLOR="#0000FF"](?<=\< div class\=\"title\"\>)[/b][/COLOR]\<a href\=\"http:\/\/gameproj\.ru\/.*\/\d+.*\.html\"\>.*\<\/a\>
.*
(?<=\<div class\=\"title\"\>\r\n)[\w\W]*\<a href\=\"http:\/\/gameproj\.ru\/.*\/\d+.*\.html\"\>.*\<\/a\>