Бесплатно напишу регулярное выражение. Часть 2.

  • Автор темы Автор темы LightWood
  • Дата начала Дата начала
Подскажите пожалуйста универсальную (вне зависимости от атрибутов тега <a>) регулярку для парсинга анкоров ссылок.
 
Подскажите пожалуйста универсальную (вне зависимости от атрибутов тега <a>) регулярку для парсинга анкоров ссылок.

Код:
Развернуть Свернуть Копировать
(?<=<a.*?>).*?(?=</a>)
 
  • Спасибо
Реакции: surrealmix
Подскажите регулярку чтобы парсились строки с не более чем 2 точками:
пример текста для обработки:
ddd.ddddd
d.ddddddd.dd
dddddd.dd.dd.dd
dd.d.ddd.dd.dd.dddd

чтобы выдавало только первый и второй результат, т.е. в которых не больше 2 точек включительно
Спасибо.

Upd.
Накостылил \w+\.\w+\.\w+
 
Ребята выручайте!)

Есть такой кусок кода который весь в 1 строку в html:
PHP:
Развернуть Свернуть Копировать
...<div class="card cbox"><a href="/dk?st.cmd=userMsgs&amp;st.chatWith=bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin&amp;_prevCmd=userDlgs&amp;tkn=3993#lst" class="sclnk"><div class="ccard nopt">...

надо выдернуть все ссылки с подобным кодом:
PHP:
Развернуть Свернуть Копировать
/dk?st.cmd=userMsgs&amp;st.chatWith=bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin&amp;_prevCmd=userDlgs&amp;tkn=3993#lst

где bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin и 3993 меняются у ссылок на страницы
 
регулярка
Код:
Развернуть Свернуть Копировать
/dk\?st\.cmd=userMsgs&amp;st\.chatWith=.*?&amp;_prevCmd=userDlgs&amp;tkn=.*?#lst
 
Есть участок кода
<h4 class="blogHeader">
<a href="http://site.com/apps/blog/27887502-electronic-">Electronic </a>


</h4>

подскажите регулярку чтоб выдрать URL
 
Есть участок кода
<h4 class="blogHeader">
<a href="http://site.com/apps/blog/27887502-electronic-">Electronic </a>


</h4>

подскажите регулярку чтоб выдрать URL
Странный вопрос, потому что в Зенно есть конструктор регулярных выражений и у Вас простая регулярка.
Указываем в конструкторе рег. выражений текст кторый есть до нужного нам значения, затем указываем тот, который есть после нужного значения и ставим галочку "Самое короткое совпадение".
В данном случае:
Текст до href="
Текст после "

Скриншот: http://clip2net.com/s/5ci64J
 
По возможности, прошу подсказать

Есть div <div id="group_contacts" class="module clear page_list_module"> между ним и закрывающим его тегом </div>, много еще чего. Как правильней спарсить DOM тега? Т.е все что внутри его

Сама страница https://vk.com/ya_ego_a_on_aaa, раздел контакты

Спасибо
 
спасибо
 
Пожалуйста, помогите отловить строку с адресом блога. Простая задача на первый взгляд, но ничего не выходит (версия Zenno 4.5.0.2). Конструктор Рег.Выр. то ничего не видит, то выхватывает пол страницы кода. Вот здесь сам код страницы http://yadi.sk/d/WVCLc-ly61wUT А вот нужная строчка href="http://ousporniva.blogspot.com/">View blog</a> из которой нужно выпарсить URL блога.
 
если страница всегда на англ. языке попробуйте так
(?<="\ href=")http://.*?(?=/">View\ blog)
 
  • Спасибо
Реакции: ibelieve
Спасибо огромное!!! Это то, что нужно! :)
Понял свою ошибку. Мне нужно было вставлять в "Перед искомым тестом всегда есть" символы " href=" включая не только пробел, но и кавычки с предыдущей строки кода.

Ещё раз спасибо, очень помогли!
 
Есть строка:
Найден 4 241 человек
Подскажите как выбрать все числа в одну строку без пробела? Если \d{1,} то он берет 4 и 242 в две строки.
 
  • Спасибо
Реакции: LightWood
(?<=Найден\ ).*?(?=\ человек)
Ребята, пользуйтесь конструктором регулярных выражений. Он поможет решить вопросы с такими простыми регулярками.
 
Есть текстовый файл, нужно регуляркой дергать из него куски текста до 10.000 символов. В конструкторе регулярок не нашел ничего об ограничении по количеству символов, прошу подсказать знающих.
 
.{10000}
Но это ровно для 10000 символов.
 
  • Спасибо
Реакции: dynamix
ок, а до 10000 можете написать?
 
Подскажите, как через Regex-замену сделать это.
Есть строка: http://ya.ru">ляляля
Нужно сделать: <a href="http://ya.ru">ляляля</a>

В текстовом редакторе типа PSPad было бы так:
Найти: (.*?)">(.*)
Замена: <a href="$1">$2</a>
 
Подскажите, как через Regex-замену сделать это.
Есть строка: http://ya.ru">ляляля
Нужно сделать: <a href="http://ya.ru">ляляля</a>

В текстовом редакторе типа PSPad было бы так:
Найти: (.*?)">(.*)
Замена: <a href="$1">$2</a>

Находите нужный текст регуляркой чтото вроде этой http.*">.*
вставляете полученный текст в переменную (к примеру text)
Дальше через Операции над текстом - замена, заменяете переменную {-Variable.text-} на <a href="{-Variable.text-}</a>
 
Как обрезать количество символов (беру всего 1 строку из файла)?
http://yandex.ru, а нужно yandex.ru
 
Подскажите регулярное выражение, чтобы искало все, что оканчивается на 2 именно в конце строки.
 
  • Спасибо
Реакции: sdrem71
Последнее редактирование:
Спасибо. Все работает, просто скопировал с пробелом на конце!:D
 
Доброго времени!

Столкнулся с задачей

<span class="row_title">Группа:</span>
<span class="row_data">Пользователь</span>

<span class="row_title">Email:</span>
<span class="row_data">123123123@123.123</span>

<span class="row_title">ICQ:</span>
<span class="row_data">123123123</span>

Подскажите рег выр для парсинга только одного слова "Пользователь" <span class="row_data"> эти границы </span> повторяются как до так и после и в каждом случае количество их разное
 
Понимаю что всегда перед искомым тексто будет это

<span class="row_title">Группа:</span>
<span class="row_data">

а после всегда это

</span>

но какой символ (оператор использовать тут)

<span class="row_title">Группа:</span>
<span class="row_data">

не могу понять так как получается две строки а рег выр пишется в одну подскажите что нужно написать вот сюда чтоюы оно разаботало?

(?<=Группа:</span>ВОТ сюда<span class="row_data"> )[\w\W]*?(?=</span>)
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)