Бесплатно напишу регулярное выражение. Часть 2.

surrealmix

Client
Joined
Mar 7, 2013
Messages
715
Reaction score
409
Points
63
Подскажите пожалуйста универсальную (вне зависимости от атрибутов тега <a>) регулярку для парсинга анкоров ссылок.
 

rostonix

Известная личность
Joined
Dec 23, 2011
Messages
29,067
Reaction score
5,719
Points
113
Подскажите пожалуйста универсальную (вне зависимости от атрибутов тега <a>) регулярку для парсинга анкоров ссылок.
Code:
(?<=<a.*?>).*?(?=</a>)
 
  • Thank you
Reactions: surrealmix
Joined
Jul 2, 2010
Messages
412
Reaction score
120
Points
43
Подскажите регулярку чтобы парсились строки с не более чем 2 точками:
пример текста для обработки:
ddd.ddddd
d.ddddddd.dd
dddddd.dd.dd.dd
dd.d.ddd.dd.dd.dddd

чтобы выдавало только первый и второй результат, т.е. в которых не больше 2 точек включительно
Спасибо.

Upd.
Накостылил \w+\.\w+\.\w+
 

Master

Client
Joined
May 3, 2010
Messages
17
Reaction score
2
Points
3
Ребята выручайте!)

Есть такой кусок кода который весь в 1 строку в html:
PHP:
...<div class="card cbox"><a href="/dk?st.cmd=userMsgs&amp;st.chatWith=bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin&amp;_prevCmd=userDlgs&amp;tkn=3993#lst" class="sclnk"><div class="ccard nopt">...
надо выдернуть все ссылки с подобным кодом:
PHP:
/dk?st.cmd=userMsgs&amp;st.chatWith=bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin&amp;_prevCmd=userDlgs&amp;tkn=3993#lst
где bofiurwpgqxdjqwluo0qphgwbcjhcirhnpuin и 3993 меняются у ссылок на страницы
 

surrealmix

Client
Joined
Mar 7, 2013
Messages
715
Reaction score
409
Points
63
регулярка
Code:
/dk\?st\.cmd=userMsgs&amp;st\.chatWith=.*?&amp;_prevCmd=userDlgs&amp;tkn=.*?#lst
 

Svyat

Client
Joined
Apr 10, 2012
Messages
97
Reaction score
8
Points
8
Есть участок кода
<h4 class="blogHeader">
<a href="http://site.com/apps/blog/27887502-electronic-">Electronic </a>


</h4>

подскажите регулярку чтоб выдрать URL
 

surrealmix

Client
Joined
Mar 7, 2013
Messages
715
Reaction score
409
Points
63
Есть участок кода
<h4 class="blogHeader">
<a href="http://site.com/apps/blog/27887502-electronic-">Electronic </a>


</h4>

подскажите регулярку чтоб выдрать URL
Странный вопрос, потому что в Зенно есть конструктор регулярных выражений и у Вас простая регулярка.
Указываем в конструкторе рег. выражений текст кторый есть до нужного нам значения, затем указываем тот, который есть после нужного значения и ставим галочку "Самое короткое совпадение".
В данном случае:
Текст до href="
Текст после "

Скриншот: http://clip2net.com/s/5ci64J
 

finista

Client
Joined
Oct 10, 2012
Messages
365
Reaction score
57
Points
28
По возможности, прошу подсказать

Есть div <div id="group_contacts" class="module clear page_list_module"> между ним и закрывающим его тегом </div>, много еще чего. Как правильней спарсить DOM тега? Т.е все что внутри его

Сама страница https://vk.com/ya_ego_a_on_aaa, раздел контакты

Спасибо
 

rostonix

Известная личность
Joined
Dec 23, 2011
Messages
29,067
Reaction score
5,719
Points
113
  • Thank you
Reactions: finista

finista

Client
Joined
Oct 10, 2012
Messages
365
Reaction score
57
Points
28
спасибо
 

ibelieve

Client
Joined
Dec 24, 2012
Messages
250
Reaction score
96
Points
28
Пожалуйста, помогите отловить строку с адресом блога. Простая задача на первый взгляд, но ничего не выходит (версия Zenno 4.5.0.2). Конструктор Рег.Выр. то ничего не видит, то выхватывает пол страницы кода. Вот здесь сам код страницы http://yadi.sk/d/WVCLc-ly61wUT А вот нужная строчка href="http://ousporniva.blogspot.com/">View blog</a> из которой нужно выпарсить URL блога.
 

tonic

Client
Joined
Aug 7, 2011
Messages
103
Reaction score
50
Points
28
если страница всегда на англ. языке попробуйте так
(?<="\ href=")http://.*?(?=/">View\ blog)
 
  • Thank you
Reactions: ibelieve

ibelieve

Client
Joined
Dec 24, 2012
Messages
250
Reaction score
96
Points
28
Спасибо огромное!!! Это то, что нужно! :-)
Понял свою ошибку. Мне нужно было вставлять в "Перед искомым тестом всегда есть" символы " href=" включая не только пробел, но и кавычки с предыдущей строки кода.

Ещё раз спасибо, очень помогли!
 

VovanSam

Client
Joined
Feb 18, 2013
Messages
1
Reaction score
1
Points
3
Есть строка:
Найден 4 241 человек
Подскажите как выбрать все числа в одну строку без пробела? Если \d{1,} то он берет 4 и 242 в две строки.
 
  • Thank you
Reactions: LightWood

ZennoScript

Moderator
Joined
Mar 4, 2011
Messages
4,452
Reaction score
1,888
Points
113
(?<=Найден\ ).*?(?=\ человек)
Ребята, пользуйтесь конструктором регулярных выражений. Он поможет решить вопросы с такими простыми регулярками.
 

dynamix

Client
Joined
Dec 28, 2012
Messages
28
Reaction score
1
Points
3
Есть текстовый файл, нужно регуляркой дергать из него куски текста до 10.000 символов. В конструкторе регулярок не нашел ничего об ограничении по количеству символов, прошу подсказать знающих.
 

rostonix

Известная личность
Joined
Dec 23, 2011
Messages
29,067
Reaction score
5,719
Points
113
.{10000}
Но это ровно для 10000 символов.
 
  • Thank you
Reactions: dynamix

dynamix

Client
Joined
Dec 28, 2012
Messages
28
Reaction score
1
Points
3
ок, а до 10000 можете написать?
 

propipes

Client
Joined
Feb 20, 2012
Messages
13
Reaction score
4
Points
3
Подскажите, как через Regex-замену сделать это.
Есть строка: http://ya.ru">ляляля
Нужно сделать: <a href="http://ya.ru">ляляля</a>

В текстовом редакторе типа PSPad было бы так:
Найти: (.*?)">(.*)
Замена: <a href="$1">$2</a>
 

ZennoScript

Moderator
Joined
Mar 4, 2011
Messages
4,452
Reaction score
1,888
Points
113
Подскажите, как через Regex-замену сделать это.
Есть строка: http://ya.ru">ляляля
Нужно сделать: <a href="http://ya.ru">ляляля</a>

В текстовом редакторе типа PSPad было бы так:
Найти: (.*?)">(.*)
Замена: <a href="$1">$2</a>
Находите нужный текст регуляркой чтото вроде этой http.*">.*
вставляете полученный текст в переменную (к примеру text)
Дальше через Операции над текстом - замена, заменяете переменную {-Variable.text-} на <a href="{-Variable.text-}</a>
 

igorello

Новичок
Joined
Jul 14, 2013
Messages
1
Reaction score
0
Points
1
Как обрезать количество символов (беру всего 1 строку из файла)?
http://yandex.ru, а нужно yandex.ru
 

sdrem71

Client
Joined
Sep 9, 2012
Messages
7
Reaction score
0
Points
0
Подскажите регулярное выражение, чтобы искало все, что оканчивается на 2 именно в конце строки.
 

diomidov

Client
Joined
Jul 13, 2011
Messages
38
Reaction score
3
Points
8
Подскажите регулярное выражение, чтобы искало все, что оканчивается на 2 именно в конце строки.
Вот
.*2$
 
  • Thank you
Reactions: sdrem71

rostonix

Известная личность
Joined
Dec 23, 2011
Messages
29,067
Reaction score
5,719
Points
113
Подскажите регулярное выражение, чтобы искало все, что оканчивается на 2 именно в конце строки.
Если построчно проверяете

.*2$
 
  • Thank you
Reactions: sdrem71

rostonix

Известная личность
Joined
Dec 23, 2011
Messages
29,067
Reaction score
5,719
Points
113
Last edited:

sdrem71

Client
Joined
Sep 9, 2012
Messages
7
Reaction score
0
Points
0

sdrem71

Client
Joined
Sep 9, 2012
Messages
7
Reaction score
0
Points
0
Спасибо. Все работает, просто скопировал с пробелом на конце!:D
 

СТЕПАН

Moderator
Joined
Mar 17, 2013
Messages
951
Reaction score
353
Points
63
Доброго времени!

Столкнулся с задачей

<span class="row_title">Группа:</span>
<span class="row_data">Пользователь</span>

<span class="row_title">Email:</span>
<span class="row_data">123123123@123.123</span>

<span class="row_title">ICQ:</span>
<span class="row_data">123123123</span>
Подскажите рег выр для парсинга только одного слова "Пользователь" <span class="row_data"> эти границы </span> повторяются как до так и после и в каждом случае количество их разное
 

СТЕПАН

Moderator
Joined
Mar 17, 2013
Messages
951
Reaction score
353
Points
63
Понимаю что всегда перед искомым тексто будет это

<span class="row_title">Группа:</span>
<span class="row_data">

а после всегда это

</span>

но какой символ (оператор использовать тут)

<span class="row_title">Группа:</span>
<span class="row_data">

не могу понять так как получается две строки а рег выр пишется в одну подскажите что нужно написать вот сюда чтоюы оно разаботало?

(?<=Группа:</span>ВОТ сюда<span class="row_data"> )[\w\W]*?(?=</span>)
 

Users Who Are Viewing This Thread (Total: 2, Members: 0, Guests: 2)