Регулярные выражения на все случаи жизни

Jidibi · 03.11.2017

КарлМаркс написал(а):
Как взять текст которых находит между тегами 
нужно взять из

Tuesday, 12 January 2016


Tuesday, 12 January 2016
то есть нужно цепляться за месяц или день недели.

дом и регуляркой:

Код:

(?<=<span>)[\w\W]*?(?=</span>)

либо

Код:

(?<=<span>).*?(?=</span>)

либо если береш через GET запрос,
обработка текста Regex

КарлМаркс · 03.11.2017

Jidibi написал(а):
дом и регуляркой:

Код:

(?<=)[\w\W]*?(?=)

либо

Код:

(?<=).*?(?=)

либо если береш через GET запрос,
обработка текста Regex

не совсем правильно обьяснил
мне нужно взять текст который находится в данных тегах и содержит например January

orka13 · 03.11.2017

Если текст такой:

Код:

<span>
Tuesday, 12 January 2016
</span>
<span>
фигня без дат
</span>

То такая регулярка ищет только строки с указанными днями и месяцами (надо дополнить всеми вариациями), без "фигни":

Код:

(?<=<span>\s+).*?(Tuesday|Monday|Wednesday).*?(January|February|March).*?(?=\s+</span>)

MikR0ReR · 04.11.2017

Привет! Прошу поправить регулярку: (?<=href=('|"))/[^/][\w\.\u0020!@#$%:;&?/=_-]*?(?=(\1))
(?<=href=('|")) впереди искомого должно быть href=" или href='
/ начало искомого
[^/] второй символ искомого не должен быть /. Пробовал добавлять [^"] в разных вариантах, не хочет работать.
[\w\.\u0020!@#$%:;&?/=_-] далее эти символы могу встречаться, даже пробел
(?=(\1)) ну и ссылка на " или '

лезит /" class=

вход:
<a href="/" class="pflogo"></a> лезит /" class=
<li><a href="/youtube.php">YOUTUBE</a></li>
<li><a href="/facebook.php">FACEBOOK</a></li>
href='//www.2.org/favicon.ico' found at 150
href='//www.2.org' found at 12205

выход:
/youtube.php
/facebook.php

ДОБИЛСЯ РЕШЕНИЯ! добавил (?!") и получил (?<=href=('|"))/(?!")[^/][\w\.\u0020!@#$%:;&?/=_-]*?(?=\1) пока все работает

serg32 · 07.11.2017

Добрый вечер!

Столкнулся с такой проблемой, создал регулярку в конструкторе регулярных выражений, в самом конструкторе все работает отлично, но по факту ничего не находит, а при проверке регулярки на онлайн сервисах выдается ошибка, что-то типа "Квантификатор внутри lookbehind делает его не фиксированной шириной"

Вот текст, который обрабатывается регуляркой:

"Received: from [127.0.0.1] (helo=udomain.ru)
by con.smprot.pro
(envelope-from <info@udomsia.ru>)
id 1e9EIA-0004gw-LJ
for kiselev@mail.ru; Mon, 30 Oct 2017 17:56:06 +0000"

В конструкторе получилось следующие:

(?<=con.smprot.pro[\w\W]*?id ).*?(?=\s) - это в конструкторе работает без проблем, но в коде любого языка и самом зп выдает ошибку при компиляции, подскажите где ошибка? Я так думаю ему не нравится символы переноса строки "[\w\W]" и звездочка после них, так как он не знает максимальную глубину поиска, это судя по переводу ошибки)

orka13 · 08.11.2017

да, другие проги могут лажать, но зенка и в кубике "Обработка текста - Regex", и в C# блоке норм принимает такую регулярку. Может ты как-то не так ее используешь. Надо так:

Код:

string In_Text = project.Variables["Text"].Value; // в переменной Text лежит наш текст
string pattern = @"(?<=con.smprot.pro[\w\W]*?id ).*?(?=\s)"; // наша регулярка
var regex = new System.Text.RegularExpressions.Regex(pattern, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
if (regex.IsMatch(In_Text))
    return regex.Match(In_Text); // это выводим то что нашли (первое совпадение)
else
    return "No";  // это отвечаем если ничего не находим

MikR0ReR · 08.11.2017

serg32 написал(а):
а при проверке регулярки на онлайн сервисах выдается ошибка

Реализация регулярных выражений различается в разных языках программирования например: С# JavaScript PHP Python. Не мудрено что не работает. Смотрите какой язык поддерживает онлайн сервис.

Сам я пользуюсь для С#:
http://regexhero.net/ программа на компьютер (ваша регулярка работает)
http://rextester.com/tester онлайн сервис (ваша регулярка работает)

редко
http://regexstorm.net/tester онлайн сервис (ваша регулярка работает)
http://derekslager.com/blog/posts/2007/09/a-better-dotnet-regular-expression-tester.ashx онлайн сервис (ваша регулярка работает)

serg32 · 09.11.2017

Всем спасибо за советы и предложения, проверял на сервисе
https://regex101.com/ - вот тут была ошибка, причем ругается гад на звездочку, она же везде используется...
Пришлось подгонять, регулярка составлялась не под ЗП а под другой язык, я хотел просто использовать ее конструктор, думал что он универсальный, а как выяснилось вообще нет) Пришлось заморачиваться, час делов и регулярка готова))

yriy158 · 10.11.2017

Можно ли как-то одной регуляркой с

Код:

data-type="item" data-email="kushinoleg@mail.ru" data-id="" data-first-name="Олег" data-last-name=

вытащить
kushinoleg@mail.ru и Олег
и желательно что бы сразу записать их через какой-то разделитель, например ; ?
Заранее спасибо!

Hannes · 11.11.2017

Добрый день!
Можете помочь в составление регулярки?

Нужно взять все английские и русские буквы, цифры и символы (){}[]^@!~#%^&*+-_|\/"':;.,=?><
Задача очистка текста по регулярке, удалить всё кроме символов выше.

upd:
Задача решена, в другом топике Orka13 помог.
Регулярка:
[^A-Za-zА-ЯЁа-яё0-9\{\}\[\]\^\@\!\~\#\%\^\&\*\+\-\|\\\/\"\'\:\;\.\,\=\?\>\<]

Sanekk · 15.11.2017

yriy158 написал(а):
Можно ли как-то одной регуляркой с

Код:

data-type="item" data-email="kushinoleg@mail.ru" data-id="" data-first-name="Олег" data-last-name=

вытащить
kushinoleg@mail.ru и Олег
и желательно что бы сразу записать их через какой-то разделитель, например ; ?
Заранее спасибо!

нашли решение? тоже искал когда-то что-то подобное... интересно так можно с разделителем вообще сделать?

Dimionix · 16.11.2017

yriy158 написал(а):
Можно ли как-то одной регуляркой с

Код:

data-type="item" data-email="kushinoleg@mail.ru" data-id="" data-first-name="Олег" data-last-name=

вытащить
kushinoleg@mail.ru и Олег
и желательно что бы сразу записать их через какой-то разделитель, например ; ?
Заранее спасибо!

Можно заменой по регулярке

Код:

.*((?<=data-email=\").*?(?=\")).*((?<=data-first-name=\").*?(?=\")).*

на

Код:

$1;$2

kapelan28 · 17.11.2017

Подскажите регулярку, как взять последнее значение из текста?

Код:

ACCESS_NUMBER:123456:7900000000

Банальное - (?<=

.* - дает обе группы цифр, а нужны только после второго двоеточия
P.S. смайлик из-за автозамены, там двоеточие и скобка

Dimionix · 17.11.2017

kapelan28 написал(а):
Подскажите регулярку, как взять последнее значение из текста?

\d+$ (если только цифры) или \w+$ (если буквы, цифры и нижние подчеркивания)
Или [^:]+$ (любые символы, кроме двоеточия)

Astraport · 23.11.2017

Подскажите, плиз
Урлы такого типа

https://www.facebook.com/story.php?...generic&notif_id=1511429158450390&ref=m_notif

Нужно взять всю левую часть до второго символа &, т. е. должно получиться https://www.facebook.com/story.php?story_fbid=1696732392377027&id=100001207465877

Dimionix · 23.11.2017

Astraport написал(а):
Нужно взять всю левую часть до второго символа &

Последовательность параметров точно не меняется?
Если нет, то варианты регулярок:

Код:

^.*?&.*?(?=&)
^.*?(?=&notif_t)
^.*?&id=\d+
^.*?story_fbid=\d+&id=\d+

Если может меняться, то можно сделать замену по регулярке

Код:

(.*(?=\?)).*((story_fbid|(?<=[^\w])id)=\d+).*(((?<=[^\w])id|story_fbid)=\d+).*

на

Код:

$1?$2&$4

Astraport · 23.11.2017

Dimionix написал(а):
Последовательность параметров точно не меняется?

Спасибо, работает!

ТРОН · 24.11.2017

Парни, подскажите регулярку чтоб отсеивала первые 6 значений в строке и оставляла все, что после.

[TABLE="class: brtb_item_table"][TBODY][TR][TD]На входе:[/TD]
[TD]На выходе:[/TD][/TR]
[TR][TD]*666ТА77*[/TD]
[TD="align: right"]

77*

[/TD][/TR]
[TR][TD]А2**МО99[/TD]
[TD="align: right"]

99

[/TD][/TR]
[TR][TD]А*00МО77[/TD]
[TD="align: right"]

77

[/TD][/TR]
[TR][TD]А7*7****0[/TD]
[TD="align: right"]

**0

[/TD][/TR]
[TR][TD]А0**МО77[/TD]
[TD="align: right"]

77

[/TD][/TR]
[TR][TD]А6*9ММ99[/TD]
[TD="align: right"]

99

[/TD][/TR]
[TR][TD]А666*А7**[/TD]
[TD="align: right"]

7**

[/TD][/TR]
[TR][TD]*777М**50[/TD]
[TD="align: right"]

*50

[/TD][/TR]
[TR][TD]А3*3ММ150[/TD]
[TD="align: right"]

150

[/TD][/TR]
[TR][TD]*777**77[/TD]
[TD="align: right"]

77

[/TD][/TR]
[TR][TD]А**6КР7*7[/TD]
[TD="align: right"]

7*7

[/TD][/TR]
[TR][TD]А**5КР777[/TD]
[TD="align: right"]

777

[/TD][/TR]
[TR][TD]*999ОО750[/TD]
[TD="align: right"]

750

[/TD][/TR]
[TR][TD]А0*0М**50[/TD]
[TD="align: right"]

*50

[/TD][/TR][/TBODY][/TABLE]

orka13 · 24.11.2017

найти по регулярке и заменить на пустоту:

Код:

^.{6}

Dimionix · 24.11.2017

Osedjuse написал(а):
Парни, подскажите регулярку чтоб отсеивала первые 6 значений в строке и оставляла все, что после.

Код:

(?<=^.{6}).*

ТРОН · 24.11.2017

Dimionix написал(а):
Код:

(?<=^.{6}).*

Благодарю, работает как надо

maxtor1986 · 06.12.2017

Есть переменная "dgvbkj45sdv".

Какой регуляркой узнать если там цифры? Если есть - неуспех, только буквы - успех.

orka13 · 06.12.2017

Обработка текста - поиск по Regex в переменную var1:

Код:

\d

Потом эту переменную сравниваете пустая она или нет.

maxtor1986 · 06.12.2017

Вот задачка, которую пытаюсь решить: http://prntscr.com/hjwsar

Задача состоит в чем: в переменной есть текст. Нужно чтобы если ЛЮБОЕ из 2-х значений в нем присутствует, оно положило в переменную. Если не нашло текста - пусто!

evgen_po · 06.12.2017

maxtor1986 написал(а):
Вот задачка, которую пытаюсь решить: http://prntscr.com/hjwsar

Задача состоит в чем: в переменной есть текст. Нужно чтобы если ЛЮБОЕ из 2-х значений в нем присутствует, оно положило в переменную. Если не нашло текста - пусто!

Одну палку а не две нужно прописывать

Dimionix · 06.12.2017

maxtor1986 написал(а):
Вот задачка, которую пытаюсь решить: http://prntscr.com/hjwsar

Задача состоит в чем: в переменной есть текст. Нужно чтобы если ЛЮБОЕ из 2-х значений в нем присутствует, оно положило в переменную. Если не нашло текста - пусто!

Код:

.*(scr|background).*

axiles · 07.12.2017

doc написал(а):
[+#<>$%!`&*{}=:@\\/\r\n] заменить по регулярке на пустоту

Спасибо! Помог очень сильно.

Gizmond · 07.12.2017

Добрый день. Есть текст в переменке. Как регексом рэндомное слово взять?

Dimionix · 07.12.2017

Gizmond написал(а):
Добрый день. Есть текст в переменке. Как регексом рэндомное слово взять?

Регулярка: \b\w+\b
В поле "Номер совпадения (Одно совпадение)" - Random

Gizmond · 08.12.2017

Dimionix написал(а):
Регулярка: \b\w+\b
В поле "Номер совпадения (Одно совпадение)" - Random

Извиняюсь , а можно сделать чтобы выбирались слова которые пишутся на кириллице ? И исключить из этого все спец символы(= * " № ! < ) и т.д ?

Регулярные выражения на все случаи жизни

Пользователь

Активный пользователь

Client

Client

Client

Client

Client

Client

Client

Client

Client

Moderator

Client

Moderator

Client

Moderator

Client

Client

Client

Moderator

Client

Client

Client

Client

Client

Moderator

Client

Client

Moderator

Client

Кто просматривает тему: (Всего: 17, Пользователи: 0, Гости: 17)