Регулярные выражения на все случаи жизни

Nord · 20.09.2023

bitport написал(а):
Не совсем понял, как использовать?

Взять в переменную совпадение по регулярке

bitport · 20.09.2023

Nord написал(а):
Взять в переменную совпадение по регулярке

(\d+) ₽$ Не даёт результат регулярка, да и короткая

Nord · 20.09.2023

bitport написал(а):
(\d+) ₽$ Не даёт результат регулярка, да и короткая

\s\d+?(?=\s₽)

Alexmd · 20.09.2023

bitport написал(а):
Товарищи помогите решить проблему. Есть список, нужно получить цену.

(?<=-\ ).*?(?=\ ₽\ ) Этой регуляркой получаю, но если в строке ещё одна цифра, то результат такой "134 (KS слюда) - 50"

Как получать только последнее число в строке?

Космос (KS картон) - 50 ₽
Родоппи ( KS картон) - 50 ₽
Opal (KS слюда) - 50 ₽
Ту - 134 (KS слюда) - 50 ₽

C#:

var s = project.Variables["trash"].Value;
return Regex.Match(s, @"(\d+)(?=\s*₽)", RegexOptions.RightToLeft).Value ?? "null";

Все уже придумано. Прикольно.

Кубиком Обработка текста->Regex (\d+)(?=\s*₽)

nexx1 · 20.09.2023

брать строку, и этой регуляркой извлекать цену

bitport написал(а):
Не совсем понял, как использовать?

bitport · 20.09.2023

Nord написал(а):
\s\d+?(?=\s₽)

работает, от души!

Mitnik · 16.10.2023

Подскажите, пожалуйста, как составить регулярку, которая будет определять с заглавной ли буквы (кириллица) написано первое слово фразы или со строчной?
Задача - отсортировать в таблице строки, в которых в определенном столбце прописаны фразы, у которых и нужно определить - заглавная первая буква или строчная.

Nord · 16.10.2023

^[А-Я] - с заглавной

Mitnik написал(а):
Подскажите, пожалуйста, как составить регулярку, которая будет определять с заглавной ли буквы (кириллица) написано первое слово фразы или со строчной?
Задача - отсортировать в таблице строки, в которых в определенном столбце прописаны фразы, у которых и нужно определить - заглавная первая буква или строчная.

Mitnik · 16.10.2023

Nord написал(а):
^[А-Я] - с заглавной

Спасибо огромное )
Вручную проверять - так себе вариант.
А сейчас веселее пойдет.

Grush20 · 18.11.2023

Всем привет. А почему в конструкторе регулярных выражений нет поля "искомый текст содержит"?

Можно ли как-то сразу выбрать регуляркой, например, один параграф из множества, включая теги и содержащий в себе определённое слово или число? Параграфы содержат по несколько строк, а не одну.

Попробовал так: [\w\W]*Нужная[\w\W]*? в регулярку засунуть нужный признак строки - берёт вместе с параграфами которые выше, если таковые имеются.

Образец параграфов:

C#:

<p>
Первая строка
Вторая строка
Какая-то строка
</p>

<p>
Первая строка
Вторая строка
Нужная строка
</p>

<p>
Первая строка
Вторая строка
Ненужная строка
</p>

slavyn8213 · 18.11.2023

может точки не хватает? я не могу сейчас проверить [\w\W]*Нужная[\w\W].*?

Grush20 · 18.11.2023

slavyn8213 написал(а):
может точки не хватает? я не могу сейчас проверить [\w\W]*Нужная[\w\W].*?

Нет, так не работает.

slavyn8213 · 18.11.2023

([^<]*\bНужная\b[^<]*)<\/p>

Grush20 · 18.11.2023

slavyn8213 написал(а):
([^<]*\bНужная\b[^<]*)<\/p>

Спасибо, так пашет! А не подскажите как называются эти галочки в скобочках? Как найти про них почитать подробнее?

slavyn8213 · 18.11.2023

GPT

: Соответствует открывающему тегу .
([^<]*\bнужная\b[^<]*): Сопоставляет текст, содержащий слово "нужная" внутри тегов , исключая другие теги.
<\/p>: Соответствует закрывающему тегу .

K R · 18.11.2023

Grush20 написал(а):
Спасибо, так пашет! А не подскажите как называются эти галочки в скобочках? Как найти про них почитать подробнее?

Символ ^ в квадратных скобках ставится перед тем символом, которого не должно быть в искомом фрагменте текста.
Выражение [^<]* означает, что после могут быть любые символы кроме <. То есть будут взяты все символы до <.
Соответственно регулярное выражение не выйдет за рамки одного абзаца.

Информации по регуляркам много. Вот, например, на хабре.

ALev · 10.01.2024

Ребят, требуется регулярное выражение для EmEditor. Оно у меня будет сложным, но мне хотя бы важно разобраться с его принципом. И так, требуется найти все слова целиком вне зависимости от регистра "аа" и заменить их на "аб", при этом сохранив регистр заменяемого слова. То есть, исходное слово может быть: аа, АА, Аа, аА.
Для "Найти", вот хотя бы есть рабочие вариант:
\b[Аа][Аа]\b
\b([Аа])([Аа])\b
А заменить каким выражением?
Для приведённого примера, результат работы выражения должен преобразовать в: аб, АБ, Аб, аБ.

Deisler · 10.01.2024

ALev написал(а):
Ребят, требуется регулярное выражение для EmEditor. Оно у меня будет сложным, но мне хотя бы важно разобраться с его принципом. И так, требуется найти все слова целиком вне зависимости от регистра "аа" и заменить их на "аб", при этом сохранив регистр заменяемого слова. То есть, исходное слово может быть: аа, АА, Аа, аА.
Для "Найти", вот хотя бы есть рабочие вариант:
\b[Аа][Аа]\b
\b([Аа])([Аа])\b
А заменить каким выражением?
Для приведённого примера, результат работы выражения должен преобразовать в: аб, АБ, Аб, аБ.

Тут нужно создать словарь в котором вы руками пропишите все возможные варианты и соответственно все возможные варианты на которые надо заменить

C#:

string[] aaDictionary = { "aa","AA","Aa","aA" };
string[] abDictionary = {  "ab","AB","Ab", "aB" };

string str = project.Variables["text"].Value;
    int i = 0;
    while (i < abDictionary.Length)
    {
        str = str.Replace(aaDictionary[i], abDictionary[i]);
        i++;
    }

return str;

PS. В моем примере английские буквы

mr. Nik · 13.01.2024

Уважаемые форумчане. Есть регулярка, которая парсила с канала урл, картинку, описание и короткую ссылку, затем складывала все в таблицу; но в определенный момент она перестала работать, прошу помощи!

Канал в телеграмме https://t.me/s/darom_ali

Регулярка: (?<=<a\ class="tgme_widget_message_photo_wrap)[\w\W]*?(https://t\.me/darom_ali/.*?(?="))[\w\W]*?(https://cdn4\.telegram\-cdn\.org/.*?(?='))[\w\W]*?((?<=).*?(?= ))[\w\W]*?((?<=<a\ href=")[\w\W]*?(?="))[\w\W]*?()[\w\W]*?(?=<div\ class="tgme_widget_message_footer\ compact\ js-message_footer">)

Подскажите пожалуйста, где в ней ошибка почему перестала работать?

Sergodjan · 13.01.2024

mr. Nik написал(а):
Уважаемые форумчане. Есть регулярка, которая парсила с канала урл, картинку, описание и короткую ссылку, затем складывала все в таблицу; но в определенный момент она перестала работать, прошу помощи!

Канал в телеграмме https://t.me/s/darom_ali

Регулярка: (?<=<a\ class="tgme_widget_message_photo_wrap)[\w\W]*?(https://t\.me/darom_ali/.*?(?="))[\w\W]*?(https://cdn4\.telegram\-cdn\.org/.*?(?='))[\w\W]*?((?<=).*?(?= ))[\w\W]*?((?<=<a\ href=")[\w\W]*?(?="))[\w\W]*?()[\w\W]*?(?=<div\ class="tgme_widget_message_footer\ compact\ js-message_footer">)

Подскажите пожалуйста, где в ней ошибка почему перестала работать?

Возможно, длинный составной класс class="tgme_widget_message_footer\ compact\ js-message_footer" и/или class="tgme_widget_message_photo поменялся.

Может кто-то подтянется, подскажет.
У меня пока нет возможности проверить, к сожалению.

noble · 20.04.2024

Дорый.
Поскажите как мне уделить все после первого пробела?
252,00 грн|В КОРЗИНУ|2 кг срок до 14.04.24 г|S2_2-sk|965,00 грн|500,00 грн|В КОРЗИНУ|2 кг|S2_2|965,00 грн|В КОРЗИНУ|11,4 кг скидка!|S2_11,4-ak|3 685,00 грн|2 579,00 грн|В КОРЗИНУ|20 кг (breeder)|S2_20|6 134,00 грн|В КОРЗИНУ

То есть у меня должно остаться 252,00

Ribas · 20.04.2024

(?<=\ ).* заменить на пустоту

samsonnn · 20.04.2024

noble написал(а):
То есть у меня должно остаться 252,00

Код:

\S+(?=\s)

noble · 20.04.2024

samsonnn написал(а):
Код:

\S+(?=\s)

Оправка - после первого знаска |
Т.к. тесты показали, что если попадется числовое значение записанное таким боразом - 2 579,00 грн то в переменную сохраняется только двойка.
Спс за помощь

n0n3mi1y · 20.04.2024

noble написал(а):
Оправка - после первого знаска |
Т.к. тесты показали, что если попадется числовое значение записанное таким боразом - 2 579,00 грн то в переменную сохраняется только двойка.
Спс за помощь

Попробуйте не регуляркой, а методом Split. Как мне кажется, в этой ситуации он более подходящий)

noble · 20.04.2024

спс не знал про Split, пригодиться в других проекта.
Нужная регулярка выглядит так: ^(.*?)грн|.*$
Я вообще до сегодня не знал чтоесть язык регулярных выроже т.к. мне это не нужо было))))

k0refun · 06.02.2025

Уважаемые знатоки! Помогите, пжлста, с регуляркой, которая будет искать незакрытые теги . Столкнулся с такой напастью, что после парсинга сайта попадаются статьи, где у некоторых предложений отсутствует закрывающий тег . Нужна регулярка которая будет проставлять закрывающие теги, вот пример:

<h2>здесь какой то текст</h2>
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст.
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст:
<ul>
<li>здесь какой то текст</li>
<li>здесь какой то текст</li>
</ul>
здесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст

PussyM · 07.02.2025

k0refun написал(а):
Уважаемые знатоки! Помогите, пжлста, с регуляркой, которая будет искать незакрытые теги . Столкнулся с такой напастью, что после парсинга сайта попадаются статьи, где у некоторых предложений отсутствует закрывающий тег . Нужна регулярка которая будет проставлять закрывающие теги, вот пример:

<h2>здесь какой то текст</h2>
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст.
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст:
<ul>
<li>здесь какой то текст</li>
<li>здесь какой то текст</li>
</ul>
здесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст

Используй специализированные библиотеки для парсинга HTML. Погугли HtmlAgilityPack для C#. Должно помочь.

slavyn8213 · 07.02.2025

k0refun написал(а):
Уважаемые знатоки! Помогите, пжлста, с регуляркой, которая будет искать незакрытые теги . Столкнулся с такой напастью, что после парсинга сайта попадаются статьи, где у некоторых предложений отсутствует закрывающий тег . Нужна регулярка которая будет проставлять закрывающие теги, вот пример:

<h2>здесь какой то текст</h2>
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст.
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст:
<ul>
<li>здесь какой то текст</li>
<li>здесь какой то текст</li>
</ul>
здесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текст
здесь какой то текстздесь какой то текстздесь какой то текстздесь какой то текст

string text = project.Variables["HTML"].Value;
string pattern = @"(<p[^>]*>)([^<]*)(?!<\/p>)";
string result = System.Text.RegularExpressions.Regex.Replace(text, pattern, "$1$2");
project.Variables["HTML"].Value = result;

k0refun · 08.02.2025

slavyn8213 написал(а):
string text = project.Variables["HTML"].Value;
string pattern = @"(<p[^>]*>)([^<]*)(?!<\/p>)";
string result = System.Text.RegularExpressions.Regex.Replace(text, pattern, "$1$2");
project.Variables["HTML"].Value = result;

Спасибо друг, но не помогло(

Регулярные выражения на все случаи жизни

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Новичок

Client

Client

Administrator

Пользователь

Client

Client

Пользователь

Client

Пользователь

Новичок

Client

Client

Новичок

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)