Регулярные выражения на все случаи жизни

Сибиряк · 19.04.2020

Можно вот так попробовать

C#:

(https:|http:).*?(?=/\d{1,10}.{1,10})

Если нужен 1 протокол то (https:|http:удалить) замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема

TRUMP · 19.04.2020

Сибиряк написал(а):
Можно вот так попробовать

C#:

(https:|http:).*?(?=/\d{1,10}.{1,10})

Посмотреть вложение 54134

Если нужен 1 протокол то (https:|http замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема

Спасибо!

TRUMP · 19.04.2020

Сибиряк написал(а):
Можно вот так попробовать

C#:

(https:|http:).*?(?=/\d{1,10}.{1,10})

Посмотреть вложение 54134

Если нужен 1 протокол то (https:|http:удалить) замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема

Странно, почему то он не взял 2 строчку

https://site.ru/kino/kino/film

Сибиряк · 20.04.2020

TRUMP написал(а):
Странно, почему то он не взял 2 строчку

https://site.ru/kino/kino/film

Что бы не упарываться в сложность регулярки, проще парсить несколькими регулярками и в вписке удалять дубли.

C#:

(https:|http:).*(?=\/\d{1,50}.{1,50}) - для строк с цифрами
^(?!.*\/\d{1,50}.{1,50}$).*$ - для строк исключающие конструкцию /123какие-то-символы

regex101: build, test, and debug regex

Regular expression tester with syntax highlighting, explanation, cheat sheet for PHP/PCRE, Python, GO, JavaScript, Java, C#/.NET, Rust.

regex101.com

strcn · 05.05.2020

Други мои, нужна регулярка для

HTML:

Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?

Sergodjan · 05.05.2020

strcn написал(а):
Други мои, нужна регулярка для

HTML:

17,456 678 83

Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?

"Обработка текста - Замена (Text)" -> заменить {-String.Enter-}{-String.Enter-} на пустоту.
Потом "Обработка текста - Trim".

Либо "Обработка текста - В список".
Потом "Операции над списокм - Удалить строки - Содержащие только пробельные символы".
Потом "Операции над списокм - Объединить элементы списка" (в переменную).

cardelis · 07.05.2020

Подскажите регулярку для парсинга ID из текста.
Перед ID есть либо "группы: ", либо "страницы: ", после всегда "</td>"

вроде разобрался

Код:

(?<=(страницы|группы):\ ).*?(?=</td>)

Сибиряк · 07.05.2020

cardelis написал(а):
Подскажите регулярку для парсинга ID из текста.
Перед ID есть либо "группы: ", либо "страницы: ", после всегда "</td>"

вроде разобрался

Код:

(?<=(страницы|группы):\ ).*?(?=</td>)

На будущее. Приводите пример кода который надо парсить.

obi_zdec · 10.05.2020

Подскажите, где можно еще кроме зенно постера тестера, без запуска зеннопостера, по тестировать выражения?

Sergodjan · 10.05.2020

obi_zdec написал(а):
Подскажите, где можно еще кроме зенно постера тестера, без запуска зеннопостера, по тестировать выражения?

Есть аналог конструктора из Зеннопостера.

https://zennolab.com/discussion/threads/analog-konstruktora-reguljarnyx-vyrazhenij.41380/post-307043

Сибиряк · 10.05.2020

obi_zdec написал(а):
Подскажите, где можно еще кроме зенно постера тестера, без запуска зеннопостера, по тестировать выражения?

Так сервисы есть же

Alexmd · 15.05.2020

C#:

// Текст для обработки
string text = project.ExecuteMacro(project.Variables["get"].Value);
project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name="cookieuser"\ value=").*?(?=")", "0")[0].FirstOrDefault();

Подобных кубиков в районе 14. Решил объединить в один сниппет, но что-то пошло не так. Подеркивает кучу всего. Пытался заэкранировать кавычки и слэши, но не помогло.

Sergodjan · 15.05.2020

Alexmd написал(а):
C#:

// Текст для обработки string text = project.ExecuteMacro(project.Variables["get"].Value); project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name="cookieuser"\ value=").*?(?=")", "0")[0].FirstOrDefault();

Подобных кубиков в районе 14. Решил объединить в один сниппет, но что-то пошло не так. Подеркивает кучу всего. Пытался заэкранировать кавычки и слэши, но не помогло.

Попробуйте экранировать (продублировать) двойные кавычки в регулярке в 3-ей строке.

C#:

project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name=""cookieuser""\ value="").*?(?="")", "0")[0].FirstOrDefault();

Alexmd · 16.05.2020

Да, подчеркивать перестал, но и выполняться тоже не хочет.
Такое сообщение в логе:

Выполнение действия CSharp OwnCode: Индекс за пределами диапазона. Индекс должен быть положительным числом, а его размер не должен превышать размер коллекции.
Имя параметра: index

НИ фига не понял, но решение найдено) https://zennolab.com/discussion/thr...n-byt-polozhitelnym-chislom.71959/post-489909

Unipostmaster · 17.05.2020

Приветствую!
Помогите с регуляркой - в наличии есть файл для перевода в формате txt с 4к строками (изначально все строки на English), в текущей версии половина строк переведена на русский, надо выделить строки содержащие русские буквы и посмотреть сколько строк переведено.

Сибиряк · 18.05.2020

Unipostmaster написал(а):
Приветствую!
Помогите с регуляркой - в наличии есть файл для перевода в формате txt с 4к строками (изначально все строки на English), в текущей версии половина строк переведена на русский, надо выделить строки содержащие русские буквы и посмотреть сколько строк переведено.

Текст в списке построчно и фильтровать через регулярку
Например такую

C#:

[\.\-_A-Za-z]{3,200}
или
[\.\-_А-ЯЁа-яё]{3,200}

Это просто проверка на наличие того или иного набора символов.
Проблема будет если например в строке с кириллицей есть слово латиницей и наоборот.

Dobriyk0t · 18.05.2020

strcn написал(а):
Други мои, нужна регулярка для

HTML:

17,456 678 83

Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?

(?<=\ ).*[0-9] потом убираешь двойные пробелы

Dobriyk0t · 18.05.2020

Может кому понадобится убрать пробелы в начале текста, то вот регулярка для получения текста: (?<=\ ).*[а-яА-Я]

Unipostmaster · 18.05.2020

Сибиряк написал(а):
Текст в списке построчно и фильтровать через регулярку
Например такую

C#:

[\.\-_A-Za-z]{3,200} или [\.\-_А-ЯЁа-яё]{3,200}

Это просто проверка на наличие того или иного набора символов.
Проблема будет если например в строке с кириллицей есть слово латиницей и наоборот.

Не совсем верно ищет, мне надо найти точное количество строк содержащие русские буквы, а текущая регулярка ищет слова в строке, тем самым не давая точного количества строк - т.к. размножает их в зависимости от количества слов на русском языке в строке

Сибиряк · 19.05.2020

Unipostmaster написал(а):
Не совсем верно ищет, мне надо найти точное количество строк содержащие русские буквы, а текущая регулярка ищет слова в строке, тем самым не давая точного количества строк - т.к. размножает их в зависимости от количества слов на русском языке в строке

Если вот так?
В списке построчно находится текст

C#:

^[\d\W\ \;\:\,\(\)\–\.\-_А-ЯЁа-яё]+$

Tvister · 19.05.2020

Есть строка dfgdfgd567;dfgdfgd565reter;457fgd567et;353dfgdfgd567erfw;34534dfgddfgddfg;dfgdfg654;

Как заменить первую ; на : ?

Сибиряк · 19.05.2020

Tvister написал(а):
Есть строка dfgdfgd567;dfgdfgd565reter;457fgd567et;353dfgdfgd567erfw;34534dfgddfgddfg;dfgdfg654;

Как заменить первую ; на : ?

Так можно

heks · 27.05.2020

есть строка переменой как ниже 1 строка 1 переменная
123123123@mail.ru:123123
2342342@gmail.com:23453465
sdfgsdf@gmail.com:23423423
нужен снипет что бы из строк что выше
на выходе получалось 2 переменные
login и pass

123123123:123123
2342342:23453465
sdfgsdf:23423423

Sergodjan · 27.05.2020

heks написал(а):
есть строка переменой как ниже 1 строка 1 переменная
123123123@mail.ru:123123
2342342@gmail.com:23453465
sdfgsdf@gmail.com:23423423
нужен снипет что бы из строк что выше
на выходе получалось 2 переменные
login и pass

123123123:123123
2342342:23453465
sdfgsdf:23423423

Обработка текста - Split, можно перечислить разделители.

Если нужен именно C# код, то можно этот кубик сконвертирвоать в C# через ПКМ.

heks · 27.05.2020

сприт точно забыл про него совсем

Андрейка2020 · 04.06.2020

любой текст в html, потом хренак <br> перенос
Как получить на выходе любой текст в html, потом хренак - перенос?

Сибиряк · 04.06.2020

Андрейка2020 написал(а):
любой текст в html, потом хренак <br> перенос
Как получить на выходе любой текст в html, потом хренак - перенос?

Можно попробовать заменять <br> на \n

Хорошая конкурсная статья по регуляркам

Андрейка2020 · 04.06.2020

Сибиряк написал(а):
Можно попробовать заменять <br> на \n

мне не нужна вторая строка переноса, как раз наоборот - избавиться от нее хочу. Либо заменить на пробел, либо на тире, а можно и вообще всю ячейку игнорить при парсинге. При некоторых настройках получается избавиться от переноса, но тогда между ячейками нет символов разделителя

Сибиряк · 04.06.2020

Андрейка2020 написал(а):
мне не нужна вторая строка переноса, как раз наоборот - избавиться от нее хочу. Либо заменить на пробел, либо на тире, а можно и вообще всю ячейку игнорить при парсинге. При некоторых настройках получается избавиться от переноса, но тогда между ячейками нет символов разделителя

тогда \n меняете на то что надо

Андрейка2020 · 04.06.2020

Сибиряк написал(а):
тогда \n меняете на то что надо

тогда у меня все строки в одну запишутся

Регулярные выражения на все случаи жизни

Client

Client

Client

Client

Client

Administrator

Новичок

Client

Новичок

Administrator

Client

Client

Administrator

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Administrator

Client

Client

Client

Client

Client

Client

Кто просматривает тему: (Всего: 21, Пользователи: 0, Гости: 21)