Регулярные выражения на все случаи жизни

Можно вот так попробовать
C#:
Развернуть Свернуть Копировать
(https:|http:).*?(?=/\d{1,10}.{1,10})

регулярка.png
Если нужен 1 протокол то (https:|http:удалить) замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема
 
  • Спасибо
Реакции: TRUMP
Можно вот так попробовать
C#:
Развернуть Свернуть Копировать
(https:|http:).*?(?=/\d{1,10}.{1,10})

Если нужен 1 протокол то (https:|http:-) замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема
Спасибо!
 
  • Спасибо
Реакции: Сибиряк
Можно вот так попробовать
C#:
Развернуть Свернуть Копировать
(https:|http:).*?(?=/\d{1,10}.{1,10})

Если нужен 1 протокол то (https:|http:удалить) замените на нужный, например https:
\d{1,10} - цифры от 1 до 10
.{1,10}) - любые символы от 1 до 10

Полезная тема
Странно, почему то он не взял 2 строчку
 
Странно, почему то он не взял 2 строчку
Что бы не упарываться в сложность регулярки, проще парсить несколькими регулярками и в вписке удалять дубли.
C#:
Развернуть Свернуть Копировать
(https:|http:).*(?=\/\d{1,50}.{1,50}) - для строк с цифрами
^(?!.*\/\d{1,50}.{1,50}$).*$ - для строк исключающие конструкцию /123какие-то-символы
 
  • Спасибо
Реакции: TRUMP
Други мои, нужна регулярка для

HTML:
Развернуть Свернуть Копировать
    17,456


    678


    83

Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?
 
Други мои, нужна регулярка для

HTML:
Развернуть Свернуть Копировать
    17,456


    678


    83

Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?
"Обработка текста - Замена (Text)" -> заменить {-String.Enter-}{-String.Enter-} на пустоту.
Потом "Обработка текста - Trim".

Либо "Обработка текста - В список".
Потом "Операции над списокм - Удалить строки - Содержащие только пробельные символы".
Потом "Операции над списокм - Объединить элементы списка" (в переменную).
 
Последнее редактирование:
  • Спасибо
Реакции: strcn
Подскажите регулярку для парсинга ID из текста.
Перед ID есть либо "группы: ", либо "страницы: ", после всегда "</td>"

вроде разобрался
Код:
Развернуть Свернуть Копировать
(?<=(страницы|группы):\ ).*?(?=</td>)
 
Подскажите регулярку для парсинга ID из текста.
Перед ID есть либо "группы: ", либо "страницы: ", после всегда "</td>"

вроде разобрался
Код:
Развернуть Свернуть Копировать
(?<=(страницы|группы):\ ).*?(?=</td>)
На будущее. Приводите пример кода который надо парсить.
 
Подскажите, где можно еще кроме зенно постера тестера, без запуска зеннопостера, по тестировать выражения?
 
C#:
Развернуть Свернуть Копировать
// Текст для обработки
string text = project.ExecuteMacro(project.Variables["get"].Value);
project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name="cookieuser"\ value=").*?(?=")", "0")[0].FirstOrDefault();

Подобных кубиков в районе 14. Решил объединить в один сниппет, но что-то пошло не так. Подеркивает кучу всего. Пытался заэкранировать кавычки и слэши, но не помогло.
 
C#:
Развернуть Свернуть Копировать
// Текст для обработки
string text = project.ExecuteMacro(project.Variables["get"].Value);
project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name="cookieuser"\ value=").*?(?=")", "0")[0].FirstOrDefault();

Подобных кубиков в районе 14. Решил объединить в один сниппет, но что-то пошло не так. Подеркивает кучу всего. Пытался заэкранировать кавычки и слэши, но не помогло.
Попробуйте экранировать (продублировать) двойные кавычки в регулярке в 3-ей строке.
C#:
Развернуть Свернуть Копировать
project.Variables["cookie_user"].Value = Macros.TextProcessing.Regex(text, @"(?<=<input\ type='hidden'\ name=""cookieuser""\ value="").*?(?="")", "0")[0].FirstOrDefault();
 
  • Спасибо
Реакции: Alexmd
Да, подчеркивать перестал, но и выполняться тоже не хочет.
Такое сообщение в логе:
Выполнение действия CSharp OwnCode: Индекс за пределами диапазона. Индекс должен быть положительным числом, а его размер не должен превышать размер коллекции.
Имя параметра: index


НИ фига не понял, но решение найдено) https://zennolab.com/discussion/thr...n-byt-polozhitelnym-chislom.71959/post-489909
 
Последнее редактирование:
Приветствую!
Помогите с регуляркой - в наличии есть файл для перевода в формате txt с 4к строками (изначально все строки на English), в текущей версии половина строк переведена на русский, надо выделить строки содержащие русские буквы и посмотреть сколько строк переведено.
 
Приветствую!
Помогите с регуляркой - в наличии есть файл для перевода в формате txt с 4к строками (изначально все строки на English), в текущей версии половина строк переведена на русский, надо выделить строки содержащие русские буквы и посмотреть сколько строк переведено.
Текст в списке построчно и фильтровать через регулярку
Например такую
C#:
Развернуть Свернуть Копировать
[\.\-_A-Za-z]{3,200}
или
[\.\-_А-ЯЁа-яё]{3,200}
Это просто проверка на наличие того или иного набора символов.
Проблема будет если например в строке с кириллицей есть слово латиницей и наоборот.
 
Други мои, нужна регулярка для

HTML:
Развернуть Свернуть Копировать
    17,456


    678


    83

Хочется убрать пробелы и пустые и оставить только строки со значениями. Пробовал несколько регулярок из первого сообщения, но они убирают всё, кроме первого числа. Можно ли сделать так, чтобы оставались все три?
(?<=\ ).*[0-9] потом убираешь двойные пробелы
 
  • Спасибо
Реакции: strcn
Может кому понадобится убрать пробелы в начале текста, то вот регулярка для получения текста: (?<=\ ).*[а-яА-Я]
 
  • Спасибо
Реакции: strcn
Текст в списке построчно и фильтровать через регулярку
Например такую
C#:
Развернуть Свернуть Копировать
[\.\-_A-Za-z]{3,200}
или
[\.\-_А-ЯЁа-яё]{3,200}
Это просто проверка на наличие того или иного набора символов.
Проблема будет если например в строке с кириллицей есть слово латиницей и наоборот.

Не совсем верно ищет, мне надо найти точное количество строк содержащие русские буквы, а текущая регулярка ищет слова в строке, тем самым не давая точного количества строк - т.к. размножает их в зависимости от количества слов на русском языке в строке
 
Не совсем верно ищет, мне надо найти точное количество строк содержащие русские буквы, а текущая регулярка ищет слова в строке, тем самым не давая точного количества строк - т.к. размножает их в зависимости от количества слов на русском языке в строке
Если вот так?
В списке построчно находится текст
C#:
Развернуть Свернуть Копировать
^[\d\W\ \;\:\,\(\)\–\.\-_А-ЯЁа-яё]+$

регулярка.png
 
Есть строка dfgdfgd567;dfgdfgd565reter;457fgd567et;353dfgdfgd567erfw;34534dfgddfgddfg;dfgdfg654;

Как заменить первую ; на : ?
 
Последнее редактирование:
  • Спасибо
Реакции: Tvister
есть строка переменой как ниже 1 строка 1 переменная
123123123@mail.ru:123123
2342342@gmail.com:23453465
sdfgsdf@gmail.com:23423423
нужен снипет что бы из строк что выше
на выходе получалось 2 переменные
login и pass

123123123:123123
2342342:23453465
sdfgsdf:23423423
 
есть строка переменой как ниже 1 строка 1 переменная
123123123@mail.ru:123123
2342342@gmail.com:23453465
sdfgsdf@gmail.com:23423423
нужен снипет что бы из строк что выше
на выходе получалось 2 переменные
login и pass

123123123:123123
2342342:23453465
sdfgsdf:23423423

Обработка текста - Split, можно перечислить разделители.

56913


Если нужен именно C# код, то можно этот кубик сконвертирвоать в C# через ПКМ.
 
Последнее редактирование:
  • Спасибо
Реакции: doc, masterLomaster и heks
любой текст в html, потом хренак <br> перенос
Как получить на выходе любой текст в html, потом хренак - перенос?
 
Можно попробовать заменять <br> на \n
мне не нужна вторая строка переноса, как раз наоборот - избавиться от нее хочу. Либо заменить на пробел, либо на тире, а можно и вообще всю ячейку игнорить при парсинге. При некоторых настройках получается избавиться от переноса, но тогда между ячейками нет символов разделителя
 
мне не нужна вторая строка переноса, как раз наоборот - избавиться от нее хочу. Либо заменить на пробел, либо на тире, а можно и вообще всю ячейку игнорить при парсинге. При некоторых настройках получается избавиться от переноса, но тогда между ячейками нет символов разделителя
тогда \n меняете на то что надо
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)