Регулярные выражения на все случаи жизни

Рябят помогите с регуляркой родной помощник не справляется.
дано урл нада с него взять 2740
ссылка-ссылка-ссылка-ссылка-ссылка-ссылка-ссылка-ссылка-2740.html
Юзал конструктор но из-за многих ---- берет не то что нужно.
дергать только число тоже не вариант в самой ссылке кроме нужного могут встречатся и другие числа
ссылка-ссылка-15лка-ссылка-сс36ка-ссылка-ссылка-ссылка-2740.html
а нужно именно то что в конце

Попробуйте такую:
Регулярка:
Развернуть Свернуть Копировать
([^-]+(?=\.html))

44998
 
Последнее редактирование:
  • Спасибо
Реакции: сергос
Рябят помогите с регуляркой
есть список:

Australien
Bella
Bella
Bella
Bildband
Chance
Charakter
Hintergrundinfos
Ihrer
Inspirationsquelle
Italia
Italia
Italia
Italien
Italiens
Italiens
Kirschen
kochen
kochen

Нужно из списка взять слова которые повторяються 2 и более раз и чтоб регулярка необращала внимание написанны ли слова с большой буквы или нет.

Результат должен быть такой:

Bella
Italia
kochen
 
Рябят помогите с регуляркой
есть список:

Australien
Bella
Bella
Bella
Bildband
Chance
Charakter
Hintergrundinfos
Ihrer
Inspirationsquelle
Italia
Italia
Italia
Italien
Italiens
Italiens
Kirschen
kochen
kochen

Нужно из списка взять слова которые повторяються 2 и более раз и чтоб регулярка необращала внимание написанны ли слова с большой буквы или нет.

Результат должен быть такой:

Bella
Italia
kochen

Вот тут, вроде бы то что вам нужно:
 
sergodjan66
Благодарю за помощь. Здесь на форуме топиков пять я нашол, которые обсуждают данную проблему. Тобиш нужно получить именно дубли из списка или текста. Решения не в одной ветке так и ненашлось.

Решение с C# из этой ветки нерабочее:

Единственно что работает это примерно такое решение:
Сохраняем исходный файл отдельно, как duplicate.txt, например -> удаляем дубли из исходного списка -> сохраняем результат в отдельный файл, например, origin.txt -> берем первую строку с удалением из файла origin.txt -> удаляем ее из duplicate.txt -> зацикливаем
В результате в duplicate.txt получаем все найденные дубли.

Но здесь минусы в том что если чекать слово за словом то
1. будут браться не только нужные слова, к примеру возьмёт из моего списка слово "Italien" и хотя оно одно, то его найдёт как дубль, потому как в списке есть ещё такие слова как "Italiens"
2. Проверка по списку очень долгое и ресурсоёмкое занятие .
 

Вложения

Последнее редактирование:
  • Спасибо
Реакции: Tony Soprano
Огромное спасибо. Занимает конечно довольно много времени. Но работает. Если кто то всётаки сможет осилить и написать регулярку по моему запросу, который описан выше, то буду премного благодарен.
 
Ребят, помогите удалить последнюю строку из файла(она же перенос), т.е. либо последний перенос строки в файле либо всю последнюю строку
 
Ребят, помогите удалить последнюю строку из файла(она же перенос), т.е. либо последний перенос строки в файле либо всю последнюю строку
Если файл у вас привязан к списку, то проще через экшен Операции над списком - Удалить строку по номеру и указать end.

45147
 
  • Спасибо
Реакции: quickmouse
  • Спасибо
Реакции: quickmouse
Приветствую! Подскажите регулярку которая выбирала бы из списка доменов все домены третьего уровня.
 
Подскажите есть ли где толковый мануал(помимо вики, там мало и непонятно), как парсить группами
C#:
Развернуть Свернуть Копировать
<div class="tbl tbl-item">
                <div class="tbl-sub-item">011051</div>
                <div class="tbl-sub-item grow">ФИО</div>
                <div class="tbl-sub-item">
                    <div class="btn-group">
                        <a href="/export/judiciary/1370/CalcDebtByDateReport.pdf" target="_blank" class="btn btn-primary btn-sm indent">
                            <i class="fa fa-file-pdf-o"></i> Детализация
                       <a href="#" external_account="vk" external_uid="30395405" order_id="57116" class="btn btn-primary btn-sm indent judiciary_photoData">
                            <i class="fa"></i> Фото
                        </a>
                    </div>
                </div>
Это кусок кода, часть удалена, так что могут быть незакрытые теги......
Таких групп очень много, мне нужно вывести в табличку 011051 ФИО 1370 30395405 57116
 
Помогите пожалуйста, нужна регулярка, что бы удалить все строки содержащие кириллицу.
 
Помогите пожалуйста, нужна регулярка, что бы удалить все строки содержащие кириллицу.
Берете строку из списка и с помощью Обработка текста - Regex пробуете из нее парсить кириллицу
регуляркой::
Развернуть Свернуть Копировать
(?i)[а-яё]+
После этого с помощью IF экшена, результат парсинга сравниваете с пустотой, соотв если пустота, то строка не содержит кириллицу, если что то нашлось, то содержит. Соответственно, удаляете строку, если там нашлась кириллица.
 
  • Спасибо
Реакции: igoreff
Подскажите есть ли где толковый мануал(помимо вики, там мало и непонятно), как парсить группами
C#:
Развернуть Свернуть Копировать
<div class="tbl tbl-item">
                <div class="tbl-sub-item">011051</div>
                <div class="tbl-sub-item grow">ФИО</div>
                <div class="tbl-sub-item">
                    <div class="btn-group">
                        <a href="/export/judiciary/1370/CalcDebtByDateReport.pdf" target="_blank" class="btn btn-primary btn-sm indent">
                            <i class="fa fa-file-pdf-o"></i> Детализация
                       <a href="#" external_account="vk" external_uid="30395405" order_id="57116" class="btn btn-primary btn-sm indent judiciary_photoData">
                            <i class="fa"></i> Фото
                        </a>
                    </div>
                </div>
Это кусок кода, часть удалена, так что могут быть незакрытые теги......
Таких групп очень много, мне нужно вывести в табличку 011051 ФИО 1370 30395405 57116

По групповым регуляркам не спец, но можно думаю с такими же временными затратами сделать последовательный парсинг несколькими отдельными стандартными (не групповыми) регулярками.
Приложил пример шаблона с регулярками.

46439


Либо составной регуляркой, через "|" в список и потом этот список объединить в переменную с пробельными разделителями. Удобно пользоваться встроенным в ПМ конструктором рег-выражений.
 

Вложения

  • Спасибо
Реакции: bartenev
Еще один вопрос, в тексте остается куча мусора в виде знаков препинания в разных вариациях
.,,.. текст текст,.,.,, текст текст.?;., текст текст.!,,.,

ну и так далее, идут они подряд без пробелов, как заменить все их например на точку, вот сами знаки
,.?!:;
 
Регулярку нашел такую, вроде пашет
C#:
Развернуть Свернуть Копировать
 ?([\.\!\?\:\,\:\;\ ]){2,}(?=|$)
 
  • Спасибо
Реакции: Sergodjan
Требуется помощь, а именно, в переменной строки, вида:
Код:
Развернуть Свернуть Копировать
185.139.70.40;255.255.255.0;185.139.70.1
88.11.170.41;12.11.104.22;185.139.70.104
185.139.70.42
185.139.71.141;255.255.255.255;185.139.70.120
185.139.70.142
101.12.51.165;167.12.4.55;78.11.170.6
99.139.76.95

Вопрос: Как взять только первые ip-адреса, чтобы на выходе было:
Код:
Развернуть Свернуть Копировать
185.139.70.40
88.11.170.41
185.139.70.42
185.139.71.141
185.139.70.142
101.12.51.165
99.139.76.95
 
Требуется помощь, а именно, в переменной строки, вида:
Код:
Развернуть Свернуть Копировать
185.139.70.40;255.255.255.0;185.139.70.1
88.11.170.41;12.11.104.22;185.139.70.104
185.139.70.42
185.139.71.141;255.255.255.255;185.139.70.120
185.139.70.142
101.12.51.165;167.12.4.55;78.11.170.6
99.139.76.95

Вопрос: Как взять только первые ip-адреса, чтобы на выходе было:
Код:
Развернуть Свернуть Копировать
185.139.70.40
88.11.170.41
185.139.70.42
185.139.71.141
185.139.70.142
101.12.51.165
99.139.76.95


Вариант с построчной обработкой в цикле (берем строку из списка и обрабатываем ее регуляркой).
Регулярка:
Развернуть Свернуть Копировать
^.*?(?=(;|$))
 
  • Спасибо
Реакции: Ilshakin
Вариант с построчной обработкой в цикле (берем строку из списка и обрабатываем ее регуляркой).
Регулярка:
Развернуть Свернуть Копировать
^.*?(?=(;|$))
А без использования списка, возможно ли сделать?
 
А без использования списка, возможно ли сделать?
Тут нужно другую регулярку, более хитрую, т.к. якоря начала и конца строки (^$) не отрабатываются если не строка, а целиком текст.
 
  • Спасибо
Реакции: Ilshakin
Тут нужно другую регулярку, более хитрую, т.к. якоря начала и конца строки (^$) не отрабатываются если не строка, а целиком текст.

C#:
Развернуть Свернуть Копировать
^.*?(?=(;|$))
Данная регулярка не подходит, к сожалению - она берет только первый ip-адрес до ";"
 
Требуется помощь, а именно, в переменной строки, вида:
Код:
Развернуть Свернуть Копировать
185.139.70.40;255.255.255.0;185.139.70.1
88.11.170.41;12.11.104.22;185.139.70.104
185.139.70.42
185.139.71.141;255.255.255.255;185.139.70.120
185.139.70.142
101.12.51.165;167.12.4.55;78.11.170.6
99.139.76.95

Вопрос: Как взять только первые ip-адреса, чтобы на выходе было:
Код:
Развернуть Свернуть Копировать
185.139.70.40
88.11.170.41
185.139.70.42
185.139.71.141
185.139.70.142
101.12.51.165
99.139.76.95
;\d{2,3}[.]\d{1,3}[.]\d{1,3}[.]\d{1,3}

Очищаете по регулярке и получаете готовый список ip
 
  • Спасибо
Реакции: Ilshakin
Может я что то делаю не то, но значения берутся не те (дописываются в том числе ip-адреса, после ";")
Что получается у вас в итоге после применения регулярки?
 

Кто просматривает тему: (Всего: 1, Пользователи: 1, Гости: 0)