Регулярные выражения на все случаи жизни

Sergodjan · 29.11.2019

сергос написал(а):
Рябят помогите с регуляркой родной помощник не справляется.
дано урл нада с него взять 2740
ссылка-ссылка-ссылка-ссылка-ссылка-ссылка-ссылка-ссылка-2740.html
Юзал конструктор но из-за многих ---- берет не то что нужно.
дергать только число тоже не вариант в самой ссылке кроме нужного могут встречатся и другие числа
ссылка-ссылка-15лка-ссылка-сс36ка-ссылка-ссылка-ссылка-2740.html
а нужно именно то что в конце

Попробуйте такую:

Регулярка:

([^-]+(?=\.html))

Tony Soprano · 29.11.2019

Рябят помогите с регуляркой
есть список:

Australien
Bella
Bella
Bella
Bildband
Chance
Charakter
Hintergrundinfos
Ihrer
Inspirationsquelle
Italia
Italia
Italia
Italien
Italiens
Italiens
Kirschen
kochen
kochen

Нужно из списка взять слова которые повторяються 2 и более раз и чтоб регулярка необращала внимание написанны ли слова с большой буквы или нет.

Результат должен быть такой:

Bella
Italia
kochen

Sergodjan · 29.11.2019

Tony Soprano написал(а):
Рябят помогите с регуляркой
есть список:

Australien
Bella
Bella
Bella
Bildband
Chance
Charakter
Hintergrundinfos
Ihrer
Inspirationsquelle
Italia
Italia
Italia
Italien
Italiens
Italiens
Kirschen
kochen
kochen

Нужно из списка взять слова которые повторяються 2 и более раз и чтоб регулярка необращала внимание написанны ли слова с большой буквы или нет.

Результат должен быть такой:

Bella
Italia
kochen

Вот тут, вроде бы то что вам нужно:

https://zennolab.com/discussion/threads/kak-najti-dubli.19386/post-125937

https://zennolab.com/discussion/threads/podskazhite-logiku-vydelenija-dublej.63947/

Tony Soprano · 29.11.2019

sergodjan66
Благодарю за помощь. Здесь на форуме топиков пять я нашол, которые обсуждают данную проблему. Тобиш нужно получить именно дубли из списка или текста. Решения не в одной ветке так и ненашлось.

Решение с C# из этой ветки нерабочее:

https://zennolab.com/discussion/threads/kak-najti-dubli.19386/#post-125937

Единственно что работает это примерно такое решение:

Сохраняем исходный файл отдельно, как duplicate.txt, например -> удаляем дубли из исходного списка -> сохраняем результат в отдельный файл, например, origin.txt -> берем первую строку с удалением из файла origin.txt -> удаляем ее из duplicate.txt -> зацикливаем
В результате в duplicate.txt получаем все найденные дубли.

Но здесь минусы в том что если чекать слово за словом то
1. будут браться не только нужные слова, к примеру возьмёт из моего списка слово "Italien" и хотя оно одно, то его найдёт как дубль, потому как в списке есть ещё такие слова как "Italiens"
2. Проверка по списку очень долгое и ресурсоёмкое занятие .

сергос · 29.11.2019

sergodjan66 написал(а):
Попробуйте такую:

Большое человеческое спасибо!!!

Sergodjan · 29.11.2019

Tony Soprano написал(а):
2. Проверка по списку очень долгое и ресурсоёмкое занятие .

На больших списках не тестировал, проверьте в ПМ с отложенной отрисовкой или в ЗП, может и ничего.

Tony Soprano · 29.11.2019

Огромное спасибо. Занимает конечно довольно много времени. Но работает. Если кто то всётаки сможет осилить и написать регулярку по моему запросу, который описан выше, то буду премного благодарен.

quickmouse · 02.12.2019

Ребят, помогите удалить последнюю строку из файла(она же перенос), т.е. либо последний перенос строки в файле либо всю последнюю строку

Sergodjan · 02.12.2019

quickmouse написал(а):
Ребят, помогите удалить последнюю строку из файла(она же перенос), т.е. либо последний перенос строки в файле либо всю последнюю строку

Если файл у вас привязан к списку, то проще через экшен Операции над списком - Удалить строку по номеру и указать end.

Ilshakin · 02.12.2019

потерто

quickmouse · 02.12.2019

sergodjan66 написал(а):
Если файл у вас привязан к списку, то проще через экшен Операции над списком - Удалить строку по номеру и указать end.

Посмотреть вложение 45147

Удаляет не последний перенос, а строку выше(((

Sergodjan · 02.12.2019

quickmouse написал(а):
Удаляет не последний перенос, а строку выше(((

Тогда попробуйте такой вариант удаления:

An_To_Ha · 06.12.2019

Приветствую! Подскажите регулярку которая выбирала бы из списка доменов все домены третьего уровня.

bartenev · 13.12.2019

Подскажите есть ли где толковый мануал(помимо вики, там мало и непонятно), как парсить группами

C#:

<div class="tbl tbl-item">
                <div class="tbl-sub-item">011051</div>
                <div class="tbl-sub-item grow">ФИО</div>
                <div class="tbl-sub-item">
                    <div class="btn-group">
                        <a href="/export/judiciary/1370/CalcDebtByDateReport.pdf" target="_blank" class="btn btn-primary btn-sm indent">
                            <i class="fa fa-file-pdf-o"></i> Детализация
                       <a href="#" external_account="vk" external_uid="30395405" order_id="57116" class="btn btn-primary btn-sm indent judiciary_photoData">
                            <i class="fa"></i> Фото
                        </a>
                    </div>
                </div>

Это кусок кода, часть удалена, так что могут быть незакрытые теги......
Таких групп очень много, мне нужно вывести в табличку 011051 ФИО 1370 30395405 57116

igoreff · 13.12.2019

Помогите пожалуйста, нужна регулярка, что бы удалить все строки содержащие кириллицу.

Sergodjan · 13.12.2019

igoreff написал(а):
Помогите пожалуйста, нужна регулярка, что бы удалить все строки содержащие кириллицу.

Берете строку из списка и с помощью Обработка текста - Regex пробуете из нее парсить кириллицу

регуляркой::

(?i)[а-яё]+

После этого с помощью IF экшена, результат парсинга сравниваете с пустотой, соотв если пустота, то строка не содержит кириллицу, если что то нашлось, то содержит. Соответственно, удаляете строку, если там нашлась кириллица.

Sergodjan · 13.12.2019

bartenev написал(а):
Подскажите есть ли где толковый мануал(помимо вики, там мало и непонятно), как парсить группами

C#:

<div class="tbl tbl-item"> <div class="tbl-sub-item">011051</div> <div class="tbl-sub-item grow">ФИО</div> <div class="tbl-sub-item"> <div class="btn-group"> <a href="/export/judiciary/1370/CalcDebtByDateReport.pdf" target="_blank" class="btn btn-primary btn-sm indent"> <i class="fa fa-file-pdf-o"></i> Детализация <a href="#" external_account="vk" external_uid="30395405" order_id="57116" class="btn btn-primary btn-sm indent judiciary_photoData"> <i class="fa"></i> Фото </a> </div> </div>

Это кусок кода, часть удалена, так что могут быть незакрытые теги......
Таких групп очень много, мне нужно вывести в табличку 011051 ФИО 1370 30395405 57116

По групповым регуляркам не спец, но можно думаю с такими же временными затратами сделать последовательный парсинг несколькими отдельными стандартными (не групповыми) регулярками.
Приложил пример шаблона с регулярками.

Либо составной регуляркой, через "|" в список и потом этот список объединить в переменную с пробельными разделителями. Удобно пользоваться встроенным в ПМ конструктором рег-выражений.

igoreff · 15.12.2019

Еще один вопрос, в тексте остается куча мусора в виде знаков препинания в разных вариациях
.,,.. текст текст,.,.,, текст текст.?;., текст текст.!,,.,

ну и так далее, идут они подряд без пробелов, как заменить все их например на точку, вот сами знаки
,.?!:;

igoreff · 15.12.2019

Регулярку нашел такую, вроде пашет

C#:

 ?([\.\!\?\:\,\:\;\ ]){2,}(?=|$)

Ilshakin · 24.12.2019

Требуется помощь, а именно, в переменной строки, вида:

Код:

185.139.70.40;255.255.255.0;185.139.70.1
88.11.170.41;12.11.104.22;185.139.70.104
185.139.70.42
185.139.71.141;255.255.255.255;185.139.70.120
185.139.70.142
101.12.51.165;167.12.4.55;78.11.170.6
99.139.76.95

Вопрос: Как взять только первые ip-адреса, чтобы на выходе было:

Код:

185.139.70.40
88.11.170.41
185.139.70.42
185.139.71.141
185.139.70.142
101.12.51.165
99.139.76.95

Sergodjan · 24.12.2019

Ilshakin написал(а):
Требуется помощь, а именно, в переменной строки, вида:

Код:

185.139.70.40;255.255.255.0;185.139.70.1 88.11.170.41;12.11.104.22;185.139.70.104 185.139.70.42 185.139.71.141;255.255.255.255;185.139.70.120 185.139.70.142 101.12.51.165;167.12.4.55;78.11.170.6 99.139.76.95

Вопрос: Как взять только первые ip-адреса, чтобы на выходе было:

Код:

185.139.70.40 88.11.170.41 185.139.70.42 185.139.71.141 185.139.70.142 101.12.51.165 99.139.76.95

Вариант с построчной обработкой в цикле (берем строку из списка и обрабатываем ее регуляркой).

Регулярка:

^.*?(?=(;|$))

Ilshakin · 24.12.2019

sergodjan66 написал(а):
Вариант с построчной обработкой в цикле (берем строку из списка и обрабатываем ее регуляркой).

Регулярка:

^.*?(?=(;|$))

А без использования списка, возможно ли сделать?

Sergodjan · 24.12.2019

Ilshakin написал(а):
А без использования списка, возможно ли сделать?

Тут нужно другую регулярку, более хитрую, т.к. якоря начала и конца строки (^$) не отрабатываются если не строка, а целиком текст.

Ilshakin · 24.12.2019

sergodjan66 написал(а):
Тут нужно другую регулярку, более хитрую, т.к. якоря начала и конца строки (^$) не отрабатываются если не строка, а целиком текст.

C#:

^.*?(?=(;|$))

Данная регулярка не подходит, к сожалению - она берет только первый ip-адрес до ";"

Valandersi · 24.12.2019

Ilshakin написал(а):
Требуется помощь, а именно, в переменной строки, вида:

Код:

185.139.70.40;255.255.255.0;185.139.70.1 88.11.170.41;12.11.104.22;185.139.70.104 185.139.70.42 185.139.71.141;255.255.255.255;185.139.70.120 185.139.70.142 101.12.51.165;167.12.4.55;78.11.170.6 99.139.76.95

Вопрос: Как взять только первые ip-адреса, чтобы на выходе было:

Код:

185.139.70.40 88.11.170.41 185.139.70.42 185.139.71.141 185.139.70.142 101.12.51.165 99.139.76.95

;\d{2,3}[.]\d{1,3}[.]\d{1,3}[.]\d{1,3}

Очищаете по регулярке и получаете готовый список ip

Ilshakin · 24.12.2019

Valandersi написал(а):
;\d{2,3}[.]\d{1,3}[.]\d{1,3}[.]\d{1,3}

Уже близко ;-)

Но значения получаются со знаком ";"

Valandersi · 24.12.2019

Valandersi · 24.12.2019

Ilshakin написал(а):
Уже близко
Но значения получаются со знаком ";"

; можно убрать заменой

Ilshakin · 24.12.2019

Valandersi написал(а):
; можно убрать заменой

Может я что то делаю не то, но значения берутся не те (дописываются в том числе ip-адреса, после ";")

Valandersi · 24.12.2019

Ilshakin написал(а):
Может я что то делаю не то, но значения берутся не те (дописываются в том числе ip-адреса, после ";")

Что получается у вас в итоге после применения регулярки?

Регулярные выражения на все случаи жизни

Administrator

Новичок

Administrator

Новичок

Client

Administrator

Вложения

Новичок

Client

Administrator

Client

Client

Administrator

Client

Client

Client

Administrator

Administrator

Вложения

Client

Client

Client

Administrator

Client

Administrator

Client

Client

Client

Client

Client

Client

Client

Кто просматривает тему: (Всего: 19, Пользователи: 0, Гости: 19)