Регулярные выражения на все случаи жизни

The_vAe · 12.11.2020

Подскажите пожалуйста.

Есть очень много различных ссылок, например:

https://www.ввввв.com/watch/?v=8rxrPM/4G4tM
https://www.ааа.com.ua/black/vassa/SSSS

Как мне регуляркой получить:
?v=8rxrPM/4G4tM
vassa/SSSS

И во втором варианте:
4G4tM
SSSS

Суть в том, что нужно изменяя цифру, получать результаты в зависимости от количества / в конце. Например указав {1} получить значение с конца до первой палочки / , пример: 4G4tM , а если поставить цифру {2} получить значение с конца до второй палочки / , пример: ?v=8rxrPM/4G4tM и по такой логике, увеличивая число, получать более длинную часть url.

random.Object · 27.11.2020

Привет. Есть строчка
<td class="field_domain"><a href="/goto/1/5g6epr/814/?tr=search" target="_blank" title='RegEX.ru"><strong>RegEX</strong>.ru</a></td>

Как из нее достать содержимое текста title?

The_vAe · 27.11.2020

random.Object написал(а):
Привет. Есть строчка
<td class="field_domain"><a href="/goto/1/5g6epr/814/?tr=search" target="_blank" title='RegEX.ru"><strong>RegEX</strong>.ru</a></td>

Как из нее достать содержимое текста title?

(?<=title=').*?(?=">)

random.Object · 27.11.2020

Gunjubasik написал(а):
(?<=title=').*?(?=">)

Посмотреть вложение 67940

Понял свою ошибку надо было давать сразу контекст. Задача. С сайта expireddomains.net/domain-name-search/?q=fitness&searchinit=1 мне нужно спарсить название доменов и положить их в файл.
В конструкторе регулярок выбираю "Исходные текст начинается с <td class="field_domain">. Получаю список ссылок с тайталами. 25. Далее пытаюсь вытащить текст, но задача оказалось трудной

The_vAe · 27.11.2020

random.Object написал(а):
Понял свою ошибку надо было давать сразу контекст. Задача. С сайта expireddomains.net/domain-name-search/?q=fitness&searchinit=1 мне нужно спарсить название доменов и положить их в файл.
В конструкторе регулярок выбираю "Исходные текст начинается с <td class="field_domain">. Получаю список ссылок с тайталами. 25. Далее пытаюсь вытащить текст, но задача оказалось трудной

Используйте для парсинга метод Xpath ,для ваших целей очень зайдет.

dima2121 · 04.12.2020

Добрый день, есть регулярка которая разбивает слова на буквы
Регулярка \w
Взять все совпадения.
Результат:
п
р
и
в
е
т
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет

The_vAe · 04.12.2020

dima2121 написал(а):
Добрый день, есть регулярка которая разбивает слова на буквы
Регулярка \w
Взять все совпадения.
Результат:
п
р
и
в
е
т
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет

\w+

dima2121 · 04.12.2020

Gunjubasik написал(а):
\w+

чет у меня не работает, не объединяются буквы

Sergodjan · 04.12.2020

dima2121 написал(а):
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет

Из списка объединить, с помощью действия "Операции над списком - Объединить элементы списка".

dima2121 · 04.12.2020

sergodjan66 написал(а):
Из списка объединить, с помощью действия "Операции над списком - Объединить элементы списка".

тоже не работает, не объединяются буквы

Sergodjan · 04.12.2020

dima2121 написал(а):
тоже не работает, не объединяются буквы

Покажите как вы делаете.

dima2121 · 04.12.2020

sergodjan66 написал(а):
Покажите как вы делаете.

Посмотреть вложение 68298

да , работает, что-то не то делал , прошу прощения

igoreff · 15.12.2020

Подскажите пожалуйста, как удалить предложения короче 30 букв, текст английский?

Sergodjan · 15.12.2020

igoreff написал(а):
Подскажите пожалуйста, как удалить предложения короче 30 букв, текст английский?

Попробуйте такой вариант регулярки: [A-Z].{30,}?(\.|\!|\?)(\ |\r|\n|$)

igoreff · 15.12.2020

sergodjan66 написал(а):
Попробуйте такой вариант регулярки: [A-Z].{30,}?(\.|\!|\?)(\ |\r|\n|$)

Посмотреть вложение 69172

Спасибо, но почему то у меня цепляет и длинные предложения тоже, но не все длинные. Где то два предожения цепляет.

Вот например такой текст

Download and play free Casino Games. Win big in Slots. Search PC Games. Browse by Genre Hidden Object. Join the fun and strike it rich as you play free Casino Games. Play them for free or try before you buy. 1 Hit Game. Slingo Supreme 2. Slingo Supreme 2 expands on the hit Slingo Supreme game and adds double the powerups. double the awards and double the mini games which makes for double the fun. IGT Slots Wild Wolf.
Feel the adrenaline rush of putting your money at risk. even if its only fictional money. in our selection of poker and casino games for Windows. A Las Vegas casino on your PC. free English 63.6 MB 0/26/2018 Windows. Slingo Quest Deluxe. Slot machines and bingo in a single game. demo English 1.5 MB 11/03/2011 Windows.

Sergodjan · 15.12.2020

igoreff написал(а):
Спасибо, но почему то у меня цепляет и длинные предложения тоже, но не все длинные. Где то два предожения цепляет.

Все правильно, по регулярке отбираются предложения от 30 символов и длиннее.

Khmer · 17.12.2020

Всем привет, кто-нибудь может помочь поправить регулярку?
Есть ссылки такого вида:

href="/Product/Chore-Chart-for-Kids-5975434?st=f374e058b7bdaf87937027c56571955d
href="/Product/Rainbow-Children--4392006?st=f374e058b7bdaf87937027c56571955d

Мне нужно забрать выделенные ID.
Регулярка (?<=-).[1-9]\d*(?=\?st=)
отдает
5975434
-4392006
А нужно без второго дефиса:
5975434
4392006

Sergodjan · 17.12.2020

Khmer написал(а):
Всем привет, кто-нибудь может помочь поправить регулярку?
Есть ссылки такого вида:

href="/Product/Chore-Chart-for-Kids-5975434?st=f374e058b7bdaf87937027c56571955d
href="/Product/Rainbow-Children--4392006?st=f374e058b7bdaf87937027c56571955d

Мне нужно забрать выделенные ID.

Попробуйте такую регулярку: ([^-]+(?=\?st=))

Khmer · 17.12.2020

sergodjan66 написал(а):
Попробуйте такую регулярку: ([^-]+(?=\?st=))

Посмотреть вложение 69334

Спасибо большое!

Kinomanius · 25.12.2020

Добрый вечер! Нашёл тут регулярку

(?i)\bgo.*?(?=\W|\ |\r|\n|$)

Которая позволяет из текста вытянуть все слова начинающиеся на go.
Проблема - слова где есть дефис просто обрезаются и достаётся только первая часть.
Пример - слово "gose-goto" на выходе получаем "gose"

Sergodjan · 25.12.2020

Kinomanius написал(а):
Добрый вечер! Нашёл тут регулярку

(?i)\bgo.*?(?=\W|\ |\r|\n|$)

Которая позволяет из текста вытянуть все слова начинающиеся на go.
Проблема - слова где есть дефис просто обрезаются и достаётся только первая часть.
Пример - слово "gose-goto" на выходе получаем "gose"

Попробуйте так: (?i)\bgo.*?(?=\s|\r|\n|$)

Ztrex · 19.01.2021

Подскажите регулярку для Notepad++
k:/file/data/temp/images/10/3yMVUeyGhi.jpg
k:/file/data/temp/images/10/7MsaJJOvPI.jpg
k:/file/data/temp/images/10/G9UtXt1l8L.jpg

нужно удалить пути к файлам и оставить имена и расширения файлов. Имена и расширения могут быть разными.

Sergodjan · 19.01.2021

Ztrex написал(а):
Подскажите регулярку для Notepad++
k:/file/data/temp/images/10/3yMVUeyGhi.jpg
k:/file/data/temp/images/10/7MsaJJOvPI.jpg
k:/file/data/temp/images/10/G9UtXt1l8L.jpg

нужно удалить пути к файлам и оставить имена и расширения файлов. Имена и расширения могут быть разными.

Регулярка: [^/]+(?=$|\r?\n)

Ztrex · 19.01.2021

sergodjan66 написал(а):
Регулярка: [^/]+(?=$|\r?\n)

Удаляются имена файлов, а нужно чтобы удалились пути к файлам. Конечный результат должен быть таким:
3yMVUeyGhi.jpg
7MsaJJOvPI.jpg
G9UtXt1l8L.jpg

Sergodjan · 19.01.2021

Ztrex написал(а):
Удаляются имена файлов, а нужно чтобы удалились пути к файлам. Конечный результат должен быть таким:
3yMVUeyGhi.jpg
7MsaJJOvPI.jpg
G9UtXt1l8L.jpg

Регулярка: .*/

санчил · 20.01.2021

приветствую!
подскажите как сделать регулярку? для Сообщение: "8091"

Sergodjan · 20.01.2021

санчил написал(а):
приветствую!
подскажите как сделать регулярку? для Сообщение: "8091"

\d+ не подходит?

санчил · 20.01.2021

sergodjan66 написал(а):
\d+ не подходит?

Сообщение: "8091"

для всей строки вместе со словом( Сообщение: "8091")

Sergodjan · 20.01.2021

санчил написал(а):
Сообщение: "8091"

для всей строки вместе со словом( Сообщение: "8091")

Я подумал только номер нужен. Тогда так: Сообщение:\ ".*?"

санчил · 20.01.2021

sergodjan66 написал(а):
Я подумал только номер нужен. Тогда так: Сообщение:\ ".*?"

и номер тоже вместе с Сообщением ( т.е 8091 эти цифры постоянно меняются

Регулярные выражения на все случаи жизни

Client

Client

Client

Client

Client

Client

Client

Client

Administrator

Client

Administrator

Client

Client

Administrator

Client

Administrator

Client

Administrator

Client

Активный пользователь

Administrator

Client

Administrator

Client

Administrator

Client

Administrator

Client

Administrator

Client

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)