Регулярные выражения на все случаи жизни

Подскажите пожалуйста.

Есть очень много различных ссылок, например:
https://www.ввввв.com/watch/?v=8rxrPM/4G4tM https://www.ааа.com.ua/black/vassa/SSSS

Как мне регуляркой получить:
?v=8rxrPM/4G4tM
vassa/SSSS

И во втором варианте:
4G4tM
SSSS

Суть в том, что нужно изменяя цифру, получать результаты в зависимости от количества / в конце. Например указав {1} получить значение с конца до первой палочки / , пример: 4G4tM , а если поставить цифру {2} получить значение с конца до второй палочки / , пример: ?v=8rxrPM/4G4tM и по такой логике, увеличивая число, получать более длинную часть url.
 
Привет. Есть строчка
<td class="field_domain"><a href="/goto/1/5g6epr/814/?tr=search" target="_blank" title='RegEX.ru"><strong>RegEX</strong>.ru</a></td>

Как из нее достать содержимое текста title?
 
Привет. Есть строчка
<td class="field_domain"><a href="/goto/1/5g6epr/814/?tr=search" target="_blank" title='RegEX.ru"><strong>RegEX</strong>.ru</a></td>

Как из нее достать содержимое текста title?

(?<=title=').*?(?=">)
67940
 
  • Спасибо
Реакции: random.Object
Понял свою ошибку надо было давать сразу контекст. Задача. С сайта expireddomains.net/domain-name-search/?q=fitness&searchinit=1 мне нужно спарсить название доменов и положить их в файл.
В конструкторе регулярок выбираю "Исходные текст начинается с <td class="field_domain">. Получаю список ссылок с тайталами. 25. Далее пытаюсь вытащить текст, но задача оказалось трудной
 
Понял свою ошибку надо было давать сразу контекст. Задача. С сайта expireddomains.net/domain-name-search/?q=fitness&searchinit=1 мне нужно спарсить название доменов и положить их в файл.
В конструкторе регулярок выбираю "Исходные текст начинается с <td class="field_domain">. Получаю список ссылок с тайталами. 25. Далее пытаюсь вытащить текст, но задача оказалось трудной
Используйте для парсинга метод Xpath ,для ваших целей очень зайдет.
 
  • Спасибо
Реакции: random.Object
Добрый день, есть регулярка которая разбивает слова на буквы
Регулярка \w
Взять все совпадения.
Результат:
п
р
и
в
е
т
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет
 
Добрый день, есть регулярка которая разбивает слова на буквы
Регулярка \w
Взять все совпадения.
Результат:
п
р
и
в
е
т
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет
\w+
 
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет
Из списка объединить, с помощью действия "Операции над списком - Объединить элементы списка".
 
Подскажите пожалуйста, как удалить предложения короче 30 букв, текст английский?
 
  • Спасибо
Реакции: The_vAe
Попробуйте такой вариант регулярки: [A-Z].{30,}?(\.|\!|\?)(\ |\r|\n|$)

Посмотреть вложение 69172

Спасибо, но почему то у меня цепляет и длинные предложения тоже, но не все длинные. Где то два предожения цепляет.

Вот например такой текст
Download and play free Casino Games. Win big in Slots. Search PC Games. Browse by Genre Hidden Object. Join the fun and strike it rich as you play free Casino Games. Play them for free or try before you buy. 1 Hit Game. Slingo Supreme 2. Slingo Supreme 2 expands on the hit Slingo Supreme game and adds double the powerups. double the awards and double the mini games which makes for double the fun. IGT Slots Wild Wolf.
Feel the adrenaline rush of putting your money at risk. even if its only fictional money. in our selection of poker and casino games for Windows. A Las Vegas casino on your PC. free English 63.6 MB 0/26/2018 Windows. Slingo Quest Deluxe. Slot machines and bingo in a single game. demo English 1.5 MB 11/03/2011 Windows.
 
Спасибо, но почему то у меня цепляет и длинные предложения тоже, но не все длинные. Где то два предожения цепляет.
Все правильно, по регулярке отбираются предложения от 30 символов и длиннее.
 
  • Спасибо
Реакции: igoreff
Всем привет, кто-нибудь может помочь поправить регулярку?
Есть ссылки такого вида:

href="/Product/Chore-Chart-for-Kids-5975434?st=f374e058b7bdaf87937027c56571955d
href="/Product/Rainbow-Children--4392006?st=f374e058b7bdaf87937027c56571955d

Мне нужно забрать выделенные ID.
Регулярка (?<=-).[1-9]\d*(?=\?st=)
отдает
5975434
-4392006
А нужно без второго дефиса:
5975434
4392006
 
Всем привет, кто-нибудь может помочь поправить регулярку?
Есть ссылки такого вида:

href="/Product/Chore-Chart-for-Kids-5975434?st=f374e058b7bdaf87937027c56571955d
href="/Product/Rainbow-Children--4392006?st=f374e058b7bdaf87937027c56571955d

Мне нужно забрать выделенные ID.

Попробуйте такую регулярку: ([^-]+(?=\?st=))

69334
 
  • Спасибо
Реакции: Khmer
Добрый вечер! Нашёл тут регулярку

(?i)\bgo.*?(?=\W|\ |\r|\n|$)

Которая позволяет из текста вытянуть все слова начинающиеся на go.
Проблема - слова где есть дефис просто обрезаются и достаётся только первая часть.
Пример - слово "gose-goto" на выходе получаем "gose"
 
Добрый вечер! Нашёл тут регулярку

(?i)\bgo.*?(?=\W|\ |\r|\n|$)

Которая позволяет из текста вытянуть все слова начинающиеся на go.
Проблема - слова где есть дефис просто обрезаются и достаётся только первая часть.
Пример - слово "gose-goto" на выходе получаем "gose"
Попробуйте так: (?i)\bgo.*?(?=\s|\r|\n|$)

69754
 
  • Спасибо
Реакции: Kinomanius
Подскажите регулярку для Notepad++
k:/file/data/temp/images/10/3yMVUeyGhi.jpg
k:/file/data/temp/images/10/7MsaJJOvPI.jpg
k:/file/data/temp/images/10/G9UtXt1l8L.jpg

нужно удалить пути к файлам и оставить имена и расширения файлов. Имена и расширения могут быть разными.
 
Подскажите регулярку для Notepad++
k:/file/data/temp/images/10/3yMVUeyGhi.jpg
k:/file/data/temp/images/10/7MsaJJOvPI.jpg
k:/file/data/temp/images/10/G9UtXt1l8L.jpg

нужно удалить пути к файлам и оставить имена и расширения файлов. Имена и расширения могут быть разными.
Регулярка: [^/]+(?=$|\r?\n)

70965
 
  • Спасибо
Реакции: Ztrex
приветствую!
подскажите как сделать регулярку? для Сообщение: "8091"
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)