Регулярные выражения на все случаи жизни

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 564
Благодарностей
1 367
Баллы
113
Подскажите пожалуйста.

Есть очень много различных ссылок, например:
https://www.ввввв.com/watch/?v=8rxrPM/4G4tM
https://www.ааа.com.ua/black/vassa/SSSS


Как мне регуляркой получить:
?v=8rxrPM/4G4tM
vassa/SSSS

И во втором варианте:
4G4tM
SSSS

Суть в том, что нужно изменяя цифру, получать результаты в зависимости от количества / в конце. Например указав {1} получить значение с конца до первой палочки / , пример: 4G4tM , а если поставить цифру {2} получить значение с конца до второй палочки / , пример: ?v=8rxrPM/4G4tM и по такой логике, увеличивая число, получать более длинную часть url.
 

random.Object

Client
Регистрация
25.11.2020
Сообщения
9
Благодарностей
0
Баллы
1
Привет. Есть строчка
<td class="field_domain"><a href="/goto/1/5g6epr/814/?tr=search" target="_blank" title='RegEX.ru"><strong>RegEX</strong>.ru</a></td>

Как из нее достать содержимое текста title?
 

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 564
Благодарностей
1 367
Баллы
113
  • Спасибо
Реакции: random.Object

random.Object

Client
Регистрация
25.11.2020
Сообщения
9
Благодарностей
0
Баллы
1
Понял свою ошибку надо было давать сразу контекст. Задача. С сайта expireddomains.net/domain-name-search/?q=fitness&searchinit=1 мне нужно спарсить название доменов и положить их в файл.
В конструкторе регулярок выбираю "Исходные текст начинается с <td class="field_domain">. Получаю список ссылок с тайталами. 25. Далее пытаюсь вытащить текст, но задача оказалось трудной
 

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 564
Благодарностей
1 367
Баллы
113
Понял свою ошибку надо было давать сразу контекст. Задача. С сайта expireddomains.net/domain-name-search/?q=fitness&searchinit=1 мне нужно спарсить название доменов и положить их в файл.
В конструкторе регулярок выбираю "Исходные текст начинается с <td class="field_domain">. Получаю список ссылок с тайталами. 25. Далее пытаюсь вытащить текст, но задача оказалось трудной
Используйте для парсинга метод Xpath ,для ваших целей очень зайдет.
 
  • Спасибо
Реакции: random.Object

dima2121

Client
Регистрация
09.02.2020
Сообщения
143
Благодарностей
16
Баллы
18
Добрый день, есть регулярка которая разбивает слова на буквы
Регулярка \w
Взять все совпадения.
Результат:
п
р
и
в
е
т
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет
 

Gunjubasik

Client
Регистрация
30.05.2019
Сообщения
3 564
Благодарностей
1 367
Баллы
113
Добрый день, есть регулярка которая разбивает слова на буквы
Регулярка \w
Взять все совпадения.
Результат:
п
р
и
в
е
т
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет
\w+
 

dima2121

Client
Регистрация
09.02.2020
Сообщения
143
Благодарностей
16
Баллы
18

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113
А как собрать буквы в слово обратно ? чтоб получилось из
п
р
и
в
е
т
привет
Из списка объединить, с помощью действия "Операции над списком - Объединить элементы списка".
 

dima2121

Client
Регистрация
09.02.2020
Сообщения
143
Благодарностей
16
Баллы
18

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113

dima2121

Client
Регистрация
09.02.2020
Сообщения
143
Благодарностей
16
Баллы
18
  • Спасибо
Реакции: Sergodjan

igoreff

Client
Регистрация
24.02.2011
Сообщения
193
Благодарностей
24
Баллы
18
Подскажите пожалуйста, как удалить предложения короче 30 букв, текст английский?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113
  • Спасибо
Реакции: Gunjubasik

igoreff

Client
Регистрация
24.02.2011
Сообщения
193
Благодарностей
24
Баллы
18
Попробуйте такой вариант регулярки: [A-Z].{30,}?(\.|\!|\?)(\ |\r|\n|$)

Посмотреть вложение 69172
Спасибо, но почему то у меня цепляет и длинные предложения тоже, но не все длинные. Где то два предожения цепляет.

Вот например такой текст
Download and play free Casino Games. Win big in Slots. Search PC Games. Browse by Genre Hidden Object. Join the fun and strike it rich as you play free Casino Games. Play them for free or try before you buy. 1 Hit Game. Slingo Supreme 2. Slingo Supreme 2 expands on the hit Slingo Supreme game and adds double the powerups. double the awards and double the mini games which makes for double the fun. IGT Slots Wild Wolf.
Feel the adrenaline rush of putting your money at risk. even if its only fictional money. in our selection of poker and casino games for Windows. A Las Vegas casino on your PC. free English 63.6 MB 0/26/2018 Windows. Slingo Quest Deluxe. Slot machines and bingo in a single game. demo English 1.5 MB 11/03/2011 Windows.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113
Спасибо, но почему то у меня цепляет и длинные предложения тоже, но не все длинные. Где то два предожения цепляет.
Все правильно, по регулярке отбираются предложения от 30 символов и длиннее.
 
  • Спасибо
Реакции: igoreff

Khmer

Client
Регистрация
28.01.2020
Сообщения
12
Благодарностей
4
Баллы
3
Всем привет, кто-нибудь может помочь поправить регулярку?
Есть ссылки такого вида:

href="/Product/Chore-Chart-for-Kids-5975434?st=f374e058b7bdaf87937027c56571955d
href="/Product/Rainbow-Children--4392006?st=f374e058b7bdaf87937027c56571955d

Мне нужно забрать выделенные ID.
Регулярка (?<=-).[1-9]\d*(?=\?st=)
отдает
5975434
-4392006
А нужно без второго дефиса:
5975434
4392006
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113
Всем привет, кто-нибудь может помочь поправить регулярку?
Есть ссылки такого вида:

href="/Product/Chore-Chart-for-Kids-5975434?st=f374e058b7bdaf87937027c56571955d
href="/Product/Rainbow-Children--4392006?st=f374e058b7bdaf87937027c56571955d

Мне нужно забрать выделенные ID.
Попробуйте такую регулярку: ([^-]+(?=\?st=))

69334
 
  • Спасибо
Реакции: Khmer

Khmer

Client
Регистрация
28.01.2020
Сообщения
12
Благодарностей
4
Баллы
3
  • Спасибо
Реакции: Sergodjan

Kinomanius

Активный пользователь
Регистрация
20.01.2020
Сообщения
184
Благодарностей
26
Баллы
28
Добрый вечер! Нашёл тут регулярку

(?i)\bgo.*?(?=\W|\ |\r|\n|$)

Которая позволяет из текста вытянуть все слова начинающиеся на go.
Проблема - слова где есть дефис просто обрезаются и достаётся только первая часть.
Пример - слово "gose-goto" на выходе получаем "gose"
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113
Добрый вечер! Нашёл тут регулярку

(?i)\bgo.*?(?=\W|\ |\r|\n|$)

Которая позволяет из текста вытянуть все слова начинающиеся на go.
Проблема - слова где есть дефис просто обрезаются и достаётся только первая часть.
Пример - слово "gose-goto" на выходе получаем "gose"
Попробуйте так: (?i)\bgo.*?(?=\s|\r|\n|$)

69754
 
  • Спасибо
Реакции: Kinomanius

Ztrex

Client
Регистрация
20.02.2016
Сообщения
28
Благодарностей
5
Баллы
3
Подскажите регулярку для Notepad++
k:/file/data/temp/images/10/3yMVUeyGhi.jpg
k:/file/data/temp/images/10/7MsaJJOvPI.jpg
k:/file/data/temp/images/10/G9UtXt1l8L.jpg

нужно удалить пути к файлам и оставить имена и расширения файлов. Имена и расширения могут быть разными.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113
Подскажите регулярку для Notepad++
k:/file/data/temp/images/10/3yMVUeyGhi.jpg
k:/file/data/temp/images/10/7MsaJJOvPI.jpg
k:/file/data/temp/images/10/G9UtXt1l8L.jpg

нужно удалить пути к файлам и оставить имена и расширения файлов. Имена и расширения могут быть разными.
Регулярка: [^/]+(?=$|\r?\n)

70965
 

Ztrex

Client
Регистрация
20.02.2016
Сообщения
28
Благодарностей
5
Баллы
3

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113
  • Спасибо
Реакции: Ztrex

санчил

Client
Регистрация
15.04.2016
Сообщения
334
Благодарностей
60
Баллы
28
приветствую!
подскажите как сделать регулярку? для Сообщение: "8091"
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113

санчил

Client
Регистрация
15.04.2016
Сообщения
334
Благодарностей
60
Баллы
28

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 564
Благодарностей
9 179
Баллы
113

санчил

Client
Регистрация
15.04.2016
Сообщения
334
Благодарностей
60
Баллы
28

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)