Бесплатно напишу регулярное выражение. Часть 2.

Nord

Client
Регистрация
22.03.2012
Сообщения
2 406
Благодарностей
1 473
Баллы
113
Есть ссылки вида
Код:
https://olxua-ring05.akamaized.net/images_slandocomua/194884925_1_261x203_kupolnaya-vytyazhka-derevyannyy-baget-chernigov.jpg
https://img02.rl0.ru/e7f4532353da432c42985f5d2f518bdf/c700x700/intstyle.com.ua/image/cache/700-700/data/products/CHP_MAGNIT/VITYAZHKI_DLYA_KUHNI/slim50_white_800x600.jpg
https://avatars.mds.yandex.net/get-marketpic/169660/market_WoXKCtozMbOjF95MDt3O2w/orig
https://a1.s3.ua/r650/613/1305613/42/36abb9c6-189b-4f4d-87a8-c11684644c74.jpg
Нужно спарсить расширение у изображений ( jpg, png и прочие), а если его нет, как в третей строке, то ничего =)
Можно это интерпретировать так - последние 3-4 символов с конца до точки, если таковая имеется
 

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
Есть ссылки вида
Код:
https://olxua-ring05.akamaized.net/images_slandocomua/194884925_1_261x203_kupolnaya-vytyazhka-derevyannyy-baget-chernigov.jpg
https://img02.rl0.ru/e7f4532353da432c42985f5d2f518bdf/c700x700/intstyle.com.ua/image/cache/700-700/data/products/CHP_MAGNIT/VITYAZHKI_DLYA_KUHNI/slim50_white_800x600.jpg
https://avatars.mds.yandex.net/get-marketpic/169660/market_WoXKCtozMbOjF95MDt3O2w/orig
https://a1.s3.ua/r650/613/1305613/42/36abb9c6-189b-4f4d-87a8-c11684644c74.jpg
Нужно спарсить расширение у изображений ( jpg, png и прочие), а если его нет, как в третей строке, то ничего =)
Можно это интерпретировать так - последние 3-4 символов с конца до точки, если таковая имеется
\.[a-z]{2,5}\r\n

так как у зенки баг с интерпретацией символа \r, если не сработает уберите его из выражения
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Есть ссылки вида
Код:
https://olxua-ring05.akamaized.net/images_slandocomua/194884925_1_261x203_kupolnaya-vytyazhka-derevyannyy-baget-chernigov.jpg
https://img02.rl0.ru/e7f4532353da432c42985f5d2f518bdf/c700x700/intstyle.com.ua/image/cache/700-700/data/products/CHP_MAGNIT/VITYAZHKI_DLYA_KUHNI/slim50_white_800x600.jpg
https://avatars.mds.yandex.net/get-marketpic/169660/market_WoXKCtozMbOjF95MDt3O2w/orig
https://a1.s3.ua/r650/613/1305613/42/36abb9c6-189b-4f4d-87a8-c11684644c74.jpg
Нужно спарсить расширение у изображений ( jpg, png и прочие), а если его нет, как в третей строке, то ничего =)
Можно это интерпретировать так - последние 3-4 символов с конца до точки, если таковая имеется
Код:
(?<=[^\s\.])\.\w{3,4}(?=\s)
 

botovod

Client
Регистрация
04.04.2014
Сообщения
170
Благодарностей
126
Баллы
43
(?<=\.)[^.]{3,5}(?=\r|\n|$)
 

radv

Client
Регистрация
11.05.2015
Сообщения
3 788
Благодарностей
1 952
Баллы
113
есть регулярка поиска адресов емайл

[\w\.-]+@[\w\.-]+.[a-z]{2,}

почему то иногда оставляет не буквенные символы

Примеры

[email protected]>info
[email protected]<info
[email protected],
[email protected]?subject

т.е. иногда нормально ищет, а иногда в конце адреса емайла остаются не нужные символы, как от них избавиться?
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
[\w\.-]+@[\w\.-]+\.[a-z]{2,}
есть регулярка поиска адресов емайл

[\w\.-]+@[\w\.-]+.[a-z]{2,}

почему то иногда оставляет не буквенные символы

Примеры

[email protected]>info
[email protected]<info
[email protected],
[email protected]?subject

т.е. иногда нормально ищет, а иногда в конце адреса емайла остаются не нужные символы, как от них избавиться?
просто в вашей регулярке не экранирован символ точки. Надо так:
[\w\.-]+@[\w\.-]+\.[a-z]{2,}
 
  • Спасибо
Реакции: radv

Nord

Client
Регистрация
22.03.2012
Сообщения
2 406
Благодарностей
1 473
Баллы
113
Добрый вечер, комрады.
Имеем
def |4555_yr7gy |o96f_com

Требуется
o96f

Конструктор предлагает такое, но это не катит, потому что парсит не то, что нужно
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
  • Спасибо
Реакции: Nord

Nord

Client
Регистрация
22.03.2012
Сообщения
2 406
Благодарностей
1 473
Баллы
113

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
Спасибо, но что то не хочет, пишет что инвалидная регулярка
В PM всё норм, а в Notepad'е вообще не понятно, как регулярки работают, хз какой там синтаксис.
 
  • Спасибо
Реакции: Nord

leonidm

Client
Регистрация
28.04.2017
Сообщения
19
Благодарностей
2
Баллы
3
Нужна регулярка для обрезки текста, максимальное количество симвоолов в исходном тексте должно быть не больше 16000 символов, но текст не должен заканчиваться обрываясь на словах после обрезки, а заканчиваться предложением.
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Нужна регулярка для обрезки текста, максимальное количество симвоолов в исходном тексте должно быть не больше 16000 символов, но текст не должен заканчиваться обрываясь на словах после обрезки, а заканчиваться предложением.
^[\w\W]{0,16000}[.!?]
Была тема об этом
 

santers3

Client
Регистрация
24.07.2017
Сообщения
32
Благодарностей
1
Баллы
8

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
  • Спасибо
Реакции: santers3 и Sanekk

santers3

Client
Регистрация
24.07.2017
Сообщения
32
Благодарностей
1
Баллы
8
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Хелоу
Ребят помогите с регулярным выражением.
Надо удалить из списка экшеном "Операция над списком" ключевики состоящие менее чем из 3-х слов.
Там два режима рег. выражение удовлетворяющее и не удовлетворяющее.
Ни как не могу составить.
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Хелоу
Ребят помогите с регулярным выражением.
Надо удалить из списка экшеном "Операция над списком" ключевики состоящие менее чем из 3-х слов.
Там два режима рег. выражение удовлетворяющее и не удовлетворяющее.
Ни как не могу составить.
регулярка для поиска строк с количеством слов меньше 3 (количество = от 0 по 2):
Код:
^(\W*\b\w+\b\W*){0,2}$
 
  • Спасибо
Реакции: Сибиряк
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63

redman

Client
Регистрация
11.03.2016
Сообщения
554
Благодарностей
178
Баллы
43
Друзья, есть текст со словами и цифрами. В нём попадаются вот такие числа разделенные дефисом, 13-, 97-07, 2008-13, -89, как мне их выудить?
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
  • Спасибо
Реакции: redman

sidor800

Client
Регистрация
16.04.2013
Сообщения
123
Благодарностей
41
Баллы
28
Как очистить атрибуты тегов есть к примеру такие теги
<div class="box">
<td bgcolor=#334455 class=style1 align=left width=10%>
<p class="MsoNormal">
<strong data-redactor-tag="strong" data-verified="redactor">
должно остаться

<div>
<td >
<p >
<strong>
 

botovod

Client
Регистрация
04.04.2014
Сообщения
170
Благодарностей
126
Баллы
43
Замена по Regexp (?<=<.*) .*?(?=>)
 

bizzon

Client
Регистрация
08.09.2015
Сообщения
1 103
Благодарностей
132
Баллы
63
как убрать единичные символы с пробелом в начале строк, например:
r gffgfgfgf
gfgfgfgfg
u fgfgfgfg
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
заменить на пустоту это вхождение регулярки (после второго слеша там пробел должен идти, просто форум его может обрезать):
Код:
^\S\
 
  • Спасибо
Реакции: bizzon

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
  • Спасибо
Реакции: bizzon

seomr

Client
Регистрация
31.05.2011
Сообщения
103
Благодарностей
5
Баллы
18
Нужно спарсить только email адреса на анализируемом домене.
К примеру, у нас есть site.ru, с него нужно спарсить мыла [email protected] и прочие, но не парсить [email protected] и другие.
Также не должно спотыкаться на site.com.ru
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113

seomr

Client
Регистрация
31.05.2011
Сообщения
103
Благодарностей
5
Баллы
18
Не парсит с сайтов в зоне типа com.ru
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
  • Спасибо
Реакции: seomr

iBotovod

Client
Регистрация
01.07.2017
Сообщения
56
Благодарностей
19
Баллы
8
Привет.
Есть строка ABCDEFBGH
B, D, F - константы
Какой регуляркой можно получить ACEGH (искомая строка, но без констант)?
Спасибо.
 
Последнее редактирование:

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)