Бесплатно напишу регулярное выражение. Часть 2.

  • Автор темы Автор темы LightWood
  • Дата начала Дата начала
Есть ссылки вида
Код:
Развернуть Свернуть Копировать
https://olxua-ring05.akamaized.net/images_slandocomua/194884925_1_261x203_kupolnaya-vytyazhka-derevyannyy-baget-chernigov.jpg
https://img02.rl0.ru/e7f4532353da432c42985f5d2f518bdf/c700x700/intstyle.com.ua/image/cache/700-700/data/products/CHP_MAGNIT/VITYAZHKI_DLYA_KUHNI/slim50_white_800x600.jpg
https://avatars.mds.yandex.net/get-marketpic/169660/market_WoXKCtozMbOjF95MDt3O2w/orig
https://a1.s3.ua/r650/613/1305613/42/36abb9c6-189b-4f4d-87a8-c11684644c74.jpg

Нужно спарсить расширение у изображений ( jpg, png и прочие), а если его нет, как в третей строке, то ничего =)
Можно это интерпретировать так - последние 3-4 символов с конца до точки, если таковая имеется
 
Есть ссылки вида
Код:
Развернуть Свернуть Копировать
https://olxua-ring05.akamaized.net/images_slandocomua/194884925_1_261x203_kupolnaya-vytyazhka-derevyannyy-baget-chernigov.jpg
https://img02.rl0.ru/e7f4532353da432c42985f5d2f518bdf/c700x700/intstyle.com.ua/image/cache/700-700/data/products/CHP_MAGNIT/VITYAZHKI_DLYA_KUHNI/slim50_white_800x600.jpg
https://avatars.mds.yandex.net/get-marketpic/169660/market_WoXKCtozMbOjF95MDt3O2w/orig
https://a1.s3.ua/r650/613/1305613/42/36abb9c6-189b-4f4d-87a8-c11684644c74.jpg

Нужно спарсить расширение у изображений ( jpg, png и прочие), а если его нет, как в третей строке, то ничего =)
Можно это интерпретировать так - последние 3-4 символов с конца до точки, если таковая имеется
\.[a-z]{2,5}\r\n

так как у зенки баг с интерпретацией символа \r, если не сработает уберите его из выражения
 
Есть ссылки вида
Код:
Развернуть Свернуть Копировать
https://olxua-ring05.akamaized.net/images_slandocomua/194884925_1_261x203_kupolnaya-vytyazhka-derevyannyy-baget-chernigov.jpg
https://img02.rl0.ru/e7f4532353da432c42985f5d2f518bdf/c700x700/intstyle.com.ua/image/cache/700-700/data/products/CHP_MAGNIT/VITYAZHKI_DLYA_KUHNI/slim50_white_800x600.jpg
https://avatars.mds.yandex.net/get-marketpic/169660/market_WoXKCtozMbOjF95MDt3O2w/orig
https://a1.s3.ua/r650/613/1305613/42/36abb9c6-189b-4f4d-87a8-c11684644c74.jpg

Нужно спарсить расширение у изображений ( jpg, png и прочие), а если его нет, как в третей строке, то ничего =)
Можно это интерпретировать так - последние 3-4 символов с конца до точки, если таковая имеется
Код:
Развернуть Свернуть Копировать
(?<=[^\s\.])\.\w{3,4}(?=\s)
 
(?<=\.)[^.]{3,5}(?=\r|\n|$)
 
есть регулярка поиска адресов емайл

[\w\.-]+@[\w\.-]+.[a-z]{2,}

почему то иногда оставляет не буквенные символы

Примеры

info@mail.ru>info
info@mail.company<info
info@mail.ru,
info@mail.com?subject

т.е. иногда нормально ищет, а иногда в конце адреса емайла остаются не нужные символы, как от них избавиться?
 
[\w\.-]+@[\w\.-]+\.[a-z]{2,}
есть регулярка поиска адресов емайл

[\w\.-]+@[\w\.-]+.[a-z]{2,}

почему то иногда оставляет не буквенные символы

Примеры

info@mail.ru>info
info@mail.company<info
info@mail.ru,
info@mail.com?subject

т.е. иногда нормально ищет, а иногда в конце адреса емайла остаются не нужные символы, как от них избавиться?
просто в вашей регулярке не экранирован символ точки. Надо так:
[\w\.-]+@[\w\.-]+\.[a-z]{2,}
 
  • Спасибо
Реакции: radv
Добрый вечер, комрады.
Имеем
def |4555_yr7gy |o96f_com

Требуется
o96f

Конструктор предлагает такое, но это не катит, потому что парсит не то, что нужно
6a252ad89712f51b52377b23285162f6.png
 
  • Спасибо
Реакции: Nord
Спасибо, но что то не хочет, пишет что инвалидная регулярка
В PM всё норм, а в Notepad'е вообще не понятно, как регулярки работают, хз какой там синтаксис.
 
  • Спасибо
Реакции: Nord
Нужна регулярка для обрезки текста, максимальное количество симвоолов в исходном тексте должно быть не больше 16000 символов, но текст не должен заканчиваться обрываясь на словах после обрезки, а заканчиваться предложением.
 
Нужна регулярка для обрезки текста, максимальное количество симвоолов в исходном тексте должно быть не больше 16000 символов, но текст не должен заканчиваться обрываясь на словах после обрезки, а заканчиваться предложением.
^[\w\W]{0,16000}[.!?]
Была тема об этом
 
нужно получить из полного адреса страницы всё кроме главной страницы
например из http://zennolab.com/discussion/threads/reguljarnye-vyrazhenija-na-vse-sluchai-zhizni.20829/page-17
получить /discussion/threads/reguljarnye-vyrazhenija-na-vse-sluchai-zhizni.20829/page-17
Код:
Развернуть Свернуть Копировать
(?<=://[^\/]+)/\S+
 
  • Спасибо
Реакции: santers3 и Sanekk
Хелоу
Ребят помогите с регулярным выражением.
Надо удалить из списка экшеном "Операция над списком" ключевики состоящие менее чем из 3-х слов.
Там два режима рег. выражение удовлетворяющее и не удовлетворяющее.
Ни как не могу составить.
 
Хелоу
Ребят помогите с регулярным выражением.
Надо удалить из списка экшеном "Операция над списком" ключевики состоящие менее чем из 3-х слов.
Там два режима рег. выражение удовлетворяющее и не удовлетворяющее.
Ни как не могу составить.
регулярка для поиска строк с количеством слов меньше 3 (количество = от 0 по 2):
Код:
Развернуть Свернуть Копировать
^(\W*\b\w+\b\W*){0,2}$
 
  • Спасибо
Реакции: Сибиряк
Друзья, есть текст со словами и цифрами. В нём попадаются вот такие числа разделенные дефисом, 13-, 97-07, 2008-13, -89, как мне их выудить?
 
Друзья, есть текст со словами и цифрами. В нём попадаются вот такие числа разделенные дефисом, 13-, 97-07, 2008-13, -89, как мне их выудить?
Код:
Развернуть Свернуть Копировать
\d+-\d+|\d+-|-\d+
 
  • Спасибо
Реакции: redman
Как очистить атрибуты тегов есть к примеру такие теги
<div class="box">
<td bgcolor=#334455 class=style1 align=left width=10%>
<p class="MsoNormal">
<strong data-redactor-tag="strong" data-verified="redactor">
должно остаться

<div>
<td >
<p >
<strong>
 
Замена по Regexp (?<=<.*) .*?(?=>)
 
как убрать единичные символы с пробелом в начале строк, например:
r gffgfgfgf
gfgfgfgfg
u fgfgfgfg
 
заменить на пустоту это вхождение регулярки (после второго слеша там пробел должен идти, просто форум его может обрезать):
Код:
Развернуть Свернуть Копировать
^\S\
 
  • Спасибо
Реакции: bizzon
  • Спасибо
Реакции: bizzon
Нужно спарсить только email адреса на анализируемом домене.
К примеру, у нас есть site.ru, с него нужно спарсить мыла info@site.ru и прочие, но не парсить site.ru@gmail.com и другие.
Также не должно спотыкаться на site.com.ru
 
Нужно спарсить только email адреса на анализируемом домене.
К примеру, у нас есть site.ru, с него нужно спарсить мыла info@site.ru и прочие, но не парсить site.ru@gmail.com и другие.
Также не должно спотыкаться на site.com.ru
Код:
Развернуть Свернуть Копировать
[a-zA-Z0-9_.-]+@site\.ru
 
Не парсит с сайтов в зоне типа com.ru
 
  • Спасибо
Реакции: seomr
Привет.
Есть строка ABCDEFBGH
B, D, F - константы
Какой регуляркой можно получить ACEGH (искомая строка, но без констант)?
Спасибо.
 
Последнее редактирование:

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)