Регулярные выражения на все случаи жизни

Прошу помощи в составлении регулярки
Заменить

<a\shref\s?=\s?"https?://((?!badsite\.tld).)*?>([\w\W]*?)</a> (для конкретного домена)
<a\shref\s?=\s?"https?://((?!{-Variable.domain-}).)*?>([\w\W]*?)</a> (для домена из переменной)

на $2

При такой замене останутся анкоры ссылок!
 
  • Спасибо
Реакции: kirsa
<a\shref\s?=\s?"https?://((?!badsite\.tld).)*?>([\w\W]*?)</a>
Выполняется с точностью до "наоборот". Ссылки на badsite.tld остаются полностью, а остальные теги режутся, анкоры остаются. Как инвертировать, что бы анкоры от badsite.tld и ссылки полностью на не_badsite.tld остались?
Просто режет все с badsite.tld
 

Вложения

  • reg01_4.jpg
    reg01_4.jpg
    177,5 KB · Просмотры: 756
Выполняется с точностью до "наоборот". Ссылки на badsite.tld остаются полностью, а остальные теги режутся, анкоры остаются.
Да, всё верно! Просто подумал, что так и надо было))
Как инвертировать, что бы анкоры от badsite.tld и ссылки полностью на не_badsite.tld остались?
Заменить

<a\shref\s?=\s?"https?://badsite\.tld.*?>([\w\W]*?)</a> (для конкретного домена)
<a\shref\s?=\s?"https?://{-Variable.domain-}.*?>([\w\W]*?)</a> (для домена из переменной)

на $1

При такой замене останутся анкоры ссылок!
 
  • Спасибо
Реакции: kirsa
@Dimionix, спасибо! Пока непонятно как работает, с такой заменой впервые столкнулся. Еще раз благодарю за урОк.
 
Можно ли реализовать в "Обработке текста - Замена" смену регистра символа(ов)? В EmEditor работает префикс "\U". Есть вариант на форуме через char.ToUpper(), но возможно ли в кубике такую замену сделать?
 

Вложения

  • reg01_5.jpg
    reg01_5.jpg
    79,5 KB · Просмотры: 737
  • reg01_6.jpg
    reg01_6.jpg
    66,1 KB · Просмотры: 729
Можно ли реализовать в "Обработке текста - Замена" смену регистра символа(ов)? В EmEditor работает префикс "\U". Есть вариант на форуме через char.ToUpper(), но возможно ли в кубике такую замену сделать?
в кубике эти модификаторы регистра не работают, как и в коде. Решение только циклом искать по одному совпадению маленькую букву и заменять на большую
 
  • Спасибо
Реакции: kirsa
Добрый день. Два часа с утра бьюсь над элементарной задачей, но на одном месте что-то((( надо номер +9 (999) 999-99-99 привести к виду +99999999999
 
спасибо) я сделал сначала немного геморойнее - заменял ненужные символы на пустоту каждый раз складывая их в одну переменную. в итоге последовательно очищался номер от всего лишнего.
 
Как можно выдрать два значения за раз в одну переменную или сразу в список ?

Код:
Развернуть Свернуть Копировать
">значение раз</a></td>
                <td>значение два</td>
 
Ребята добрый день!
Я прошу прощения, новичок в этом деле я,как выдернуть отсюда адреса прокси с помощью регулярных выражений?
https://hidemy.name/ru/proxy-list/
 
Ребята добрый день!
Я прошу прощения, новичок в этом деле я,как выдернуть отсюда адреса прокси с помощью регулярных выражений?
https://hidemy.name/ru/proxy-list/

почитай первый пост, там есть для прокси
http://zennolab.com/discussion/threads/reguljarnye-vyrazhenija-na-vse-sluchai-zhizni.20829/
 
Добрый день. Я здесь впервые. Помогите пожалуйста: нужно составить регулярку, которая бы удаляла ссылки в постах по следующим критериям: http://.*html и еще: http://.*\
Заранее благодарю)
 
Добрый день. Я здесь впервые. Помогите пожалуйста: нужно составить регулярку, которая бы удаляла ссылки в постах по следующим критериям: http://.*html и еще: http://.*\
Заранее благодарю)
выложи пример по подробнее , что есть и что требуется после обработки
 
выложи пример по подробнее , что есть и что требуется после обработки
Мне нужно спарсить прокси с определенного сайта домен-"hidemy.name"
Посл парсинга хотел бы видеть значение в списке Прокси:порт
 
Ребята добрый день!
Я прошу прощения, новичок в этом деле я,как выдернуть отсюда адреса прокси с помощью регулярных выражений?
https://hidemy.name/ru/proxy-list/
Мне нужно спарсить прокси с определенного сайта домен-"hidemy.name"
Посл парсинга хотел бы видеть значение в списке Прокси:порт
Код:
Развернуть Свернуть Копировать
(?<=<td class=tdl>)[\d.]+.*?\d+(?=</td>)
Потом заменить </td><td> на : (двоеточие)
 
выложи пример по подробнее , что есть и что требуется после обработки
https://vk.com/darom_dam Подарит
D83CDF81.png
blank.gif
своему случайному подписчику веночек на голову белого цвета
blank.gif
2728.png


Для участия нужно :
D83DDD39.png
Вступить в группу https://vk.com/darom_dam
D83DDD39.png
Сделать РЕПОСТ этой записи
D83DDD39.png
Быть Подписчиком https://youproxy.ru/russian-proxy.html

Имя Победителя мы узнаем 23 Июня!
Всем удачи
263A.png
D83CDF40.png
2728.png

Это пример поста.
Или еще: Например: продаю шубу хорька, чтобы купить обращайтесь на сайт: https://shuba-horqka.html Юрий.

Нужно чтобы из этих постов или объявлений оставались чистые объявления без ссылок
 
После обработки требуется: продаю шубу хорька, чтобы купить обращайтесь на сайт: Юрий.
или


Подарит
D83CDF81.png
blank.gif
своему случайному подписчику веночек на голову белого цвета
blank.gif
2728.png


Для участия нужно :
D83DDD39.png
Вступить в группу
D83DDD39.png
Сделать РЕПОСТ этой записи
D83DDD39.png
Быть Подписчиком

Имя Победителя мы узнаем 23 Июня!
Всем удачи
263A.png
D83CDF40.png
2728.png
 

Вложения

Последнее редактирование:
После обработки требуется: продаю шубу хорька, чтобы купить обращайтесь на сайт: Юрий.
или


Подарит
D83CDF81.png
blank.gif
своему случайному подписчику веночек на голову белого цвета
blank.gif
2728.png


Для участия нужно :
D83DDD39.png
Вступить в группу
D83DDD39.png
Сделать РЕПОСТ этой записи
D83DDD39.png
Быть Подписчиком

Имя Победителя мы узнаем 23 Июня!
Всем удачи
263A.png
D83CDF40.png
2728.png
Все! Разобрался) Всем спасибо)
 
Ребят подскажите плиз.
Как объединить эти две регулярки? Это чищу строку урла от всяких левых символов..Т.е. надо только то что перечислено в этих регулярках, а остальное вырезать нафиг.
Код:
Развернуть Свернуть Копировать
[^а-я0-9ёА-ЯЁ \-\:\(\)\"\—\…,]    //Удалять предложения, в которых присутствуют любые символы отличные от русских букв, цифр, тире и запятой
[^a-z0-9A-Z \-\:\(\)\"\—\…,]    //Удалять предложения, в которых присутствуют любые символы отличные от латинских букв, цифр, тире и запятой

УПД
Подсказали чуток
[^а-яА-Яa-zA-Z0-9\.\-\,\.\s]
 
Последнее редактирование:
ТЗ размытое. Наведите пример какой урл надо, а какой нет. Пока подходят такие регулярки (вторая более универсальная):
Код:
Развернуть Свернуть Копировать
http://site\.ru/\d+
https?://[^.]+\.[^.]+/\d+
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)