Регулярные выражения на все случаи жизни

  • Спасибо
Реакции: Nosovevgen
Мне нужно удалить из HTML div с цитированием.
PHP:
Развернуть Свернуть Копировать
Regex.Replace(he.GetAttribute("innerhtml"), @"(?<=<div\ class=""quote"">).*(?=</div>)", String.Empty);
Но он часто глючит потому что и после цитаты есть теги и div-ы.
Как лучше изменить регулярку чтобы удаляла только этот элемент целиком?
 
Мне нужно удалить из HTML div с цитированием.
PHP:
Развернуть Свернуть Копировать
Regex.Replace(he.GetAttribute("innerhtml"), @"(?<=<div\ class=""quote"">).*(?=</div>)", String.Empty);
Но он часто глючит потому что и после цитаты есть теги и div-ы.
Как лучше изменить регулярку чтобы удаляла только этот элемент целиком?
никак)
 
  • Спасибо
Реакции: Astraport
Подскажите мне нужно спарсить данные какой город, какая широта и долгота
</tr>
<tr>
<td>Город:</td>
<td>Прилуки</td>
</tr>
<tr>
<td>Широта:</td>
<td>50.59324</td>
</tr>
<tr>
<td>Долгота:</td>
<td>32.38761</td>
</tr>
<tr>
 
Подскажите мне нужно спарсить данные какой город, какая широта и долгота
</tr>
<tr>
<td>Город:</td>
<td>Прилуки</td>
</tr>
<tr>
<td>Широта:</td>
<td>50.59324</td>
</tr>
<tr>
<td>Долгота:</td>
<td>32.38761</td>
</tr>
<tr>

Самый простой вариант
Код:
Развернуть Свернуть Копировать
(?<=<td>).*?(?=</td>)

Вариант поумнее. Учитываем двоеточие и не включаем строки с ним.
Код:
Развернуть Свернуть Копировать
(?<=<td>).*[^:](?=</td>)
 
  • Спасибо
Реакции: LeonidV
Всем привет, прошу подсказки:
Допустим, есть переменная с текстом: достопримечательность.

1. Нужно сократить ее в рандомном режиме до первых 3-5 букв, какой код?

2. Нужно убрать последнюю часть (20%) букв?
 
Всем привет, прошу подсказки:
Допустим, есть переменная с текстом: достопримечательность.

1. Нужно сократить ее в рандомном режиме до первых 3-5 букв, какой код?

2. Нужно убрать последнюю часть (20%) букв?

1.
Первый кубик Обработка текста с макросом {-Random.Int-|-3-|-6-} в переменную rand
Второй кубик Обработка текста и Regex. Регулярка ^.{0,{-Variable.rand-}}

2.
Считаете количество символов в строке.
Считаете сколько символов приходится на 20%
Подставляете число в регулярку .{0,{-Variable.rand-}}$
Далее обработка текста как первом примере.



Иногда такой вот поиск в Гугл помогает
 
Привет, подскажите пожалуйста как удалить все многоточие?
 
  • Спасибо
Реакции: udder и kerteis
Добрый день!
Код:
Развернуть Свернуть Копировать
(?<=<a\ class="name"\ title="Слово"\ href=").*(?=">)
Подскажите как написать правильно....там где в кавычках "Слово" может быть любой текст (слово / предложение с цифрами / знаками препинания).
 
Добрый день!
Код:
Развернуть Свернуть Копировать
(?<=<a\ class="name"\ title="Слово"\ href=").*(?=">)
Подскажите как написать правильно....там где в кавычках "Слово" может быть любой текст (слово / предложение с цифрами / знаками препинания).
Слово заменить на .*?
 
  • Спасибо
Реакции: juder
  • Спасибо
Реакции: juder
Подскажите регулярку для такой задачи.
Часто люди не делают пробел в конце предложения, выглядит это так: ...with chat.It will be a...
Нужно добавлять пробел между точкой и буквой, если она заглавная - ...with chat. It will be a...
Какой регуляркой это можно сделать? Спасибо.
 
Подскажите регулярку для такой задачи.
Часто люди не делают пробел в конце предложения, выглядит это так: ...with chat.It will be a...
Нужно добавлять пробел между точкой и буквой, если она заглавная - ...with chat. It will be a...
Какой регуляркой это можно сделать? Спасибо.
Код:
Развернуть Свернуть Копировать
string f = "qwer.Rtttt";

return Regex.Replace(f, @"(?<=\w\.).*?(?=[A-Z])", " ");
 
  • Спасибо
Реакции: Astraport
Как добавить? в искомом тексте должно содержать слово "комментарий" или "comments".

#<span\ (slot="date"|class="(date|style-scope|ytd-video-secondary-info-renderer)\ (date|style-scope|ytd-video-secondary-info-renderer)\ (date|style-scope|ytd-video-secondary-info-renderer)")\ (slot="date"|class="(date|style-scope|ytd-video-secondary-info-renderer)\ (date|style-scope|ytd-video-secondary-info-renderer)\ (date|style-scope|ytd-video-secondary-info-renderer)")>[\w\W]*?</span>#
 
Помогите выдрать ссылку, цифры всегда разные (перечисление страниц) у самого не получается
Код:
Развернуть Свернуть Копировать
<div><a href="https://sait.ru/poisk/?category=1&amp;min_age=0&amp;max_age=0&amp;int_country_id=1&amp;int_region_id=0&amp;int_city_id=0&amp;int_metro_id=0&amp;children=-1&amp;str_order_by=order_date&amp;page=5">5</a></div>
 
Помогите выдрать ссылку, цифры всегда разные (перечисление страниц) у самого не получается
Код:
Развернуть Свернуть Копировать
<div><a href="https://sait.ru/poisk/?category=1&amp;min_age=0&amp;max_age=0&amp;int_country_id=1&amp;int_region_id=0&amp;int_city_id=0&amp;int_metro_id=0&amp;children=-1&amp;str_order_by=order_date&amp;page=5">5</a></div>

(?<=<a\ href=")https://sait\.ru/poisk/\?category.*?(?=">)
 
  • Спасибо
Реакции: CmauJluk
Подскажите, пожалуйста

Есть известная регулярка, которая парсит Email:

Код:
Развернуть Свернуть Копировать
[\.\-_A-Za-z0-9]+?@[\.\-A-Za-z0-9]+?[\.A-Za-z0-9]{2,}

Но такое мыло она "не видит":
Код:
Развернуть Свернуть Копировать
user@jabber.hot-chilli.net

Как правильно подправить, чтобы такое тоже видела?
 
  • Спасибо
Реакции: Enigma
Подскажите пожалуйста, пытаюсь составить регулярное выражение, парсер сниппетов бинг, там в тегах цифры меняются,
<span class="c_tlbxH" h="BASE:CACHEDPAGEDEFAULT" k="SERP,5169.1"></span>
<span class="c_tlbxH" h="BASE:CACHEDPAGEDEFAULT" k="SERP,5182.1"></span>
Вот эти цифры меняются, "SERP,5169.1"
как можно это зацепить?
 
что ЭТО зацепить?
всю строку, или то что в кавычках, в каких кавычках и тп

если всю строку можно так
Код:
Развернуть Свернуть Копировать
<span class="c_tlbxH" h="BASE:CACHEDPAGEDEFAULT" k="SERP,.*"></span>

или
Код:
Развернуть Свернуть Копировать
<span class="c_tlbxH" h="BASE:CACHEDPAGEDEFAULT" k=".*"></span>
 
Подскажите, пожалуйста, как взять первых 10 слов из текста. Спасибо
 
Здравствуйте, помогите составить регулярку для обработчика Email, поиск по почте получателия и отправителя, информация об этом содержится в заголовке Письма
Пример

Delivered-To: mail@mail.ru
Return-path: <noreply@mail.ru>

Пробовал так:
Return-Path:\ <noreply@mail\.ru>[\w\W]*?Delivered-To:\ mail@mail\.ru
Не получилось
Скрин
fclSr8cTQL28l0ae8U2etw.png
 
Здравствуйте, помогите составить регулярку для обработчика Email, поиск по почте получателия и отправителя, информация об этом содержится в заголовке Письма
Пример

Delivered-To: mail@mail.ru
Return-path: <noreply@mail.ru>

Пробовал так:
Return-Path:\ <noreply@mail\.ru>[\w\W]*?Delivered-To:\ mail@mail\.ru
Не получилось
Скрин
fclSr8cTQL28l0ae8U2etw.png

Попробуйте экранировать угловые скобки < и >, они являются мета-символами и требуют экранирования.
Также в регулярке лишняя угловая скобка есть, скорее всего она и нарушает поиск.

upload_2019-2-2_18-46-36.png
 
  • Спасибо
Реакции: udder
(?i)(Return-Path:\ <noreply@now-dns\.com>\s+Delivered-To:\ 2plh0za@mail\.ru|Delivered-To:\ 2plh0za@mail\.ru\s+Return-Path:\ <noreply@now-dns\.com>)
Вот такая регулярка сработала. Поиск по получателю и отправителю из заголовков письма
Попробуйте экранировать угловые скобки < и >, они являются мета-символами и требуют экранирования.
Также в регулярке лишняя угловая скобка есть, скорее всего она и нарушает поиск.
 
Приветствую!
В базе пользователей сайта нашел много пользователей с размноженными емейлами от гугла - по типу e.x.a.m.p.l.e@gmail.com ex.am.pl.e@gmail.com exa.mpl.e@gmail.com
Нужна помощь в составлении регулярки которая выдернет все емейлы от gmail.com у которых до собаки стоит более одной точки.
Помогите плиз!
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)