Бесплатно напишу регулярное выражение. Часть 2.

Сибиряк · 14.02.2019

А в зенке парсите DOM модель или код страницы?
Как вариант сделать сохранение кода страницы в TXT файл из переменной и посмотреть что не так.

cherus09 · 15.02.2019

Сибиряк написал(а):
А в зенке парсите DOM модель или код страницы?
Как вариант сделать сохранение кода страницы в TXT файл из переменной и посмотреть что не так.

Посмотрел как вы подсказали и действительно в коде по другому ссылки прописаны, подправил регулярку, теперь все норм парсит. Спасибо за наводку!

Jorge_Rodrigez · 15.02.2019

Подскажите про замену групп. Есть тексты, хочу в каждом тексте одно рандомное слово заменять этим же словом но уже с ссылкой. Делал через кубик замены, в поиске (\s\w{4,20}) меняю на <a href="ссылка">$1</a>, в итоге зенно меняет буквально на этот текст, не заменяя $1 на группу. Через сниппет C# замена работает, но я не знаю как через C# сделать одну рандомную замену, и он меняет все вхождения.

maryan · 16.02.2019

Как в одном экшн заменить пустые строки? в тестере показывает Строка1\r\n\r\nСтрока2 При замене нифига не срабатывает в regexp

doc · 16.02.2019

maryan написал(а):
Как в одном экшн заменить пустые строки? в тестере показывает Строка1\r\n\r\nСтрока2 При замене нифига не срабатывает в regexp
Посмотреть вложение 36223

\\r\\n

udder · 01.03.2019

@doc Здравствуйте, помогите пожалуйста с регуляркой.
https://test.com
http://sub.test.com/postname/
http://www.test.com/article/post/

Как оставить только имена доменов, если есть сабдомен, то его так же оставить. Протокол оставлять необязательно.
Чтобы на выходе оставить только
test.com
sub.test.com
www.test.com

Sanekk · 16.03.2019

как получить выделенное красным?
путь к файлу рандомный
/main_foto/KOS8YA4QZX3aTiIkX6jdcGXj.jpg

doc · 16.03.2019

Sanekk написал(а):
как получить выделенное красным?
путь к файлу рандомный
/main_foto/KOS8YA4QZX3aTiIkX6jdcGXj.jpg

/[^/]+$

санчил · 19.05.2019

подскажите как удалить в строке последний пароль VsEoz9BEPEYUL78XfEPQ2R2

users sveruta05:CL:CKS5FlVI0nXzcHojPTW kizner2:CL:VsEoz9BEPEYUL78XfEPQ2R2

Сибиряк · 19.05.2019

Можно по простому вырезать нужную часть
.*:

санчил · 19.05.2019

Сибиряк написал(а):
Можно по простому вырезать нужную часть
.*:

очень вам благодарен ,все четко работает

inilim · 24.05.2019

как составить регулярку, взять содержимое тега в котором отсутствуют любые теги. Например тег <a>:
<a>text1</a>
<a>1text</a>
<a>текс</a>
но при этом содержимое может и не быть вовсе.
<a></a>

orka13 · 24.05.2019

inilim написал(а):
как составить регулярку, взять содержимое тега в котором отсутствуют любые теги. Например тег <a>:
<a>text1</a>
<a>1text</a>
<a>текс</a>
но при этом содержимое может и не быть вовсе.
<a></a>

Код:

(?<=<(\w+)[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?(\1)>)

Или если нужен конкрентный тег <a>:

Код:

(?<=<a[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?a>)

inilim · 24.05.2019

Не одна не пашет

orka13 · 24.05.2019

inilim написал(а):
Не одна не пашет

В какой среде используются? Я в конструкторе регулярок проверил, все ок. В C# подправить может придется.

inilim · 24.05.2019

orka13 написал(а):
В какой среде используются? Я в конструкторе регулярок проверил, все ок. В C# подправить может придется.

проверял в regex101

orka13 · 24.05.2019

Тут под зенку тема, зачем на сервисе стороннем тестировать? Там сложные регулярки могут не сработать. Вот скрин что в зенке работает:

санчил · 26.05.2019

подскажите пожалуйста есть строки в таком виде
http://kourortchernomor.ru/divnomorsk-otdyx/
http://www.nashikurorty.ru/blog/divnomorskoe-otdyx-kruglyj-god/
http://www.kurortniku.ru/divnomorsk.htm
https://www.sunnyregion.ru/region/divnomorskoe/

как их получить в таком виде ( обработать
http://www.nashikurorty.ru

Sergodjan · 26.05.2019

санчил написал(а):
подскажите пожалуйста есть строки в таком виде
http://kourortchernomor.ru/divnomorsk-otdyx/
http://www.nashikurorty.ru/blog/divnomorskoe-otdyx-kruglyj-god/
http://www.kurortniku.ru/divnomorsk.htm
https://www.sunnyregion.ru/region/divnomorskoe/

как их получить в таком виде ( обработать
http://www.nashikurorty.ru

Код:

(http|https)://.*?/

санчил · 27.05.2019

sergodjan66 написал(а):
Код:

(http|https)://.*?/

Посмотреть вложение 39235

благодарен Вам , все работает

POLOZ · 27.05.2019

Приветствую! Помогите составить регулярку, чтобы обрезалась строка на точке или запятой и в строке после обрезки оставалось не более 250 символов.

Sergodjan · 27.05.2019

POLOZ написал(а):
Приветствую! Помогите составить регулярку, чтобы обрезалась строка на точке или запятой и в строке после обрезки оставалось не более 250 символов.

Код:

[\w\W]{0,250}[,\.]

Обработка текста - Regex (Первое совпадение)

POLOZ · 27.05.2019

sergodjan66 написал(а):
Код:

[\w\W]{0,250}[,\.]

Обработка текста - Regex (Первое совпадение)

Спасибо большое за оперативную помощь!

Сибиряк · 18.08.2019

Всем привет.
Знатоки к вам вопрос.
Как разбить текст по предложениям (т.е. по точкам) если в тексте куча сокращений типа "г.", "км.", "мл.", "сек." и т.п.?

orka13 · 18.08.2019

Сибиряк написал(а):
Всем привет.
Знатоки к вам вопрос.
Как разбить текст по предложениям (т.е. по точкам) если в тексте куча сокращений типа "г.", "км.", "мл.", "сек." и т.п.?

Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:

C#:

// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней:
regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);

Там можно много интересных идей по обработке текста одолжить. Не все костыли там идеальные, но вроде рабочие.

Сибиряк · 18.08.2019

orka13 написал(а):
Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:

C#:

// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней: regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);

Там можно много интересных идей по обработке текста одолжить. Не все костыли там идеальные, но вроде рабочие.

Парсер огонь!
Спасибо за код))

Sanekk · 19.08.2019

текст (83) текст (р.56);
нужно получить значение во вторых скобках
";" - после скобок всегда

Sergodjan · 19.08.2019

Sanekk написал(а):
текст (83) текст (р.56);
нужно получить значение во вторых скобках
";" - после скобок всегда

Регулярка:

Код:

(?<=\().*?(?=\))

Берем второе совпадение.

Sanekk · 19.08.2019

sergodjan66 написал(а):
Регулярка:

Код:

(?<=$).*?(?=$)

Берем второе совпадение.

Посмотреть вложение 41117

первых скобок может не быть

Sergodjan · 19.08.2019

Sanekk написал(а):
первых скобок может не быть

Это можно кубиками алгоритмически обыграть.
Если по второму совпадению ничего не найдено (проверяем через IF),
то берем первое совпадение.

Бесплатно напишу регулярное выражение. Часть 2.

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Вложения

Client

Administrator

Client

Client

Administrator

Вложения

Client

Client

Client

Client

Client

Administrator

Client

Administrator

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)