Бесплатно напишу регулярное выражение. Часть 2.

Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
А в зенке парсите DOM модель или код страницы?
Как вариант сделать сохранение кода страницы в TXT файл из переменной и посмотреть что не так.
 

cherus09

Client
Регистрация
10.10.2016
Сообщения
172
Благодарностей
14
Баллы
18
А в зенке парсите DOM модель или код страницы?
Как вариант сделать сохранение кода страницы в TXT файл из переменной и посмотреть что не так.
Посмотрел как вы подсказали и действительно в коде по другому ссылки прописаны, подправил регулярку, теперь все норм парсит. Спасибо за наводку!
 
Регистрация
27.12.2012
Сообщения
70
Благодарностей
8
Баллы
8
Подскажите про замену групп. Есть тексты, хочу в каждом тексте одно рандомное слово заменять этим же словом но уже с ссылкой. Делал через кубик замены, в поиске (\s\w{4,20}) меняю на <a href="ссылка">$1</a>, в итоге зенно меняет буквально на этот текст, не заменяя $1 на группу. Через сниппет C# замена работает, но я не знаю как через C# сделать одну рандомную замену, и он меняет все вхождения.
 

maryan

Client
Регистрация
04.07.2014
Сообщения
230
Благодарностей
40
Баллы
28
Как в одном экшн заменить пустые строки? в тестере показывает Строка1\r\n\r\nСтрока2 При замене нифига не срабатывает в regexp
upload_2019-2-16_13-27-14.png
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113

udder

Client
Регистрация
28.03.2017
Сообщения
618
Благодарностей
128
Баллы
43
@doc Здравствуйте, помогите пожалуйста с регуляркой.
https://test.com
http://sub.test.com/postname/
http://www.test.com/article/post/

Как оставить только имена доменов, если есть сабдомен, то его так же оставить. Протокол оставлять необязательно.
Чтобы на выходе оставить только
test.com
sub.test.com
www.test.com
 

Sanekk

Client
Регистрация
24.06.2016
Сообщения
999
Благодарностей
390
Баллы
63
как получить выделенное красным?
путь к файлу рандомный
/main_foto/KOS8YA4QZX3aTiIkX6jdcGXj.jpg
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113
  • Спасибо
Реакции: Sanekk

санчил

Client
Регистрация
15.04.2016
Сообщения
334
Благодарностей
60
Баллы
28
подскажите как удалить в строке последний пароль VsEoz9BEPEYUL78XfEPQ2R2

users sveruta05:CL:CKS5FlVI0nXzcHojPTW kizner2:CL:VsEoz9BEPEYUL78XfEPQ2R2
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Можно по простому вырезать нужную часть
.*:
 

санчил

Client
Регистрация
15.04.2016
Сообщения
334
Благодарностей
60
Баллы
28

inilim

Client
Регистрация
16.09.2017
Сообщения
446
Благодарностей
170
Баллы
43
как составить регулярку, взять содержимое тега в котором отсутствуют любые теги. Например тег <a>:
<a>text<span>1</span></a>
<a>
<span>1</span>text</a>
<a>текс</a>
но при этом содержимое может и не быть вовсе.
<a></a>
 
Последнее редактирование:

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
как составить регулярку, взять содержимое тега в котором отсутствуют любые теги. Например тег <a>:
<a>text<span>1</span></a>
<a>
<span>1</span>text</a>
<a>текс</a>
но при этом содержимое может и не быть вовсе.
<a></a>
Код:
(?<=<(\w+)[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?(\1)>)
Или если нужен конкрентный тег <a>:
Код:
(?<=<a[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?a>)
 
  • Спасибо
Реакции: inilim

inilim

Client
Регистрация
16.09.2017
Сообщения
446
Благодарностей
170
Баллы
43
Не одна не пашет :(
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113

inilim

Client
Регистрация
16.09.2017
Сообщения
446
Благодарностей
170
Баллы
43

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Тут под зенку тема, зачем на сервисе стороннем тестировать? Там сложные регулярки могут не сработать. Вот скрин что в зенке работает:
 

Вложения

  • Спасибо
Реакции: inilim

санчил

Client
Регистрация
15.04.2016
Сообщения
334
Благодарностей
60
Баллы
28

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 436
Благодарностей
9 132
Баллы
113

санчил

Client
Регистрация
15.04.2016
Сообщения
334
Благодарностей
60
Баллы
28
  • Спасибо
Реакции: Sergodjan

POLOZ

Client
Регистрация
06.02.2018
Сообщения
42
Благодарностей
4
Баллы
8
Приветствую! Помогите составить регулярку, чтобы обрезалась строка на точке или запятой и в строке после обрезки оставалось не более 250 символов.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 436
Благодарностей
9 132
Баллы
113
Приветствую! Помогите составить регулярку, чтобы обрезалась строка на точке или запятой и в строке после обрезки оставалось не более 250 символов.
Код:
[\w\W]{0,250}[,\.]
Обработка текста - Regex (Первое совпадение)
 

Вложения

  • Спасибо
Реакции: POLOZ

POLOZ

Client
Регистрация
06.02.2018
Сообщения
42
Благодарностей
4
Баллы
8
  • Спасибо
Реакции: Sergodjan
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Всем привет.
Знатоки к вам вопрос.
Как разбить текст по предложениям (т.е. по точкам) если в тексте куча сокращений типа "г.", "км.", "мл.", "сек." и т.п.?
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Всем привет.
Знатоки к вам вопрос.
Как разбить текст по предложениям (т.е. по точкам) если в тексте куча сокращений типа "г.", "км.", "мл.", "сек." и т.п.?
Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:
C#:
// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней:
regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);
Там можно много интересных идей по обработке текста одолжить. Не все костыли там идеальные, но вроде рабочие.
 
  • Спасибо
Реакции: Сибиряк
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:
C#:
// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней:
regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);
Там можно много интересных идей по обработке текста одолжить. Не все костыли там идеальные, но вроде рабочие.
Парсер огонь!
Спасибо за код))
 

Sanekk

Client
Регистрация
24.06.2016
Сообщения
999
Благодарностей
390
Баллы
63
текст (83) текст (р.56);
нужно получить значение во вторых скобках
";" - после скобок всегда
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 436
Благодарностей
9 132
Баллы
113

Sanekk

Client
Регистрация
24.06.2016
Сообщения
999
Благодарностей
390
Баллы
63

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 436
Благодарностей
9 132
Баллы
113
первых скобок может не быть
Это можно кубиками алгоритмически обыграть.
Если по второму совпадению ничего не найдено (проверяем через IF),
то берем первое совпадение.
 
  • Спасибо
Реакции: Sanekk

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)