Бесплатно напишу регулярное выражение. Часть 2.

Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
А в зенке парсите DOM модель или код страницы?
Как вариант сделать сохранение кода страницы в TXT файл из переменной и посмотреть что не так.
 

cherus09

Client
Регистрация
10.10.2016
Сообщения
172
Благодарностей
14
Баллы
18
А в зенке парсите DOM модель или код страницы?
Как вариант сделать сохранение кода страницы в TXT файл из переменной и посмотреть что не так.
Посмотрел как вы подсказали и действительно в коде по другому ссылки прописаны, подправил регулярку, теперь все норм парсит. Спасибо за наводку!
 
Регистрация
27.12.2012
Сообщения
70
Благодарностей
8
Баллы
8
Подскажите про замену групп. Есть тексты, хочу в каждом тексте одно рандомное слово заменять этим же словом но уже с ссылкой. Делал через кубик замены, в поиске (\s\w{4,20}) меняю на <a href="ссылка">$1</a>, в итоге зенно меняет буквально на этот текст, не заменяя $1 на группу. Через сниппет C# замена работает, но я не знаю как через C# сделать одну рандомную замену, и он меняет все вхождения.
 

maryan

Client
Регистрация
04.07.2014
Сообщения
230
Благодарностей
40
Баллы
28
Как в одном экшн заменить пустые строки? в тестере показывает Строка1\r\n\r\nСтрока2 При замене нифига не срабатывает в regexp
upload_2019-2-16_13-27-14.png
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 685
Благодарностей
4 652
Баллы
113

udder

Client
Регистрация
28.03.2017
Сообщения
638
Благодарностей
139
Баллы
43
@doc Здравствуйте, помогите пожалуйста с регуляркой.
https://test.com
http://sub.test.com/postname/
http://www.test.com/article/post/

Как оставить только имена доменов, если есть сабдомен, то его так же оставить. Протокол оставлять необязательно.
Чтобы на выходе оставить только
test.com
sub.test.com
www.test.com
 

Sanekk

Client
Регистрация
24.06.2016
Сообщения
1 000
Благодарностей
389
Баллы
83
как получить выделенное красным?
путь к файлу рандомный
/main_foto/KOS8YA4QZX3aTiIkX6jdcGXj.jpg
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 685
Благодарностей
4 652
Баллы
113
  • Спасибо
Реакции: Sanekk

санчил

Client
Регистрация
15.04.2016
Сообщения
342
Благодарностей
60
Баллы
28
подскажите как удалить в строке последний пароль VsEoz9BEPEYUL78XfEPQ2R2

users sveruta05:CL:CKS5FlVI0nXzcHojPTW kizner2:CL:VsEoz9BEPEYUL78XfEPQ2R2
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Можно по простому вырезать нужную часть
.*:
 

санчил

Client
Регистрация
15.04.2016
Сообщения
342
Благодарностей
60
Баллы
28

inilim

Client
Регистрация
16.09.2017
Сообщения
446
Благодарностей
170
Баллы
43
как составить регулярку, взять содержимое тега в котором отсутствуют любые теги. Например тег <a>:
<a>text<span>1</span></a>
<a>
<span>1</span>text</a>
<a>текс</a>
но при этом содержимое может и не быть вовсе.
<a></a>
 
Последнее редактирование:

orka13

Client
Регистрация
07.05.2015
Сообщения
2 185
Благодарностей
2 198
Баллы
113
как составить регулярку, взять содержимое тега в котором отсутствуют любые теги. Например тег <a>:
<a>text<span>1</span></a>
<a>
<span>1</span>text</a>
<a>текс</a>
но при этом содержимое может и не быть вовсе.
<a></a>
Код:
(?<=<(\w+)[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?(\1)>)
Или если нужен конкрентный тег <a>:
Код:
(?<=<a[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?a>)
 
  • Спасибо
Реакции: inilim

inilim

Client
Регистрация
16.09.2017
Сообщения
446
Благодарностей
170
Баллы
43
Не одна не пашет :(
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 185
Благодарностей
2 198
Баллы
113

inilim

Client
Регистрация
16.09.2017
Сообщения
446
Благодарностей
170
Баллы
43

orka13

Client
Регистрация
07.05.2015
Сообщения
2 185
Благодарностей
2 198
Баллы
113
Тут под зенку тема, зачем на сервисе стороннем тестировать? Там сложные регулярки могут не сработать. Вот скрин что в зенке работает:
 

Вложения

  • Спасибо
Реакции: inilim

санчил

Client
Регистрация
15.04.2016
Сообщения
342
Благодарностей
60
Баллы
28

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
21 861
Благодарностей
9 718
Баллы
113

санчил

Client
Регистрация
15.04.2016
Сообщения
342
Благодарностей
60
Баллы
28
  • Спасибо
Реакции: Sergodjan

POLOZ

Client
Регистрация
06.02.2018
Сообщения
42
Благодарностей
4
Баллы
8
Приветствую! Помогите составить регулярку, чтобы обрезалась строка на точке или запятой и в строке после обрезки оставалось не более 250 символов.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
21 861
Благодарностей
9 718
Баллы
113
Приветствую! Помогите составить регулярку, чтобы обрезалась строка на точке или запятой и в строке после обрезки оставалось не более 250 символов.
Код:
[\w\W]{0,250}[,\.]
Обработка текста - Regex (Первое совпадение)
 

Вложения

  • Спасибо
Реакции: POLOZ

POLOZ

Client
Регистрация
06.02.2018
Сообщения
42
Благодарностей
4
Баллы
8
  • Спасибо
Реакции: Sergodjan
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Всем привет.
Знатоки к вам вопрос.
Как разбить текст по предложениям (т.е. по точкам) если в тексте куча сокращений типа "г.", "км.", "мл.", "сек." и т.п.?
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 185
Благодарностей
2 198
Баллы
113
Всем привет.
Знатоки к вам вопрос.
Как разбить текст по предложениям (т.е. по точкам) если в тексте куча сокращений типа "г.", "км.", "мл.", "сек." и т.п.?
Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:
C#:
// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней:
regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);
Там можно много интересных идей по обработке текста одолжить. Не все костыли там идеальные, но вроде рабочие.
 
  • Спасибо
Реакции: Сибиряк
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:
C#:
// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней:
regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);
Там можно много интересных идей по обработке текста одолжить. Не все костыли там идеальные, но вроде рабочие.
Парсер огонь!
Спасибо за код))
 

Sanekk

Client
Регистрация
24.06.2016
Сообщения
1 000
Благодарностей
389
Баллы
83
текст (83) текст (р.56);
нужно получить значение во вторых скобках
";" - после скобок всегда
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
21 861
Благодарностей
9 718
Баллы
113

Sanekk

Client
Регистрация
24.06.2016
Сообщения
1 000
Благодарностей
389
Баллы
83

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
21 861
Благодарностей
9 718
Баллы
113
первых скобок может не быть
Это можно кубиками алгоритмически обыграть.
Если по второму совпадению ничего не найдено (проверяем через IF),
то берем первое совпадение.
 
  • Спасибо
Реакции: Sanekk

Кто просматривает тему: (Всего: 5, Пользователи: 0, Гости: 5)