Посмотрел как вы подсказали и действительно в коде по другому ссылки прописаны, подправил регулярку, теперь все норм парсит. Спасибо за наводку!А в зенке парсите DOM модель или код страницы?
Как вариант сделать сохранение кода страницы в TXT файл из переменной и посмотреть что не так.
\\r\\nКак в одном экшн заменить пустые строки? в тестере показывает Строка1\r\n\r\nСтрока2 При замене нифига не срабатывает в regexp
Посмотреть вложение 36223
/[^/]+$как получить выделенное красным?
путь к файлу рандомный
/main_foto/KOS8YA4QZX3aTiIkX6jdcGXj.jpg
очень вам благодарен ,все четко работаетМожно по простому вырезать нужную часть
.*:
как составить регулярку, взять содержимое тега в котором отсутствуют любые теги. Например тег <a>:
<a>text<span>1</span></a>
<a><span>1</span>text</a>
<a>текс</a>
но при этом содержимое может и не быть вовсе.
<a></a>
(?<=<(\w+)[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?(\1)>)
(?<=<a[^\<\>]*?>)[^\<\>]*?(?=< ?\/ ?a>)
В какой среде используются? Я в конструкторе регулярок проверил, все ок. В C# подправить может придется.Не одна не пашет
проверял в regex101В какой среде используются? Я в конструкторе регулярок проверил, все ок. В C# подправить может придется.
подскажите пожалуйста есть строки в таком виде
http://kourortchernomor.ru/divnomorsk-otdyx/
http://www.nashikurorty.ru/blog/divnomorskoe-otdyx-kruglyj-god/
http://www.kurortniku.ru/divnomorsk.htm
https://www.sunnyregion.ru/region/divnomorskoe/
как их получить в таком виде ( обработать
http://www.nashikurorty.ru
(http|https)://.*?/
благодарен Вам , все работаетПосмотреть вложение 39235Код:(http|https)://.*?/
Приветствую! Помогите составить регулярку, чтобы обрезалась строка на точке или запятой и в строке после обрезки оставалось не более 250 символов.
[\w\W]{0,250}[,\.]
Спасибо большое за оперативную помощь!Обработка текста - Regex (Первое совпадение)Код:[\w\W]{0,250}[,\.]
Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:Всем привет.
Знатоки к вам вопрос.
Как разбить текст по предложениям (т.е. по точкам) если в тексте куча сокращений типа "г.", "км.", "мл.", "сек." и т.п.?
// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней:
regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);
Парсер огонь!Вот отрывок моего говнокода из старенького моего шаблона конкурсного Быстрый парсер RU + ENG текстового контента на Get-запросах:
Там можно много интересных идей по обработке текста одолжить. Не все костыли там идеальные, но вроде рабочие.C#:// умно разбиваем длинные строки на предложение по наличию точки, + пробела и заглавной буквы после нее, + текста без точки недалеко перед ней: regexTest = System.Text.RegularExpressions.Regex.Replace(regexTest, @"(?<=[^\!\.\?\r\n]{10,650})[\!\.\?]\ (?=[A-ZА-Я][^\.]{10,650})", ".\r\n", System.Text.RegularExpressions.RegexOptions.Multiline);
первых скобок может не быть
Это можно кубиками алгоритмически обыграть.первых скобок может не быть