Бесплатно напишу регулярное выражение. Часть 2.

starley · 11.04.2015

fri-lancer сказал(а):
Подскажите пожалуйста регулярку чтобы обрезала предложения до трех слов.

тоже мучаюсь с похожей задачей: чтобы ещё можно было задавать диапазон - обрезать строки рандомно, к примеру, оставлять от 3 до 5 слов в строке. Как определить количество слов в строке нашел на форуме, а вот как обрезать и оставить заданное количество - не знаю.

Radzhab · 11.04.2015

C#:

var str = "Подскажите пожалуйста регулярку чтобы обрезала предложения до трех слов.";
            
             Random rnd = new Random();
             var count = rnd.Next(1, str.Split(' ').Count());
             var words = str.Split(' ').Take(count);
             string rezultString = string.Join(" ", words.ToArray());

Wide · 11.04.2015

Radzhab сказал(а):

C#:

var str = "Подскажите пожалуйста регулярку чтобы обрезала предложения до трех слов.";
          
             Random rnd = new Random();
             var count = rnd.Next(1, str.Split(' ').Count());
             var words = str.Split(' ').Take(count);
             string rezultString = string.Join(" ", words.ToArray());

имхо. было бы логичнее заставить код работать с переменными. ну а так, как всегда красава. забираю в копилку)

ssXXXss · 12.04.2015

mrXrumer сказал(а):
имхо. было бы логичнее заставить код работать с переменными. ну а так, как всегда красава. забираю в копилку)

я не кодер но вроде работает))

Код:

var str = project.Variables["str"].Value;

             Random rnd = new Random(1);
             var count = rnd.Next(int.Parse(project.Variables["q"].Value), str.Split(' ').Count());
             var words = str.Split(' ').Take(count);
             string rezultString = string.Join(" ", words.ToArray());
            return rezultString;
;

если предложение состоит меньше заданного числа то выходит по красной
q - это ваше заданное число которое прибавляется к +1, так же можно поставить кубик рандом для q

если что то ни так сильно не пинайте)))))

Wide · 12.04.2015

ssXXXss сказал(а):
я не кодер но вроде работает))
если что то ни так сильно не пинайте)))))

Проверено. работает. молодца. лайк)

barkasian · 13.04.2015

Приветствую!
Нуждаюсь в Вашей помощи.
Возникли сложности со взятием тайтла и сниппета с поисковика GoGo.
Суть проблему в огромном количестве пробелов, переводах строки и ненужной шелухи при использовании регулярного выражения.
Помогите подкорректировать регулярку. Проект приложен.

sof · 14.04.2015

Друзья, нужна ваша помощь в составлении регулярного выражения. Нужно вытянуть тел.номера (телефонов может быть от 1 до 4)
Пример:
8 (099) 459 80 60 093 727 72 62 

Нужно чтобы было
8 (099) 459 80 60; 093 727 72 62

LmPopo · 14.04.2015

(?<=>)\d[\d\ ()]+\d(?=<)

sof · 14.04.2015

LmPopo сказал(а):
(?<=>)\d[\d\ ()]+\d(?=<)

Не, это не то, как то не корректно он распознает и к тому же вытягивает только один тел.

LmPopo · 14.04.2015

ну-ну )
дан был конкретный пример, на его основе написана рабочая регулярка. Чтоб собрать все совпадения - нужно использовать список.

Wide · 14.04.2015

Аффтар, где ты?) народ помогите пжл распарсить такие ссылки на категории: http://poddomen.site.ru/rubrica1/rubrica2/ http://site.ru/rubrica1/rubrica2/rubrica3/
т.е. должно быть так поддомен и/или домен плюс уровень категории. пример: http://poddomen.site.ru/rubrica1/ http://poddomen.site.ru/rubrica1/rubrica2/ http://site.ru/rubrica1/ http://site.ru/rubrica1/rubrica2/ http://site.ru/rubrica1/rubrica2/rubrica3/

Wide · 15.04.2015

Парни, актуально очень))

Bot_Sculptor · 15.04.2015

mrXrumer сказал(а):
Аффтар, где ты?) народ помогите пжл распарсить такие ссылки на категории: http://poddomen.site.ru/rubrica1/rubrica2/ http://site.ru/rubrica1/rubrica2/rubrica3/
т.е. должно быть так поддомен и/или домен плюс уровень категории. пример: http://poddomen.site.ru/rubrica1/ http://poddomen.site.ru/rubrica1/rubrica2/ http://site.ru/rubrica1/ http://site.ru/rubrica1/rubrica2/ http://site.ru/rubrica1/rubrica2/rubrica3/

ниче не понял, но уже отпишу , раз тут

Код:

https?://.+?/(.+?/){2}

{2} сколько категорий брать
{2,5} диапазон
{2,} >=2

Wide · 15.04.2015

kibnet сказал(а):
ниче не понял, но уже отпишу , раз тут

Код:

https?://.+?/(.+?/){2}

{2} сколько категорий брать
{2,5} диапазон
{2,} >2

ого работает) нужно будет подстановой в скобках поиграться. а универсальной нету? типа чтоб разбила на все категории?

Bot_Sculptor · 15.04.2015

mrXrumer сказал(а):
ого работает) нужно будет подстановой в скобках поиграться. а универсальной нету? типа чтоб разбила на все категории?

увы, я тебя не понимать)
покажи точный исходный текст, дальше покажи что с него ты хочешь получить, в точном виде. тогда станет ясно

Wide · 15.04.2015

kibnet сказал(а):
увы, я тебя не понимать)
покажи точный исходный текст, дальше покажи что с него ты хочешь получить, в точном виде. тогда станет ясно

всё спасибо мил-человек) распарсил подстановкой значения в скобках {}

Severip · 04.05.2015

Помогите плиз с регуляркой!
Задача: собрать все теги img со страницы, исключив те теги, которые в ссылке содержат слова logo и avatar.
Вот примеры ссылок:

Код:

<img src="http://cdn1.img22.domen.ru/i/company_logo.png" alt="">
<img width="16" height="16" src="http://cdn1.img22.domen.ru/i/default-avatar-20x20.jpg" class="avatar">

Пишу что-то вроде этого:

Код:

<img\ .*?domen\.ru.*?(?!logo|avatar).*?>
<img\ .*?domen\.ru.*?((?!logo|avatar).)*?>

но эти конструкции все-равно парсят все теги со стоп-словами

Как сделать правильно?

P.S. Ссылки абсолютно разные везде, их объединяет только корневой домен и + могут быть еще другие стоп слова.

LmPopo · 04.05.2015

Вроде этого -

Код:

<img[^<>]*?https?://((?!logo|avatar|<|>).)+?["'][^<>]*?>

Severip · 04.05.2015

Спасибо за помощь!
Только осталось одно но - domen.ru тоже должен присутствовать, т.к. без него собирает счетчики и прочий мусор.
Куда вставить domen.ru, чтобы он тоже присутствовал?
У меня не получается с доменом

Severip · 04.05.2015

А-а-а поковырял твой вариант, получилось!
LmPopo, спасибо!!!!!!
Вот итог:

Код:

<img[^<>]*?https?://[^<>]*?domen\.ru[^<>]((?!logo|avatar|<|>).)+?["'][^<>]*?>

Может пригодится кому... парсит картинки в статье.

LmPopo · 04.05.2015

верно, но можно конкретно написать слеш вместо "[^<>]" :-)

+ добавил отсутствие пробелов в ссылке

Код:

<img[^<>]*?https?://[^<>]*?domen\.ru/((?!logo|avatar|<|>|\s).)+?["'][^<>]*?>

Severip · 05.05.2015

О, да! Работает! Спасибо! :-)

Severip · 05.05.2015

Еще вопрос по регуляркам. Есть список дат в файле:

20150505-наборсимволов::наборсимволов
20150504-наборсимволов::наборсимволов
20150503-наборсимволов::наборсимволов
20150502-наборсимволов::наборсимволов
20150501-наборсимволов::наборсимволов
20150430-наборсимволов::наборсимволов
20150429-наборсимволов::наборсимволов

Есть экшен Удалить строки в списке соответствующие регулярному выражению.
Задача: нужна регулярка, которая удалит все строки "младше" текущей даты 20150505 на 3 дня.
Подскажите плиз, как сделать?

LmPopo · 05.05.2015

Сначала нужно получить эти три дня, напр. с помощью c# экшна.
Затем удалить строки, не удовлетворяющие регулярке: ^20150505|^20150504|^20150503

Severip · 05.05.2015

LmPopo, спасибо тебе большое! Снова выручил.
Сделал снипет на c#, он конечно страшный, но как умею...

Код:

var date = DateTime.Now.ToString("yyyyMMdd");
var date1 = DateTime.Now.AddDays(-1).ToString("yyyyMMdd");
var date2 = DateTime.Now.AddDays(-2).ToString("yyyyMMdd");
var date3 = DateTime.Now.AddDays(-3).ToString("yyyyMMdd");
string result = "^" + date + "|^" + date1 + "|^" + date2 + "|^" + date3;
return result;

Может пригодится кому...
Хотя кто умеет, в две строки все напишет.

Severip · 05.05.2015

Покопался на форуме, но не нашел решения. Как получить регуляркой домен из ссылок вида:
www.cdn1.img22.domen.ru
img22.domen.com
в виде:
domen.ru или domen.com, т.е. чтобы сохранялся только чистый домен?
Варианты со списком всех доменных зон не нужны, т.к. никаких экзотических доменов не будет.

rostonix · 05.05.2015

а вам это надо после навигейта на сайт или до?

Severip · 05.05.2015

До перехода на сайт, оно будет в другую регулярку подставляться.

LmPopo · 05.05.2015

[\w-]+\.\w+$

Severip · 05.05.2015

Респект, LmPopo! :dh:

Бесплатно напишу регулярное выражение. Часть 2.

Client

Client

Client

Client

Client

Client

Вложения

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Известная личность

Client

Client

Client

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)