Регулярные выражения на все случаи жизни

Сори, значит не догнал. Пока разбираюсь с возможностями на триал версии, туплю с терминами и функционалом, не смотря на то, что пересмотрел кучу видео курсов....
Можно чуть подробнее алгоритм действий?
1. Беру Дом, складываю в список
2. С# - код, туда вставляю return System.Web.HttpUtility.UrlDecode(project.Variables["string"].Value);
..?
Зачем в список, ну и делай все действия какие тебе надо до вывода в список а уже отработаное ложи в список, если работаешь с браузером то можно с DOM кинуть в переменную перекодировать весь текст а после записать в список
 
Всем спасибо, разобрался, прекрасно работает!
 
еще вопрос - есть список ссылок, разного рода, например:
http://www.mysyte.com
http://mysyte.com
http://mysyte.com/
http://test.mysyte.com
http://mysyte.com/test/run
https://mysyte.com/test/run

Нужна регулярка, которая отберет домены, включая поддомены. Т.е. на выходе должно получиться:
mysyte.com
mysyte.com
mysyte.com
test.mysyte.com
mysyte.com
mysyte.com
если на таком примере то можно так (?<=http://|https://).*?\.\w+
и в догонку http://zennolab.com/discussion/thre...to-takoe-i-s-chem-ix-edjat.23612/#post-164717
 
Для некоторых вариантов номеров телефонов
Код:
Развернуть Свернуть Копировать
(\+\d{1,2})?((\(\d{3}\))|(\-?\d{3}\-)|(\d{3}))((\d{3}\-\d{4})|(\d{3}\-\d\d\-\d\d)|(\d{7})|(\d{3}\-\d\-\d{3}))
+7-916-777-88-00
+7-916-777-8800
+47-916-777-88-00
+47-916-7778800
+47(916)777-88-00
+47(916)777-8800
+47(916)7778800
(916)777-88-00
(916)777-8800
(916)777-8-800
(916)7778800
9167778800
916-7778800
916-777-88-00
916-777-8-800
Не получается нормально спарсить номера
№ Значение
0 5041202005
1 4070281064
2 0000007389
3 3010181040
4 0000000225
5 1155012000
получается такое
 
Ребята, помогите модифицировать данную регулярку (http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&amp;:/~\+#]*[\w\-\@?^=%&amp;/~\+#])? Надо чтобы она выдёргивала не все URL, а только URL в которых содержится http://www.timberland.com/shop/ и после Shop идут разделы разные.
 
Не получается нормально спарсить номера
№ Значение
0 5041202005
1 4070281064
2 0000007389
3 3010181040
4 0000000225
5 1155012000
получается такое
ну так там и написанно ведь что не для всех номеров регулярка эта, формат видимо не подходит под неёё
 
  • Спасибо
Реакции: ParfeniyAnton
Ребята, помогите модифицировать данную регулярку (http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&amp;:/~\+#]*[\w\-\@?^=%&amp;/~\+#])? Надо чтобы она выдёргивала не все URL, а только URL в которых содержится http://www.timberland.com/shop/ и после Shop идут разделы разные.
Если начало не изменяется то попробуй так http://www\.timberland\.com/shop/[^*<]+\s.*? это если после ссылки идёт пробел
 
  • Спасибо
Реакции: ParfeniyAnton
<li><a class="button-link" href="http://www.timberland.com/shop/classic-footwear-mens-collection"><p class="catLabel">Classic Footwear Collection</p></a></li>
Вот кусок кода. Нужны именно такого вида ссылки выдернуть) Спасибо за помощь!)
попробуй так
Код:
Развернуть Свернуть Копировать
http://www\.timberland\.com/shop/[^*<]+(?=").*?
 
  • Спасибо
Реакции: ParfeniyAnton
Для телефонов, потестил вроде много вариантов вытаскивает
Код:
Развернуть Свернуть Копировать
\+?\d+([\(\s\-]?\d+[\)\s\-]?[\d\s\-]+)?
 
  • Спасибо
Реакции: CSS
Телефоны парсить - это дело очень неблагодарное и сложное.
Для того, чтобы более точно собирало нужные номера, лучше добавлять в начале хотя бы код нужных регионов\операторов. + нужно учесть, что в любом месте могут быть такие знаки, как плюс, пробел, скобка открывающая\закрывающая и т.д.
 
  • Спасибо
Реакции: CSS
Телефоны парсить - это дело очень неблагодарное и сложное.
Для того, чтобы более точно собирало нужные номера, лучше добавлять в начале хотя бы код нужных регионов\операторов. + нужно учесть, что в любом месте могут быть такие знаки, как плюс, пробел, скобка открывающая\закрывающая и т.д.
Поддерживаю, поэтому я в первый пост и не добавлял телефонные регулярки, не столь они развитые чтобы их использовать на данном уровне реализации
 
вот так ещё, это если начинается со скобок
Код:
Развернуть Свернуть Копировать
\W+?\+?\d+?([\(\s\-]?\d+[\)\s\-]?[\d\s\-]+)?
понимаю тоже что вариантов куча, поэтому и пишу что для некоторых на которых тестилось
+79005555555
+7(900)-555-5555
+7(900)555-5555
8900-555-55-55
7900-555-55-55
900-555-5555
+7-900-5-5-5-5-5-5-5
+7-900-55-555-55
(900)-555-5555
(900)-55-555-55
(900)-5555555
 
Телефоны парсить - это дело очень неблагодарное и сложное.
Для того, чтобы более точно собирало нужные номера, лучше добавлять в начале хотя бы код нужных регионов\операторов. + нужно учесть, что в любом месте могут быть такие знаки, как плюс, пробел, скобка открывающая\закрывающая и т.д.
Ну а то что мы все выкладываем мы ведь не ручаемся что это 100% для всех номеров сылок и тому подобное, каждый ТС потом может немного доработать, просто ленятся
 
Ну а то что мы все выкладываем мы ведь не ручаемся что это 100% для всех номеров сылок и тому подобное, каждый ТС потом может немного доработать, просто ленятся

Я делал приблизительно так:

Код:
Развернуть Свернуть Копировать
(9[\ \(-]*?2[\ \(-\)]*?6)([\(\)\ -\ \    /\r\n]*?\d+){1,}

Это для телефонов с кодом 926. Результат, который получили, нужно обрабатывать через разные фильтры, чистки, чтобы получить то, что нужно и все равно попадается много хлама.
 
Всем привет. Нужный топик!
Есть список с кеями, нужно взять только 3 словные. Помогите регуляркой?
 
  • Спасибо
Реакции: CSS и GreenWay
Код:
Развернуть Свернуть Копировать
(\S+\s){3}
 
  • Спасибо
Реакции: CSS и GreenWay
  • Спасибо
Реакции: CSS и GreenWay
Прям красавчег! Где регулярку взял? Как получилось её составить? :D
Это сарказм?
Ваша немного не правильно работает.
А вообще, для составления иногда пользуюсь этим:
regexp.png


Кстати, если можно, добавьте в старт пост, может кому-то пригодится. Взято, вроде, отсюда: http://www.exlab.net/tools/sheets/regexp.html
 
Последнее редактирование:
  • Спасибо
Реакции: DenisK, CSS и GreenWay
Это сарказм?
Ваша немного не правильно работает.
А вообще, для составления иногда пользуюсь этим:
Посмотреть вложение 11011

Кстати, если можно, добавьте в старт пост, может кому-то пригодится. Взято, вроде, отсюда: http://www.exlab.net/tools/sheets/regexp.html

Вообще наши регулярки были в принципе аналогичны.
Но для целей будет больше подходить вот эта

Код:
Развернуть Свернуть Копировать
(\w+\ +){2}\w+
 
  • Спасибо
Реакции: CSS, GreenWay и Dimionix
Но для целей будет больше подходить вот эта

Код:
Развернуть Свернуть Копировать
(\w+\s+){2}\w+
Согласен, но так тоже берутся переносы строк. Так работает правильно:
Код:
Развернуть Свернуть Копировать
(\w+\s){2}\w+
 
  • Спасибо
Реакции: CSS и GreenWay
Для некоторых вариантов номеров телефонов
Код:
Развернуть Свернуть Копировать
(\+\d{1,2})?((\(\d{3}\))|(\-?\d{3}\-)|(\d{3}))((\d{3}\-\d{4})|(\d{3}\-\d\d\-\d\d)|(\d{7})|(\d{3}\-\d\-\d{3}))
+7-916-777-88-00
+7-916-777-8800
+47-916-777-88-00
+47-916-7778800
+47(916)777-88-00
+47(916)777-8800
+47(916)7778800
(916)777-88-00
(916)777-8800
(916)777-8-800
(916)7778800
9167778800
916-7778800
916-777-88-00
916-777-8-800
Вот написал регулярку

Код:
Развернуть Свернуть Копировать
(8|\+7|7)?((\s|\-)?)(\([0-9]{3}\)|\-[0-9]{3}\-|\s[0-9]{3}\s|[0-9]{3})(\-|\s)?[0-9]{3}(-|\s)?[0-9]{2}(-|\s)?[0-9]{2}

Начал хоть как то разбираться)
 
Добрый день. Может кто подскажет, как можно собрать все запятые в строке?

Пример: Мне нужно из предложения "Слово слово, слово, слово" собрать все запятые, причем они должны сохранятся в переменную в виде: ,,,,
 
Добрый день. Может кто подскажет, как можно собрать все запятые в строке?

Пример: Мне нужно из предложения "Слово слово, слово, слово" собрать все запятые, причем они должны сохранятся в переменную в виде: ,,,,
Обработка текста - Замена.
Заменить ((?!\,).)* на пустоту.
Тип поиска: Regex
Заменить все.
 
  • Спасибо
Реакции: molotok

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)