- Регистрация
- 22.05.2010
- Сообщения
- 1 327
- Реакции
- 665
- Баллы
- 113
Собираем народный список регулярок (regex) на все случаи жизни, начну первым. У кого есть свои - закидывайте, добавлю в первый пост указав автора. Регулярки бывает могут работать не правильно, если что отписывайтесь в этой теме - найдём решение.
[TABLE="class: brtb_item_table, border-width: 4px"][TBODY][TR][TH]Список регулярных выражений и типовых контекстов использования[/TH][/TR]
[TR][TD]Поиск числа больше 0
Вариант использования:
в этом примере ищутся строго видимые элементы, невидимые же (имеющие ширину 0px) игнорируются, но иногда бывают осечки - когда сайт слоями накладывает элементы (встречается например в гугле).
Благодарим: CSS, ZennoScript[/TD][/TR]
[TR][TD] Разбор текста на предложения, кажется автора ZennoScript, немного мной доработано
пример работы, на входе:
Благодарим: ZennoScript[/TD][/TR]
[TR][TD]Поиск слова начинающегося с определённого текста (благодарим ZennoScript за доработку)
найдёт в тексте все слова начинающиеся на go, например: goal, god, google
Благодарим: CSS, ZennoScript[/TD][/TR]
[TR][TD]Ищет число в диапазоне 400-699:
подробнее про диапазоне можно посмотреть здесь http://www.regular-expressions.info/numericranges.html
Поделился: CSS[/TD][/TR]
[TR][TD]Виртуальные колонки с разделителем ";"
на входе: name;pass;mail
на выходе: нужная вам "колонка" по номеру совпадения:
вариант использования: работаем со списком, разбираем по кускам колонки как в таблице
Поделился: CSS[/TD][/TR]
[TR][TD]Получить имя файла из пути windows:
на входе:
Поделился: CSS[/TD][/TR]
[TR][TD]Поиск строк НЕ содержащих указанную (под)строку:
на входе:
Поделился: CSS[/TD][/TR]
[TR][TD]Взять все строки больше 18 символов
Благодарим: alekwuy[/TD][/TR]
[TR][TD]Взять все строки до 18 символов
Благодарим: alekwuy[/TD][/TR]
[TR][TD]Поиск всех HTML тегов
Вариант использования - очистка текста от HTML кода
Благодарим: Trader1985[/TD][/TR]
[TR][TD]Поиск всех пустых строк в тексте
Вариант использования - приведение текста в порядок
Благодарим: Trader1985[/TD][/TR]
[TR][TD]Поиск от трёх и более пустых строк
Вариант использования - приведение текста в порядок в случае когда нас устраивает 2 пустые строки
Благодарим: Trader1985[/TD][/TR]
[TR][TD]Email:
[/TD][/TR]
[TR][TD]IP
[/TD][/TR]
[TR][TD]URL
[/TD][/TR]
[TR][TD] IP
ORT (например для парсинга прокси)
Благодарим: up_lvl[/TD][/TR][/TBODY][/TABLE]
[TABLE="class: brtb_item_table, border-width: 4px"][TBODY][TR][TH]Список регулярных выражений и типовых контекстов использования[/TH][/TR]
[TR][TD]Поиск числа больше 0
Код:
(?<=(\D|^))[1-9]\d*
Вариант использования:
в этом примере ищутся строго видимые элементы, невидимые же (имеющие ширину 0px) игнорируются, но иногда бывают осечки - когда сайт слоями накладывает элементы (встречается например в гугле).
Благодарим: CSS, ZennoScript[/TD][/TR]
[TR][TD] Разбор текста на предложения, кажется автора ZennoScript, немного мной доработано
Код:
[А-ЯA-Z].{15,}?(\.|\!|\?)(?=\ |\r|\n|$)
пример работы, на входе:
на выходе:Lorem ipsum dolor sit amet, consectetur adipiscing elit. Fusce dapibus tellus nec nulla gravida, sed congue nunc hendrerit. Integer interdum elementum lorem id rutrum. Ut sit amet interdum mauris. Phasellus mollis ex eleifend lacus molestie dictum. Fusce blandit, ligula non condimentum maximus, massa nisi ullamcorper odio, et vehicula nisl nunc nec orci. Sed neque diam, gravida eu blandit ullamcorper, porttitor non lorem. Etiam sagittis diam a dolor feugiat placerat. Suspendisse enim turpis, imperdiet in tellus sit amet, consectetur porta magna. Suspendisse odio nulla, imperdiet eget augue in, pulvinar hendrerit nunc. Aenean ut cursus tellus, nec vehicula ante. Vestibulum ornare erat non ante tempus, eu aliquet felis dapibus. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Mauris eget arcu imperdiet, laoreet erat non, imperdiet leo. Sed arcu mi, ornare non leo sed, faucibus semper nunc.
Благодарим: ZennoScript[/TD][/TR]
[TR][TD]Поиск слова начинающегося с определённого текста (благодарим ZennoScript за доработку)
Код:
(?i)\bgo.*?(?=\W|\ |\r|\n|$)
Благодарим: CSS, ZennoScript[/TD][/TR]
[TR][TD]Ищет число в диапазоне 400-699:
Код:
^([4-6][0-9][0-9])$
Поделился: CSS[/TD][/TR]
[TR][TD]Виртуальные колонки с разделителем ";"
Код:
(?<=(^|;)).*?(?=(;|$|\r\n))
на выходе: нужная вам "колонка" по номеру совпадения:
вариант использования: работаем со списком, разбираем по кускам колонки как в таблице
Поделился: CSS[/TD][/TR]
[TR][TD]Получить имя файла из пути windows:
Код:
([^\\]+$)
на выходе: ZennoPoster.exeС:\Program Files (x86)\ZennoLab\ZennoPoster Pro\Progs\ZennoPoster.exe
Поделился: CSS[/TD][/TR]
[TR][TD]Поиск строк НЕ содержащих указанную (под)строку:
Код:
(?<=(^|\r\n))((?!(test)).)*(?=($|\r\n))
на выходе:test
tester
gogogo
ololo
gogogo
ololo
Поделился: CSS[/TD][/TR]
[TR][TD]Взять все строки больше 18 символов
Код:
(?<=(\r\n|^)).{18,}(?=(\r\n|$))
Благодарим: alekwuy[/TD][/TR]
[TR][TD]Взять все строки до 18 символов
Код:
(?<=(\r\n|^)).{1,18}(?=(\r\n|$))
Благодарим: alekwuy[/TD][/TR]
[TR][TD]Поиск всех HTML тегов
Код:
<.*?>
Благодарим: Trader1985[/TD][/TR]
[TR][TD]Поиск всех пустых строк в тексте
Код:
\n\r
Благодарим: Trader1985[/TD][/TR]
[TR][TD]Поиск от трёх и более пустых строк
Код:
(?<=(\r\n){2})(\r\n){1,}
Благодарим: Trader1985[/TD][/TR]
[TR][TD]Email:
Код:
[\.\-_A-Za-z0-9]+?@[\.\-A-Za-z0-9]+?[\.A-Za-z0-9]{2,}
[TR][TD]IP
Код:
(\d{1,3}\.){3}\d{1,3}
[TR][TD]URL
Код:
(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?
[TR][TD] IP
ORT (например для парсинга прокси)
Код:
(\d{1,3}\.){3}\d{1,3}:\d*
- Категория
- Полезно
Последнее редактирование модератором:





Сори за флуд)