Как не учитывать дефис при парсинге email

  • Автор темы Автор темы denchik
  • Дата начала Дата начала

denchik

Client
Регистрация
26.05.2017
Сообщения
50
Реакции
100
Баллы
33
Делаю парсинг все емаил адресов на странице с помощью регулярки [\.\-_A-Za-z0-9]+?@[\.\-A-Za-z0-9]+?[\.A-Za-z0-9]{2,} На доменах без дефисов работает нормально, но если в домене есть символ "-", например, my-site.ru, тогда email вида info@my-site.ru парсится как info@my
Скажите, пожалуйста, как изменить регулярку, чтобы емаилы такого вида, тоже корректно собирались, а то у меня уже мозг кипит, не могу никак подобрать(
 
Код:
Развернуть Свернуть Копировать
[A-Za-z0-9_.-]+@[A-Za-z0-9.-]+[A-Za-z0-9.]{2,}
 
  • Спасибо
Реакции: Platon и denchik
Если парсишь большие объёмы, то подели на 2 этапа.
1. Парсинг всего что похоже на почту: [\w.-]{1,50}@[\w.-]{3,40}
2. обработка почты: регулярка, живой домен, рабочий 25ый порт.
 
Если парсишь большие объёмы, то подели на 2 этапа.
1. Парсинг всего что похоже на почту: [\w.-]{1,50}@[\w.-]{3,40}
2. обработка почты: регулярка, живой домен, рабочий 25ый порт.
Спасибо большое за совет. Вроде банально, но сразу до этого не додумался.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)