Уважаемые пользователи, рады вам сообщить, что мы выполнили все анонсированные нами пункты по доработке нашего проекта! И он вышел на совершенно другой уровень!
Понятие "слепок", по которому делается быстрая валидация (сравниваются базы Пользователя с нашими), приобрело иное значение, после того, как мы ввели понятие "срок жизни" e-mail адресов. Есть домены, такие как @rambler.ru, @
[email protected](http://@aol.com), и прочие нестабильные почтовые сервисы, где актуальность базы меняется каждый день, и нет смысла считать актуальным слепок старше 2-х месяцев. Для таких доменов каждый e-mail адрес получает уникальный номер и удаляется из "слепка" через 2 месяца, а сам слепок становится более актуальным, и дает Вам высокую точность актуализации баз. По аналогии также удаляются другие домены в слепке, при этом их срок жизни также назначается индивидуально.
Подключен новый модуль довалидации. Это интерактивный модуль, который после быстрого сравнения со слепком (суть которого описана выше), сортирует и производит довалидацию e-mail адресов, которые попали в файл "unknown":
1) Добавлена валидация и довалидация CORP-ов. CORP-ы – это e-mail базы предприятий, в которых до 1 000 адресов. Нами реализован достаточно сложный и неочевидный механизм проверки, дополнительной проверки и перепроверки, а также глубокий анализ доменов. Вот какие задачи нам удалось решить:
* Поиск "спам-ловушек". Это e-mail адреса, которые используются ботами для выявления аномалий в сети и не несут никакой полезной нагрузки. Причем выглядят они как обычные адреса, и обычная проверка показывает, что это рабочие адреса. Именно это снижает процент доставки писем и вынуждает закупать больше расходных материалов. Мы их записываем в базу "bad".
* Поиск "триггеров". Часть доменов настроены таким образом, что база вида
[email protected]@domain.com(
http://[email protected]) (random – произвольное значение) на любой проверке будет показывать, что это рабочая база. Только представьте себе, сколько может быть не существующих e-mail адресов на одном таком домене (например, сгенеренная база- это миллионы нерабочих адресов), которые по сути не существуют, но Вы об этом никогда не узнаете и будете тратить на нее ресурсы и время. Мы выявляем их и отправляем в файл "unknown".
2) Добавлена валидация и довалидация Сред -ов. Сред –ы – Это фактически те же CORP-ы, но с количеством доменов от 1000 до 1 000 000. По этой базе работает алгоритм, объединяющий алгоритмы валидации CORP-ов, BIG-ов и SUPERBIG-ов.
3) Добавлена довалидация BIG-ов и SUPERBIG-ов. Мы постарались охватить все домены, которые хоть как-то поддаются всем известным и нашим собственным алгоритмам валидации. Мы постоянно работаем над увеличением этого списка и можем с уверенностью заявить, что сделан практически полный охват доменов.
И если обобщить все вышесказанное- мы Вам предлагаем сервис валидации e-mail адресов, который обладает впечатляющими качествами точности, скорости и охвата.