Поздравляю всех вас с Днем Великой Победы!
9 и 10 мая скидки на большинство Ботов - от 10% до 30%:
zenno-bots.ru
Также, в ближайшие 3 дня доделаю полезную обнову
к Боту-рассыльщику, о которой меня давно просили (осталось "отшлифовать").
Ну и "полезняшка":
Недавно посмотрел довольно интересное видео от специалиста ML-Антиспам Mail.ru:
- как майл_ру борется со спамом
Проанализировал и поминутно выделил некоторые моменты, на которые стоит обратить внимание:
02:20 - 1,5 миллиарда писем в сутки (существенное ограничение для майла), 30 000 000 пользователей дневной аудитории, более 10 систем машинного обучения (ML-антиспам и не только)
03:50 - анализ контента (тексты, картинки, аттачи, ссылки) с использованием нейросетей
04:15 - мета-признаки письма (информация про отправителя, про получателя, IP с которого идет рассылка) ВАЖНЕЕ контента письма
06:30 - анализ письма ML-антиспамом в строго отведенных таймингах (нужно успеть проанализировать письмо, пока оно летит к пользователю)
07:05 - все модели ML-антиспам майла основываются на выборках, выборки берутся из сигналов от пользователя (например, нажатие на кнопку спама), но выборки нужно фильтровать.
07:40 - основная боль mail.ru - спамеры, которые постоянно совершенствуют свои действия по пробиву спам-защиты майла. 50% усилий антиспам-борцов майла направлены на совершенствование долгосрочной защиты от действий спамеров
08:20 - быстрая адаптация спамеров к антиспам-решениям майла, постоянная "гонка вооружений" между майлом и спамерами, кто быстрее - тот и прав
13:00 - за последние пару лет спам эволюционировал настолько, что майлу пришлось внедрять машинное обучение))
18:30 - лучший помощник майлу в борьбе со спамом, это получатель писем, при этом майл учитывает то, что спамеры стараются подстроиться под пользователя (вытаскиваем письма из папки спам, добавляем в избранное и т.д.)
19:55 - вопрос адаптации спамеров под действия обычного пользователя (майл в этом сомневается, а зря
)
22:10 - майл старается дать пользователю стабильность, т.е., если сегодня письмо попало в папку Спам, то и завтра подобное письмо должно туда попасть
27:00 - про структуру и автоматизацию ML-Антиспама майла
28:17 - про фидбек и странных пользователей
майлу приходится с этим жить...
30:10 - конечное решение спам\неспам определяется по всем признакам (признаки отправителя, признаки получателя, контент, фидбек от получателя) - если "минусов" (определяемых майлом) по письму больше, чем "плюсов" и при этом пользователь нажал "это спам" - система отправит письмо в спам...
32:02 - нейросеть, "граммы"\пиксели на картинках...
34:00 - эксплуатация ML-Антиспам, графики, срезы, "среднее по больнице"
40:30 - майл готов поступиться 100% точностью при определении письма, как спам\неспам, чтобы не нести репутационные потери при отправке возможно хорошего письма в папку спам
42:30 - вопрос про бинарную классификацию в ML-Антиспам
46:00 - если пользователь отправил письмо в спам - он больше не будет получать письма в инбокс от данного источника (все письма отправителя будут отправляться в спам)
46:38 - "0\1" - "черное\белое" - "треш\спам\возможно спам\неспам" - "в никуда\в карантин\в спам\во входящие" (пороги принятия решений о действиях с письмом, отправленным пользователю)
P.S. Интересно, как майл будет бороться со спамерами, которые научатся не только подстраиваться под обычного пользователя, но и начнут отправлять письма и картинки, сгенерированные нейросетью, в автоматическом режиме и "на лету"
В-общем, Господа-Спамеры... тьфу-ты, Емайл-Маркетологи (конечно-же) - настоятельно рекомендую к просмотру для общего кругозора
и понимания того, как нужно работать с майлом...