Как устроен дуршлаг

symbiosis

Хакер, номер #072, стр. 072-044-1

(symbiosis@gameland.ru)

Принципы действия спам-фильтров

«Меня уже не тошнит – у меня стоят фильтры» (с) группа «Кирпичи». Уж не знаю, как там у Васи В. из «Кирпичей», но у меня проблема остается: фильтры стоят, а вот тошнота что-то не проходит. К сожалению, причина этого мерзкого чувства заключается не в том, что я провел выходные на ура, а в том обилии спама, который с дивной регулярностью валится мне в ящик.

That’s means war!

Вот кажется, что страшного в том, что кроме тех писем, которых ты ждешь и которые важны для тебя, тебе придет пара-тройка этаких сюрпризов, среди которых, возможно, даже будет что-то интересное? А страшно становится только тогда, когда эта пара-тройка с неконтролируемой скоростью мутирует в пару-тройку сотен в день, а содержание интересного плавно сходится к нулю. Тогда-то и начинаешь задумываться о том, как бороться с обилием такого хлама. Ты просматриваешь форумы, спрашиваешь знакомых, тестируешь разный софт для защиты, короче, всеми способами пытаешься постоять за себя. Но храбры молодцы, которые поднимают бабки на массовых рассылках (а это, к слову, очень неплохой, хоть и низкопробный бизнес), тоже не дремлют и придумывают все новые и новые ухищрения, чтобы заставить тебя прочитать их «письмо счастья». Вот и получается самая настоящая война: с одной стороны люди, отрабатывающие свои деньги, с другой – ты со своим крутым набором защиты. И кто в этой войне выигрывает, неясно. Ясно только то, что конца и края ей пока не видно. А раз так, то полезно понимать, с каким оружием тебе придется иметь дело.

Мы не ищем легких путей

Каждая статья про спам начинается с истории про консервную банку, которая первой стала рекламироваться таким назойливым способом, - это, по ходу, традиция такая. Что ж, отдав дань традиции, давай не будем больше переливать из пустого в порожнее и перейдем к тому, как устроены спам-фильтры. Для этого надо хорошо понять, как именно они должны работать. Если ты считаешь, что главная задача – не пропустить в твой ящик спам, то ты не прав. Такая задача имеет тривиальное решение: просто запрещаем прием ВСЕХ писем! Глупо, правда? Зато задача выполнена – в ящике спама не будет. Точно не будет. На все сто. Верь мне (даже я уже поверил. – Прим. Бублика)! Из этого дурацкого примера сразу вытекает вторая задача: нужные письма должны доходить до адресата. И эта причина важнее первой, ведь лучше принять одно лишнее письмо, чем пропустить важное. Как говорится, лучше недосолить, чем пересолить.

Как мы с тобой поняли, приведенный метод «в лоб» тут не сработает и надо искать более умные и хитрые способы сортировки spam’а и ham’а – именно так на английском жаргоне называется полезная почта. И такие способы найдены и работают, правда, с переменным успехом.

Jungle is massive!

Хлам от ham’а можно отличить, в первую очередь, по тому, что первый рассылается сразу доброй тысяче пользователей, а второй – только тебе (в подавляющем большинстве случаев). Исключением являются только рассылки всяких новостей, но с ними все просто: ты знаешь адрес отправителя, а значит, поставить фильтр – дело техники. Второй чертой массовых рассылок раньше являлось то, что в письме не прописан конечный получатель. Значит, по этим двум критериям можно отлавливать и хоронить спам в выгребной яме. На такое простое фильтрование спамеры ответили созданием софта, который посылает сообщение якобы тебе и лишь одному тебе, и опять в твой ящик полез отстой. Эти признаки сами по себе не дают никакой защиты, но их наличие в сочетании с другими дает общее представление о характере письма, так что их нужно иметь в виду.

Содержание  Вперед на стр. 072-044-2
ttfb: 3.1909942626953 ms