Издательский дом ООО "Гейм Лэнд"ЖУРНАЛ ХАКЕР 151, АВГУСТ 2011 г.

Спамим ответы@mail.ru: Используем невнимательность руководства mail.ru в своих целях

К сожалению (а может быть, и к счастью), создатели даже в самых крупных сервисах допускают просчеты. В этой статье я расскажу, как с помощью одного из них устроить себе бесплатную таргетированную рекламу, со страшной силой залетающую на почтовые ящики посетителей otvet.mail.ru.

Предыстория

Однажды мне потребовалось привлечь новых посетителей на форум. Так как форум был чисто экспериментальным и бесперспективным, вкладывать деньги в рекламу я не хотел. Поэтому первое, что пришло мне в голову — попробовать немного попиарить его на otvet.mail.ru. После отправки пары-тройки ответов со ссылкой на мой сайт модераторы тут же удалили сообщения и запретили мне доступ к ресурсу. Я зарегистрировал новый аккаунт, но продолжать в том же духе было сущей глупостью — мне предстояло хорошенько подумать над автоматизацией этого процесса.

Итак, первое, что я сделал — нажал в браузере заветную комбинацию <ctrl+u> и стал читать HTML-код страницы. В начале следовали стандартные тэги, совершенно мне не интересные. Далее я увидел текст тех самых вопросов, которые задают пользователи, и тут же мне на глаза стали попадаться какие-то еmail-адреса. В голове промелькнула мысль: это могут быть адреса пользователей, задающих вопросы. Внимательный просмотр главной страницы сервиса подтвердил мои догадки, после чего я открыл свой gedit и стал кодить.

Пишем скрипт

Программировать мы будем на Python. Если ты никогда не работал с ним — не пугайся. В рамках статьи все будет очень просто. Для начала давай соберем все email-адреса с главной страницы какогонибудь раздела сервиса. Для этого нам потребуется модуль «urllib» для загрузки веб-страниц посредством HTTP и модуль «re» для работы с регулярными выражениями. Подключим их в самом начале нашего Python-исходника:

import urllib
import re

Далее сценарий работы предельно прост: открываем webстранцу, ищем на ней все мыльники и используем их в своих целях. На питоне это будет выглядеть следующим образом:

while True:
u = urllib.urlopen("http://otvet.mail.ru/it/")
page = u.read()
emailPattern =
r"[0-9a-zA-Z_\-\.]+@[0-9a-z-A-Z\.]+.[a-zA-Z]+"
compiledPattern = re.compile(emailPattern)
for address in compiledPattern.fi ndall(page):
# Делаем что-нибудь

По адресу http://otvet.mail.ru/it/ размещаются все вопросы, связанные с компьютерными технологиями. Если ты, например, захочешь получить email-адреса людей, интересующихся спортом — замени его на http://otvet.mail.ru/sport/.

Далее в переменную emailPattern мы помещаем регулярное выражение, содержащее шаблон email-адреса. О том, как строятся регулярные выражения я рассказывать не буду — эта тема выходит за рамки статьи. Просто вбей в Google соответствующий запрос и узнай о регулярных выражениях все, что твоей душе будет угодно :).

В следующей строке мы компилируем регулярку в удобный для интерпретатора вид и подходим к заветной конструкции: for address in compiledPattern.fi ndall(page):
В данной строчке в первую очередь выполняется метод findall объекта compiledPattern. Данный метод ищет все строки в параметре page, которые соответствуют заданному нами регулярному выражению. В нашем случае метод findall вернет список email-адресов, содержащихся на странице http://otvet.mail.ru/it/.

Блок, находящийся под строкой for <значение> in <коллекция>, выполнится столько раз, сколько email-адресов содержится на странице, и при каждом проходе в переменной address будет содержаться адрес очередного почтового ящика. Это значит, что в этом блоке и будут совершаться все злодеяния, которые только способны прийти нам в голову. Давай будем отправлять на каждый почтовый адрес «нежелательное» сообщение. Для этого инициализируем несколько глобальных переменных, расположив их между главным циклом и импортом библиотек:

smtp_server = "smtp.mail.ru"
smtp_port = 25
smtp_address = "nickname@mail.ru"
smtp_password = "passw0rd"
mail_topic = "Спам сообщение"
mail_body = "Здравствуйте, я прислал вам спам-сообщение. Добавьте меня, пожалуйста, в черный список."

Здесь у нас все предельно ясно — названия переменных говорят сами за себя. Теперь реализуем непосредственно отправку сообщения адресату. Для этого добавим кое-что в список импорта:

import smtplib
from email.MIMEText import MIMEText

…и впишем нижеследующий код в блок конструкции «forin», чтобы он выполнялся для каждого найденного emailадреса:

msg = MIMEText(mail_body + address, "", "utf-8")
msg['From'] = smtp_address
msg['To'] = address
msg['Subject'] = email_topic
mailServer = smtplib.SMTP(smtp_server, smtp_port)
mailServer.login(smtp_address, smtp_password)
mailServer.sendmail(smtp_address, address,
msg.as_string())
mailServer.close()
usedEmails.append(address)

В самом коде ничего сложного нет: мы лишь создаем emailсообщение и отправляем его на почтовый ящик, содержащийся в переменной address. В идеальном мире скрипт можно было бы запустить на выполнение уже сейчас. Но есть одно «но», о котором стоит поговорить отдельно.

Обход спам-фильтра

Если ты будешь каждую секунду слать одинаковые сообщения на кучу адресов, то спам-фильтрам не составит труда тебя обезвредить. Один из вариантов — слать сообщения с одного аккаунта с интервалом 20-25 секунд. Для этого достаточно добавить в цикл строку:

time.sleep(25)

И импортировать соответствующий модуль для работы со временем:

import time

Вторым шагом можно добавить разные синонимайзеры и рандомайзеры, чтобы все отправляемые сообщения были совершенно разными по своему содержанию. Также можно еще больше увеличивать интервал между отправкой сообщений с одного аккаунта, увеличивая количество потоков и самих аккаунтов. Используя эти нехитрые трюки, мне удавалось привлекать от 150 до 400 новых посетителей на форум каждый день. И эти цифры можно увеличить во много раз! Зайди на главную страницу сервиса http://otvet.mail.ru и обрати внимание, сколько посетителей сейчас онлайн. На момент написания этих строк их было 19 998. Практически 20 тысяч посетителей — и каждый из них так и ждет от тебя сообщения на почту :).

Заключение

Как видишь, руководство сервиса otvet.mail.ru не особо беспокоится о спаме в почтовых ящиках своих пользователей. К слову сказать, у Google и Yahoo есть аналогичные проекты, но там адреса не раскрываются ни при каких обстоятельствах. Может, администрация «национальной почтовой службы» задумается о существующей проблеме, но пока что есть возможность если не спамить, то хотя бы собирать email-адреса в базы данных, чтобы использовать их в будущем.

Такая база будет иметь цену хотя бы потому, что она содержит адреса, сгруппированные по интересам их владельцев. На своем опыте могу сказать, что обход спам-фильтров тоже не является сколько-нибудь сложной задачей: разделяй и властвуй! Тьфу, не та пословица. Я хотел сказать, конечно «рандомизируй и синонимизируй» :). Ну и напоследок: обрати внимание на сервис my.mail.ru. Страницы этой социальной сети тоже кишат пользовательскими мылами. Делая возможным поиск по интересам, возрасту и месту проживания.

Содержание
загрузка...
Журнал Хакер #151Журнал Хакер #150Журнал Хакер #149Журнал Хакер #148Журнал Хакер #147Журнал Хакер #146Журнал Хакер #145Журнал Хакер #144Журнал Хакер #143Журнал Хакер #142Журнал Хакер #141Журнал Хакер #140Журнал Хакер #139Журнал Хакер #138Журнал Хакер #137Журнал Хакер #136Журнал Хакер #135Журнал Хакер #134Журнал Хакер #133Журнал Хакер #132Журнал Хакер #131Журнал Хакер #130Журнал Хакер #129Журнал Хакер #128Журнал Хакер #127Журнал Хакер #126Журнал Хакер #125Журнал Хакер #124Журнал Хакер #123Журнал Хакер #122Журнал Хакер #121Журнал Хакер #120Журнал Хакер #119Журнал Хакер #118Журнал Хакер #117Журнал Хакер #116Журнал Хакер #115Журнал Хакер #114Журнал Хакер #113Журнал Хакер #112Журнал Хакер #111Журнал Хакер #110Журнал Хакер #109Журнал Хакер #108Журнал Хакер #107Журнал Хакер #106Журнал Хакер #105Журнал Хакер #104Журнал Хакер #103Журнал Хакер #102Журнал Хакер #101Журнал Хакер #100Журнал Хакер #099Журнал Хакер #098Журнал Хакер #097Журнал Хакер #096Журнал Хакер #095Журнал Хакер #094Журнал Хакер #093Журнал Хакер #092Журнал Хакер #091Журнал Хакер #090Журнал Хакер #089Журнал Хакер #088Журнал Хакер #087Журнал Хакер #086Журнал Хакер #085Журнал Хакер #084Журнал Хакер #083Журнал Хакер #082Журнал Хакер #081Журнал Хакер #080Журнал Хакер #079Журнал Хакер #078Журнал Хакер #077Журнал Хакер #076Журнал Хакер #075Журнал Хакер #074Журнал Хакер #073Журнал Хакер #072Журнал Хакер #071Журнал Хакер #070Журнал Хакер #069Журнал Хакер #068Журнал Хакер #067Журнал Хакер #066Журнал Хакер #065Журнал Хакер #064Журнал Хакер #063Журнал Хакер #062Журнал Хакер #061Журнал Хакер #060Журнал Хакер #059Журнал Хакер #058Журнал Хакер #057Журнал Хакер #056Журнал Хакер #055Журнал Хакер #054Журнал Хакер #053Журнал Хакер #052Журнал Хакер #051Журнал Хакер #050Журнал Хакер #049Журнал Хакер #048Журнал Хакер #047Журнал Хакер #046Журнал Хакер #045Журнал Хакер #044Журнал Хакер #043Журнал Хакер #042Журнал Хакер #041Журнал Хакер #040Журнал Хакер #039Журнал Хакер #038Журнал Хакер #037Журнал Хакер #036Журнал Хакер #035Журнал Хакер #034Журнал Хакер #033Журнал Хакер #032Журнал Хакер #031Журнал Хакер #030Журнал Хакер #029Журнал Хакер #028Журнал Хакер #027Журнал Хакер #026Журнал Хакер #025Журнал Хакер #024Журнал Хакер #023Журнал Хакер #022Журнал Хакер #021Журнал Хакер #020Журнал Хакер #019Журнал Хакер #018Журнал Хакер #017Журнал Хакер #016Журнал Хакер #015Журнал Хакер #014Журнал Хакер #013Журнал Хакер #012Журнал Хакер #011Журнал Хакер #010Журнал Хакер #009Журнал Хакер #008Журнал Хакер #007Журнал Хакер #006Журнал Хакер #005Журнал Хакер #004Журнал Хакер #003Журнал Хакер #002Журнал Хакер #001