Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
32
Добавлен:
28.06.2014
Размер:
703.08 Кб
Скачать

Типы почтовых серверов

Существует три основных типа почтовых серверов:

  • Почтовые серверы POP3

  • Почтовые серверы IMAP

  • Почтовые серверы SMTP

Также серверы делят на:

  • Серверы входящей почты (к ним относятся первые два)

  • Серверы исходящей почты (к ним относится последний из перечисленных выше)

Методы борьбы со спамом

Для начала уточним, что же такое спам в нашем понимании. Традиционным считается следующее определение:

SPAM– массовая рассылка коммерческой, политической и инойрекламыили иного вида сообщений (информации) лицам, не выражавшим желания их получать.

В общепринятом значении этот термин в русском языке стал использоваться применительно к массовым рассылкам электронных писем и мгновенных сообщений в системах обмена оными. Известно большое количество всемирных «эпидемий» спама. Примером являются так называемые «нигерийские письма», активная рассылка которых началась в начале 1980-х. В них под предлогом открытия счета с целью получения в дальнейшем большой суммы денег у получателя письма выманивалась определенная сумма денег.

Следует отметить, что на 2011 год спам составляет около 80% всего интернет-трафика, что, естественно, является серьезной проблемой.

Существует несколько путей решения этой проблемы:

  • Отказ от продуктов и услуг, продвигаемых таким образом (очевидно, что подобная рассылка приносит определенную прибыль отправителям)

  • Затруднение доступа спамеров к пользователям

При использовании второго пути можно использовать большое число разнообразных методов. Так, к примеру, существует ряд простых мер предосторожности, которые позволяют значительно уменьшить вероятность получения подобных писем:

  • Следует стараться не публиковать свой адрес везде, где только можно. Если этого избежать не удается (к примеру, это контактная информация организации), то можно, к примеру, предоставлять свой адрес картинкой

  • Для регистрации на ресурсах, не вызывающих большого доверия, можно завести специальный ящик или пользоваться сервисами, предоставляющими так называемые «одноразовые» почтовые ящики

  • Если же подобное письмо все-таки было получено, не следует открывать ссылки, находящиеся в нем. Помимо угрозы заражения компьютера, это подтвердит тот факт, что этим почтовым ящиком пользуются, и, более того, пользователь читает спам, что может резко увеличить его количество

Также ясно, что спам-письма обычно сильно отличаются от обычной корреспонденции. Именно поэтому автоматическая фильтрация спама – отсеивание сообщений из входящего потока – является достаточно эффективной методикой решения проблемы спама.

Существует довольно большое многообразие различных программных средств автоматической фильтрации спама. Подобное ПО может работать как на стороне почтового сервера, так и на стороне клиента.

Автоматические фильтры используют статистический анализ письма с целью выяснения, является ли оно спамом. Самым популярным является так называемый метод байесовской фильтрации спама, основанный на теореме Байеса, известной нам из курса теории вероятностей.

При использовании этого метода фильтр сначала обучают на предварительно размеченной выборке из писем. В случае, если выборка довольно крупная, удается достичь высокого качества фильтрации.

Вкратце его суть можно описать так:

При обучении фильтра для каждого встреченного в письмах слова высчитывается и сохраняется его «вес» — вероятность того, что письмо с этим словом — спам (в простейшем случае — по классическому определению вероятности: «появлений в спаме / появлений всего»).

При проверке вновь пришедшего письма вычисляется вероятность того, что оно — спам, по формуле из теоремы Байеса для множества гипотез. В данном случае «гипотезы» — это слова, и для каждого слова «достоверность гипотезы» — % этого слова в письме, а «зависимость события от гипотезы» P(B | Ai)— вычисленный ранее «вес» слова. То есть «вес» письма в данном случае — не что иное, как усредненный «вес» всех его слов.

Отнесение письма к «спаму» или «не-спаму» производится по тому, превышает ли его «вес» некую планку, заданную пользователем (обычно берут 60-80 %). После принятия решения по письму в базе данных обновляются «веса» для вошедших в него слов.

Рассмотрим, как вычислить вероятность того, что сообщение, содержащее определенное слово, является спамом.

Предположим, что подозреваемое сообщение содержит слово "Увеличение". Большинство людей, которые привыкли получать электронное письмо, знает, что это сообщение, скорее всего, будет спамом. Программа обнаружения спама, однако, не "знает" такие факты, все, что она может сделать—вычислить вероятности. Формула, используемая программным обеспечением, чтобы определить это, получена из теоремы Байеса.

где:

  • Pr(S | W) - условная вероятность того, что сообщение—спам, при условии, что слово "Увеличение" находится в нем

  • Pr(S) - полная вероятность того, что произвольное сообщение—спам

  • Pr(W | S) - условная вероятность того, что слово "Увеличение" появляется в сообщениях, если они являются спамом

  • Pr(H) - полная вероятность того, что произвольное сообщение не спам (т.е. "ham")

  • Pr(W | H) - условная вероятность того, что слово "Увеличение" появляется в сообщениях, если они являются "ham"

Также существует ряд методов неавтоматической фильтрации. К этим методам относятся, к примеру, так называемые черные списки и т.д.

Перейдем к выполнению работы.

Соседние файлы в папке Лабораторная работа 2