12
Проблема фильтрации спама Определение Спам - нежелательная почта. Та почта, которую пользователь не хотел бы получить даже зная о факте ее отправки. Определение Задача фильтрации спама - задача обнаружения спам-сообщений для их последующего отсеивания из потока входящей почты.

diploma-prezentation

Embed Size (px)

Citation preview

Page 1: diploma-prezentation

Проблема фильтрации спама

Определение

Спам - нежелательная почта. Та почта, которую пользовательне хотел бы получить даже зная о факте ее отправки.

Определение

Задача фильтрации спама - задача обнаруженияспам-сообщений для их последующего отсеивания из потокавходящей почты.

Page 2: diploma-prezentation

Статистический подход к фильтрации спама

Page 3: diploma-prezentation

Персонифицированный и неперсонифицированныйподходы

Page 4: diploma-prezentation

Многопрофильный подход

Для классификации используются как собственные письма, таки письма от других пользователей

Page 5: diploma-prezentation

Постановка задачи

Произвести обзор открытых систем фильтрации спама ивыбрать средство для расширения.Реализовать в рамках выбранного средства алгоритмклассификации на базе метода опорных векторов в работеА. Розинкина.Разработать модификацию метода, которая позволитклассифицировать сообщения по нескольким профилямРеализовать данную модификацию в рамках выбранногоранее средстваПроизвести экспериментальное исследование

Page 6: diploma-prezentation

Метод опорных векторов

Разделяющая гиперплоскость максимально удалена отобъектов обоих классов

Page 7: diploma-prezentation

Представление письма в виде вектора

Представление письма в виде вектора

Page 8: diploma-prezentation

Многопрофильность

Добавление информации о пользователе

Page 9: diploma-prezentation

dspam

СвободныйБыстрыйМногопользовательский

Page 10: diploma-prezentation

Схема работы модифицированного dspam

Page 11: diploma-prezentation

Результаты тестирования

Соотношение коэффицента верных обнаружений икоэффицента ложных срабатываний

Page 12: diploma-prezentation

Результаты

Произведен обзор существующих средств фильтрацииспама, выбрано средство для доработки.В рамках средства реализован алгоритим фильтрацииспама на основе метода опорных векторов, описанный вработе Розинкина.Разработана модификация метода опорных вектров дляработы с несколькими профилями.Разработанный метод реализован в рамках системы dspam.Произведено экспериментальное исследование.