Upload
alexandr-petrov
View
229
Download
1
Embed Size (px)
Citation preview
Проблема фильтрации спама
Определение
Спам - нежелательная почта. Та почта, которую пользовательне хотел бы получить даже зная о факте ее отправки.
Определение
Задача фильтрации спама - задача обнаруженияспам-сообщений для их последующего отсеивания из потокавходящей почты.
Статистический подход к фильтрации спама
Персонифицированный и неперсонифицированныйподходы
Многопрофильный подход
Для классификации используются как собственные письма, таки письма от других пользователей
Постановка задачи
Произвести обзор открытых систем фильтрации спама ивыбрать средство для расширения.Реализовать в рамках выбранного средства алгоритмклассификации на базе метода опорных векторов в работеА. Розинкина.Разработать модификацию метода, которая позволитклассифицировать сообщения по нескольким профилямРеализовать данную модификацию в рамках выбранногоранее средстваПроизвести экспериментальное исследование
Метод опорных векторов
Разделяющая гиперплоскость максимально удалена отобъектов обоих классов
Представление письма в виде вектора
Представление письма в виде вектора
Многопрофильность
Добавление информации о пользователе
dspam
СвободныйБыстрыйМногопользовательский
Схема работы модифицированного dspam
Результаты тестирования
Соотношение коэффицента верных обнаружений икоэффицента ложных срабатываний
Результаты
Произведен обзор существующих средств фильтрацииспама, выбрано средство для доработки.В рамках средства реализован алгоритим фильтрацииспама на основе метода опорных векторов, описанный вработе Розинкина.Разработана модификация метода опорных вектров дляработы с несколькими профилями.Разработанный метод реализован в рамках системы dspam.Произведено экспериментальное исследование.