Upload
yandex
View
600
Download
4
Embed Size (px)
DESCRIPTION
Рассказ о различных методах классификации документов. Ликбез методов машинного обучения, понятие разделимости классов, советы по выбору множества признаков. Разбор практического примера классификации.
Citation preview
Я.Субботник, Минск, 2 июня 2012 года
РазработчикЮрий Богомолов
Методы классификации документов в поиске
2
Как описать картошку?
3
Выбор признаковОдин признак Два признака
4
Точность и полнота
5
6
Обучение с учителем
7
Методы обучения
8
Ирисы Фишера
Длина чашелистика
Ширина чашелистика
Длина лепестка
Ширина лепестка
9
Наивный байесовский метод
10
Линейные методы
11
Дерево принятия решения
12
Обучение без учителя
13
Яндекс.Новости
14
Кластеризация
15
Смешанное обучение
16
Конкретный пример
17
Определение страниц вида 404
18
Где взять выборку для обучения?
Для обучающей выборки нам нужно много примеров страниц
Чтобы написать классификатор, надо иметь такой же классификатор
19
Симбиоз классификаторов
20
Производительность
21