Does one size really fit all? Evaluating classifiers in Bag-of-Visual-Words classification Christian...

Does one size really fit all? Evaluating classifiers in Bag-of-Visual-Words classification

Christian Hentschel, Harald Sack

Hasso Plattner Institute

Agenda

1. Content-based Image Classification – Motivation

2. Bag-of-Visual-Words

3. Bag-of-Visual-Words Classification

■ Classifier Evaluation

■ Model Visualization

4. Conclusion

Does one size really fit all?

Content-based Image Classification

Christian Hentschel, 09-18-2014

Chart 3

Training:

■ Positive images:

(that depict a concept)

■ Negative images:

(that don’t)

Classification:

■ Test image if it depicts concept

(or not):

Content-based Image Classification (2)

Chart 4

■ Origin - text classification

□ e.g. Task: classify forum posts into “insult” (positive) and “not insult” (negative)

Bag-of-Visual-Words

Chart 5

"haha...at least get your insults straight you idiot!!...."

"You're one of my favorite commenters."

{ “idiot”: 1, “favorite”: 2, “to”: 3, “you”: 4, “at”: 5, “least”: 6, “commenter”: 7, …}

[1, 2, 1, 1, 2, 0, 0,…]

[1, 1, 1, 1, 0, 1, 1,…]

■ Learn a decision rule (e.g. linear SVM)

□ i.e. learn features weights

Bag-of-Visual-Words (2)

Chart 6[Adopted from A. Mueller,https://github.com/amueller/ml-berlin-tutorial]

■ Examples for Visual Words

Chart 7[Schmid, 2013]

Chart 8

■ De-facto standard: kernel-based Support Vector Machines

□ Decision rule:

□ Kernel-Function:

□ Distance metric:

Bag-of-Visual Words Classification

Chart 9

■ Testing different classification models

□ Average Precision (AP, area under Precision Recall Curve)

■ Test Dataset

□ Caltech-101

– 100 + 1 object classes

– 31 – 800 images per class

■ Tested Classifiers:

□ Naïve Bayes, K-NN, Logistic Regression

□ SVM: linear SVM, RBF kernel SVM, Chi2-kernel SVM

□ Ensemble Methods:Random Forest, AdaBoost

□ Hyper parameters optimized in grid-search using CV

Bag-of-Visual Words Classification (2)

Chart 10

■ Mean AP scores over all classes:

Bag-of-Visual Words Classification – Results

Chart 12Naive Bayes

Logistic Regression

linear SVM

RBF kernel SVM

Random Forest

AdaBoost

Chi2-Kernel SVM

■ mAP-scores between best (Chi2-SVM) and worst (Naïve Bayes): 0.19

□ Poor performance of Naïve Bayes and k-NN – but fast training

■ Superior performance of kernel-based SVM, but:

□ Kernel function (Chi2 vs. Gaussian RBF) is crucial:

– Ensemble methods outperform Gaussian RBF

– Gaussian RBF only slightly better than linear SVM

□ increased evaluation time:

– complex kernel function between each SV and a testing example

– ensemble method reduce classification time

Bag-of-Visual Words Classification – Results (2)

Chart 13

■ Correlation between training sets size and average Precision:

Chart 14

■ Outliers:

□ “minaret”

□ “leopards”

Chart 15

■ Visualize impact of individual image regions on classification result

□ Use ensemble methods

– No kernel function

– AdaBoost:direct indicator for feature importance: mean decrease in impurity

Bag-of-Visual Words Classification –Model Visualization

Chart 16

Local Region

Descriptor

BoVW Vector

Feature Weights

“minaret”

Chart 17

■ “leopards”

Chart 18

■ “minaret”

Chart 19

■ “car_side”

Chart 20

■ “watch”

■ Kernel-based SVM are best choice when aiming for accuracy

□ Kernel function is crucial

□ Evaluation time-cost is high

■ Ensemble methods are second-best winner

□ Fast evaluation

□ Offer intuitive visualization of model parameters

■ Visual analytics reveal deficiencies in datasets

□ Improperly chosen training data affects classification results

Conclusion

Chart 21

Thank you for your attention!

Christian Hentschel, Harald Sack

Hasso Plattner Institute

Does one size really fit all? Evaluating classifiers in Bag-of-Visual-Words classification Christian...

Documents

HASSO-PLATTNER-INSTITUT für Softwaresystemtechnik GmbH an der Universität Potsdam Multiprocessor Scheduling Integrating List Heuristics into genetic Algorithms

Hasso Plattner Design Thinking Research Program … Thinking Research Program COMMUNITY BUILDING ... Workshop Keynote Speaker ... HPDTRPCommunityBuildingWorkshopMarch.2018-AGENDA_FINAL

1 Jürgen Döllner XML-Lösungen für Geoinformationen Jürgen Döllner Konstantin Baumann Hasso-Plattner-Institut an der Universität Potsdam

HASSO PLATTNER INSTITUT - hpi.dehpi.de/fileadmin/user_upload/hpi/dokumente/publikationen/technische_b... · HASSO-PLATTNER-INSTITUT für Softwaresystemtechnik an der Universität

Annual Report 2014 final web - Hasso-Plattner-Institut · Annual&Report&2014&!!!! & & & EnterprisePlatformandIntegrationConcepts& & Research!Group!of! Prof.Dr.HassoPlattner&! HassoPlattner!Institute!

19. Mai 2016 | Hasso-Plattner-Institut...junges Spin-off des Hasso-Plattner-Instituts. Wir entwickeln seit 2014 in Potsdam und Hamburg Deep-Tech-Anwendungen für Echtzeit-Bild- und

#1 Anne Roudaut (extract from patrick baudisch lecture at Hasso Plattner Institute) paper writing

7. Bachelorpodium Hasso-Plattner-Institut, Potsdam 2. Juli 2010

HASSO PLATTNER INSTITUTE for IT Systems Engineering at the

d. hasso plattner Institute of Design at Stanford EMPATHY ... · PDF fileInstitute of Design at Stanford d. hasso plattner ... our users’ motivations based on what they say, do,

openHPI The MOOC Offer at Hasso Plattner Institute...2 MOOC offers at Hasso Plattner Instxitute. The Potsdam Universityaffiliated Hasso Plattner Institute (HPI)-is Germany’s university

Jens Krüger, Christian Tinnefeld, Martin Grund, Alexander Zeier, Hasso Plattner A Case for Online Mixed Workload Processing

Zeugnis Sichere Email - INDOBE · 2016. 5. 4. · openHPI ist die Internet-Bildungsplattform des Hasso-Plattner-Instituts (HPI) f r Softwaresystem-technik GmbH. Das Hasso-Plattner-Institut

Dipl.-Ing. Bernhard Kaiser Hasso-Plattner-Institut für Softwaresystemtechnik Tel. (0331) 5509-158

Hasso-Plattner-Institut: Das Wichtigste im Überblick - hpi.de · Weitere Infos: Das junge Exzellenz-Zentrum Das Hasso-Plattner-Institut für Softwaresystemtechnik an der Univer-sität

Tips and Tricks - Hasso Plattner Institute · PDF fileTips and Tricks Arian Treffer arian.treffer@hpi.de Prof. Plattner, Dr. Uflacker Enterprise Platform and Integration Concepts

Zeugnis Sicherheit im Internet - Christoph Haefner · openHPI ist die Internet-Bildungsplattform des Hasso-Plattner-Instituts (HPI) für Digital Engineering. Das Hasso-Plattner-Institut

HASSO PLATTNER INSTITUT · HASSO-PLATTNER-INSTITUT für Softwaresystemtechnik an der Universität Potsdam Conceptual Architecture Patterns: FMC-based Representations Technische Berichte

Hasso-Plattner-InstitutHasso-Plattner-Institut Ausgabe 7 – Winter ‘10 Ausgabe 8 - Sommer 10 Forschungsprojekte am HPI Das Tele-Board-Projekt Mysterien des HPI 3 Intern 00 Editorial

#? rahul swaminathan (T-Labs) & professor patrick baudisch hci2 hasso-plattner institute determining depth