17
                 Jennifer Lee CSI 5386 Project Presentation Fall 2008 Question Classification Using Machine Learning Methods

Question Classifier

Embed Size (px)

DESCRIPTION

A graduate project presentation on implementing the question classifier based on works by Li & Roth (2002) and Huang et al (2008).

Citation preview

Page 1: Question Classifier

   

                

Jennifer Lee

CSI 5386 Project Presentation

Fall 2008

Question ClassificationUsing Machine Learning Methods

Page 2: Question Classifier

Motivation• An important step in QA

– To classify the question to the anticipated type of the answer (semantically).

– More challenging than common search tasks.

• Q: What Canadian city has the largest population?Answer type: city

Page 3: Question Classifier

                

• What is bipolar disorder?• What do bats eat?• What is the PH scale?• Hard to categorize those questions into one 

single class– Need multiple class labels for a single 

question.

The Ambiguity Problem

Page 4: Question Classifier

                

Why Machine Learning?• Manually constructed sets of rules to map a 

question to its type is not efficient.– Requires the analysis of a large number of 

questions.– Mapping questions into fine classes requires 

the use of lexical items (specific words).• A learned classifier enables one to define only a 

small number of “type” features.• Can be trained on a new taxonomy.

Page 5: Question Classifier

   

                

Li and Roth (2002):Learning Question Classifier

• Uses the SnoW learning architecture.– Hierarchical classifiers– 6 coarse classes: ABBREVATION, ENTITY, 

DESCRIPTION, HUMAN, LOCATION, NUMERIC VALUE.

– 50 fine classes.

Page 6: Question Classifier

   

                

Li and Roth (cont)• UIUC question classification dataset

– 5500 training (from TREC 8,9, including 500 rare questions).

– 500 test datasets from TREC 10.• Six primitive feature types:

– Words, pos tags, chunks, named entities, head chunks and semantically related words

• Semantically related word list for each question– “away” belongs to the sensor Rel(distance).

Page 7: Question Classifier

   

                

Zhang and Lee (2003): Question Classifcation using SVM

• Two kind of features:– Bag of words and bag of n­grams.

• SVM with kernel tree – Use LIBVSM (Chang and Lin, 2001).– Take advantage of the syntactic structures of 

questions.– Compare with Nearest Neighbors, Naïve 

Bayes, Decision Tree, SnoW.

Page 8: Question Classifier

   

                

Zhang and Lee (cont)

• Using the same dataset as Li and Roth• Same two­layered question taxonomy• Same assumption:

– One question resides in only one category.• Uses automated constructed features 

– No semantically related word list

Page 9: Question Classifier

   

                

Huang et al. (2008):QC using Head Words and their Hypernyms

• In contrast to Li's, a compact feature set was proposed:– Head word– Use WordNet to augment the semantic 

features.– Adopt Lesk's word sense disambiguation 

algorithm

Page 10: Question Classifier

   

                

Huang et al. (cont)• Again, use the same dataset.• Other features:

– Question wh­word, word  grams, word shape

• Classifiers:– Maximum Entropy Model– Support Vector Model – also adopt LIBVSM.– Obtained higher accuracy (89% and 89.2%). 

Page 11: Question Classifier

   

                

Datasets for the project• Same dataset as Li's:

– http://l2r.cs.uiuc.edu/~cogcomp/Data/QA/QC/

• Additional datasets:– TREC QA: http://trec.nist.gov/data/qa.html

Page 12: Question Classifier

   

                

Plan for the project• Experiment with different feature types:

– Head chunks, semantic features for head chunk, named­entities, word grams and word shape feature

• Use WordNet to automate the generation of semantic features– Find hypernyms.– Apply Lesk's WSD to the head chunk.

Page 13: Question Classifier

   

Head word sense disambiguation

Page 14: Question Classifier

   

                

Resources

• Java interface to WordNet:– http://wordnet.princeton.edu/links#SQL

• A syntactic parser for extracting the head­chunk feature:– Berkeley parser (Petrov and Klein, 2007).

• Use the N­gram Statistics Package

Page 15: Question Classifier

   

Resources (cont)

• Named entity recognizer, a relational feature extraction language (FEX):– http://l2r.cs.uiuc.edu/~cogcomp/software.php

• Mallet Machine Learning Library:– http://mallet.cs.umass.edu/

Page 16: Question Classifier

   

References

• Li, X. and D. Roth. 2002. Learning Question Classifiers.The 19th international conference on Computational linguistics, vol. 1, pp. 1–7.

• Zhang D. and W. S. Lee. 2003. Question Classification using Support Vector Machines. The ACM SIGIR conference in information retrieval, pp. 26–32.

• Zhiheng Huang; Marcus Thint; Zengchang Qin. Question Classification using Head Words and their Hypernyms.

Page 17: Question Classifier

   

References (cont)• D. Roth, G. Kao, X. Li, R. Nagarajan, V. 

Punyakanok, N. Rizzolo, W. Yih, C. O. Alm, and L. G. Moran. 2002. Learning components for a question answering system. In TREC­2001.

• Jonathan Brown – IR Lab.  Entity­Tagged Language Models for Question Classification in a QA System.

• Donald Metzler, W. Bruce Croft Analysis of statistical question classification for fact­based questions (2003).