Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
28.3.2013.
1
Sadržaj predavanja
Klasifikacija zasnovana na Bayesovoj teoriji odlučivanja
Naivni Bayesov klasifikator, primjer
Copyright: Lejla Banjanović-Mehmedović 1
Prepoznavanje uzoraka
Klasifikacija zasnovana na Bayesovoj teoriji odlučivanja
Probabilistički pristup u prepoznavanju uzoraka: Statistička varijacija uzoraka Šum u mjerenjima
Dizajn klasifikatora, koji klasificiraju nepoznate uzorake u najvjerovatnije klase: Osnovni cilj prepoznavanja oblika jeste da se donese odluka
kojoj kategoriji posmatrani uzorak pripada. Na osnovu opservacija ili mjerenja formira se vektor mjerenja. Ovaj vektorsluži kao ulaz u pravilo odlučivanja kroz koje se ovaj vektorpridružuje nekoj od analiziranih klasa.
Copyright: Lejla Banjanović-Mehmedović 2
Prepoznavanje uzoraka
28.3.2013.
2
Slučajni vektori i njihova raspodjela
Posmatrajmo slučajni vektor X (vektor uzoraka), koji se sastoji od n slučajnih varijabli:
Pridružuje se funkcija raspodjele vjerovatnoće
i funcija gustine vjerovatnoće
Copyright: Lejla Banjanović-Mehmedović 3
Prepoznavanje uzoraka
Slučajni vektori i njihova raspodjela U teoriji prepoznavanja uzoraka operiše se sa slučajnim vektorima
koji se pridružiju različitim klasama (klasa i, L ukupan broj klasa.)
– a’priori vjerovatnoća pojave klase i Svaka klasa je okarakterisana svojom funckijom raspodjele (uslovna
raspodjele za i-tu klasu)- distribucija vektora X u svaku od klasa
Bezuslovna funcija raspodjele sl. vektora X –miksana funkcija raspodjele:
Aposteriorna vjerovatnoća klase se računa na osnovu Bayesove teoreme (predstavlja vjerovatnoću da nepoznati uzorak pripada datoj klasi):
Copyright: Lejla Banjanović-Mehmedović 4
Prepoznavanje uzoraka
28.3.2013.
3
Bayesovo klasifikaciono pravilo
Copyright: Lejla Banjanović-Mehmedović 5
Slučaj 2 klase: a’priori vjerovatnoće poznate ili
Uslovna vjerovatanoća ili funkcija sličnosti klase wi u odnosu na X
Traženje max. vrijednosti pri istoj a’priori vrijednosti se odnosi na uslovne vjerovatnoće!
Prepoznavanje uzoraka
Bayesovo klasifikaciono pravilo
Copyright: Lejla Banjanović-Mehmedović 6
Izraz l se naziva količnik vjerodostojnosti (likelihood ratio) i to je vrlo važna veličina u prepoznavanju oblika.
Količnik a’ priori vjerovatnoća naziva se vrijednošću praga (threshold value)količnika vjerodostojnosti u odlučivanju.
Prepoznavanje uzoraka
28.3.2013.
4
Bayesovo klasifikaciono pravilo
Uobičajeno je da se na količnik vjerodostojnosti primjeni funkcija negativnog prirodnog logaritma, i tada pravilo odlučivanja dobija formu:
Izraz h(X) predstavlja diskriminacionu funkciju.
Copyright: Lejla Banjanović-Mehmedović 7
Prepoznavanje uzoraka
Bayesovo pravilo odlučivanja minimalne greške
U analizi navedenog pravila vrlo je važno odrediti vjerovatnoću greške odlučivanja. Ovo i slična pravila ne obezbjeđuje savršeno klasifikovanje.
Pod vjerovatnoćom greške se podrazumjeva vjerovatnoća događaja da će pravilo donijeti pogrešnu odluku o pripadanju mjernog vektora klasi.
Copyright: Lejla Banjanović-Mehmedović 8
Primjer dvije klase iste vjerovatnoće, pri čemu je uzeta samo jedna karakteristika (atribut) l=1
Prepoznavanje uzoraka
28.3.2013.
5
Bayesovo pravilo odlučivanja minimalne greške
Copyright: Lejla Banjanović-Mehmedović 9
Ukupna greška (Bayesova greška) :
Bayesova vjerovatnoća greške sastoji iz dva člana: prvi se odnosi na loše klasifikovane vektore iz klase ω1, dok se drugi odnosi na loše klasifikovane vektore iz klase ω2.
Ovo pravilo generiše najmanju moguću grešku odlučivanja (Bayesovo pravilo odlučivanja minimalne greške) ako se greška minimizira tako da za izdjeljene regione R1 i R2 vrijedi:
Ili uopšteno: Bayesov klasifikator je optimalan s obzirom na minimizaciju
klasifikacione greške vjerovatnoće.Prepoznavanje uzoraka
Bayesovo pravilo odlučivanja minimalne cijene
Copyright: Lejla Banjanović-Mehmedović 10
Vrlo često u praksi, minimizacija vjerovatnoće greške nije najbolji kriterijum za projektovanje pravila odlučivanja.
Često se dešava da greška kada se mjerni vektor iz prve klase pridruži drugoj nema istu težinu kao kada se mjerni vektor iz druge klase pridruži prvoj.
Dobar primer za ilustraciju ovakve situacije jeste prepoznavanje oboljenja u medicini.
Zbog toga se uvode cjene za svaku od mogućih odluka.
Prepoznavanje uzoraka
28.3.2013.
6
Bayesovo pravilo odlučivanja minimalne cijene
Copyright: Lejla Banjanović-Mehmedović 11
Problem iz medicine: Umjesto da selektiramo R1 i R2 tako da min. Pe, minimizirat ćemo modifikovanu verziju:
Prepoznavanje uzoraka
Bayesovo pravilo odlučivanja minimalne cijene
Copyright: Lejla Banjanović-Mehmedović 12
Rj, regioni prostora klase j Vektor X koji pripada klasi wk, leži u regionu i Greška => uvođenje kazne (gubitka,pogrešna odluka)
Rizik asociran sa klasom wk: Cilj: izabrati takvo formiranje regiona tako da prosječan rizik
bude minimiziran:
Prepoznavanje uzoraka
28.3.2013.
7
Bayesovo pravilo odlučivanja minimalne cijene
Copyright: Lejla Banjanović-Mehmedović 13
Za 2 klase:
Pridružit ćemo X klasi ω1 ako je l1
28.3.2013.
8
Diskriminantne funkcije i površ odlučivanja
Copyright: Lejla Banjanović-Mehmedović 15
Minimiziranje rizika ili greške vjerovatnoće je ekvivalentno podjeli prostora uzoraka u M regiona, za zadatke sa M klasa.
Ako su Ri, Rj granični regioni, onda su podjeljeni sa površi odlučivanja u multidimenzionalnom prostoru.
U slučaju minimalne greške vjerovatnoće, površ odlučivanja opisana sa:
S matematičke strane, opravdano uvesti diskriminantnu funkciju
pa test odluke glasi: Klasificiraj X u ωi ako je Površi odlučivanja, koje razdvajaju granične regione opisane sa:
Prepoznavanje uzoraka
Normalna raspodjela Poseban slučaj funkcije gustine vjerovatnoće p(X) jeste normalna raspodjela slučajne
varijable X (multi forma za l-dimenzionalni prostor):
pri čemu je ovo forma za normalnu raspodjelu sa matematičkim očekivanjem M i kovarijacionom matricom Σ
hji je (i,j)-ti element inverzne matrice Σ tr A-trag matrice A, zbir svih dijagonalnih elemenata matrice A.
Copyright: Lejla Banjanović-Mehmedović 16
Prepoznavanje uzoraka
28.3.2013.
9
Posmatramo 2-D prostor:
Copyright: Lejla Banjanović-Mehmedović 17
Normalna raspodjela
Primjer sferične simetrije
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 18
Normalna raspodjela
Graf Gausijana izdužen duž x1 ose, smjer veće varijanse, krive elipse
Prepoznavanje uzoraka
28.3.2013.
10
Copyright: Lejla Banjanović-Mehmedović 19
Normalna raspodjela
Graf Gausijana izdužen duž x2 ose
Prepoznavanje uzoraka
Primjer nedijagonalne kovarijantne matice (različite krive po obliku i orjentaciji
Copyright: Lejla Banjanović-Mehmedović 20
Normalna raspodjela
Prepoznavanje uzoraka
28.3.2013.
11
Copyright: Lejla Banjanović-Mehmedović 21
Normalna raspodjela
Jednačina elipse čije su ose određene varijansama uključenih karakteristika
Prepoznavanje uzoraka
Bayesov klasifikator za Normalno distribuirane klase Cilj: analizirati optimalni Bayesov klasifikator, gdje su uključene
funkcije vjerovatnoće svake klase u odnosu na vektor uzoraka X
opisujući distribuciju podataka sa multivarijacionom normalnom distribucijom
Diskriminaciona funkcija:
ili
Copyright: Lejla Banjanović-Mehmedović 22
Prepoznavanje uzoraka
28.3.2013.
12
Bayesov klasifikator za Normalno distribuirane klase
Generalno nelinearna kvadratna forma.
Za l=2 =>
Kriva odlučivanja je kvadratna (elipsa, parabola, hiperbola, parovi linija i sl.) => Bayesov kvadratni klasifikator
Za l>2 => hiperkvadratna površ odlučivanja
Copyright: Lejla Banjanović-Mehmedović 23
Prepoznavanje uzoraka
Bayesov klasifikator za Normalno distribuirane klase
Copyright: Lejla Banjanović-Mehmedović 24
Primjer kvadratne krive odlučivanja (elipsa, hiperbola)
Prepoznavanje uzoraka
28.3.2013.
13
Bayesov klasifikator za Normalno distribuirane klase
Copyright: Lejla Banjanović-Mehmedović 25
Dvije jednako vjerovatne klase u 2D prostoru, sa normalnom distribucijom i različitih kovarijansnih matrica. Kriva odlučivanja-elipsa
Prepoznavanje uzoraka
Bayesov klasifikator za Normalno distribuirane klase
Copyright: Lejla Banjanović-Mehmedović 26
Dvije jednako vjerovatne klase u 2D prostoru, sa normalnom distribucijom i različitih kovarijansnih matrica. Kriva odlučivanja-hiperbolaPrepoznavanje uzoraka
28.3.2013.
14
Hiperravni odlučivanja
Copyright: Lejla Banjanović-Mehmedović 27
Kvadratni doprinos u (**) dolazi od izraza:
Reduciranjem gi(X):
gi(X) je linearna funkcija od X, površi odlučivanja -hiperravni
Prepoznavanje uzoraka
Hiperravni odlučivanja
Copyright: Lejla Banjanović-Mehmedović 28
Linija odlučivanja za kompaktne i nekompaktne klase
Prepoznavanje uzoraka
28.3.2013.
15
Klasifikatori minimalne distance Ako uvedemo pretpostavku u (**) da 2 jednako vjerovatne klase
imaju istu kovarijantnu matricu =>
1. Dijagonalna matrica, max gi(X) implicira min. Euklidske distance 2. Nedijagonalna matrica, max gi(X) implicira min. Mahalanobisove distance
Copyright: Lejla Banjanović-Mehmedović 29
Prepoznavanje uzoraka
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 30
Naivni Bayesov klasifikator
Spada u grupu statističkih parametarskih klasifikatora (vektor atributa se interpretira kao stohastička varijabla čija raspodjela zavisi od klase uzoraka), iz tog razloga se može koristiti Bayesova teorema u klasifikaciji.
Primjena u prepoznavanju uzoraka
28.3.2013.
16
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 31
Naivni Bayesov klasifikator
Pretpostavimo da imamo skup od m uzoraka ili podataka S ={S1,S2,...,Sm}, gdje je svaki uzorak Si predstavljen kao n-dimenzini vektor {x1,x2,...,xn}, pri čemu svako xi predstavlja atribut uzorka.
Neka je definisano k klasa k1, k2,…, kk i neka svaki uzorak pripada jednoj od ovih klasa. Neka je dat dodatni uzorak X, pri
čemu ne znamo kojoj klasi pripada.
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 32
Naivni Bayesov klasifikator
Ukoliko klasifikaciju predstavimo kao pronalaženje najvjerojatnije klasifikacije tada se može računati po izrazu:
što predstavlja najvjerovatniji element konačnog skupa K svih mogućih klasifikacija uzoraka. Svaki uzorak prikazan je kao skup vrijednosti atributa
28.3.2013.
17
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 33
Naivni Bayesov klasifikator
Naivni Bayesov klasifikator uvodi pojednostavljenje u vidu pretpostavljene međusobne nezavisnosti vrijednosti atributa u n-torkama tako da vrijedi izraz:
Prepravljeni izraz za klasifikaciju Naivnim Bayesovim klasifikatorom sada glasi:
Događaji E1, E2,...En su međusobno nezavisni ako isamo ako za bilo koji podskup
ovih događaja vrijedi:
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 34
Primjer za klasifikaciju Naivnim Bayesovim klasifikatorom
Za svaki uzorak opisan atributima A1, A2 i A3 data je klasa, kojoj pripada. Potrebno je predvidjeti klasu za novi uzorak opisan sa X= {1,2,2}.
Uzorak Atribut A1 Atribut A2 Atribut A3 Klasa K
1 1 2 1 1
2 0 0 1 1
3 2 1 2 2
4 1 2 1 2
5 0 1 2 1
6 2 2 2 2
7 1 0 0 1
28.3.2013.
18
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 35
Primjer za klasifikaciju Naivnim Bayesovim klasifikatorom
A’priori vjerovatnoće za svaku od klasa su:
Proračun uslovnih vjerovatnoća za svaki atribut novog uzorka u odnosu na svaku klasu:
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 36
Primjer za klasifikaciju Naivnim Bayesovim klasifikatorom
Pod pretpostavkom uslovne nezavisnosti atributa, uslovne vjerovatnoće su:
28.3.2013.
19
Prepoznavanje uzoraka
Copyright: Lejla Banjanović-Mehmedović 37
Primjer za klasifikaciju Naivnim Bayesovim klasifikatorom
Množenjem uslovnih vjerovatnoća sa odgovarajućim a’priori vjerovatnoćama, moćemo naći odgovarajuće a’posteriori vjerovatnoće:
te maksimum imeđu njih: