21
SVEUČILIŠTE U ZAGREBU FAKULTET STROJARSTVA I BRODOGRADNJE NEPARAMETARSKE STATISTIČKE METODE Kolegij: Multivarijatne statističke metode Studenti: Sirovica Ivan, Sabol Mate i Lekšić Ivan

Neparametrijske statističke metode

Embed Size (px)

Citation preview

Page 1: Neparametrijske statističke metode

SVEUČILIŠTE U ZAGREBU

FAKULTET STROJARSTVA I BRODOGRADNJE

NEPARAMETARSKE STATISTIČKE METODE

Kolegij: Multivarijatne statističke metode

Studenti: Sirovica Ivan, Sabol Mate i Lekšić Ivan

Zagreb, 23. siječnja 2014.

Page 2: Neparametrijske statističke metode

SADRŽAJ

1. UVOD..............................................................................................................................................3

2. NEPARAMETRIJSKI TESTOVI................................................................................................................4

2.1. Hi-kvadrat test.............................................................................................................................4

2.1.1. Osnovni uvjeti za upotrebu hi-kvadrat testa.........................................................................5

2.2. Dva nezavisna uzorka..................................................................................................................6

2.2.1. Test homogenog niza (Run test, Wald-Wolfowitzov test)....................................................6

2.2.2. Medijan test.........................................................................................................................7

2.2.3. Test sume rangova(Wilcoxonov T-test, Mann-Whitneyev U-test)........................................7

2.2.4. Siegel-Tukeyev test...............................................................................................................7

2.3. Dva zavisna uzorka......................................................................................................................8

2.3.1. Test predznaka (Sign test).....................................................................................................8

2.3.2. Wilcoxonov test ekvivalentnih parova..................................................................................8

2.4. Više nezavisnih uzoraka...............................................................................................................9

2.4.1. Prošireni medijan test...........................................................................................................9

2.4.2. Kruskal-Wallisov test............................................................................................................9

2.5. Više zavisnih uzoraka.................................................................................................................10

2.5.1. Friedmanov test..................................................................................................................10

2.5.2. Fergusonov test monotonije trenda...................................................................................11

3. PRIMJER........................................................................................................................................11

3.1. Primjer sa više nezavisnih uzoraka (Kruskal-Wallisov test)...................................................11

3.2. Primjer sa više zavisnih uzoraka (Friedmanov test)..............................................................14

5. LITERATURA......................................................................................................................................17

2

Page 3: Neparametrijske statističke metode

1. UVOD

Za razliku od parametrijskoga pristupa statističkoj analizi, katkada je potrebito rabiti i neparametrijske metode. Kod parametrijske statistike polazi se od izvjesnih pretpostavki o zajedničkom obliku i simetričnosti raspodjele učestalosti osnovnih skupova, kao i o jednakosti varijanci.

Navedene pretpostavke moraju biti ispunjene kod usporedbe srednjih vrijednosti (npr. pojedinačni testovi pri ispitivanju razlika srednjih vrijednosti tretmana u analizi varijance) i standardnih devijacija ili proporcija. U slučaju neispunjavanja tih pretpostavki ili u slučaju opravdane sumnje u homogenost pokusnih podataka, pristupa se prikladnoj transformaciji podataka. Transformacija pokusnih podataka trebala bi osigurati ispunjenje osnovnih preduvjeta za primjenu parametrijskih testova. Nakon transformacije, provodi se statistička analiza (npr. analiza varijance), te na osnovi njezinih rezultata izvode valjani zaključci.

Danas je uobičajena metodološka praksa statističke analize pokusa postavljanje ispitivanje nultih hipoteza, uz određivanje pragova značajnosti ili granica povjerenja. Međutim, često se ne polazi od pretpostavke o obliku raspodjele učestalosti jednoga ili više osnovnih skupova, odnosno ispitivane populacije. Za takav metodološki pristup uobičajeni je naziv metoda slobodne raspodjele ili neparametrijska statistika.

Neparametrijski testovi često se rabe iz više razloga. Njihova osnovna prednost je u brzini i jednostavnosti primjene. Naime, većina se neparametrijskih testova provodi na osnovi razlike ili ranga. Uzorak na osnovi kojega se provodi test može se temeljiti na različitim oblicima osnovnih skupova ili dijelova ispitivane populacije o kojoj se vrlo malo zna. To je slučaj kod postavljanja pokusa ili određivanja nultih hipoteza tamo gdje se provode potpuno nova (do tada nepoznata, neprovjerena ili nepotvrđena) istraživanja. Slijedeća prednost neparametrijskih testova ogleda se u povoljnom odnosu učinkovitosti i ekonomičnosti. Naime, neparametrijski testovi, iako manje učinkoviti od parametrijskih, ekonomski su opravdaniji. To pozitivno utjeće na ekonomičnost pokusa u cjelini.

Glavni nedostatak neparametrijskih testova u odnosu na parametrijske je smanjena efikasnost. Naime, ako je efikasnost nekoga testa 70%, tada je veličina uzorka za odgovarajući parametrijski test 30% manja, uz postizanje iste učinkovitosti ili preciznosti. Stoga je, u slučajevima kada je poznata raspodjela učestalosti osnovnoga skupa koja je podudarna s već poznatim oblicima, ili se taj uvjet postiže prikladnom transformacijom, primjena neparametrijskih testova manje opravdana.

Kada su podaci dati u formi ranga, gotovo i ne postoji drugi izbor nego li primijeniti neparametrijske metode u postupku testiranja. U znanstveno-istraživačkom radu rabe se brojni neparametrijski testovi.[1]

3

Page 4: Neparametrijske statističke metode

2. NEPARAMETRIJSKI TESTOVI

2.1. Hi-kvadrat test

Postupak nazvan hi-kvadrat test se upotrebljava u većini slučajeva ako se radi o kvalitativnim podacima ili ako tim podacima distribucija značajno odstupa od normalne. Već u početku treba naglasiti da se hi-kvadrat test računa samo s frekvencijama pa u račun nije dopušteno unositi nikakve mjerne jedinice. Osnovni podaci istraživanja mogu biti i mjerne vrijednosti, ali u hi-kvadrat unose se samo njihove frekvencije. Hi-kvadrat test je vrlo praktičan test koji može osobito poslužiti onda kad želimo utvrditi da li neke dobivene (opažene) frekvencije odstupaju od frekvencija koje bismo očekivali pod određenom hipotezom. Kod ovog testa katkada tražimo postoji li povezanost između dvije varijable i on pokazuje vjerojatnost povezanosti. Možemo pretpostaviti da neka teorijska raspodjela dobro opisuje opaženu raspodjelu frekvencija. Da bismo tu pretpostavku (hipotezu) provjerili, primjenjujemo ovaj test. Rezultati dobiveni u uzorcima ne podudaraju se uvijek s teoretskim rezultatima koji se očekuju prema pravilima vjerojatnosti. Na primjer iako prema teoriji očekujemo da kad god bacimo valjan novčić 100 puta dobijemo 50 „glava“ i 50 „pisama“, rijetko kada se dobije ovakav rezultat. Često želimo znati da li se opažene frekvencije značajno razlikuju od očekivanih frekvencija. Ta razlika se računa se prema sljedećoj formuli:

χ2=∑ (f 0−f t)2

f t

pri čemu f0 znači opažene frekvencije, a ft očekivane (teoretske) frekvencije, tj. frekvencije koje bismo očekivali pod nekom određenom hipotezom, te vrijedi:

∑ f 0=∑ f t=N

N- ukupna frekvencija

Izraz ekvivalentan prvoj formuli je sljedeći:

χ2=∑ f 02

f t−N

Broj stupnjeva slobode ν definiran je kao broj nezavisnih varijabli uključenih u izračun χ2 . Nalazimo ga na sljedeći način: ν = broj razreda – broj ograničenja.

Razmotrimo pokus koji daje n opaženih frekvencija f i. Želimo li provjeriti hipotezu da ta opažanja slijede neku teorijsku raspodjelu, najprije izračunamo očekivane teorijske vrijednosti fti. Opažene frekvencije, naravno, odstupaju od teorijskih, a mi želimo donijeti odluku možemo li ta odstupanja pripisati slučaju. Nul-hipoteza je: "Opažanja slijede teorijsku raspodjelu". Nul-hipoteza je hipoteza koju testiramo i označavamo je s H0. Ona se iskazuje kao nedostatak različitosti ili učinka. Nul-hipoteza se odbacuje ako test značajnosti pokaže da su podaci nekonzistentni s nul-hipotezom.

Granična vrijednost je vrijednost testa za koje se nul-hipoteza odbacuje. Značajnost testa α je vjerojatnost odbacivanja nul-hipoteze kada je istinita, tj. vjerojatnost da su promatrani podaci

4

Page 5: Neparametrijske statističke metode

ekstremniji od stvarnih rezultata kad je nul-hipoteza istinita. Mala značajnost testa znači da su podaci toliko ekstremni da su nevjerojatni pod ovom nul-hipotezom. Značajnost testa nije vjerojatnost da je nul hipoteza lažna. Mala značajnost testa ne znači da postoji mala vjerojatnost da je nul-hipoteza istinita. Nul-hipoteza se odbacuje za značajnost testa 0.05 ili 5%.

Najčešće upotrebljavamo hi-kvadrat test u ovim slučajevima:

1. Kad imamo frekvencije jednog uzorka pa želimo ustanoviti odstupaju li te frekvencije od frekvencija koje očekujemo uz neku hipotezu.

2. Kad imamo frekvencije dvaju ili više nezavisnih uzoraka te želimo ustanoviti razlikuju li se uzorci u opaženim svojstvima.

3. Kad imamo frekvenciju dvaju zavisnih uzoraka, koji imaju dihotomna svojstva, te želimo ustanoviti razlikuju li se uzorci u mjernim svojstvima, tj. je li došlo do promjene.

2.1.1. Osnovni uvjeti za upotrebu hi-kvadrat testa

Hi-kvadrat je stvarno vrlo jednostavan test, jer je njegova logika jasna, a izračunavanje vrlo jednostavno. No upravo se u tome vjerojatno i krije opasnost da se njegova jednostavnost precijeni. Kod hi-kvadrat testa uvijek je potrebno dobro promisliti kako ćemo rezultate prikazati u tablici.

Ovaj test posjeduje tzv. aditivna svojstva, a to znači da imamo pravo zbrojiti nekoliko hi-kvadrata iz istih istraživanja, i o značajnosti dobivenog rezultata zaključivati iz tablice, s tim da zbrojimo i stupnjeve slobode. Pri takvim situacijama zbrajanja rezultata hi-kvadrata treba paziti da se zbroje svi raspoloživi rezultati (a ne samo pozitivni).

Uvjeti koji moraju biti ispunjeni da bi se smio računati hi-kvadrat test:

1. hi-kvadrat test može se računati samo s frekvencijama

2. Suma očekivanih frekvencija mora biti jednaka sumi opaženih frekvencija

3. Kad god u hi-kvadrat testu radimo s nekim svojstvom koje se pojavilo ili se nije pojavilo, treba u računu staviti i frekvencije u kojima se to svojstvo nije pojavilo.

4. Frekvencije u pojedinim ćelijama moraju biti u tom smislu nezavisne da svaka frekvencija u pojedinoj ćeliji mora pripadati nekom drugom individuumu. Na primjer ne smijemo u tablicu unositi nekoliko odgovora jednog ispitanika.

5. Nijedna očekivana frekvencija ne smije biti previše mala. U tom se treba pridržavati ovih pravila:

a) Kad imamo više od dvije ćelije, ako je više od 20% očekivanih frekvencija manje od 5, treba spajati susjedne ćelije. Kad radimo samo s dvije ćelije, ne smije ni jedna očekivana frekvencija biti manja od 5.

5

Page 6: Neparametrijske statističke metode

b) Kod 2 × 2 tablica hi-kvadrat smije se upotrijebiti uvijek ako je N veći od 40. Ako je N manji od 40, ali veći od 20, ne smije ni jedna očekivana frekvencija biti manja od 5.

c) U tablicama kontigencije kad je broj stupnjeva slobode veći od 1, hi-kvadrat se smije računati ako manje od 20% ćelija ima očekivanu frekvenciju manju od 5, a ni jedna ćelija manju od 1. Ako to nije postignuto treba spajati ćelije u kojima su očekivane frekvencije previše male.

6. Kada postoji samo 1 stupanj slobode, potrebno je provesti korekciju za kontinuitet (Yates-ova korekcija). Ako su razlike između opaženih i očekivanih frekvencija vrlo male tako da primjenom Yates-ove korekcije dobijemo razliku koja je numerički veća (bez obzira na predznak), onda upotreba te korekcije nema opravdanja.

2.2. Dva nezavisna uzorka

2.2.1. Test homogenog niza (Run test, Wald-Wolfowitzov test)

Kod testa homogenog niza testira se dali se dva uzorka razlikuju statistički značajno u bilo kojem pogledu: u centralnoj tendenciji, u varijabilnosti, simetričnosti itd. Može se upotrebljavati kod rangiranih rezultata kao i kod rezultata dobivenih mjerenjem, nakon što ih rangiramo. Zajedno se rangiraju rezultati obje skupine, svakom se rangu daje oznaka kojoj od skupina pripada, analizira se koliko homogenih nizova ukupno ima u cijeloj skali rangova, tj. koliko skupina jednako obilježenih ima rangova. Koliko je najmanje nizova potrebno da bi se moglo smatrati da se obje skupine međusobno razlikuju provjerava se ili tablicama ili računom koji se svodi na z-vrijednosti. Ako su m ili n veći od 20, test homogenog niza računa se tako da se prvo izračuna aritmetička sredina nizova:

xniza=2mnm+n

+1

m, n - broj podataka u nizovima

Zatim se računa standardna devijacija niza prema formuli:

sniza=√ 2mn(2mn−m−n)(m+n )2(m+n−1)

Nakon toga izračunamo vrijednost z:

z=dobivenibroj nizova−xniza

sniza

Ako je broj nizova manji od očekivanog po slučaju, smatramo da se grupe međusobno razlikuju. Preveliki broj nizova u nekim slučajevima može značiti da smo falsificirali rezultate.

6

Page 7: Neparametrijske statističke metode

2.2.2. Medijan test

To je vrlo jednostavan test, koji se zapravo svodi na hi-kvadrat test, a kojim ispitujemo pripadaju li dva ili više uzoraka istoj populaciji. Jedan od najslabijih testova (zadnja opcija). U parametarskoj statistici njemu djelomično odgovara t-test, kojim ispitujemo značajnost razlika između dvije aritmetičke sredina. Gruba dihotomizacija rezultata, razlike se svedu samo na dvije ili iznad ili ispod C, ne znamo koliko su udaljeni rezultati. Loše jer ekstremi i medijan spadaju u istu kategoriju. Koriste se 2 × 2 tablice, te se iz te tablice izračunava hi-kvadrat test, vodeći računa o svim pravilima koja vrijede za hi-kvadrat. Ako je ukupan broj rezultata paran, medijan je aritmetička sredina između dva rezultata, koji se nalaze u sredini niza svih rezultata, poredanih po veličini. U tom slučaju će nam svi rezultati biti iznad ili ispod medijana, a niti jedan na samom medijanu.

2.2.3. Test sume rangova(Wilcoxonov T-test, Mann-Whitneyev U-test)

Taj je test donekle sličan testu homogenih nizova, ali on koristi više informacija i zato se može smatrati boljim i snažnijim. Kao i medijan testom, testom sume rangova testiramo pripadaju li dva uzorka u populaciju s istim medijanom. Test se provodi na način da se dodijele rangovi te se nakon toga računa izraz:

z=|2T i−N i (N+1 )|−2

√ N1 N2(N+1)3

Gdje Ti znači bilo koju od suma rangova, a N i znači broj ispitanika u skupini iz koje smo uzeli T i. Ako je broj ispitanika u svakoj skupini barem 8, tada izračunani z daje normalnu distribuciju s aritmetičkom sredinom 0 i standardnom devijacijom 1, tj. izračunana vrijednost nije ništa drugo nego nama već dobro poznata z-vrijednost. Statistički značajni rezultati smatraju se oni na razini značajnosti od 5%. Ako je z premalen onda prihvaćamo nul-hipotezu: nismo dokazali da se ta dva uzorka statistički značajno razlikuju.

2.2.4. Siegel-Tukeyev test

Siegel-Tukeyev test pogodan je jedino za testiranje značajnosti razlika u varijabilitetu. Po upotrijebljenim formulama on je jednak upravo opisanom testu sume rangova, ali se razlikuje po načinu rangiranja rezultata. Dok smo u testu sume rangova rangirali rezultate na standardan uobičajen način, ovdje je rangiranje malo neobično. Rezultati se rangiraju tako da se rang 1 daje najnižem rezultatu, rang 2 i 3 najvišim, rang 4 i 5 idućim najnižim itd. Ako je totalni broj rangova neparan, ne uzima se srednji rezultat u daljnjem računu. Ako se obje populacije ne razliku u varijabilitetu (nul-hipoteza), sume rangova jednog i drugog uzorka bit će slične. Naprotiv ako se populacije u varijabilitetu razlikuju, uzorak iz populacije s većim varijabilitetom tendirat će ekstremima sekvence rangova, i stoga će biti označen nižim rangovima: Naprotiv, uzorak iz populacije

7

Page 8: Neparametrijske statističke metode

s manjim varijabilitetom, tendirat će prema sredini sekvence rangova, i zato će biti označen višim rangovima. Dakle uzorak s većom varijacijom imat će manju sumu rangova.

2.3. Dva zavisna uzorka

Kao i kod parametrijskih testova i kod neparametrijskih testova metode su nešto drugačije ako radimo sa zavisnim uzorcima, dakle ili dva puta s istom skupinom ispitanika, ili s dvije skupine ispitanika, u kojima svaki ispitanik jedne skupine ima svoj par u drugoj skupini.

2.3.1. Test predznaka (Sign test)

Test predznaka se koristi kod dva zavisna faktora, vrlo je jednostavan i ima vrlo malu statističku snagu. Postupak testa predznaka sastoji se u tome da se odrede dva kriterija po kojima će se bilježiti razlika. To znači da ćemo npr. U prvoj usporedbi gdje je prvi član u nečem bolji od drugog dati +, pretpostavimo da u drugoj usporedbi je drugi član para bolji pa ćemo staviti -, a ako nema značajne razlike stavljamo 0 i te parove kasnije ne uzimamo u obzir. Time će se broj N tj. broj parova smanjiti. Dakle u testu predznaka broj parova koji se razlikuju.( Ako imamo mnogo parova bez razlike, test predznaka se ne može upotrijebiti). Pretpostavimo da je test proveden i dobijemo da je u 11 od 15 pari bolji prvi član, a u 4 slučaja je bolji drugi član. Dakle, u računu imamo 4 minusa i 11 plusa. Daljnji postupak provodimo s manjim od ta dva broja. Naš broj razlika je 4, što pokazuje da bi se takva razlika mogla i slučajno dogoditi u 25% slučajeva i to bi bilo da je naš problem dvosmjeran. Pošto je naš problem jednosmjeran 25 dijelimo sa 2 i dobijemo da se ta razlika mogla slučajno dogoditi u 12.5% slučajeva, što je naravno još uvijek nedovoljno, jer ne želimo ići na razine značajnosti koje su veće od P = 0,05, a u ovom slučaju P = 0,125. Nedostatak testa predznaka je što on ne uzima u obzir veličinu razlike, nego samo njen smjer. Konkretno u našem slučaju se moglo dogoditi da je 11 prvih članova znatno bolje, a da je u slučaju gdje su bolji drugi članovi bolji tek neznatno. Za test predznaka to je nažalost svejedno. Zato za taj test kažu da je to vrlo prikladan postupak štednje vremena kada su razlike velike, i vrlo koristan instrument da bi se aproksimativno ustanovili postoji li uopće neki fenomen. Ali kad nam je potrebna veća preciznost, gdje želimo iskoristiti i ostale podatke koje imamo, a to su veličine pojedinih razlika, mnogo je prikladniji Wilcoxonov test.

2.3.2. Wilcoxonov test ekvivalentnih parova

Taj test zahtijeva mjerene vrijednosti. Postupak se sastoji u tome da izračunamo razlike (d) između oba člana u svakom paru. Ako razlike nema ona je 0 i taj se par ispušta iz daljnje obrade. Razlike mogu biti pozitivne i negativne. Te se razlike rangiraju i to bez obzira na predznak. Najmanja razlika dobiva rang 1, iduća rang 2 itd. Ako su dvije ili više razlika jednake veličine, dobivaju zajednički rang. Nakon toga svakom se rangu daje onaj isti predznak koji je imala i razlika: ako je razlika pozitivna, i rang je pozitivan, a ako je razlika negativna, i rang je negativan. Pod pretpostavkom nul-hipoteze (tj.

8

Page 9: Neparametrijske statističke metode

da nema razlike među uzorcima) postojat će tendencija suma pozitivnih i suma negativnih rangova budu jednake ili slične. Ako postoji značajna razlika sumi, to već govori u prilog odbacivanja nul-hipoteze. Iz tablice možemo očitati koliko najviše smije iznositi najviše smije iznositi manja suma rangova (T) uz određeni broj parova (N). Ako je uzorak veći od 25, T ima približno normalnu razdiobu te se može izračunati z, koji glasi:

z=T−

N (N+1)4

√ N (N+1)(2N+1)24

Budući da se radi o normalnoj raspodjeli, kod dvosmjernog testa dovoljna je vrijednost z od 1,96, da bismo na razini značajnosti od 5% mogli smatrati da je razlika značajna, odnosno z od 1,64 da bismo kod jednosmjernog testa razliku mogli smatrati značajnom.

2.4. Više nezavisnih uzoraka

2.4.1. Prošireni medijan test

Ako imamo više nezavisnih skupina, pa želimo testirati pripadaju li one ili ne pripadaju populaciji s istim medijanom, možemo se poslužiti proširenim medijan testom, na sličan način kao što je to učinjeno kod dva uzorka. Postupak se sastoji u tome da nađemo medijan svih rezultata, i da rezultate, koji su iznad medijana označimo s plus a one ispod medijana s minus. Ako je broj rezultata neparan, medijan postaje jedan ili više postojećih rezultata. U tom slučaju i rezultati, koji predstavljaju medijan, dobivaju oznaku minus. Rezultati se nakon toga uvrste u 2 × k tablicu (k-broj uzoraka) i izračuna se hi-kvadrat test.

2.4.2. Kruskal-Wallisov test

Taj test zapravo predstavlja test analize varijance, samo se umjesto brojčanih mjernih podataka služi rangova. On donekle predstavlja prošireni test sume rangova. Postupak se kod tog testa može sažeti u ovih nekoliko operacija. Prvo se svi rezultati rangiraju, i to tako da najniži rezultat dobije rang 1. Sljedeći korak je izračunavanje sume rangova u svakom uzorku Ti. Broj rezultata u svakom uzorku označava se s Ni. Dobivene brojeve korisno je kontrolirati, a suma Ti mora iznositi:

∑T i=N (N+1)2

Treći korak je izračunavanje izraza H prema formuli:

H= 12N (N+1)∑

T i2

N i−3(N+1)

9

Page 10: Neparametrijske statističke metode

Gdje je:

Ti – suma rangova u jednom uzorku

N – ukupan broj opažanja

Ni – Broj opažanja u jednom uzorku

Ako su uzorci dovoljno veliki (kod ovog se računa smatra da su uzorci dovoljno veliki ako svaki uzorak sadrži više od 5 rezultata), H ima jednaku distribuciju kao i hi-kvadrat, pa zato možemo značajnost očitati i χ2 tablice uz k-1 stupnjeva slobode (k=broj grupa). Ako imamo veći broj zajedničkih rangova, a H je nešto ispod granice značajnosti, treba upotrijebiti drugu, korigiranu formulu za izračunavanje H u

kojoj prethodnu formulu dijelimo s 1−∑ T

N (N2−1) te onda formula izgleda:

H=

12N (N+1)∑

T i2

N i

−3 (N+1)

1− ∑ T

N (N2−1)

Gdje jeT=n(n2−1), a n je broj rezultata, koji čine zajednički rang. Taj račun treba posebno učiniti za sve zajedničke rangove. Na kraju taj će postupak nešto povećati vrijednost H. Kada broj mjerenja u pojedinim uzorcima nije dovoljno velik, H se ne može interpolirati kao χ2, i u tu svrhu postoje posebne tablice, iz kojih se može očitovati vjerojatnost. Te se tablice mogu naći u nekim priručnicima neparametrijskih metoda.

2.5. Više zavisnih uzoraka

2.5.1. Friedmanov test

Ako na istoj grupi ispitanika vršimo mjerenja u različitim uvjetima, onda su rezultati, dobiveni u svakom od tih uvijeta, u korelaciji s ostalim rezultatima, pa se zbog toga više ne možemo služiti Kruskal-Wallisovim testom. U tom slučaju Friedmanov test dvostruke analize varijance rangova predstavlja vrlo korisnu i upotrebljivu metodu, kojoj u parametarskoj statistici odgovara dvostruka analiza varijance, akoja se upotrebljava, između ostalog, i pri testiranju razlika između aritmetičkih sredina više zavisnih uzoraka. Postupak Friedmanova testa sastoji se u tome da se rezultati najprije razvrstaju u tablicu s N redova i k kolona. Redovi odgovaraju pojedinim ispitanicima, a kolone predstavljaju eksperimentalne uvjete: Rezultati u svakom redu pretvore se u rangove. U slučaju jednakih rezultat dobivamo naravno zajedničke rangove ali to ne utječe na vrijednost testa. Rangovi u svakoj koloni se zbroje(T). Kada ne bi bilo razlika u rezultatima među uzorcima iz različitih eksperimentalnih uvjeta, sume rangova tendirale bi sličnim vrijednostima. Da bi se izmjerila relativna veličina tih razlika, potrebno je zbrojiti kvadrirane sume rangova(Ti) i nakon to se računa:

10

Page 11: Neparametrijske statističke metode

χ2= 12N k (k+1)∑ (T i)

2−3N (k+1)

Ako su broj ispitanika (N) i broj eksperimentalnih uvjeta dovoljno veliki, izraz χ2 ima približno jednaku distribuciju kao i hi-kvadrat sa k-1 stupnjeva slobode, pa stoga značajnost očitavamo iz tablice graničnih vrijednosti hi-kvadrata. Zanimljivo je da Friedmanov test iako koristi jedino rangove, a ne stvarne izmjerene vrijednosti ima gotovo jednaku snagu kao i analiza varijance zavisnih uzoraka.

2.5.2. Fergusonov test monotonije trenda

Fergusonov test se koristi za testiranje trenda u pojedinim eksperimentima. Metoda se može podijeliti u pet koraka. Prvo se rangiraju rezultati svakog ispitanika posebno, za sve eksperimentalne situacije. Slijedeći korak je da se za svakog ispitanika izračuna izraz S, koji se računa ovako: usporedi se svaki rang sa svakim (dakle imamo N(N-1)/2 usporedbi rangova za svakog ispitanika), ako je par rangova, koji se uspoređuje, u prirodnom redu, zabilježi se +1, a ako je red izvrnut, zabilježi se -1. Rezultati se za svakog ispitanika zbroje. Treći korak je zbrajanje svih vrijednosti S. Zatim se izračuna izraz σs

2( to je varijanca distribucije uzoraka S) prema formuli:

σ s2=k (k−1)(2k+5)

18

Pri čemu je k broj eksperimentalnih situacija, i dobiveni se izraz pomnoži s N kako bi se dobila

varijanca distribucije izraza ∑ S. Drugi korijen iz toga izraza je standardna devijacija izraza ∑ S. I

peti i zadnji korak izraz ∑ S−1 se podijeli izrazom σ∑ S, i tako se dobije odstupanje u terminima

normalne razdiobe, dakle z. Ako je z veći od 1,96 ( za razinu značajnosti od 5%) ili veći od 2,58 (za razinu značajnosti od 1%), odbacit ćemo nul-hipotezu.

3. PRIMJER

3.1. Primjer sa više nezavisnih uzoraka (Kruskal-Wallisov test)

Podaci u donjoj tablici daju učinkovitost kemijskih procesa pomoću tri različita katalizatora (A, B i C) u razdoblju od četiri dana. Želi se dokaziti da različiti katalizatori za posljedicu imaju različitu učinkovitost na kemijske procese?

Katalizator Dan 1 Dan 2 Dan 3 Dan 4 A 84,5 82,8 79,1 80,2 B 78,4 79,1 78 76 C 83,1 79,9 77,8 77,9

11

Page 12: Neparametrijske statističke metode

Tablica 1. Učinkovitost katalizaora na kemijske procese

Katalizator

Dan 1 Dan 2 Dan 3 Dan 4 Ti

A 12 10 6,5 9 37,5 B 5 6,5 4 1 16,5 C 11 8 2 3 24

Tablica 2. Suma rangova za svaki uzorak katalizatora

Postavljanje hipoteza:

H0: Katalizatori nemaju različiti učinak na učinkovitost kemijskih procesa

H1: Katalizatori imaju različiti učinak na učinkovitost kemijskih procesa

Računski postupak:

H=12n( n+1)∑

T i2

n i−3(n+1 )=12

12(12+1 ) (37,52+16,52+2424 )−3(12+1 )=4,356Izrada u minitabu:

12

Page 13: Neparametrijske statističke metode

Kruskal-Wallis Test: Utjecaj versus Katalizator

Kruskal-Wallis Test on Utjecaj

AveKatalizator N Median Rank ZA 4 81,50 9,4 1,95B 4 78,20 4,1 -1,61C 4 78,90 6,0 -0,34

Overall 12 6,5

H = 4,36 DF = 2 P = 0,113

ZAKLJUČAK:

Iz tablice za hi-kvadratnu raspodjelu za stupanj slobode df=2 i α= 0,05 dobili smo Hkrit.= 5,911. Iz razloga što je H < Hkrit. prihvaćamo hiptezu H0 uz točnost pretpostavke od 95% (α =0,05). To nam govori da različiti katalizatori nemaju značajan utjecaj na učinkovitost kemijskih procesa.

13

Page 14: Neparametrijske statističke metode

Slika 1. Tablica hi-kvadratne raspodjele

3.2. Primjer sa više zavisnih uzoraka (Friedmanov test)

Na istom primjeru utjecaja katalizatora na učinkovitost kemijskih procesa izvesti ćemo i Friedmanov test tako što ćemo promatrati učinak katalizatora po pojedinom danu. Tako će biti još jedna varijabla dan koja će „blokirati“ varijablu katalizator.

Katalizator Dan 1 Dan 2 Dan 3 Dan 4 A 84,5 82,8 79,1 80,2 B 78,4 79,1 78 76

C 83,1 79,9 77,8 77,9Tablica 3. Učinkovitost katalizatora na kemijske procese

Katalizator Dan 1 Dan 2 Dan 3 Dan 4 Ti A 3 3 3 3 12 B 1 1 2 1 5 C 2 2 1 2 7

Tablica 4. Rangovi katalizatora po pojedinom danu

Postavljanje hipoteza:

H0: Katalizatori nemaju različiti učinak na učinkovitost kemijskih procesa

H1: Katalizatori imaju različiti učinak na učinkovitost kemijskih procesa

14

Page 15: Neparametrijske statističke metode

Računski postupak:

H=12n×k ( k+1)∑T i

2−3n( k+1)=124×3(3+1)

(122+52+72)−3×4 (3+1)=6,5

Izrada u minitabu:

15

Page 16: Neparametrijske statističke metode

Friedman Test: Utjecaj versus Katalizator blocked by Dan

S = 6,50 DF = 2 P = 0,039

Sum ofKatalizator N Est Median RanksA 4 81,400 12,0B 4 77,700 5,0C 4 79,300 7,0

Grand median = 79,467

ZAKLJUČAK:

Nakon dobivenih rezultata računski i u minitabu dobili smo da je S = 6,5 što je veće od Skrit. (Skrit.= 5.991 sa slike 1) što zanči da odbacujemo hipotezu H0 i prihvaćamo hipotezu H1 uz vjerojatnost pogreške P= 0,039 (3,9%). Na kraju možemo zaključiti da utjecaj varijable dan daje puno osjetljivij test utjecaja katalizatora na kemijske procese što znači da će utjecaj katalizatora na kemijske procese varirati od dana do dana.

16

Page 17: Neparametrijske statističke metode

5. LITERATURA

1. http://www.stewartschultz.com/statistics/course/Readings/Chi%20kvadarat%20test.pdf

2.Osnovne statističke metode za nematematičare, Boris Petz, SNL 1985.

3. Primijenjena statistika, Nikola Koceić Bilan, PMF Split 2011.

4. Neparametrijski Kruskal-Wallisov test za nezavisne uzorke, Andrea Bosak, PMF Zagreb 2010.

5. www.ffzg.unizg.hr/psiho/stup/skripte/prva/drugis/stat2nepar.doc

6. Hi-kvadrat test i njegove primjene, Ani Grubišić, FER 2004

17