10. predavanje

Embed Size (px)

Citation preview

NEPARAMETRIJSKI TESTOVINeparametrijski testovi se koriste kod atributivnih obeleja. a kod numerikih obeleja se koriste kod malih uzoraka koji nemaju normalan raspored. Tada se varijable ne tretiraju kao brojevi sa kojima su mogue matematike operacije, ve kao rangirani niz. Neparametrijski testovi testiraju razliku izmeu frekvencija ili njihovih rangova unutar skupa. Prednost u odnosu na parametrijske testove je ta to se mogu koristiti i kod malih uzoraka koji nemaju normalan raspored, a nedostatak to imaju manju pouzdanost i manju snagu.

2 TESTTo je jedan od najpoznatijih neparametrijskih testova. Poznat je i pod nazivom Pearson-ov 2 test, jer ga je razradio K. Pearson 1900. godine. 2 testom se izraunava da li postoji statistiki znaajna povezanost u frekvencijama dva atributivna obeleja ili izmeu dobijenih (opaenih) frekvencija i frekvencija koje oekujemo kod odreene hipoteze. Dobijene frekvencije su frekvencije dobijene empirijskim istraivanjem ili eksperimentom. Oekivane frekvencije su teorijskog karaktera ili oekivane na osnovu hipoteze koju elimo da proverimo. Hi kvadrat test se upotrebljava za testiranje znaajnosti razlike izmeu dobijenih (fd) i oekivanih (fo) frekvencija. Definie se formulom: ( f d f o )2 2 = fo Pri izradi ovog testa: - Zbir dobijenih i oekivanih frekvencija mora uvek biti jednak - Zbir razlike dobijenih i oekivanih frekvencija uvek je jednak nuli Ako ova dva uslova nisu ispunjena, postoji negde greka u raunu ili problem nema smisla, nije 2 test adekvatan za taj problem. Vrednost 2 testa ne moe da bude negativna jer ona predstavlja sumu kvadrata. Stepen slobode se izraunava po obrascu: S.S. = (R-1) x (K-1), gde je K - broj kolona, a R broj redova.

1

Tumaenje dobijene vrednosti bazira se na teorijskom 2 rasporedu: a) Raspored je definisan u oblasti od 0 do +, b) Kriva rasporeda nije simetrina, meutim, s poveanjem broja modaliteta posmatranog obeleja (sa poveanjem broja stepena slobode) 2 kvadrat raspored se pribliava normalnom rasporedu, c) Za svaki broj stepeni slobode postoji i odreen 2kvadrat raspored i kritine oblasti prihvatanja ili odbacivanja nulte hipoteze.

S.S.=3 S.S.=4 S.S.=5 S.S.=6

2 0 +

Tumaenje realizovane vrednosti 2 testa vri se na osnovu tablica kritinih vrednosti 2 distribucije (Prilog). Tri su najvanija uslova za primenu 2 kvadrat testa: 1. 2 kvadrat test se izraunava iskljuivo is apsolutnih frekvencija, ili iz podataka ako mogu da se svedu na apsolutne frekvencije; 2. Nijedna od apsolutnih frekvencija ne sme da ima vrednost manju od 5 jedinica i 3. Kada su uzorci manji od 200 jedinica (n1+n20,05 Kako je realizovana 2 vrednost od 6,34 manja od granine tabline vrednosti 2=9,488 za stepen slobode 4 i prag znaajnosti p=0,05, prihvatamo nultu i odbacujemo alternativnu hipotezu za nivo greke p>0,05 i zakljuujemo da se broj pregleda ne razlikuje po radnim danima u nedelji, tj. da je doktor medicine pravilno procenio prosean broj pregleda po radnom danu. U SPSS-u zadatak se radi na sledei nain: Podatke u SPSS obrazac unosimo tako to emo brojevima ifrirati dane: ponedeljak brojem 1, utorak -2, sreda 3, etvrtak 4 i petak - 5. Brojke su nam potrebne jer SPSS nee obraditi podatke oznaene slovima ili reima.Da bi se aktivirao test rasporeda frekvencija treba otvoriti Analyse/Nonparametric tests i u desnom grananju izabere se Chi-Square.2

Nakon toga pojavljuje se sledei prozor: 4

Odabere se varijabla boja i prebaci strelicom na Test Variable List, a zatim se odabere Options i oznai Descriptive.

Klikne se na Continue i OK i u Output-u se dobiju rezultati.

5

U prvoj tabeli su dobijene (Observed N) i oekivane frekvencije (Expected N), a u drugoj vrednst testa (Chi Square) koja je za ovaj primer 2=6,346 i p (Asymp. Sig.) koje je p=0,175.

2. 2 TEST NEZAVISNOSTI

Dva nezavisna uzorka koja se testiraju uzeta su iz jednog skupa i testira se povezanost izmeu dva obeleja. Iz ovoga proizilazi sledea definicija 2 nezavisnosti testira povezanost izmeu dva obeleja jednog skupa. Praktino ceo skup, odnosno uzorak moe da se podeli na dva dela: na grupu jedinica koje imaju i grupu jedinica koje nemaju neko obeleje. Ako se ta dva obeleja mogu klasifikovati u dva modaliteta, dobijamo sledei odnos:

Navedeni odnosi dva obeleja jednog uzorka, sa po dva modaliteta, prikazuju se tabelom kontigencije 2x2, u dva reda i dve kolone. Koji modaliteti se prikazuju u redovima, a koji u kolonama, zavisi od metoda i naina ispitivanja i studije.

6

Observacione ili retrospektivne studije, u kojima se polazi od bolesti (posledice) pa ide prema ekspoziciji (uzroku bolesti). Kod ovih studija tabela kontigencije 2x2 ima sledei opti oblik:rizik faktor (ekspozicija) eksponirani neeksponirani ukupno stanje zdravlja oboleli a c a+c zdravi b d b+d a+b c+d a+b+c+d=N ukupno

Radna hipoteza: Prevalencija oboljenja je vea meu onima koji su bili eksponirani, odnosno frekvencija eksponiranih i obolelih (a) je znaajno vea od frekvencije neeksponiranih, a obolelih (c). Prospektivne studije polaze od uzroka (faktora rizika) pa idu prema posledici (bolesti). Kod ovih studija tabela kontigencije ima oblik:

stanje zdravlja oboleli nisu oboleli ukupno

uzrok - ekspozicija eksponirani a c a+c neeksponirani b d b+d

ukupno a+b c+d N=a+b+c+d

Radna hipoteza: Oekuje se da prevalenca oboljenja bude znatno vea kod eksponiranih, odnosno frekvencija obolelih- eksponiranih (a) je znaajno vea od frekvencije obolelihneeksponiranih (c). Odgovor na pitanje, da li je frekvencija eksponiranih i obolelih vea od frekvencije obolelih a neeksponiranih, kod obe studije daje nam 2 test. U stvari 2 test daje odgovor na pitanje da li postoji asocijacija izmeu ekspozicije (rizik faktora) i nekog oboljenja. Primer 2. Da li postoji veza izmeu puenja i raka plua? Od 500 sluajno izabranih pacijenata, 85 je imalo karcinom plua, a od ovih 75 su bili puai. Kod 415 pacijenata bez karcinoma plua, bilo je 150 puaa. Ho: Izmeu puenja i raka plua ne postoji povezanost Ha: Izmeu puenja i raka plua ne postoji povezanost

7

Podatke predstavimo u vidu tabele kontigencije 2x2:puenje da ne ukupno Ca plua 75 a 10 c 85 (a+c) zdravi 150 b 265 d 415 (b+d) ukupno 225 (a+b) 275 (c+d) 500

Dobijene frekvencije su frekvencije ve date u zadatku: za puae obolele od Ca plua (a), zdrave puae (b), nepuae obolele od Ca plua (c) i zdrave nepuae (d). Oekivane frekvencije se raunaju tako to se proizvod ukupnog zbira kolona i ukupnog zbira reda deli sa ukupnom veliinom uzorka (N):

fo =

K RN

ili f o =

( a + c ) ( a + b) , a+b+c+d

gde je K kolona, R red, a N veliina uzorka.

85 225 = 38,25 500 415 225 = 186,75 fopuai bez Ca plua (b) = 500 85 275 fonepuai sa Ca plua (c)= = 46,75 500 415 275 fonepuai bez Ca plua (d) = = 228,25 500fopuai sa Ca plua (a) =

Kada smo izraunali oekivane frekvence, pristupimo izraunavanju vrednosti 2 testa:

fd

fo

fd fo

( fd

fo )

2

( fd

fo ) fo

2

puai sa Ca plua puai bez Ca plua nepuai sa Ca plua nepuai bez Ca plua

75 150 10 265 500

38,25 186,75 46,75 228,25 500

36,75 -36,75 -36,75 36,75 0

1350,56 1350,56 1350,56 1350,56

35,31 7,23 28,89 5,92 2 =77,35

8

Stepen slobode se odreuje po formuli: S.S. = (K-1)x(R-1). Kod tabele kontigencije 2x2, broj stepena slobode jednak je 1 jer je: (2-1)x(2-1) = 1. Za stepen slobode 1 i p = 0,05 u tablici 2 rasporeda oitavamo graninu tablinu vrednost 2 = 3,841. 2 = 77,35> 2(1 i 0,05)= 3,841 i p 0,337 pa moemo da tvrdimo da postoji dosta visok stepen korelacije ili asocijacije izmeu puenja i raka plua.

U SPSS-u to izgleda ovako: Otvori se Analyse/Descriptive Statistics/ Crosstabs.

Klikne se na Crosstabs i otvori se sledei prozor:

10

U redove (Row(s)) se prebaci dihotoma varijabla puenje. U drugi prozor Column(s) prebaci se druga dihotoma varijabla Ca. Otvori se Statistics i oznai se Chi-Square.

Izda se naredba Continuae i OK. U Outputu se dobiju rezultati.

11

Druga tabela je tabela kontigencije 2x2 sa ukrtenim modalitetima obeleja. U treoj tabeli u redu Pearson Chi-Square su vrednosti 2 testa Value koja iznosi 77,347 i p - Asymp. Sig. (2sided) za koje je u tabeli Output-a SPSS-a izbacio vrednost 0,000. U tom sluaju u rezultatima se pie da je p0,05 Kako je realizovana, tj. osnovna 2 vrednost od 0,55 manja od granine tabline vrednosti, 2=3,841, za broj stepeni slobode 1 i prag znaajnosti od p=0,05, prihvatamo nultu i odbacujemo alternativnu hipotezu i zakljuujemo da ne postoji statistiki znaajna razlika u broju postoperativnih komplikacija bolesnika operisanih u Niu i Beogradu, tj. uzorci se ponaaju kao da pripadaju istom osnovnom skupu.MANTEL HAENZEL-ov 2 TEST

Dva autora, Mantel i Haenzel, razradili su tehniku izraunavanja 2 testa direktno iz izvornih podataka tabele kontigencije 2x2. Njegova primena se preporuuje se kod uzoraka manjih od 200 jedinica. Prednost primene ovog naina izraunavanja je u tome to razraena formula automatski obuhvata i Yates-ovu korekciju. Za primer 3 izraunali bi smo ga na sledei nain:

=2

(a + b ) (c + d ) (a + c ) (b + d )

[ a d b c 0,5N ]

2

N

= 75,26

Dobijena je neto manja vrednost (dobijeni 2 test bez korekcije je bio 77,35) jer pri prvom metodu izraunavanja na osnovu razlika dobijenih i oekivanih frekvencija nije bila ukljuena Yates-ova korekcija.FISCHER-ov TEST TANE VEROVATNOE

Fisherov test se primenjuje kod tabela kontigencije 2x2, kod nezavisnih uzoraka kada se vrednosti obeleja mogu da prikau dihotomno tj. kada i ekspoziciju (uzrok) i bolest ili neko drugo stanje (posledicu) moemo da prikaemo sa "da" i "ne. Prednost ovog testa ogleda se u tome to on moe da se primeni i kada je u pojedinim elijama" frekvenca manja od 5 jedinica ili jednaka nuli. O tome vodi rauna aplikacija statistikog programa. Izraunava se direktno p vrednost za procenu verovatnoe greke tvrdnje da izmeu frekvencija ima razlike. 14

Fisher-ov test tane verovatnoe je u sutini jednostran. Nije jasno ta bi bila odgovarajua odstupanja u drugom pravcu, posebno kada su sve marginalne uklupne vrednosti razliite. Ovo je zato to je u tom sluaju raspodela asimetrina. Jedno reenje je da se udvostrui jednostrana verovatnoa da bi dobili dvo-strani test kada je to potrebno. Armitage Berry (1994) preferiraju ovu opciju. Drugo reenje je da se izraunaju verovatnoe za svaku moguu tabelu i da se saberu sve verovatnoe manje od ili jednake verovatnoi za posmatranu tabelu da bi dale P vrednost. Ovo moe dati manju P vrednost od metode dupliranja (doubling method).

p=

(a + b )!(c + d )!(a + c )!(b + d )! a!b!c!d !( N )!

Na taj nain, za razliku od 2 testa gde prvo raunamo vrednost 2 pa na osnovu nje za odreen broj stepena slobode i granine vrednosti utvrujemo koliko je p, kod Fierovog testa nema svih tih koraka u izraunavanju, ve se odmah dobije kolika je vrednost p. Ukoliko je: p>0,05, prihvatamo hultu i odbacujemo alternativnu hipotezu, p0,05, odbacujemo nultu i prihvatamo alternativnu hipotezu. Primer 4. Od 8 onkolokih bolenika, 4 je leeno jednom, a 4 drugom terapijom. Od 4 bolesnika leenih terapijom A umro je 1 bolesnik, a od 4 bolesnika leenih terapijom B umrla su 2 bolesnika. Da li postoji signifikantna razlika u ishodu lenja izmeu ove dve terapije? Prvo pravimo tabelu kontigencije: tetapija A B ukupno preiveli 3 2 5 umrli 1 2 3 ukupno 4 4 8

Zatim postavljamo hipoteze: Ho: Nije postojala signifikantna povezanost izmeu vrste terapije i ishoda leenja. Ha: Postojala je signifikantna povezanost izmeu vrste terapije i ishoda leenja.p=

(3 + 1)!(2 + 2)!(3 + 2)!(1 + 2)! =0,107 3!1!2!2!8!

Kako je p=0,107 vee od 0,05, prihvatamo nultu i odbacujemo alternativnu hipotezu i zakljuujemo da nije postojala signifikantna povezanost izmeu vrste terapije i ishoda leenja. Fisher-v test tane verovatnoe je prvobitno osmiljen za 2x2 tabelu i korien je samo kada su oekivane uestalosti bile male. To je zato to su za vee brojeve i vee tabele prorauni bili nepraktini. Sa raunarima stvari su se promenile i Fisher-ov test tane verovatnoe moe da se uradi za bilo koju 2x2 tabelu. Neki programi e takoe izraunati Fisher-ov test tane verovatnoe za vee tabele, dok se broj redova i kolona poveava, broj moguih tabela raste vrlo 15

brzo i postaje neizvodljivo da se izrauna i sauva verovatnoa za svaku od njih. Postoje specijalni programi kao to je StatExact koji prave sluajni uzorak moguih tabela i koriste ih za procenu raspodele verovatnoa. Metode koje uzorkuju mogunosti na ovaj nain zovu se Monte Carlo metode. Bilo je mnogo sporova izmeu statistiara o validnosti testa tane verovatnoe i korekciji kontinuiteta koji ga aproksimira. Problem je i dalje nereen, a diskusija o ovom problemu je van domaaja ove knjige. Za neke sluajeve Fisher-ov test tane verovatnoe i Yates-ova korekcija mogu biti konzervativni, odnosno dati veu verovatnou nego to bi trebalo, mada je ovo stvar rasprave. Stav autora ove knjige je da Yates-ovu korekciju i Fisher-ov test tane verovatnoe treba koristiti.

Mc NEMAR-ov TEST

Mc Nemar-ov test je u stvari 2 test za dva zavisna uzorka. Njime se utvruje da li postoji povezanost izmeu dihotomnih obeleja dva zavisna uzorka. Zavisnost podrazumeva bilo iste jedinice posmatranja u dva vremena (pre i posle nekog tretmana) ili iste jedinice posmatranja podvrgnute dejstvu dva razliita tretmana. Obeleja tablice kontigencije su prvo i drugo vreme ili prvi i drugi tretman. Podaci koji se posmatraju mogu biti i parametrijski ali heterogeni. Primenjuje se na tablice kontigencije 2x2 koja se odnosi na zavisne uzorke. Ishodi u tablici su specifino organizovani:

drugo obeleje pozitivno negativno ukupno a c

prvo obeleje pozitivno negativno b d b+d

ukupno a+b c+d N=a+b+c+d

a+c

Ivini zbirovi nisu bitni za Mc Nemar test. U izraunavanju se koriste one uestalosti u kojima se ogleda razlika u dejstvu faktora. U kontigencijskoj tablici je vidljivo da se dobijene razlike nalaze u elijama b i c. Empirijska vrednost Mc Nemar-ovog testa dobija se preko 2 testa:

16

2 =

([b c] 1)2b+c

Stepeni slobode se izraunavaju kao kod 2 testa: S.S. = (K-1)x(R-1). Tumaenje realizovane vrednosti 2 testa vri se na osnovu tablica kritinih vrednosti 2 distribucije. Uslovi za primenu Mc Nemar testa: 1. Ne moe se primeniti ako je neka od validnih uestalosti manja od 5. 2. Yates-ova korekcija se primenjuje kada je a+d0,05 Kako je realizovana 2McN vrednost od 3,02 vea od granine tabline vrednosti, 2=3,841, za broj stepeni slobode 1 i prag znaajnosti od p=0,05, to prihvatamo nultu i odbacujemo alternativnu hipotezu jer je greka p>0,05 i zakljuujemo da ne postoji statistiki znaajna razlika izmeu dijagnostikih metoda I i II

17

U SPSS-u se zadatakl radi na sledei nain: Otvori se Analyse/Nonparametric Tests i u desnom grananju 2 Related Saples:

Kada se otvori 2 Related Samples pojavi se sledei prozor:

Sa leve na desnu stranu treba prebaciti varijable koje se ukrtaju, a to su DgI za prvu dijagnostiku metodu i DgII za drugu. Zatim se odabere Mc Nemar.

18

Izda se nalog OK i dobiju rezultati:

Prva tabela je tabela kontigencije, a rezultati su u drugoj tabeli i to vrednost testa u redu ChiSquare, odakle se ita 2McN= 3,015, a vrednost p u redu Asymp. Sig, koje je p=0,082.

19

ADITIVNO DEJSTVO 2 TESTA

Aditivno dejstvo 2 testa znai da je mogue sabrati vei broj vrednosti 2 testa (pri emu se sabiraju i stepeni slobode) za istu pojavu i na osnovu tog zbira zakljuiti o znaajnosti razlike. Primer 6. Dejstvo vakcine protiv gripa ispitano je u Niu, Kragujevcu, Beogradu i Novom Sadu i dobijene su sledee vrednosti za 2 test: naselje Ni Kragujevac Beograd Novi Sad vrednost 2 2,64 2,38 4,46 2,93 12,41 S.S. 1 1 1 1 4

Za svaki grad ponaosob rezultat je vezan za jedan stepen slobode i na nivou znaajnosti od p = 0,05. Tablina vrednost 2 iznosi 3,841. Prema tome, statistiki je znaajan samo rezultat u Novom Sadu. Kako u ostalim Gradovima nemamo znaajnost, to nemamo dovoljno dokaza ni za prihvatanje ni za odbacivanje nulte hipoteze. Meutim, kako zbir svih vrednosti 2 iznosi 12,41 i za 4 stepeni slobode, na nivou znaajnosti od p=0,05 ovaj rezultat ukazuje na znaajnost razlike, jer je: 2 = 12,41 > 2(4 i 0,05)= 9,49 i p