Upload
hatu
View
220
Download
0
Embed Size (px)
Citation preview
11/21/2012
1
TESTIRANJE ZNAČAJNOSTI RAZLIKE
Ass. dr Zoran Bukumirić Beograd, 2012
Z-TEST I T-TEST
Z-TEST I T-TEST
z-testom i Studentovim t-testom testiramo razliku:
jedne aritmetičke sredine i pretpostavljene vrednosti
dve aritmetičke sredine
dva nezavisna uzorka
dva zavisna uzorka
11/21/2012
2
Z-TEST I T-TEST
Pretpostavke za izvođenje:
obe varijable koje se testiraju moraju biti numeričke
normalna raspodela ili aproksimacija normalne raspodele (CV<30%) obe varijable
PROCEDURA TESTIRANJA HIPOTEZA
1. Formulisati nultu i alternativnu hipotezu
2. Odrediti nivo značajnosti (α-nivo)
3. Odabrati odgovarajući test
4. Izračunati empirijsku vrednost testa (statistika testa) na osnovu primenjene formule
5. Odrediti teorijsku vrednost testa (oblast odbacivanja) tj. granične vrednosti
6. Doneti statistički zaključak
11/21/2012
3
Formulisati Odrediti Odabrati Izračunati empirijsku Odrediti teorijsku Statistički H0 i H1 nivo značajnosti test vrednost testa vrednost testa zaključak
Nulta hipoteza , ne postoji razlika aritmetičkih sredina:
H0: μ1 = μ2
Alternativna (radna) hipoteza
-dvostrana hipoteza , postoji razlika aritmetičkih sredina bez obzira na smer razlike: H1: μ1 ≠ μ2
-jednosmerna hipoteza , postoji razlika aritmetičkih sredina u jednom smeru tj. da jedna veća od druge: H1: μ1 < μ2 H1: μ1 > μ2
Nivo značajnosti (α-nivo) je maksimalna verovatnoća greške I tipa koju je istraživač
spreman da prihvati u svom istraživanju.
α-nivo je najčešće 0,05 ili 0,01.
Formulisati Odrediti Odabrati Izračunati empirijsku Odrediti teorijsku Statistički H0 i H1 nivo značajnosti test vrednost testa vrednost testa zaključak
11/21/2012
4
MALI UZORCI n ≤ 30 t-test
VELIKI UZORCI n > 30 z-test
Formulisati Odrediti Odabrati Izračunati empirijsku Odrediti teorijsku Statistički H0 i H1 nivo značajnosti test vrednost testa vrednost testa zaključak
NEZAVISNI UZORAK Jedinice u jednom uzorku su različite i nezavisne od jedinica u drugom uzorku. Jedinica posmatranja može biti samo u jednom uzorku.
ZAVISNI UZORAK Jedinice jednog uzorka povezane su sa jedinicama drugog uzorka. Ponovljena merenja na istim jedinicama posmatranja (pre i posle)
Izračunati empirijsku vrednost testa (statistika testa) na osnovu primenjene formule.
Formulisati Odrediti Odabrati Izračunati empirijsku Odrediti teorijsku Statistički H0 i H1 nivo značajnosti test vrednost testa vrednost testa zaključak
11/21/2012
5
Formulisati Odrediti Odabrati Izračunati empirijsku Odrediti teorijsku Statistički H0 i H1 nivo značajnosti test vrednost testa vrednost testa zaključak
Odrediti teorijsku vrednost testa iz tablica. Teorijska vrednost testa je maksimalna vrednost testa za koju još uvek važi H0.
zt – teorijska vrednost z-testa Određuje se na osnovu: jednosmerne ili dvosmerne H1
nivoa značajnosti (α-nivo)
Nivo značajnosti
0,05 0,01
Dvosmerno testiranje 1,96 2,58
Jednosmerno testiranje 1,64 2,33
Formulisati Odrediti Odabrati Izračunati empirijsku Odrediti teorijsku Statistički H0 i H1 nivo značajnosti test vrednost testa vrednost testa zaključak
t-test Određuje se iz tablica t raspodele na osnovu: jednosmerne ili dvosmerne H1
nivoa značajnosti (α-nivo) broja stepena slobode (DF)
za dvosmernu H1
α-nivo od 0,05 DF=9
Stepen slobode
jednosmerno testiranje (verovatnoća rizika)
0,05 0,025 0,01 0,005
dvosmerno testiranje (verovatnoća rizika)
0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,500 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
Stepen slobode
jednosmerno testiranje (verovatnoća rizika)
0,05 0,025 0,01 0,005
dvosmerno testiranje (verovatnoća rizika)
0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,500 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
Stepen slobode
jednosmerno testiranje (verovatnoća rizika)
0,05 0,025 0,01 0,005
dvosmerno testiranje (verovatnoća rizika)
0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,500 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
Stepen slobode
jednosmerno testiranje (verovatnoća rizika)
0,05 0,025 0,01 0,005
dvosmerno testiranje (verovatnoća rizika)
0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,500 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
tt=2,262
11/21/2012
6
Poređenje empirijske i teorijske vrednosti metoda.
Ako je empirijska vrednost testa u oblasti odbacivanja odbaciti nultu i prihvatiti alternativnu hipotezu. U protivnom, zadržati nultu hipotezu.
te > tt H1 p<0,05
te < tt H0 p>0,05
Formulisati Odrediti Odabrati Izračunati empirijsku Odrediti teorijsku Statistički H0 i H1 nivo značajnosti test vrednost testa vrednost testa zaključak
ze > zt H1 p<0,05
ze < zt H0 p>0,05
Testiranje značajnosti razlike aritmetičkih sredina – jedan uzorak
Testiramo nultu hipotezu da je aritmetička sredina populacije jednaka nekoj specifikovanoj vrednosti:
H0 : = 0
- nepoznata aritmetička sredina populacije iz koje potiče uzorak,
0 -specifikovana vrednost koja je pretpostavljena na osnovu ranijih istraživanja ili teorijskog modela.
11/21/2012
7
Testiranje značajnosti razlike aritmetičkih sredina – jedan uzorak
z-test veliki uzorak (n>30) poznata varijansa populacije (SD2)
t-test mali uzorak (n≤30) nije poznata varijansa populacije (SD2)
n
SD
Xx
SE
Xxz
x
- aritmetička sredina uzorka x
-standardna greška aritmetičke sredine populacije n
SDSEx
- specifikovana vrednost populacije X
n
sd
Xx
SE
Xxt
x
Pretpostavke za izvođenje:
slučajno biran uzorak
numerički kontinuirani podaci
normalna raspodela u populaciji
Testiranje značajnosti razlike aritmetičkih sredina – jedan uzorak
11/21/2012
8
Testiranje značajnosti razlike aritmetičkih sredina – jedan uzorak
Primer 1: Ispitivana je telesna masa na rođenju u jednoj opštini u toku jedne godine. Aritmetička sredina slučajnog uzroka, veličine 50, iznosila je 3530 g. Prethodna istraživanja ukazivala su na aritmetičku sredinu 3550 g, i standardnu devijaciju SD=149g.
Da li se može reći da je došlo do promene telesne mase na rođenju?
Testirati na nivou značajnosti od 0,05.
H0: μ = 3550g
H1: μ ≠ 3550g
α-nivo = 0,05
poznata SD2 populacije
n>30
948,01,21
20
50
149
35503530
z
ze < zt H0 p>0,05
ze = 0,948
zt =1,96
Zaključak: Dobijena zed vrednost (0,948) je manja od teorijske (1,96), za dvosmerno testiranje i nivo značajnosti 0,05, pa prihvatamo H0 i zaključujemo da nije došlo do značajne promene telesne mase na rođenju u poslednjoj godini u odnosu na protekli period (p>0,05).
xSE
Xxz
Testiranje značajnosti razlike aritmetičkih sredina – jedan uzorak
11/21/2012
9
Testiranje značajnosti razlike aritmetičkih sredina – dva nezavisna uzorka
Testiramo nultu hipotezu da su aritmetičke sredine osnovnih skupova iz kojih su dobijeni uzorci jednake
H0 : 1 = 2
Uslovi za testiranje:
normalnost podataka
jednakost varijansi
nezavisnost uzoraka
Testiranje značajnosti razlike aritmetičkih sredina – dva nezavisna uzorka
z-test SD2 u populaciji poznate uzorci veliki ili mali
t-test za dva nezavisna uzorka SD2 u populaciji nepoznate uzorci mali (n ≤ 30)
z-test SD2 u populaciji nepoznate uzorci veliki (n > 30)
2
2
2
1
2
1
21
n
SD
n
SD
xxz
2
2
2
1
2
1
21
n
sd
n
sd
xxz
2121
2
22
2
11
21
11
2
)1()1(
nnnn
sdnsdn
xxt
221 nnDF
11/21/2012
10
Primer 2: Dve grupe lečene su tretmanima A i B. Sedimentacija eritrocita (mm/h) ispitanika u istraživanju iznosi:
Tretman A: 15 17 20 14 19 17 18 19
Tretman B: 16 14 17 15 18 17 16
Da li se ova dva tretmana razlikuju prema sedimentaciji eritrocita?
Testirati na nivou značajnosti od 0,05.
Poznato je da ispitivana varijabla ima normalnu raspodelu u populaciji.
Testiranje značajnosti razlike aritmetičkih sredina – dva nezavisna uzorka
Tretman A Tretman B
15 -2,38 5,66 16 -0,14 0,02
17 -0,38 0,14 14 -2,14 4,58
20 2,62 6,86 17 0,86 0,74
14 -3,38 11,42 15 -1,14 1,30
19 1,62 2,62 18 1,86 3,46
17 -0,38 0,14 17 0,86 0,74
18 0,62 0,38 16 -0,14 0,02
19 1,62 2,62
Σ 139 28,88 113 10,86
38,178
139
1
1
1
n
xx
14,167
113
2
2
2
n
xx
27,4
7
88,29
11
2
112
1
n
xxsd
81,1
6
86,10
12
2
222
2
n
xxsd
35,1
7
1
8
1
278
81.1)17(27.4)18(
14,1638,17
11
2
)1()1(
2121
2
22
2
11
21
nnnn
sdnsdn
xxt
211 xx 222 xx 11 xx 22 xx 1x 2x
Testiranje značajnosti razlike aritmetičkih sredina – dva nezavisna uzorka
11/21/2012
11
za dvosmerna H1
α-nivo od 0,05 DF=13 tt=2,160
Stepen slobode
jednosmerno testiranje (verovatnoća rizika)
0,05 0,025 0,01 0,005
dvosmerno testiranje (verovatnoća rizika)
0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,500 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169 11 1,796 2,201 2,718 3,106 12 1,782 2,179 2,681 3,054 13 1,771 2,160 2,650 3,012
Testiranje značajnosti razlike aritmetičkih sredina – dva nezavisna uzorka
te < tt H0 p>0,05
te = 1,35
tt =2,160
Zaključak: Dobijena t statistika (1,35) manja je od granične (2,160) za dvosmerno testiranje, DF=13 i nivo značajnosti 0,05. Zaključujemo da između ispitanika na tretmanima A i B ne postoji statistički značajna razlika prema sedimentaciji eritrocita (t=1,351; DF=13; p>0,05).
H0: A = B
H1: A B
α-nivo = 0,05
Testiranje značajnosti razlike aritmetičkih sredina – dva nezavisna uzorka
11/21/2012
12
Testiranje značajnosti razlike aritmetičkih sredina – dva zavisna uzorka
Test je zasnovan na razlici opservacija pre-posle ili razlici mečovanih opservacija.
Testiramo nultu hipotezu da je aritmetička sredina razlika pre-posle jednaka 0.
H0 : d = 0
Uslovi za testiranje:
normalnost podataka
jednakost varijansi
zavisni uzorci
Primer 3: Deset bolesnika od hronične opstruktivne bolesti pluća praćeno je u toku 5 godina. Date su vrednosti vitalnog kapaciteta pluća (mL) na početku i kraju tog perioda:
Prvo merenje:
2960 2820 2990 3050 2670 2900 3180 3220 3490 2890
Drugo merenje:
2700 2640 2920 2850 2580 2790 2810 2970 2750 2680
Da li je došlo do promene vitalnog kapaciteta u posmatranom periodu?
Testirati na nivou značajnosti od 0,05.
Testiranje značajnosti razlike aritmetičkih sredina – dva zavisna uzorka
11/21/2012
13
prvo
merenje
drugo
merenje
x1 x2 d=x2-x1 d2
2960 2700 –260 67600
2820 2640 –180 32400
2990 2920 –70 4900
3050 2850 –200 40000
2670 2580 –90 8100
2900 2790 –110 12100
3180 2810 –370 136900
3220 2970 –250 62500
3490 2750 –740 547600
2890 2680 –210 44100
Σ -2480 956200
)110(1010
6150400956200
248
)1(
2
2
nnn
dd
dt
91101 nDF
24810
2480
n
dd
028,4
Testiranje značajnosti razlike aritmetičkih sredina – dva zavisna uzorka
dvosmerna H1
za α-nivo od 0,05 DF=9 tt=2,262
Stepen slobode
jednosmerno testiranje (verovatnoća rizika)
0,05 0,025 0,01 0,005
dvosmerno testiranje (verovatnoća rizika)
0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,500 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169 11 1,796 2,201 2,718 3,106 12 1,782 2,179 2,681 3,054 13 1,771 2,160 2,650 3,012
Testiranje značajnosti razlike aritmetičkih sredina – dva zavisna uzorka
11/21/2012
14
te > tt H1 p<0,05
te = 4,028
tt = 2,262
Zaključak: Dobijena statistika t-testa (4,028) je veća od granične vrednosti (2,262) za dvosmerno testiranje, DF = 9 i nivo značajnosti od 0,05. Došlo je do značajnog smanjenja vitalnog kapaciteta u posmatranom periodu (t = 4,028; DF=9; p<0,05).
H0: d = 0
H1: d 0
α-nivo = 0,05
Testiranje značajnosti razlike aritmetičkih sredina – dva zavisna uzorka
Zadatak1: Deset dijabetičara je pre terapije imalo sledeće vrednosti glikemije:
14,99 12,21 9,38 16,99 6,44 10,66 17,98 13,10 9,21 6,16 mmol/L
Posle odgovarajuće terapije kod istih bolesnika vrednost šećera u krvi iznosila je:
10,05 8,22 7,33 10,49 9,44 6,99 11,27 7,16 5,83 8,88 mmol/L
Da li je terapija uspešno delovala?
Testirati na nivou značajnosti od 0,05.
Zadatak 1
11/21/2012
15
Pre
terapije
Posle
terapije
x1 x2 d=x2-x1 d2
14,99 10,05 -4,94 24,40
12,21 8,22 -3,99 15,92
9,38 7,33 -2,05 4,20
16,99 10,49 -6,5 42,25
6,44 9,44 3,00 9,00
10,66 6,99 -3,67 13,47
17,98 11,27 -6,71 45,02
13,1 7,16 -5,94 35,28
9,21 5,83 -3,38 11,42
6,16 8,88 2,72 7,40
Σ - - -31,46 208,36
91101 nDF
146,310
46,31
n
dd
)1(
2
2
nnn
dd
dt
854,2
215,1
146,3
)110(1010
31,46-36,208
146,32
Zadatak 1
dvosmerna H1
za α-nivo od 0,05 DF=9 tt=2,262
Stepen slobode
jednosmerno testiranje (verovatnoća rizika)
0,05 0,025 0,01 0,005
dvosmerno testiranje (verovatnoća rizika)
0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,500 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169 11 1,796 2,201 2,718 3,106 12 1,782 2,179 2,681 3,054 13 1,771 2,160 2,650 3,012
Zadatak 1
11/21/2012
16
te > tt H1 p<0,05
te = 2,854
tt = 2,262
Zaključak: Dobijena statistika t-testa (2,854) je veća od granične vrednosti (2,262) za dvosmerno testiranje, DF = 9 i nivo značajnosti od 0,05. Došlo je do značajnog smanjenja glikemije nakon primene terapije (t = 2,854; DF=9; p<0,05).
H0: d = 0
H1: d 0
α-nivo = 0,05
Zadatak 1