Upload
others
View
8
Download
1
Embed Size (px)
Citation preview
1
Statistično
zaključevanje
Anja PodlesekMagistrski študij Kognitivna znanost, Uvod v statistiko
Vzorčne porazdelitve
2
Vzorčne porazdelitve
3
2
Vzorčne porazdelitve
4
� Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo.
vzorčne porazdelitve statistik� opisnih statistik vzorca, npr. M, var, p, r…� drugih izrazov, npr.
� Vsako vzorčno porazdelitev lahko opišemo: Mstatistike
SD = SEstatistike
21
21
MMSE
MM
−
−
Vzorčne porazdelitve
5Mstatistike
SEstatistike
M
SD
frekvenčna porazdelitev spremenljivke
vzorčna porazdelitev statistike
Vzorčne porazdelitve različnih statistik se razlikujejo:z, F, t, χ2 porazdelitve
Vzorčne porazdelitve
6Mstatistike
SEstatistike
M
SD
frekvenčna porazdelitev spremenljivke
vzorčna porazdelitev statistikeza manjše/večje vzorce
Če je vzorec velik, bo statistika vzorca bolj podobna parametru. Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša.
teoremcentralnelimite
http://onlinestatbook.com/simulations/CLT/clt.html
3
Standardne napake
7
NSEMX
'σσ ==
SEM = standardni odklon vzorčniharitmetičnih sredin
= standardna napaka oceneµ
NSE
2
σσ =SE
p p
Np =−( )1
Standardna napaka se z večanjem vzorca manjša.
Standardne napake
8
( ) ( )
1 2
1 2
1 2
1 2
1 2
2 21 2
1 2
1 2
1 1 2 2
1 2
1 1
1
3r
M M
M M
M M
p p
z
SEn n
SEn n
SEN
µ µ µ
σ σ
µ π π
π π π π
−
−
−
−
= −
= +
= −
− −= +
=−
Razlike med sredinami
Razlike med proporci
Korelacijski koeficienti
Statistično zaključevanje
9
Izberemo vzorec. Določimo statistiko (npr. M).Posplošujemo z vzorca na populacijo.
� ocenjevanje parametraVprašanje: Kolikšen je parameter (µ) v populaciji?
� testiranje hipotezVprašanje: Ali je M pomembno različna od nekevrednosti?
4
Ocenjevanje parametra
10
Ocenjevanje parametra
11
Vzorčna statistika je ocena populacijskega parametra.
Točkovna ocena parametra� nepristranska ocena -
sredina vzorčne porazdelitve statistikeje enaka ocenjevanemu parametru; velja za vse mere centralne tendence, deleže, korelacijske koeficiente
� pristranska ocena -mere razpršenosti
Intervalna ocena parametra� razpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z
določeno verjetnostjo = interval zaupanja
( )
( )1
2
2'
2
2
−−
=
−=
∑
∑
N
XX
N
XXSD
σ
Ocenjevanje parametra
12
µsp µzg
(npr. 90 % interval zaupanja pri α = 0,10)interval zaupanja
p = α / 2α / 2
1 - α
SEM
µ
Intervalna ocena parametrarazpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z določeno verjetnostjo
SEM · zp
grafični prikaz kvantilov
5
Ocenjevanje parametra
13
Splošno intervalno ocenjevanje parametrov pri velikih vzorcih
Gp SEzG ⋅±Gpop
SEG
vzorčna porazdelitev G je N.D.
Gvz
0
1N (0,1)vz pop
pG
G Gz
SE
−=
z
Ocenjevanje parametra
14
Intervalno ocenjevanje Mpri velikih vzorcih
Mµ pz SE± ⋅µ
SEM
vzorčna porazdelitev M je N.D.
M
0
1N (0,1)
M
µp
Mz
SE
−=
z
15
µsp µzg
p = α / 2α / 2
1 - α
SEM
µ
vzorčna porazdelitev M
α / 2
M
kk SE
zµµ −=
vzorčna porazdelitev z
zsp zzg
p = α / 2
1 - α
SDz = 1
µz = 0
SDz · zp
SEM · zp
M
zgzg
Mzgzg
SEz
SEz
µµµµ
−=
⋅+=
6
Ocenjevanje parametra
16
Pri majhnih vzorcih
µ
SEM
Vzorčna porazdelitev M je N.D. le, če je frekvenčna porazdelitev spremenljivke normalna.
preveriti
Vrednost SEM se spreminja z velikostjo vzorca. Vzorčna porazdelitev je odvisna odstopenj prostosti.
0
1
Mp SE
Mt
µ−=
Xp SEtX ⋅±Interval zaupanja za µ:
df = N - 1
Ocenjevanje parametra
17
2
2)1(
p
XN
χσ− df = N - 1
sp. meja: zg. meja:
χ21-p χ2
p
2
22 ˆ)1(
σσχ −= N
Xp SEtX ⋅±Interval zaupanja za µ
Interval zaupanja za σ
21
2)1(
p
XN
−
−χ
σ
df = N - 1
Testiranje hipotez
18
� Postavimo dve nasprotni si hipotezi (ničelno in alternativno).H0: V našem vzorcu je povprečni IQ enak 100
(oz. naš vzorec izhaja iz populacije, kjer je povprečni IQ enak 100).H1: V našem vzorcu je povprečni IQ različen od 100.
(oz. naš vzorec ne izhaja iz populacije, kjer je povprečni IQ enak 100).
� Konstruiramo vzorčno porazdelitev(pod predpostavko pravilnostiničelne hipoteze).
0
100
SE
odvisna od velikosti vzorca
odvisna odrazpršenosti v populaciji
1t
7
Če je vrednost statistike verjetna(se nahaja znotraj intervalazaupanja okrog vrednosti ničelnehipoteze), ničelno hipotezoohranimo.
Testiranje hipotez
19
Če je vrednost višja/nižja od zgornje/spodnjemeje intervala zaupanja (pade v kritičnoregijo), ničelno hipotezo zavrnemo. (Pravilnost ničelne hipoteze je malo verjetna. Alternativnahipoteza je verjetnejša. Statistika našega vzorca se odpoznanega / predpostavljenega parametra pomembno
razlikuje.)
Na osnovi vzorčne porazdelitve poznamo verjetnost pojavljanja določene vrednosti statistike.
0
1
tM tM0
1
Testiranje hipotez
20
µ
SEM
M
H0: µ’ = µH1: µ’ ≠ µ
0
1
t
Mp SE
Mt
µ−=t > tkrit.tkrit.tkrit.
H0: Μ = µH1: Μ ≠ µ
Testiranje hipotez
21
H0: µ1 - µ2 = 0H1: µ1 - µ2 ≠ 0
H0: µ’ = µH1: µ’ ≠ µ
H0: µ’ - µ = 0H1: µ’ - µ ≠ 0
H0: ρ = 0H1: ρ ≠ 0
H0: µ1 = µ2
H1: µ1 ≠ µ2 21
)()( 2121
MMp
Mp
SE
MMt
SE
Mt
−
−−−=
−=
µµ
µ
H0: σ’ = σH1: σ’ ≠ σ
H0: σ1 = σ2
H1: σ1 ≠ σ2 22
21
2
22 ˆ)1(
σσ
σσχ
=
−=
F
N
H0: ρ1 - ρ2 = 0H1: ρ1 - ρ2 ≠ 0
r
zrzz
r
Nrt
σµ−=
−−=
21
2
8
Ocenjevanje parametra
vs. testiranje hipotez
22
zG
1
zkritzkrit0
0
1
zG
zG > zkrit.zkritzkrit
Napake pri statističnem zaključevanju
23
ρ = 0Gvz= Gpop
ρ ≠ 0Gvz ≠ Gpop
dejanskostanje
naš zaključek
pravilna potrditev ničelne hipoteze
α napaka
pravilna zavrnitev ničelne hipoteze
β napaka
ρ ≠ 0Gvz ≠ Gpop
ρ = 0Gvz= Gpop
24
z
G
popvzp SE
GGz
−=
zkrit.zkrit.
α napaka
z
zkrit.zkrit.
β napakadejansko stanje
ničelna hipoteza
Napake pri statističnem zaključevanju
9
Izbor ustreznega
statističnega testa
25
� vrsta statistike� nivo merjenja� normalnost porazdelitve� enakost varianc � odvisni / neodvisni vzorci� majhni / veliki vzorci� vrednost ničelne hipoteze� nivo tveganja� enosmerno / dvosmerno
testiranje
Neparametrični testi� pogosto pri majhnih vzorcih, pri
omejenosti razpona, stališča (U-porazdelitev)
� Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij -nižja moč testa (ničelno hipotezo, ki je napačna, težje ovržemo).
Raziskovalni načrti
z 1 NV in 1 OV
26
� primerjava vzorca s populacijo (primerjava vzorčne statistike s poznano ali predpostavljeno vrednostjo parametra)
� primerjava statistik dveh vzorcev
� primerjava statistik več vzorcev
Ali so vrednosti preveč različne?
Ali vzorci pripadajo isti populaciji?
Testiranje hipotez
27
Povprečja
N.D.parametrični testi
1 vzorec 2 vzorca
neodvisna odvisna
t test(independent
t test(paired-samples)
t test(one-sample)
več vzorcev
neodvisnih odvisnih
enosmerna ANOVA(GLM - univariate)
enosmerna ANOVA(GLM -repeated-measures)
10
Testiranje hipotez
28
Povprečja
ni N.D.neparametrični testi
1 vzorec 2 vzorca
neodvisna odvisna
- Mann-WhitneyevU
- medianski test
- WilcoxonovT test(matched pairs)
- test predznakov
binomski test
več vzorcev
neodvisnih odvisnih
- Kruskal-Wallisov H
- razširjenimedianski test
Friedmanovtest
Testiranje hipotez
29
o varianci
� en vzorec: χ2
� dva vzorca: F test
NOMINALNE
SPREMENLJIVKE
− t test razlike med deleži
− χ2
o obliki porazdelitve− χ2 test − preverjanje N.D.:
χ2 goodness-of-fittest Kolmogorov-SmirnovShapiro-Wilksov test
o povezanosti− t test za testiranje H0: r = 0− Fisherjeva transformacija
in z test za testiranje H0: r = X
� o aritmetični sredini:
df = N - 1
� o mediani: ; majhni vz.: iz tabel binomskih verjetnosti
Testiranje hipotez o sredini
30
N
M
SE
t
t
M
==
==
=
=−
= −
=
50
20
21
5
0 71
20 210 71
141
49 2 0105
µσ '
.
..
( ) ..2120
0.71
0-1.41-2.01 tM
tM
SEM
=− µ
Npq
NpMez
−=
envzorec
11
Primer testiranja hipotez o povprečju:
primerjava povprečja vzorca z znano vrednostjo
31
H0: M = 6.0H1: M ≠ 6.0
Študenti v povprečju na nekem testu dosegajo rezultat 6.0,rezultati testa v naši skupini pa so bili naslednji:9 7 4 11 10 8 7 10 7 4 7 10 8 10 6 8 10 7 8 9
Vprašanje: Ali je naša skupina običajna skupina študentov ali morda ne? Ali je povprečje našega vzorca enako 6.0?
Če bi bila ničelna hipoteza pravilna (če bi vzorčili iz populacije s sredino 6.0), bi vrednosti t v 5 % vzorcev presegale 2.09. Verjetnost pojavljanja t vrednosti 4.60 zaradi napake vzorčenja bi bila zelo majhna, manjša od 5 %. Večja verjetnost je, da vrednost našega vzorca ni posledica napake vzorčenja, temveč da naš vzorec pripada neki drugi populaciji. Ničelno hipotezo zavrnemo, sprejmemo alternativno. Povprečje našega vzorca statistično pomembno odstopa od 6.0.
M = 8.0σ’ = 1.95SEM = 1.95 / Sqrt(20) = 0.44t = (8.0 - 6.0) / 0.44 = 4.60df = N - 1 = 19tkrit (19) = 2.09t > tkrit 6.0
0.44
8.0 --- t = 4.6
32
Testiranje hipotez o odstotkih
43.17
5040
749
6040
%50
%40
50
.
−=−=
=⋅=
===
z
SE
p
p
N
p
pop
Testiranje hipotez o varianci
05.
1.7864
10249
1.1049
5010'
8
10
50
2
2
<
=⋅=
=⋅=
==
=
p
SD
N
χ
σ
σ
( )2
22 '1
σσχ −= N
ocena populacijskevariance (korigiranavarianca vzorca)
poznana/predpostavljenapopulacijska varianca
envzorec
p
popvzorca
SE
ppz .−
=
33
Testiranje hipotez o korelacijskih koeficientih
r
zr
r
zz
N
σµ
σ
−=
−=
3
1
Testiranje hipoteze ρ = 0 N
r
t
==
=⋅−
=
50
45
45 48
1 45349
2
.
.
..
Testiranje drugačnih hipotez o ρ - Fisherjeva transformacija r v zr
N
r
z
r
===
= =
=−
−
50
45
60
1
47146
485 693
146143
.
.
.
. .
..
ρ
σ
21
2
r
Nrt
−−=
envzorec
12
Testiranje razlik med aritmetičnima
sredinama dveh vzorcev
34
Parametrični test
t test
Neparametrični testi
Wilcoxonov test za neodvisna vzorca (Wilcoxonov R)
Mann-Whitneyev U
dva neodvisna vzorca
t-test
35
Ali oba vzorca izhajata iz iste populacije?Je razlikamed njunimiM ničelna? Ima NV vpliv na OV?
dva neodvisna vzorca
36
vzorčna porazdelitev razlik med pari M
t test za primerjavo sredin
SE SE SEX X X X1 2 1 2
2 2
− = +
standardna napaka razlik med M1 in M2
µ1 - µ2 M1 - M2
( ) ( )t
X X
SEX X
=− − −
−
1 2 1 2
1 2
µ µ
df = N1 + N2 - 2
vrednost ničelne hipoteze (navadno 0)
dva neodvisna vzorca
Ničelno hipotezo preverjamo preko vzorčne porazdelitve izrazov t.
13
37
SE SE SEn nX X X X1 2 1 2
2 2 12
1
22
2− = + = +
σ σ
21
21
XXSE
XXt
−
−=
Pr.1 S1 S27.0 7.5
14.0 5.010.0 5.011.0 6.08.5 1.05.0 6.04.5 9.0
11.0 3.09.0 6.0
10.0 7.0
M 9.00 5.55σ’ 2.90 2.27var’ 8.41 5.15
t = (9.00-5.55) / 1.16 = 2.97df = 10+10-2 = 18; t.05(18) = 2.101
Primer t testa dva neodvisna vzorca
Naša vzorca se razlikujeta za 3.45, medtem ko je variabilnost vrednosti znotraj vsakega vzorca sorazmerno majhna. Razlika med vzorcema je v primerjavi z razlikami med osebami znotraj vzorcev precejšnja. S t-testom ugotovimo, ali je razlika med sredinama obeh vzorcev tudi statistično pomembna.
Če bi neštetokrat vzorčili po dva vzorca iz iste populacije, bi pri 5% primerov vzorčenj vrednost t-testa presegla kritično vrednost 2.101. Naš dobljeni t znaša 2.97 in je višji od kritične vrednosti. To pomeni, da bi v manj kot 5% primerov vzorčenj iz iste populacije potegnili dva tako različna vzorca, kot sta naša. Ker je naša dobljena vrednost t višja od kritične, zaključujemo, da je verjetnost, da smo oba vzorca potegnili iz iste populacije, premajhna. Najverjetneje vzorca izhajata iz dveh različnih populacij. Zaključimo, da se aritmetični sredini pri naših vzorcih statistično pomembno razlikujeta, oz. da je S1 dosegala statistično pomembno drugačne rezultate od S2. Neodvisna spremenljivka (skupina) je imela učinek na merjeno odvisno spremenljivko (znanje).
kritični t
1.16 10
272.2
10
2.902 SEd =+=
Vprašanje:Ali se študenti iz skupine 1 po znanju razlikujejo od študentov iz skupine 2?
38
Testiranje razlik med dvemaµ pri neenakih variancah
d f
s
n
s
n
sn
n
sn
n
=+
++
+
−
12
1
22
2
2
12
1
2
1
22
2
2
21 1
2 zaokrožimo
uporabimo drugačne df
Wilcoxonov R in Mann-Whitneyev U test
39
� Statistiki temeljita na vsoti rangov namesto na M.� Vse dosežke rangiramo od najmanjšega do največjega.
V vsakem vzorcu seštejemo range. � H0 : ni razlik med vsotama rangov (rangi so podobno
porazdeljeni)� H1 : razlika obstaja, vsota rangov pri manjšem vzorcu je
pomembno premajhna (rangi enega vzorca pomembno manjkrat predhodijo rangom drugega)
� precej velika moč testa
dva neodvisna vzorca
14
40
točkedeklice dečki53 5876 6669 6872 7170 7852 4750 566167
rang točke spol1 47 deček2 50 deklica3 52 deklica4 53 deklica5 56 deček6 58 deček7 61 deklica8 66 deček9 67 deklica
10 68 deček11 69 deklica12 70 deklica13 71 deček14 72 deklica paziti na15 76 deklica vezane16 78 deček range
Rdeklice= 77 Pri velikih vzorcih se Rdečki = 59 Rporazdeljuje normalno.R’dečki = 60 zvrednost
primerjati z Rkrit.
Testiranje razlik med variancama
41
PARAMETRIČNI TEST: F test
F = večja σ2 / manjša σ2
F = 1.0 H0 sprejmemo
F > 1.0 H0 zavrnemo
df = N-1 (pri obeh variancah)
NEPARAMETRIČNI TEST
O’Brien (1981)
� Izvorne podatke transformiramo (Mtrans = var)
� t test
Pr. 1 F= 8.41 / 5.15 = 1.63; df1 = 9, df2 = 9; F.05(9,9) = 4.03
dva neodvisna vzorca
Testiranje razlik med korelacijskima
koeficientoma
42
S Fisherjevo transformacijo r vrednosti transformiramo v zr
(vzorčna distribucija N.D.). Testiramo hipotezo, da med dvema r ni razlik.
zz z
N N
r r=−
−+
−
1 2
13
131 2
Razlika med distribucijama(oblikama distribucij) v dveh vzorcih:Wald-Wolfowitz test homogenih nizov, Kolmogorov-Smirnov test za dva vzorca, Siegel-Tukeyev test
dva neodvisna vzorca
15
43
Testiranje razlik med aritmetičnima sredinamadveh odvisnih vzorcev
Parametrični test
test diferenc (t)
Neparametrični testi
Wilcoxonov test za odvisna vzorca (W. test ekvivalentnih parov / Wilcoxonov T)
test predznaka
dva odvisna vzorca
44
Test diferenc
tX
SErazlik razlik
X razlik
=− µ
SENX
razlik
razlik=
σ
Ali je med dvemameritvama prišlo do sprememb?
otrok znani neznani razlika (d)A.A. 38.48 66.67 -28.19B.B. 49.04 73.96 -24.92C.C. 37.23 43.64 -6.41Č.Č. 43.89 42.82 1.07D.D. 69.34 71.81 -2.47E.E. 53.99 47.52 6.47F.F. 40.79 75.33 -34.54G.G. 49.44 60.41 -10.97H.H. 54.47 71.16 -16.69I.I. 47.45 65.90 -18.45
Μ 48.412 61.922 Md = -13.510σ’ 9.489 12.715 Med = -13.830SEM 3.001 4.021 SDd = 13.387
SEd = 13.387 / Sqrt(10) = 4.23t = (-13.51 - 0) / 4.23 = -3.19df = N - 1 = 9; t.05(9) = 2.262
material
Pr.2= one-sample ttest
(X razlike, µrazlik = 0)
45
2121222
21
XXXXSErSESESE
XXt
−+
−=
Testiranje razlik med dvemaµ
Testi za ponovljene meritve imajo večjo moč.
r = 0.300t = (48.412-61.922) / sqrt(3.0012+4.0212-2*0.300*3.001*4.021) == -13.51 / sqrt (17.934) = -3.19
Pr.2
dva odvisna vzorca
16
Wilcoxonov test
ekvivalentnih parov
46
� Pri vsaki osebi izračunamo razlike med dosežkoma. Razlike uredimo po absolutnih vrednostih odnajmanjše do največje, nato jim pripišemo pripadajočepredznake. Seštejemo pozitivne in negativne range.
� H0: Mrazlik = 0 (oz. vsota pozitivnih rangov = vsotanegativnih) H1: Vsoti sta različni.
� Ali je T (nižja vsota rangov) manjša od kritične?
Test predznakaPreštejemo pozitivne in negativne razlike. Nižje številoprimerjamo s kritičnim.
dva odvisna vzorca
47
otrok znani neznani razlika1 38.48 66.67 -28.192 49.04 73.96 -24.923 37.23 43.64 -6.414 43.89 42.82 1.075 69.34 71.81 -2.476 53.99 47.52 6.477 40.79 75.33 -34.548 49.44 60.41 -10.979 54.47 71.16 -16.6910 47.45 65.90 -18.45
material
otrok abs.raz. rang predzn.rang4 1.07 1 +15 2.47 2 -23 6.41 3 -36 6.47 4 +48 10.97 5 -59 16.69 6 -610 18.45 7 -72 24.92 8 -81 28.19 9 -97 34.54 10 -10Σ+ = 5 … TΣ- = 50
Pri velikih vzorcih se T statistikaporazdeljuje normalno, s sredinoN(N+1)/4 in standardno napakoSqrt(N(N+1)(2N+1)/24).
Ali je T manjši od kritične vrednosti?Če da, zavrnemo ničelno hipotezo.
Wilcoxonov test ekvivalentnih parov
48
preverjanje razlik med aritmetičnimisredinami več vzorcev:
enosmerna analiza variance
več vzorcev
17
Analiza variance
49
� preverjamo pomembnost razlik med aritmetičnimi sredinami več vzorcev
� meritve v več pogojih (oz. vzorčenje iz več populacij)
� H0: ni razlik med njihovimi µ
več vzorcev
Analiza variance
50
� preverjamo pomembnost razlik med aritmetičnimi sredinami več vzorcev
� meritve v več pogojih (oz. vzorčenje iz več populacij)
� H0: ni razlik med njihovimi µ
variabilnost med skupinami
variabilnost znotraj skupinF =
več vzorcev
Analiza variance
51
Ocena variance
Skupno varianco vseh podatkov lahko razstavimo na dva dela:� varianco napake, ki je posledica:
� napak merjenja (slabih merskih instrumentov), � napak kontrole (zunanjih spremenljivk), � razlik med posamezniki
� varianco, nastalo zaradi učinkov neodvisne spremenljivke
( )σ2
2
1=
−−
∑ X X
N
vsota kvadratov odklonov (SS)
df
več vzorcev
18
52
( ) ( )totjjijtotij MMMYMY −+−=−
M tot Mj
Yi
( ) ( ) ( )∑ ∑ ∑ −+−=− 222totjjijtotij MMMYMY
skupna variabilnost
variabilnostznotraj skupin
variabilnostmed skupinami
1−==
a
SS
df
SSMS med
med
medmed( )1−
==na
SS
df
SSMS zn
zn
znzn
zn
med
MS
MSF =
Analiza variance
53
� neponovljene in ponovljene meritve� pogoji:
� nominalna NV� OV na vsaj intervalni merski ravni� normalna porazdelitev spremenljivke v populaciji� enakost varianc vzorcev
� analiza variance za več NV� dvosmerna, trismerna ANOVA� glavni učinki + interakcija med NV
več vzorcev
54
2 3 4 5 6 7 8 9 10 11 12MT = 7
SSznotraj-1= 1(2-4)2 + 2(3-4)2 + 3(4-4)2 + 2(5-4)2 + 1(6-4)2 =12SSznotraj-2 = 1(8-10)2 + 2(9-10)2 + 3(10-10)2 + 2(11-10)2 + 1(12-10)2 =12SSmed= 9(4-7)2 + 9(10-7)2 = 81 + 81 = 162
df znotraj= N - a = 18 - 2 = 16dfmed= a - 1 = 2 - 1 = 1
več vzorcevPrimer enosmerne analize variance z dvema vzorcema
MSznotraj= SSznotraj / dfznotraj= 24 / 16 = 1.5MSmed= SSmed/ dfmed= 162 / 1 = 162F = 162 /1.5 = 108F.05(1,16) = 4.49
19
55
izvor variabilnosti SS df MS F p
NV 162 1 162,0 108 < ,001
napaka 24 16 1,5
skupaj 186 17
Neodvisna spremenljivka ni imela statistično pomembnega učinkana odvisno spremenljivko; F (1, 16) = 108; MSE= 1,5; p < ,001.
več vzorcev
Povzetek analize variance
Po analizi variance
56
� ANOVA - hipoteze so nespecifične
� Med katerimi µi obstajajo razlike?
primerjave
a priori post hocvnaprej pričakujemo razliko potem, ko ANOVA odkrije razliko
� SSkontrast, df = 1, MS, F - Sheffejev test
� dve µ: - Tukeyev test- Bonferronijeva prilagoditev αt
M M
M S
nznotra j
=−1 2
2
več vzorcev
Primerjava median
Kruskal-Wallisov H test
57
� zvezna spremenljivka, ordinalna� Ali je porazdelitev (Mdn) v vseh vzorcih enaka? � Vse podatke rangiramo. Izračunamo vsote rangov v vsakem
vzorcu in statistiko H. Primerjamo jo s χ2p, df=a-1
Razširjeni medianski testPoiščemo skupno mediano vseh podatkov. Preštejemo, kolikopodatkov posameznega vzorca pade pod / nad skupnomediano - χ2 test (2 × a tabela).
več neodvisnih vzorcev
20
58
glasba tišina hrup6 5 34 7 24 8 1
rangirano:7 6 34.5 8 24.5 9 116 23 6 Rj256 529 36 Rj2
točke rang ozadje1 1 hrup2 2 hrup3 3 hrup4 4.5 glasba4 4.5 glasba5 6 tišina6 7 glasba7 8 tišina8 9 tišina
( ) ( )HN N
R
nN
j
j
=+
− +∑12
13 1
2
= (12/(9*10))*(256/3+529/3+36/3)-3(9+1) = 6.49 χ2,05(2)= 5.991
Pri velikihvzorcih
Pri majhnih vzorcih - tablice.
Kruskal - Wallisov test
59
� neparametrična alternativa analizi variance zaponovljene meritve
� H0: ni razlik med medianami populacij
� Rangiramo rezultate znotraj osebe in seštejemo range pri posameznem pogoju. Testna statistika χ2
F je podobna Kruskal-Wallisovi.
Primerjava median
Friedmanov test
več odvisnih vzorcev
60
parfumoseba A B C D E1 10(5) 8(4) 4(2) 5(3) 1(1)2 10(5) 2(1) 3(2) 5(3) 8(4)3 8(5) 5(2) 6(3) 4(1) 7(4)
Rj 15 7 7 7 9
( )χF jna aR n a2 212
13 1=
+− +∑( )
= (12/(3*5*6))*(225+49+49+49+81)-3*3*6 = 6.4
χ2(4)= 9.49Pri velikih vzorcih:
Pri majhnih vzorcih - tablice.
Friedmanov test
21
Načrti z več NV =
večfaktorski načrti
parametrični testi: dvosmerna ANOVA, trosmerna
ANOVA
neparametrični testi: χχχχ2 za dve NV, log-linearnaanaliza
Nominalni podatki
Statistično zaključevanje za frekvence
63
� Opis: tabele, frekvenčni poligoni, histogrami
� Običajna vprašanja:- enakost deležev kategorij pri več vzorcih- ujemanje dejanskih podatkov s pričakovanimi,testiranje hipotez o obliki porazdelitve
- povezanost (interakcija) med dvema nominalnimaspremenljivkama
22
χ2 test za eno spremenljivko
64
� Ali je višja pogostost ene kategorije slučajna?
� pričakovane frekvence
� H0: Populacijska frekvenčna porazdelitev je enakapričakovani.
� odstopanje dejanskih od pričakovanih vrednosti
… Pearsonov χ2 - približekχ2 porazdelitve
df = a - 1
( )χ 2
2
=−
∑f f
fe t
t
Pogoji za uporabo χ2 testa
65
� ekskluzivnost kategorij
� neodvisnost podatkov
� ft > 5
Interpretacija χ2
f f
fe t
t
−• pregled rezidualov -koliko se vsaka frekvenca razlikuje od pričakovane, doprinos k χ2
• pretvorba v odstotke
nespecifičen test
Primer χ2 testa za preverjanje pravokotnosti
porazdelitve (= enakosti deleža oseb v vseh
kategorijah)
66
Delež izbir napačnih alternativ na vprašanju zaprtega tipa: a) b) c)
fe 30 40 80 skupaj 150dejanski delež 0.20 0.27 0.53ft 50 50 50teoretični delež 0.33 0.33 0.33χ2(2) = (30-50)2/50 + (40-50)2/50 + (80-50)2/50 = 28kritična vrednost χ2 pri 5% tveganju: 5.99
Naš dobljeni χ2 presega kritično vrednost. Če bi neštetokrat vzorčili iz populacije, kjer osebe enakovredno izbirajo napačne alternative (kjer je delež izbire vseh alternativ enak, in sicer 0.33), bi kritično vrednost χ2 poslučaju preseglo le 5 % vzorcev. Ker so bili deleži v našem vzorcu zelo različni od teoretičnega deleža 0.33 in je zato χ2 pri našem vzorcu zelo presegel kritično vrednost, ni preveč verjetno, da smo ga potegnili iz populacije, kjer osebe enako pogosto izbirajo vse tri alternative. Bolj verjetno kot to je, da smo ga povlekli iz populacije, kjerosebe različne alternative izbirajo različno pogosto. Zaključimo torej, da alternativni odgovori niso enako privlačni.
23
67
Odgovori fe f t fe-f t (fe-f t)2/f t (fe-f t)/Sqrt(ft)a 13 9 +4 1.778 +1.333b 7 9 -2 0.444 -0.666c 5 9 -4 1.778 -1.333d 15 9 +6 4.000 +2.000e 5 9 -4 1.778 -1.333
χ2 = 9.778χ2
.05(4)= 9.49
Primer χ2 testa za preverjanje pravokotnosti porazdelitve (= enakosti deleža oseb v vseh kategorijah)
χ2 test odvisnosti dveh spremenljivk
68
� kontingenčna tabela� H0: Vpliv ene spremenljivke ni odvisen od druge spremenljivke (na vseh
ravneh ene spremenljivke so ravni druge enako izražene).� pričakovana frekvenca ft = fvrsta fstolpec / N� v vsakem polju izračunamo
� seštejemo izračune v vseh poljih, dobimo χ2
� Dobljeno vrednost primerjamo s kritično vrednostjo χ2
df = (število vrstic - 1) (število stolpcev - 1)� pregled rezidualov
( )t
te
f
ff 2−
zrezidual
rezidual
=σ( )( )σ rezidual N v N s= − −∑ ∑
uspešnost pri nalogi 1+ -
ženske 36 14 50(29) (21)(+1.192)* (-1.645)
moški 22 28 50(29) (21)(-1.192) (+1.645)58 42 100
χ2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = 8.05df = (število vrstic - 1) ·(število stolpcev - 1) = (2-1)(2-1) = 1kritična vrednost:χ2
.05 (1) = 3.841
Naš dobljeniχ2 je višji od kritične vrednosti, kar pomeni, da je rezultat statistično pomemben. Če bi naš vzorec izhajal iz populacije, kjer se moški in ženske ne bi razlikovali v uspešnosti pri nalogi, bi v manj kot 5% vzorcev dejanske frekvence tako zelo odstopale od teoretičnih. To pomeni, da je bolj kot to, da smo vzorec vlekli iz populacije, kjer oba spola enako pogosto pravilno odgovorita, verjetno, da smo vzorecvlekli iz populacije, v kateri se ženske in moški razlikujejo v uspešnosti reševanja naloge. Zaključimo, da so ženske pri reševanju naloge statistično pomembno bolj uspešne kot moški.
robna vsota frekvenc
V oklepajih so navedene teoretične frekvence.
robna vsotafrekvenc
število vseh oseb
*SDrez = sqrt((100-50)/(100-58)) = sqrt(1.19) = 1.091rezidual = (36-29)/sqrt(29) = 1.300 z= 1.300 / 1.091 = 1.192
z reziduala
24
Odvisni vzorci, 2 x 2:
McNemarjev test
70
primerjava frekvenc pri istem vzorcu na dveh meritvah
test 2- +
test 1 + 5A* 55B B in C - neujemanje- 25C 15D* A in D - neujemanje
*pričakovane frekvence: (A+D)/2polovica neujemanj -/+, polovica +/-
χ2 = (A-D)2 / (A+D) χ2 = 100 / 20 = 5 ali χ2 = (5 - 10)2 / 10 + (15 - 10)2 / 10 = 5
Previdnost!
71
� pomembna mesta
� Interpretacija izsledka naj upošteva značilnosti raziskovalneganačrta.
� ni statistično pomembno = ni dokazano
Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri opazovanempojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.
� Statistična pomembnost: relativen pojem, vezan na verjetnostno teorijo, raste z velikostjo vzorca.
� Pregledati velikost učinka
Velikost učinka
72
� kako zelo se vrednost statistike razlikuje od neke vrednosti (tj. vrednosti ničelne hipoteze) glede na razpršenost vrednosti spremenljivke (v populaciji, za katero velja ničelna hipoteza)
� višina korelacijskega koeficienta
0
0
σµ−
=G
d
0,20 - majhen učinek0,50 - srednje velik učinek0,80 - velik učinek
0,10 - nizek r0,30 - srednje visok r0,50 - visok r
25
Primeri osnovne literature
73
� HyperStat Online Statistics Textbook: http://davidmlane.com/hyperstat/index.html
� Concepts & Applications of Inferential Statistics:http://faculty.vassar.edu/lowry/webtext.html
� Introductory statistics: concepts, models, and applications http://www.psychstat.missouristate.edu/introbook/sbk00.htm
� Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill.
� Graveter, F. J., in Wallnau, L. B. (2000). Statistics for the Behavioral Sciences (5.izd.). Belmont, CA: Wadsworth/Thomson Learning.
� Pagano, R. R. (2001). Understanding Statistics in the Behavioral Sciences (6.izd.). Belmont, CA: Wadsworth/Thomson Learning.
� Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap.
� Spatz, C. (2001). Basic Statistics (7.izd.). Belmont, CA: Wadsworth/Thomson Learning.
� Spiegel, M. R. (1991). Theory and problems of statistics (2. izd.). New York: McGraw - Hill.