Osnove statistike - infer2psy.ff.uni-lj.si/iGuests/KZ/UvodStat/OsnoveStatistike-inferencna.pdf · 9 Izbor ustreznega statističnega testa 25 vrsta statistike nivo merjenja normalnost

1

Statistično

zaključevanje

Anja PodlesekMagistrski študij Kognitivna znanost, Uvod v statistiko

Vzorčne porazdelitve

2


3

2


4

� Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo.

vzorčne porazdelitve statistik� opisnih statistik vzorca, npr. M, var, p, r…� drugih izrazov, npr.

� Vsako vzorčno porazdelitev lahko opišemo: Mstatistike

SD = SEstatistike

21

21

MMSE

MM

−

−


5Mstatistike

SEstatistike

M

SD

frekvenčna porazdelitev spremenljivke

vzorčna porazdelitev statistike

Vzorčne porazdelitve različnih statistik se razlikujejo:z, F, t, χ2 porazdelitve


6Mstatistike

SEstatistike

M

SD

frekvenčna porazdelitev spremenljivke

vzorčna porazdelitev statistikeza manjše/večje vzorce

Če je vzorec velik, bo statistika vzorca bolj podobna parametru. Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša.

teoremcentralnelimite

http://onlinestatbook.com/simulations/CLT/clt.html

3

Standardne napake

7

NSEMX

'σσ ==

SEM = standardni odklon vzorčniharitmetičnih sredin

= standardna napaka oceneµ

NSE

2

σσ =SE

p p

Np =−( )1

Standardna napaka se z večanjem vzorca manjša.

Standardne napake

8

( ) ( )

1 2

1 2

1 2

1 2

1 2

2 21 2

1 2

1 2

1 1 2 2

1 2

1 1

1

3r

M M

M M

M M

p p

z

SEn n

SEn n

SEN

µ µ µ

σ σ

µ π π

π π π π

−

−

−

−

= −

= +

= −

− −= +

=−

Razlike med sredinami

Razlike med proporci

Korelacijski koeficienti

Statistično zaključevanje

9

Izberemo vzorec. Določimo statistiko (npr. M).Posplošujemo z vzorca na populacijo.

� ocenjevanje parametraVprašanje: Kolikšen je parameter (µ) v populaciji?

� testiranje hipotezVprašanje: Ali je M pomembno različna od nekevrednosti?

4

Ocenjevanje parametra

10


11

Vzorčna statistika je ocena populacijskega parametra.

Točkovna ocena parametra� nepristranska ocena -

sredina vzorčne porazdelitve statistikeje enaka ocenjevanemu parametru; velja za vse mere centralne tendence, deleže, korelacijske koeficiente

� pristranska ocena -mere razpršenosti

Intervalna ocena parametra� razpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z

določeno verjetnostjo = interval zaupanja

( )

( )1

2

2'

2

2

−−

=

−=

∑

∑

N

XX

N

XXSD

σ


12

µsp µzg

(npr. 90 % interval zaupanja pri α = 0,10)interval zaupanja

p = α / 2α / 2

1 - α

SEM

µ

Intervalna ocena parametrarazpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z določeno verjetnostjo

SEM · zp

grafični prikaz kvantilov

5


13

Splošno intervalno ocenjevanje parametrov pri velikih vzorcih

Gp SEzG ⋅±Gpop

SEG

vzorčna porazdelitev G je N.D.

Gvz

0

1N (0,1)vz pop

pG

G Gz

SE

−=

z


14

Intervalno ocenjevanje Mpri velikih vzorcih

Mµ pz SE± ⋅µ

SEM

vzorčna porazdelitev M je N.D.

M

0

1N (0,1)

M

µp

Mz

SE

−=

z

15

µsp µzg

p = α / 2α / 2

1 - α

SEM

µ

vzorčna porazdelitev M

α / 2

M

kk SE

zµµ −=

vzorčna porazdelitev z

zsp zzg

p = α / 2

1 - α

SDz = 1

µz = 0

SDz · zp

SEM · zp

M

zgzg

Mzgzg

SEz

SEz

µµµµ

−=

⋅+=

6


16

Pri majhnih vzorcih

µ

SEM

Vzorčna porazdelitev M je N.D. le, če je frekvenčna porazdelitev spremenljivke normalna.

preveriti

Vrednost SEM se spreminja z velikostjo vzorca. Vzorčna porazdelitev je odvisna odstopenj prostosti.

0

1

Mp SE

Mt

µ−=

Xp SEtX ⋅±Interval zaupanja za µ:

df = N - 1


17

2

2)1(

p

XN

χσ− df = N - 1

sp. meja: zg. meja:

χ21-p χ2

p

2

22 ˆ)1(

σσχ −= N

Xp SEtX ⋅±Interval zaupanja za µ

Interval zaupanja za σ

21

2)1(

p

XN

−

−χ

σ

df = N - 1

Testiranje hipotez

18

� Postavimo dve nasprotni si hipotezi (ničelno in alternativno).H0: V našem vzorcu je povprečni IQ enak 100

(oz. naš vzorec izhaja iz populacije, kjer je povprečni IQ enak 100).H1: V našem vzorcu je povprečni IQ različen od 100.

(oz. naš vzorec ne izhaja iz populacije, kjer je povprečni IQ enak 100).

� Konstruiramo vzorčno porazdelitev(pod predpostavko pravilnostiničelne hipoteze).

0

100

SE

odvisna od velikosti vzorca

odvisna odrazpršenosti v populaciji

1t

7

Če je vrednost statistike verjetna(se nahaja znotraj intervalazaupanja okrog vrednosti ničelnehipoteze), ničelno hipotezoohranimo.

Testiranje hipotez

19

Če je vrednost višja/nižja od zgornje/spodnjemeje intervala zaupanja (pade v kritičnoregijo), ničelno hipotezo zavrnemo. (Pravilnost ničelne hipoteze je malo verjetna. Alternativnahipoteza je verjetnejša. Statistika našega vzorca se odpoznanega / predpostavljenega parametra pomembno

razlikuje.)

Na osnovi vzorčne porazdelitve poznamo verjetnost pojavljanja določene vrednosti statistike.

0

1

tM tM0

1

Testiranje hipotez

20

µ

SEM

M

H0: µ’ = µH1: µ’ ≠ µ

0

1

t

Mp SE

Mt

µ−=t > tkrit.tkrit.tkrit.

H0: Μ = µH1: Μ ≠ µ

Testiranje hipotez

21

H0: µ1 - µ2 = 0H1: µ1 - µ2 ≠ 0

H0: µ’ = µH1: µ’ ≠ µ

H0: µ’ - µ = 0H1: µ’ - µ ≠ 0

H0: ρ = 0H1: ρ ≠ 0

H0: µ1 = µ2

H1: µ1 ≠ µ2 21

)()( 2121

MMp

Mp

SE

MMt

SE

Mt

−

−−−=

−=

µµ

µ

H0: σ’ = σH1: σ’ ≠ σ

H0: σ1 = σ2

H1: σ1 ≠ σ2 22

21

2

22 ˆ)1(

σσ

σσχ

=

−=

F

N

H0: ρ1 - ρ2 = 0H1: ρ1 - ρ2 ≠ 0

r

zrzz

r

Nrt

σµ−=

−−=

21

2

8


vs. testiranje hipotez

22

zG

1

zkritzkrit0

0

1

zG

zG > zkrit.zkritzkrit

Napake pri statističnem zaključevanju

23

ρ = 0Gvz= Gpop

ρ ≠ 0Gvz ≠ Gpop

dejanskostanje

naš zaključek

pravilna potrditev ničelne hipoteze

α napaka

pravilna zavrnitev ničelne hipoteze

β napaka

ρ ≠ 0Gvz ≠ Gpop

ρ = 0Gvz= Gpop

24

z

G

popvzp SE

GGz

−=

zkrit.zkrit.

α napaka

z

zkrit.zkrit.

β napakadejansko stanje

ničelna hipoteza

Napake pri statističnem zaključevanju

9

Izbor ustreznega

statističnega testa

25

� vrsta statistike� nivo merjenja� normalnost porazdelitve� enakost varianc � odvisni / neodvisni vzorci� majhni / veliki vzorci� vrednost ničelne hipoteze� nivo tveganja� enosmerno / dvosmerno

testiranje

Neparametrični testi� pogosto pri majhnih vzorcih, pri

omejenosti razpona, stališča (U-porazdelitev)

� Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij -nižja moč testa (ničelno hipotezo, ki je napačna, težje ovržemo).

Raziskovalni načrti

z 1 NV in 1 OV

26

� primerjava vzorca s populacijo (primerjava vzorčne statistike s poznano ali predpostavljeno vrednostjo parametra)

� primerjava statistik dveh vzorcev

� primerjava statistik več vzorcev

Ali so vrednosti preveč različne?

Ali vzorci pripadajo isti populaciji?

Testiranje hipotez

27

Povprečja

N.D.parametrični testi

1 vzorec 2 vzorca

neodvisna odvisna

t test(independent

t test(paired-samples)

t test(one-sample)

več vzorcev

neodvisnih odvisnih

enosmerna ANOVA(GLM - univariate)

enosmerna ANOVA(GLM -repeated-measures)

10

Testiranje hipotez

28

Povprečja

ni N.D.neparametrični testi

1 vzorec 2 vzorca

neodvisna odvisna

- Mann-WhitneyevU

- medianski test

- WilcoxonovT test(matched pairs)

- test predznakov

binomski test

več vzorcev

neodvisnih odvisnih

- Kruskal-Wallisov H

- razširjenimedianski test

Friedmanovtest

Testiranje hipotez

29

o varianci

� en vzorec: χ2

� dva vzorca: F test

NOMINALNE

SPREMENLJIVKE

− t test razlike med deleži

− χ2

o obliki porazdelitve− χ2 test − preverjanje N.D.:

χ2 goodness-of-fittest Kolmogorov-SmirnovShapiro-Wilksov test

o povezanosti− t test za testiranje H0: r = 0− Fisherjeva transformacija

in z test za testiranje H0: r = X

� o aritmetični sredini:

df = N - 1

� o mediani: ; majhni vz.: iz tabel binomskih verjetnosti

Testiranje hipotez o sredini

30

N

M

SE

t

t

M

==

==

=

=−

= −

=

50

20

21

5

0 71

20 210 71

141

49 2 0105

µσ '

.

..

( ) ..2120

0.71

0-1.41-2.01 tM

tM

SEM

=− µ

Npq

NpMez

−=

envzorec

11

Primer testiranja hipotez o povprečju:

primerjava povprečja vzorca z znano vrednostjo

31

H0: M = 6.0H1: M ≠ 6.0

Študenti v povprečju na nekem testu dosegajo rezultat 6.0,rezultati testa v naši skupini pa so bili naslednji:9 7 4 11 10 8 7 10 7 4 7 10 8 10 6 8 10 7 8 9

Vprašanje: Ali je naša skupina običajna skupina študentov ali morda ne? Ali je povprečje našega vzorca enako 6.0?

Če bi bila ničelna hipoteza pravilna (če bi vzorčili iz populacije s sredino 6.0), bi vrednosti t v 5 % vzorcev presegale 2.09. Verjetnost pojavljanja t vrednosti 4.60 zaradi napake vzorčenja bi bila zelo majhna, manjša od 5 %. Večja verjetnost je, da vrednost našega vzorca ni posledica napake vzorčenja, temveč da naš vzorec pripada neki drugi populaciji. Ničelno hipotezo zavrnemo, sprejmemo alternativno. Povprečje našega vzorca statistično pomembno odstopa od 6.0.

M = 8.0σ’ = 1.95SEM = 1.95 / Sqrt(20) = 0.44t = (8.0 - 6.0) / 0.44 = 4.60df = N - 1 = 19tkrit (19) = 2.09t > tkrit 6.0

0.44

8.0 --- t = 4.6

32

Testiranje hipotez o odstotkih

43.17

5040

749

6040

%50

%40

50

.

−=−=

=⋅=

===

z

SE

p

p

N

p

pop

Testiranje hipotez o varianci

05.

1.7864

10249

1.1049

5010'

8

10

50

2

2

<

=⋅=

=⋅=

==

=

p

SD

N

χ

σ

σ

( )2

22 '1

σσχ −= N

ocena populacijskevariance (korigiranavarianca vzorca)

poznana/predpostavljenapopulacijska varianca

envzorec

p

popvzorca

SE

ppz .−

=

33

Testiranje hipotez o korelacijskih koeficientih

r

zr

r

zz

N

σµ

σ

−=

−=

3

1

Testiranje hipoteze ρ = 0 N

r

t

==

=⋅−

=

50

45

45 48

1 45349

2

.

.

..

Testiranje drugačnih hipotez o ρ - Fisherjeva transformacija r v zr

N

r

z

r

===

= =

=−

−

50

45

60

1

47146

485 693

146143

.

.

.

. .

..

ρ

σ

21

2

r

Nrt

−−=

envzorec

12

Testiranje razlik med aritmetičnima

sredinama dveh vzorcev

34

Parametrični test

t test

Neparametrični testi

Wilcoxonov test za neodvisna vzorca (Wilcoxonov R)

Mann-Whitneyev U

dva neodvisna vzorca

t-test

35

Ali oba vzorca izhajata iz iste populacije?Je razlikamed njunimiM ničelna? Ima NV vpliv na OV?


36

vzorčna porazdelitev razlik med pari M

t test za primerjavo sredin

SE SE SEX X X X1 2 1 2

2 2

− = +

standardna napaka razlik med M1 in M2

µ1 - µ2 M1 - M2

( ) ( )t

X X

SEX X

=− − −

−

1 2 1 2

1 2

µ µ

df = N1 + N2 - 2

vrednost ničelne hipoteze (navadno 0)


Ničelno hipotezo preverjamo preko vzorčne porazdelitve izrazov t.

13

37

SE SE SEn nX X X X1 2 1 2

2 2 12

1

22

2− = + = +

σ σ

21

21

XXSE

XXt

−

−=

Pr.1 S1 S27.0 7.5

14.0 5.010.0 5.011.0 6.08.5 1.05.0 6.04.5 9.0

11.0 3.09.0 6.0

10.0 7.0

M 9.00 5.55σ’ 2.90 2.27var’ 8.41 5.15

t = (9.00-5.55) / 1.16 = 2.97df = 10+10-2 = 18; t.05(18) = 2.101

Primer t testa dva neodvisna vzorca

Naša vzorca se razlikujeta za 3.45, medtem ko je variabilnost vrednosti znotraj vsakega vzorca sorazmerno majhna. Razlika med vzorcema je v primerjavi z razlikami med osebami znotraj vzorcev precejšnja. S t-testom ugotovimo, ali je razlika med sredinama obeh vzorcev tudi statistično pomembna.

Če bi neštetokrat vzorčili po dva vzorca iz iste populacije, bi pri 5% primerov vzorčenj vrednost t-testa presegla kritično vrednost 2.101. Naš dobljeni t znaša 2.97 in je višji od kritične vrednosti. To pomeni, da bi v manj kot 5% primerov vzorčenj iz iste populacije potegnili dva tako različna vzorca, kot sta naša. Ker je naša dobljena vrednost t višja od kritične, zaključujemo, da je verjetnost, da smo oba vzorca potegnili iz iste populacije, premajhna. Najverjetneje vzorca izhajata iz dveh različnih populacij. Zaključimo, da se aritmetični sredini pri naših vzorcih statistično pomembno razlikujeta, oz. da je S1 dosegala statistično pomembno drugačne rezultate od S2. Neodvisna spremenljivka (skupina) je imela učinek na merjeno odvisno spremenljivko (znanje).

kritični t

1.16 10

272.2

10

2.902 SEd =+=

Vprašanje:Ali se študenti iz skupine 1 po znanju razlikujejo od študentov iz skupine 2?

38

Testiranje razlik med dvemaµ pri neenakih variancah

d f

s

n

s

n

sn

n

sn

n

=+

++

+

−

12

1

22

2

2

12

1

2

1

22

2

2

21 1

2 zaokrožimo

uporabimo drugačne df

Wilcoxonov R in Mann-Whitneyev U test

39

� Statistiki temeljita na vsoti rangov namesto na M.� Vse dosežke rangiramo od najmanjšega do največjega.

V vsakem vzorcu seštejemo range. � H0 : ni razlik med vsotama rangov (rangi so podobno

porazdeljeni)� H1 : razlika obstaja, vsota rangov pri manjšem vzorcu je

pomembno premajhna (rangi enega vzorca pomembno manjkrat predhodijo rangom drugega)

� precej velika moč testa


14

40

točkedeklice dečki53 5876 6669 6872 7170 7852 4750 566167

rang točke spol1 47 deček2 50 deklica3 52 deklica4 53 deklica5 56 deček6 58 deček7 61 deklica8 66 deček9 67 deklica

10 68 deček11 69 deklica12 70 deklica13 71 deček14 72 deklica paziti na15 76 deklica vezane16 78 deček range

Rdeklice= 77 Pri velikih vzorcih se Rdečki = 59 Rporazdeljuje normalno.R’dečki = 60 zvrednost

primerjati z Rkrit.

Testiranje razlik med variancama

41

PARAMETRIČNI TEST: F test

F = večja σ2 / manjša σ2

F = 1.0 H0 sprejmemo

F > 1.0 H0 zavrnemo

df = N-1 (pri obeh variancah)

NEPARAMETRIČNI TEST

O’Brien (1981)

� Izvorne podatke transformiramo (Mtrans = var)

� t test

Pr. 1 F= 8.41 / 5.15 = 1.63; df1 = 9, df2 = 9; F.05(9,9) = 4.03


Testiranje razlik med korelacijskima

koeficientoma

42

S Fisherjevo transformacijo r vrednosti transformiramo v zr

(vzorčna distribucija N.D.). Testiramo hipotezo, da med dvema r ni razlik.

zz z

N N

r r=−

−+

−

1 2

13

131 2

Razlika med distribucijama(oblikama distribucij) v dveh vzorcih:Wald-Wolfowitz test homogenih nizov, Kolmogorov-Smirnov test za dva vzorca, Siegel-Tukeyev test


15

43

Testiranje razlik med aritmetičnima sredinamadveh odvisnih vzorcev

Parametrični test

test diferenc (t)

Neparametrični testi

Wilcoxonov test za odvisna vzorca (W. test ekvivalentnih parov / Wilcoxonov T)

test predznaka

dva odvisna vzorca

44

Test diferenc

tX

SErazlik razlik

X razlik

=− µ

SENX

razlik

razlik=

σ

Ali je med dvemameritvama prišlo do sprememb?

otrok znani neznani razlika (d)A.A. 38.48 66.67 -28.19B.B. 49.04 73.96 -24.92C.C. 37.23 43.64 -6.41Č.Č. 43.89 42.82 1.07D.D. 69.34 71.81 -2.47E.E. 53.99 47.52 6.47F.F. 40.79 75.33 -34.54G.G. 49.44 60.41 -10.97H.H. 54.47 71.16 -16.69I.I. 47.45 65.90 -18.45

Μ 48.412 61.922 Md = -13.510σ’ 9.489 12.715 Med = -13.830SEM 3.001 4.021 SDd = 13.387

SEd = 13.387 / Sqrt(10) = 4.23t = (-13.51 - 0) / 4.23 = -3.19df = N - 1 = 9; t.05(9) = 2.262

material

Pr.2= one-sample ttest

(X razlike, µrazlik = 0)

45

2121222

21

XXXXSErSESESE

XXt

−+

−=

Testiranje razlik med dvemaµ

Testi za ponovljene meritve imajo večjo moč.

r = 0.300t = (48.412-61.922) / sqrt(3.0012+4.0212-2*0.300*3.001*4.021) == -13.51 / sqrt (17.934) = -3.19

Pr.2

dva odvisna vzorca

16

Wilcoxonov test

ekvivalentnih parov

46

� Pri vsaki osebi izračunamo razlike med dosežkoma. Razlike uredimo po absolutnih vrednostih odnajmanjše do največje, nato jim pripišemo pripadajočepredznake. Seštejemo pozitivne in negativne range.

� H0: Mrazlik = 0 (oz. vsota pozitivnih rangov = vsotanegativnih) H1: Vsoti sta različni.

� Ali je T (nižja vsota rangov) manjša od kritične?

Test predznakaPreštejemo pozitivne in negativne razlike. Nižje številoprimerjamo s kritičnim.

dva odvisna vzorca

47

otrok znani neznani razlika1 38.48 66.67 -28.192 49.04 73.96 -24.923 37.23 43.64 -6.414 43.89 42.82 1.075 69.34 71.81 -2.476 53.99 47.52 6.477 40.79 75.33 -34.548 49.44 60.41 -10.979 54.47 71.16 -16.6910 47.45 65.90 -18.45

material

otrok abs.raz. rang predzn.rang4 1.07 1 +15 2.47 2 -23 6.41 3 -36 6.47 4 +48 10.97 5 -59 16.69 6 -610 18.45 7 -72 24.92 8 -81 28.19 9 -97 34.54 10 -10Σ+ = 5 … TΣ- = 50

Pri velikih vzorcih se T statistikaporazdeljuje normalno, s sredinoN(N+1)/4 in standardno napakoSqrt(N(N+1)(2N+1)/24).

Ali je T manjši od kritične vrednosti?Če da, zavrnemo ničelno hipotezo.

Wilcoxonov test ekvivalentnih parov

48

preverjanje razlik med aritmetičnimisredinami več vzorcev:

enosmerna analiza variance

več vzorcev

17

Analiza variance

49

� preverjamo pomembnost razlik med aritmetičnimi sredinami več vzorcev

� meritve v več pogojih (oz. vzorčenje iz več populacij)

� H0: ni razlik med njihovimi µ

več vzorcev

Analiza variance

50

� preverjamo pomembnost razlik med aritmetičnimi sredinami več vzorcev

� meritve v več pogojih (oz. vzorčenje iz več populacij)

� H0: ni razlik med njihovimi µ

variabilnost med skupinami

variabilnost znotraj skupinF =

več vzorcev

Analiza variance

51

Ocena variance

Skupno varianco vseh podatkov lahko razstavimo na dva dela:� varianco napake, ki je posledica:

� napak merjenja (slabih merskih instrumentov), � napak kontrole (zunanjih spremenljivk), � razlik med posamezniki

� varianco, nastalo zaradi učinkov neodvisne spremenljivke

( )σ2

2

1=

−−

∑ X X

N

vsota kvadratov odklonov (SS)

df

več vzorcev

18

52

( ) ( )totjjijtotij MMMYMY −+−=−

M tot Mj

Yi

( ) ( ) ( )∑ ∑ ∑ −+−=− 222totjjijtotij MMMYMY

skupna variabilnost

variabilnostznotraj skupin

variabilnostmed skupinami

1−==

a

SS

df

SSMS med

med

medmed( )1−

==na

SS

df

SSMS zn

zn

znzn

zn

med

MS

MSF =

Analiza variance

53

� neponovljene in ponovljene meritve� pogoji:

� nominalna NV� OV na vsaj intervalni merski ravni� normalna porazdelitev spremenljivke v populaciji� enakost varianc vzorcev

� analiza variance za več NV� dvosmerna, trismerna ANOVA� glavni učinki + interakcija med NV

več vzorcev

54

2 3 4 5 6 7 8 9 10 11 12MT = 7

SSznotraj-1= 1(2-4)2 + 2(3-4)2 + 3(4-4)2 + 2(5-4)2 + 1(6-4)2 =12SSznotraj-2 = 1(8-10)2 + 2(9-10)2 + 3(10-10)2 + 2(11-10)2 + 1(12-10)2 =12SSmed= 9(4-7)2 + 9(10-7)2 = 81 + 81 = 162

df znotraj= N - a = 18 - 2 = 16dfmed= a - 1 = 2 - 1 = 1

več vzorcevPrimer enosmerne analize variance z dvema vzorcema

MSznotraj= SSznotraj / dfznotraj= 24 / 16 = 1.5MSmed= SSmed/ dfmed= 162 / 1 = 162F = 162 /1.5 = 108F.05(1,16) = 4.49

19

55

izvor variabilnosti SS df MS F p

NV 162 1 162,0 108 < ,001

napaka 24 16 1,5

skupaj 186 17

Neodvisna spremenljivka ni imela statistično pomembnega učinkana odvisno spremenljivko; F (1, 16) = 108; MSE= 1,5; p < ,001.

več vzorcev

Povzetek analize variance

Po analizi variance

56

� ANOVA - hipoteze so nespecifične

� Med katerimi µi obstajajo razlike?

primerjave

a priori post hocvnaprej pričakujemo razliko potem, ko ANOVA odkrije razliko

� SSkontrast, df = 1, MS, F - Sheffejev test

� dve µ: - Tukeyev test- Bonferronijeva prilagoditev αt

M M

M S

nznotra j

=−1 2

2

več vzorcev

Primerjava median

Kruskal-Wallisov H test

57

� zvezna spremenljivka, ordinalna� Ali je porazdelitev (Mdn) v vseh vzorcih enaka? � Vse podatke rangiramo. Izračunamo vsote rangov v vsakem

vzorcu in statistiko H. Primerjamo jo s χ2p, df=a-1

Razširjeni medianski testPoiščemo skupno mediano vseh podatkov. Preštejemo, kolikopodatkov posameznega vzorca pade pod / nad skupnomediano - χ2 test (2 × a tabela).

več neodvisnih vzorcev

20

58

glasba tišina hrup6 5 34 7 24 8 1

rangirano:7 6 34.5 8 24.5 9 116 23 6 Rj256 529 36 Rj2

točke rang ozadje1 1 hrup2 2 hrup3 3 hrup4 4.5 glasba4 4.5 glasba5 6 tišina6 7 glasba7 8 tišina8 9 tišina

( ) ( )HN N

R

nN

j

j

=+

− +∑12

13 1

2

= (12/(9*10))*(256/3+529/3+36/3)-3(9+1) = 6.49 χ2,05(2)= 5.991

Pri velikihvzorcih

Pri majhnih vzorcih - tablice.

Kruskal - Wallisov test

59

� neparametrična alternativa analizi variance zaponovljene meritve

� H0: ni razlik med medianami populacij

� Rangiramo rezultate znotraj osebe in seštejemo range pri posameznem pogoju. Testna statistika χ2

F je podobna Kruskal-Wallisovi.

Primerjava median

Friedmanov test

več odvisnih vzorcev

60

parfumoseba A B C D E1 10(5) 8(4) 4(2) 5(3) 1(1)2 10(5) 2(1) 3(2) 5(3) 8(4)3 8(5) 5(2) 6(3) 4(1) 7(4)

Rj 15 7 7 7 9

( )χF jna aR n a2 212

13 1=

+− +∑( )

= (12/(3*5*6))*(225+49+49+49+81)-3*3*6 = 6.4

χ2(4)= 9.49Pri velikih vzorcih:

Pri majhnih vzorcih - tablice.

Friedmanov test

21

Načrti z več NV =

večfaktorski načrti

parametrični testi: dvosmerna ANOVA, trosmerna

ANOVA

neparametrični testi: χχχχ2 za dve NV, log-linearnaanaliza

Nominalni podatki

Statistično zaključevanje za frekvence

63

� Opis: tabele, frekvenčni poligoni, histogrami

� Običajna vprašanja:- enakost deležev kategorij pri več vzorcih- ujemanje dejanskih podatkov s pričakovanimi,testiranje hipotez o obliki porazdelitve

- povezanost (interakcija) med dvema nominalnimaspremenljivkama

22

χ2 test za eno spremenljivko

64

� Ali je višja pogostost ene kategorije slučajna?

� pričakovane frekvence

� H0: Populacijska frekvenčna porazdelitev je enakapričakovani.

� odstopanje dejanskih od pričakovanih vrednosti

… Pearsonov χ2 - približekχ2 porazdelitve

df = a - 1

( )χ 2

2

=−

∑f f

fe t

t

Pogoji za uporabo χ2 testa

65

� ekskluzivnost kategorij

� neodvisnost podatkov

� ft > 5

Interpretacija χ2

f f

fe t

t

−• pregled rezidualov -koliko se vsaka frekvenca razlikuje od pričakovane, doprinos k χ2

• pretvorba v odstotke

nespecifičen test

Primer χ2 testa za preverjanje pravokotnosti

porazdelitve (= enakosti deleža oseb v vseh

kategorijah)

66

Delež izbir napačnih alternativ na vprašanju zaprtega tipa: a) b) c)

fe 30 40 80 skupaj 150dejanski delež 0.20 0.27 0.53ft 50 50 50teoretični delež 0.33 0.33 0.33χ2(2) = (30-50)2/50 + (40-50)2/50 + (80-50)2/50 = 28kritična vrednost χ2 pri 5% tveganju: 5.99

Naš dobljeni χ2 presega kritično vrednost. Če bi neštetokrat vzorčili iz populacije, kjer osebe enakovredno izbirajo napačne alternative (kjer je delež izbire vseh alternativ enak, in sicer 0.33), bi kritično vrednost χ2 poslučaju preseglo le 5 % vzorcev. Ker so bili deleži v našem vzorcu zelo različni od teoretičnega deleža 0.33 in je zato χ2 pri našem vzorcu zelo presegel kritično vrednost, ni preveč verjetno, da smo ga potegnili iz populacije, kjer osebe enako pogosto izbirajo vse tri alternative. Bolj verjetno kot to je, da smo ga povlekli iz populacije, kjerosebe različne alternative izbirajo različno pogosto. Zaključimo torej, da alternativni odgovori niso enako privlačni.

23

67

Odgovori fe f t fe-f t (fe-f t)2/f t (fe-f t)/Sqrt(ft)a 13 9 +4 1.778 +1.333b 7 9 -2 0.444 -0.666c 5 9 -4 1.778 -1.333d 15 9 +6 4.000 +2.000e 5 9 -4 1.778 -1.333

χ2 = 9.778χ2

.05(4)= 9.49

Primer χ2 testa za preverjanje pravokotnosti porazdelitve (= enakosti deleža oseb v vseh kategorijah)

χ2 test odvisnosti dveh spremenljivk

68

� kontingenčna tabela� H0: Vpliv ene spremenljivke ni odvisen od druge spremenljivke (na vseh

ravneh ene spremenljivke so ravni druge enako izražene).� pričakovana frekvenca ft = fvrsta fstolpec / N� v vsakem polju izračunamo

� seštejemo izračune v vseh poljih, dobimo χ2

� Dobljeno vrednost primerjamo s kritično vrednostjo χ2

df = (število vrstic - 1) (število stolpcev - 1)� pregled rezidualov

( )t

te

f

ff 2−

zrezidual

rezidual

=σ( )( )σ rezidual N v N s= − −∑ ∑

uspešnost pri nalogi 1+ -

ženske 36 14 50(29) (21)(+1.192)* (-1.645)

moški 22 28 50(29) (21)(-1.192) (+1.645)58 42 100

χ2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = 8.05df = (število vrstic - 1) ·(število stolpcev - 1) = (2-1)(2-1) = 1kritična vrednost:χ2

.05 (1) = 3.841

Naš dobljeniχ2 je višji od kritične vrednosti, kar pomeni, da je rezultat statistično pomemben. Če bi naš vzorec izhajal iz populacije, kjer se moški in ženske ne bi razlikovali v uspešnosti pri nalogi, bi v manj kot 5% vzorcev dejanske frekvence tako zelo odstopale od teoretičnih. To pomeni, da je bolj kot to, da smo vzorec vlekli iz populacije, kjer oba spola enako pogosto pravilno odgovorita, verjetno, da smo vzorecvlekli iz populacije, v kateri se ženske in moški razlikujejo v uspešnosti reševanja naloge. Zaključimo, da so ženske pri reševanju naloge statistično pomembno bolj uspešne kot moški.

robna vsota frekvenc

V oklepajih so navedene teoretične frekvence.

robna vsotafrekvenc

število vseh oseb

*SDrez = sqrt((100-50)/(100-58)) = sqrt(1.19) = 1.091rezidual = (36-29)/sqrt(29) = 1.300 z= 1.300 / 1.091 = 1.192

z reziduala

24

Odvisni vzorci, 2 x 2:

McNemarjev test

70

primerjava frekvenc pri istem vzorcu na dveh meritvah

test 2- +

test 1 + 5A* 55B B in C - neujemanje- 25C 15D* A in D - neujemanje

*pričakovane frekvence: (A+D)/2polovica neujemanj -/+, polovica +/-

χ2 = (A-D)2 / (A+D) χ2 = 100 / 20 = 5 ali χ2 = (5 - 10)2 / 10 + (15 - 10)2 / 10 = 5

Previdnost!

71

� pomembna mesta

� Interpretacija izsledka naj upošteva značilnosti raziskovalneganačrta.

� ni statistično pomembno = ni dokazano

Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri opazovanempojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.

� Statistična pomembnost: relativen pojem, vezan na verjetnostno teorijo, raste z velikostjo vzorca.

� Pregledati velikost učinka

Velikost učinka

72

� kako zelo se vrednost statistike razlikuje od neke vrednosti (tj. vrednosti ničelne hipoteze) glede na razpršenost vrednosti spremenljivke (v populaciji, za katero velja ničelna hipoteza)

� višina korelacijskega koeficienta

0

0

σµ−

=G

d

0,20 - majhen učinek0,50 - srednje velik učinek0,80 - velik učinek

0,10 - nizek r0,30 - srednje visok r0,50 - visok r

25

Primeri osnovne literature

73

� HyperStat Online Statistics Textbook: http://davidmlane.com/hyperstat/index.html

� Concepts & Applications of Inferential Statistics:http://faculty.vassar.edu/lowry/webtext.html

� Introductory statistics: concepts, models, and applications http://www.psychstat.missouristate.edu/introbook/sbk00.htm

� Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill.

� Graveter, F. J., in Wallnau, L. B. (2000). Statistics for the Behavioral Sciences (5.izd.). Belmont, CA: Wadsworth/Thomson Learning.

� Pagano, R. R. (2001). Understanding Statistics in the Behavioral Sciences (6.izd.). Belmont, CA: Wadsworth/Thomson Learning.

� Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap.

� Spatz, C. (2001). Basic Statistics (7.izd.). Belmont, CA: Wadsworth/Thomson Learning.

� Spiegel, M. R. (1991). Theory and problems of statistics (2. izd.). New York: McGraw - Hill.

Documents

Osnove statistike - infer2psy.ff.uni-lj.si/iGuests/KZ/UvodStat/OsnoveStatistike-inferencna.pdf · 9 Izbor ustreznega statističnega testa 25 vrsta statistike nivo merjenja normalnost