Download pdf - Testarea diferenţei dintre mai mult de două medii: … · ANOVA unifactorial ă(One-way ANOVA) ANOVA multifactorial ă(Two-way ANOVA) ANOVA unifactorial

M. Popa

Testarea diferenţei dintre mai mult de două medii:Testarea diferenţei dintre mai mult de două medii:Testarea diferenţei dintre mai mult de două medii:Testarea diferenţei dintre mai mult de două medii:Analiza de varianţă unifactorială (ANOVA)Analiza de varianţă unifactorială (ANOVA)Analiza de varianţă unifactorială (ANOVA)Analiza de varianţă unifactorială (ANOVA)

Modelul de cercetare� Testul t pentru eşantioane independente:

� diferenţa dintre mediile a două loturi de de subiecţi diferiţi� în două condiţii diferite (de ex.: practicare-nepracticare TA; masculin-feminin,

etc.)

� Există şi situaţii în care se pune problema semnificaţiei diferenţei dintre mai mult de două medii� diferenţele constatate la un test de cunoştinţe statistice între cele 5 grupe ale unui

an de studiu, diferă semnificativ?

� Variabila dependentă� performanţa la testul de cunoştinţe (scală I-R)

� Variabila independentă� grupele de studiu (scală nominală)

De ce nu aplicăm repetat testul t?� volum mare de calcule (pe măsură ce creşte numărul categoriilor) � problema cercetării vizează relaţia dintre variabila dependentă şi

variabila independentă (grupele de studiu) � ar fi bine să putem utiliza un singur test, nu mai multe

� argumentul esenţial:� cumulul de eroare de tip I peste alfa=0.05� Exemplu

� testăm relaţia dintre nivelul performanţei şi trei metode de antrenament� avem trei categorii ale căror medii ar trebui comparate două câte două

� se cumulează o cantitate totală de eroare de tip I de 0.15 adică0.05+0.05+0.05

Soluţia: Soluţia: Soluţia: Soluţia: ANALIZA DE VARIANŢĂ (ANOVA)

� ANOVA unifactorială (One-way ANOVA)

� ANOVA multifactorială (Two-way ANOVA)

ANOVA unifactorialăANOVA unifactorialăANOVA unifactorialăANOVA unifactorială((((One-way ANOVA))))

� variabilă dependentă� scală de interval/raport

� variabilă independentă� de tip categorial (nominală sau ordinală)� este denumită „factor”� are trei sau mai multe valori (“niveluri”)� exemple

� Nivelul anxietăţii în raport cu trei categorii de fumători („1-10 ţigări zilnic”, „11-20 ţigări” şi „21-30 ţigări”).

� Timpul de răspuns la un strigăt de ajutor, în funcţie de natura vocii persoanelor care solicită ajutorul (copil, femeie, bărbat).

� Scorul la un test de cunoştinţe statistice ale studenţilor de la psihologie, în funcţie de tipul de liceu absolvit (real, umanist, agricol, artistic)

ANOVA multifactorialăANOVA multifactorialăANOVA multifactorialăANOVA multifactorială� variabilă dependentă

� măsurată pe scală I/R

� două sau mai multe variabile independente� fiecare cu două sau mai multe valori măsurate pe o scală nominală sau ordinală� exemple

� Nivelul anxietăţii în raport cu intensitatea fumatului („1-10 ţigări zilnic”, „11-20 ţigări” şi „21-30 ţigări”), şi cu genul (masculin, feminin). În acest caz, problema cercetării este dacă intensitatea fumatului şi caracteristica de sex au, împreună, o relaţie cu nivelul anxietăţii.

� Timpul de răspuns la un strigăt de ajutor în funcţie de natura vocii care solicită ajutorul (copil, femeie, bărbat) şi de genul (masculin, feminin) al persoanei care trebuie sărăspundă la solicitarea de ajutor.

� Scorul la un test de cunoştinţe statistice ale studenţilor de la psihologie, în funcţie de tipul de liceu absolvit (real, umanist, agricol, artistic) şi de genul (masculin, feminin) al studenţilor.

ANOVA unifactorială- cadrul conceptualcadrul conceptualcadrul conceptualcadrul conceptual -

� Temă de cercetare:� relaţia dintre performanţa sportivilor în tragerea la ţintă şi trei metode de

antrenament (metoda 1, metoda 2 şi metoda 3)

� trei grupuri de sportivi antrenaţi prin metode diferite

� mediile performanţei lor la o şedinţă de tragere sunt diferite? (sunt diferenţe de eficienţă între cele trei metode de antrenament?)

� ANOVA este o procedură de comparare a mediilor eşantioanelor

� În locul diferenţei directe dintre medii, se utilizeazădispersia lor

� Ipoteza cercetării (H1):� valorile variabilei dependente aferente fiecărui nivel al variabilei

independente, fac parte din populaţii distincte, cărora le corespunde un nivel specific de performanţă (o medie caracteristică, diferită de a celorlalte populaţii)

(m1≠m2 ≠m3 ≠m4)

� Ipoteza de nul (H0):� valorile variabilei dependente fac parte dintr-o populaţie unică,

indiferent de categoriile variabilei independente.(m1=m2=m3=m4)

Populaţia 1(metoda 1)



eşantion1

(m1, s12)

eşantion2

(m2, s22)

eşantion3

(m2, s32)

populaţia de nul

m1≠m2≠m3

Cât de diferite (împrăştiate) trebuie să fie m1, m2, m3 �

(luate ca distribuţie de sine stătătoare) pentru a accepta că

nu provin din populaţia de nul, ci din trei populaţii diferite

(P1, P2, P3)?

Ipoteza de nul: m1=m2=m3

Ipoteza cercetării:

a) dispersia mediilor performanţei grupurilor cercetării (considerate ca eşantioane separate)

� “dispersia intergrup”

b) dispersia valorilor individuale la nivelul populaţiei de nul (indiferent de metoda de antrenament)

� “dispersia intragrup”

c) Facem raportul dintre aceste două valori� un raport ridicat exprimă apartenenţa fiecăreia din cele trei medii la o

populaţie distinctă� un raport scăzut ar sugera provenienţa mediilor dintr-o populaţie unică (de

nul)

d) Decizia statistică cu privire la mărimea raportului (semnificaţia diferenţelor dintre medii), se face prin raportarea valorii raportului la o distribuţie teoreticăadecvată, alta decât distribuţia normală

intragrup dispersia

intergrup dispersia=F

Raportul Fisher

Cu cât valoarea raportului este mai mare,

cu atât împrăştierea mediilor eşantioanelor

este mai mare decât împrăştierea valorilor

populaţiei de nul

Procedura de calculProcedura de calculProcedura de calculProcedura de calcul

(a) (a) (a) (a) varianţa intragrupvarianţa intragrupvarianţa intragrupvarianţa intragrup (media dispersiilor)(media dispersiilor)(media dispersiilor)(media dispersiilor)

� grupuri de volume

egale grupuriN

ssss

2

3

2

2

2

1intragrup

2 ++=

• grupuri de volume

inegale3

2

intragrup

32

2

intragrup

21

2

intragrup

1intragrup

2 *** sdf

dfs

df

dfs

df

dfs ++=

unde: df1=N1-1; df2=N2-1; df3=N3-1

dfintragrup=Nsubiecţi-Ngrupuri

((((bbbb) varianţa intergrup) varianţa intergrup) varianţa intergrup) varianţa intergrup (dispersia mediilor)(dispersia mediilor)(dispersia mediilor)(dispersia mediilor)

intergrup

2

intergrup2

)(*

df

Mmns

ii∑ −=

intergrup

2

33

2

22

2

11intergrup

2 )(*)(*)(*

df

MmnMmnMmns

−+−+−=

intergrup

2

3

2

2

2

1intergrup

2 )()()(*

df

MmMmMmns

−+−+−=

NM

22 σ

σ = MN 22 *σσ =

pentru grupuri inegale

pentru grupuri egale

Există o relaţie între variaţia mediilor şi variaţia valorilor din grupurile comparate:

� varianţa intragrup� Dispersia valorilor individuale

� estimare directă (media dispersiilor)

� varianţa intergrup� Dispersia mediilor grupurilor

� estimare indirectă (dispersia mediilor)

� Raportul s2intergrup/s2

intragrup tinde să devină cu atât mai mare, cu cât dispersia dintre mediile grupurilor este mai mare decât dispersia din interiorul grupurilor

� Dacă H0 este falsă� valorile variabilei independente (factorul) influenţează mediile

variabilei dependente

Distribuţia Fisher

1. asimetrie pozitivă;2. poate lua o valori oricât de mari; 3. valoarea minimă este 0, deoarece

decurge din raportul a douădispersii(!)

4. forma distribuţiei variază în funcţie de o pereche de grade de libertate

intragrup2

intergrup2

s

sF =

dfintergrup=nr. grupuri-1

dfintragrup=NT-nr. grupuri

Sir Ronald Aylmer Fisher

1890-1962

EXEMPLU DE CALCUL

� Problema cercetării:� Avem rezultatele la o şedinţă de tragere la ţintă pentru trei grupuri

de câte 6 sportivi, fiecare grup fiind antrenat cu o altă metodă

� vrem să vedem dacă există o legătură între nivelul performanţei şi metoda de antrenament.

� Ipoteza cercetării: � „Performanţa sportivă este în legătură cu metoda de antrenament

utilizată.

� Ipoteza de nul: � „Nu există o legătură între performanţa sportivă şi metoda de

antrenament.”

criteriile deciziei statistice

� Nivelul α=0.05

� dfintergrup=3-1=2

� dfintragrup=18-3=15

� Citim F critic (F(0.05, 2, 15)) din tabelul F pentru α=0.05:

• Fcritic=3.6823

df

intragrup

(within)

df intergrup (between)

1 2 3 4

1 161.4476 199.5000 215.7073 224.5832

2 18.5128 19.0000 19.1643 19.2468

3 10.1280 9.5521 9.2766 9.1172

4 7.7086 6.9443 6.5914 6.3882

5 6.6079 5.7861 5.4095 5.1922

6 5.9874 5.1433 4.7571 4.5337

7 5.5914 4.7374 4.3468 4.1203

8 5.3177 4.4590 4.0662 3.8379

9 5.1174 4.2565 3.8625 3.6331

10 4.9646 4.1028 3.7083 3.4780

11 4.8443 3.9823 3.5874 3.3567

12 4.7472 3.8853 3.4903 3.2592

13 4.6672 3.8056 3.4105 3.1791

14 4.6001 3.7389 3.3439 3.1122

15 4.5431 3.6823 3.2874 3.0556

16 4.4940 3.6337 3.2389 3.0069

X1

(puncte)

10

9

10

7

8

6

X2

(puncte)

3

6

6

5

8

7

X3

(puncte)

4

5

2

3

2

1

(X1-m1)2

3.13

0.59

3.13

0.59

0.10

5.42

(X2-m2)2

8.00

0.02

0.02

0.68

4.70

1.36

(X3-m3)2

1.36

4.70

0.68

0.02

0.02

3.34

ΣΣΣΣX

N

M

s2

(m-M)

(m-M)2

50

6

m1=8.33

2.67

7.12

12.96 35

6

m2=5.83

0.17

0.02

14.78 17

6

m3=2.83

-2.83

8.00

10.14

M=(m1+m2+m3)/3=5.66

ΣΣΣΣ(m-M)2=15.14

„metoda 2”„metoda 1” „metoda 3”

2.59 2.96 2.83

F calculat (6) > F critic (3.6823)

Decizia statistică:

Respingem ipoteza de nul şi acceptăm ipoteza cercetării:

„Nivelul performanţei prezintă o variaţie în legătură cu metoda

de antrenament utilizată”

42.4557.7*62

00.802.012.7*6intergrup

2 ==++

=s

57.73

02.296.259.22

3

2

2

2

1intragrup

2 =++

=++

=grupuriN

ssss

657.7

42.45

intragrup2

intergrup2

===s

sF

Mărimea efectului pentru testul FMărimea efectului pentru testul FMărimea efectului pentru testul FMărimea efectului pentru testul F� Mărimea lui F indică de câte ori este cuprinsă dispersia

intragrup în dispersia intergrup

� Uzual, doi indici de mărime a efectului (ai asocierii):� eta pătrat (η2)� omega pătrat (ω2)

Indicele eta pătrat

� descrie procentul din varianţa (împrăştierea) variabilei dependente care este explicat de varianţa variabilei independente

intragrupintergrup

intergrup2

dfF+∗

∗=df

Fdfη

Indicele eta pătrat

� Variante de interpretare:

0.9-1 Aproape perfect, descrie relaţia dintre două variabile practic indistincte

0.7-0.9 Foarte mare, foarte ridicat

0.5-0.7 Mare, ridicat, major

0.3-0.5 Moderat, mediu

0.1-0.3 Mic, minor

0.0-0.1 Foarte mic, neglijabil, nesubstanţial

0.70 → asociere foarte puternică

0.50 – 0.69 asociere substanţială

0.30 – 0.49 asociere moderată

0.10 – 0.29 asociere scăzută

0.01 – 0.09 asociere neglijabilă

Hopkins (2000):

Davis (citat de Kotrlik şi Williams, 2003)

Pentru exemplul nostru

� Mărime a efectului medie (moderată)

� 44% din variaţia performanţei de instruire este explicată de utilizarea metodelor de antrenament…

� … restul de variabilitate de 54% provine din alte surse

44.01562

62

dfF intragrupintergrup

intergrup2 =+∗

∗=

+∗

∗=df

Fdfη

Indicele f (Cohen) pentru mărimea efectului

� efect mic=0.10

� efect mediu=0.25

� efect mare=0.402

2

1 η

η

−=f

Analiza „postAnaliza „postAnaliza „postAnaliza „post----hoc”hoc”hoc”hoc”

� Testul F spune ceva despre relaţia globală dintre v.dep. şi categoriile v.indep.

� există teste post-hoc, care testează semnificaţia diferenţei dintre categorii, luate două câte două

� Bonferoni, Scheffe, Tuckey...

Publicarea rezultatului testului (ANOVA)Publicarea rezultatului testului (ANOVA)Publicarea rezultatului testului (ANOVA)Publicarea rezultatului testului (ANOVA)

� Grupurile (categoriile) comparate, mediile lor, valoarea testului F, cu numărul gradelor de libertate şi pragul de semnificaţie al testului, mărimea efectului

� Într-o manieră narativă, rezultatul obişnuit pe exemplul de mai sus, poate fi prezentat astfel:� „A fost analizată performanţa în tragerea la ţintă a trei grupuri de sportivi, antrenaţi cu

metode diferite. Mediile performanţei pentru cele trei grupuri au fost 8.33, 5.83, respectiv 2.83. Analiza de varianţă unifactorială a relevat o diferenţă semnificativă între aceste medii, F (2, 15)=6; p≤0.05. Mărimea efectului apreciată cu indicele eta pătrat indică un efect moderat (η2=0.44), în timp ce indicele f al lui Cohen indică un efect mare (f=0.88)”.

Avantajele ANOVAAvantajele ANOVAAvantajele ANOVAAvantajele ANOVA� elimină riscul cumulării unei cantităţi prea mari de eroare de

tip I � pune în evidenţă diferenţe semnificative între mediile mai

multor grupuri, chiar şi atunci când nici una dintre ele nu diferă semnificativ una de cealaltă (testul t)

� poate fi utilizată şi în cazurile în care există numai douăgrupuri (deşi nu este uzual)

v. indep. v. dep.

1 9

1 5

1 7

2 14

2 15

2 10

t=3.13, p=0.035

F=9.82 (t2), p=0.035

Echivalenţa testelor t şi F

pentru compararea a două medii independente

Condiţii de utilizare a testului ANOVACondiţii de utilizare a testului ANOVACondiţii de utilizare a testului ANOVACondiţii de utilizare a testului ANOVA

� independenţa eşantioanelor (grupurilor supuse comparaţiei)� normalitatea distribuţiei de eşantionare, în conformitate cu

teorema limitei centrale� absenţa valorilor extreme (outliers)� egalitatea varianţei grupurilor comparate (denumită

„homoscedasticitate”)� în caz de nerespectare:

� renunţarea la ANOVA în favoarea unei prezentări descriptive � transformarea variabilei dependente astfel încât să dobândească proprietăţile

necesare � transformarea variabilei pe o altă scală de măsurare şi aplicarea altui test

statistic (neparametric)