21
1 DOF610 - Statistiske metoder i medisinsk forskning 2 Variansanalyse Uke 43–44 Variansanalyse Sammenligne gjennomsnitt av kontinuerlige data i ulike grupper (rep. fra DO600) Post hoc tester Variansanalyse med kovariat Enveis ANCOVA Sammenligning av flere faktorer Toveis ANOVA med interaksjon Toveis ANOVA med gjentatte målinger Likheten mellom regresjon og variansanalyse Dekkes av Altman avsnitt 9.8, 9.9, 12.3 og forelesningsnotatene. Analysis of variance (ANOVA) ANOVA=ANalysis Of Variance ANOVA er en samling av statistiske modeller der variansen i målinger deles inn i komponenter i henhold til ulike forklaringsvariable. Den første som utviklet ANOVAmetoder var R. A. Fisher i 1920årene. Ffordelingen (Fisherfordelingen) som er sentral i ANOVAanalyser ble blant annet utviklet av han. 3

variance (ANOVA) - ux.uis.no · Enveis variansanalyse undersøker eventuell effekt av én faktor ... Toveis ANOVA (two‐way ANOVA) • I toveis ANOVA ser vi på effekten av to

  • Upload
    lamcong

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

1

DOF610 - Statistiske metoder i medisinsk forskning 2

Variansanalyse

Uke 43–44 Variansanalyse

• Sammenligne gjennomsnitt av kontinuerlige data i ulike grupper (rep. fra DO600)

• Post hoc tester• Variansanalyse med kovariat

– Enveis ANCOVA

• Sammenligning av flere faktorer– Toveis ANOVA med interaksjon– Toveis ANOVA med gjentatte målinger

• Likheten mellom regresjon og variansanalyse• Dekkes av Altman avsnitt 9.8, 9.9, 12.3 og

forelesningsnotatene.

Analysis of variance (ANOVA)

• ANOVA=ANalysis Of Variance

• ANOVA er en samling av statistiske modeller dervariansen i målinger deles inn i komponenter ihenhold til ulike forklaringsvariable.

• Den første som utviklet ANOVA‐metodervar R. A. Fisher i 1920‐årene.                                         F‐fordelingen (Fisher‐fordelingen) somer sentral i ANOVA‐analyser ble blantannet utviklet av han. 

3

2

Enveis ANOVA (One‐way ANOVA)

• Sammenligning av gjennomsnitt i flere grupper (for kontinuerlige data)

• Eksempel: – Placebo og to ulike medikamenter for blodtrykk

– Gruppe i får medikament nr i   (i = 1, 2, 3)

– Er det forskjell mellom de tre behandlingene?

– I så fall hvilken gir lavest blodtrykk?

4

Enveis ANOVA i SPSS

• Legg alle målingene etter hverandre i en kolonne

• Lag en kolonne til som viser hvilken gruppe hver måling tilhørertilhører 

• Som et eksempel skal vi se på dataene i SPSS fila Viagra.sav– Her ligger målingene i 

kolonnene libido og gruppen i kolonnen dose.

5

Enveis ANOVA

Start analysen med å plotte dataene:

6

Ved enveis variansanalyse kan vi teste om det er signifikant (=påvisbar) forskjell i gjennomsnittsverdi for de tre gruppene

3

Enveis ANOVA

7

Enveis ANOVA

8

Enveis ANOVA generelt• k grupper 

• Nullhypotese, H0:  Samme forventningsverdi i alle gruppene, dvsμ1= μ2=…= μk

• Alternativ hypotese, H1 : Ikke samme forventningsverdi i alle  gruppene, dvs minst en μi  er ulik de andre. 

• Forutsetninger:– Normalfordeling innad i hver gruppe

– Lik varians innad i alle gruppene

– Uavhengighet

• Prinsipp:  Sammenligner variasjon mellom gruppene med variasjonen innad i gruppene. 

4

Enveis ANOVAEnveis variansanalyse undersøker eventuell effekt av én faktor (pasientene deles inn i grupper etter verdi på denne faktoren)

10

Enveis ANOVA

11

Enveis ANOVA

12

5

Enveis ANOVA

13MSEMSA

kNSSEkSSAF =−−

=/

1/

Forkaster nullhypotesen når følgende størrelse er ”stor”:

Enveis ANOVA i SPSS

14

Enveis ANOVA i SPSSDescriptives

Libido

5 2,2000 1,30384 ,58310 ,5811 3,8189 1,00 4,00

5 3,2000 1,30384 ,58310 1,5811 4,8189 2,00 5,00

5 5,0000 1,58114 ,70711 3,0368 6,9632 3,00 7,00

15 3,4667 1,76743 ,45635 2,4879 4,4454 1,00 7,00

Placebo

Low Dose

High Dose

Total

N Mean Std. Deviation Std. Error Lower Bound Upper Bound

95% Confidence Interval forMean

Minimum Maximum

Test of Homogeneity of Variances

15

Libido

,092 2 12 ,913

LeveneStatistic df1 df2 Sig.

ANOVA

Libido

20,133 2 10,067 5,119 ,025

23,600 12 1,967

43,733 14

Between Groups

Within Groups

Total

Sum ofSquares df Mean Square F Sig.

SSASSESST

Ok å anta lik varians!

6

• Residualer beregnes ved å ta hver enkelt observasjon og trekke fra gruppegjennomsnittet:

• Plott av residual mot gruppenummer viser om antagelsen om lik varians i gruppene  holder.

• Normalplott av residualene viser om normalfordelingsantagelsen holder. 

•− iij yy

Sjekk av antakelser

2

Normal Q-Q Plot of res

Ser ok ut! Observed Value

210-1-2

Exp

ecte

d N

orm

al

1

0

-1

-2

Post‐hoc tester

• Etter at man eventuelt har funnet en signifikant forskjell (som i vårt eksempel) kan man gå videre med konfidensintervall eller tester for differanser mellom to og to grupper for å finne ut hvilke grupper det er som skiller seg fra hverandredet er som skiller seg fra hverandre– Kalles gjerne Post‐hoc tester

– Bør korrigere for multippel testing

17

Post‐hoc i SPSS

18

Gjør her Bonferroni‐korreksjonfor multippel testing. 

Betyr at man i hver enkel test bruker nivå α/m, der m er antall tester og α er ”overall”‐nivået man ønsker (typisk 0.05). 

7

Post‐hoc i SPSSMultiple Comparisons

Dependent Variable: LibidoBonferroni

-1,00000 ,88694 ,845 -3,4652 1,4652

-2,80000* ,88694 ,025 -5,2652 -,3348

1,00000 ,88694 ,845 -1,4652 3,4652

-1,80000 ,88694 ,196 -4,2652 ,6652

2,80000* ,88694 ,025 ,3348 5,2652

(J) Dose of ViagraLow Dose

High Dose

Placebo

High Dose

Placebo

(I) Dose of ViagraPlacebo

Low Dose

High Dose

MeanDifference

(I-J) Std. Error Sig. Lower Bound Upper Bound

95% Confidence Interval

19

, , , , ,

1,80000 ,88694 ,196 -,6652 4,2652Low Dose

g

The mean difference is significant at the .05 level.*.

Dvs det er signifikant forskjell mellom placebo og ”high dose”, men ikke mellom placebo og ”lowdose” eller mellom ”low dose” og ”high dose”. 

Planlagte kontraster

• Noen ganger er man interesserte i å teste hypoteser som for eksempel:                                    H0: µ1=(µ2+µ3)/2 mot  H1: µ1≠(µ2+µ3)/2

• Eller:                                                                               H0: µ1+µ2=µ3+µ4  mot  H1: µ1+µ2 ≠ µ3+µ4

• Generelt:                                                                       H0: c1µ1+c2µ2+…+ckµk=0 mot H1: c1µ1+c2µ2+…+ckµk ≠ 0

• Dette kalles planlagte kontraster, og er et alternativ til å kjøre post hoc tester (ikke gjør begge deler!). 

20

Planlagte kontraster i SPSS

• One‐way ANOVA  → Contrasts…

21

8

Planlagte kontraster i SPSS

22

Kruskal‐Wallis testen

• Dersom antagelsen om normalfordeling ikke holder kan man i stedet for vanlig enveis ANOVA bruke Kruskal‐Wallis testen. 

• Dette er en ikke‐parametriske metode (som ikkeDette er en ikke parametriske metode (som ikke antar normalfordeling) for å sammenligne k grupper.

23

Kruskal‐Wallis testen

24

9

Kruskal‐Wallis testen

• Kruskal‐Wallis test Ranks

5 4,80

5 7,50

5 11,70

15

Dose of ViagraPlacebo

Low Dose

High Dose

Total

LibidoN Mean Rank

b

• En tester deretter de parvise forskjellene med Mann‐Whitney U‐test

25

Test Statisticsa,b

6,200

2

,045

Chi-Square

df

Asymp. Sig.

Libido

Kruskal Wallis Testa.

Grouping Variable: Dose of Viagrab.

Så vidt signifikant

ANCOVA• ANCOVA=ANalysis of COVariance• ANCOVA = ANOVA med kovariat(er)• I en ANCOVA‐analyse inkluderer man kovariater/forklarings‐

variable som ikke er en del av forsøksdesignet men som kan ha en påvirkning på den avhengige variabelen

• Man sier gjerne at man kontrollerer for disse kovariatene. – Eksempel: Medikamenteffekt på libido for menn 

korrigert for libido til partner  [ViagraCovariate.sav]

26

Hvorfor bruke ANCOVA?

• For å redusere den uforklarte variansen innen grupper • Gjør det lettere å se reelle forskjeller mellom grupper.

• For å eliminere effekten av konfunderende variable• Konfunderende variable vil her være variable som har sammenheng både med grupperingsvariabelen og med 

27

sa e e g både ed g uppe gs a abe e og edresponsvariabelen. 

• Slike konfunderende variable vil kunne bidra til feilaktige konklusjoner i analysene dersom man ikke justerer for dem.

• I Viagra‐eksemplet  vil  en variabel være konfunderende dersom den er forskjellig for ulike nivå av dose (som er grupperingsvariabelen) og i tillegg har innflytelse på libido (som er responsvariabelen).

10

ANCOVA i SPSS

28

ANCOVA i SPSS

Tests of Between-Subjects Effects

Dependent Variable: Libido

34,750a 3 11,583 3,952 ,019 ,313

12 171 1 12 171 4 152 052 138

SourceCorrected Model

I t t

Type III Sumof Squares df Mean Square F Sig.

Partial EtaSquared

29

12,171 1 12,171 4,152 ,052 ,138

17,906 1 17,906 6,109 ,020 ,190

28,337 2 14,169 4,833 ,016 ,271

76,216 26 2,931

683,000 30

110,967 29

Intercept

partner

dose

Error

Total

Corrected Total

R Squared = ,313 (Adjusted R Squared = ,234)a.

Mål på effektstørrelse. En tommel-fingerregel sier at effekten er ”stor” når denne er over 0.25.

Signifikant effekt av dose

ANOVA versus Regresjon

• Merk at ANOVA analysene også kan gjøres via en tilsvarende regresjonsanalyse

• Eksempel: Regresjonsmodellen for medikamenteffekt på libido for menn korrigert for libido til partner kanpå libido for menn korrigert for libido til partner kan skrives slik:

30

ε++++= partnerlibidobhøydoseblavdosebblibido 3210 _***

Her er lavdose=1 dersom pasienten er i lavdosegruppen og 0 ellers. Tilsvarende med høydose. 

11

Toveis ANOVA (two‐way ANOVA)

• I toveis ANOVA ser vi på effekten av to grupperings‐variable (to ”faktorer” eller to kategoriske kovariater)

• Vi skal se på to typer situasjoner

• To faktorer en måling per enhet

31

• To faktorer, en måling per enhet (pasient)

• Repeterte målinger på samme enhet (pasient) under ulike forhold (f.eks. ved ulike tidspunkt).

Toveis ANOVA• Vi ser først på situasjonen med to faktorer og en måling per enhet (pasient). Vi kan her, som i eksemplet under, ha flere målinger for hver faktorkombinasjon.

32

Toveis ANOVA

33

12

Toveis ANOVA

34

Toveis ANOVA

35

Toveis ANOVA

ANOVA-tabell:

36

13

Toveis ANOVA

• Ved en toveis ANOVA med gjentak (flere målinger for hver faktorkombinasjon) tester man alltid først om det er en samspills‐effekt. 

• Dersom det ikke er samspillseffekt kan man gå videre og teste om hver enkelt faktor har betydning. 

37

• Dersom det er en samspillseffekt betyr det at effekten av den ene faktoren avhenger av nivået på den andre faktorene. 

• Da har begge faktorene betydning, og effekten er mer komplisert enn hva som bare forklares av effekten av hver enkelt faktor alene. 

Toveis ANOVA

•Antagelsene for toveis ANOVA er:• Normalfordelte residualer (dvs normalfordelte målinger innen hver faktorkombinasjon).

• Lik varians for alle residualer (samme varians ved alle faktor‐kombinasjoner).

38

kombinasjoner).• Uavhengige målinger.

Toveis ANOVA i SPSS• Datafil: two‐way‐ANOVA.sav

39

14

Toveis ANOVA i SPSS

Descriptive Statistics

Dependent Variable: Utbytte av kjemisk reaksjon

41,0000 1,00000 3

49,3333 1,15470 3

50,0000 1,00000 3

46,7778 4,43784 9

43,0000 1,00000 3

51 0000 1 00000 3

Temperatur140 grader

160 grader

180 grader

Total

140 grader

160 d

Reaksjonstid20 min

30 min

Mean Std. Deviation N

40

51,0000 1,00000 3

52,0000 1,73205 3

48,6667 4,41588 9

44,0000 ,00000 3

52,3333 ,57735 3

54,0000 1,00000 3

50,1111 4,67559 9

42,6667 1,50000 9

50,8889 1,53659 9

52,0000 2,06155 9

48,5185 4,55201 27

160 grader

180 grader

Total

140 grader

160 grader

180 grader

Total

140 grader

160 grader

180 grader

Total

40 min

Total

Toveis ANOVA i SPSSTests of Between-Subjects Effects

Dependent Variable: Utbytte av kjemisk reaksjon

519,407a 8 64,926 60,448 ,000 ,964

63559,259 1 63559,259 59175,862 ,000 1,000

50,296 2 25,148 23,414 ,000 ,722

467,852 2 233,926 217,793 ,000 ,960

1,259 4 ,315 ,293 ,879 ,061

19,333 18 1,074

64098 000 27

SourceCorrected Model

Intercept

Reaksjonstid

Temperatur

Reaksjonstid *Temperatur

Error

Total

Type III Sumof Squares df Mean Square F Sig.

Partial EtaSquared

0H ′′0H ′0H ′′′

41

64098,000 27

538,741 26

Total

Corrected Total

R Squared = ,964 (Adjusted R Squared = ,948)a.

Konklusjoner:

Behold , , det er ikke samspill (p-verdi=0.879)

Forkast , faktor A (reaksjonstid) har betydning (p-verdi<0.0005)

Forkast , faktor B (temperatur) har betydning (p-verdi<0.0005)

Toveis ANOVA i SPSS

Levene's Test of Equality of Error Variances a

Dependent Variable: Utbytte av kjemisk reaksjon

1,525 8 18 ,217F df1 df2 Sig.

Tests the null hypothesis that the error variance ofthe dependent variable is equal across groups.

42

p q g pDesign:Intercept+Reaksjonstid+Temperatur+Reaksjonstid * Temperatur

a.

Antagelsen om lik varians er ok. 

15

Toveis ANOVA i SPSS

Contrast Results (K Matrix)

1,889

0

1,889

Contrast Estimate

Hypothesized Value

Difference (Estimate - Hypothesized)

ReaksjonstidSimple Contrast a

Level 2 vs. Level 1

Utbytte avkjemiskreaksjon

Dependent

Variable

43

,489

,001

,862

2,915

3,333

0

3,333

,489

,000

2,307

4,360

Std. Error

Sig.

Lower Bound

Upper Bound

95% Confidence Intervalfor Difference

Contrast Estimate

Hypothesized Value

Difference (Estimate - Hypothesized)

Std. Error

Sig.

Lower Bound

Upper Bound

95% Confidence Intervalfor Difference

Level 3 vs. Level 1

Reference category = 1a.

Toveis ANOVA i SPSS

Contrast Results (K Matrix)

8,222

0

8 222

Contrast Estimate

Hypothesized Value

Difference (Estimate - Hypothesized)

TemperaturSimple Contrast a

Level 2 vs. Level 1

Utbytte avkjemiskreaksjon

Dependent

Variable

44

8,222

,489

,000

7,196

9,249

9,333

0

9,333

,489

,000

8,307

10,360

Std. Error

Sig.

Lower Bound

Upper Bound

95% Confidence Intervalfor Difference

Contrast Estimate

Hypothesized Value

Difference (Estimate - Hypothesized)

Std. Error

Sig.

Lower Bound

Upper Bound

95% Confidence Intervalfor Difference

Level 3 vs. Level 1

Reference category = 1a.

Toveis ANOVA i SPSS

• Test av residualene

45

16

Toveis ANOVA i SPSS

46

Tests of Normality

,167 27 ,052 ,896 27 ,011StandardizedResidual for Utbytte

Statistic df Sig. Statistic df Sig.

Kolmogorov-Smirnova Shapiro-Wilk

Lilliefors Significance Correctiona.

Repeterte målinger ANOVA (Repeated measures ANOVA)

• Et enkelt repeterte målinger design er når det er gjort flere målinger på samme pasient (enhet) på ulike tidspunkt eller under  ulike målebetingelser. 

• Dette kan analyseres som en toveis ANOVA modell der den ene faktoren er pasient nummer og den andre faktoren er ål tid kt ll ål b ti l

47

måletidspunkt eller målebetingelse.

• Man er da vanligvis bare interessert i om det er en effekt av måletidspunkt/målebetingelse, og ikke i om det er forskjell mellom pasientene. 

• Vanligvis bare en måling på hver pasient ved hvert tidpunkt/hver betingelse. 

• Kalles av og til også enveis repeterte målinger ANOVA (one‐way repeated measures ANOVA) (men er egentlig en toveis ANOVA..).

Repeterte målinger ANOVA

• Eksempel fra Altmann

48

Enalapril is used in the treatment of hypertension and some types of chronic heart failure. The primary effect of enalapril is to lower blood pressure.

17

Repeterte målinger ANOVA

• Datafil SPSS:  Repeated_ANOVA.sav

49

Repeterte målinger ANOVA

Skriv inn et navn selv, spesifiser antall nivå og trykk ”Add”Trykk deretter ”Define”

50

Repeterte målinger ANOVA

51

18

Repeterte målinger ANOVADescriptive Statistics

96,5556 16,44773 9

92,5556 17,84034 9

91,1111 17,18607 9

92,3333 16,54539 9

Beats per minuteat time 0

Beats per minuteat time 30

Beats per minuteat time 60

Beats per minuteat time 120

Mean Std. Deviation N

52

Repeterte målinger ANOVA

Mauchly's Test of Sphericityb

Measure: MEASURE_1

,471 5,066 5 ,412 ,707 ,968 ,333Within Subjects Effecttimefactor

Mauchly's WApprox.

Chi-Square df Sig.Greenhouse-Geisser Huynh-Feldt Lower-bound

Epsilona

Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportionalto an identity matrix.

May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed inthe Tests of Within Subjects Effects table

a.

53

the Tests of Within-Subjects Effects table.

Design: Intercept Within Subjects Design: timefactor

b.

Sphericity betyr essensielt sett at alle parvise differanser i gjennomsnitt har samme varians. Dersom denne antagelsen er ok, som her (dvs vi forkaster ikke null‐hypotesen), kan vi bruke en test som bygger på denne antagelsen når vi tester om det er forskjell i responsen på de ulike måletidspunktene. 

Repeterte målinger ANOVATests of Within-Subjects Effects

Measure: MEASURE_1

150,972 3 50,324 4,070 ,018 ,337

150,972 2,120 71,226 4,070 ,034 ,337

150,972 2,904 51,988 4,070 ,019 ,337

150,972 1,000 150,972 4,070 ,078 ,337

296,778 24 12,366

296,778 16,957 17,502

296,778 23,232 12,775

Sphericity Assumed

Greenhouse-Geisser

Huynh-Feldt

Lower-bound

Sphericity Assumed

Greenhouse-Geisser

Huynh-Feldt

Sourcetimefactor

Error(timefactor)

Type III Sumof Squares df Mean Square F Sig.

Partial EtaSquared

54

296,778 8,000 37,097Lower-bound

Tests of Between-Subjects Effects

Measure: MEASURE_1Transformed Variable: Average

312294,694 1 312294,694 278,631 ,000 ,972

8966,556 8 1120,819

SourceIntercept

Error

Type III Sumof Squares df Mean Square F Sig.

Partial EtaSquared

Dvs signifikant forskjell mellom måletidspunktene!

Også signifikant forskjell mellom pasientene (oftest mindre interessant).

19

Repeterte målinger ANOVATests of Within-Subjects Contrasts

Measure: MEASURE_1

144,000 1 144,000 4,204 ,074

18,778 1 18,778 2,202 ,176

13,444 1 13,444 ,749 ,412

274,000 8 34,250

68,222 8 8,528

143,556 8 17,944

timefactorLevel 1 vs. Level 2

Level 2 vs. Level 3

Level 3 vs. Level 4

Level 1 vs. Level 2

Level 2 vs. Level 3

Level 3 vs. Level 4

Sourcetimefactor

Error(timefactor)

Type III Sumof Squares df Mean Square F Sig.

55

143,556 8 17,944Level 3 vs. Level 4

Repeterte målinger ANOVA

Multivariate Testsb

,493 1,945a 3,000 6,000 ,224 ,493

,507 1,945a 3,000 6,000 ,224 ,493

,973 1,945a 3,000 6,000 ,224 ,493

,973 1,945a 3,000 6,000 ,224 ,493

Pillai's Trace

Wilks' Lambda

Hotelling's Trace

Roy's Largest Root

Effecttimefactor

Value F Hypothesis df Error df Sig.Partial EtaSquared

E t t ti tia

56

Exact statistica.

Design: Intercept Within Subjects Design: timefactor

b.

Disse testene krever ikke sphericity.

Friedmans test• Dersom antagelsen om normalfordelte residualer ikke holder i en repeterte målinger situasjon kan man kjøre en ikke‐parametrisk test som kalles Friedmans test.

57

20

Friedmans test

Mean RankBeats per minute at time 0

3,50

Beats per minute at time 30

2,44

Beats per minute at time 60

1,89

58

Beats per minute at time 120

2,17

N 9Chi-Square 8,506df 3Asymp. Sig. ,037

Signifikant forskjell over tid

ANOVA versus Regresjon

• Også toveis ANOVA kan formuleres som regresjonsmodeller.

• Eksempel: En regresjonsmodell for hjerteratedataene kan skrives:hjerteratedataene kan skrives:

59

9036023011a1a11 TidTidTidPasPasY β+β+β+α++α+μ= −−L

Oppgaver

• Oppgave 1: – I datafila survey.sav har en registrert total optimisme for tre aldersgrupper

– Gjør en enveis ANOVA i SPSS med tilhørende plottGjør en enveis ANOVA i SPSS med tilhørende plott og post.hoc. tester

60

21

• Oppgave 2– Åpne fila HangoverCure.sav i SPSS

– En har målt hvordan ulike personer føler seg  dagen derpå. Personene er delt inn i tre grupper som får forskjellig drink til frokost etter en fuktig natt på byen

1. Analyser om type frokostdrikk (drink) hadde betydning for  hvordan de følte seg dagen der på (bruk enveis ANOVA)

2 Gjør det samme som i 1 men kontroller for hvor fulle (drunk)

61

2. Gjør det samme som i 1, men kontroller for hvor fulle (drunk) personene hadde vært natten før (bruk enveis ANCOVA)

3. Kommenter forskjellen mellom analyse 1 og 2

• Oppgave 3 (toveis ANOVA) 

– I datafila survey.sav har en registrert total optimisme for tre aldersgrupper og kjønn.

Studer forskjellen i gjennomsnittlig optimisme mellom de tre aldersgruppene og kjønn.

å d f l d

62

Gjør en toveis ANOVA i SPSS på datafila survey.sav med tilhørende plott og tester.

• Oppgave 4– Gjør selv de samme analysene av hjerteratedataene i Repeated_ANOVA.sav som vi har gått gjennom på forelesing.

– Eksperimenter med ulike kontraster.