Author
lamcong
View
216
Download
0
Embed Size (px)
1
DOF610 - Statistiske metoder i medisinsk forskning 2
Variansanalyse
Uke 43–44 Variansanalyse
• Sammenligne gjennomsnitt av kontinuerlige data i ulike grupper (rep. fra DO600)
• Post hoc tester• Variansanalyse med kovariat
– Enveis ANCOVA
• Sammenligning av flere faktorer– Toveis ANOVA med interaksjon– Toveis ANOVA med gjentatte målinger
• Likheten mellom regresjon og variansanalyse• Dekkes av Altman avsnitt 9.8, 9.9, 12.3 og
forelesningsnotatene.
Analysis of variance (ANOVA)
• ANOVA=ANalysis Of Variance
• ANOVA er en samling av statistiske modeller dervariansen i målinger deles inn i komponenter ihenhold til ulike forklaringsvariable.
• Den første som utviklet ANOVA‐metodervar R. A. Fisher i 1920‐årene. F‐fordelingen (Fisher‐fordelingen) somer sentral i ANOVA‐analyser ble blantannet utviklet av han.
3
2
Enveis ANOVA (One‐way ANOVA)
• Sammenligning av gjennomsnitt i flere grupper (for kontinuerlige data)
• Eksempel: – Placebo og to ulike medikamenter for blodtrykk
– Gruppe i får medikament nr i (i = 1, 2, 3)
– Er det forskjell mellom de tre behandlingene?
– I så fall hvilken gir lavest blodtrykk?
4
Enveis ANOVA i SPSS
• Legg alle målingene etter hverandre i en kolonne
• Lag en kolonne til som viser hvilken gruppe hver måling tilhørertilhører
• Som et eksempel skal vi se på dataene i SPSS fila Viagra.sav– Her ligger målingene i
kolonnene libido og gruppen i kolonnen dose.
5
Enveis ANOVA
Start analysen med å plotte dataene:
6
Ved enveis variansanalyse kan vi teste om det er signifikant (=påvisbar) forskjell i gjennomsnittsverdi for de tre gruppene
3
Enveis ANOVA
7
Enveis ANOVA
8
Enveis ANOVA generelt• k grupper
• Nullhypotese, H0: Samme forventningsverdi i alle gruppene, dvsμ1= μ2=…= μk
• Alternativ hypotese, H1 : Ikke samme forventningsverdi i alle gruppene, dvs minst en μi er ulik de andre.
• Forutsetninger:– Normalfordeling innad i hver gruppe
– Lik varians innad i alle gruppene
– Uavhengighet
• Prinsipp: Sammenligner variasjon mellom gruppene med variasjonen innad i gruppene.
4
Enveis ANOVAEnveis variansanalyse undersøker eventuell effekt av én faktor (pasientene deles inn i grupper etter verdi på denne faktoren)
10
Enveis ANOVA
11
Enveis ANOVA
12
5
Enveis ANOVA
13MSEMSA
kNSSEkSSAF =−−
=/
1/
Forkaster nullhypotesen når følgende størrelse er ”stor”:
Enveis ANOVA i SPSS
14
Enveis ANOVA i SPSSDescriptives
Libido
5 2,2000 1,30384 ,58310 ,5811 3,8189 1,00 4,00
5 3,2000 1,30384 ,58310 1,5811 4,8189 2,00 5,00
5 5,0000 1,58114 ,70711 3,0368 6,9632 3,00 7,00
15 3,4667 1,76743 ,45635 2,4879 4,4454 1,00 7,00
Placebo
Low Dose
High Dose
Total
N Mean Std. Deviation Std. Error Lower Bound Upper Bound
95% Confidence Interval forMean
Minimum Maximum
Test of Homogeneity of Variances
15
Libido
,092 2 12 ,913
LeveneStatistic df1 df2 Sig.
ANOVA
Libido
20,133 2 10,067 5,119 ,025
23,600 12 1,967
43,733 14
Between Groups
Within Groups
Total
Sum ofSquares df Mean Square F Sig.
SSASSESST
Ok å anta lik varians!
6
• Residualer beregnes ved å ta hver enkelt observasjon og trekke fra gruppegjennomsnittet:
• Plott av residual mot gruppenummer viser om antagelsen om lik varians i gruppene holder.
• Normalplott av residualene viser om normalfordelingsantagelsen holder.
•− iij yy
Sjekk av antakelser
2
Normal Q-Q Plot of res
Ser ok ut! Observed Value
210-1-2
Exp
ecte
d N
orm
al
1
0
-1
-2
Post‐hoc tester
• Etter at man eventuelt har funnet en signifikant forskjell (som i vårt eksempel) kan man gå videre med konfidensintervall eller tester for differanser mellom to og to grupper for å finne ut hvilke grupper det er som skiller seg fra hverandredet er som skiller seg fra hverandre– Kalles gjerne Post‐hoc tester
– Bør korrigere for multippel testing
17
Post‐hoc i SPSS
18
Gjør her Bonferroni‐korreksjonfor multippel testing.
Betyr at man i hver enkel test bruker nivå α/m, der m er antall tester og α er ”overall”‐nivået man ønsker (typisk 0.05).
7
Post‐hoc i SPSSMultiple Comparisons
Dependent Variable: LibidoBonferroni
-1,00000 ,88694 ,845 -3,4652 1,4652
-2,80000* ,88694 ,025 -5,2652 -,3348
1,00000 ,88694 ,845 -1,4652 3,4652
-1,80000 ,88694 ,196 -4,2652 ,6652
2,80000* ,88694 ,025 ,3348 5,2652
(J) Dose of ViagraLow Dose
High Dose
Placebo
High Dose
Placebo
(I) Dose of ViagraPlacebo
Low Dose
High Dose
MeanDifference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
19
, , , , ,
1,80000 ,88694 ,196 -,6652 4,2652Low Dose
g
The mean difference is significant at the .05 level.*.
Dvs det er signifikant forskjell mellom placebo og ”high dose”, men ikke mellom placebo og ”lowdose” eller mellom ”low dose” og ”high dose”.
Planlagte kontraster
• Noen ganger er man interesserte i å teste hypoteser som for eksempel: H0: µ1=(µ2+µ3)/2 mot H1: µ1≠(µ2+µ3)/2
• Eller: H0: µ1+µ2=µ3+µ4 mot H1: µ1+µ2 ≠ µ3+µ4
• Generelt: H0: c1µ1+c2µ2+…+ckµk=0 mot H1: c1µ1+c2µ2+…+ckµk ≠ 0
• Dette kalles planlagte kontraster, og er et alternativ til å kjøre post hoc tester (ikke gjør begge deler!).
20
Planlagte kontraster i SPSS
• One‐way ANOVA → Contrasts…
21
8
Planlagte kontraster i SPSS
22
Kruskal‐Wallis testen
• Dersom antagelsen om normalfordeling ikke holder kan man i stedet for vanlig enveis ANOVA bruke Kruskal‐Wallis testen.
• Dette er en ikke‐parametriske metode (som ikkeDette er en ikke parametriske metode (som ikke antar normalfordeling) for å sammenligne k grupper.
23
Kruskal‐Wallis testen
24
9
Kruskal‐Wallis testen
• Kruskal‐Wallis test Ranks
5 4,80
5 7,50
5 11,70
15
Dose of ViagraPlacebo
Low Dose
High Dose
Total
LibidoN Mean Rank
b
• En tester deretter de parvise forskjellene med Mann‐Whitney U‐test
25
Test Statisticsa,b
6,200
2
,045
Chi-Square
df
Asymp. Sig.
Libido
Kruskal Wallis Testa.
Grouping Variable: Dose of Viagrab.
Så vidt signifikant
ANCOVA• ANCOVA=ANalysis of COVariance• ANCOVA = ANOVA med kovariat(er)• I en ANCOVA‐analyse inkluderer man kovariater/forklarings‐
variable som ikke er en del av forsøksdesignet men som kan ha en påvirkning på den avhengige variabelen
• Man sier gjerne at man kontrollerer for disse kovariatene. – Eksempel: Medikamenteffekt på libido for menn
korrigert for libido til partner [ViagraCovariate.sav]
26
Hvorfor bruke ANCOVA?
• For å redusere den uforklarte variansen innen grupper • Gjør det lettere å se reelle forskjeller mellom grupper.
• For å eliminere effekten av konfunderende variable• Konfunderende variable vil her være variable som har sammenheng både med grupperingsvariabelen og med
27
sa e e g både ed g uppe gs a abe e og edresponsvariabelen.
• Slike konfunderende variable vil kunne bidra til feilaktige konklusjoner i analysene dersom man ikke justerer for dem.
• I Viagra‐eksemplet vil en variabel være konfunderende dersom den er forskjellig for ulike nivå av dose (som er grupperingsvariabelen) og i tillegg har innflytelse på libido (som er responsvariabelen).
10
ANCOVA i SPSS
28
ANCOVA i SPSS
Tests of Between-Subjects Effects
Dependent Variable: Libido
34,750a 3 11,583 3,952 ,019 ,313
12 171 1 12 171 4 152 052 138
SourceCorrected Model
I t t
Type III Sumof Squares df Mean Square F Sig.
Partial EtaSquared
29
12,171 1 12,171 4,152 ,052 ,138
17,906 1 17,906 6,109 ,020 ,190
28,337 2 14,169 4,833 ,016 ,271
76,216 26 2,931
683,000 30
110,967 29
Intercept
partner
dose
Error
Total
Corrected Total
R Squared = ,313 (Adjusted R Squared = ,234)a.
Mål på effektstørrelse. En tommel-fingerregel sier at effekten er ”stor” når denne er over 0.25.
Signifikant effekt av dose
ANOVA versus Regresjon
• Merk at ANOVA analysene også kan gjøres via en tilsvarende regresjonsanalyse
• Eksempel: Regresjonsmodellen for medikamenteffekt på libido for menn korrigert for libido til partner kanpå libido for menn korrigert for libido til partner kan skrives slik:
30
ε++++= partnerlibidobhøydoseblavdosebblibido 3210 _***
Her er lavdose=1 dersom pasienten er i lavdosegruppen og 0 ellers. Tilsvarende med høydose.
11
Toveis ANOVA (two‐way ANOVA)
• I toveis ANOVA ser vi på effekten av to grupperings‐variable (to ”faktorer” eller to kategoriske kovariater)
• Vi skal se på to typer situasjoner
• To faktorer en måling per enhet
31
• To faktorer, en måling per enhet (pasient)
• Repeterte målinger på samme enhet (pasient) under ulike forhold (f.eks. ved ulike tidspunkt).
Toveis ANOVA• Vi ser først på situasjonen med to faktorer og en måling per enhet (pasient). Vi kan her, som i eksemplet under, ha flere målinger for hver faktorkombinasjon.
32
Toveis ANOVA
33
12
Toveis ANOVA
34
Toveis ANOVA
35
Toveis ANOVA
ANOVA-tabell:
36
13
Toveis ANOVA
• Ved en toveis ANOVA med gjentak (flere målinger for hver faktorkombinasjon) tester man alltid først om det er en samspills‐effekt.
• Dersom det ikke er samspillseffekt kan man gå videre og teste om hver enkelt faktor har betydning.
37
• Dersom det er en samspillseffekt betyr det at effekten av den ene faktoren avhenger av nivået på den andre faktorene.
• Da har begge faktorene betydning, og effekten er mer komplisert enn hva som bare forklares av effekten av hver enkelt faktor alene.
Toveis ANOVA
•Antagelsene for toveis ANOVA er:• Normalfordelte residualer (dvs normalfordelte målinger innen hver faktorkombinasjon).
• Lik varians for alle residualer (samme varians ved alle faktor‐kombinasjoner).
38
kombinasjoner).• Uavhengige målinger.
Toveis ANOVA i SPSS• Datafil: two‐way‐ANOVA.sav
39
14
Toveis ANOVA i SPSS
Descriptive Statistics
Dependent Variable: Utbytte av kjemisk reaksjon
41,0000 1,00000 3
49,3333 1,15470 3
50,0000 1,00000 3
46,7778 4,43784 9
43,0000 1,00000 3
51 0000 1 00000 3
Temperatur140 grader
160 grader
180 grader
Total
140 grader
160 d
Reaksjonstid20 min
30 min
Mean Std. Deviation N
40
51,0000 1,00000 3
52,0000 1,73205 3
48,6667 4,41588 9
44,0000 ,00000 3
52,3333 ,57735 3
54,0000 1,00000 3
50,1111 4,67559 9
42,6667 1,50000 9
50,8889 1,53659 9
52,0000 2,06155 9
48,5185 4,55201 27
160 grader
180 grader
Total
140 grader
160 grader
180 grader
Total
140 grader
160 grader
180 grader
Total
40 min
Total
Toveis ANOVA i SPSSTests of Between-Subjects Effects
Dependent Variable: Utbytte av kjemisk reaksjon
519,407a 8 64,926 60,448 ,000 ,964
63559,259 1 63559,259 59175,862 ,000 1,000
50,296 2 25,148 23,414 ,000 ,722
467,852 2 233,926 217,793 ,000 ,960
1,259 4 ,315 ,293 ,879 ,061
19,333 18 1,074
64098 000 27
SourceCorrected Model
Intercept
Reaksjonstid
Temperatur
Reaksjonstid *Temperatur
Error
Total
Type III Sumof Squares df Mean Square F Sig.
Partial EtaSquared
0H ′′0H ′0H ′′′
41
64098,000 27
538,741 26
Total
Corrected Total
R Squared = ,964 (Adjusted R Squared = ,948)a.
Konklusjoner:
Behold , , det er ikke samspill (p-verdi=0.879)
Forkast , faktor A (reaksjonstid) har betydning (p-verdi<0.0005)
Forkast , faktor B (temperatur) har betydning (p-verdi<0.0005)
Toveis ANOVA i SPSS
Levene's Test of Equality of Error Variances a
Dependent Variable: Utbytte av kjemisk reaksjon
1,525 8 18 ,217F df1 df2 Sig.
Tests the null hypothesis that the error variance ofthe dependent variable is equal across groups.
42
p q g pDesign:Intercept+Reaksjonstid+Temperatur+Reaksjonstid * Temperatur
a.
Antagelsen om lik varians er ok.
15
Toveis ANOVA i SPSS
Contrast Results (K Matrix)
1,889
0
1,889
Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized)
ReaksjonstidSimple Contrast a
Level 2 vs. Level 1
Utbytte avkjemiskreaksjon
Dependent
Variable
43
,489
,001
,862
2,915
3,333
0
3,333
,489
,000
2,307
4,360
Std. Error
Sig.
Lower Bound
Upper Bound
95% Confidence Intervalfor Difference
Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized)
Std. Error
Sig.
Lower Bound
Upper Bound
95% Confidence Intervalfor Difference
Level 3 vs. Level 1
Reference category = 1a.
Toveis ANOVA i SPSS
Contrast Results (K Matrix)
8,222
0
8 222
Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized)
TemperaturSimple Contrast a
Level 2 vs. Level 1
Utbytte avkjemiskreaksjon
Dependent
Variable
44
8,222
,489
,000
7,196
9,249
9,333
0
9,333
,489
,000
8,307
10,360
Std. Error
Sig.
Lower Bound
Upper Bound
95% Confidence Intervalfor Difference
Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized)
Std. Error
Sig.
Lower Bound
Upper Bound
95% Confidence Intervalfor Difference
Level 3 vs. Level 1
Reference category = 1a.
Toveis ANOVA i SPSS
• Test av residualene
45
16
Toveis ANOVA i SPSS
46
Tests of Normality
,167 27 ,052 ,896 27 ,011StandardizedResidual for Utbytte
Statistic df Sig. Statistic df Sig.
Kolmogorov-Smirnova Shapiro-Wilk
Lilliefors Significance Correctiona.
Repeterte målinger ANOVA (Repeated measures ANOVA)
• Et enkelt repeterte målinger design er når det er gjort flere målinger på samme pasient (enhet) på ulike tidspunkt eller under ulike målebetingelser.
• Dette kan analyseres som en toveis ANOVA modell der den ene faktoren er pasient nummer og den andre faktoren er ål tid kt ll ål b ti l
47
måletidspunkt eller målebetingelse.
• Man er da vanligvis bare interessert i om det er en effekt av måletidspunkt/målebetingelse, og ikke i om det er forskjell mellom pasientene.
• Vanligvis bare en måling på hver pasient ved hvert tidpunkt/hver betingelse.
• Kalles av og til også enveis repeterte målinger ANOVA (one‐way repeated measures ANOVA) (men er egentlig en toveis ANOVA..).
Repeterte målinger ANOVA
• Eksempel fra Altmann
48
Enalapril is used in the treatment of hypertension and some types of chronic heart failure. The primary effect of enalapril is to lower blood pressure.
17
Repeterte målinger ANOVA
• Datafil SPSS: Repeated_ANOVA.sav
49
Repeterte målinger ANOVA
Skriv inn et navn selv, spesifiser antall nivå og trykk ”Add”Trykk deretter ”Define”
50
Repeterte målinger ANOVA
51
18
Repeterte målinger ANOVADescriptive Statistics
96,5556 16,44773 9
92,5556 17,84034 9
91,1111 17,18607 9
92,3333 16,54539 9
Beats per minuteat time 0
Beats per minuteat time 30
Beats per minuteat time 60
Beats per minuteat time 120
Mean Std. Deviation N
52
Repeterte målinger ANOVA
Mauchly's Test of Sphericityb
Measure: MEASURE_1
,471 5,066 5 ,412 ,707 ,968 ,333Within Subjects Effecttimefactor
Mauchly's WApprox.
Chi-Square df Sig.Greenhouse-Geisser Huynh-Feldt Lower-bound
Epsilona
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportionalto an identity matrix.
May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed inthe Tests of Within Subjects Effects table
a.
53
the Tests of Within-Subjects Effects table.
Design: Intercept Within Subjects Design: timefactor
b.
Sphericity betyr essensielt sett at alle parvise differanser i gjennomsnitt har samme varians. Dersom denne antagelsen er ok, som her (dvs vi forkaster ikke null‐hypotesen), kan vi bruke en test som bygger på denne antagelsen når vi tester om det er forskjell i responsen på de ulike måletidspunktene.
Repeterte målinger ANOVATests of Within-Subjects Effects
Measure: MEASURE_1
150,972 3 50,324 4,070 ,018 ,337
150,972 2,120 71,226 4,070 ,034 ,337
150,972 2,904 51,988 4,070 ,019 ,337
150,972 1,000 150,972 4,070 ,078 ,337
296,778 24 12,366
296,778 16,957 17,502
296,778 23,232 12,775
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Sourcetimefactor
Error(timefactor)
Type III Sumof Squares df Mean Square F Sig.
Partial EtaSquared
54
296,778 8,000 37,097Lower-bound
Tests of Between-Subjects Effects
Measure: MEASURE_1Transformed Variable: Average
312294,694 1 312294,694 278,631 ,000 ,972
8966,556 8 1120,819
SourceIntercept
Error
Type III Sumof Squares df Mean Square F Sig.
Partial EtaSquared
Dvs signifikant forskjell mellom måletidspunktene!
Også signifikant forskjell mellom pasientene (oftest mindre interessant).
19
Repeterte målinger ANOVATests of Within-Subjects Contrasts
Measure: MEASURE_1
144,000 1 144,000 4,204 ,074
18,778 1 18,778 2,202 ,176
13,444 1 13,444 ,749 ,412
274,000 8 34,250
68,222 8 8,528
143,556 8 17,944
timefactorLevel 1 vs. Level 2
Level 2 vs. Level 3
Level 3 vs. Level 4
Level 1 vs. Level 2
Level 2 vs. Level 3
Level 3 vs. Level 4
Sourcetimefactor
Error(timefactor)
Type III Sumof Squares df Mean Square F Sig.
55
143,556 8 17,944Level 3 vs. Level 4
Repeterte målinger ANOVA
Multivariate Testsb
,493 1,945a 3,000 6,000 ,224 ,493
,507 1,945a 3,000 6,000 ,224 ,493
,973 1,945a 3,000 6,000 ,224 ,493
,973 1,945a 3,000 6,000 ,224 ,493
Pillai's Trace
Wilks' Lambda
Hotelling's Trace
Roy's Largest Root
Effecttimefactor
Value F Hypothesis df Error df Sig.Partial EtaSquared
E t t ti tia
56
Exact statistica.
Design: Intercept Within Subjects Design: timefactor
b.
Disse testene krever ikke sphericity.
Friedmans test• Dersom antagelsen om normalfordelte residualer ikke holder i en repeterte målinger situasjon kan man kjøre en ikke‐parametrisk test som kalles Friedmans test.
57
20
Friedmans test
Mean RankBeats per minute at time 0
3,50
Beats per minute at time 30
2,44
Beats per minute at time 60
1,89
58
Beats per minute at time 120
2,17
N 9Chi-Square 8,506df 3Asymp. Sig. ,037
Signifikant forskjell over tid
ANOVA versus Regresjon
• Også toveis ANOVA kan formuleres som regresjonsmodeller.
• Eksempel: En regresjonsmodell for hjerteratedataene kan skrives:hjerteratedataene kan skrives:
59
9036023011a1a11 TidTidTidPasPasY β+β+β+α++α+μ= −−L
Oppgaver
• Oppgave 1: – I datafila survey.sav har en registrert total optimisme for tre aldersgrupper
– Gjør en enveis ANOVA i SPSS med tilhørende plottGjør en enveis ANOVA i SPSS med tilhørende plott og post.hoc. tester
60
21
• Oppgave 2– Åpne fila HangoverCure.sav i SPSS
– En har målt hvordan ulike personer føler seg dagen derpå. Personene er delt inn i tre grupper som får forskjellig drink til frokost etter en fuktig natt på byen
1. Analyser om type frokostdrikk (drink) hadde betydning for hvordan de følte seg dagen der på (bruk enveis ANOVA)
2 Gjør det samme som i 1 men kontroller for hvor fulle (drunk)
61
2. Gjør det samme som i 1, men kontroller for hvor fulle (drunk) personene hadde vært natten før (bruk enveis ANCOVA)
3. Kommenter forskjellen mellom analyse 1 og 2
• Oppgave 3 (toveis ANOVA)
– I datafila survey.sav har en registrert total optimisme for tre aldersgrupper og kjønn.
Studer forskjellen i gjennomsnittlig optimisme mellom de tre aldersgruppene og kjønn.
å d f l d
62
Gjør en toveis ANOVA i SPSS på datafila survey.sav med tilhørende plott og tester.
• Oppgave 4– Gjør selv de samme analysene av hjerteratedataene i Repeated_ANOVA.sav som vi har gått gjennom på forelesing.
– Eksperimenter med ulike kontraster.