66
Basal Statistik Variansanalyse 24 september 2013

Basal Statistik Variansanalyse

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Basal Statistik Variansanalyse

24 september 2013

Michael GamborgInstitut for sygdomsforebyggelse Københavns Universitetshospital

[email protected]

Lene Theil Skovgaard biostat.ku.dk/~lts/basal/overheads/anova.pdf

E2013 Basal Statistik - Variansanalyse 3

Variansanalyse

• Fordelingsantagelse• En-sidet• To-sidet• Interaktion• Model kontrol

ANOVA

ANalysis Of VAriance

E2013 Basal Statistik - Variansanalyse 4

Variansanalyse

• Typiske problemstillinger– Hvordan afhænger

behandlingen afsygdomstadium

– Er der forskel i effekten afdiverse præperater tilnedsættelse af blodtrykket

– Afhænger lungefunktionenaf rygestatus? Og affysiskaktivitet?

• Datastruktur• Ensidet variansanalyse

– Et antal personer (N) opdelt i veldefinerede grupper (k)

• Tosidet variansanalyse– Personerne er inddelt efter

flere forskellige indelingskriterier, f. eks. Rygning og fysiskaktivitet

E2013 Basal Statistik - Variansanalyse 5

Variansanalyse

• Én-sidet En faktor med mere end 2 grupper

• To-sidet To faktorer

• Fler-sidet Flere faktorer

En-sidet variansanalyse med 2 grupper eller niveauer er præcis det samme som et t-test

E2013 Basal Statistik - Variansanalyse 6

Variansanalyse

• Sammenligner varianser mellem grupper med varianser indenfor grupper

• Variansen inden for grupper er den biologiske variation.

• Hvis den biologiske variation er stor vil den tilfældige variation mellem grupperne også blive stor

E2013 Basal Statistik - Variansanalyse 7

Én-sidet Variansanalyse

• Kvalitativ faktor & kvantitativ respons• Eksempel: 22 ptt. bypass-operationer, 3 slags

ventilation (randomiseret)Gruppe I 50% N2O, 50% O2 i 24 timer

Gruppe II 50% N2O, 50% O2 under op.

Gruppe III 30–50% O2 (ingen N2O) i 24 timer

• Er der forskel på fordelingen af responset (red cell foliate) i de tre grupper?

• Er der forskel på niveauerne i de tre grupper?

E2013 Basal Statistik - Variansanalyse 8

Én-sidet Variansanalyse

• Kan vi ikke bare sammenligne grupperne parvis med t-test

• Problem: Massesignifikans

• (se senere)axis1 ORDER = (1 to 3 by 1) OFFSET=(8,8)

LABEL=(H=2 'gruppe nr.') VALUE=(H=2) MINOR=none ;axis2 OFFSET=(1,1) LABEL=(a=90 R=0 H=2 'red cell foliate')

VALUE=(H=2) MINOR=none ;symbol1 V=circle I=none H=2 C=black ;

PROC GPLOT DATA=sasuser.redcell;PLOT redcell*grp/frame haxis=axis1 vaxis=axis2;RUN;

E2013 Basal Statistik - Variansanalyse 9

Én-sidet Variansanalyse

Én-sidet• Der kun er et inddelings-

kriterium, – f.eks. som her

ventileringsmetode

Variansanalyse:• Fordi man sammenligner

variansen mellem grupper med variansen indenfor grupper

Antagelser:• Alle observationer er

uafhængige(personerne går ikke igen flere gange, ingen tvillinger o.l.)

• Inden for hver gruppe er observationerne normalfordelt

• Der er samme varians indenfor grupperne

E2013 Basal Statistik - Variansanalyse 10

Én-sidet Variansanalyse

i’te observation individueli gruppe nr. g afvigelse

middelværdi forgruppe nr. g

giggiY εµ +=

),0(~ 2σε Ngi) ,(~ 2σµggi NY

Model

Observationerne antages at følge en normalfordeling (inden for hver gruppe) med samme varians.

E2013 Basal Statistik - Variansanalyse 11

• Vi undersøger om alle k grupper kan tænkes at have samme middelværdi

Én-sidet Variansanalyse

kH µµµ === L210 :

• Variansestimaterne for hver gruppe pooles til et fælles estimat for variansen indenfor grupper

• H0 testes ved at betragte forholdet mellemvariationen mellem grupper og det fælles estimat for variansen indenfor grupper

E2013 Basal Statistik - Variansanalyse 12

Kvadratsummer

• Opspaltning af observationer:

i-te observation i g-te gruppe

gennemsnit i g-te gruppetotalgennemsnit

44344214434421grupper mellem

,

2

grupperindenfor

,

2

,

2 .)( )( .)( ∑∑∑ −+−=−gi

g

gi

ggi

gi

gi yyyyyy

( ) ( )⋅⋅ −+−=− yyyyyy gggigi

gygiy

⋅y

• Opspaltning af variation (kvadratsum, sum of squares, SAK/SS):

E2013 Basal Statistik - Variansanalyse 13

Kvadratsummer

44344214434421grupper mellem

,

2

grupperindenfor

,

2

,

2 .)( )( )( ∑∑∑ −+−=−gi

g

gi

ggi

gi

gi yyyyyy

SStot = SSw + SSb

SSDtot = SSDw + SSDb

SAK: Sum af Afvigelses Kvadrater

SS(D): Sum of Squares (of deviation)

SAKtot = SAKres+SAKgrp

E2013 Basal Statistik - Variansanalyse 14

• Opdeling af variansen

– Mellem grupper SAKgrp (SSb)

– Indenfor grupper SAKres (SSw)

• Total variationen SAKtot (SStot)opdeles i de to varians-komponenter

SAKtot = SAKgrp + SAKres

Kvadratsummer

E2013 Basal Statistik - Variansanalyse 15

Mellem grupper

• De forskelle der er mellem f.eks. Rygere og ikke-ryger eller mellem social klasser

Indenfor grupper

• De forskelle der er mellem f.eks. Individer

Indenfor grupper-variansen kaldes også residual

eller rest-variansen.

Kvadratsummer

E2013 Basal Statistik - Variansanalyse 16

F-Test

• Middelkvadratsummer (Mean Squares MS)– MSw = SSw / (N-k): Poolet varians – MSb = SSb / (k-1): Varians mellem gruppe

gennemsnittene

• Teststørrelse: w

b

MS

MSF =

• Vi forkaster hvis F er stor, altså hvis variationen mellem grupperne er stor i forhold til variationen indenfor grupper

E2013 Basal Statistik - Variansanalyse 17

Variansanalyseskema

Varianstype SS df MS F = Mellem grp. SS k-1 SS/df MS/MS

Indenf. grp SS N-k SS/df

Total N-1

Varianstype SS df MS F = Mellem grp. 15515.88 2 7757.9 3.71Indenf. grp 39716.09 19 2090.3

Total 55231.97 21

E2013 Basal Statistik - Variansanalyse 18

Ensidet ANOVA i SAS• Data sættes op i 2 variabler, en med outcome (redcell) og en med

klassifikationsvariablen (grp)PROC GLM DATA=sasuser.redcell;CLASS grp;MODEL redcell=grp;RUN;

Sum ofSource DF Squares Mean Square F Value Pr > FModel 2 15515.76641 7757.88321 3.71 0.0436Error 19 39716.09722 2090.32091Corrected Total 21 55231.86364

R-Square Coeff Var Root MSE redcell Mean0.280921 16.14252 45.72003 283.2273

Source DF Anova SS Mean Square F Value Pr Fgrp 2 15515.76641 7757.88321 3.71 0.0436

E2013 Basal Statistik - Variansanalyse 19

Ensidet ANOVA i SAS

• Hvis man også vil have estimater og konfidensgrænser ....og det vil man ALTID:

PROC GLM DATA=sasuser.redcell;CLASS grp;MODEL redcell=grp / solution clparm;RUN;

E2013 Basal Statistik - Variansanalyse 20

Normalfordelingsantagelsen• Det er antaget, at observationerne følger en

normalfordeling inden for hver gruppe

• Dette bør checkes, f.eks.:

– ved at tegne histogrammer eller fraktil-diagrammer for hver gruppe

– ved at tegne histogram eller fraktildiagram for residualerne

_

ˆggiggigi YYYr −=−= µ

– ved at lave normalfordelingstest, enten for hver gruppe for sig, eller samlet for residualerne

E2013 Basal Statistik - Variansanalyse 21

Normalfordelingsantagelsen

PROC GLM DATA=sasuser.redcell;CLASS grp;MODEL redcell=grp / solution clparm;OUTPUT OUT=ny P=predikt R=resid;RUN;QUIT;PROC UNIVARIATE normal DATA=ny;VAR resid;HISTOGRAM / normal cfill=gray height=3;PROBPLOT / normal(MU=est SIGMA=est L=33);RUN;

E2013 Basal Statistik - Variansanalyse 22

Flot er det jo ikke – men hvad kan man forvente med kun 22 observationer....

Normalfordelingsantagelsen

Histogram, med overlejret normalfordeling:

E2013 Basal Statistik - Variansanalyse 23

Tests for NormalityTest ------Statistic------- --------p Value---------Shapiro-Wilk W 0.965996 Pr < W 0.6188Kolmogorov-Smirnov D 0.107925 Pr > D >0.1500Cramer-von Mises W-Sq 0.043461 Pr >W-Sq >0.2500Anderson-Darling A-Sq 0.263301 Pr > A-Sq >0.2500

Her er normalfordelingsantagelsen tilsyneladende OK

• Probability plot:

Normalfordelingsantagelsen

• Normalfordelingstest:

E2013 Basal Statistik - Variansanalyse 24

Varianshomogenitet• En af forudsætningerne for den ensidede variansanalyse er, at der er

samme varians i alle grupper.PROC GLM DATA=sasuser.redcell;CLASS grp;MODEL redcell=grp / solution clparm;MEANS grp / HOVTEST=levene ;OUTPUT OUT=ny P=predikt R=resid;RUN;QUIT;axis3 OFFSET=(8,8) LABEL=(H=2 'predicted value') VALUE=(H=2) MINOR=none ;axis4 OFFSET=(1,1) LABEL=(a=90 R=0 H=2 'residual') VALUE=(H=2) MINOR=none ;symbol1 V=circle I=none H=2 W=2;

PROC GPLOT DATA=ny;PLOT resid*predikt / frame haxis=axis3 vaxis=axis4;RUN;

E2013 Basal Statistik - Variansanalyse 25

Varianshomogenitet• Levenes test for varianshomogenitet:

Level of -----------redcell-----------grp N Mean Std Dev1 8 316.625000 58.71708802 9 256.444444 37.12179653 5 278.000000 33.7564809

Levene’s Test for Homogeneity of redcell VarianceANOVA of Squared Deviations from Group Means

Sum of MeanSource DF Squares Square F Value Pr > Fgrp 2 18765720 9382860 4.14 0.0321Error 19 43019786 2264199

• Ved sammenligning af de k = 3 variansestimater fås teststørrelse på 4.14 F(2,19)-fordelt, svarende til P=0.03, og altså signifikans!

E2013 Basal Statistik - Variansanalyse 26

Varianshomogenitet

• Grafisk check med residualplot:

• Residualer tegnes op mod predikterede(forventede, fittede) værdier

E2013 Basal Statistik - Variansanalyse 27

Multiple sammenligninger

• Problem:– F-test viser, at der nok er

forskel – men hvor?• Parvise t-test ikke godt

pga. massesignifikans– Der er m = k(k − 1)/2

mulige test, reelt signifikansniveau: 1 − (1 − α)m

– f.eks. for k=5: 0.40

E2013 Basal Statistik - Variansanalyse 28

Der findes ikke nogen helt tilfredsstillende løsning, men

1. Prøv at undgå problemet (fokuser problemstillingen)2. Udvælg et (lille) antal relevante sammenligninger på

forhånd, dvs. skriv dem ind i protokollen!3. Tegn gennemsnit ±2 × SEM og brug øjemål(!), evt.

suppleret med F-tests på delsæt af grupper4. Modificer t-test ved at gange P med antallet af tests –

såkaldt Bonferroni korrektion (konservativ) eller anden form for korrektion (Dunnett, Tukey).

Multiple sammenligninger

E2013 Basal Statistik - Variansanalyse 29

symbol1 V=circle I=std2mjt H=2 W=2;PROC GPLOT DATA=sasuser.redcell; PLOT redcell*grp / frame haxis=axis1 vaxis=axis2;RUN;

• Her med Bars på 2 s.e., dvs. konfidensintervaller for middelværdierne

Multiple sammenligninger

E2013 Basal Statistik - Variansanalyse 30

Bonferroni– signifikansniveau

Tukey-Kramer– baseres på fordeling af

’størst blandt mange’– giver større styrke

Multiple sammenligninger

m

α

( )m

α ≈−−1

11

– stærkt konservativ, dvs. for høje P-værdier

– lav styrke

Sidak– benytter signifikansniveau

for små m– lidt mindre konservativ– stadig ret lav styrke

Dunnett– korrigerer kun for test

mod referencegruppe– (typisk en kontrolgruppe

eller ’tid 0’)

E2013 Basal Statistik - Variansanalyse 31

PROC GLM DATA=sasuser.redcell;CLASS grp;MODEL redcell=grp / solution clparm;LSMEANS grp / pdiff adjust=bonferroni cl;LSMEANS grp / pdiff adjust=tukey cl;RUN;

Adjustment for Multiple Comparisons: Bonferroni

Least Squares Means for effect grpPr > |t| for H0: LSMean(i)=LSMean(j)

Dependent Variable: redcell

i/j 1 2 3

1 0.0418 0.46432 0.0418 1.00003 0.4643 1.0000

Adjustment for Multiple Comparisons: Tukey-Kramer

Least Squares Means for effect grpPr > |t| for H0: LSMean(i)=LSMean(j)

Dependent Variable: redcell

i/j 1 2 3

1 0.0355 0.32152 0.0355 0.68023 0.3215 0.6802

Multiple sammenligninger i SAS

E2013 Basal Statistik - Variansanalyse 32

Adjustment for Multiple Comparisons: Bonferroni

Difference Simultaneous 95%Between Confidence Limits for

i j Means LSMean(i)-LSMean(j)

1 2 60.180556 1.861360 118.499751 3 38.625000 -29.796878 107.046872 3 -21.555556 -88.499465 45.38835

Adjustment for Multiple Comparisons: Tukey-Kramer

Difference Simultaneous 95%Between Confidence Limits for

i j Means LSMean(i)-LSMean(j)

1 2 60.180556 3.742064 116.619041 3 38.625000 -27.590379 104.84032 3 -21.555556 -86.340628 43.2295

Multiple sammenligninger i SAS

PROC GLM DATA=sasuser.redcell;CLASS grp;MODEL redcell=grp / solution clparm;LSMEANS grp / pdiff cl;RUN;

Giver p værdier og konfidens grænser Uden justering for multipel testning

E2013 Basal Statistik - Variansanalyse 33

Hvis antagelserne ikke holder• Transformation (ofte

logaritmer) kan afhjælpe såvel variansinhomogenitet som dårlig normalfordelingstilpasning

• Man kan lave vægtet analyse (Welch’s test), ligesom ved T-test

PROC GLM DATA=sasuser.redcell;CLASS grp;MODEL redcell=grp / solution clparm;MEANS grp / HOVTEST=levene

WELCH ;

RUN;

Welch’s variance-weighted test

Welch’s ANOVA for redcell

Source DF F Value Pr > F

grp 2.0000 2.97 0.0928Error 11.0646

Vi er altså ikke alt for sikre på den fundne forskel...

E2013 Basal Statistik - Variansanalyse 34

Kruskal-Wallis Test

PROC NPAR1WAY DATA=sasuser.redcellwilcoxon;CLASS grp;VAR redcell;RUN;

• Bemærk: Man kan også få en eksakt vurdering af teststørrelsen, men pas på i tilfælde af store materialer!

• EXACT wilcoxon;• Tilføjes før RUN;

The NPAR1WAY Procedure

Analysis of Variance for Variable redcellClassified by Variable grp

Wilcoxon Scores (Rank Sums) for Variable redcellClassified by Variable grp

Sum of Expected Std Dev Meangrp N Scores Under H0 Under H0 Score1 8 120.0 92.00 14.651507 15.0000002 9 77.0 103.50 14.974979 8.5555563 5 56.0 57.50 12.763881 11.200000

Kruskal-Wallis Test

Chi-Square 4.1852DF 2Asymptotic Pr > Chi-Square 0.1234Exact Pr >= Chi-Square 0.1233

E2013 Basal Statistik - Variansanalyse 35

Logaritmerede dataLogaritme transformere udfaldet (her 10 tals logaritmen) logredcell=log10(redcell);

E2013 Basal Statistik - Variansanalyse 36

Logaritmerede data

E2013 Basal Statistik - Variansanalyse 37

Logaritmerede data

• Fortolkning:– Eksempelvis forskel mellem gruppe 1 og gruppe 3:– Estimatet: 0.05232 – med CI: (-0.02996;0.13459)

• Tilbage transformeres til – Estimat: 128.110 05232.0 =

( ) ( )363.1;933.010;10 13459.002996.0 =−

• Dvs gruppe 1 ligger 12.8% højere end gruppe 3 med CI fra 6.7% under til 36.3% over

– Med CI:

E2013 Basal Statistik - Variansanalyse 38

ANOVA og t-test

Tosidet variansanalyse forekommer dog oftest i anden sammenhæng (flere inddelingskriterier)

E2013 Basal Statistik - Variansanalyse 39

To-sidet Variansanalyse

Ved sammenligning af tidspunkter skal man eliminere variation mellem personer – ganske som i et parret t-test

E2013 Basal Statistik - Variansanalyse 40

Spaghetti Plot

• Puls vs. tid, observationer hørende til samme person forbundet.

• Ideelt er forløbene parallelle (additivitet)

E2013 Basal Statistik - Variansanalyse 41

Spaghetti Plot

DATA sasuser.puls;INFILE 'c:\puls.txt' firstobs=2;INPUT person tid0 tid30 tid60 tid120;tid=0; puls=tid0; output;tid=30; puls=tid30; output;tid=60; puls=tid60; output;tid=120; puls=tid120; output;RUN;

axis5 LABEL=(H=2) VALUE=(H=2) MINOR=none ;axis6 LABEL=(A=90 R=0 H=2) VALUE=(H=2) MINOR=none ;symbol1 V=circle I=join C=black H=3 W=2

L=2 R=9;

/*gentager symbolet 9 gange*/

PROC GPLOT DATA=sasuser.puls;PLOT puls*tid=person / nolegend frame haxis=axis5 vaxis=axis6;RUN;

E2013 Basal Statistik - Variansanalyse 42

To-sidet Variansanalyse

Der er effekt af person (p) og tid (t):

pttpptY εβαµ +++=

)049 == βα

( )2,0~ σε Npt

Variationsopspaltning:

SStot = SSperson + SStid + SSres

εpt uafhængige, middelværdi 0, samme varians, normalfordelte,

og disse virker additivt.(Nødvendigt med passende bånd på parametrene, i SAS f.eks.

E2013 Basal Statistik - Variansanalyse 43

To-sidet Variansanalyse Ideelt set parallelle forløb, overlejret med normal-fordelt variation giver mere irregulære forløb.

E2013 Basal Statistik - Variansanalyse 44

Variansanalyseskema

• Højsignifikant forskel på personer – (forventeligt, men ikke så interessant)

• Signifikant tidsforskel, P=0.018 – men vi mangler estimater!

df SS MS F P

Personer 8 8966.6 1120.8 90.60 <0.0001

Tid 3 151.0 50.3 4.07 0.0180

Resid. 24 296.8 12.4

total 35 9414.3

E2013 Basal Statistik - Variansanalyse 45

Estimater

PROC GLM DATA=sasuser.puls;CLASS tid person;MODEL puls=tidperson / solution clparm;OUTPUT OUT=nyP=predikt R=resid;RUN;QUIT;

Sum ofSource DF Squares Mean Square F Value Pr > F

Model 11 9117.527778 828.866162 67.03 <.0001Error 24 296.777778 12.365741Corrected Total 35 9414.305556

R-Square Coeff Var Root MSE puls Mean0.968476 3.775539 3.516496 93.13889

Source DF Type I SS Mean Square F Value Pr > Ftid 3 150.97222 50.324074 4.07 0.0180person 8 8966.55555 1120.819444 90.64 <.0001

E2013 Basal Statistik - Variansanalyse 46

StandardParameter Estimate Error t Value Pr > |t|

Intercept 102.1944444 B 2.03024963 50.34 <.0001tid 0 4.2222222 B 1.65769189 2.55 0.0177tid 30 0.2222222 B 1.65769189 0.13 0.8945tid 60 -1.2222222 B 1.65769189 -0.74 0.4681tid 120 0.0000000 B . . .person 1 -11.5000000 B 2.48653783 -4.62 0.0001person 2 6.5000000 B 2.48653783 2.61 0.0152person 3 -17.2500000 B 2.48653783 -6.94 <.0001person 4 -19.5000000 B 2.48653783 -7.84 <.0001person 5 19.0000000 B 2.48653783 7.64 <.0001person 6 -5.0000000 B 2.48653783 -2.01 0.0557person 7 -33.5000000 B 2.48653783 -13.47 <.0001person 8 -27.5000000 B 2.48653783 -11.06 <.0001person 9 0.0000000 B . . .

Forventede værdierfor person = 3, tid = 30:

Bemærk, at de sidste niveauer af hver faktor(Class-variabel) bliver sat til 0

De kaldes referenceniveauer

Residualer

Altså f.eks.

E2013 Basal Statistik - Variansanalyse 47

Modelkontrol

• Varianshomgenitet?• Normalfordelte residualer?• Additivitet? (vekselvirkning, interaktion,

effekt modifikation)– Kan kun undersøges hvis der er flere

observationer per celle

• Seriel korrelation?

E2013 Basal Statistik - Variansanalyse 48

Modelkontrol

• Varianshomgenitet

E2013 Basal Statistik - Variansanalyse 49

Modelkontrol

• Normalfordelte residualer

E2013 Basal Statistik - Variansanalyse 50

Modelkontrol

• Seriel korrelationDer ser ikke ud til at være Seriel korrelation her

Modeller, der inkludere sådanne korrelationer kaldes

Repeated measurements

E2013 Basal Statistik - Variansanalyse 51

Modelkontrol

• Data til seriel korrelation plottet:

DATA ny2;SET ny;f_resid=lag(resid);IF tid=0 THEN f_resid=.;RUN;

• Seriel korrelation plottet:

axis7 OFFSET=(8,8) LABEL=(H=2 'forrigeresidual') VALUE=(H=2) MINOR=none ;symbol1 V=circle I=none C=black H=2 W=2 L=2 ;

PROC GPLOT DATA=ny2;PLOT resid*f_resid / vref=0 href=0 lvref=33 lhref=33 haxis=axis7 vaxis=axis4;RUN;

E2013 Basal Statistik - Variansanalyse 52

Vekselvirkning

• Eller interaktion eller effekt modifikation• Hvordan virker faktorerne ind på

hinanden?

• Forskellen i respons mellem niveauerne af en faktor er ikke den samme ved alle niveauer af de andre faktorer

• Der kan være en synergistisk effekt (eller det modsatte)

E2013 Basal Statistik - Variansanalyse 53

Ao 20 30

Fakt. A

A1 40 52

Faktor B

Ingen vekselvirkning

0

20

40

60

Faktor B

Res

po

ns

Ao 20 40

Fakt. A

A1 30 12

Faktor B

Med vekselvirkning

0

10

20

30

40

50

Faktor B

Res

po

ns

Ao

A1

A1

Ao

E2013 Basal Statistik - Variansanalyse 54

Vekselvirkning

• Eksempel på 2 inddelingskriterier:– køn– rygestatus

• Respons: FEV1• Mulige forklaringer:

– biologisk forskel på effekt af rygning– måske ryger kvinderne ikke helt så meget– måske virker rygningen som en relativ (%-vis)

nedsættelse af FEV1

E2013 Basal Statistik - Variansanalyse 55

Eksempel

E2013 Basal Statistik - Variansanalyse 56

Vekselvirkning

• Interaktion/vekselvirkning mellem mængden og varigheden af Rygningen

• Der er effekt af mængden, men kun hvis man har røget længe

• Der er effekt af varigheden, og denne effekt øges med mængden

E2013 Basal Statistik - Variansanalyse 57

VekselvirkningFibrinogen efter

miltoperation

34 rotter randomiseres, på 2 måder• 17 får fjernet milten

(splenectomy=yes)• 8/17 i hver gruppe opholder sig i

stor højde (place=altitude)Outcome:• Fibrinogen niveau i mg% ved

dag 21

E2013 Basal Statistik - Variansanalyse 58

VekselvirkningAlmindelig model:

sprpssprY εβαµ +++=

sprsppssprY εγβαµ ++++=

Her specificeres en interaktion mellem splenectomy og place, dvs. effekten af ophold i stor højde tænkes at afhænge af, hvorvidt man har fået fjernet milten eller ej.— og omvendt ....

splenectomy (s=yes/no) og place (p=altitude/control) virker additivt.

Model med interaktion (vekselvirkning):

E2013 Basal Statistik - Variansanalyse 59

Vekselvirkning i SASPROC GLM DATA=sasuser.fibronogen;CLASS splenectomy place;MODEL fibrinogen = splenectomy place splenectomy*place / solution;RUN;

The GLM Procedure

Class Level InformationClass Levels Valuessplenectomy 2 no yesplace 2 altitude control

Number of observations 34Dependent Variable: fibrinogen

Sum ofSource DF Squares Mean Square F Value Pr > F

Model 3 138402.2949 46134.0983 7.51 0.0007Error 30 184321.2639 6144.0421Corrected 33 322723.5588

^ Total ^

R-Square Coeff Var Root MSE fibrinogen Mean0.428857 22.21804 78.38394 352.7941

E2013 Basal Statistik - Variansanalyse 60

Vekselvirkning i SAS

E2013 Basal Statistik - Variansanalyse 61

• Referenceniveauerne er place=control, splenectomy=yes (de sidste i den alfabetiske rækkefølge)

• så disse har forventet fibrinogenniveau på intercept=261.67

• For de andre niveauer skal der adderes et eller flere ekstra estimater, således:

Splenectomyplace

control Altitude

yes261.67 261.67

+ 90.58= 352.25

no

261.67+ 104.44

= 366.11

261.67+ 104.44+ 90.58- 15.82= 440.87

Vekselvirkning i SAS

E2013 Basal Statistik - Variansanalyse 62

• Vi kan godt få SAStil at udregne disse niveauer explicit:

PROC GLM DATA=sasuser.fibronogen;CLASS splenectomy place;MODEL fibrinogen = splenectomy*place /

solution noint;RUN;• Bemærk at “splenectomy

place” er slettet i model linien

Vekselvirkning i SAS

E2013 Basal Statistik - Variansanalyse 63

• Vekselvirkningen var ikke signifikant (p=0.77)

• Så modellen simplificeres til en tosidet variansanalyse uden vekselvirkning

To-sidet variansanalyse

E2013 Basal Statistik - Variansanalyse 64

To-sidet variansanalyse

E2013 Basal Statistik - Variansanalyse 65

Modelkontrol

E2013 Basal Statistik - Variansanalyse 66

Modelkontrol