Mixed models Jonathan Harrington library(lme4) datasets.zip noch einmal laden, wenn asp.txt, lex.txt...

Mixed models

Jonathan Harrington

library(lme4)

datasets.zip noch einmal laden, wenn asp.txt, lex.txt nicht vorhanden sind

library(multcomp)

Mixed model (MM)Mixed model (MM)

Ein MM ist eine Art von Regression in dem ein Response (abhängige Variable) aus einer Kombinationen von gewichteten Faktoren eingeschätzt wird.

Lineares Modell, Minimierung vom Abstand zwischen tatsächlichen und eingeschätzten Werten.

(Das Verfahren um dies zu tun, ist nicht least-squares wie in Regression sondern maximum-likelihood)

Im MM-Verfahren wird prinzipiell zwischen 2 verschiedene Sorten von Faktoren differenziert

Random: Faktoren, die randomisierte Stichproben aus einer Bevölkerung enthalten (z.B. Versuchspersonen, Wörter).

Mixed Model und FaktorenMixed Model und Faktoren

Fixed = Faktoren die vorhanden sind, unabhängig von dem experimentellen Design (z.B. Geschlecht, Sprache, Alter)

Vergleich: MM und RM-ANOVAVergleich: MM und RM-ANOVA

Die Kieferposition wurde in 3 Vokalen /i, e, a/ und jeweils zu 2 Sprechtempi (langsam, schnell) gemessen. Die Messungen sind von 8 mit Muttersprache spanisch, 8 mit Muttersprache englisch aufgenommen worden.

RM-Anova

Fixed: Sprache, Sprechtempo, Vokal Random: Sprecher

soll geprüft werdensoll ausgeklammert werden

F1 von /a:/ wurde in 100 verschiedenen Wörtern gemessen (Bart, Pfad, mager, maßgebend, erstarrt...). Die Wörter wurden von 10 Vpn produziert sowohl phrasenmedial als auch phrasenfinal. Inwiefern wird F1 von Phrasenposition beeinflusst (N.B. F1 variiert sehr stark wegen Kontext, also von Wort zu Wort).

(a) Wir wollen die Sprechervariation ausklammern (Random Factor)

(b) Wir wollen aber auch die Wortvariation ausklammern (dass F1 unterschiedliche Werte hat in Bart vs. mager usw. interessiert uns nicht).(a) und (b) gleichzeitig ausklammern in einem RM-Anova geht nicht.

MMfixed: Phrasenposition random: Sprecher, Wort

(b) Wir wollen auch die Wortvariation ausklammern (dass F1 unterschiedliche Werte hat in Bart vs. mager usw. interessiert uns nicht).

final initial final initial final initialBart Pfad Start

müssen die Zellen nicht vollständig seines muss nicht über Wiederholungen gemittelt werden

In einem MM:

Wann soll der MM verwendet werden?Wann soll der MM verwendet werden?

1. Wenn ein RM-Anova nicht/kaum einsetzbar ist:Einige unabhängige Variablen sind kontinuierlichmehr als ein Random Faktor.

unvollständige Daten ('fehlende Zellen')

man will nicht über Wiederholungen mitteln

2. Ein MM ist nur robust bei einer großen Anzahl von Stichproben – mindestens insgesamt 200-300, je mehr umso besser.

Die Reaktionszeiten wurde von 21 Vpn in der Erkennung von 79 englischen Wörtern unterschiedlicher Längen gemessen. Es gab zwei Gruppen von Vpn: diejenigen mit Englisch als Muttersprache und diejenigen mit Englisch als Zweitsprache. Inwiefern wird die Reaktionszeit von der Wortlänge und/oder Sprachgruppe beeinflusst (Daten aus Baayen, 2009)?

head(lex) names(lex)

Abhängige Variable (response)

Random

Lang, Length

Word, Subj

str(lex)

AbbildungenAbbildungen

boxplot(rt ~ Lang, ylab = "Reaktionszeit", data = lex)with(lex, interaction.plot(Lang, Length, rt))

Lang signifikant? Length sig? (= liegt ein Trend vor?)

Lang * Length Interaktion? (bedeutet...?)

lmer(response ~ fixed1 * fixed2 * ... + (1|Random1) +(1|Random2)+ ...

mm = lmer(rt ~ Lang * Length + (1|Subj) + (1|Word), data = lex)

+ +keine InteraktionMM Anwendung in RMM Anwendung in R

rt = b1Lang + b2Length + b3(Lang x Length) + k + kSubj + kWord^

by-subject intercept adjustment

by-word intercept adjustmenteingeschätzer RT

fitted(mm)

Hier werden 3 Neigungen und 3 Intercepts (also 6 Parameter) berechnet, sodass der Abstand zwischen rt und rt minimiert wird.^

Beitrag vom Random FaktorBeitrag vom Random Faktor

Benötigen wir Word als Random Factor?entwedermm2 = update(mm, ~ . -(1|Word))# odermm2 = lmer(rt ~ Lang * Length + (1|Subj), data = lex)anova(mm, mm2)

Berechne wieder das gleiche wie für mm berechnet wurde, aber lass (1|Word) weg:

mm2: rt ~ Lang * Length + (1 | Subj)mm: rt ~ Lang * Length + (1 | Subj) + (1 | Word) Df AIC BIC logLik Chisq Chi Df Pr(>Chisq) mm2 6 -1199.04 -1166.94 605.52 mm 7 -1295.61 -1258.15 654.80 98.568 1 < 2.2e-16 ***

mm (mit (1|Word)) wird bevorzugt, da AIC niedriger ist

(Daher benötigen wird (1|Word)

Beitrag der Fixed-FaktorenBeitrag der Fixed-Faktoren

anova(mm)

Analysis of Variance Table Df Sum Sq Mean Sq F valueLang 1 0.13993 0.13993 6.2512Length 1 0.47000 0.47000 20.9972Lang:Length 1 0.36477 0.36477 16.2961

Je größer der F-Wert, umso wichtiger ist der Faktor. Es werden aber keine Wahrscheinlichkeiten berechnet, da die Freiheitsgrade in einem MM-Modell im Nenner nicht festgestellt werden können.

(a) Lang* Length Interaktion(a) Lang* Length Interaktion

Die Frage = ?

Lang:Length weglassen und Modelle vergleichen.

mm3 = lmer(rt ~ Lang + Length + (1|Subj) + (1|Word), data = lex)odermm3 = update(mm, ~ . -(Lang:Length))

anova(mm, mm3)

Df AIC BIC logLik Chisq Chi Df Pr(>Chisq) mm3 6 -1281.43 -1249.32 646.71 mm 7 -1295.61 -1258.15 654.80 16.181 1 5.756e-05 ***

Die Interaktion zwischen den Faktoren hatte einen signifikanten Einfluss auf die Reaktionzeiten (2[1] = 16.2, p < 0.001)

(a) Lang* Length Interaktion(a) Lang* Length Interaktion

(b) Lang(b) Lang

Die Frage?

mm4: rt ~ Length + (1 | Subj) + (1 | Word)mm3: rt ~ Lang + Length + (1 | Subj) + (1 | Word) Df AIC BIC logLik Chisq Chi Df Pr(>Chisq) mm4 5 -1277.55 -1250.79 643.77 mm3 6 -1281.43 -1249.32 646.71 5.8803 1 0.01531 *

mm4 = update(mm3, ~ . - Lang)anova(mm3, mm4)

Reaktionszeiten wurden signifikant von Language beeinflusst (2[1] = 5.9, p < 0.05)

(b) Lang(b) Lang

(c) Length(c) LengthDie Frage?

m = with(lex, aggregate(rt, list(Length), mean))plot(m[,1], m[,2], type="l", xlab="Length", ylab="rt")

Data: lexModels:mm5: rt ~ Lang + (1 | Subj) + (1 | Word)mm3: rt ~ Lang + Length + (1 | Subj) + (1 | Word) Df AIC BIC logLik Chisq Chi Df Pr(>Chisq) mm5 5 -1264.41 -1237.66 637.20 mm3 6 -1281.43 -1249.32 646.71 19.017 1 1.295e-05 ***

mm5 = update(mm3, ~ . - Length)anova(mm3, mm5)

(c) Length(c) Length

Reaktionszeiten wurden signifikant von Length beeinflusst (2[1] = 19.0, p < 0.001)

Der Data-Frame asp enthält Werte der Aspirationsdauer von silbeninitialem /t/ und /k/ aus gelesenen Sätzen in dem Kielcorpus. Diese Dauern sind für 55 Versuchspersonen und 287 Wörter erhoben worden. (Die Versuchspersonen produzierten nicht alle dieselben Wörter). Inwiefern wird die Aspirationsdauer von der Artikulationsstelle (/k/, /t/) oder von der Silbenbetonung ("betont", "unbetont") beeinflusst?

VorgangVorgang

1. Abbildungen: boxplot(), interaction.plot()

2. lmer(), Festlegung von fixed und random factors

3. Prüfen ob(a) wir die random factors benötigen (b) die Interaktion signifikant ist(c) es für die fixed factors Haupteffekte gibt

4. ggf. Die Kombinationen der Factor-Stufen prüfen

1. Abbildungen1. Abbildungen

lmer(), fixed factors, random factorslmer(), fixed factors, random factors

a = lmer(...)

F-Werte für fixed-factors anschauen

Interaktion signifikant?Interaktion signifikant?

a = lmer(...)Mit Interaktion

Ohne Interaktion

b = update(a, ~ . , etwas)

Unterscheiden sich a und b?

Haupteffekte signifikant?Haupteffekte signifikant?

Ohne Interaktion

b = update(a, ~ . etwas)

Ohne Interaktion und ohne fixed factor

d = update(b, ~ . etwas)

Unterscheiden sich b und d?

Post-hoc Tukey TestsPost-hoc Tukey Tests

Faktoren, die post-hoc getestet werden sollen, zu einem neuen Faktor verbinden

beide = factor(with(asp, paste(Kons, Bet, sep=".")))

library(multcomp)summary(glht(e, linfct = mcp(beide = "Tukey")))

e = lmer(d ~ beide + (1|Wort) + (1|Vpn), data = asp)

Fit: lmer(formula = d ~ beide + (1 | Wort) + (1 | Vpn), data = asp)

Linear Hypotheses: Estimate Std. Error z value Pr(>|z|) k.un - k.be == 0 -14.427 1.852 -7.791 <0.001 ***t.be - k.be == 0 -4.553 1.659 -2.745 0.0304 * t.un - k.be == 0 -32.794 1.406 -23.326 <0.001 ***t.be - k.un == 0 9.874 1.852 5.332 <0.001 ***t.un - k.un == 0 -18.367 1.773 -10.359 <0.001 ***t.un - t.be == 0 -28.241 1.590 -17.765 <0.001 ***

Mixed models Jonathan Harrington library(lme4) datasets.zip noch einmal laden, wenn asp.txt, lex.txt...

Documents

Fitting Linear Mixed-Effects Models Using the lme4 Package ...pages.stat.wisc.edu/~bates/PotsdamGLMM/LMMD.pdf · Simple Longitudinal Singular Non-nested Interactions Theory Fitting

Package ‘ILS’ - R · 2018-03-06 · Package ‘ILS’ March 6, 2018 Type Package Title Interlaboratory Study Version 0.2 Date 2018-03-06 Depends R (>= 3.1.0), lattice, multcomp,

Mixed models in R using the lme4 package Part 1: Linear mixed …lme4.r-forge.r-project.org/slides/2011-03-16-Amsterdam/1... · 2011-03-04 · Mixed models in R using the lme4 package

Varianzanalyse+mitMesswiederholungen+ (Repeated8measures ... · Varianzanalyse+mitMesswiederholungen+ (Repeated8measures(ANOVA) Jonathan+Harrington+ Befehle:+anova2.txt Bie ++noch++einmal++datasets.zip++laden+

Mixed models in R using the lme4 package Part 2 ...lme4.r-forge.r-project.org/slides/2011-03-16-Amsterdam/2... · Mixed models in R using the lme4 package Part 2: Longitudinal data,

Fitting Mixed-Effects Models Using the lme4 Package in Rbates/IMPS2008/lme4D.pdf · Fitting Mixed-Eﬀects Models Using the lme4 Package in R Douglas Bates University of Wisconsin

Computational methods for mixed models - uni-bayreuth.deftp.uni-bayreuth.de/.../doc/vignettes/lme4/Theory.pdf · we describe the mixed model formula and the forms of these matrices

Mixed models in R using the lme4 package Part 8: Nonlinear ...lme4.r-forge.r-project.org/slides/2009-07-01-Lausanne/8NLMMD.pdf · Mixed models in R using the lme4 package Part 8:

Estimating the Multilevel Rasch Model: With the lme4 Package

Mixed models in R using the lme4 package Part 9: Nonlinear

Package ‘multcomp’€¦ · Package ‘multcomp’ November 14, 2020 Title Simultaneous Inference in General Parametric Models Version 1.4-15 Date 2020-11-12 Description Simultaneous

Mixed models in R using the lme4 package Part 1 ...lme4.r-forge.r-project.org/slides/2009-07-01-Lausanne/1...2009/07/01 · Following the operations on the slides The lines of R code

Linear mixed model implementation in lme4 - uni-bayreuth.deftp.uni-bayreuth.de/math/statlib/R/CRAN/doc/vignettes/lme4/... · Linear mixed model implementation in lme4 Douglas Bates

Google lme4

Logistische Regression und die Analyse von Proportionen Jonathan Harrington library(lme4) library(lattice) library(multcomp) source(file.path(pfadu, "phoc.txt"))

Kurzeinführung in R (Bernd Huwe, SoSem 2006) · • Rlecturenotes.pdf, hierzu gehört: Rscripts.zip Datasets.zip • SimpleR.pdf, heirzu gehört das package: Simple_0.5.zip • usingR.pdf

Package ‘lme4’dk.archive.ubuntu.com/pub/pub/cran/web/packages/lme4/lme4.pdf · encounter segmentation faults (!!); the solution is to make sure to re-install these packages before

Generalized linear mixed models - lme4

Simultaneous Inference in General Parametric Modelscran.mtu.edu/web/packages/multcomp/vignettes/generalsiminf.pdfLubbock, TX 79409, U.S.A November 8, 2017 Abstract Simultaneous inference

Package ‘lmfor’ · Depends R (>= 2.10), stats4, nlme, spatstat, grDevices, graphics, stats, magic Suggests lme4 Description Functions for different purposes related to Forest