T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

Preview:

Citation preview

TUTORATDESKRIPTIVE STATISTIK UND WAHRSCHEINLICHKEITSTHEORIE

Kai Vogt

vogtkai@gmx.net

Termin 2

WIEDERHOLUNG TERMIN 1

Multiple Korrelationen Ry.x1x2

Partialkorrelation rxy.z

Semipartialkorrelation rx(y.z)

• Inkrementelle Validität Suppressor-Effekt Multikollinearität

Multiple Regression Biased Estimate & Capitalization of Chance Kreuzvalidierung Signifikanzprüfung Strategien der Prädiktorauswahl

STRATEGIEN DER PRÄDIKTORAUSWAHL BEI DER

MULTIPLEN REGRESSION

STRATEGIEN DER PRÄDIKTORAUSWAHL (5)

Inhaltliche Auswahl

Alle möglichen Untermengen

Vorwärtsselektion

Rückwärtselemination

Schrittweise Regression

Aufgabe: Eine multiple Regression liefert folgendes Ergebnis. Welche Form der Auswahl der Prädiktoren wurde hier gewählt? Begründet eure Antwort.

Lösung: Es wurde die Rückwärtselemination verwendet!

R² wird kleiner, weil Prädiktoren die einen (nicht-signifikanten) Teil des Kriteriums vorhersagen, weggelassen werden. D.H. das nacheinander die Prädiktoren die keine inkrementelle Validität besitzen aussortiert werden.

Das korrigierte R² steigt, weil die Schrumpfungskorrektur wegen der geringeren Anzahl an Prädiktoren kleiner ausfällt! (Prädiktoren werden weniger im Laufe der Rückwärtseleminierung)

22 ²)1(2

²)1(2

31ˆ R

KNR

KN

NR

GLIEDERUNG

I. MediatoranalyseII. ModeratoranalyseIII. ALM

I. MEDIATORANALYSE

MEDIATORANALYSE Wir erinnern uns: Zwei Variablen Korrelieren signifikant. Welche Kausalitäten sind

möglich?

Ein „echtes“ Beispiel nach Urban & Mayerl (2005):

Alter AusländerfeindlichkeitDirekter Effekt:

Totaler Effekt:

Indirekter Effekt: Alter Ausländerfeindlichkeit

Autoritarismus

Alter Ausländerfeindlichkeit

-

+

+ +

Mediatoranalyse

• Die Mediatoranalyse prüft, ob ein Zusammenhang zwischen zwei Variablen vollständig oder teilweise durch eine dritte Variable vermittelt wird.

• Sie erlaubt demgemäß die Vielfalt der bei Korrelationen möglichen Kausalitäten einzuschränken („Pfadanalyse“).

• Alternative: Die Kausalitäten sind durch experimentelle Prüfung oder theoretische Ableitung bereits bekannt

• Grundsatz: Erst die Theorie, dann die Statistik – „Zahlen sprechen nicht“

MEDIATORANALYSE

Alter Ausländerfeindlichkeit

Autoritarismus

Unabhängige Variable

AbhängigeVariable

Mediatorvariable

MEDIATORANALYSE: SCHRITT 1

Alter (X) Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• Regression von Y auf X. Regression der Ausländerfeindlichkeit auf das Alter.

Y = b * X + a

• Nur wenn sich eine signifikanter Zusammenhang zwischen der AV und der UV ergibt (b ≠ 0), kann eine Mediation vorliegen.

bY,X≠0

MEDIATORANALYSE: SCHRITT 2

Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• Regression von M auf X. Regression des Autoritarismus auf das Alter.

M = b * X + a

• Nur wenn b ≠ 0, kann eine Mediation vorliegen.

bM,X≠0

Alter (X)

MEDIATORANALYSE: SCHRITT 3

Alter (X) Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• Regression von Y auf M. Regression der Ausländerfeindlichkeit auf den Autoritarismus.

Y = b * M + a

• Nur wenn b ≠ 0, kann eine Mediation vorliegen.

bY,M≠0

MEDIATORANALYSE: SCHRITT 4

Alter (X) Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• (Multiple) Regression von Y auf X und M. Regression der Ausländerfeindlichkeit auf das Alter und den Autoritarismus.

bY,M≠0

bY,M= 0

Y = bYX * X + bYM * M + a

VOLLSTÄNDIGE UND PARTIELLE MEDIATION

Y = bYX * X + bYM * M + a

• Wenn bYX=0 und bYM ≠0, spricht man von „vollständiger Mediation“, da der komplette Effekt des Alters auf die Ausländerfeindlichkeit über den Autoritarismus vermittelt ist.

• Wenn |bYX|>0 aber kleiner als in Schritt 1, spricht man von „partieller Mediation“.

Verknüpfung: Multiple Korrelation

Einen Hinweis auf das Vorliegen einer (partiellen) Mediation kann uns auch der Vergleich von Partialkorrelation und bivariater Korrelation liefern.

ryx2.x1 = n.s.; ryx2 = signifikant → vollständige Mediation

ryx2.x1 < ryx2

→ partielle Mediation

II. MODERATORANALYSE

MODERATORANALYSE

Die Moderatoranalyse prüft, ob ein Zusammenhang zwischen zwei Variablen durch eine dritte Variable beeinflusst wird.

Hypothese: Die gleiche Trainingszeit wirkt sich bei Fußballspielern mit großem Talent stärker auf deren Marktwert aus, als bei Spielern mit wenig Talent.

Im Gegensatz zur Mediatorvariablen, wird nicht angenommen, dass die Moderatorvariable durch die UV beeinflusst wird – der Moderator korreliert nur mit dem Kriterium, nicht aber mit der UV.

MODERATORANALYSE

Training Markwert

Talent

Unabhängige Variable

AbhängigeVariable

Moderatorvariable

Hinweis:Die Moderatorvariable wirkt nicht direkt auf den Marktwert, sondern auf den Zusammenhang, d.h. auf das b-Gewicht der Regression

MODERATORANALYSE

Marktwert

Training

Talent -

Talent +

Hinweis:

- Es wird angenommen, dass die Moderatorvariable intervallskaliert ist.

- Es ist jedoch üblich, nur 2 Geraden zu zeigen, z.B. für Probanden die eine Standardabeichung über bzw. unter dem Mittelwert liegen.

- Die Moderatorvariable beeinflusst die Steigung (das b-Gewicht) der Reggressionsgeraden.

Talent +

Talent -

MODERATORANALYSE: VORGEHEN

1. Schritt:

z-Transformation von Prädiktor (unabhängiger Variable) und potentiellem Moderator

Frage: Warum z-Transformation?

2. Schritt

Ermittlung eines dritten Prädiktors

zxm = zx * zm

3. Schritt

Multiple Regressionsanalyse von y auf zxm, zx und zm

ŷ = b1 * m * x + b2*x + b3*m + a Wie groß ist b1?

MODERATORANALYSE

Interpretation der Ergebnisse: ŷ = b1 * m * x + b2*x + b3*m + a

b1 > 0 (p< .05): Je größer die Ausprägung in der Moderatorvariablen (=Talent), desto größer ist die Steigung der ursprünglichen Regressionsgeraden zur Vorhersage von y (Marktwert) durch x (Training)

b1 < 0 (p< .05): Je größer die Ausprägung in der Moderatorvariablen, desto geringer ist die Steigung der ursprünglichen Regressionsgeraden zur Vorhersage von y durch x

b1 = 0 (n.s.): Keine Moderation

INHALTLICHE BEDEUTUNG

Eine Moderation bedeutet, dass eine Interaktion zwischen dem Prädiktor und Moderator in Bezug auf das Kriterium vorliegt.→ Verknüpfung: Varianzanalyse (dazu später )

Das Regressionsgewicht b1 (=bmx) beziffert die Stärke des Interaktionseffekts.

MODERATORANALYSE

Hinweis:

Es ist möglich, dass die Moderatorvariable zusätzlich auch einen direkten Einfluss auf die aV (das Kriterium) hat.

Dann ist sie sowohl Prädiktor wie auch Moderator für den Zusammenhang zwischen Kriterium und dem anderen Prädiktor.

Training Markwert

Talent

Unabhängige Variable

AbhängigeVariable

Moderatorvariable

Schlagwort: … vermittelt Die Mediatorvariable

korreliert selbst mit der unabhängigen Variable (Sie vermittelt zumindest einen Teil des Einflusses der uV auf die aV)

Schlagwort: … beeinflusst

Die Moderatorvariable korreliert nicht mit der unabhängigen Variable (Sie beeinflusst den Zusammenhang von uV und aV)

Mediatoranalyse ModeratoranalyseVS.

AUFGABEN

a) Was wird mit einer Mediationshypothese überprüft?

b) Erläutern Sie die vier Schritte der Mediatoranalyse

LÖSUNG

(a) Es wird die Hypothese geprüft, dass ein Zusammenhang zwischen X und Y durch eine Drittvariable, den Mediator M, kausal vermittelt wird.

(b)1. Es wird überprüft, ob überhaupt ein signifikanter Zusammenhang zwischen X und Y besteht.2. Es wird überprüft, ob ein signifikanter Zusammenhang zwischen X und M besteht.3. Es wird überprüft, ob ein signifikanter Zusammenhang zwischen M und Y besteht.4. In einer multiplen Regression wird überprüft, ob ein signifikanter Zusammenhang zwischen X und Y bestehen bleibt, wenn zusätzlich der Prädiktor M berücksichtigt wird.

AUFGABEN

In eine Moderatoranalyse wird geprüft, ob der Zusammenhang von X und Y durch M moderiert wird. Belegen die untenstehenden Ergebnisse eine solche Moderation?

11.04.23Tutorat Statistik II29

LÖSUNG

Die Ergebnisse belegen eine Moderation, da das Regressionsgewicht des Prädiktors P signifikant von Null verschieden ist.

III. ALLGEMEINES LINEARES MODELL

ALM

Übergeordnete Darstellungsform für verschiedene statistische Verfahren:

Varianzanalyse Regression

Der beobachtete individuelle Wert einer Versuchsperson i in der abhängigen Variablen yi ist zusammengesetzt aus einer gewichteten Summe anderer Variablen xj und einem individuellen Fehler ei

Relevant ist das Verständnis der mathematischen Darstellung

ALM

/ Gewichte

BEISPIEL

ALM

Effekte sind die Basis der Varianzanalyse!

Definition: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert.

yi = a0 ‧ xi0 + a1 ‧ xi1 + a2 ‧ xi2 + … + ap + xip + ei

Im Beispiel von eben: a0 = 7,5 ; a1 = -2,5 ; a2 = 2,5

Für einzelne Personen gilt dann:

In Gruppe 1: xi0 = 1 ; xi1 = 1 ; xi2 = 0 ; ei individuell

In Gruppe 2: xi0 = 1 ; xi1 = 0 ; xi2 = 1 ; ei individuell

WICHTIGES AUS TERMIN 2

Mediatoranalyse• Wann wird diese Analyse gerechnet?• Verständnis für das Grundprinzip der Mediatoranalyse• Vorgehen bei einer Mediatoranalyse• vollständige vs. partielle Mediation

Moderatoranalyse• Wann wird diese Analyse gerechnet?• Verständnis für das Grundprinzip der Moderatoranalyse• Vorgehen bei einer Moderatoranalyse

Allgemeines Lineares Modell (ALM)• Was ist das ALM?

VIELEN DANK FÜR EURE AUFMERKSAMKEIT!

Bis zum nächsten Mal!!!!

Wenn ihr zwischendurch noch Fragen habt:

vogtkai@gmx.net