22
Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Embed Size (px)

Citation preview

Page 1: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Multivariate Analysemethoden

Günter MeinhardtJohannes Gutenberg Universität Mainz

20.10.2008

Page 2: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Vorlesung

Einführung Was sind multivariate Analysemethoden?

Verfahrensdarstellung in

• Überblick • Grundprinzip• wichtigsten mathematischen Beziehungen• Anwendungsbeispielen

Übung Vermittlung von Hintergründen/Voraussetzungen

• Grundlagen der linearen Algebra• Wiederholung / Durcharbeiten der Beispiele• Aufgaben und Anwendungen auf verwandte ProblemePrüfung• Klausur zum Abschluss des SS. Aufgaben: Wissen auf beiden Niveaus (Grundprinzip+Anwendung)• Teilklausur zum Ende des WS 2008/09

Page 3: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Literatur

Einführung Was sind multivariate Analysemethoden?

a) b)

c) d)

Page 4: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Inhalte im WS 2008/09

Einführung Was sind multivariate Analysemethoden?

MultivariateKlassifikation I

MultidimensionaleSkalierung

Vektoren / Matrizen

Faktorenanalyse

Multivariate Distanz

Deskriptive multivariate Methoden

Page 5: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Einteilung

Einführung Was sind multivariate Analysemethoden?

Latente Variable

• Faktorenanalyse• Diskriminanzanalyse• MDS• Kanonische Korrelation• LISREL

Konkrete Variable

• Multiple/Logistische Regression• T2 / MANOVA• Conjoint Measurement• Kanonische Korrelation

Multivariate Analysemethoden

Page 6: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Latente Variable

Verfahren Latente Variable

Multidimensionale Skalierung

Problem:

Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum)

Möglichkeiten:

Faktorenanalyse MultidimensionaleSkalierung

Page 7: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

LatenteVariable

Einführung Was sind multivariate Analysemethoden?

Faktor / MDS

Demo - Beispiel mit Excel und Statistica

Page 8: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Multivariates Testen

Einführung Was sind multivariate Analysemethoden?

Grundüberlegungen zum Unterschied des Testens mit einer AV und mehreren AVs

Grundprinzip und Beispiel anhand einer 2 Vars - 2Groups Diskriminanzanalyse

Page 9: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Mittelwertsprüfung bei mehreren Variablen

Beispiel

X1: Gehalt

X2: EntscheidungsfreiheitX3: Qualität der Kommunikation

Arbeit

X4: Ehe

X5: Freunde/BeziehungenX6: Sexualität

Privatsphäre

X7: Lebensansprüche

X8: Sinnhaftigkeit

Person

X9: Hobbies

X10: Sport/Fitness

Aktivität

( )1 2 10, , ,x x xK

Lebenszufriedenheit

Gesunde Herzinfarktpatienten

10 Variablen

2 Gruppen

Page 10: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Multivariate Mittelwertsvergleiche - Einzeltestungen

Teststrategie

Ausweg

Frage Unterscheiden sich Gesunde und Patienten im Variablen-komplex Lebenszufriedenheit?

Wir testen auf jeder der 10 Skalen den Gruppenunterschied mit einem t- Test. Wenn irgend einer der Tests signifikantwird, sehen wir die Gruppen als verschieden an.Probleme 1. Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft.

2. Unterstellte Unabhängigkeit: Man behandelt die einzelnen Skalen als unabhängig voneinander.

3. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht alsVariablenkomplex mit Binnenstruktur behandelt.

4. Mangelnde Teststärke: Man nutzt nicht die Korrelations-struktur der Variablen für einen leistungsfähigen Test.

Verwendung eines multivariaten Tests, der die Information aller 10 Variablen und ihrer Korrelationsstruktur in eine statistische Prüfgrösse einfliessen lässt.

Page 11: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Multivariate Mittelwertsvergleiche - Verfahren

MultivariatesTestkonstrukt

Variablen-komplex

Verfahren

( )1 2 10, , ,x x xK

Multivariate Distanz(Mahalanobisdistanz)

Multivariate Quadratsummen(SSCP-Matrizen-Zerlegung)

Optimale Linearkombination(Linear Discriminant Function)

Hotelling‘s T2 MANOVA Diskriminanz-Analyse

Alle Verfahren entscheiden über den Gruppenunterschied imgesamten Variablenkomplex mit einem statistischen Test

Page 12: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Grundprinzip(2 Gruppen)

Multivariates Testen - Diskriminanzanalyse

( )1 2, , , mx x xKFür die m Variablen

finde eine Linearkombination zu einer neuen Variable

0 1 1 2 2 m my b b x b x b x= + + + +K

so dass diese die Gruppen c1 und c2 optimal trennt.

Das Optimierungskriterium für die Wahl der bj lautet

erklärte Variationmax

nicht erklärte VariationBetween

Within

QS

QS

Die der bj sind so zu wählen, dass auf der neuen Variable y die Streuung zwischen den Gruppen zu der Streuung innerhalb der Gruppen ein maximales Verhältnis hat.

Kriterium derOptimierung

Page 13: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

2D-Beispiel Man möchte trennen

anhand von

Anforderung

2D BeispielDiskriminanzanalyse

Stechmückenc1

Blindmückenc2

Fühlerlänge

x1

2 Gruppen

2 Variablen Flügellänge

x2

• Maximale Gruppentrennung (Mittelwerte)• Minimale Klassifikationsfehler (Fall-Klassifikation)

Page 14: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1.40

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70

(Fühlerlänge)

Blindmücke

Stechmücke

Variablenraum

• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).

• In beiden Gruppen existiert eine Korrelation der Variablen Fühlerlänge (X1) und Flügellänge (X2).

Ausgangslage

2D BeispielDiskriminanzanalyse

x1

(Flügelänge)

x2

Regression Stechmücke

Regression Blindmücke

Page 15: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Bestes Kriterium auf x1

Blindmücke

Stechmücke

• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).

• Das geht mit einem Kriteriumswert auf jeder einzelnen Variable X1

und X2 offenbar nicht.

Problem

2D BeispielDiskriminanzanalyse

x1

x2

Bestes Kriterium auf x2

Variablenraum

Page 16: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1.40

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70

(Fühlerlänge)

Blindmücke

Stechmücke

Variablenraum

2D BeispielDiskriminanzanalyse

x1

(Flügelänge)

x2

Kriteriumsfunktion

Lösung Eine lineare Kriteriumsfunktion teilt den Variablenraum in 2 Gebiete: Oberhalb Stechmücke (c1), unterhalb Blindmücke (c2).

2 1x b ax Somit folgt die Klassifikationsfunktion

1 2 11 2

2 2 1

, wenn ,

, wenn

c x ax bg x x

c x ax b

Page 17: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Einfache Lösung

2D BeispielDiskriminanzanalyse

Zuerst die Daten im Nullpunkt zentrieren und dann um den optimalen Winkel drehen !

x1

1x

2xx2

Zentrierung &Rotation !

Die Varianz zwischen den Gruppen wird auf der Achse x‘1 maximiert, und x‘2 steht senkrecht x‘1. Eine Parallele zu x‘2 liefert das optimale Trennkriterium.

Page 18: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

z-Standard

2D BeispielDiskriminanzanalyse

standardisiert

-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00

-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00

z1

z2

Page 19: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

z-Standard

2D BeispielDiskriminanzanalyse

Diskriminanz-funktion

• Die neue x- Achse z1‘ ist die Diskriminanzfunktion y. Auf ihr läßt sich ein Kriterium zur optimalen Trennung beider Gruppen finden.

1 1 1 2 2z b z b z

• Da eine Drehoperation auf die Diskriminanzfunktion geführt hat, ist sie darstellbar als eine Linearkombination der alten Koordinaten:

-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00

-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00

z‘1

z‘2

Koordinaten rotiert um = 46° (clockwise)

Page 20: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

y: Linear-kombination

2D BeispielDiskriminanzanalyse

Koeffizientenvon y

Das Auffinden der Koeffizienten b1 und b2 ist also identisch mit dem Problem, den optimalen Drehwinkel zu bestimmen. Hierfür braucht man ein Kriterium der gewünschten maximalen Trennung, und die Lösung des dahinter stehenden Maximierungsproblems.

y (Diskriminanzfunktion)

Kriterium y0

blindstech

1 1

2 2

cos sin

sin cos

z z

z z

1 2 1

1 2 2

cos sin

sin cos

z z z

z z z

Da 1y z gilt

1 1 2 2y b z b z

mit 1 cosb und 2 sinb

[Excel-Beispiel]

Page 21: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Rotation zury - Funktion

2D BeispielDiskriminanzanalyse

y (Diskriminanzfunktion)

z1

z2

Klassifikation • Case-Classification durch einfachen Vergleich mit dem Kriterium y0. • Prüfung des Gruppenunterschieds mit einem einfachen t - Test auf y.

y (Diskriminanzfunktion)

Kriterium y0

blind

stech

Page 22: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz 20.10.2008

Methoden derPsychologie

Vergleich derCIs

2D Konfidenzregionen und 1D Konfidenzintervalle ermöglichenverschiedene Entscheidungen, je nachdem, ob Paarungen vonMittelwerten (Centroiden) oder einzelne Mittelwerte interessieren.Zu beachten ist, dass im multivariaten Kontext Aussagen für eineAchse strenggenommen nie ohne Berücksichtigung des Wertes auf den anderen Variablenachsen gemacht werden können (Bounding-Box und Bonferroni-Box hat immer mehr Fläche als die CI-Ellipse)

CI-Aussagen

Univariate - Multivariate – Konfidenzregionen

0.50

0.55

0.60

0.65

0.70

0.50 0.55 0.60 0.65 0.70

x1

alpha-CE

DataCentroid

ProbeCentroid

x2 Simultanes CI

Bonferroni

1D (falsch)