Upload
sofie-ziebarth
View
111
Download
4
Embed Size (px)
Citation preview
Methoden derPsychologie
Multivariate Analysemethoden
Günter MeinhardtJohannes Gutenberg Universität Mainz
20.10.2008
Methoden derPsychologie
Vorlesung
Einführung Was sind multivariate Analysemethoden?
Verfahrensdarstellung in
• Überblick • Grundprinzip• wichtigsten mathematischen Beziehungen• Anwendungsbeispielen
Übung Vermittlung von Hintergründen/Voraussetzungen
• Grundlagen der linearen Algebra• Wiederholung / Durcharbeiten der Beispiele• Aufgaben und Anwendungen auf verwandte ProblemePrüfung• Klausur zum Abschluss des SS. Aufgaben: Wissen auf beiden Niveaus (Grundprinzip+Anwendung)• Teilklausur zum Ende des WS 2008/09
Methoden derPsychologie
Literatur
Einführung Was sind multivariate Analysemethoden?
a) b)
c) d)
Methoden derPsychologie
Inhalte im WS 2008/09
Einführung Was sind multivariate Analysemethoden?
MultivariateKlassifikation I
MultidimensionaleSkalierung
Vektoren / Matrizen
Faktorenanalyse
Multivariate Distanz
Deskriptive multivariate Methoden
Methoden derPsychologie
Einteilung
Einführung Was sind multivariate Analysemethoden?
Latente Variable
• Faktorenanalyse• Diskriminanzanalyse• MDS• Kanonische Korrelation• LISREL
Konkrete Variable
• Multiple/Logistische Regression• T2 / MANOVA• Conjoint Measurement• Kanonische Korrelation
Multivariate Analysemethoden
Methoden derPsychologie
Latente Variable
Verfahren Latente Variable
Multidimensionale Skalierung
Problem:
Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum)
Möglichkeiten:
Faktorenanalyse MultidimensionaleSkalierung
Methoden derPsychologie
LatenteVariable
Einführung Was sind multivariate Analysemethoden?
Faktor / MDS
Demo - Beispiel mit Excel und Statistica
Methoden derPsychologie
Multivariates Testen
Einführung Was sind multivariate Analysemethoden?
Grundüberlegungen zum Unterschied des Testens mit einer AV und mehreren AVs
Grundprinzip und Beispiel anhand einer 2 Vars - 2Groups Diskriminanzanalyse
Methoden derPsychologie
Mittelwertsprüfung bei mehreren Variablen
Beispiel
X1: Gehalt
X2: EntscheidungsfreiheitX3: Qualität der Kommunikation
Arbeit
X4: Ehe
X5: Freunde/BeziehungenX6: Sexualität
Privatsphäre
X7: Lebensansprüche
X8: Sinnhaftigkeit
Person
X9: Hobbies
X10: Sport/Fitness
Aktivität
( )1 2 10, , ,x x xK
Lebenszufriedenheit
Gesunde Herzinfarktpatienten
10 Variablen
2 Gruppen
Methoden derPsychologie
Multivariate Mittelwertsvergleiche - Einzeltestungen
Teststrategie
Ausweg
Frage Unterscheiden sich Gesunde und Patienten im Variablen-komplex Lebenszufriedenheit?
Wir testen auf jeder der 10 Skalen den Gruppenunterschied mit einem t- Test. Wenn irgend einer der Tests signifikantwird, sehen wir die Gruppen als verschieden an.Probleme 1. Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft.
2. Unterstellte Unabhängigkeit: Man behandelt die einzelnen Skalen als unabhängig voneinander.
3. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht alsVariablenkomplex mit Binnenstruktur behandelt.
4. Mangelnde Teststärke: Man nutzt nicht die Korrelations-struktur der Variablen für einen leistungsfähigen Test.
Verwendung eines multivariaten Tests, der die Information aller 10 Variablen und ihrer Korrelationsstruktur in eine statistische Prüfgrösse einfliessen lässt.
Methoden derPsychologie
Multivariate Mittelwertsvergleiche - Verfahren
MultivariatesTestkonstrukt
Variablen-komplex
Verfahren
( )1 2 10, , ,x x xK
Multivariate Distanz(Mahalanobisdistanz)
Multivariate Quadratsummen(SSCP-Matrizen-Zerlegung)
Optimale Linearkombination(Linear Discriminant Function)
Hotelling‘s T2 MANOVA Diskriminanz-Analyse
Alle Verfahren entscheiden über den Gruppenunterschied imgesamten Variablenkomplex mit einem statistischen Test
Methoden derPsychologie
Grundprinzip(2 Gruppen)
Multivariates Testen - Diskriminanzanalyse
( )1 2, , , mx x xKFür die m Variablen
finde eine Linearkombination zu einer neuen Variable
0 1 1 2 2 m my b b x b x b x= + + + +K
so dass diese die Gruppen c1 und c2 optimal trennt.
Das Optimierungskriterium für die Wahl der bj lautet
erklärte Variationmax
nicht erklärte VariationBetween
Within
QS
QS
Die der bj sind so zu wählen, dass auf der neuen Variable y die Streuung zwischen den Gruppen zu der Streuung innerhalb der Gruppen ein maximales Verhältnis hat.
Kriterium derOptimierung
Methoden derPsychologie
2D-Beispiel Man möchte trennen
anhand von
Anforderung
2D BeispielDiskriminanzanalyse
Stechmückenc1
Blindmückenc2
Fühlerlänge
x1
2 Gruppen
2 Variablen Flügellänge
x2
• Maximale Gruppentrennung (Mittelwerte)• Minimale Klassifikationsfehler (Fall-Klassifikation)
Methoden derPsychologie
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1.40
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70
(Fühlerlänge)
Blindmücke
Stechmücke
Variablenraum
• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).
• In beiden Gruppen existiert eine Korrelation der Variablen Fühlerlänge (X1) und Flügellänge (X2).
Ausgangslage
2D BeispielDiskriminanzanalyse
x1
(Flügelänge)
x2
Regression Stechmücke
Regression Blindmücke
Methoden derPsychologie
Bestes Kriterium auf x1
Blindmücke
Stechmücke
• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).
• Das geht mit einem Kriteriumswert auf jeder einzelnen Variable X1
und X2 offenbar nicht.
Problem
2D BeispielDiskriminanzanalyse
x1
x2
Bestes Kriterium auf x2
Variablenraum
Methoden derPsychologie
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1.40
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70
(Fühlerlänge)
Blindmücke
Stechmücke
Variablenraum
2D BeispielDiskriminanzanalyse
x1
(Flügelänge)
x2
Kriteriumsfunktion
Lösung Eine lineare Kriteriumsfunktion teilt den Variablenraum in 2 Gebiete: Oberhalb Stechmücke (c1), unterhalb Blindmücke (c2).
2 1x b ax Somit folgt die Klassifikationsfunktion
1 2 11 2
2 2 1
, wenn ,
, wenn
c x ax bg x x
c x ax b
Methoden derPsychologie
Einfache Lösung
2D BeispielDiskriminanzanalyse
Zuerst die Daten im Nullpunkt zentrieren und dann um den optimalen Winkel drehen !
x1
1x
2xx2
Zentrierung &Rotation !
Die Varianz zwischen den Gruppen wird auf der Achse x‘1 maximiert, und x‘2 steht senkrecht x‘1. Eine Parallele zu x‘2 liefert das optimale Trennkriterium.
Methoden derPsychologie
z-Standard
2D BeispielDiskriminanzanalyse
standardisiert
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00
z1
z2
Methoden derPsychologie
z-Standard
2D BeispielDiskriminanzanalyse
Diskriminanz-funktion
• Die neue x- Achse z1‘ ist die Diskriminanzfunktion y. Auf ihr läßt sich ein Kriterium zur optimalen Trennung beider Gruppen finden.
1 1 1 2 2z b z b z
• Da eine Drehoperation auf die Diskriminanzfunktion geführt hat, ist sie darstellbar als eine Linearkombination der alten Koordinaten:
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00
z‘1
z‘2
Koordinaten rotiert um = 46° (clockwise)
Methoden derPsychologie
y: Linear-kombination
2D BeispielDiskriminanzanalyse
Koeffizientenvon y
Das Auffinden der Koeffizienten b1 und b2 ist also identisch mit dem Problem, den optimalen Drehwinkel zu bestimmen. Hierfür braucht man ein Kriterium der gewünschten maximalen Trennung, und die Lösung des dahinter stehenden Maximierungsproblems.
y (Diskriminanzfunktion)
Kriterium y0
blindstech
1 1
2 2
cos sin
sin cos
z z
z z
1 2 1
1 2 2
cos sin
sin cos
z z z
z z z
Da 1y z gilt
1 1 2 2y b z b z
mit 1 cosb und 2 sinb
[Excel-Beispiel]
Methoden derPsychologie
Rotation zury - Funktion
2D BeispielDiskriminanzanalyse
y (Diskriminanzfunktion)
z1
z2
Klassifikation • Case-Classification durch einfachen Vergleich mit dem Kriterium y0. • Prüfung des Gruppenunterschieds mit einem einfachen t - Test auf y.
y (Diskriminanzfunktion)
Kriterium y0
blind
stech
Methoden derPsychologie
Vergleich derCIs
2D Konfidenzregionen und 1D Konfidenzintervalle ermöglichenverschiedene Entscheidungen, je nachdem, ob Paarungen vonMittelwerten (Centroiden) oder einzelne Mittelwerte interessieren.Zu beachten ist, dass im multivariaten Kontext Aussagen für eineAchse strenggenommen nie ohne Berücksichtigung des Wertes auf den anderen Variablenachsen gemacht werden können (Bounding-Box und Bonferroni-Box hat immer mehr Fläche als die CI-Ellipse)
CI-Aussagen
Univariate - Multivariate – Konfidenzregionen
0.50
0.55
0.60
0.65
0.70
0.50 0.55 0.60 0.65 0.70
x1
alpha-CE
DataCentroid
ProbeCentroid
x2 Simultanes CI
Bonferroni
1D (falsch)