Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl...

Preview:

Citation preview

KolmogorovKolmogorov--SmirnovSmirnov--TestTest

Forschungsmethodik II

Mag.rer.nat. M. Kickmeier-Rust

Karl-Franzens-Universität Graz

1

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov-- Smirnov TestSmirnov Test

�Andrei Nikolajewitsch Kolmogorov

− * 25.4.1903 - † 20.10.1987

2

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov-- Smirnov TestSmirnov Test

�Wladimir Iwanowitsch Smirnov

−* 10.6.1887 - † 11.2.1974

3

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

EinleitungEinleitung

�Statistischer Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen

�zwei Zufallsvariablen die gleiche Verteilung �zwei Zufallsvariablen die gleiche Verteilung besitzen

�eine Zufallsvariable einer Wahrscheinlichkeitsverteilung folgt

(Kolmogorov- Smirnov- Anpassungstest)

4

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

EinleitungEinleitung

�NVT als Voraussetzung für viele statistische Verfahren

�Überprüfung mittels KSA

5

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

EinleitungEinleitung

�Kolmogorov- Smirnov: n <50

�n >50: Chi- Quadrat

�Nichtparametrischer Test− stabil

−unanfällig

6

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov-- SmirnovSmirnov-- TestTest

�Stetig verteilte metrische Merkmale

�Diskrete Merkmale

�Rangskalierte Merkmale�Rangskalierte Merkmale

�Weniger Trennschärfe

7

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov-- SmirnovSmirnov-- TestTest

�NullhypotheseH0: Fx(x) = F0(x)

�AlternativhypotheseH1: Fx(x) ≠ F0(x)

8

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov-- SmirnovSmirnov-- TestTest

�p < 0.05: − keine Normalverteilungkeine Normalverteilung

− Zahlenreihen stammen nicht aus derselben Verteilung

9

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test Test ––Berechnung per HandBerechnung per HandBerechnung per HandBerechnung per Hand

10

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

BspBsp. für . für händischehändische BerechnungBerechnung

8 Zeitangaben (= n), die auf Normalverteilung geprüft werden sollensollen

200, 198, 390, 215, 171, 160, 150, 224

11

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

x z Ф(z) f d

1. Tabelle aufstellen

x = die zu testenden Werte

z = z-Werte

Ф(z) = Flächenstücke unter

VorgehensweiseVorgehensweise

Ф(z) = Flächenstücke unter

Normalverteilungskurve

f = gleiche Abstände der

Flächenstücke

d = absolute Differenzen

12

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

VorgehensweiseVorgehensweise

x

150

160

1712. Werte in eine

aufsteigende Reihenfolge 171

198

200

215

224

390

bringen

200, 198, 390, 215, 171,

160, 150, 224�

13

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

3. dazugehörige z-Werte

ausrechnen

VorgehensweiseVorgehensweise

x z Ф(z)

150 -0.84 0.200

160 -0.70 0.242

171 -0.56 0.288

4. gemäß der z-Tabelle

Flächenstücke unter der

Normalverteilungskurve

Ф(z) ermittelten

171 -0.56 0.288

198 -0.20 0.421

200 -0.18 0.429

215 0.02 0.508

224 0.14 0.556

390 2.32 0.990

14

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

Flächenstücke unter der

Normalverteilungskurve sollten bei idealer

Normalverteilung gleiche Abstände haben:

VorgehensweiseVorgehensweise

f

0.125

0.250

0.375

erzeugt durch Division mit Fallzahl n ( = 8 )

5. f berechnen

f = i/n i = 1, …, n

0.500

0.625

0.750

0.875

1.000

15

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

6. Berechnung der

absoluten

Differenzen:

VorgehensweiseVorgehensweise

Ф(z) f d

0.200 0.125 0.075

0.242 0.250 0.008

0.288 0.375 0.087Differenzen:

d = ІФ(z) - fІ

0.421 0.500 0.079

0.429 0.625 0.196

0.508 0.750 0.242

0.556 0.875 0.319

0.990 1.000 0.010

16

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

x z Ф(z) f d

150 -0.84 0.200 0.125 0.075

160 -0.70 0.242 0.250 0.008

171 -0.56 0.288 0.375 0.087

VorgehensweiseVorgehensweise

198 -0.20 0.421 0.500 0.079

200 -0.18 0.429 0.625 0.196

215 0.02 0.508 0.750 0.242

224 0.14 0.556 0.875 0.319

390 2.32 0.990 1.000 0.010

17

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

VorgehensweiseVorgehensweise

Ф(z) f d

0.200 0.125 0.075

0.242 0.250 0.008

0.288 0.375 0.087

Maximum dieser

Differenzen (a) =

Prüfgröße beim

Kolmogorov-0.421 0.500 0.079

0.429 0.625 0.196

0.508 0.750 0.242

0.556 0.875 0.319

0.990 1.000 0.010

Kolmogorov-

Smirnov-Test

a = 0.319

18

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

Maximum dieser Differenzen (a) = Prüfgröße beim Kolmogorov-Smirnov-Test

a = 0.319

VorgehensweiseVorgehensweise

a = 0.319

� kritischen Wert ermitteln:− in Tabelle nachschauen (bei n = 8)

19

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

Kritische WerteKritische Werten kritischer Wert

3 0.708

4 0.624

5 0.563

6 0.5196 0.519

7 0.483

8 0.454

9 0.430

10 0.409

11 0.391

12 0.375

20

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

Maximum dieser Differenzen (a) = Prüfgröße beim Kolmogorov-Smirnov-Test

a = 0.319

VorgehensweiseVorgehensweise

� in Tabelle nachschauen (bei n = 8)

kritischer Wert = 0.454

a < acrit � normalverteilt21

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test Test mit SPSSmit SPSSmit SPSSmit SPSS

22

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

� Menüpunkt ANALYSIEREN

�Aus den Alternativen �Aus den Alternativen NICHTPARAMETRISCHE TESTS wählen

�Auswahlpunkte, die sich rechts öffnen,K-S BEI EINER STICHPROBE wählen

23

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

�Testvariable auswählen, welche auf Normalverteilung überprüft werden.

Achtung: links unten unter Testverteilung darauf achten, dass der Testverteilung darauf achten, dass der Punkt Normal angewählt ist.

� OK anklicken

�Bildschirmausgabe wie folgende:

24

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

25

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS�Hier sind für uns die folgenden Werte

wichtig:

N (in diesem Falle 8), Extremste Differenzen (0,320) und Asymptotische Differenzen (0,320) und Asymptotische Signifikanz.

�Nun vergleichen wir diese beiden ersten Werte mit einer Tabelle für den Kolmogorov-Smirnov-Test.

26

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

�Die nachfolgende Tabelle gibt bei einer 5 % Irrtumswahrscheinlichkeit Grenzwerte für Irrtumswahrscheinlichkeit Grenzwerte für Stichproben an, bei denen n zwischen 1-35 liegt.

27

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

28

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

�Wir suchen nun den Wert für N = 8 und sehen dort die Zahl 0,454.

�Falls die Extremste Differenz in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine Normalverteilung vor.

29

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

� In unserem Fall haben wir jedoch eine Extremste Differenz von nur 0,32. Das Ergebnis wird am Besten so Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer Standardverteilungnicht verworfen werden muss.

30

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS�Auch unser Wert für die Asymptotische Signifikanz ist weit größer als der Grenzwert 0,05.

�Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % Signifikanzniveau).

31

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

�Da unser Wert jedoch deutlich darüber liegt, kann die Hypothese einer Normalverteilung auf diesem Normalverteilung auf diesem Signifikanzniveau nicht verworfen werden.

32

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

�Achtung:

Der Kolmogorov-Smirnov-Testbenötigt, v.a. bei kleinen Stichproben, benötigt, v.a. bei kleinen Stichproben, extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen.

33

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS

�SPSS Syntax

NPAR TEST/K-S (normal) = variable .

34

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser

Vielen DankVielen Dankfür Ihre für Ihre für Ihre für Ihre

Aufmerksamkeit!Aufmerksamkeit!

Lisza Gaiswinkler, Daniela Gusel, Tanja

Schlosser 35

Recommended