Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Statistik fur Informatiker, SS 2019
2. Ideen aus der Statistik
2.1 Deskriptive Statistik
Matthias Birkner
http://www.staff.uni-mainz.de/birkner/StatInfo19/
24.6.2019
1/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
2/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Viele Menschen stehen ”Statistik“ kritisch gegenuber:
It is easy to lie with statistics.
It is hard to tell the truth without it.
Andrejs Dunkels (1939–1998)
3/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Viele Menschen stehen ”Statistik“ kritisch gegenuber:
It is easy to lie with statistics.It is hard to tell the truth without it.
Andrejs Dunkels (1939–1998)
3/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellieren
Die Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.
Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.4/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Deskriptive (d.h. beschreibende) Statistik
Wie geht man mit variablen Daten um?
”0. Antwort“: Man verschafft sich einenersten Eindruck mittels graphischerDarstellungen und statistischerKenngroßen
5/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Deskriptive (d.h. beschreibende) Statistik
Wie geht man mit variablen Daten um?
”0. Antwort“: Man verschafft sich einenersten Eindruck mittels graphischerDarstellungen und statistischerKenngroßen
5/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
6/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Ein Beispiel
Bei einer biologischen Expeditionwurden in der Nordsee Springkrebse(Galathea intermedia) gefangenund untersucht.
Die Daten: Helgolander Tiefe Rinne, Fang vom 6.9.
Carapaxlange (mm):Nichteiertragende Weibchen (n = 215)
2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,03,0 2,9 3,4 2,8 2,9 2,8 2,8 2,42,8 2,5 2,7 3,0 2,9 3,2 3,1 3,02,7 2,5 3,0 2,8 2,8 2,8 2,7 3,02,6 3,0 2,9 2,8 2,9 2,9 2,3 2,72,6 2,7 2,5 . . . . .
7/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Ein Beispiel
Bei einer biologischen Expeditionwurden in der Nordsee Springkrebse(Galathea intermedia) gefangenund untersucht.Die Daten: Helgolander Tiefe Rinne, Fang vom 6.9.
Carapaxlange (mm):Nichteiertragende Weibchen (n = 215)
2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,03,0 2,9 3,4 2,8 2,9 2,8 2,8 2,42,8 2,5 2,7 3,0 2,9 3,2 3,1 3,02,7 2,5 3,0 2,8 2,8 2,8 2,7 3,02,6 3,0 2,9 2,8 2,9 2,9 2,3 2,72,6 2,7 2,5 . . . . .
7/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
0 50 100 150 200
2.0
2.5
3.0
Stichprobe vom 6. September, n=215
Index
Car
apax
lang
e[m
m]
8/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
9/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Eine Moglichkeit der graphischenDarstellung:
das Histogramm
10/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramm der Carapaxlangen in der Stichprobe
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?
11/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramm der Carapaxlangen in der Stichprobe
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?11/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramm der Carapaxlangen in der Stichprobe
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
22
Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?22
12/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Analoge Daten zwei Monate spater(Stichprobe vom 3.11. der Große n = 57)
Stichprobe vom 3. November, n=57
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
05
1015
2025
13/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vergleich der beiden VerteilungenBeide Stichproben
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57
Idee: stauche vertikale Achse so, dass Gesamtflache = 1.
14/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vergleich der beiden VerteilungenBeide Stichproben
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57
Idee: stauche vertikale Achse so, dass Gesamtflache = 1.
14/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vergleich der beiden VerteilungenBeide Stichproben
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57
Idee: stauche vertikale Achse so, dass Gesamtflache = 1.14/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Die Gesamtflache der Balken ist nun = 1.
Die neue vertikale Koordinate ist jetzt eine Dichte (engl.density).
15/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Die Gesamtflache der Balken ist nun = 1.
Die neue vertikale Koordinate ist jetzt eine Dichte (engl.density).
15/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.
Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%
16/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.
Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?
Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%
16/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.
Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%
16/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Die beiden Histogramme sind jetztvergleichbar
(sie haben dieselbe Gesamtflache).
17/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Die beiden Histogramme sind jetztvergleichbar
(sie haben dieselbe Gesamtflache).
17/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
Beide Stichproben
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
2.0
2.5
18/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
Beide Stichproben
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
2.0
2.5
19/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
1.5 1.7 1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7
Beide Stichproben0.
00.
51.
01.
52.
0
20/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
Beide Stichproben
1.3 1.5 1.7 1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.90
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
Sept
Nov
21/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vorschlag
Total abgefahrene 3D-Plots konnen in der Werbung nutzlich sein
,
fur die Wissenschaft sind einfache und klare2D-Darstellungen meistens angemessener.
22/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vorschlag
Total abgefahrene 3D-Plots konnen in der Werbung nutzlich sein,
fur die Wissenschaft sind einfache und klare2D-Darstellungen meistens angemessener.
22/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Problem
Histogramme kann man nicht ohneweiteres
in demselben Graphendarstellen,
weil sie einanderuberdecken wurden.
23/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Problem
Histogramme kann man nicht ohneweiteres
in demselben Graphendarstellen,
weil sie einanderuberdecken wurden.
23/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Einfache und klare Losung: Dichtepolygone
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
24/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Einfache und klare Losung: Dichtepolygone
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
25/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Einfache und klare Losung: Dichtepolygone
Stichprobe vom 3. November, n=57
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
2.0
26/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zwei (oder mehr) Dichtepolygone in einem Plot
1.5 2.0 2.5 3.0 3.5 4.0
0.0
0.5
1.0
1.5
2.0
2.5
Beide Stichproben
Carapaxlange [mm]
Dic
hte
SeptNov
Man sieht sofort:Die Verteilung in der Stichprobe vom November ist gegenuberder vom September nach links verschoben (und sie ist auchstarker um den haufigsten Wert konzentriert).
27/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zwei (oder mehr) Dichtepolygone in einem Plot
1.5 2.0 2.5 3.0 3.5 4.0
0.0
0.5
1.0
1.5
2.0
2.5
Beide Stichproben
Carapaxlange [mm]
Dic
hte
SeptNov
Man sieht sofort:Die Verteilung in der Stichprobe vom November ist gegenuberder vom September nach links verschoben (und sie ist auchstarker um den haufigsten Wert konzentriert).
27/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
29/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stripchart, einfach
Carapaxlangen in den beiden Stichproben
1.5 2.0 2.5 3.0 3.5
Sep
tN
ov
30/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stripchart, mit “jitter”
Carapaxlangen in den beiden Stichproben
1.5 2.0 2.5 3.0 3.5
Sep
tN
ov
31/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stripchart, mit “stacking”
Carapaxlangen in den beiden Stichproben
1.5 2.0 2.5 3.0 3.5
Sep
tN
ov
32/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramme/Dichtepolygone undStripcharts
gebenein ausfuhrliches Bildeines Datensatzes.
Manchmal zu ausfuhrlich.
33/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramme/Dichtepolygone undStripcharts
gebenein ausfuhrliches Bildeines Datensatzes.
Manchmal zu ausfuhrlich.
33/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
34/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zu viel Information erschwert den Uberblick
Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum
Wald?
35/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zu viel Information erschwert den Uberblick
Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum
Wald?
35/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, einfache Ausfuhrung
0 2 4 6
x
0 2 4 6
36/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, einfache Ausfuhrung
0 2 4 6
x
0 2 4 6
25% 25% 25% 25%
36/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, einfache Ausfuhrung
0 2 4 6
x
0 2 4 6
25% 25% 25% 25%
Min Max1. Quartil 3. QuartilMedian
36/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Standard-Ausfuhrung
0 2 4 6
x
0 2 4 6
37/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Standard-Ausfuhrung
0 2 4 6
x
0 2 4 6
Interquartilbereich (IQR)
1.5 × IQR 1.5 × IQR
37/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Profi-Ausfuhrung
0 2 4 6
x
0 2 4 6
38/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Profi-Ausfuhrung
0 2 4 6
x
0 2 4 6
95%-Konfidenzintervall fur den Median
38/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Beispiel:Vergleich von mehreren Gruppen
39/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Dic
hte
8 10 12 14
0.00
Dic
hte
8 10 12 14
0.00
Dic
hte
8 10 12 14
0.0
Dic
hte
8 10 12 14
0.0
40/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
12
34
8 10 12 14
40/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
41/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Graphische Tricksereien
im Bereich der deskriptiven Statistik / der Kommunikationvon numerischen Beobachtungen oder Resultaten:
(Graphische) Tricksereien / ”Aufhubschen“ vonBeobachtungen, z.B.
Irrefuhrende Wahl des NullpunktsStillschweigende nicht-lineare Transformationen derAchsenoptische Tauschung durch unpassende2d/3d-Grafiken...
konnen den Betrachter (manchmal absichtlich) in die Irrefuhren.
42/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Beunruhigend große Fluktuationen beimDornfelder?
Hektarertrage Dornfelder, 1994–2013 (in hl)
1995 2000 2005 2010
110
120
130
140
150
160
170
Jahr
Hek
tare
rtra
g
Daten: Statistisches Landesamt RLP
43/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Beunruhigend große Fluktuationen beimDornfelder?
Hektarertrage Dornfelder, 1994–2013 (in hl)
1995 2000 2005 2010
050
100
150
Jahr
Hek
tare
rtra
g
Daten: Statistisches Landesamt RLP
44/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Rotwein in RLP: nur ein Tropfchen?
Bestockte Weinflachen in RLP 2013
Rotwein: 8881 ha Weißwein: 14686 ha
Daten: Statistisches Landesamt RLP; Bilder (c) Benutzer Andre Karwath
45/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Rotwein in RLP: nur ein Tropfchen?Bestockte Weinflachen in RLP 2013
020
0040
0060
0080
0010
000
1200
014
000
Rotwein: 8881 ha Weißwein: 14686 ha
Daten: Statistisches Landesamt RLP46/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
48/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Es ist oft moglich,das Wesentliche
an einer Stichprobe
mit ein paar Zahlenzusammenzufassen.
49/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wesentlich:
1. Wie groß?
Lageparameter
2. Wie variabel?
Streuungsparameter
50/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wesentlich:
1. Wie groß?
Lageparameter
2. Wie variabel?
Streuungsparameter
50/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wesentlich:
1. Wie groß?
Lageparameter
2. Wie variabel?
Streuungsparameter
50/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
51/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Eine Moglichkeitkennen wir schonaus dem Boxplot:
52/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Lageparameter
Der Median
Streuungsparameter
Der Quartilabstand (Q3 −Q1)
53/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Lageparameter
Der Median
Streuungsparameter
Der Quartilabstand (Q3 −Q1)
53/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Lageparameter
Der Median
Streuungsparameter
Der Quartilabstand (Q3 −Q1)
53/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Der Median1:die Halfte der Beobachtungen sind
kleiner,die Halfte sind großer.
Der Median istdas 50%-Quantil
der Daten.
1”saloppe“ Definition (wir sehen gleich die prazise Definition)
54/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Der Median1:die Halfte der Beobachtungen sind
kleiner,die Halfte sind großer.
Der Median istdas 50%-Quantil
der Daten.
1”saloppe“ Definition (wir sehen gleich die prazise Definition)
54/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das erste Quartil2, Q1:
ein Viertel der Beobachtungensind kleiner,
drei Viertel sind großer.
Q1 ist das25%-Quantilder Daten.
2”saloppe“ Definition (wir sehen gleich die prazise Definition)
55/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das erste Quartil2, Q1:ein Viertel der Beobachtungen
sind kleiner,drei Viertel sind großer.
Q1 ist das25%-Quantilder Daten.
2”saloppe“ Definition (wir sehen gleich die prazise Definition)
55/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das erste Quartil2, Q1:ein Viertel der Beobachtungen
sind kleiner,drei Viertel sind großer.
Q1 ist das25%-Quantilder Daten.
2”saloppe“ Definition (wir sehen gleich die prazise Definition)
55/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das dritte Quartil3, Q3:
drei Viertel der Beobachtungensind kleiner,
ein Viertel sind großer.
Q3 ist das75%-Quantilder Daten.
3”saloppe“ Definition (wir sehen gleich die prazise Definition)
56/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das dritte Quartil3, Q3:drei Viertel der Beobachtungen
sind kleiner,ein Viertel sind großer.
Q3 ist das75%-Quantilder Daten.
3”saloppe“ Definition (wir sehen gleich die prazise Definition)
56/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das dritte Quartil3, Q3:drei Viertel der Beobachtungen
sind kleiner,ein Viertel sind großer.
Q3 ist das75%-Quantilder Daten.
3”saloppe“ Definition (wir sehen gleich die prazise Definition)
56/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein
Seien n (reelle) Beobachtungswerte x1,x2, . . . ,xn
gegeben, α ∈ (0,1).q ist (ein) α-Quantil der n Beobachtungswerte, wenn gilt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.: Im Allgemeinen ist ein α-Quantil nicht eindeutig:Seien x(1) ≤ x(2) ≤ ⋯ ≤ x(n) die der Große nach sortiertenWerte.Wenn α = k
n mit 1 ≤ k < n, so ist jeder Wert q ∈ [x(k),x(k+1)]ein α-Quantil,denn ∣i ∶ xi ≤ x(k)∣ ≥ k , ∣i ∶ xi ≥ x(k)∣ ≥ n − k + 1.Wenn nα /∈ 1, . . . ,n − 1, so ist das α-Quantil der Wertx(k) mit k = ⌈αn⌉.
57/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein
Seien n (reelle) Beobachtungswerte x1,x2, . . . ,xn
gegeben, α ∈ (0,1).q ist (ein) α-Quantil der n Beobachtungswerte, wenn gilt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.: Im Allgemeinen ist ein α-Quantil nicht eindeutig:Seien x(1) ≤ x(2) ≤ ⋯ ≤ x(n) die der Große nach sortiertenWerte.Wenn α = k
n mit 1 ≤ k < n, so ist jeder Wert q ∈ [x(k),x(k+1)]ein α-Quantil,denn ∣i ∶ xi ≤ x(k)∣ ≥ k , ∣i ∶ xi ≥ x(k)∣ ≥ n − k + 1.Wenn nα /∈ 1, . . . ,n − 1, so ist das α-Quantil der Wertx(k) mit k = ⌈αn⌉.
57/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein II
n (reelle) Beobachtungswerte x1,x2, . . . ,xn gegeben,α ∈ (0,1).(ein) α-Quantil q der n Beobachtungswerte erfullt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.:Die Definition passt zu unserer fruheren Definition furVerteilungen, wenn man die empirische Verteilung1n ∑
ni=1 δxi betrachtet.
In der Literatur (und auch in Statistik-Software) sindverschiedene Interpolationen ublich, um ”das“α-Quantil stetig in α zu machen.(In R siehe etwa help(quantile), es sind 9 Variantenimplementiert.)Die Uneindeutigkeit des α-Quantils ist fur halbwegsgroße n in der Praxis oft wenig von Belang.
58/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein II
n (reelle) Beobachtungswerte x1,x2, . . . ,xn gegeben,α ∈ (0,1).(ein) α-Quantil q der n Beobachtungswerte erfullt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.:Die Definition passt zu unserer fruheren Definition furVerteilungen, wenn man die empirische Verteilung1n ∑
ni=1 δxi betrachtet.
In der Literatur (und auch in Statistik-Software) sindverschiedene Interpolationen ublich, um ”das“α-Quantil stetig in α zu machen.(In R siehe etwa help(quantile), es sind 9 Variantenimplementiert.)Die Uneindeutigkeit des α-Quantils ist fur halbwegsgroße n in der Praxis oft wenig von Belang.
58/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
59/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
n (reelle) Beobachtungswerte x1,x2, . . . ,xn
Am haufigsten werden benutzt:
Lageparameter
Der Mittelwert x ∶= 1n
n
∑i=1
xi
StreuungsparameterDie Standardabweichung s (bzw. σ)
wobei
σ2 = 1n
n
∑i=1
(xi − x)2 die (empirische) Varianz
s2 = 1n − 1
n
∑i=1
(xi − x)2 die korrigierte Stichproben-Varianz
( = nn−1σ
2)
60/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
n (reelle) Beobachtungswerte x1,x2, . . . ,xn
Am haufigsten werden benutzt:
Lageparameter
Der Mittelwert x ∶= 1n
n
∑i=1
xi
StreuungsparameterDie Standardabweichung s (bzw. σ)
wobei
σ2 = 1n
n
∑i=1
(xi − x)2 die (empirische) Varianz
s2 = 1n − 1
n
∑i=1
(xi − x)2 die korrigierte Stichproben-Varianz
( = nn−1σ
2)
60/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
n (reelle) Beobachtungswerte x1,x2, . . . ,xn
Am haufigsten werden benutzt:
Lageparameter
Der Mittelwert x ∶= 1n
n
∑i=1
xi
StreuungsparameterDie Standardabweichung s (bzw. σ)
wobei
σ2 = 1n
n
∑i=1
(xi − x)2 die (empirische) Varianz
s2 = 1n − 1
n
∑i=1
(xi − x)2 die korrigierte Stichproben-Varianz
( = nn−1σ
2)60/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Erinnerung: Geometrische Bedeutungdes Mittelwerts
Der Schwerpunkt
61/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wir stellen uns die Beobachtungen alsgleich schwere Gewichte auf einer
Waage vor:
0 1 2 3
x
62/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wo muß der Drehpunkt sein, damit dieWaage im Gleichgewicht ist?
0 1 2 3
x
62/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,5 ?
63/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,5 ?
zu klein
63/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 2 ?
63/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 2 ?
zu groß
63/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,8 ?
63/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,8 ?
richtig
63/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Oft kann man ”mit dem bloßen Auge“anhand eines Histogramms den
Mittelwert gut einschatzen.
Beispiel: Galathea intermedia
”Rundlichkeit“:=
Abdominalbreite / Carapaxlange
64/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Beispiel:
3.11.88
66/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Standardabweichung (auch: Streuung)
Wie weit weichteine typische Beobachtung
vomMittelwert
ab ?
68/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Standardabweichung (auch: Streuung)
Wie weit weichteine typische Beobachtung
vomMittelwert
ab ?
68/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Mit n oder n − 1 berechnen?
Die Standardabweichung σ eines Zufallsexperiments mitn gleichwahrscheinlichen Ausgangen x1, . . . ,xn (z.B.Wurfelwurf) ist definiert durch (vgl. Def. 1.76)
σ =¿ÁÁÀ1
n
n
∑i=1
(xi − x)2.
Wenn es sich bei x1, . . . ,xn um Beobachtungswerte ineiner Stichprobe handelt, verwendet man eher
s =¿ÁÁÀ 1
n − 1
n
∑i=1
(xi − x)2.
69/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Mit n oder n − 1 berechnen?
Die Standardabweichung σ eines Zufallsexperiments mitn gleichwahrscheinlichen Ausgangen x1, . . . ,xn (z.B.Wurfelwurf) ist definiert durch (vgl. Def. 1.76)
σ =¿ÁÁÀ1
n
n
∑i=1
(xi − x)2.
Wenn es sich bei x1, . . . ,xn um Beobachtungswerte ineiner Stichprobe handelt, verwendet man eher
s =¿ÁÁÀ 1
n − 1
n
∑i=1
(xi − x)2.
69/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
s als Schatzer fur σ
Wir werden sehen:Wenn X1, . . . ,Xn u.i.v. Zufallsvariablen mit VarianzVar[X1] = σ2,
X ∶= 1n
n
∑i=1
Xi ,
so hat die Zufallsvariable
S2 ∶= 1n − 1
n
∑i=1
(Xi −X)2
die EigenschaftE[S2] = σ2.
70/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Faustregel fur die Standardabweichung
Bei ungefahr glockenformigen (also eingipfligen undsymmetrischen) Verteilungen liegen ca. 2/3 der Verteilungzwischen x − σ und x + σ.
0.0
0.2
0.4
0.6
0.8
1.0
prob
abili
ty d
ensi
ty
x −− σσ x x ++ σσ
Oft kann man so die Standardabweichung ”mit bloßemAuge“ abschatzen.
71/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Faustregel fur die Standardabweichung
Bei ungefahr glockenformigen (also eingipfligen undsymmetrischen) Verteilungen liegen ca. 2/3 der Verteilungzwischen x − σ und x + σ.
0.0
0.2
0.4
0.6
0.8
1.0
prob
abili
ty d
ensi
ty
x −− σσ x x ++ σσ
Oft kann man so die Standardabweichung ”mit bloßemAuge“ abschatzen.
71/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88
Nichteiertragende Weibchen
Carapaxlänge [mm]
Dic
hte
2.0 2.5 3.0
0.0
0.5
1.0
1.5 x == 2.53
Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.
72/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88
Nichteiertragende Weibchen
Carapaxlänge [mm]
Dic
hte
2.0 2.5 3.0
0.0
0.5
1.0
1.5 x == 2.53x == 2.53σσ == 0.28
σσ2 == 0.077
Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.
72/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88
Nichteiertragende Weibchen
Carapaxlänge [mm]
Dic
hte
2.0 2.5 3.0
0.0
0.5
1.0
1.5 x == 2.53x == 2.53σσ == 0.28
σσ2 == 0.077
Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.72/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Ubrigens: Einschlagige R-Befehle
Mittelwert (mean), Standardabweichung (sd), Median,und Quantilemean(x)sd(x)median(x)quantile(x, 0.25, type=1)quantile(x, 0.75, type=1)summary(x)
Boxplot, Histogrammboxplot(x)hist(x) (fur Dichtehistogramm: hist(x, prob=T))
Ein Dichtepolygon gewinnt man z.B. viah <- hist(x)plot(h$mids, h$density, type=’l’)
73/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
74/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig ist
und mussen andernfalls mit Vorsicht interpretiertwerden.
Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.
M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.
(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)
75/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig istund mussen andernfalls mit Vorsicht interpretiertwerden.
Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.
M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.
(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)
75/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig istund mussen andernfalls mit Vorsicht interpretiertwerden.
Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.
M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.
(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)
75/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
76/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Bachstelzen fressen DungfliegenRauber Beute
Bachstelze (White Wagtail) Gelbe DungfliegeMotacilla alba alba Scatophaga stercoraria
image (c) by Artur Mikołajewski image (c) by Viatour Luc
77/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vermutung
Die Fliegen sind unterschiedlich großEffizienz fur die Bachstelze = Energiegewinn / Zeitzum Fangen und fressenLaborexperimente lassen vermuten, dass dieEffizienz bei 7mm großen Fliegen maximal ist.
N.B. Davies.Prey selection and social behaviour in wagtails (Aves:Motacillidae).J. Anim. Ecol., 46:37–57, 1977.
78/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
available dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
050
100
150
79/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
available dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
050
100
150 mean= 7.99
79/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
available dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
050
100
150 mean= 7.99
sd= 0.96
79/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
captured dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
010
2030
4050
60
79/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
captured dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
010
2030
4050
60 mean= 6.79
79/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
captured dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
010
2030
4050
60 mean= 6.79
sd= 0.69
79/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
79/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert
6.79 < 7.99Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert
6.79
<
7.99Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.79 < 7.99
Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.79 < 7.99Standardabweichung
0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.79 < 7.99Standardabweichung
0.69
<
0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.79 < 7.99Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Interpretation
Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mmgroß sind.
Hier waren die Verteilungen glockenformig und esgenugten 4 Werte (die beiden Mittelwerte und die beidenStandardabweichungen), um die Daten adaquat zubeschreiben.
81/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Interpretation
Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mmgroß sind.
Hier waren die Verteilungen glockenformig und esgenugten 4 Werte (die beiden Mittelwerte und die beidenStandardabweichungen), um die Daten adaquat zubeschreiben.
81/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
82/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensisimage (c) by Bernard Gagnon
83/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Simulierte Daten:Eine Stichprobe von 70 SpinnenMittlere Große: 21,06 mmStandardabweichung der Große: 12,94 mm
84/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
?????
size [mm]
Fre
quen
cy
0 10 20 30 40 50
01
23
45
6
85/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
85/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
mean= 21.06
85/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
males females
85/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
males females
85/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensisimage (c) by Arthur Chapman 86/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Fazit des Spinnenbeispiels
Wenn die Daten aus verschiedenen Gruppenzusammengesetzt sind, die sich bezuglich des Merkmalsdeutlich unterscheiden, kann es sinnvoll sein,Kenngroßen wie den Mittelwert fur jede Gruppe einzelnzu berechnen.
87/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
88/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Kupfertolerantes Rotes Straußgras
Rotes Straußgras KupferAgrostis tenuis Cuprum
image (c) Kristian Peters Hendrick met de Bles
89/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.
Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.
Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.
Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
020
4060
8010
0 Copper Mine Grass
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
010
2030
40
Grass seeds from a meadow
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
010
2030
40
Grass seeds from a meadow
copper tolerant ?
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
0 50 100 150 200
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
meadow plants
copper mine plants
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
020
4060
8010
0 copper mine plants
m m+sm−s
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
010
2030
40
meadow plants
m m+sm−s
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Fazit des Straußgras-Beispiels
Manche Verteilungen konnen nur mit mehr alszwei Variablen angemessen beschrieben
werden.
z.B. mit den funf Werten der Boxplots:min, Q1, median, Q3, max
92/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Fazit des Straußgras-Beispiels
Manche Verteilungen konnen nur mit mehr alszwei Variablen angemessen beschrieben
werden.
z.B. mit den funf Werten der Boxplots:min, Q1, median, Q3, max
92/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
0 50 100 150 200
Browntop Bent n=50+50
root length (cm)
copper mine plants
meadow plants
93/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Schlussfolgerung
Viele Datenverteilungen sind annaherndglockenformig und konnen durch den Mittelwert
und die Standardabweichung hinreichendbeschrieben werden.
Es gibt aber auch Ausnahmen. Also:Besser ist es, die Daten auch graphisch zu
untersuchen,und sich nicht allein auf numerische
Kenngroßen zu verlassen.
94/94
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Schlussfolgerung
Viele Datenverteilungen sind annaherndglockenformig und konnen durch den Mittelwert
und die Standardabweichung hinreichendbeschrieben werden.
Es gibt aber auch Ausnahmen. Also:Besser ist es, die Daten auch graphisch zu
untersuchen,und sich nicht allein auf numerische
Kenngroßen zu verlassen.
94/94