289
Jörg Bewersdorff STATISTIK - wie und warum sie funktioniert

STATISTIK – wie und warum sie funktioniert ||

  • Upload
    joerg

  • View
    258

  • Download
    0

Embed Size (px)

Citation preview

  • Jrg Bewersdorff

    STATISTIK - wie und warum sie funktioniert

  • '!IItJ!"hH@i"i"P Stochastik Stochastik fr Einsteiger von Norbert Henze

    Wahrscheinlichkeitstheorie von Christian Hesse

    Einfhrung in die Wahrscheinlichkeitstheorie und Statistik von Ulrich Krengel

    Wahrscheinlichkeitstheorie und Statistik von Albrecht Irle

    Leitfaden Stochastik von Andreas Eichler und Markus Vogel

    Methoden der Statistik von Michael Krapp und lohannes Nebel

    Grundlegende Statistik mit R von lrgen Gro

    Elementare Einfhrung in die Wahrscheinlichkeitsrechnung von Karl Bosch

    Elementare Einfhrung in die angewandte Statistik von Karl Bosch

    www.viewegteubner.de ______________ ---'

  • Jrg Bewersdorff

    STATISTIK -wie und warum sie funktioniert Ein mathematisches Lesebuch

    STUDIUM

    VIEWEG+ TEUBNER

  • Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet ber abrufbar.

    Dr. Jrg Bewersdorff Josef-Mehlhaus-Strae 8 65549 Limburg

    [email protected] Homepage: www.bewersdorff-online.de

    1. Auflage 2011

    Alle Rechte vorbehalten Vieweg+ Teubner Verlag I Springer Fachmedien Wiesbaden GmbH 2011 Lektorat: Ulrike Schmickler-Hirzebruch I Barbara Gerlach Vieweg+ Teubner Verlag ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de

    Das Werk einschlielich aller seiner Teile ist urheberrechtlich geschtzt. Jede Verwertung auerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulssig und strafbar. Das gilt insbesondere fr Vervielfltigungen, bersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.

    Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wren und daher von jedermann benutzt werden drften.

    Umschlaggestaltung: KnkelLopka Medienentwicklung, Heidelberg Graphik: Marco Reinz Druck und buchbinderische Verarbeitung: AZ Druck und Datentechnik GmbH, Berlin Gedruckt auf surefreiem und chlorfrei gebleichtem Papier Printed in Germany

    ISBN 978-3-8348-1753-2

  • Vorwort

    Ich vertraue nur der Statistik, die ich selbst geftilscht habei.

    Selbst wer versucht, der Mathematik mglichst aus dem Weg zu gehen, wird es in Bezug auf die Statistik und der mit ihrer Hilfe gezogenen Schlussfolgerungen kaum schaffen. So werden wir fast wchentlich durch die Medien mit mehr oder minder besorgniserregenden Erkenntnis-sen konfrontiert. Unter anderem erfahren wir dabei, dass in angeblich re-prsentativen Testreihen die Gefhrlichkeit bestimmter Nahrungsbestand-teile erkannt wurde, um daon oft nur wenig spter ber die Relativierung, wenn nicht sogar Widerlegung, solcher Aussagen informiert zu werden. Abseits der im konkreten Einzelfall mglichen lnfragestellung methodi-scher Anstze, etwa im Hinblick auf Placebo-Effekte oder die bertrag-barkeit von Ergebnissen aus Tierversuchen auf Menschen, stellt sich re-gelmig eine ganz prinzipielle Frage: Kann man von einer relativ kleinen Stichprobe, die einer solchen Untersuchung zugrunde liegt, ber-haupt auf eine allgemein gltige Aussage schlieen. Sptestens daon kommt auch die Mathematik ins Spiel, und zwar in Fonn der Mathe-matischen Statistik. Diese Disziplin der angewandten Mathematik bein-haltet nmlich Methoden, die es erlauben, weitgehend gesicherte Aussa-gen ber meist groe Gesamtheiten dadurch zu erhalten, dass deutlich kleinere, zufiUlig ausgewhlte Stichproben untersucht werden. Dabei hat es die innerhalb der Mathematischen Statistik betriebene Forschung zum Gegenstand, die diversen Methoden insbesondere daraufhin zu analysie-ren, unter welchen Umstnden, das heit beispielsweise bei welcher Gr-e einer Stichprobe, ein vorher vorgegebenes Ma an Sicherheit fr die Richtigkeit der Ergebnisse erreicht wird. Basierend auf einer solchen

    1 Das Zitat wird div= Politikern, insbesondere Winslon Churchill, nachgesagt. Ein-deotige Belege fiir eine Urheberschaft konoteo aber nicht ermittelt werdeo. Siehe auch: Werner Barke, "Ich glaube nur der Statistik, die ich selbst gefolscht habe ... ", Statistisches Monatsheft Badeo-WOrtteroberg, 11/2004, S. 50-53.

  • VI Vorwort

    Grundlagenforschung knnen dann - angepasst an die jeweilige Situation - mglichst optimale, das heit mit einem Minimum an Unsicherheit be-haftete, Methoden ausgewhlt werden. Dass solche Problemstellungen alles andere als trivial sind, liegt unter anderem daran, dass der Zufall, welcher einer Stichprobenauswahl zu-grunde liegt, mit der fUr ihn typischen Ungewissheit geradezu im direkten Gegensatz zu stehen scheint zur deterministischen Natur mathematischer Formeln. Und so drfte dieser glcklicherweise nur scheinbare Gegensatz fUr viele Verstndnisprobleme verantwortlich sein, welche die Mathema-tische Statistik immer wieder bereitet. Das vorliegende Bchlein trgt genau diesem Umstand Rechnung: Typi-sche Argumentationen der Mathematischen Statistik sollen exemplarisch erlutert werden, wobei im Wesentlichen nur Kenntnisse vorausgesetzt werden, wie sie auf einer hheren Schule vermittelt werden. Aus diesem Rahmen herausfallende Ausblicke auf besonders abstrakte oder mathema-tisch schwierige Sachverhalte wurden weitestgehend aus dem normalen Text ausgegliedert und knnen zumindest beim ersten Lesen bersprun-gen werden. Generell liegt der Schwerpunkt eindeutig darauf, statistische Argumenta-tionen in prinzipieller Weise zu begrnden und somit die wissenschaftli-che Legitimation fUr den Anwender zu verdeutlichen. Insofern wird so-wohl davon abgesehen, mglichst viele Verfahren ohne jegliche Be-grndung kochrezept-artig zu beschreiben, als auch davon, mathematisch anspruchsvolle Berechnungen und Beweisfiihrungen vollstndig darzule-gen. Stattdessen werden primr solche Sachverhalte ausgewhlt, die fUr ein Verstndnis statistischer Methoden wichtig sind, ganz nach dem Mot-to Statistik - wie und warum sie fUnktioniert. Im Blickpunkt stehen also Ideen, Begriffe und Techniken, die so weit vermittelt werden, dass eine konkrete Anwendung, aber auch die Lektre weiterfhrender Literatur, mglich sein sollte. Dabei soll sowohl dem Schrecken entgegengewirkt werden, der von Tabellen mit suspekt erscheinenden Titeln wie Werte der Normalverteilung und Quantile der Chi-Quadrat-Verteilung ausgehen kann, als auch dem oft zu unbekmmert praktizierten Umgang mit Statis-tik-Programmen.

    Konkret wird zu diesem Zweck deutlich gemacht werden, wie solche Ta-bellen zustande kommen, das heit, wie die dort tabellierten Werte be-

  • Vorwort vn

    stimmt werden knnen, und wie und warum mit ihrer Hilfe Stichproben-ergebnisse interpretierbar sind. Da die dafiir notwendigen mathemati-schen Methoden alles andere als elementar sind, wird vom blicherweise in Statistikbchem beschrittenen Weg abgewichen, indem ein empiri-scher Zugang zu den besagten Tabellen aufgezeigt wird. In Bezug auf diese Tabellen bleibt anzumerken, dass sie heute ihre praktische Bedeu-tung fast vollstndig verloren haben. Der Grund dafiir ist, dass selbst der-jenige, der kein Statistikprogramm zur Verfgung hat, heute mit Tabel-lenka1kulationsprogrammen wie Microsoft Excel oder OpenOjfice ohne groe Mhe einen vollen Zugriff auf die Werte der tabellierten Vertei-lungen besitzt.

    Die Darstellung der formalen Grundlagen ist - soweit irgend mglich und sinnvoll - auf ein Mindestma reduziert. Dabei wurde versucht, zumin-dest die wesentlichen Begriffsbildungen sowie Argumentationsketten zu bercksichtigen und auch auf die Lcken der Darlegung hinzuweisen, so dass weitergehend Interessierte gezielt ergnzende Fachliteratur zu Rate ziehen knnen.

    Nicht unterschlagen werden soll die historische Entwicklung, und zwar zum einen, weil der Aufschwung der Mathematik im zwanzigsten Jahr-hundert, in dem sich die Entwicklung der Mathematischen Statistik im Wesentlichen vollzogen hat, weit weniger bekannt ist als der zeitlich pa-rallel erfolgte Fortschritt bei den Naturwissenschaften, zum anderen, weil es durchaus spannend sein kann, persnlichen Irrtum und Erkenntnisge-winn der zeitrafferartig verkrzten Entwicklung zuordnen zu knnen. Und so werden wir auch im ersten Teil mit einer konkreten Untersuchung starten, die rckblickend als historisch erster sogenannter Hypothesentest verstanden werden kann. Ausgehend von der Diskussion der auf Basis dieser Untersuchung erfolgten Argumentation wird dann im zweiten Teil das mathematische Rstzeug entwickelt, bei dem es sich um die Grund-zge der mathematischen Wahrscheinlichkeitsrechnung handelt. Letztlich handelt es sich dabei um Formeln, mit denen bei zuflligen Prozessen komplizierte Situationen, wie sie insbesondere in Versuchsreihen auftre-ten, rechnerisch auf einfachere Gegebenheiten zurckgefhrt werden knnen. Auf diesen Formeln aufbauend werden dann im dritten Teil typi-sche statistische Tests vorgestellt.

  • VIII Vorwort

    Um auch in der ueren Form eine deutliche Trennlinie zu mathemati-schen Lehrbchern zu ziehen, habe ich eine Darstellungsform gewhlt, wie sie meinen auf hnliche Leserkreise ausgerichteten Bchern Glck, Logik und Bluff Mathematik im Spiel- Methoden, Ergebnisse und Gren-zen sowie Algebrafiir Einsteiger: Von der Gleichungsauflsung zur Ga-lois-Theorie zugrunde liegt: Jedes Kapitel beginnt mit einer plakativen, manchmal mehr oder weniger rhetorisch gemeinten Problemstellung, auch wenn der Inhalt des Kapitels meist weit ber die Lsung des formu-lierten Problems hinausreicht.

    In diesem Buch nur am Rande behandelt wird die beschreibende Statistik. Bei diesem Zweig handelt es sich eigentlich um den klassischen Teil der Statistik, die ihren Namen sowohl dem lateinischen Wort status (Zu-stand) als auch dem Wortstanun Staat verdankt (statista lautet das italie-nische Wort fr Staatsmann) und ab dem siebzehnten Jahrhundert zu-nchst als reine Staatenkunde verstanden wurde. Die beschreibende Statistik - auch deskriptive Statistik genannt - beschftigt sich mit der hreit angelegten Erfassung von Daten sowie deren Aufbereitung, Auswer-tung und Prsentation in Tabellen und Graphiken. Basis bildeten frher zum Teil die - in ihrer Tradition bis in die Antike zurckreichenden -Volkszhlungen. Heute handelt es sich meist um die Kumulationen von Einzelstatistiken, wie sie von lokalen Behrden und Institutionen wie Meldemtern, Finanzbehrden, Krankenkassen, Handwerks- und Han-delskammern zusammengetragen werden. Inhalt solcher Statistiken sind in der Regel Aussagen darber, wie hufig die mglichen Werte be-stinunter Merkmale bei den untersuchten Objekten vorkommen. Der zur beschreibenden Statistik komplementre Teil der Statistik wird brigens meist schlieende Statistik2 genannt. Diese Benennung ist in-sofern missdeutbar, als dass natrlich auch die beschreibende Statistik zur Fundierung von Schlussfolgerungen verwendet wird. Daher drfte die Bezeichnung Mathematische Statistik als Oberbegriff fr solche Sach-verhalte, wie sie im Folgenden erlutert werden, treffender sein. Selbstverstndlich mchte ich es nicht versumen, mich bei all denjeni-gen zu bedanken, die zum Entstehen dieses Buches beigetragen haben: uerst hilfreiche Hinweise auf Fehler und Unzulnglichkeiten in Vor-

    2 In Anlehnung an das englische Wort fiir Schlussfolgerung, nmlich inference, spricht man zum Teil auch von Inferenzstatistik.

  • Vorwort IX

    versionen dieses Buches habe ich von Wilfried Hausmann und Christoph Leuenberger erhalten. Dem ViewegtTeubner Verlag und seiner Pro-gramrn1eiterin U1rike Schmickler-Hirzebruch habe ich dafr zu danken, das vorliegende Buch ins Verlagsprogramm aufgenommen zu haben. Und schlielich schulde ich einen ganz besonderen Dank meiner Frau Claudia, ohne deren manchmal strapaziertes Verstndnis dieses Buch nicht htte entstehen knnen.

    JRG BEWERSDORFF3

    3 Unter [email protected] sind Hinweise auf Fehler und Unzo1nglichkeiten willkommen. Auch Fragen werden, soweit es mir mglich ist, gerne beantwortet. Er-gnzungen und Korrekturen werden auf meiner Homepage

    http://www.bewersdorff-on1ine.de verffentlicht.

  • Inhaltsverzeichnis

    Vorwort ..................................................................................................................... V

    1 Einfhrung ............................................................................................................ 1 1.1 Der erste Hypothesentest. .............................................................................. 1 1.2 Die Formulierung statistischer Aussageo ...................................................... 3 1.3 Die Prfung statistischer Aussagen ............................................................... 8

    2 Die Mathematik des Zufall 20 2.1 Ein Ma fiIr Sicherheit ................................................................................ 20 2.2 Die Gesetze des Zufalls ............................................................................... 31 2.3 Ursache und Wirkung bei Ereignissen ........................................................ 39 2.4 Zufallsgroen: zufllig bestimmte Werte ................................................... .48 2.5 Ursache, Wirkung und Abhngigkeiten bei Zufallsgroen ......................... 71 2.6 Zufallsgroen im groben berblick ............................................................ 87 2.7 Das Gesetz der groen Zahlen .................................................................... 90 2.8 Das starke Gesetz der groen Zahlen ........................................................ 103

    2.9 Der Zentrale Grenzwertsatz ...................................................................... 114 2.10 Monte-Carlo-Verfahren: Wenn Formeln zu kompliziert

    sind ............................................................................................................ 140 2.11 Resmee der Wahrscheinlichkeitsrechnung .............................................. 163

    3 Statistische Methoden ...................................................................................... 166 3.1 Die Problemstellungen der Mathematischen Statistik .............................. 166 3.2 Hypothesentest: ein Beispiel aus der Qualittssicherung ......................... .177

  • xn Inhaltsverzeichnis

    3.3 Hypothesentests - die Grundlagen ............................................................ 183

    3.4 Normalverteilung bei kleinen Stichproben? .............................................. 20 1

    3.5 Testplanung ohne festgelegtes Sigoifikanzniveau: der p-Wert ........................................................................................................... 214

    3.6 Koofidenzintervalle: zufallsbestimmte Intervalle ..................................... 218

    3.7 Schtztheorie: Eine Einfiihrung ................................................................ 225

    3.8 Vierfeldertest: Unabhugigkeitstest fiir verbundene Stichproben ............................................................................................... 242

    3.9 Universelle Tests ohne Parameter ............................................................. 253

    3.10 Resmee und Ausblick .............................................................................. 267

    Sachwortverzeidlnis .............................................................................................. 272

  • 1 Einfiihrung

    1.1 Der erste Hypothesentest

    Es liegt eine Geburtenstatistik von 82 Jahrgngen vor, bei der in jedem Einzeljahr der Anteil der mnnlichen Babys den der weiblichen ber-steigt. Kann aufgrund dieser Statistik das bergewicht von mnnlichen Neugeborenen als generell gltige Tatsache angesehen werden? 171 0, knapp 200 Jahre vor dem eigentlichen Beginn einer systematischen Erforschung statistischer Testrnglichkeiten prsentierte der schottische Arzt und Satiriker John Arbuthnot (1667-1735) - unter anderem war er Hofarzt der letzten Stuart-Knigin Anne und Erfinder der dem Deutschen Michel entsprechenden Figur des ,,John Bull" - eine Auswertung der an-gefilhrten Geburtenstatistik, welche die 82 Jahre von 1629 bis 1710 um-fasste. Allerdings war Arbuthnots Ansinnen eigentlich nicht naturwissen-schaftlich orientiert. Vielmehr sollten seine Ausfhrungen nachweisen, dass nicht der Zufall, sondern die gttliche Vorsehung am Werke ist. So lautete der Titel seiner in den Philosophical Transactions of the Royal Society of London, 27 (1710) verffentlichten Untersuchung: An argu-ment for Dtvine Providence, taken from the constant regularity observed in the births of both sexes. Was aber auch Arbuthnots genauer Beweg-grund gewesen sein mag - in Bezug auf seine Argumentation ist Ar-buthnots Vorgehen auf jeden Fall uerst bemerkenswert. Obwohl wir die Grundlagen einer solchen Argumentation erst in den nchsten Kapi-teln detailliert errtern werden, knnen wir doch schon jetzt Arbuthnots Gedankengang im Wesentlichen nachvollziehen, wenn auch zum Teil noch ohne exakte Begrndung. Ausgegangen wird von der Annahme, dass das Geschlecht eines Neuge-borenen zuflillig mit gleichen Chancen bestimmt wird - wie beim Wurf einer symmetrischen Mnze. Folglich sind auch die Chancen identisch,

    J. Bewersdorff, STATISTIK wie und warum sie funktioniert,DOI 10.1007/978-3-8348-8264-6_1, Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011

  • 2 1 Einfiibrung

    dass ein Geschlecht in einem Jahr berwiegt. Schlielich besitzen auch die Mglichkeiten, wie sich solche bergewichte ber mehrere Jahre mit-einander kombinieren knnen, untereinander die gleichen Chancen. In Bezug auf die ersten beiden Jahre besitzen also die 4 mglichen Kombi-nationen die gleichen Chancen:

    ,,MM": mnnliches bergewicht im 1. Jahr und 2. Jahr; ,,Mw": mnnliches bergewicht im 1. Jahr, weibliches bergewicht im

    2. Jahr;

    "wM": weibliches bergewicht im 1. Jahr, mnnliches bergewicht im 2. Jahr;

    "ww": weibliches bergewicht im 1. Jahr und 2. Jahr; Entsprechend ergeben sich fr die 8 mglichen Kombinationen, die in den ersten drei Jahren mglich sind, ebenfalls gleiche Chancen:

    MMM, MMw, MwM, Mww, wMM, wMw, wwM, www

    Mit jedem weiteren Jahr verdoppelt sich die Zahl der mglichen, unter-einander chancengleichen Kombinationen jeweils nochmals. Fr den ge-samten zugrunde gelegten Zeitraum von 82 Jahren ergibt sich auf diese Weise die astronomische Gesamtzahl von

    222 ... 2 (82 Faktoren) = 282 = 4835703278458516698824704 untereinander chancengleichen Kombinationen. Dass sich dabei einzig aufgrund des puren Zufalls ausgerechnet die Kombination

    MMMM M (82 mal) fr Arbuthnots Geburtenstatistik ergibt, ist wohl kaum zu erwarten. Min-destens eine der beiden der Berechnung zugrunde liegenden Annahmen, nmlich Zuflligkeit und Chancengleichheit, muss also hochgradig in Zweifel gezogen werden. Andernfalls wre nmlich das apriori vllig unwahrscheinliche Ergebnis nicht zu erklren. Arbuthnots Folgerung war es nun, die Zufalligkeit als widerlegt anzuse-hen, so dass er glaubte, einen gttlichen Plan zu erkennen. Schon von zeitgenssischen Mathematikern wie Willem Jacob 's Gravesande (1688-1742) und Nikolaus Bernoulli (1687-1759) wurde aber zu Recht

  • 1.2 Die Formulierung statistischer Aussagen 3

    erkannt, dass die betreffende Geburtenstatistik vielmehr als Nachweis da-fr zu werten ist, dass bei einem Neugeborenen die Chance, dass es sich um einen Jungen handelt, die Chance auf ein Mdchen bersteigt. Nach diesem kleinen Rckblick auf 300 Jahre zurckliegende Denkwei-sen ist es mehr als lehrreich, Arbuthnots Beispiel aus dem Blickwinkel unseres heutigen Erkenntnisstandes zu errtern. Konkret: Wie wrde ein Statistiker heute vorgehen und argumentieren? Dies wollen wir in den beiden nchsten Kapiteln im Detail tun.

    Bild 1 John Arbuthnot und Faksimile eines Teils der von ihm ver-wendeten Geburtenstatistik.

    1.2 Die Formulierung statistischer Aussagen

    Um Arbuthnots Argumente in einer Weise darlegen zu knnen, die dem heutigen Anspruch in Bezug auf wissenschaftliche Exaktheit gengt, be-darf es klar definierter Begriffsbildungen zur Formulierung statistischer Aussagen.

    Ausgangspunkt aller Aussagen, die wir hier untersuchen wollen, ist stets eine fest vorgegebene, eindeutig definierte Grundgesamtheit. Dabei

  • 4 I Einfiibrung

    kann es sich zum Beispiel um die Bevlkerung Deutschlands handeln. Als Gesamtheit ebenso denkbar sind die Studenten, die derzeit an einer Hochschule in Nordrhein-Westfalen innnatrikuliert sind, oder die in Mnchen zugelassenen Autos. Welche Grundgesamtheit man konkret whlt, wird sich primr am Gegenstand des Interesses orientieren. Zu be-rcksichtigen ist aber auch, dass die realistisch fr Untersuchungen zu Verfiigung stehenden Stichproben reprsentativ fr die Grundgesamtheit sein mssen: So knnte man im Fall von Arbuthnots Untersuchung als Grundgesamtheit alle Neugeborenen nehmen, eventuell eingeschrnkt auf gewisse Geburtsjahrgnge und -orte, um so gegebenenfalls dadurch be-dingte Einflsse zu verhindern. Wir wollen nur solche Grundgesamtheiten zum Gegenstand einer Unter-suchung machen, deren Mitglieder - oft werden sie schlicht Untersu-chungseinheiten genannt - die Gemeinsamkeit besitzen, dass sie alle-samt gewisse Merkmale aufweisen: Handelt es sich zum Beispiel bei der Grundgesamtheit um die deutsche Bevlkerung, so kann es sich bei sol-chen Merkmalen sowohl um quantitative Angaben wie Alter oder Ein-kommen als auch qualitative Eigenschaften wie Geschlecht oder Beruf handeln. Oft ist es von Interesse, wie hufig jeder mgliche Wert eines Merkmals - bezeichnet meist als Merkmalsausprgung oder schlicht als Merk-malswert - innerhalb der Grundgesamtheit auftritt. So ist beispielsweise fr die Bevlkerung die Altersverteilung, die graphisch in der Regel als sogenanote Alterspyramide dargestellt wird (siehe Bild 2), ein wesentli-cher Faktor fr Prognosen ber die weitere Entwicklung der Sozialversi-cherungen. Aber auch fr andere Planungen, ob beim Bau von Kindergr-ten und Krankenhusern oder bei Marktanalysen fr bestimmte Produktgruppen - eben sprichwrtlich von der Wiege bis zur Bahre -, spielt die Altersverteilung eine wichtige Rolle. Die Gesamtheit aller Hufigkeiten, mit der die mglichen Werte eines Merkmals innerhalb der Grundgesamtheit auftreten, wird Hufigkeits-verteilung genannt. Strukturell wichtiger als die ahsoluten Hufigkei-ten, das heit die konkreten Anzahlen, mit denen Merkmalswerte inner-halb der Grundgesamtheit vorkommen, sind die relativen Hufigkeiten: So besagt die Aussage, dass ein Kandidat bei einer direkten Brgermeis-terwahl circa zwanzigtausend Stimmen erhalten hat, nicht allzu viel. Be-

  • 1.2 Die Formulierung statistischer Aussagen 5

    zogen auf das in der Grundgesamtheit der Whler "untersuchte" Merkmal gewhlter Kandidat sind nmlich relative Hufigkeiten wahlentscheidend und nur indirekt die absoluten Hufigkeiten: So hat ein Kandidat die ab-solute Mehrheit der Stinunen auf sich vereinigt, wenn der ihm entspre-chende Merkmalswert des Merkmals gewhlter Kandidat eine relative Hufigkeit von ber 50% besitzt.

    Bild 2

    600 300 Tausend

    Altersaufbau 2001 Deutschland

    Insgesamt (MilI.): 82.4 300 600 Tausend

    Alterspyramide als Beispiel einer graphisch dargestellten Hu-figkeitsverteilung des kombinierten Merkmals ,,Alter und Ge-schlecht" (Quelle: Statistisches Bundesamt)

    Wie im gerade angefhrten Beispiel kann eine relative Hufigkeit durch einen Prozentwert angegeben werden. Mathematisch ist es allerdings

  • 6 1 Einfiibrung

    praktischer, die Gesamtheit auf den Wert 1 zu normieren: 50% Prozent entsprechen dann Y:z, und anstelle eines Wertes von beispielsweise 51,2% tritt der Anteil in Hhe von 0,512. Oft interessieren die relativen Hufigkeiten, mit denen bestimmte Merk-male auftreten, nur indirekt, nmlich nur in Form daraus abgeleiteter Gren. Am wichtigsten dabei ist sicherlich der auch Durchschnitt ge-nannte Mittelwert, mit welchem ein quantitatives Merkmal innerhalb der Grundgesamtheit auftritt. So muss sich eine Versicherung bei der Kallru-lation ihrer Beitrge an den durchschnittlichen Aufwendungen pro Versi-chertem orientieren: Um diesen Durchschnitt zu berechnen, werden die Aufwendungen, die fiir die einzelnen Versicherten gettigt wurden, alle-samt addiert und anschlieend durch die Zahl der Versicherten geteilt.

    Soll der Durchschnitt aus den Daten einer Hufigkeitsverteilung berech-net werden, so geschieht dies in Form einer gewichteten Summe, wobei jeder Summand einem Produkt entspricht: Multipliziert wird jeweils ein Wert, den das Merkmal annehmen kann, mit der dazugehrigen relativen Hufigkeit. Ausgedrckt als Formel ergibt sich der Durchschnittswert ei-nes Merkmals x, welches die mglichen Werte a, b, ... mit den relativen Hufigkeiten ra , rh, ... anninnnt, durch

    Noch einfacher als diese Formel ist der ihr zugrunde liegende Sachver-halt, wie ein Beispiel sofort zeigt: Erhalten 90% der Autofahrer in einem Jahr keinen Bugeldbescheid, 7% einen Bugeldbescheid, 2% zwei Bu-geldbescheide und 1 % sogar drei Bugeldbescheide, dann betrgt der Durchschnitt der jhrlichen Bugeldbescheide pro Autofahrer

    -

    x = 0,90+0,071 + 0,022+ 0,013 = 0,14.

    So naheliegend und berechtigt die Verwendung des Durchschnitts fiir das schon erwhnte Beispiel der Aufwendungen einer Versicherung ist, so muss genauso vor der unsachgemen Interpretation des Durchschnitts gewarnt werden. "Typische" Verhltnisse, beispielsweise das Einkom-men des "Durchschnittsbrgers", werden oft realistischer durch den so-genannten Median widergespiegelt: Der Median wird nmlich so ge-whlt, dass er die Grundgesamtheit in Bezug auf die Gre des be-

  • 1.2 Die Formulierung statistischer Aussagen 7

    treffenden Merkmalswertes in zwei gleich groe Teile zerlegt. Fr das Beispiel des Einkommensmedians, der sich fiir die deutsche Bevlkerung ergibt, haben also 50% der Bevlkerung ein Einkommen, das mindestens so gro ist wie der Median, whrend die andere Hlfte ein Einkommen besitzt, das hchstens so hoch wie der Median ist. Es liegt auf der Hand, dass eine jhrliche Erfassung des Einkommensmedians die Vernderung der "typischen" Einkommensverhltnisse innerhalb der Bevlkerung eher widerspiegelt, als das beim Durchschnittseinkommen der Fall ist. Ein Grund dafiir ist, dass Vernderungen, die sich nur isoliert im Bereich der Spitzenverdiener abspielen, den Durchschnitt verndern, jedoch ohne Wirkung auf den Median bleiben.

    Natrlich lassen sich die Hufigkeiten, mit der bestimmte Merkmalswerte innerhalb der Grundgesamtheit auftreten, stets im Rahmen einer Voller-hebung ermitteln. Allerdings ist bei groen Grundgesamtheiten der dafiir notwendige Aufwand, etwa im Rahmen einer Volkszhlung, meist unver-tretbar hoch. Darber hinaus gibt es sogar Flle, in denen sinnvoll ber-haupt keine Vollerhebung mglich ist, etwa wenn bei einem Fabrikati-onsprozess die qualittssichemde Endprfung nur dadurch mglich ist, dass die geprften Untersuchungseinheiten zerstrt werden. Aus den genannten Grnden ist es vorteilhaft, wenn nur ein relativ klei-ner Teil der Mitglieder der Grundgesamtheit untersucht werden braucht. In Anlehnung an eine dem Httenwesen entstammende Terminologie nennt man eine solche zufallig getroffene Auswahl Stichprobe. Auch wenn nur eine Stichprobe untersucht wird, bleibt natrlich trotzdem das Ziel bestehen, daraus Aussagen ber die Grundgesamtheit abzuleiten: Wie und mit welcher Przision und Sicherheit dies mglich ist, davon handelt die schlieende Statistik. Dabei ist jeweils der Umfang der Stich-probe mit zu bercksichtigen. Denn schon intuitiv ist klar, dass mit gr-eren Stichproben genauere und sicherere Aussagen ber die Grundge-samtheit erzielt werden knnen als mit kleineren Stichproben.

    Fassen wir zusammen:

    Die Statistik beschftigt sich mit Aussagen ber relative Hufigkeitsver-teilungen von Merkmalen innerhalb fest vorgegebener Grundgesamthei-ten. Darunter fallen sowohl direkte Aussagen ber relative Hufigkeiten, aber auch Aussagen ber daraus resultierende Gren, wobei es sich bei-spielsweise um einen Mittelwert oder einen Median handeln kann. Ein

  • 8 I Einfhrung

    wesentlicher Teil der Statistik besteht aus einem Apparat von Methoden, mit denen solche Aussagen mittels der Untersuchung von Stichproben getroffen beziehungsweise geprft werden knnen.

    Auf Basis der eingefhrten Tenninologie knnen wir nun die aus Ar-buthnots Daten gezogene Schlussfolgerung erneut formulieren:

    ,,Bei Neugeborenen besitzt der Merkmalswert mnnlich eine relative Hufigkeit, die 0,5 beziehungsweise 50% bersteigt und somit grer ist als die relative Hufigkeit des Merkmalswertes weiblich."

    Wie diese statistische Aussage mittels der Untersuchung einer Stichprobe geprft werden kann, haben wir im Wesentlichen bereits kennengelemt. Wir wollen diese Schlussweise im nchsten Kapitel nochmals im Detail errtern, und zwar nun - entsprechend dem gerade erweiterten Horizont -in einem allgemeineren Kontext.

    1.3 Die Prfung statistischer Aussagen

    In welcher Hinsicht kann Arbuthnots Argumentation verallgemeinert werden, und was ist dabei zu beachten? Der entscheidende Punkt von Arbuthnots Argumentation besteht zweifel-los darin, eine sich auf eine groe Grundgesamtheit beziehende Vermu-tung dadurch zu prfen, dass eine vergleichsweise kleine Stichprobe un-tersucht wird. Dabei wird - und das ist der die mathematische Bearbeitung erleichternde "Kniff" - das Gegenteil dessen, was letztlich nachgewiesen werden soll, als (Arbeits-)Hypothese unterstellt. Die eigentliche mathematische Bearbeitung geschieht auf der Basis ma-thematischer Gesetzmigkeiten von zufaIligen Prozessen. Solche Geset-ze werden wir im zweiten Teil des Buches ausfiihrIich erlutern. Dabei kommt der Zufall bei Stichprobenuntersuchungen stets dadurch ins Spiel, dass die Stichprobe mittels Zufallsauswahl aus der Grundgesamtheit ent-nommen wird. brigens kann der Zufall durchaus ber den eigentlichen Auswahlprozess hinaus noch eine weitere Rolle spielen, etwa wenn ein Stichprobentest so angelegt ist, dass die Reihenfolge der ausgewhlten Untersuchungseinheiten oder - wie bei Arbuthnots Vorgehen - die Grup-

  • 1.3 Die Prfung statistischer Aussagen 9

    pierung zu Unterstichproben fr die mathematische Bearbeitung von Be-deutung ist.

    Bei Arbuthnot geschah die Zufallsauswahl der Stichprobe mehr oder min-der implizit, nmlich in Abhngigkeit von Ort und Jahrgang der Geburt. Da bei diesen beiden Faktoren ein Einfluss auf das Geschlecht wenig plausibel erscheint, kann ein solches Vorgehen durchaus als "gengend" zufllig angesehen werden. In jedem Fall unkritischer und daher in sys-tematischer Weise vorzuziehen wre aber die Vorgehensweise, die Aus-wahl der Stichprobe und deren Unterteilung in 82 Unterstichproben vllig zufllig vorzunehmen.

    Arbuthnots Vorgehen hat im Vergleich zu anderen statistischen Tests, die wir an spterer Stelle kennenlemen werden und die zum Teil im Hinblick auf den notwendigen Stichprobenumfang wesentlich effIzienter sind, den Vorteil, dass die mathematische Argumentation sehr elementar ist. Aus-gehend von der Hypothese einer Symmetrie zwischen den beiden Chan-cen, dass ein Neugeborenes mnnlich beziehungsweise weiblich ist, ber-trgt sich diese Symmetrie zunchst auf die bergewichte bei den 82 Unterstichproben und schlielich auf die astronomisch groe Anzahl von 282 Kombinationen der 82 Unterstichproben-bergewichte. Das heit, je-de Sequenz von 82 jahrgangsbezogenen, mit "M" oder "w" bezeichneten Geschlechts-bergewichten wie

    MMMMMMMMMM ... M MwMwMwMwMw w MMwMwwwMMw M wwwwwwwwww .. w

    ist gieichwahrscheinlich. Dabei wurde die Beobachtung der Sequenz MMMMMMMMMM. . . M als Indiz dafr angesehen, die ursprnglich gemach-te Hypothese als widerlegt ansehen zu mssen.

    Warum soll aber gerade diese Sequenz MMMMMMMMMM. . . M als Indiz fr eine Verwerfung der Hypothese genommen werden? Die sofort einleuch-tende Begrodung ist: Zwar ist die zweite der gerade aufgelisteten Se-quenzen, nmlich MwMwMwMwMw w, in ihrer regehnigen Abfolge genauso unwahrscheinlich wie die erste Sequenz. Allerdings kann das Eintreten der ersten Sequenz MMMMMMMMMM. . . M, nicht aber das Eintre-

  • 10 1 Einfiibrung

    ten der zweiten Sequenz MwMwMwMwMw. w, plausibel erklrt werden, nmlich dadurch, dass ein Ungleichgewicht zugunsten berwiegender Knabengeburten vorliegt. So gesehen sind Sequenzen, bei denen die Knaben innerhalb der 82 Unterstichproben im Verhltnis 82:0, aber auch noch in Verhltnissen wie 81: 1 oder 80:2, stark berwiegen, absolut un-wahrscheinlich4, es sei denn, die gemachte Hypothese wrde aufgegeben. "Ausreier"-Ergebnisse mit mnnlichen bergewichten in mindestens 80 der 82 Unterstichproben sind also als gewichtiges Indiz dafr zu werten, die Hypothese zu verwerfen, wobei bei dieser Verfahrensweise ein Fehl-schluss mit einer an Sicherheit grenzenden Wahrscheinlichkeit ausge-schlossen werden kann.

    Welche Untersuchungsergebnisse bei einem Hypothesentest als Widerle-gung der Hypothese zu werten sind und welche nicht, ist im allgemeinen Fall Bestandteil der sogenannten Entscheidungsregel, die im Rahmen der Testplanung auf Basis der mathematischen Gesetzmigkeiten zuflil-liger Prozesse formuliert und begrndet wird. Dabei sollten im Rahmen der Entscheidungsregel solche Ergehnisse der Stichprobenuntersuchung zu einer Hypothesen-Widerlegung fhren,

    die bei unterstellter Richtigkeit der Hypothese einen ,,Ausreier"-Cha-rakter besitzen, das heit apriori sehr unwahrscheinlich sind, und

    die ihren Ausreier-Charakter aber verlieren, wenn die Gltigkeit der Hypothese aufgeben wird.

    Meist orientiert sich die Entscheidungsregel daran, ob ein aus der Stich-probenuntersuchung berechneter Wert innerhalb des sogenannten Ableh-nungsbereichs, oft auch als Verwerfungsbereich oder kritischer Be-reich bezeichnet, liegt oder nicht. Dabei wird die Berechnungsvorschrift des Wertes als Stichprobenfunktion, TestgrBe oder auch als Prfgr-Be bezeichnet. Im Fall von Arbuthnots Test entspricht der Wert der Stichprobenfunktion schlicht deIjenigen Anzahl von Unterstichproben, in denen mnnliche Babys berwiegen.

    4 Wie unwahrscheinlich solche Ausreier in dem Fall, dass die Hypothese stimmt, tat-schlich sind, werden wir mit mathematischen Methoden, die wir im zweiten Teil be-schreiben werdeo, konkret berechnen knnen.

  • 1.3 Die Prfung statistischer Aussagen 11

    Konkret werden sich der Ablehnungsbereich und damit die Entschei-dungsregel eines Hypothesentests inuner am gesamten Umfeld der Stich-probenuntersuchung orientieren, das heit insbesondere an

    der Hypothese,

    der Stichprobengre,

    den innerhalb der Stichprobe ermittelten Daten und

    der daraus berechneten Stichprobenfunktion. In systematischer Hinsicht ist es dabei ungemein wichtig, dass diese Pla-nung vor der Durchfiihrung der Stichprobenuntersuchung oder zumindest vor der Sichtung des Datenmaterials stattfindet. Auf den ersten Blick er-scheint eine solche Festlegung vielleicht etwas bertrieben, und gerade Arbuthnot ist ein Beispiel dafr, dass er seinen Test erst nach dem Vor-liegen der Stichprobendaten durchfllhrte. Der Grund dafr, diese Reihen-folge aber trotzdem unbedingt einzuhalten, ist der folgende:

    Anderufalls knnte man nmlich einfach nur mit Flei urufangreiches Datenmaterial ber gengend viele Eigenschaften von Versuchspersonen ermitteln und wrde darin hchstwahrscheinlich irgendeine, zufllig in dieser Stichprobe auftretende Auffii1ligkeit entdecken. Beispielsweise knnte es sein, dass eine untersuchte Gruppe erwachsener Mnner zuftil-lig so zusammengesetzt ist, dass darin die Personen mit grerer Schuh-gre eine im Durchschnitt deutlich hhere Intelligenz aufweisen. Wahr-scheinlich htte man in einer anderen Stichprobe eine andere Anomalie wie etwa zwischen Haarfarbe und Einkommen gefunden. Dafiir htte man aber dort kaum unter den Personen mit groer Schuhgre eine deut-lich hhere Intelligenz festgestellt. Trotzdem wrde natrlich eine pas-send zur ursprnglichen Versuchsgruppe aufgestellte Hypothese, gem der es keinen Zusammenhang zwischen Intelligenz und Schuhgre gibt, durch die Daten dieser ersten Gruppe scheinbar widerlegt. Verkrzt fiir die Titelseite der Boulevardpresse wre damit endlich der ,,Beweis" er-bracht: "Mnner denken mit den Fen".

    Wenn nicht aus dem fiir den Test verwendeten Datenmaterial, woher soll eine Hypothese aber sonst kommen? Die Antwort auf den scheinbaren Einwand ist so einfach wie einleuchtend zugleich: zum Beispiel aus ande-rem Datenmaterial! Oder, weil wie im Fall von Arbuthnot das Gegenteil

  • 12 1 Einfiibrung

    zuvor als naheliegende Erfahrungstatsache gegolten hat. Oder, weil im Fall der Wirksamkeitsprfung eines neuen Medikaments eine Hoffnung darauf besteht, die dazu hypothetisch angenommene Unwirksamkeit zu widerlegen. Oder, weil man einfach wissen will, ob die Regierungspartei-en noch immer so populr sind wie bei den letzten Wahlen. Da Hypothe-sen, und zwar ber die gerade angefiihrten Flle hinaus, oft einen fehlen-den Unterschied zum Gegenstand haben, hat sich ganz allgemein als Sprachgebrauch der Begriff der sogenannten Null-Hypothese eingebr-gert.

    Fassen wir zusammen: Das Prozedere eines Tests, nmlich betreffend

    Stichprobengre,

    Art der zu erhebenden Daten und

    deren Bearbeitung bis hin zur anzuwendenden Entscheidungsregel, sollte stets vollstndig im Rahmen einer Testplanung festgelegt werden, bevor Teile des Tests durchgefiihrt werden. Eine schematische Darstel-lung der vorzunehmen Einzelschritte ist in Bild 3 dargestellt. Dem eigentlichen Test voran geht eine Vermutung, auf deren Basis durch Negierung eine (Null-)Hypothese aufgestellt wird. Wird diese Hypothese dann im Rahmen des Tests widerlegt, so erfahrt die ursprngliche Ver-mutung, die oft als Alternativhypothese bezeichnet wird, eine Bestti-gung. Aufgrund der Zuflilligkeit der Stichprobenauswahl beinhaltet ein solcher Test stets das Risiko, die Hypothese zu verwerfen, obwohl sie in Wahr-heit stimmt - theoretisch feststellbar im Rahmen einer Vollerhebung. Man bezeichnet diese Art des Irrtums als Fehler 1. Art. Dabei wird der Test unter Verwendung mathematischer Methoden so konzipiert, dass ein Fehler 1. Art relativ unwahrscheinlich ist, wozu beispielsweise die dies-bezgliche Wahrscheinlichkeit auf 0,01 begrenzt wird. Diese Obergrenze, bei der man von einem Signifikanzniveau von I % oder auch von einer Sicherheitswahrscheinlichkeit von 99% spricht, bedeutet konkret: hn Fall, dass die Hypothese in Wahrheit richtig ist, wrde sie trotzdem bei 1000 Testdurchgngen etwa zehmnal flschlicherweise als widerlegt er-scheinen, weil das Testergebnis wesentlich, eben signifikant, vom eigent-lich zu Erwartenden abweicht.

  • 1.3 Die Prfung statistischer Aussagen

    (unbekanntei) Wirklichkeit: Hypothese ist in Bezug auf die Grundgesamtheil ...

    ... richtig: FohlM 1. Art

    Fehler 2. Art

    Hypothes. wird verworfen: keine (I)

    Abschtzung der Wahrscheinlich-keiten fr Fehler

    Vermtutung gilt als besttigt Aussage

    ~

    Bild 3

    Entscheldungsregel l'

    mathematische Bearbeiwng mathematische A ./ l' Wahrscheinlich- / V AIJswertoog der Daten keitsrechnung l'

    Stichprobenuntersuchung

    l' zufl111ge StIchprobenauswahl

    Hypothne

    T

    E

    S~ T

    Testplanung

    r Negierung Vermutung _____ ..J

    Schematischer Ablauf eines typischen Hypothesentests (von unten nach oben): Ausgehend von einer Vermutung (oft als AI-temativhypothese bezeichnet) wird durch Negierung eine Hy-pothese, die sogenannte Null-Hypothese, aufgestellt. Es folgt die Planung eines Tests und dessen anschlieende Durchftlh-rung. Arbuthnots Test ist als Beispiel in Bild 5 (Seite 18) dar-gestellt.

    13

    Streng zu unterscheiden vom Fehler 1. Art ist der sogenannte Fehler 2. Art. Dieser bezieht sich auf die Situation, dass eine objektiv falsche Hypothese - feststellbar theoretisch wieder im Rahmen einer Vollerhe-bung - nicht durch das Ergebnis des Tests widerlegt wird. Allerdings handelt es sich streng genommen in diesem Fall berhaupt nicht um einen ,,Fehler" im Sinne einer flschlicherweise gemachten Aussage. Denn ein

  • 14 1 Einfiibrung

    solcher Fehler lge nur dann vor, wenn das Testergebnis als Besttigung der Hypothese interpretiert wrde. Eine solche Schlussweise ist aber in der Systematik eines Hypothesentests eigentlich gar nicht vorgesehen!

    Bei dem hufig praktizierten Ansatz, bei der die Null-Hypothese einen nicht vorhandenen Unterschied behauptet, besteht ein Fehler 1. Art darin, dass man auf grund des Testergebnisses einen Unterschied "sieht", der in Wahrheit gar nicht vorhanden ist. Dagegen entspricht ein Fehler 2. Art der Situation, bei der ein vorhandener Unterschied bersehen wird. An-ders als bei einem Fehler 1. Art, dessen Wahrscheinlichkeit bei einer ent-sprechenden Testplanung auf einen kleinen Wert wie beispielsweise 1% oder 5% reduziert werden kann, hngt die Wahrscheinlichkeit fr einen Fehler 2. Art immer auch von der Gre des vorhandenen, aber ein seiner Gre unbekannten, Unterschiedes ab. Dabei ist bereits intuitiv klar, dass bei geringen Unterschieden die Wahrscheinlichkeit fr einen Fehler 2. Art kaum begrenzt werden kann. Auf den ersten Blick erscheint die Vorgehensweise, Hypothesen nur da-fr aufzustellen, um sie anschlieend zu verwerfen, vielleicht etwas ge-whnungsbedrftig. Auerdem tragen die diversen Begriffe wie Null-Hypothese, Alternativhypothese, Signifikanzniveau und Fehler 1. und 2. Art nicht unbedingt dazu bei, das Verstndnis dafr zu erleichtern, wa-rum ein solcher Ansatz gewhlt wird. Und obwohl es durchaus statisti-sche Verfahren gibt, die ohne Hypothesen auskommen und die wir neben diversen Hypothesentests im dritten Teil dieses Buches erlutern werden, macht es durchaus Sinn, statistische Denkweisen einfhrend anhand eines Hypothesentests zu erlutern. Dabei zeigt gerade Arbuthnots frhes Bei-spiel eines Hypothesentests, dass solche Argumentationsketten in einer gewissen Weise nahe liegen. Dafr drften zwei Grnde ausschlaggebend sein:

    Zum einen ist in einfachen Situationen wie bei Arbuthnot der Bedarf an mathematischen Hilfstuitteln relativ bescheiden, insbesondere dann, wenn man - wie bisher geschehen - nicht ins Detail geht.

    Zum anderen ist die Denkweise eines Hypothesentests im Ansatz durchaus tuit anderen Methoden der angewandten Naturwissenschaf-ten vergleichbar. Man denke nur an mathematische Modelle, ob fr Elementarteilchen, astronotuische oder auch makrokonotuische Ab-lufe. Ihnen allen zugrunde liegen mathematische Beschreibungen von

  • 1.3 Die Prfung statistischer Aussagen 15

    experimentell gemessenen Abhngigkeiten zwischen diversen, beob-achtbaren Gren. Dabei werden die Modelle so lange als gltig oder zumindest als praktisch verwendbar angesehen, wie sie nicht im Wi-derspruch zu Ergebnissen konkreter Beobachtungen stehen (siehe auch Bild 4)5. Statistische Modelle beinhalten Annahmen ber die Zusammenset-zung der Grundgesamtheit und beschreiben diese mittels mathema-tischer Objekte. Diese Annahmen mssen, genau wie ein physika-lisches Modell, als widerlegt angesehen werden, wenn experimentelle Beobachtungen mit dem Modell nicht in Einklang zu bringen sind. Da solche Beobachtungen in zufllig ausgewhlten Stichproben ermittelt werden, unterliegt die Verwerfung eines statistischen Modells immer einer gewissen Unsicherheit.

    Wirklichkeit mathematisches Modell

    reale Objekte und Ihre Beziehungen zueinander

    ModoUbildung mathematische Objekte --gg""'f.-hypot--heti-'SC""-h ~) (Zahlen, Mangan, ... ) und

    ihre Beziehungen zueinander

    Bild 4

    Beobachtung ( Prognose stimmig?

    mathemallache I Schlussfolgerungen ~

    mathematischer Satz (Aussage aber

    mathematische Objekte)

    Mathematische Modellbildung: Vergleichbar einem Modell, wie es ein Modellbauer beispielsweise zur Vorab-Prfung einer geplanten Fahrzeugkonstruktion in einem Windkanal baut, werden mathematische Objekte zur ModelIierung realer Sach-verhalte verwendet - in der Physik beispielsweise zur Be-schreibung des Verhaltens von Elementarteilchen.

    5 Neben den Gemeinsamkeiten zwischen Modellen filr naturwissenschaftliche PhlIno-mene und Annahmen, wie sie Hypothesentest zugrunde liegen, sollten aber auch die Unterschiede nicht verkannt werden: Naturwissenschaftliche Modelle sind primr durch qualitative Eigenschaften - konkret zum Beispiel durch mathematische Formeln - bestinnnt und werden zorn Zwecke ihrer permaoenten Bewhrung und somit mit dem Horizont einer mglichst laogen ,,Lebensdsuer" kreiert. Dagegen sind Hypothe-sen innerhalb eines statistischen Tests meist allein durch quantitative Parameter de-terminiert. Auerdem werden sie oft zum Zwecke ihrer Widerlegung formuliert uod sind, wenn dies wie gewanscht gelingt, naturgem sehr ,,kurzlebig".

  • 16 1 Einfiibrung

    Um Hypothesentests in den unterschiedlichsten Szenarien einzusetzen, bedarf es aber zweifelsohne einer genauen Herausarbeitung ihrer mathe-matischen Grundlagen. Denn nur so lassen sich Testplanungen passend zur jeweiligen Ausgangssituation dahingehend optimieren, dass zu Recht formulierte Vermutungen mit guter Aussicht auf Erfolg ihre statistische Besttigung erfahren.

    Arbuthnots Test in systematischer Planung Soll fr Arbuthnots Untersuchung eine Testplanung aufgestellt wer-den, die in formaler Hinsicht den beschriebenen Anforderungen einer exakten statistischen Argumentation gengt, so bietet sich das fol-gende Vorgehen an.

    Zunchst wird die Hypothese aufgestellt, wozu es zwei Mglichkei-ten gibt:

    Der relative Anteil der mnnlichen Neugeborenen ist genauso gro wie der relative Anteil der weiblichen Neugeborenen.

    Der relative Anteil der mnnlichen Neugeborenen ist hchstens so gro wie der Anteil der weiblichen Neugeborenen.

    Fr beide Hypothesen vermuten wir, dass sie nicht stimmen und dass sie aufgruud der untersuchenden Stichprobe widerlegt werden kn-nen. Natrlich bringt die Widerlegung der zweiten Hypothese mehr Erkenntnis aufgruud einer detaillierteren Aussage. Wie bei Arbuthnot sehen wir im Rahmen des geplanten Tests eine in 82 Unterstichproben zerlegte Stichprobe vor. Als Stichprobenfunkti-on, das heit als Indikator fr die am Ende gegebenenfalls zu treffen-de Verwerfung, nehmen wir wieder die Anzahl der Unterstichproben mit mnnlichem bergewicht. Der Ablehnungsbereich wird nun aus solchen ,,Ausreier"-Ergebnis-sen zusammengestellt, die einerseits insgesamt sehr unwahrscheinlich sind, andererseits diese Unwahrscheinlichkeit aber dann ein Ende fin-det, wenn bestimmte, allerdings im Widerspruch zur Hypothese ste-hende, Umstnde zugruude gelegt werden. Konkret: Ein ,,Ausreier"-Ergebnis mit einem starken bergewicht von Knaben verliert seine Unwahrscheinlichkeit, wenn Geburten mnnlicher Babys tatschlich

  • 1.3 Die Prfung statistischer Aussagen 17

    im bergewicht auftreten sollten. So kann dann fUr die zweite der eben angefhrten Hypothesen ein sogenannter einseitiger Ableh-nungsbereich zusammengestellt werden, der ausgeprgte berge-wichte mnnlicher Babys im Verhltnis von beispielsweise 82:0, 81:1, ... umfasst.

    Bei der Beschreibung weiterer Details wollen wir uns aber auf die Planung eines Tests beschrnken, mit dem gegebenenfalls die erste der beiden angefhrten Hypothesen widerlegt werden kann. Wir fra-gen uns: Wie ausgeprgt muss ein ,,Ausreier"-bergewicht wie bei-spielsweise 82:0, 81:1 oder auch 0:82, 1:81 sein, damit es in den zweiseitigen Ablehnungsbereich aufgenommen werden kann, ohne dass dabei die Irrtumswabrscheinlichkeit im Falle einer daraus re-su1tierenden Hypothesen-Verwerfung zu gro wird? Anders ausge-drckt: Welcher Ablehnungsbereich kann und sollte genommen wer-den, wenn eine Obergrenze fUr die Wabrscheiu1ichkeit eines Fehlers 1. Art vorgegeben ist? Um diese Frage konkret zu beantworten, mssen wir prfen, wie vie-le der aus 82 der Buchstaben ,,M" oder "w" bestehenden Sequenzen ein ausgeprgtes bergewicht haben. So gibt es unter den insgesamt 282, alle untereinander gleichwabrscheiu1ichen Sequenzen der Lnge 82

    eine Sequenz, die 82-mal den Buchstaben ,,M" enthlt,

    82 Sequenzen, von denen jede 81-mal den Buchstaben "M" und eimnal den Buchstaben "w" enthlt (das einzige "w" kann nmlich anjeder der 82 Positionen stehen).

    3321 Sequenzen, bei denen das bergewicht des Buchstabens ,,M" im Verhltnis 80:2 vorliegt,

    88560 Sequenzen, bei denen das bergewicht des Buchstabens ,,M" im Verhltnis 79:3 vorliegt,

    Die F ormem zur Ermittlung solcher Zahlen werden wir noch spter kennenlernen. Im Moment wichtiger fUr uns ist, dass wir alle ber-gewichte bis hin zu denen im Verhltnis von 53:29 und 29:53 in den Ablehnungsbereich aufnehmen knnen, ohne dass die Gefahr eines Fehlers 1. Art die Wabrscheiu1ichkeit von 1% bersteigt. Das heit

  • 18 1 Einfiibrung

    konkret: Unter der Voraussetzung, dass die Hypothese stinnnt, fhrt der solchennaen abgegrenzte Ablehnungsbereich nur in durch-schnittlich einem von hundert Stichprobenuntersuchungen zu einer sachlich falschen Schlussfolgerung in Fonn einer rein zufallsbe-dingten Ablehnung der Hypothese.

    (unbekanntei) Wirklichkeit: Hypothese Ist In Bezug auf die Grundgesamtheit ...

    .. richtig'

    ... falsch:

    Fehler 1. Art t!ftt nur mit 1" auf

    Hypothese

    _2. Art

    wird verworfen: keine (I) Abschtzung der Wahrscheinlich-keilen fr Fehler Venntutung gilt als besttigt Aussage

    BildS

    mathematische Wahrscheinlich-keitsrechnung

    ~ Entac:heldungsregel: T A? CN6 Anzshl der Gruppen mit

    / f/ mtnnIichem Obelpewicht ist mincI9st9t1& 53 oder hlJchsl.8na 29 E

    l' prOfa, In wie vielen Gruppen die I'TIAnn-

    liehen Nougeboronen Obe!wiegen l'

    s~ T Testplanung

    wthle 82 x 100 Neugeborene zufallig aus Hypothese:

    Der Anteil der Geschlechter bei Neugeborenen Ist gleich

    l' Negierung Vennutung:

    Der Anteil der Geschlechter bei Neugeborenen Ist unterschiedlich

    Arbuthnots Test in der schematischen Darstellung von Bild 3 (siehe Seite 13).

    ber die Mglichkeit eines Fehlers 2. Art ist damit noch gar nichts ausgesagt: Die Wahrscheinlichkeit einer solchen Nicht-Ablehnung einer im Grunde falschen Hypothese hngt einerseits davon ab, weI-che Werte die relativen Hufigkeiten in Wahrheit besitzen. Dabei ist schon intuitiv klar, dass das Risiko eines Fehlers 2. Art bei nur einer

  • 1.3 Die Prfung statistischer Aussagen 19

    geringfgigen Abweichung von einer symmetrischen Geschlechter-verteilung relativ gro werden kann (zugleich ist in solchen Situatio-nen ein Fehler 2. Art aber auch nicht so folgenschwer). Angemerkt werden muss aber auch, dass die Gren der Unterstichproben einen Einfluss auf das Risiko eines Fehlers 2. Art haben: Je grer die Un-terstichproben sind, desto geringer wird das Risiko.

  • 2 Die Mathematik des Zufalls

    2.1 Ein Ma fr Sicherheit

    Bei der sprachlichen Umschreibung von Unsicherheit kennen wir viele Varianten: "Morgen wird es wohl regnen". Oder: "Ich kann mir kaum vorstellen, dass der Zug die Versptung noch aufholen wird" Oder: "Der Angeklagte hat die Tat mit einer an Sicherheit grenzenden Wahr-scheinlichkeit begangen ". Gesucht ist eine Maskala, mit der Sicherheiten bei zuflligen Erschei-nungen gemessen werden knnen. Wir haben im ersten Teil des Buches gesehen, warum die mathemati-schen Gesetzmigkeiten von zuflilligen Prozessen bei der Bewertung von Stichprobenergebnissen so wichtig sind. Aus Arbuthnots Geburten-statistik konnte nmlich nur deshalb eine Schlussfolgerung gezogen wer-den, weil die Effekte, die auf der Zuflligkeit der Stichprobenauswahl be-ruhten, rechentecbnisch begrenzt werden konnten. Und so suchen wir nun im allgemeinen Kontext nach Wegen, wie ausgehend von hypothetischen Annahmen ber eine Grundgesamtheit weitgehend sichere Prognosen ber die Ergebnisse einer Stichprobenuntersuchung erstellt werden kn-nen. Solche Prognosen bilden dann, wie wir im dritten Kapitel errtern werden, die Basis fiir statistische Schlussfolgerungen, bei denen in umge-kehrter Richtung von den Ergebnissen einer Stichprobe auf die Zusam-mensetzung der Grundgesamtheit geschlossen wird. Ziel dieses zweiten Teils werden also Formeln sein, mit denen insbeson-dere quasi sichere Ergebnisse in zuflilligen Prozessen erkannt werden knnen. Diesen Formeln zugrunde liegt ein ,,Ma fiir Sicherheit", ver-gleichbar physikalischen Gren wie Masse, Lnge und Geschwindig-keit. Und wie in der Physik werden es diese Formeln erlauben, kompli-zierte Sachverhalte rechentecbnisch auf einfachere Situationen

    J. Bewersdorff, STATISTIK wie und warum sie funktioniert,DOI 10.1007/978-3-8348-8264-6_2, Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011

  • 2.1 Ein Ma flIr Sicherheit 21

    zurckzufiihren: Beispielsweise ermglichen es die Formeln der physika-lischen Disziplin der Mechanik, die Flugbahn einer Raumsonde dadurch zu berechoen, dass Stck flIr Stck der Wegstrecke die aktuell auf die Raumsonde wirkenden Krfte bestimmt werden, ob verursacht durch Gravitation oder Beschleunigung - ganz so, wie wir es im einfachen Fall aus einem stehenden oder anfahrenden Aufzug her kennen. In einer ge-wissen Analogie dazu werden wir Formeln kennenlemen, welche die Ei-genschaften einer zuflIllig ausgewhlten Stichprobe auf diejenigen Para-meter zurckfhren, welche die zuflillige Auswahl einer einzelnen Unter-suchungseinheit chara.ktcrisieren.

    RUd 6 Blaise Pascal (links) und Pierre de Fermat (rechts) begrndeten 1654 in einem Briefwechsel ber Glcksspiele die mathemati-sche Wahrscheinlichkeitsrechnung. Sie fanden unter anderem Erklrungen dafr, warum die Wette, in 24 Wrfen mit zwei Wrfeln mindestens eine Doppel-Sechs zu erzielen, eher verlo-ren als gewonnen wird, obwohl die entsprechende W ctte, in vier Wrfen mit einem Wrfel eine Sechs zu erzielen, eher ge-wonnen als verloren wird.

    In Bezug auf die historische Entwicklung waren es die Glcksspiele, die Mathematiker erstmals dazu inspirierten, sich mit zufllligen Erscheinun-

  • 22 2 Die Mathematik des Zufalls

    gen zu beschftigen. Gefragt wurde unter anderem danach, welche Chan-cen ein Spieler in einem Glc!{sspiel hat und wie diese Chancen - insbe-sondere in Relation zum Einsatz oder in Relation zu den Gewinnchancen anderer Spieler - quantifizierbar sind. Ausgehend von den ersten syste-matischen Untersuchungen der Mathematiker Blaise Pascal (1623-1662) und Pierre de Fermat (1601-1665) entstand so ein mathematischer Appa-rat, der die Gesetzmigkeiten zuflliger Prozesse widerspiegelt. Auch heute noch bilden Glcksspiele eine - im wahrsten Sinne des Wor-tes - ideale "Spielwiese" dafiir, zuflillige Prozesse mathematisch zu ana-lysieren. Dies hat vor allem zwei Grnde: Zum einen gibt es angefangen vom simplen Wurf eines einzelnen Wrfels bis hin zum komplizierten Glcksspiel eine Flle von (Bei-)Spielen, mit denen viele theoretische Aussagen plastisch erlutert werden knnen. Zum anderen erfllen Glcksspiele offensichtlich jene Grundvoraussetzungen, die wir allen ma-thematischen berlegungen ber sogenannte Zufallsexperimente zu-grunde legen wollen:

    Die Bedingungen, unter denen der Zufall wirkt, sind bekannt: Dies schliet die verwendeten Mechanismen zur Zufallserzeugung, wie bei-spielsweise den verwendeten Wrfel, genauso ein wie die Kumulation des zuflligen Einflusses in einem eindeutig benennbaren und durch Beobachtung feststellbaren Zufallsergebnis.

    Das Zufallsexperiment ist vom Prinzip her beliebig oft unter gleichen Bedingungen wiederholbar.

    Die erste Bedingung bildet die notwendige Grundlage dafiir, berhaupt eine Aussage ber das Zufallsexperirnent machen zu knnen. Die zweite Bedingung stellt sicher, dass theoretische Aussagen im Zuge von Ver-suchsreihen praktisch berprft werden knnen. Der zentrale Begriff zur mathematischen Beschreibung von Zufal1sexpe-rirnenten ist der Begriff der Wahrscheinlichkeit, nach Jakob Bernoulli (1654-1705), einem der Pioniere der Wahrscheinlichlceitsrecbnung, ein "Grad von Gewissheit". Ausgedrckt wird dieser Grad an Gewissheit durch eine Zahl. Wie eine Lnge misst auch die Wahrscheinlichlceit et-was, aber was genau und wovon berhaupt? Das heit, was fiir Objekte werden gemessen, und welche Ausprgung von ihnen ist Gegenstand der Messung?

  • 2.1 Ein Ma fr Sicherheit 23

    Nehmen wir zunchst den Wurf eines einzelnen Wrfels. ber ein ein-zelnes Wrfelergebnis sind Aussagen mglich wie "Das Wrfelergebnis ist gleich 5" oder "Die geworfene Zahl ist hchstens gleich 3". Je nach Wurf kann eine solche Aussage wahr oder unwahr sein. Anders ausge-drckt: Das durch die Aussage beschriebene Ereignis kann bei einem einzelnen Versuch eintreten oder auch nicht. Dabei tritt der Extremfall des unmglichen Ereignisses, welches beispielsweise durch die Aussage ,,Das Wrfelergebnis ist gleich 7" reprsentiert wird, nie ein. Dagegen tritt das absolut sichere Ereignis, beschrieben etwa durch die Aussage ,,Die geworfene Zahl liegt zwischen 1 und 6", in jedem Versuch ein. Die Ereignisse sind nun die Obj ekte, die mit den Wahrscheinlichkeiten gemessen werden. Gemessen wird bei einem Ereignis die Gewissheit oder Sicherheit, mit der es in einem einzelnen Versuch eintreten kann.

    Wie aber lsst sich diese Sicherheit messen? Messen heit vergleichen. So messen wir Lngen dadurch, dass wir sie mit einem Mastab, etwa ei-nem Lineal, vergleichen. Bei den Wahrscheinlichkeiten ist das nicht so einfach. Zum einen sind die zu messenden Objekte nicht materiell, zum anderen ist die zu messende Ausprgung, im Gegensatz zu Gren wie Geschwindigkeit, Temperatur oder Helligkeit, nicht direkt wahrnehmbar. hnmerhin ist intnitiv klar, wie man die Sicherheit eines Ereignisses ab-schtzen kann: Man schreitet zur Tat, das heit, man wrfelt, und zwar mglichst oft! Je hher dabei der Anteil der Wrfe ist, bei denen das Er-eignis eintritt, als desto sicherer ist der Eintritt des Ereignisses in einem einzelnen Versuch anzusehen. Zahlenmig wird der gemessene Anteil durch die relative Hufigkeit erfasst, bei der die Zahl der Eintritte durch die Gesamtzahl der Wrfe geteilt wird. Ergeben beispielsweise von 6000 Wrfen 2029 Wrfe mindestens eine Fnf, dann entspricht das einer rela-tiven Hufigkeit von 2029/6000 = 0,338. Die Sicherheit, mindestens eine Fnf zu wrfeln, ist damit gemessen, das Messergebnis lautet 0,338. Eine erneute Messung mit derselben oder einer anderen Wurfzahl wrde kaum das gleiche, vermutlich aber ein hnliches, Ergebnis erbringen. Ein end-gltiger Wert ist aber so nicht zu erhalten, und selbst die Angabe einer Messgenauigkeit ist bereits problematisch. Eindeutig messbar sind nur das absolut sichere Ereignis, das inuner die relative Hufigkeit 1 besitzt, sowie das unmgliche Ereignis, fr das sich stets die relative Hufigkeit o ergibt.

  • 24 2 Die Mathematik des Zufalls

    Will man bei unterschiedlichen Ereignissen die Sicherheit vergleichen, mit der sie eintreten, dann muss das nicht unbedingt experimentell ge-schehen. Mglich ist es vielmehr auch, Symmetrien zu bercksichtigen: So wie die sechs Flchen des Wrfels geometrisch vollkommen gleich-wertig sind, so ist es nahe liegend, den Eintritt der entsprechenden Ereig-nisse als gleich sicher anzusehen, das heit, den sechs Wurf ergebnissen die gleiche Wahrscheinlichkeit zu unterstellen. Auf einer Wahrschein-lichkeits-Maskala, die wie bei den relativen Hufigkeiten von der 0 des unmglichen Ereignisses bis zur 1 des absolut sicheren Ereignisses reicht, ergeben sich dann fr die sechs Wurf ergebnisse, von denen immer genau eines eintritt, die Wahrscheinlichkeiten 1/6. Jakob Bernoulli begrndete dies mit den Worten: "Wahrscheinlichkeit ist nmlich der Grad an der Unsicherheit, und sie unterscheidet sich von ihr wie ein Teil vom Gan-zen."

    Das Ereignis, mindestens eine Fnf zu werfen, umfasst die Wrfelergeb-nisse Fnf und Sechs. Folglich wird ihr die Wahrscheinlichkeit 2/6 = 1/3 zugeordnet. Das Ereignis, eine gerade Zahl zu werfen, erhlt entspre-chend die Wahrscheinlichkeit 3/6 = 1/2.

    Wahrscheinlichkeiten lassen sich immer dann wie beim Wrfel finden, wenn ein System gleichmglicher Flle vorliegt. Der fr uns wichtigste Spezialfall einer solchen Situation ist die zufllige Auswahl einer einzel-nen Untersuchungseinheit aus einer Grundgesamtheit, deren mehrfache Wiederholung es nach und nach erlaubt, eine Zufallstichprobe zusam-menzustellen.

    Allgemein erklrte Pierre Simon Laplace (1749-1824) Flle dann fr gleichmglich, wenn "wir ber deren Eintreffen in der gleichen Unge-wissheit sind" und wir - in der Regel aufgrund einer vorliegenden Sym-metrie - ,,keinen Grund zu glauben haben, dass einer dieser Flle eher eintreten werde als der andere". Sind die mglichen Ergebnisse eines Zu-fallsexperimentes in diesem Sinne "gleichmglich", dann ist die Wahr-scheinlichkeit eines Ereignisses nach Laplace wie folgt definierbar: Die Anzahl der Flle, bei denen das Ereignis eintritt, das heit, die "gnstig" fr das Ereignis sind, geteilt durch die Gesamtzahl der mglichen Flle. Ist A ein Ereignis, dann entspricht die Definition von Laplace der Formel

    Wahrscheinlichkeit des Ereignisses A = Anzahl der fr A ~tigen Flle Gesamtzahl der mglichen Flle

  • 2.1 Ein Ma flIr Sicherheit 25

    Angewendet wird die Formel in der schon erluterten Weise: So sind fr das Ereignis, mit einem Wrfel eine gerade Zahl zu wrfeln, drei Flle, nmlich 2, 4 und 6, ,.gnstig", so dass wir eine Wahrscheinlichkeit von 3/6 ~ 1/2 erhalten.

    BUd7

    ESSA I PIi ILOSOPHIQUE .. '

    LES PROABILITES;

    ~_ ..... "c ...... , .... _ .. ~"'-~_, "" .................. ~-,~_ .. "-*"_ .. .. _ ... ~ .......... , ... _ .. _ .. .-.. .... _, .... _ .. _ ... _, .. -. .. .. _ ... _ . .n_._

    I'ARIS. ,,~ ,.

  • 26 2 Die Mathematik des Zufalls

    Wabrscheinlichkeiten sind. Dies ist zugleich die Besttigung dafiir, dass Wabrscheinlichkeiten bei Ereignissen wirklich die Sicherheit messen, wie man sie intuitiv versteht: bersteigt beispielsweise bei einem Spiel die Gewinnwabrscheinlichkeit die Wahrscheinlichkeit eines Vedustes, dann wird man in einer gengend langen Spielserie fter gewinnen als verlie-ren. Dabei macht Bemoullis Gesetz der groen Zahlen sogar Aussagen darber, wie genau Wabrscheinlichkeiten und relative Hufigkeiten ber-einstimmen. Wir werden darauf noch zurckkommen. Bei einem Wrfel ist die Symmetrie der Grund dafiir, dass die sechs Wer-te als gleichmglich und damit gleichwabrscheinlich angesehen werden knnen. Es gibt eben keinen Grund dafiir, dass - im Sinne von Laplace -ein Wrfelwert eher erreicht wrde als ein anderer. Bei zwei Wrfeln gibt es, wie in Bild 8 zu sehen ist, insgesamt 36 Kombinationen der beiden Wrfelwerte. Wichtig ist, dass Wrfelkombinationen wie 2-3 und 3-2 un-terschieden werden! In der Praxis ist der Unterschied zwar hufig nicht zu erkennen, etwa dann, wenn zwei gleichartige Wrfel aus einem Be-cher geworfen werden. Nimmt man aber zwei unterschiedlich gefrbte Wrfel, so werden die Ereignisse 2-3 und 3-2 problemlos unterscheidbar.

    2. Wilrfe! 1 2 3 4 5 6 1. WOrfe!

    1 1-1 1-2 1-3 1-4 1-5 1-6 2 2-1 2-2 2-3 2-4 2-5 2-6 3 3-1 3-2 3-3 3-4 3-5 3-6 4 4-1 4-2 4-3 4-4 4-5 4-6 5 5-1 5-2 5-3 5-4 5-5 5-6 6 6-1 6-2 6-3 6-4 6-5 6-6

    BildS Die 36 Kombinationen von zwei Wrfelergebnissen

    Sind nun auch diese 36 Kombinationen gleichmglich im Laplace'schen Sinne? Zunchst ist zu bemerken, dass es nicht ausreicht, einfach wieder nur auf die Symmetrie der Wrfel zu verweisen. So wre es denkbar, dass zwischen beiden Wrfelwerten kausale Einflsse bestehen, wie sie auf-treten, wenn zwei Karten aus einem Kartenspiel gezogen werden: Zieht man aus einem Rommeblatt mit 52 Karten eine Karte, dann ist die Wahr-scheinlichkeit fiir jeden der 13 Kartenwerte gleich 4/52 = 1/13. Wird aber, ohne dass die erste Karte zurckgesteckt wird, eine weitere Karte

  • 2.1 Ein Ma fr Sicherheit 27

    gezogen, dann gelten fr deren Wert neue Wahrscheinlichkeiten. So ist eine Wiederholung des zuerst gezogenen Wertes weniger wahrscheinlich, da er nur bei 3 der 51 verbliebenen Karten erreicht wird. Jeder der zwlf anderen Werte besitzt dagegen die Wahrscheinlichkeit von 4/51.

    Verursacht wird die nderung der Wahrscheinlichkeiten dadurch, dass das Kartenspiel aufgrund der ersten Ziehung seinen Zustand verndert hat. Vergleichbares ist bei einem Wrfel wenig plausibel, da sein Zu-stand, anders als der des Kartenspiels, nicht von vorangegangenen Ergeb-nissen abhngt - Wrfel besitzen eben kein "Gedchtnis". hn Sinne von Laplace ist also, egal wie der erste Wurf ausgeht, kein Grund dafr zu er-kennen, welcher Wert beim zweiten Wurf eher erreicht werden knnte als ein anderer. Damit knnen alle 36 Wrfelkombinationen als gieichwabr-scheinlich angesehen werden.

    Auf Basis der angestellten berlegungen knnen wir nun Ereignisse, die beim Wurf eines Wrfelpaares eintreten knnen, untereinander verglei-chen. Beispielsweise ist das Ereignis, eine Summe von 9 zu werfen, wabrscheinlicher als das Ereignis, die Summe 4 zu erzielen: Fr das erste Ereignis gibt es nmlich unter den 36 gleichmgiichen Fllen vier "gns-tige", nmlich 6-3, 3-6, 54 und 4-5. Beim zweiten Ereignis sind aber nur drei Flle "gnstig", nmlich 1-3, 3-1 und 2-2. Gem dem Gesetz der groen Zahlen wird damit in gengend langen Versuchsreihen die Anzahl der Neuner-Summen die Anzahl der Vierer-Summen bersteigen.

    Kombinatorik - wenn zhlen zu lange dauert Ist die Laplace'sche Formel fr die Wahrscheinlichkeit eines Ereig-nisses A berhaupt anwendbar, dann kann die Wahrscheinlichkeit im Prinzip immer dadurch bestimmt werden, dass man alle (gleich)mg-lichen Flle untersucht. Dabei zhlt man einerseits alle Flle und an-dererseits nur diejenigen, die fr das Ereignis A gnstig sind. Aller-dings stt man bei einer solchen Verfabrensweise in der Praxis schnell an die Grenze dessen, was durch Abzhlen noch zu bewl-tigen ist. Man denke nur an ein Romme-Blatt mit 52 Karten, das ge-mischt wird: Wie viele gieichmgliche Sortierungen dieser 52 Karten gibt es?

    Glcklicherweise existieren einige elementare Gesetzmigkeiten, mit denen sich solche Fragen drastisch einfacher beantworten lassen.

  • 28 2 Die Mathematik des Zufalls

    Da solche Aussagen nicht zwangslufig etwas mit Wahrscheinlich-keiten zu tun haben, werden sie in der Mathematik in einer eigenstn-digen Teildisziplin, der sogenannten Kombinatnrik, zusammenge-fasst. Fundamental dabei ist die sogenannte Multiplikationsregel, die wir im Fall der mglichen Ergebnisse eines Wrfelpaares bereits kennengelernt haben: Kombiniert man alle Werte, die ein Merkmal annehmen kann, mit allen Werten, die ein weiteres Merkmal anneh-men kann, so ist die Gesamtzahl der mglichen Kombinationen gleich dem Produkt der Anzahlen, die jeder Merkmalswert ftlr sich annehmen kann. Direkt plausibel wird diese Tatsache, wenn man die mglichen Kombinationen entsprechend den Wrfelpaar-Ergebnissen (siehe Bild 8, Seite 26) wie in Bild 9 in Form einer Tabelle anordnet, wobei die Zeilen und Spalten jeweils die Kombinationen enthalten, die in Bezug auf das erste beziehungsweise zweite Merkmal berein-stinnnende Werte besitzen.

    2.Mertan.: 1 2 3 ... I.Merkmal

    A AI A2 A3 ... B BI B2 C3 C CI C2 C3 ... ... . ..

    Bild 9 Die Kombinationen der Merkmalswerte A, B, C, ... mit den Merkmalswerten 1,2,3, ...

    Es bleibt anzumerken, dass auch die Anzahl der 282 Sequenzen MMMM ... M, wMMM .. M, .. , wwww .. w im Test von Arbuthnot mit Hilfe der Multiplikationsregel gefolgert werden kann.

    Noch elementarer als die Multiplikationsregel, und nur der Vollstn-digkeit halber zu erwhnen, ist das Additionsprinzip: Setzt sich eine Gesamtheit aus zwei Teilen zusammen, die keine gemeinsamen Ele-mente beinhalten, dann ist die Gesamtzahl der Elemente gleich der Summe der Elemente-Anzahlen ftlr die beiden Teile. Soll wie im schon angefhrten Beispiel des Romme-Blattes die An-zahl der mglichen, als Permutationen bezeichneten, Sortierungen von n unterschiedlichen Dingen bestinnnt werden, so muss die Multi-plikationsregel ftlr eine leicht modifizierte Situation angewendet wer-

  • 2.1 Ein Ma fr Sicherheit 29

    den: Dazu stellen wir uns vor, dass wir nacheinander alle mglichen Sortierungen der n ,,Karten", wie wir die Dinge auch allgemein be-zeichnen wollen, aufzhlen. Dabei gibt es fr die erste Karte offen-sichtlich n Mglichkeiten. Fr die zweite Karte gibt es jeweils n - 1 Mglichkeiten, da jeweils jede Karte, auer der bereits auf Position 1 befindlichen Karte, als zweite Karte genommen werden kann. Damit gibt es insgesamt n(n -1) Mglichkeiten fr die ersten beiden Kar-ten. Verfhrt man in dieser Weise fort, so erkennt man, dass es fr die ersten drei Karten n-(n -IHn - 2) Mglichkeiten gibt und so weiter. Fhrt man diese berlegung weiter bis zu de!jenigen Karte, die sich an der letzten Stelle der Sortierung befindet und fr die daher nur noch eine Mglichkeit brig bleibt, so erkennt man, dass die Gesamt-zahl der Permutationen von n Karten gleich

    n-(n -1)(n - 2)(n - 3) ... 321 ist. Abgekrzt wird dieses Produkt mit n!, gesprochen,,n Fakultt". Fr die gestellte Frage nach den mglichen Permutationen eines 52 Karten urufassenden Romme-Blattes ergibt sich damit die Anzahl

    52! = 525150 ... 321, wobei es sich um eine 67-stellige Zahl mit einer wahrhaft astrono-mischen Gre handelt, da die Zahl der Atome im ganzen Universum in einer hnlichen Grenordnung geschtzt wird.

    Ein kombinatorisches Problem, dass noch etwas schwieriger zu lsen ist, tritt beim Lotto auf. Dort werden bekanntlich bei jeder Ziehung 6 der 49 Zahlen 1, 2, ... , 49 gezogen. Auch bei diesem Problem ist es wieder sinnvoll, die mglichen Verlufe eines Ziehungsvorganges unter Rckgriff auf die Multiplikationsregel abzuzhlen: Fr die erste gezogene Zahl gibt es offensichtlich 49 Mglichkeiten. Gem den eben angestellten berlegungen gibt es fr die ersten beiden Zahlen 4948 Mglichkeiten. msgesamt gibt es daher 494847464544 mgliche Verlufe des Ziehungsvorganges. Da es aber bei einer Lot-to-Ziehung keine Rolle spielt, in welcher Reihenfolge die sechs Zah-len gezogen werden, ergeben jeweils 6! = 654321 = 120 mgliche Ziehungsverlufe dieselben sechs Zahlen. Damit ist die Zahl der mglichen,,6 aus 49"-Zahlenkombinationen gleich

  • 30 2 Die Mathematik des Zufalls

    494847464544 = 13983816. 123456

    Die allgemeine Formel, die diesem Sachverhalt zugrunde liegt, be-antwortet die Frage danach, wie viele Mglichkeiten es gibt, eine k Dinge umfassende Auswahl aus einer Gesamtheit von n verschie-denen Dingen zu treffen. Fr die als Binomialkoeffizient ,,n ber k" bezeichnete Anzahl erhlt man analog zu der eben fr das Lotto-Beispiel erluterten Weise die Formel

    (n) = n(n -1)(n-2) ... (n-k+ I) k k! (n-k)!k!

    n!

    Aufgaben 1. Wie gro ist die Wabrscbeinlichkeit, mit drei Wrfeln mindestens die Summe 16 zu erzielen?

    2. Wie gro ist die Wabrscheinlichkeit, mit einem Lotto-Tipp vier Richtige zu erzielen?

    Hinweis: Vier Richtige erzielt man genau dann, wenn 4 der 6 getippten Zahlen und 2 der 43 nicht getippten Zahlen gezogen werden.

    3. Ein Wrfel wird filnfinal geworfen. Wie hoch ist die Wabrscheinlichkeit, ge-nau zwei Sechsen zu werfen? Hinweis: Man berlege sich zunchst, wie viele mgliche Sequenzen es mit ge-nau zwei Treffern gibt wie beispielweise TNNTN, wobei "T" flIr einen Treffer, das heit eine Sechs, steht und ,,N" flIr einen Nicht-Treffer, also eine Zahl zwi-schen 1 und 5.

    4. Aus einem Vorrat von insgesamt N Kugeln, von denen genau M wei sind, werden gleichwabrscheinlich n Kugeln gezogen. Wie gro ist die Wabrschein-Iichkeit, dabei genau kweie Kugeln zu ziehen? Die flIr feste Werte N, Mund n sowie zu allen mglichen Werten k gebildete Gesamtheit der Wabrscheinlichkei-ten wird bypergeometriscbe Verteilung genannt.

    Hinweis: berlegen Sie sich dazu, wie viele Mglichkeiten es flIr die weien Kugeln einerseits gibt und wie viele Mglichkeiten flIr die nicht weien Kugeln.

  • 2.2 Die Gesetze des Zufalls 31

    2.2 Die Gesetze des Zufalls

    Gesucht sind die for Wahrscheinlichkeiten geltenden Gesetzmigkeiten. Auch wenn wir uns im Alltag keine groeu Gedanken darber machen, zweifeln wir kaum daran, wie mit Maen und Messwerten umzugehen ist: Ist etwa das Gesamtgewicht eines Fahrzeugs gesucht, so wissen wir, dass wir dazu das Leergewicht sowie das Gewicht der Nutzlast addieren mssen. Kennen wir die Entfernung zwischen Paris und Berlin einerseits und zwischen Berlin und Moskau andererseits, so ist uns klar, dass die Entfernung zwischen Paris und Moskau hchstens gleich der Summe der beiden Einzelentfernungen sein kann. Und wie sieht es mit Wahrscheinlichkeiten aus? Zunchst stellen wir in Bezug auf die zu messenden Objekte fest, dass man aus zwei (oder mehr) Ereignissen neue Ereignisse bilden kann. Vergleichbares kennen wir aus der Arithmetik, wo viele komplizierte Rechenausdrcke auf die vier Grundoperationen, jeweils angewandt auf zwei Zahlen a und b zurckge-fhrt werden knnen: a + b, a - b, ab und a/b. Ganz analog lassen sich fr Ereignisse drei Elernentaroperationen finden, mit denen ausgehend von zwei Ereignissen A und B, die in einem Zufallsexperiment beobacht-bar sind, neue Ereignisse gebildet werden knnen:

    So kann man dasjenige Ereignis ,,A und B" untersuchen, welches das gemeinsame Eintreten beider Ereignisse A und B voraussetzt. Steht beispielsweise beim Wurf eines Wrfels A fr das Ereignis, ei-nen geraden Wert zu erzielen, und B fr das Ereignis, mindestens eine Drei zu werfen, dann umfasst das Ereignis ,,A und B" die beiden Wr-felergebnisse 4 und 6.

    Ebenso lsst sich dasjenige Ereignis konstruieren, welches das Eintreten des Ereignisses A oder das Eintreten des Ereignisses B vor-aussetzt. Dabei ist anzumerken, dass kein ausschlieendes "entweder oder" gemeint ist, das heit: Das Ereignis ,,A oder B" gilt auch dann als eingetreten, wenn beide Ereignisse eintreten. Fr die gerade beispielhaft angefhrten Ereignisse A und B umfasst das Ereignis ,,A oder B" die fnf Ergebnisse 2, 3, 4, 5 und 6.

  • 32 2 Die Mathematik des Zufalls

    Schlielich kann man Komplementr-Ereignisse untersuchen, wie das Ereignis ,,nicht A". Dieses Ereignis tritt genau dann ein, wenn das Er-eignis A nicht eintritt.

    Fr das angefhrte Beispielereignis A, eine gerade Zahl zu werfen, umfasst das dazu komplementre Ereignis die ungeraden Wrfeler-gebnisse, also I, 3 und 5.

    Da es sich bei den drei Operationen um universelle Mechanismen han-delt, mit denen aus vorhandenen Ereignissen neue Ereignisse gebildet werden knnen, stellt sich natrlich sofort die Frage, in welcher Relation die zugehrigen Wahrscheinlichkeiten stehen. Dabei ist es einleuchtend, dass solche Gesetzrnigkeiten keineswegs den Charakter von "I'art pour l'art" haben, denn wie bei anderen Maen ermglichen solche ,,Rechen-regeln" in der praktischen Anwendung eine Reduktion komplexer Pro-blemstellungen auf einfachere Situationen.

    So werden wir mit Hilfe dieser Rechenregeln zum Beispiel die Wahr-scheinlichkeit berechnen knnen, bei vier Wrfen mit je einem Wrfel mindestens eine Sechs zu werfen. Dazu merken wir zunchst an, dass tat-schlich die drei oben genannten Elementaroperationen ausreichen, um das Ereignis, mindestens eine Sechs zu werfen, durch Ereignisse auszu-drcken, die sich nur auf einen einzelnen Wurf beziehen. Dazu mssen einfach vier geeignete, auf die einzelnen Wrfe bezogene Ereignisse mit-tels der "Oder"-Operation miteinander verkettet werden: Dabei erhalten wir das Ereignis, im ersten Wurf eine Sechs zu werfen, oder im zweiten Wurf eine Sechs zu werfen, oder im dritten Wurf eine Sechs zu werfen, oder im vierten Wurf eine Sechs zu werfen (oder, daja ausdrcklich kein "entweder oder" gemeint ist, in mehreren der Wrfe Sechsen zu werfen). Insgesamt ist dieses Ereignis aber nichts anderes als das Ereignis, min-destens eine Sechs zu werfen.

    Eine alternative Charakterisierung dieses Ereignisses, die wir noch ver-wenden werden, erhlt man, wenn zu jedem Wurf das Ereignis, keine Sechs zu werfen, betrachtet wird. Mit der "Und"-Operation erhlt man dann das Ereignis, in keinem der vier Wrfe eine Sechs zu werfen. Mit einer abschlieenden Komplementr-Operation gelangt man schlielich zum Ereignis, in den vier Wrfen mindestens eine Sechs zu werfen.

  • 2.2 Die Gesetze des Zufalls 33

    Und wie sieht es mit der zugehrigen Wahrscheinlichkeit aus? Das heit, wie gro ist die Wahrscheinlichkeit, in vier Wrfen mindestens eine Sechs zu werfen? Ad hoc bietet sich die folgende berlegung an: Bei ei-nem Wurf ist die Wahrscheinlichkeit 116, da das Ereignis genau eines der sechs gleichmglichen, das heit zueinander symmetrischen, Wrfeler-gebnisse umfasst. Es erscheint daher einleuchtend, dass bei zwei Wrfen die Wahrscheinlichkeit 2/6, bei drei Wrfen 3/6 und bei vier Wrfen 4/6 betrgt. Aber sptestens die Fortschreibung dieses verlockenden Gedan-kenganges auf sieben Wrfe, fiir die sich dann analog eine Wahrschein-lichkeit von 7/6 ergeben wrde, fhrt die berlegung ad absurdum. Der gerade erkannte Fehlschluss ist typisch fiir Irrtmer, die in Bezug auf die Wahrscheinlichkeitsrechnung oft gemacht werden, ob bei der Fehl-deutung statistischer Untersuchungen oder beim Einschtzen von Ge-winnchancen in Glcksspielen6. Abhilfe kann nur eine systematische Auseinandersetzung mit den Gesetzmigkeiten von Wahrscheinlichkei-ten bringen. Dabei sollten sowohl inha1tliche Aspekte errtert werden als auch die Argumente fiir ihre formale Begrndung. Wir beginnen mit einer Zusammenstellung der grundlegenden Gesetz-migkeiten von Wahrscheinlichkeiten: (WI) Die jedem Ereignis A zugeordnete Wahrscheinlichkeit, die meist

    mit P(A) bezeichnet wird7, ist eine Zahl zwischen 0 und I. (W2) Das unmgliche Ereignis hat die Wahrscheinlichkeit o. (W3) Das sichere Ereignis hat die Wahrscheinlichkeit l. (W4) Additionsgesetz:

    Schlieen sich zwei in einem Zufallsexperiment beobachtbare Er-eignisse A und B gegenseitig aus, das heit, knnen die beide Er-eignisse in einem Versuch keinesfalls beide eintreten, dann ist die Wahrscheinlichkeit, dass mindestens eines der beiden Ereignisse

    6 Beispiele dazu findet man in ersten Teil von Jrg Bewersdorf!; Glck, Logik und Bluff: Mathematik im Spiel- Methoden, Ergebnisse und Grenzen, 5. Auflage, Wies-baden 2010.

    7 Die Bezeichnung P erinnert an die lateinische oder auch englische bersetzung des Begriffes Wahrscheinlichkeit: probablitas beziehungsweise probability. Der Aus-druck P(A) wird gesprochen als ,,P von A".

  • 34 2 Die Mathematik des Zufalls

    eintritt, gleich der Summe der Einzelwahrscheinlichkeiten. Als Formel: P(A oder B) = P(A) + P(B). Zum Beispiel ist die Wahrscheinlichkeit, mit einem Wrfel eine ungerade Zahl oder eine Sechs zu werfen, gleich 112 + 116 = 2/3. Dagegen ist das Additionsgesetz auf die Situation, eine ungerade Zahl oder eine Drei bersteigende Zahl zu erwrfeln, nicht an-wendbar, da die beiden Ereignisse bei einer Fnf gleichzeitig ein-treten.

    (WS) Multiplikationsgesetz: Beeinflusst innerhalb eines Zufallsexperimentes das Eintreten oder Nicht-Eintreten eines Ereignisse A nicht die Wahrscheinlichkeit ei-nes anderen Ereignisses B - man nennt solche Ereignisse (sto-chastisch) unabhngig voneinander -, so ist die Wahrscheinlich-keit, dass beide Ereignisse in einem Versuch gleichzeitig eintreten, gleich dem Produkt der Einzelwahrscheinlichkeiten. Als Formel: p(A und B) = P(A) P(B). Wird beispielsweise ein roter und ein weier Wrfel geworfen, dann ist die Wahrscheinlichkeit, mit dem roten Wrfel eine gerade Zahl und mit dem weien Wrfel eine Sechs zu werfen, gleich 112116 = 1112. Nicht anwendbar ist das Mnltiplikationsgesetz da-gegen in der Situation, bei der aus einem Kartenspiel zwei Karten gezogen werden. Zwar betrgt die Wahrscheinlichkeit fr ein Ass bei einer einzelnen, aus einem 52er-Blatt gezogenen Karte 1113, jedoch ist die Wahrscheinlichkeit fr zwei Asse nicht gleich 11169, da sich die Wahrscheinlichkeit fr ein zweites Ass nach dem Zie-hen des ersten Asses von 4/52 auf 3/51 reduziert: Unter den ver-bliebenen 51 Karten sind nmlich nur noch drei Asse vorhanden, und die Wahrscheinlichkeit fr zwei Asse ist daherS gleich 11131117 = 11221.

    8 Um das Multiplikationsgesetz doch noch, wenn auch in modifizierter Weise, anwen-den zu knnen, stellt man sich vor, dass das zweite Zufallsexperiment aus der gleich-wahrscheinlichen Auswahl einer Zahl k aus den Zahlen 1, 2, ... , 51 besteht, wobei dar-ao aoknpfend daoo unter den verbliebenen 51 Karten die k-te Karte ausgewhlt wird. Dabei sind die sich auf die Kartenoummer k beziehenden Ereigoisse uoabhllngig voo dem Ergebnis der crsteo Ziehuog. Da inocrhalb der zweiteo Ziehuog die Wahrschein-lichkeit, eine einem weiteren Ass entsprechende Nummer zu ziehen, gleich 3/51 ist, ergibt sich nuo auf Basis des Multiplikationsgesetzes 1/13 1/17 ~ 1/221 fiJr die g-

  • 2.2 Die Gesetze des Zufalls 35

    Da letztlich die gesamte mathematische Wahrscheinlichkeitsrechuung auf diesen grundlegenden Gesetzmigkeiten basiert, ist es von grter Wichtigkeit, diese fnf Gesetzmigkeiten nher zu errtern. Dabei hngt der Charakter dieser Gesetzmigkeiten davon ab, wie wir den Begriff der Wahrscheinlichkeit interpretieren:

    Sieht man in der Wahrscheinlichkeit primr einen empirisch im Rah-men von Versuchsreihen messbaren Wert, der sich auf Dauer als Trend bei den relativen Hufigkeiten des zu messenden Ereignisses abzeichuet, so sind die ersten vier Aussagen offensichtlich richtig, da sie bereits entsprechend fr die relativen Hufigkeiten gelten. Eine groe Bedeutung spielt das Multiplikationsgesetz, dem als empi-risch beobachtbare Erfahrungstatsache eine naturgesetzliche Bedeu-tung zukommt. Dabei kann die gemachte Voraussetzung der Nicht-Beeinflussung inuner dann als gegeben angenommen werden, wenn ein kausaler Zusammenhang beispielsweise gem unserem physikali-schen Erkenntnisstand ausgeschlossen ist. So sind zwei nacheinander durchgefhrte Wrfe eines Wrfels deshalb voneinander unabhngig, weil der Wrfel anders als eine zusammengedrckte Spiralfeder ,,kein Gedchtnis" hat, das heit, keine dem Ergebnis des ersten Wurfes ent-sprechende Zustandsnderung erfhrt, die dann eine kausale Beein-flussung des zweiten Wurfergebnisses ermglicht. brigens erfolgt die empirische Anwendung des Multiplikationsgeset-zes in der Praxis meist umgekehrt: Erfiillen die Wahrscheinlichkeiten, die fr zwei Ereignisse im Rahmen einer Versuchsreihe ermittelt wer-den, das Multiplikationsgesetz, so schlieen wir daraus, dass eine sprbar wirkende Beeinflussung nicht vorliegt.

    Ergeben sich im Sinne von Laplace die Wahrscheinlichkeiten aus Symmetrien, die zwischen den mglichen Ergebnissen eines Zufalls-experimentes bestehen, so sind auch bei dieser futerpretation der Wahrscheinlichkeiten die ersten vier Aussagen offensichtlich.

    suchte Wahrscheinlichkeit, zwei Asse zu ziehen. Eine andere Interpretation dieser Berechnung wird im Kasten Bedingte Wahrschein-licilkeiten auf Seite 39 errtert

  • 36 2 Die Mathematik des Zufalls

    Das Multiplikationsgesetz ist in solchen Fllen eine Folge kombina-torischer berlegungen, wie sie fr das Beispiel des Wurfes eines Wrfelpaares (siehe Bild 8, Seite 26) sowie im Kasten Kombinatorik-wenn zhlen zu lange dauert (Seite 27 ff.) schon erlutert wurden. Dabei bewirkt die Voraussetzung der Unabhngigkeit, dass Paarungen der fr die einzelnen Ereignisse gnstigen Flle als zueinander sym-metrische und damit gleichmgliche Flle erscheinen. Das Laplace-Modell deckt insbesondere das in der Mathematischen Statistik primr vorkommende Szenario ab, bei dem eine sich auf eine endliche Grundgesamtheit beziehende relative Hufigkeit als Wahr-scheinlichkeit aufgefasst wird. Dazu legt man eiufach dasjenige Zu-fa!lsexperiment zugrunde, bei dem gleichwahrscheinlich irgendein Mitglied der Grundgesamtheit ausgelost wird.

    Letztlich nicht unerwhnt bleiben darf noch eine dritte, aufgrund der hohen Abstraktion bisher noch nicht verwendete Interpretation von Wahrscheinlichkeiten. Dabei werden die fnf Aussagen (Wl) bis (WS) nicht als Gesetzmigkeiten, sondern als Axiome zur Definition eines mathematischen Begrlffsapparates aufgefasst. Das heit: Immer dann, wenn Objekte A, B, ... und die ihnen zugeordneten Werte P(A), P(B), .... die ersten vier Aussagen (Wl) bis (W 4) erfiIllen, werden sie - per Definition - als Ereignisse samt ihnen zugeordneten Wahr-scheinlichkeiten aufgefasst und ihre Gesamtheit als sogenannter Wahrscheinlichkeitsraum bezeichnet. Dies gilt selbst und gerade dann, wenn es sich bei den "Ereignissen" auf vllig abstraktem Ni-veau um mathematische Objekte wie Teilmengen einer bestimmten Grundmenge handelt. Auch die Aussage (WS) erhlt bei dieser Inter-pretation den Charakter einer Definition, gem der zwei Ereignisse A und B genau dann als (stochastisch) unabhllngig voneinander gelten, wenn fr sie die Gleichung des Multiplikations"gesetzes", das heit P(A undB) = P(A)'P(B), gilt9.

    9 Fr drei oder mehr Ereignisse definiert man die Unabhngigkeit dadurch, dass die Gltigkeit des Multiplikations"gesetzes" fiir beliebige Auswahleo von Ereignisseo ge-fordert wird. Drei Ereignisse A, B und C sind also geoau dann unsbhllngig, weon die vier ldeotitteo

    p(A und B und C) ~ P(A) P(B) P( C), p(A und B) ~ P(A) P(B), p(B und C) ~ P(B) P( C) und p(A und C) ~ P(A) P( C)

    erfiUlt sind.

  • 2.2 Die Gesetze des Zufalls 37

    Fr einen Nicht-Mathematiker ist diese dritte Interpretation von Wahr-scheinlichkeiten sicher etwas gewhnungsbedrftig, und daher wollen wir sie im Weiteren weitgehend ausblenden. Zuvor soll aber wenig-stens der Sinn einer solchen Vorgehensweise noch kurz erlutert wer-den: So knnen allein auf Basis dieser fnf Eigenschaften, die den De-finitionen zugrunde liegen, weitere Aussagen rein mathematisch hergeleitet werden. Mglich ist dies ohne jegliche Interpretation auf vllig abstraktem Niveau - und damit mit zweifelsfreier Exaktheit. Zu den so beweisbaren Aussagen gehren auch komplizierte Sachverhalte wie das schon erwhnte Gesetz der groen Zahlen und dessen Umfeld, das heit Aussagen darber, mit welcher Sicherheit und welcher Ge-nauigkeit sich die in Versuchsreihen gemessenen relativen Hufigkei-ten der Wahrscheinlicbkeit annhern. Die mathematische Wahrscheinlichkeitsrechnung erhlt damit einen hnlichen Charakter wie die Infinitesimalrechnung in der Physik, wenn dort ausgehend von wenigen einfachen Gesetzmigkeiten mit-tels komplexer Berechnungen Raumsonden ber viele Millionen von Kilometern zielgenau auf die Reise geschickt werden: Dabei muss man berhaupt nicht wissen, was eine Masse eigentlich ist. Es reicht, die Formeln zu kennen und anzuwenden, in denen die Masse als Pa-rameter im Sinne eines mathematischen Modells vorkommt - mathe-matische Verfahren, etwa auf der Basis von Differentialgleichungen, ermglichen den Rest, das heit die Reduktion komplexer Sachverhal-te auf grundlegende Gesetzmigkeiten der Physik. Und so war es his-torisch sehr bedeutsam, dass ausgehend von ersten, 1900 von Georg Bohlmann (1869-1928) formulierten Ideen 1933 Andrej Kolmogorow (1903-1987) eine rein mathematische Fundierung der Wahrschein-lichkeitsrechnung gelang10 Dabei kommt - und das ist die eigentliche berraschung - der Begriff des Zufalls berhaupt nicht vor!

    10 Zuvor, nlImlich zur Jahrhuodertwende 1900, hatte der bekannte Mathematiker David lffibert (1862-1943) in einem berhmt gewordenen Vortrag ber wichtige math.,. matische Fmgestelluogen dazu aofgerofen, die "physikalischen Disziplineo" der Wahrscheinlichkeitsrechnung und Mechanik axiomatisch zu begrnden. Diese Einstu-fung macht deutlich, dass zu diesem Zeitpuokt die Wahrscheinlichkeitsrechouog noch nicht als integmler Bestaodteil der Matheroatik aogeseheo worde.

  • 38 2 Die Mathematik des Zufalls

    Fassen wir zusammen: Man kann Wahrscheinlichkeitsrechnung auf Basis unterschiedlicher Interpretationen betreiben. Die Gesetzmigkeiten -und damit auch die letztlich erzielten Resultate - bleiben aber dieselben. Praktisch erfii1len die Gesetzmigkeiten schlicht die Funktion, kompli-zierte Situationen rechentechnisch auf einfache Situationen zurckfhren zu knnen. Dabei fungiert der mathematische Formelapparat als ein ab-straktes und allgemeines, im speziellen Anwendungsfall durch die Zu-weisung geeigneter Parameterwerte konkretisierbares Modell, das reale Sachverhalte durch mathematische Objekte wie Zahlen und Mengen wi-derspiegelt. Wichtig dabei ist, zwei entscheidende Eigenschaften festzu-halten:

    Einerseits hat sich diese Vorgehensweise in der tagtglichen Anwen-dung besttigt und ist somit - bei fehlerfreier Anwendung - ber j e-den Zweifel erhaben.

    Andererseits ist das Modell so flexibel, dass alle Anwendungsflle ab-gedeckt werden knnen. Im Rahmen statistischer Anwendungen den-ken wir dabei insbesondere an den Prozess der zufalligen Auswahl von Stichproben aus einer Gesamtheit. Aber selbst die Behandlung von im Laplace'schen Ansatz eigentlich nicht vorgesehenen unsym-metrischen Zufallsexperimenten ist