of 39/39
dr hab.inż. Katarzyna Zakrzewska, prof.AGH Katedra Elektroniki, AGH e-mail: [email protected] http://home.agh.edu.pl/~zak Wykład 1. Wstęp Wstęp do probabilistyki i statystyki Wstęp do probabilistyki i statystyki. wykład 1 1

Wykład 1. Wstęp

  • View
    225

  • Download
    0

Embed Size (px)

Text of Wykład 1. Wstęp

  • dr hab.in. Katarzyna Zakrzewska, prof.AGH Katedra Elektroniki, AGHe-mail: [email protected]

    http://home.agh.edu.pl/~zak

    Wykad 1.Wstp

    Wstp do probabilistyki i statystyki

    Wstp do probabilistyki i statystyki. wykad 1 1

  • Literatura:

    D.C. Montgomery, G.C. Runger, Applied Statistics and

    Probability for Engineers, J. Wiley and Sons, Inc.

    A. Pluciska, E. Pluciski, Probabilistyka, rachunek

    prawdopodobiestwa, statystyka matematyczna, procesy

    stochastyczne, WNT, 2000

    J. Jakubowski, R. Sztencel, Wstp do teorii

    prawdopodobiestwa, SCRIPT, 2000

    R. Leitner, W. akowski, Matematyka-kurs

    przygotowawczy na wysze uczelnie techniczne

    Wstp do probabilistyki i statystyki. wykad 1 2

  • Plan:

    Rys historyczny

    Rodzaje danych

    Prezentacja danych

    Zastosowania statystyki

    Parametry opisowe

    Wstp do probabilistyki i statystyki. wykad 1 3

  • Czy zajmuje si probabilistyka i statystyka?

    Wstp do probabilistyki i statystyki. wykad 1 4

    Teoria prawdopodobiestwa (take rachunek prawdopodobiestwa lub probabilistyka) dzia matematykizajmujcy si zdarzeniami losowymi. Zdarzenie losowe to wynik dowiadczenia losowego.

    Dowiadczenie losowe moe by powtarzane dowolnie wiele razy w warunkach identycznych lub bardzo zblionych a jego wynik nie daje si przewidzie jednoznacznie.

    Ll oznacza ile razy zaszo dane zdarzenie gdy dowiadczenie powtarzano n razy

    Prawidowo statystyczna przy coraz wikszej liczbie dowiadcze losowych czsto zdarzenia dy do pewnej staej liczby

  • Czy zajmuje si probabilistyka i statystyka?

    Statystyka zajmuje si metodami zbierania informacji(liczbowych) oraz ich analiz i interpretacj.

    Wstp do probabilistyki i statystyki. wykad 1 5

    Rachunek prawdopodobiestwa zajmuje si badaniem abstrakcyjnych poj matematycznych stworzonych do opisu zjawisk, ktre nie s deterministyczne:

    1. zmiennych losowych w przypadku pojedynczych zdarze oraz2. procesw stochastycznych w przypadku zdarze

    powtarzajcych si (w czasie). Jako matematyczny fundament statystyki, teoria

    prawdopodobiestwa odgrywa istotn rol w sytuacjach, w ktrych konieczna jest analiza duych zbiorw danych.

    Jednym z najwikszych osigni fizyki dwudziestego wieku byo odkrycie probabilistycznej natury zjawisk fizycznych w skali mikroskopowej, co zaowocowao powstaniem mechaniki kwantowej.

  • Rys historyczny

    Wstp do probabilistyki i statystyki. wykad 1 6

    Matematyczna teoria prawdopodobiestwa siga swoimi korzeniami do analizy gier losowych podjtej w siedemnastym wieku przez Pierre de Fermata oraz Blaise Pascala.

    Z tego powodu, pocztkowo teoria prawdopodobiestwa zajmowaa si niemal wycznie zjawiskami dyskretnymi i uywaa metod kombinatorycznych. Zmienne cigezostay wprowadzone do teorii prawdopodobiestwa znacznie pniej.

    Za pocztek stworzenia wspczesnej teorii prawdopodobiestwa powszechnie uwaa si jej aksjomatyzacj, ktrej w 1933 dokona Andriej Komogorow.

  • Rys historyczny

    Blaise Pascal (1601-1662)

    XVII w. , Pary, Francja

    Uniemiertelni kawalera de Mr oraz jego paradoks hazardowy prawdopodobiestwa wyrzucenia szstek na jednej i dwch kociach.

    Trjkt Pascala wykorzystywany przy potdze sumy

    Wstp do probabilistyki i statystyki. wykad 1 7

  • Pierre de Fermat (1601-1665)Pocztek XVII w., Touluse, Francja

    Bada waciwoci liczb pierwszych, teori liczb, rwnolegle opracowa metod wsprzdnych w geometrii. Razem z Pascalem stworzy podstawy pod wspczesny rachunek prawdopodobiestwa.

    Rys historyczny

    Wstp do probabilistyki i statystyki. wykad 1 8

  • Simon-Denis Poisson

    (1781-1840)

    XVIII-XIX w., Pary, Francja

    Przyjaciel Lagrange'a, ucze Laplace'a na sawnej colePolytechnique.

    Poza zagadnieniami mechaniczno -fizycznymi zajmowa si teori prawdopodobiestwa.

    Proces stochastyczny (podobnie jak pr. Markowa), rozkad Poissona - dystrybuanta!

    Rys historyczny

    Wstp do probabilistyki i statystyki. wykad 1 9

  • Carl Frederich Gauss (1777-1855)

    XVIII-XIX w., Getynga, Niemcy

    Profesor Universytetu w Getyndze

    Genialny matematyk, ktry ju w dziecistwie wyprzedza umiejtnociami rwienikw (w szkole podstawowej jako jedyny rozwiza zadanie nauczyciela -zsumowanie liczb 1 do 40 zauwaajc e jest to (40+1)*20)

    Rozkad normalny, zwany krzyw Gaussa

    Rys historyczny

    Wstp do probabilistyki i statystyki. wykad 1 10

  • Paradoks kawalera de Mr

    De Mr, zapalony gracz w koci, dokona obserwacji, e czciej wypada jedna szstka przy 4 rzutach jedn kostk ni dwie szstki przy 24 rzutach dwiema kostkami.

    Wg. (bdnej) logiki gracza:

    Na jednej kostce: 4 * 1/6 = 4/6Na dwch kostkach: 24 * 1/6 * 1/6 = 24/36 = 4/6

    Zdarzenia wydaj si mie takie samo prawdopodobiestwo, dlaczego zatem hazardzista obserwowa inny wynik?

    Wstp do probabilistyki i statystyki. wykad 1 11

  • Rozwizanie paradoksu de Mr

    0,51771296671

    651

    4

    =

    Prawidowo obliczone prawdopodobiestwo owych zdarze:

    a) wyrzucenie co najmniej jednej szstki przy 4 rzutach jedn kostk = 1 prawdopod. nie wyrzucenia adnej szstki przy 4 rzutach jedn kostk =

    b) wyrzucenie co najmniej raz dwch szstek przy 24 rzutach dwiema kostkami = 1- prawdopod. niewyrzucenia dwch szstek przy 24 rzutach 2 kostkami =

    0,491436351

    24

    Wstp do probabilistyki i statystyki. wykad 1 12

  • STATYSTYKA

    OPISOWA ANALIZA DANYCH(DESCRIPTIVE STATISTICS)

    Organizacja danychPodsumowanie danychPrezentacja danych

    DEDUKCYJNA MODELOWANIE STOCHASTYCZNE( STATISTICAL INFERENCE)

    Podaje metody formuowania wnioskw dotyczce obiektu bada (populacji generalnej) w oparciu o mniej liczny zbir (prb)

    GRAFICZNA NUMERYCZNA

    Wstp do probabilistyki i statystyki. wykad 1 13

  • Typy danych

    ILOCIOWE(QUANTITATIVE, NUMERICAL)

    Przykady:Zbir ludziWiekWzrostWysoko zarobkw

    Obliczenia pewnych parametrw, jak np. rednia arytmetryczna, mediana, ekstrema, maj sens

    JAKOCIOWE(QUALITATIVE, CATEGORIAL)

    Przykady:PeStan cywilny

    Mona przypisa rnym cechom arbitralne wartoci liczbowe.

    Obliczenia parametrw nie maj sensu, mona jedynie podawa np. udzia procentowy

    Wstp do probabilistyki i statystyki. wykad 1 14

  • Graficzna prezentacja danych

    Dane jakociowe mona prezentowa na wiele sposobw eby zobrazowa np. czsto wystpowania danej cechy

    x Ilo wystpie Czsto wzgldna

    1 3 3/23 = 0,1304

    2 5 5/23 = 0,2174

    3 10 10/23 = 0,4348

    4 4 4/23 = 0,1739

    5 1 1/23 = 0,0435

    Razem: 23 1,0000

    Wstp do probabilistyki i statystyki. wykad 1 15

  • Graficzna prezentacja danych

    Wstp do probabilistyki i statystyki. wykad 1 16

    13%

    22%

    44%

    17%

    4%

    Wykres koowy1 2 3 4 5

    1 0,13043478

    2 0,2173913

    3 0,43

    4 0,17391

    5 0,04347826

  • Graficzna prezentacja danych

    Wstp do probabilistyki i statystyki. wykad 1 17

    0

    0,05

    0,1

    0,15

    0,2

    0,25

    0,3

    0,35

    0,4

    0,45

    1 2 3 4 5

    Wykres kolumnowy

    Serie1

    1 0,13043478

    2 0,2173913

    3 0,43

    4 0,17391

    5 0,04347826

  • Dane ilociowe

    Wyniki 34 pomiarw (np. wielko ziaren w [nm], temperatura w kolejnych dniach o godz. 11:00 w [deg. C], czas rozmw telefonicznych w [min], itp.

    3,6 13,2 12 12,8 13,5 15,2 4,8

    12,3 9,1 16,6 15,3 11,7 6,2 9,4

    6,2 6,2 15,3 8 8,2 6,2 6,3

    12,1 8,4 14,5 16,6 19,3 15,3 19,2

    6,5 10,4 11,2 7,2 6,2 2,3

    Tak podane wartoci s mao czytelne!

    Wstp do probabilistyki i statystyki. wykad 1 18

  • Histogram

    Sporzdzenie wykresu (histogramu):1. Uporzdkowa zbir wg. rosncych (lub malejcych) wartoci

    program Excel ma tak opcj.

    2. Wyniki prby (o liczebnoci n) stanowi zbir n-liczb (niekoniecznie rnicych si od siebie). Celem ich ilustracji dzieli si je na klasy, tworzc tzn. szereg rozdzielczy.

    3. Szeroko poszczeglnych klas nie musi by taka sama, cho zwykle stosuje si klasy o tej samej szerokoci

    4. Ilo klas nie moe by zbyt maa ani te zbyt liczna. Najbardziej optymaln liczb klas 'k' okrela regua Sturge'a.

    Wstp do probabilistyki i statystyki. wykad 1 19

  • Histogram

    0 2 8 14 200

    2

    4

    6

    8

    10

    12

    14

    16

    3 klasy

    x

    Cz

    sto

    bezw

    gld

    na

    Wstp do probabilistyki i statystyki. wykad 1 20

  • Histogram

    0 2 3,5 5 6,5 8 9,5 11 12,5 14 15,5 17 18,5 200

    1

    2

    3

    4

    5

    6

    7

    8

    12 klas

    x

    Cz

    sto

    bezw

    zgl

    dna

    Wstp do probabilistyki i statystyki. wykad 1 21

  • Histogram

    0 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16 16,5 17 17,5 18 18,5 19 19,50

    1

    2

    3

    4

    5

    6

    7

    8

    35 klas

    x

    Cz

    sto

    bezw

    zgl

    dna

    Wstp do probabilistyki i statystyki. wykad 1 22

  • Regua Sturge'a

    k=1+3,3log10 n

    n=34k=5.59 6Dla naszego przykadu:

    Liczebno prbki, n Liczba klas, k< 50 5 7

    50 200 7 9200 500 9 10

    500 1000 10 -111000 5000 11 13

    5000 50000 13 1750000 < 17 20

    Wstp do probabilistyki i statystyki. wykad 1 23

  • Histogram optymalny

    0 2 5 8 11 14 17 200

    0,05

    0,1

    0,15

    0,2

    0,25

    0,3

    6 klas (optymalnie)

    x

    Cz

    sto

    wzg

    ldn

    a

    Wstp do probabilistyki i statystyki. wykad 1 24

  • Hazard

    Zdecydowana wikszo gier losowych opiera si na prawdopodobiestwie zdarzenia...

    ...oraz moe by pod tym ktem analizowana.

    Prawdopodobiestwo trafienia oczkaIlo unikatowych rozda w pokerze

    ...najprostszy,jak rzut monet, ...

    ...cakowicie losowy jak ruletka...

    ...zoony, jak rozdanie pokera...

    Wstp do probabilistyki i statystyki. wykad 1 25

  • Definicja klasyczna prawdopodobiestwa

    ( )

    ( ) 1=PNn=AP a

    Kademu zdarzeniu losowemu A przypisujemy liczb P(A), zwan prawdopodobiestwem tego zdarzenia, tak e 0 P(A) 1.

    (Kolmogorov, 1933)

    Prawdopodobiestwem zdarzenia A nazywamy stosunek liczby nazdarze sprzyjajcych zdarzeniu A do liczby wszystkich zdarze N

    Przy czym A jest podzbiorem tzw. zdarzenia pewnego .

    AWstp do probabilistyki i statystyki. wykad 1 26

  • Definicja klasyczna prawdopodobiestwa

    Prawdopodobiestwo sumy wzajemnie wykluczajcych si zdarze losowych A i B jest rwne sumie prawdopodobiestw tych zdarze

    (Kolmogorov, 1933)

    ( ) ( ) ( ) =BAgdzie,BP+AP=BAPczyli:

    Wstp do probabilistyki i statystyki. wykad 1 27

    A B

  • Przykad zdarzenia losowego

    Rzucamy monet dwa razy. Moliwe wyniki to: (o, o) wyrzucenie dwch orw (o, r) wyrzucenie ora, a potem reszki (r, o) wyrzucenie reszki, a potem ora (r, r) wyrzucenie dwch reszek

    Zatem zbir: E={(o, o); (o, r) ; (r, o); (r, r)} jest zbiorem zdarze elementarnych.

    Jeeli zbir zdarze elementarnych ma E ma n-elementw to zdarze losowych jest 2n

    Wstp do probabilistyki i statystyki. wykad 1 28

  • Przykad zdarzenia losowego

    W tej sytuacji moliwych jest 24 zdarze losowych.

    Niektre zdarzenia losowe, np.:

    A = {(o,o); (o,r); (r,o)} wyrzucenie co najmniej 1 oraB = {(o,o); (o,r);} - orze w pierwszym rzucieG = {(o,o);} - wyrzucenie dwch orwH = {(o,r); (r,o)} wyrzucenie dokadnie jednej reszki

    Wstp do probabilistyki i statystyki. wykad 1 29

  • Relacje zdarze

    Suma zdarze zachodzi co najmniej jedno ze zdarze A,B

    Iloczyn zdarze zachodzi zdarzenie A oraz zdarzenie B

    AB

    AB

    Wstp do probabilistyki i statystyki. wykad 1 30

    A B

    A BA A BAB

  • Relacje zdarze

    Zdarzenie przeciwne nie zachodzi zdarzenie A

    Zdarzenie A pociga zdarzenie B (operator: zbir A zawiera si w zbiorze B)

    Zdarzenia A i B wykluczajce si

    A'

    AB

    =BA

    Wstp do probabilistyki i statystyki. wykad 1 31

  • Rzut kostk

    Rzut kostk: wynik od 1 do 6 oczek.

    Prawdopodobiestwo wyrzucenia czterech oczek:

    1/6 (teoria)

    Wstp do probabilistyki i statystyki. wykad 1 32

  • Rzut koci

    Czsto zdarzenia zmierza do wartoci prawdopodobiestwa dopiero przy wielokrotnym powtrzeniu.

    3 rzuty:4, 5, 4

    (wyrzucenie 4: 2/3 >> 1/6)

    10 rzutw:4, 4, 5, 3, 2, 6, 1, 2 , 2, 4

    (wyrzucenie 4: 3/10 > 1/6)

    1000 rzutw:4,5,4,3,1,5,1,2,1,3,2,2,6,6,5,4,...

    (wyrzucenie 4: ~1/6)

    Wstp do probabilistyki i statystyki. wykad 1 33

  • Oglna (aksjomatyczna) definicja prawdopodobiestwa.

    Zakadamy, e zdarzenia losowe A i B s podzbiorami tego samego zbioru zdarze elementarnych E.

    Def. Jeli kademu zdarzeniu losowemu A przyporzdkowano liczb rzeczywist P(A) zwan prawdopodobiestwem zdarzenia A, w taki sposb, aby spenione byy nastpujce warunki:

    I

    II prawdopodobiestwo zdarzenia pewnego jest rwne 1P(E)=1

    III prawdopodobiestwo sumy dwch wykluczajcych si zdarze jest rwne sumie prawdopodobiestw tych zdarze

    to okrelon w ten sposb funkcj P nazywamy prawdopodobiestwem

    Wstp do probabilistyki i statystyki. wykad 1 34

    0 P(A) 1

    ( ) ( ) ( ) =BAgdzie,BP+AP=BAP

  • Prawdopodobiestwo warunkowe

    ( ) ( )( )BPBAP=B|AP

    Oglna definicja:

    Przy czym P(B) > 0 (tj. zdarzenie B musi by jakkolwiek prawdopodobne)

    Efektywnie, kade prawdopodobiestwo jest warunkowe: np. dla danych zdarze A i B:

    ( ) ( )( )

    ( ) ( )( )( ) 1

    0

    =BAPABBPAP=BAPBA

    =BAP=BA

    AP=AP

    Wstp do probabilistyki i statystyki. wykad 1 35

  • Kostka przykad 1

    Rzucamy trzema kostkami 6-cio-ciennymi. Wiemy, e na kadej kostce wypada inna liczba oczek. Jakie jest prawdopodobiestwo e na jednej kostce wypado 5 pod warunkiem e na kadej kostce wypada inna liczba?

    ( )

    ( )

    ( ) ( )( ) =

    BPBAP=B|AP

    =BP

    =BAP

    456345

    456

    345

    Wstp do probabilistyki i statystyki. wykad 1 36

  • Telekomunikacja

    Obcienie sieci telekomunikacyjnej w cigu dnia:przesyanie danych w Internecieilo wykonanych pocze telefonicznych

    (rdo: http://rrdtool.cs.pu.edu.tw/gallery/index.en.html)Wstp do probabilistyki i statystyki. wykad 1 37

  • Epidemiologia

    Statystyka umoliwia analiz i modelowanie rozwoju chorb oraz pomaga zapobiega epidemiom.

    Statystyka medyczna, np. rednia liczba zachorowa w regionie

    Statystyka spoeczna, np. gsto zaludnienia

    Statystyka gospodarcza, np. PKB, wydatki na opiek zdrowotn

    Liczba zachorowa na wisk gryp w roku 2009 w USA(rdo: http://commons.wikimedia.org)

    Wstp do probabilistyki i statystyki. wykad 1 38

  • Meteorologia

    Modele pogodowe umoliwiajce przewidywanie pogody oraz wykrywanie potencjalnych kataklizmw, np. huraganw

    (rdo:stormdebris.net/Math_Forecasting.html)

    Wstp do probabilistyki i statystyki. wykad 1 39