24
Rozkłady statystyk z próby Statystyka

Rozkłady statystyk z próby - SGGWkgohz.sggw.pl/wp-content/uploads/2013/09/statystyka_4...statystyka 2 ( 1) 2 N S zawierająca wariancję z próby i populacji ma rozkład chi-kwadrat

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • Rozkłady statystyk z próby

    Statystyka

  • Rozkłady statystyk z próby

    Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg N zmiennych losowych (X1, X2,...... XN) niezależnych i mających ten sam rozkład jak rozkład zmiennej losowej w populacji.

    Statystyką z próby nazywamy zmienną losową (np. ZN), będącą funkcją zmiennych X1, X2,...... XN. Statystykami z próby są, na przykład, średnia arytmetyczna, wariancja oraz inne parametry.

    Rozkład statystyki z próby zależy od rozkładu zmiennych losowych X1, X2,...... XN i wielkości próby.

  • Rozkłady statystyk z próby

    x

    Próba

    Parametr

    Populacja

    średnia arytmetyczna –wartość oczekiwana EX ; m

    wariancja

    D2X ; ²

    S

    odchylenie standardowe

    DX ;

    w

    częstość empiryczna - prawdopodobieństwo

    p

  • Rozkłady statystyk z próby

    Jeżeli znany jest rozkład statystyki z próby to na tej podstawie można szacować wartości nieznanych parametrów populacji. Znajomość rozkładów statystyk z próby jest zatem niezbędna we wnioskowaniu statystycznym.

    Rozkłady statystyk z próby, w których parametrem jest liczba stopni swobody (zależna od liczebności próby) nazywane są dokładnymi i są wykorzystywane w przypadku małych prób.

    Jeżeli znalezienie dokładnego rozkładu statystyki nie jest możliwe, wykorzystywane są rozkłady graniczne statystyk , ale wtedy wymagana jest duża próba.

  • Średnia - wartość oczekiwana

    X~N(m,) – znana

    a po standaryzacji wyrażenie

    ),(~N

    mNxN

    )1,0(~ NNmxN

  • Średnia - wartość oczekiwana

    X~N(m,) - nie znana

    )1(~

    NtNS

    mxN

    ma rozkład t-Studenta z lss (v) = (N 1)

  • Rozkład t-Studenta

    0Et 31

    2

    2

    N

    NtD

    0

    0,05

    0,1

    0,15

    0,2

    0,25

    -4 -3 -2 -1 0 1 2 3 4

    2

    12

    2

    2

    1

    1)(

    v

    v

    v

    v

    t

    Ntf

    0

    11 0 dla )( xdtetx x

  • Rozkład t-Studenta

    ½α=0,025 ½α=0,025

    F(t=2,447)=0,975

  • Średnia - wartość oczekiwana

    Jeżeli zmienna ma dowolny rozkład to na mocy centralnego twierdzenia granicznego, dla dużych prób:

    ),(~N

    DXEXNxN

  • różnica średnich – różnica wartości oczekiwanych

    Jeśli X1~N(m1,1) oraz X2~N(m2,2) i znane są odchylenia standardowe obu rozkładów to różnica średnich prób ma

    rozkład normalny:

    a po standaryzacji

    2

    22

    1

    21

    2121 ;~NN

    mmNxx

    )1;0(~)()(

    2

    22

    1

    21

    2121 N

    NN

    mmxx

  • Jeśli X1~N(m1,1) oraz X2~N(m2,2) - odchylenia standardowe są nieznane, to wyrażenie zawierające różnicę średnich dwóch prób ma rozkład t-Studenta z liczbą st. swobody = N1 +N2 2

    )2(~)()(

    212121

    21

    NNtS

    mmxx

    xx

    2121

    2

    22

    2

    11 11

    2

    )1()1(21 NNNN

    SNSNS xx

    różnica średnich – różnica wartości oczekiwanych

  • Jeśli zmienne X1 oraz X2 są zmiennymi losowymi o dowolnym rozkładzie to na mocy centralnego twierdzenia granicznego dla dużych prób rozkład różnicy dwóch

    średnich arytmetycznych jest rozkładem normalnym:

    2

    2

    2

    1

    2

    12121 ;~

    N

    S

    N

    SEXEXNxx

    różnica średnich – różnica wartości oczekiwanych

  • Przykład Wysokość w kłębie koni rasy śląskiej ma rozkład normalny X1~N(170 ; 5), a koni wielkopolskich X2~N(168 ; 4). Obliczyć prawdopodobieństwo, że średnia arytmetyczna 9 elementowej próby wylosowanej z populacji koni śląskich jest większa o co najmniej 1 cm od średniej 16 elementowej próby wylosowanej z populacji koni wielkopolskich.

    Poszukujemy: )1()1( 2121 xxPxxP

    2168170)( 2121 xxE

    944,19

    3416

    16

    9

    25)(

    2

    22

    1

    12

    21 NN

    xxD

    6964,0)514,0())514,0(1(1

    )514,0(1)944,1

    21(1)1(1)1( 2121

    UFUF

    UFUFxxFxxP

  • Wariancja w próbie – wariancja w populacji

    Jeżeli zmienna losowa X ma rozkład normalny (X~N(m, )), to dla dowolnej N-elementowej próby poniższa statystyka ma rozkład Chi-kwadrat Pearson’a

    )1(~)1( 22

    2

    NSN

  • Rozkład chi-kwadrat

    E² = D²²= 2

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0,7

    0,8

    0,9

    1

    0 5 10 15 20 25

    =4

  • Przykład Mierząc długość skór lisów zakłada się, że błąd pomiaru ma rozkład normalny N(µ=0 ; =0,5 cm). Obliczyć, jaka jest szansa, że wariancja w próbie złożonej z danych o długości dziesięciu skór nie przekroczy 0,15 cm2.

    statystyka 2

    2)1(

    SN zawierająca wariancję z próby i populacji

    ma rozkład chi-kwadrat o 9 stopniach swobody

    2,0)40,5()40,5(25,0

    15,09)1()15,0( 2 1

    2

    12

    22

    NN FP

    SNPSP

  • odchylenie standardowe w próbie i w populacji

    Jeśli zmienna losowa X ma rozkład normalny (X~N(m,)) oraz próba jest duża, (licząca co najmniej 120 elementów), to odchylenie standardowe tej próby będzie miało rozkład normalny: Dla nieznanego odchylenia standardowego populacji stosuje się przybliżenie:

    )2

    ;(~N

    NS

    )2

    ;(~N

    SNS

  • Iloraz wariancji dwóch prób i iloraz wariancji dwóch populacji

    Jeśli zmienna losowa X1~N(m1,1) oraz zmienna losowa X2~N(m2,2) to iloraz wariancji dwóch prób o liczebnościach N1 i N2 pobranych z dwóch populacji ma rozkład F –Snedecora,

    )1;1(~ 221121

    2

    2

    2

    2

    2

    1

    2

    2

    2

    2

    2

    1

    2

    1

    NNFS

    S

    S

    S

  • Rozkład F - Snedecora

    1=4 v2=14

    22

    2

    EF

    )4()2(

    )2(2

    2

    2

    21

    21

    2

    22

    FD

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0,7

    0,8

    0 1 2 3 4 5 6 7 8

  • Przykład Wysokość w kłębie w populacji koni rasy śląskiej jest zmienną losową o

    rozkładzie normalnym X1~N(170;5), a w populacji koni wielkopolskich X2~N(168;4,47). Obliczyć prawdopodobieństwo, że wariancja 9-elementowej próby wylosowanej z populacji koni śląskich jest co najmniej pięciokrotnie większa niż wariancja 16-elementowej próby koni wielkopolskich

    01,0)996,3(25

    981,19555

    2

    1

    2

    2

    2

    1

    2

    2

    2

    2

    2

    1

    2

    2

    2

    1

    FPFP

    S

    SP

    S

    SP

  • Częstość empiryczna – prawdopodobieństwo

    Jeżeli próba jest duża (co najmniej 100-120 elementów) i obserwujemy w niej cechę o rozkładzie dwupunktowym, to częstość empiryczna sukcesu

    na mocy omówionych twierdzeń granicznych, będzie miała rozkład normalny:

    a po standaryzacji:

    N

    mw

    N

    wwpNw

    )1(;~

    )1;0(~)1(

    N

    N

    ww

    pw

  • różnica częstości empirycznych – różnica

    prawdopodobieństw

    Jeżeli próby pochodzące z dwóch populacji są duże (co najmniej 100-120 elementów w każdej) i w każdej populacji obserwujemy tę samą cechę o rozkładzie dwupunktowym, to różnica częstości empirycznych sukcesów (w1-w2), na mocy omówionych twierdzeń granicznych, będzie miała rozkład normalny:

    21

    21

    21

    2121 gdzie 11

    )1(;~NN

    mmw

    NNwwppNww

  • Przykład Wiadomo, że prawdopodobieństwo pojawienia się albinosa w populacji

    jest równe 0,06. Jaka jest szansa, aby wśród 200 młodych urodzonych na fermie pojawiło się co najmniej 15 albinosów.

    1859,08141,01)893,0()()893,0(

    200

    94,006,0

    06,0075,0

    )1(

    075,0

    )1()075,0(

    UFUFUP

    UP

    N

    pp

    p

    N

    pp

    pwPwP

  • Bison bison