Rozkłady statystyk z próby - SGGWkgohz.sggw.pl/wp-content/uploads/2013/09/statystyka_4...statystyka 2 ( 1) 2 N S zawierająca wariancję z próby i populacji ma rozkład chi-kwadrat

Rozkłady statystyk z próby

Statystyka


Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg N zmiennych losowych (X1, X2,...... XN) niezależnych i mających ten sam rozkład jak rozkład zmiennej losowej w populacji.

Statystyką z próby nazywamy zmienną losową (np. ZN), będącą funkcją zmiennych X1, X2,...... XN. Statystykami z próby są, na przykład, średnia arytmetyczna, wariancja oraz inne parametry.

Rozkład statystyki z próby zależy od rozkładu zmiennych losowych X1, X2,...... XN i wielkości próby.


x

Próba

Parametr

Populacja

średnia arytmetyczna –wartość oczekiwana EX ; m

S²

wariancja

D2X ; ²

S

odchylenie standardowe

DX ;

w

częstość empiryczna - prawdopodobieństwo

p


Jeżeli znany jest rozkład statystyki z próby to na tej podstawie można szacować wartości nieznanych parametrów populacji. Znajomość rozkładów statystyk z próby jest zatem niezbędna we wnioskowaniu statystycznym.

Rozkłady statystyk z próby, w których parametrem jest liczba stopni swobody (zależna od liczebności próby) nazywane są dokładnymi i są wykorzystywane w przypadku małych prób.

Jeżeli znalezienie dokładnego rozkładu statystyki nie jest możliwe, wykorzystywane są rozkłady graniczne statystyk , ale wtedy wymagana jest duża próba.

Średnia - wartość oczekiwana

X~N(m,) – znana

a po standaryzacji wyrażenie

),(~N

mNxN

)1,0(~ NNmxN


X~N(m,) - nie znana

)1(~

NtNS

mxN

ma rozkład t-Studenta z lss (v) = (N 1)

Rozkład t-Studenta

0Et 31

2

2

N

NtD

0

0,05

0,1

0,15

0,2

0,25

-4 -3 -2 -1 0 1 2 3 4

2

12

2

2

1

1)(

v

v

v

v

t

Ntf

0

11 0 dla )( xdtetx x

Rozkład t-Studenta

½α=0,025 ½α=0,025

F(t=2,447)=0,975


Jeżeli zmienna ma dowolny rozkład to na mocy centralnego twierdzenia granicznego, dla dużych prób:

),(~N

DXEXNxN

różnica średnich – różnica wartości oczekiwanych

Jeśli X1~N(m1,1) oraz X2~N(m2,2) i znane są odchylenia standardowe obu rozkładów to różnica średnich prób ma

rozkład normalny:

a po standaryzacji

2

22

1

21

2121 ;~NN

mmNxx

)1;0(~)()(

2

22

1

21

2121 N

NN

mmxx

Jeśli X1~N(m1,1) oraz X2~N(m2,2) - odchylenia standardowe są nieznane, to wyrażenie zawierające różnicę średnich dwóch prób ma rozkład t-Studenta z liczbą st. swobody = N1 +N2 2

)2(~)()(

212121

21

NNtS

mmxx

xx

2121

2

22

2

11 11

2

)1()1(21 NNNN

SNSNS xx


Jeśli zmienne X1 oraz X2 są zmiennymi losowymi o dowolnym rozkładzie to na mocy centralnego twierdzenia granicznego dla dużych prób rozkład różnicy dwóch

średnich arytmetycznych jest rozkładem normalnym:

2

2

2

1

2

12121 ;~

N

S

N

SEXEXNxx


Przykład Wysokość w kłębie koni rasy śląskiej ma rozkład normalny X1~N(170 ; 5), a koni wielkopolskich X2~N(168 ; 4). Obliczyć prawdopodobieństwo, że średnia arytmetyczna 9 elementowej próby wylosowanej z populacji koni śląskich jest większa o co najmniej 1 cm od średniej 16 elementowej próby wylosowanej z populacji koni wielkopolskich.

Poszukujemy: )1()1( 2121 xxPxxP

2168170)( 2121 xxE

944,19

3416

16

9

25)(

2

22

1

12

21 NN

xxD

6964,0)514,0())514,0(1(1

)514,0(1)944,1

21(1)1(1)1( 2121

UFUF

UFUFxxFxxP

Wariancja w próbie – wariancja w populacji

Jeżeli zmienna losowa X ma rozkład normalny (X~N(m, )), to dla dowolnej N-elementowej próby poniższa statystyka ma rozkład Chi-kwadrat Pearson’a

)1(~)1( 22

2

NSN

Rozkład chi-kwadrat

E² = D²²= 2

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 5 10 15 20 25

=4

Przykład Mierząc długość skór lisów zakłada się, że błąd pomiaru ma rozkład normalny N(µ=0 ; =0,5 cm). Obliczyć, jaka jest szansa, że wariancja w próbie złożonej z danych o długości dziesięciu skór nie przekroczy 0,15 cm2.

statystyka 2

2)1(

SN zawierająca wariancję z próby i populacji

ma rozkład chi-kwadrat o 9 stopniach swobody

2,0)40,5()40,5(25,0

15,09)1()15,0( 2 1

2

12

22

NN FP

SNPSP

odchylenie standardowe w próbie i w populacji

Jeśli zmienna losowa X ma rozkład normalny (X~N(m,)) oraz próba jest duża, (licząca co najmniej 120 elementów), to odchylenie standardowe tej próby będzie miało rozkład normalny: Dla nieznanego odchylenia standardowego populacji stosuje się przybliżenie:

)2

;(~N

NS

)2

;(~N

SNS

Iloraz wariancji dwóch prób i iloraz wariancji dwóch populacji

Jeśli zmienna losowa X1~N(m1,1) oraz zmienna losowa X2~N(m2,2) to iloraz wariancji dwóch prób o liczebnościach N1 i N2 pobranych z dwóch populacji ma rozkład F –Snedecora,

)1;1(~ 221121

2

2

2

2

2

1

2

2

2

2

2

1

2

1

NNFS

S

S

S

Rozkład F - Snedecora

1=4 v2=14

22

2

EF

)4()2(

)2(2

2

2

21

21

2

22

FD

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0 1 2 3 4 5 6 7 8

Przykład Wysokość w kłębie w populacji koni rasy śląskiej jest zmienną losową o

rozkładzie normalnym X1~N(170;5), a w populacji koni wielkopolskich X2~N(168;4,47). Obliczyć prawdopodobieństwo, że wariancja 9-elementowej próby wylosowanej z populacji koni śląskich jest co najmniej pięciokrotnie większa niż wariancja 16-elementowej próby koni wielkopolskich

01,0)996,3(25

981,19555

2

1

2

2

2

1

2

2

2

2

2

1

2

2

2

1

FPFP

S

SP

S

SP

Częstość empiryczna – prawdopodobieństwo

Jeżeli próba jest duża (co najmniej 100-120 elementów) i obserwujemy w niej cechę o rozkładzie dwupunktowym, to częstość empiryczna sukcesu

na mocy omówionych twierdzeń granicznych, będzie miała rozkład normalny:

a po standaryzacji:

N

mw

N

wwpNw

)1(;~

)1;0(~)1(

N

N

ww

pw

różnica częstości empirycznych – różnica

prawdopodobieństw

Jeżeli próby pochodzące z dwóch populacji są duże (co najmniej 100-120 elementów w każdej) i w każdej populacji obserwujemy tę samą cechę o rozkładzie dwupunktowym, to różnica częstości empirycznych sukcesów (w1-w2), na mocy omówionych twierdzeń granicznych, będzie miała rozkład normalny:

21

21

21

2121 gdzie 11

)1(;~NN

mmw

NNwwppNww

Przykład Wiadomo, że prawdopodobieństwo pojawienia się albinosa w populacji

jest równe 0,06. Jaka jest szansa, aby wśród 200 młodych urodzonych na fermie pojawiło się co najmniej 15 albinosów.

1859,08141,01)893,0()()893,0(

200

94,006,0

06,0075,0

)1(

075,0

)1()075,0(

UFUFUP

UP

N

pp

p

N

pp

pwPwP

Bison bison

Documents

Rozkłady statystyk z próby - SGGWkgohz.sggw.pl/wp-content/uploads/2013/09/statystyka_4...statystyka 2 ( 1) 2 N S zawierająca wariancję z próby i populacji ma rozkład chi-kwadrat