Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Rozkłady statystyk z próby
Statystyka
Rozkłady statystyk z próby
Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg N zmiennych losowych (X1, X2,...... XN) niezależnych i mających ten sam rozkład jak rozkład zmiennej losowej w populacji.
Statystyką z próby nazywamy zmienną losową (np. ZN), będącą funkcją zmiennych X1, X2,...... XN. Statystykami z próby są, na przykład, średnia arytmetyczna, wariancja oraz inne parametry.
Rozkład statystyki z próby zależy od rozkładu zmiennych losowych X1, X2,...... XN i wielkości próby.
Rozkłady statystyk z próby
x
Próba
Parametr
Populacja
średnia arytmetyczna –wartość oczekiwana EX ; m
S²
wariancja
D2X ; ²
S
odchylenie standardowe
DX ;
w
częstość empiryczna - prawdopodobieństwo
p
Rozkłady statystyk z próby
Jeżeli znany jest rozkład statystyki z próby to na tej podstawie można szacować wartości nieznanych parametrów populacji. Znajomość rozkładów statystyk z próby jest zatem niezbędna we wnioskowaniu statystycznym.
Rozkłady statystyk z próby, w których parametrem jest liczba stopni swobody (zależna od liczebności próby) nazywane są dokładnymi i są wykorzystywane w przypadku małych prób.
Jeżeli znalezienie dokładnego rozkładu statystyki nie jest możliwe, wykorzystywane są rozkłady graniczne statystyk , ale wtedy wymagana jest duża próba.
Średnia - wartość oczekiwana
X~N(m,) – znana
a po standaryzacji wyrażenie
),(~N
mNxN
)1,0(~ NNmxN
Średnia - wartość oczekiwana
X~N(m,) - nie znana
)1(~
NtNS
mxN
ma rozkład t-Studenta z lss (v) = (N 1)
Rozkład t-Studenta
0Et 31
2
2
N
NtD
0
0,05
0,1
0,15
0,2
0,25
-4 -3 -2 -1 0 1 2 3 4
2
12
2
2
1
1)(
v
v
v
v
t
Ntf
0
11 0 dla )( xdtetx x
Rozkład t-Studenta
½α=0,025 ½α=0,025
F(t=2,447)=0,975
Średnia - wartość oczekiwana
Jeżeli zmienna ma dowolny rozkład to na mocy centralnego twierdzenia granicznego, dla dużych prób:
),(~N
DXEXNxN
różnica średnich – różnica wartości oczekiwanych
Jeśli X1~N(m1,1) oraz X2~N(m2,2) i znane są odchylenia standardowe obu rozkładów to różnica średnich prób ma
rozkład normalny:
a po standaryzacji
2
22
1
21
2121 ;~NN
mmNxx
)1;0(~)()(
2
22
1
21
2121 N
NN
mmxx
Jeśli X1~N(m1,1) oraz X2~N(m2,2) - odchylenia standardowe są nieznane, to wyrażenie zawierające różnicę średnich dwóch prób ma rozkład t-Studenta z liczbą st. swobody = N1 +N2 2
)2(~)()(
212121
21
NNtS
mmxx
xx
2121
2
22
2
11 11
2
)1()1(21 NNNN
SNSNS xx
różnica średnich – różnica wartości oczekiwanych
Jeśli zmienne X1 oraz X2 są zmiennymi losowymi o dowolnym rozkładzie to na mocy centralnego twierdzenia granicznego dla dużych prób rozkład różnicy dwóch
średnich arytmetycznych jest rozkładem normalnym:
2
2
2
1
2
12121 ;~
N
S
N
SEXEXNxx
różnica średnich – różnica wartości oczekiwanych
Przykład Wysokość w kłębie koni rasy śląskiej ma rozkład normalny X1~N(170 ; 5), a koni wielkopolskich X2~N(168 ; 4). Obliczyć prawdopodobieństwo, że średnia arytmetyczna 9 elementowej próby wylosowanej z populacji koni śląskich jest większa o co najmniej 1 cm od średniej 16 elementowej próby wylosowanej z populacji koni wielkopolskich.
Poszukujemy: )1()1( 2121 xxPxxP
2168170)( 2121 xxE
944,19
3416
16
9
25)(
2
22
1
12
21 NN
xxD
6964,0)514,0())514,0(1(1
)514,0(1)944,1
21(1)1(1)1( 2121
UFUF
UFUFxxFxxP
Wariancja w próbie – wariancja w populacji
Jeżeli zmienna losowa X ma rozkład normalny (X~N(m, )), to dla dowolnej N-elementowej próby poniższa statystyka ma rozkład Chi-kwadrat Pearson’a
)1(~)1( 22
2
NSN
Rozkład chi-kwadrat
E² = D²²= 2
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 5 10 15 20 25
=4
Przykład Mierząc długość skór lisów zakłada się, że błąd pomiaru ma rozkład normalny N(µ=0 ; =0,5 cm). Obliczyć, jaka jest szansa, że wariancja w próbie złożonej z danych o długości dziesięciu skór nie przekroczy 0,15 cm2.
statystyka 2
2)1(
SN zawierająca wariancję z próby i populacji
ma rozkład chi-kwadrat o 9 stopniach swobody
2,0)40,5()40,5(25,0
15,09)1()15,0( 2 1
2
12
22
NN FP
SNPSP
odchylenie standardowe w próbie i w populacji
Jeśli zmienna losowa X ma rozkład normalny (X~N(m,)) oraz próba jest duża, (licząca co najmniej 120 elementów), to odchylenie standardowe tej próby będzie miało rozkład normalny: Dla nieznanego odchylenia standardowego populacji stosuje się przybliżenie:
)2
;(~N
NS
)2
;(~N
SNS
Iloraz wariancji dwóch prób i iloraz wariancji dwóch populacji
Jeśli zmienna losowa X1~N(m1,1) oraz zmienna losowa X2~N(m2,2) to iloraz wariancji dwóch prób o liczebnościach N1 i N2 pobranych z dwóch populacji ma rozkład F –Snedecora,
)1;1(~ 221121
2
2
2
2
2
1
2
2
2
2
2
1
2
1
NNFS
S
S
S
Rozkład F - Snedecora
1=4 v2=14
22
2
EF
)4()2(
)2(2
2
2
21
21
2
22
FD
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0 1 2 3 4 5 6 7 8
Przykład Wysokość w kłębie w populacji koni rasy śląskiej jest zmienną losową o
rozkładzie normalnym X1~N(170;5), a w populacji koni wielkopolskich X2~N(168;4,47). Obliczyć prawdopodobieństwo, że wariancja 9-elementowej próby wylosowanej z populacji koni śląskich jest co najmniej pięciokrotnie większa niż wariancja 16-elementowej próby koni wielkopolskich
01,0)996,3(25
981,19555
2
1
2
2
2
1
2
2
2
2
2
1
2
2
2
1
FPFP
S
SP
S
SP
Częstość empiryczna – prawdopodobieństwo
Jeżeli próba jest duża (co najmniej 100-120 elementów) i obserwujemy w niej cechę o rozkładzie dwupunktowym, to częstość empiryczna sukcesu
na mocy omówionych twierdzeń granicznych, będzie miała rozkład normalny:
a po standaryzacji:
N
mw
N
wwpNw
)1(;~
)1;0(~)1(
N
N
ww
pw
różnica częstości empirycznych – różnica
prawdopodobieństw
Jeżeli próby pochodzące z dwóch populacji są duże (co najmniej 100-120 elementów w każdej) i w każdej populacji obserwujemy tę samą cechę o rozkładzie dwupunktowym, to różnica częstości empirycznych sukcesów (w1-w2), na mocy omówionych twierdzeń granicznych, będzie miała rozkład normalny:
21
21
21
2121 gdzie 11
)1(;~NN
mmw
NNwwppNww
Przykład Wiadomo, że prawdopodobieństwo pojawienia się albinosa w populacji
jest równe 0,06. Jaka jest szansa, aby wśród 200 młodych urodzonych na fermie pojawiło się co najmniej 15 albinosów.
1859,08141,01)893,0()()893,0(
200
94,006,0
06,0075,0
)1(
075,0
)1()075,0(
UFUFUP
UP
N
pp
p
N
pp
pwPwP
Bison bison