wyklad stat 10 - AGH University of Science and Technologyhome.agh.edu.pl/~mariuszp/wfiis_stat/wyklad_stat_10.pdf · M. Przybycie ń Rachunek prawdopodobie ństwa i statystyka Wykład

M. Przybycień Rachunek prawdopodobieństwa i statystyka Wykład 10-2

Funkcja wiarogodnościDefinicja: Niech będzie dana próba losowa prosta o liczebności n z rozkładu f (x; θ).Funkcją wiarogodności dla próby xi nazywamy wielkość:

( ) ( ); ;n ii

x f x=

θ = θ∏L �1

Twierdzenie (Cramera-Rao): Minimalna wartość wariancji Vmin dowolnego nieobciążonego estymatora parametru θ dana jest przez:

[ ] [ ] ( )( )minˆ ˆ ln ,L x − ∂ θ ≥ θ = θ ∂θ 12

V V E�

Uwaga: Funkcja wiarogodności to nie to samo co łączna gęstość p-twa ( );L x θ�

( )ln ,L x− ∂= − θ ∂θ 12

2E�

Ponieważ:

( ) ( ) ( ) ( )ln ; ln ;; ;L x L xL x dx L x dx2• • 2

2-• -•

∂ θ ∂ θθ = − θ ∂θ ∂θ∫ ∫� �

� � � �

( ) ( ) ( ) ( )ln ; ln ;; ;L x L xL x dx L x dx• •

-• -•

∂ θ ∂ θθ = ⇒ = θ = ∂θ ∂θ ∫ ∫� �

� � � �

E1 0


Twierdzenie Cramera-RaoEstymator o minimalnej wariancji nazywamy efektywnym (najefektywiejszym)Efektywnością estymatora nazywamy stosunek jego wariancji do Vmin.W przypadku n parametrów rozkładu nierówność Cramera-Rao ma charakter macierzowy, a minimalna wariancja wynosi:

( , ..., )nθ = θ θ�

1

( ) ( ) ( )min ln ,ˆV ln , ln ,i j i j

L xL x L x

-1-1 ∂ θ ∂ ∂ θ = θ θ = − ∂θ ∂θ ∂θ ∂θ

�

�

� � �

� �

2E E

Twierdzenie Cramera-Rao stwierdza, że V – Vmin gdzie jest macierzą dodatnio półokreśloną, w szczególności

( )ˆ ˆV cov ,ij i j= θ θ[ ]minˆ Vi ii θ ≥ V

Uwaga: Często wykorzystujemy Vmin jako przybliżenie macierzy kowariancji wstawiając w drugich pochodnych zamiast parametru jego estymatę.


Metoda największej wiarogodnościZasada największej wiarogodności: za estymatę nieznanego parametru θ powinniśmy wybrać taką liczbę dla której funkcja wiarogodności osiąga maksimum:

ˆ( ; ) maxx θ =�L

θ̂

Często stosujemy następujące równanie do znalezienia estymaty MNW:przy warunku

ˆ

ln ( ; ) ln ( ; ) ln ( ; )n n

i ii i

x f x f x= = θ=θ

∂ ∂ ∂θ = θ = θ


Metoda największej wiarogodnościJeśli oszacowana wartość parametru jest bliska wartości prawdziwej, to oczekujemydużego p-twa otrzymania z eksperymentu danych takich jakie rzeczywiście uzyskaliśmy.

Wygenerowanych 50 przypadków z rozkładu normalnego o µ = 0.2 i σ = 0.1Wyniki otrzymane z maksymalizacji funkcji wiarogodności orazˆ ˆ0.204 0.106µ = σ =

W przypadku estymat parametrów bardzo odbiegających od wartości prawdziwychotrzymujemy znacznie mniejsze wartości funkcji wiarogodności.

Odstępstwa od wartości prawdziwych są miarą błędów statystycznych.


Własności estymatorów MNWPrzykład: Wyznaczenie estymatora parametrów τ i λ rozkładu wykładniczego.

ln ˆtˆ tt

n n

i i ni i

ii

n n nt= =

=

∂ = − ⇒ − = ⇒ λ = =∂λ λ λ∑ ∑ ∑L

1 1

1

10

( ; ) exp ln lnn n

ii

i i

tt n t

= =

λ = − ⇒ = − τ − τ τ τ ∏ ∑1 11 1

L L

ln ˆt t tˆ ˆ

n n n

i i ii i i

n ntn2 2

= = =

∂ = − + ⇒ − + = ⇒ τ = =∂τ τ ττ τ∑ ∑ ∑1 1 11 1 10L

( )( ; ) exp ln lnn ni ii i

t t n t= =

λ = λ −λ ⇒ = λ − λ∏ ∑L L1 1

Podobnie wyznaczamy estymator parametru λ:

Widać, że estymator jest niezmienniczy względem transformacji α(ξ) = 1/ξ

∂ ∂ ∂α ∂= = ⇒ =∂θ ∂α ∂θ ∂α0 0L L L

Jest to ogólna cecha estymatorów MNW, tzn. jeśli znamy estymator parametru θa interesuje nas funkcja tego parametru α(θ) to przy założeniu, że ∂α/∂θ≠0 mamy


Szacowanie błędów estymatorów MNW

[ ] ( )( ) ( )ˆ ˆ ˆ ;x L x dxθ = θ − θ θ∫ 2V � � �Wariancja estymatora największej wiarogodności:

Przykład: nieobciążony estymator parametru τi tylko asymptotycznie nieobciążony estymator parametru λ: [ ]ˆ n

nλ λ−= 1E

[ ]τ̂ = τE

Ponieważ w ogólności (z wyjątkiem przekształcenia liniowego), wiec oczekujemy, że estymatory MNW są z reguły obciążone.

( ) [ ]( )ˆ ˆ α θ ≠ α θ E E

W przypadku k parametrów musimy znaleźć macierz kowariancji:( )( ) ( )( ) ( )ˆ ˆ ˆ ˆ ˆ ˆ, ;i j i i j jx x L x dx θ θ = θ − θ θ − θ θ ∫V ��

W ten sposób można wyznaczyć wariancję estymatora tylko w prostych przypadkach. Najczęściej powyższe całki są trudne/niemożliwe do rozwiązania analitycznie i musimy stosować bądź przybliżenia, bądź metodę Monte Carlo.

Wariancja przyjmuje postać funkcji ocenianego parametru. Aby uzyskać wartość liczbową musimy wstawić jego estymatę ( a więc jest to przybliżenie).


Szacowanie błędów estymatorów MNWPrzykład: Wariancja estymatora parametru rozkładu wykładniczego:[ ]

( )

ˆ exp

exp exp exp

n nj

ii j

n n n n nj j j

i ini j i j j

nn

tt dt

n

t t tt dt t dt dt

n n

n n nn n

= =

= = = = =

−

τ = − τ − = τ τ = − − τ − + τ − = τ τ τ τ

= τ τ + − τ τ ττ

∑ ∏∫∑ ∏ ∑ ∏ ∏∫ ∫ ∫

2•

1 10

2• • •2

1 1 1 1 10 0 0

3 1 2 22 2

1 1

1 1 12

1 1 12 1

V��

� � �

n n nnn n

− −τ τ − τ τ + τ τ = 2

2 2 1 22

W przypadku dużej próbki danych możemy znaleźć estymator wariancji estymatora parametru MNW korzystając z warunku nierówności Cramera-Rao:

[ ]ˆ

lnˆ ˆ−

θ=θ

∂θ = − ∂θ 1

2

2L

V

lub w przypadku większej liczby parametrów:

ˆ

lnˆ ˆ ˆ,i ji j

−

θ=θ

∂ θ θ = − ∂θ ∂θ

12

LV

� �


Zachowanie asymptotyczne �(θ)

Funkcja wiarogodności jako funkcja parametru θ ma w okolicach maksimum w przybliżeniu kształt rozkładu Gaussa.

[ ]ˆ

ˆlnˆ ˆn

−

λ=λ

∂ λλ = − = ∂λ 1

2 2

2L

V�

Uwaga: Estymatory metody największej wiarogodności są zgodne.Zachowanie funkcji wiarogodności jako funkcji parametru θ w okolicach wartości tego parametru określone jego estymatą MNW:

( ) ( ) ( ) ( ) ( )( )ˆ ˆ

ln lnˆ ˆ ˆ ˆln lnθ=θ θ=θ

∂ ∂θ = θ + θ− θ + θ− θ + θ− θ∂θ ∂θ2 2 3

212

L LL L O

lnmax

L

��

0=��

Przykład: Estymator wariancji estymatora parametru rozkładu wykładniczego.[ ]

ˆ

ˆlnˆ ˆn

−

τ=τ

∂ ττ = − = ∂τ 1

2 2

2L

V�

( ) ( )[ ] ( )( )

[ ]max maxˆ ˆ

ln ln expˆ ˆ ˆ ˆ

2 2

2 2

θ − θ θ− θ θ ≈ − ⇒ θ ≈ − θ θ L L L L

V V


Szacowanie błędów estymatorów MNW

Odstępstwo od paraboli ze względu na małą statystykę (n=50)

ˆ

ˆ .ˆ .

ˆ .

ˆ ˆ ˆ .

−

+

τ − +

τ =∆τ =∆τ =σ ≈ ∆τ ≈ ∆τ ≈

1 0620 1370 165

0 15

Metoda graficzna szacowania błędów statystycznych estymatorów MNW.

Przykład: Estymator wariancji estymatora parametru rozkładu wykładniczego.( ) ( ) ( )ˆmax max

ˆ

ˆ ˆ ˆln ln ln lnˆ θθ

θ− θθ ≈ − ⇒ θ± σ ≈ −σ

2

22L L �L L

12


Metoda największej wiarogodnościPrzykład: Wyznaczenie parametrów µ oraz σ rozkładu normalnego.

( )( )

(x; , ) exp exp

n

n ini i

i

xx

=

=

− µ −µ µ σ = = σ σ πσ πσ ∑

∏2

21

2 21

1 1- -2 22 2

L

ln ln( ) ln ( )n

ii

n n x=

= − π − σ − −µσ ∑2 22 1122 2 2

L

Obliczamy pochodne funkcji wiarogodności po parametrach µ oraz σ:

2x

ln ˆ ˆ( ) ( )ˆ

ln ˆ ˆ ˆ( ) ( ) ( ) Sˆ ˆ

n n n

i i ii i i

n n n

i i ii i i

x x xn

n nx x xn

= = =

= = =

∂ = −µ −µ = ⇒ µ = ∂µ σ σ ⇒ ∂ = − + −µ − + −µ = ⇒ σ = −µ ≡ ∂σ σ σ σ σ

∑ ∑ ∑∑ ∑ ∑

2 21 1 1

2 2 2 22 2 4 2 4

1 1 1

1 1 10

1 1 102 2 2 2

L

L

ˆˆˆˆ

ˆlnˆ ˆ[ ] nn

− −

µ=µµ=µσ=σσ=σ

∂ σ µ = − = − − = ∂µ σ

1 12 2

2 2L

V

Estymatory wariancji estymatorów parametrów µ oraz σ:

ˆ

ˆlnˆ ˆ[ ]( ) n

−

σ =σ

∂ σσ = − = ∂ σ 2 21

2 42

2 22L

V


Metoda największej wiarogodnościPrzykład: Opór każdego z n różnych oporników zmierzono niezależnie 2 razy. Dokładnośćkażdego z pomiarów jest taka sama, a prawdziwe wartości oporu nie są znane. Przyjmując, że każdy z pomiarów opisany jest rozkładem Gaussa o tej samej dyspersji σ, ale różnych wartościach oczekiwanych µi (i = 1, …, n), odpowiadających różnym oporom, znajdź estymatory wielkości µi i σ.

( ) ( )

( )( )( , ; , ) exp exp

exp ( ) exp ( )

n nj ji i

i j

n n

i i j jn ni j

yxx y

x y

= =

= =

− µ − µµ σ = − − = σ σπσ πσ = − −µ − −µ σ σ πσ πσ

∏ ∏

∑ ∑

22

2 21 1

2 22 2

1 1

1 12 22 2

1 1 1 12 22 2

L�

ln ln ln ( ) ln ln ( )n n

i i i ii i

n x n y= =

= − π − σ − −µ − π − σ − −µσ σ∑ ∑2 2 2 22 21 1

1 1 1 1 1 12 22 2 2 22 2L

ˆ ˆx yln ˆ (x y )ˆ ˆ

i i i i i i i ii i i

i

x y−µ −µ −µ −µ∂ = + ⇒ + = ⇒ µ = +∂µ σ σ σ σ2 2 2 210 2

L

ln ( ) ( )n n

i i i ii i

n x n y= =

∂ = − + −µ − + −µ∂σ σ σ σ σ∑ ∑2 22 2 4 2 41 11 1 1 1 1 12 22 2

L

ˆ ˆ ˆ(x ) (y ) (x y )ˆ ˆ

n n

i i i i i ii i

nn

= =

− + − µ + −µ = ⇒ σ = − σ σ ∑ ∑2 2 2 22 4 1 11 10 42


Metoda największej wiarogodnościPrzykład: Wyznaczenie estymatora parametru rozkładu Poissona.

( ; ) e ln ln ln ln !! !

i ik kn n n n

i ii ii i i i

nk k kk k

−µ

= = = =

µ µµ = ⇒ = −µ = µ − − µ ∏ ∑ ∑ ∑L L1 1 1 1ln ˆk k

ˆ

n n n

i i ii i i

k n nn

= = =

∂ = − ⇒ − = ⇒ µ =∂µ µ µ∑ ∑ ∑L 1 1 11 1 10

Wartość oczekiwana i wariancja: ˆ[ ] k k

n n

i ii i

nn n n= =

µ = = = µ = µ∑ ∑E1 1

1 1 1

( )ˆ ˆ[ ] ( ; ) k e (k ) e! !

(k ) (k )(k ) e!

(

i i

i

k kn n n n

i il lk k i l k i l

kn n n

i i jlk i i j l

i

L kn k n k

kn

kn

∞ ∞ ∞−µ −µ

= = = = = = =

∞−µ

= = ≠ = =

µ µ µ = µ −µ µ = −µ = −µ = µ= − µ + −µ −µ =

= −µ

∑ ∑ ∑ ∏ ∑ ∑ ∏

∑ ∑ ∑ ∏

V

2 22

0 0 1 1 0 1 1

22

0 1 1 1

2

1 1

1

1 ) e [k]!

ikn n

lk i l

nk nn

∞−µ

= = =

µ µ= = ∑ ∑ ∏ V2

20 1 1

1


Średnia ważona

( )( ; , ) exp

ni

ii ii

xx

=

−µµ σ = − σπσ ∏�

L

2

21

122

( ) ( )lnln ln lnn n n

i ii

i i ii i

x xn

= = =

−µ −µ∂= − π − σ − ⇒ =∂µσ σ∑ ∑ ∑2

22 2

1 1 1

1 122 2 2L

L

ˆ( )ˆ ˆ /

n n n n ni i i

i i i i ii i i i i

x x x

= = = = =

−µ = ⇔ = µ ⇒ µ =σ σ σ σ σ∑ ∑ ∑ ∑ ∑2 2 2 2 21 1 1 1 1

1 10

Średnia ważona: gdzieˆn

ii i i n

i

j j

w x w=

=

σµ = =

σ

∑∑

2

12

1

1

1

Dana jest próbka prosta złożona z n elementów xi (i=1,…,n), każdy z rozkładu normal-nego o różnej i znanej dyspersji σi, ale nieznanej i identycznej wartości oczekiwanej µ. (np. pomiary danej wielkości za pomocą różnych przyrządów).


Średnia ważonaWartość oczekiwana i wariancja:

( )ˆ ˆ[ ] ( ) ( ; , ) exp

( )( ) exp

( ) ( )( ) exp

n nj

i iji j j

n nj

i iji j j

n n

i i i k i ki i k j

xL x dx w x dx

xw x dx

w x w w x x

= =

= =

= ≠ =

∞ ∞

−∞ −∞

∞

−∞

− µ µ = µ −µ µ σ = −µ − σπσ − µ = −µ − = σπσ

= −µ + −µ −µ − πσ

=∑ ∏

∑ ∏

∑ ∑

∫ ∫∫

V� �

2 22

21 1

2 2

21 1

2 2

1 1

122

122

12

( )n jjj

in n n ni

i i j i i n ni j i ij

j ij jj j

xdx

w w

=

= = = =≠

= =

∞

−∞

− µ = σ σ σ = σ πσ = σ = = πσ σ σ

∏

∑ ∏ ∑ ∑∑ ∑

∫ 221

2

22 2 2 2

1 1 1 12 2

1 1

2

11 122 1 1

ˆ[ ]n n

i i ii i

w x w= =

µ = = µ = µ∑ ∑1 1

� ( )exp da a ax x x∞

−∞

π− =∫ 2 2 12

( )exp da ax x∞

−∞

π− =∫ 2


Metoda największej wiarogodnościPrzykład: Prędkość dźwięku mierzona w powietrzu dwiema różnymi metodami wynosi: v1=340 ± 9 [m/s] oraz v2=350 ± 18 [m/s]. Znajdź najlepszą estymatęprędkości dźwięku.

[m/s]ww v w v

vw w+

= =+

1 1 2 2

1 2342

. .w w= = = =1 22 21 10 013 0 0039 18

( ) [m/s]w w w −σ = + =11 2 8

Obliczamy wagi:

Średnia ważona prędkość dźwięku oraz jej błąd:

Documents

wyklad stat 10 - AGH University of Science and Technologyhome.agh.edu.pl/~mariuszp/wfiis_stat/wyklad_stat_10.pdf · M. Przybycie ń Rachunek prawdopodobie ństwa i statystyka Wykład