verosimilitate maxima

Capitolul 7

ELEMENTE DE TEORIA SELECIEI I ESTIMAIEI

7.1. Noiuni generale

Orice cercetare statistic pornete de la o colectivitate sau populaie alctuit din elemente sau indivizi care au o caracteristic general i care se difereniaz prin anumite atribute.

Elementele colectivitii (populaiei) le vom numi uniti. n studiul colectivitilor statistice, n majoritatea cazurilor suntem nevoii s studiem

numai pri din ntreaga colectivitate. Ori, n acest caz, se pune n mod natural ntrebarea dac concluziile ce le obinem concord cu rezultatul ce l-am obine dac studiem ntreaga populaie. Apare astfel problema de a studia modul n care valorile tipice (pe baza crora tragem concluzii) ale colectivitii pariale investigate pot furniza informaii asupra valorilor tipice ale ntregii colectiviti.

Vom presupune, n cele ce urmeaz, c urmrim o anumit caracteristic a colectivitii generale i c aceast caracteristic este descris de o variabil aleatoare X definit pe un cmp de probabilitate {, K, P}, n care elementele mulimii sunt tocmai elementele colectivitii generale, K este un corp borelian de pri ale lui , iar P este o probabilitate pe K.

Dup cum se tie, dac este finit, atunci K coincide cu mulimea prilor lui , iar P este o repartiie discret uniform pe .

Faptul c suntem obligai s cercetm numai o anumit parte din populaie este impus de natura concret a colectivitii. Astfel, dac numrul elementelor populaiei este infinit, n mod necesar nu putem cerceta dect un numr finit i deci obinem o informaie trunchiat.

Dar, n cazul cnd numrul elementelor populaiei este finit, atunci cnd cercetarea calitii elementelor conduce la distrugerea lor, evident c se impune alegerea unui numr finit pentru cercetare.

Dac inem seama de faptul c orice investigare (cercetare) implic i anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte din populaia total.

Vom numi selecie (eantion) o colectivitate parial de elemente alese la ntmplare. Numrul elementelor dintr-o selecie l vom numi volumul seleciei.

Spunem c o selecie este repetat, dac elementul ales la ntmplare este reintrodus n colectivitatea general naintea efecturii urmtoarei alegeri.

Selecia este nerepetat dac, elementele alese nu se mai introduc n colectivitatea general.

S efectum deci o selecie de volum n dintr-o colectivitate C i s notm cu x1, x2, , xn valorile de observaie. Acestea se refer la valorile unei variabile aleatoare X care d legitatea caracteristicii studiate.

Considerate aposteriori, valorile de selecie x1, x2, , xn sunt valori bine determinate ale variabilei aleatoare X.

Privite apriori, valorile X1, X2, , Xn pot fi considerate ca variabile aleatoare independente, identic repartizate cu variabila X, n cazul unei selecii repetate.

Dac selecia este nerepetat, atunci variabilele X1, X2, , Xn sunt dependente, dependena fiind de tipul lanurilor cu legturi complete.

Dac volumul colectivitii generale este suficient de mare iar volumul seleciei este suficient de mic, deosebirea dintre o selecie repetat i una nerepetat este nesemnificativ i, ca atare, n aplicaiile practice o selecie nerepetat se trateaz dup metodele seleciei repetate.

Orice funcie de datele de selecie o vom numi funcie de selecie sau statistic. S considerm acum o selecie de volum n: X1, X2, , Xn i s dispunem n ordine

nedescresctoare aceste date: X(1) X(2) X(n) , unde X(1) = min {X1, X2, , Xn}. X(n) = max {X1, X2, , Xn}. Mulimea {X(1), X(2), , X(n)}, constituie o statistic a ordinei. Pornind de la selecia

considerat, putem defini imediat amplitudinea de selecie. ( )W X X X X Xm m1 2, , ..., ( ) (1)= , care este evident o statistic (o funcie de selecie).

Un rol deosebit de important l are n statistica matematic funcia empiric de repartiie, care se definete astfel:

F x nnn

x( ) ,= x R , unde n este volumul seleciei, iar nx este numrul valorilor de selecie mai mici dect x.

Funciei F(x) = P(: X() < x) i vom spune funcie teoretic de repartiie. Noi vom considera numai selecii repetate. Justificarea teoretic a metodei seleciei apare n mod natural din teorema lui

V.I.Glivenko, cunoscut sub numele de teorema fundamental a statisticii matematice. Teorema lui Glivenko Dac F(x) este funcie teoretic de repartiie, iar Fn(x) funcia empiric de repartiie,

atunci: P F x F xn x R

nlim sup ( ) ( ) =

= 0 1

Teorema lui A.N.Kolmogorov ofer posibilitatea de a evalua distana dintre Fn(x) i F(x).

Teorem. Dac F(x) este o funcie continu, atunci:

lim sup ( ) ( ) ( ) ( )n x

nk kP F x F x

nK e cu < 1 02 2 ,

7.2. Momente de selecie Dac este dat selecia de volum n: X1, X2, , Xn , atunci vom numi momentul de

selecie de ordinul r i-l vom nota Mr , variabila aleatoare:

Mn

Xr jr

j

n

==1

1

Pentru r = 1, obinem media de selecie: M xn

X jj

n

11

1= ==

S considerm media i dispersia variabilei aleatoare Mr :

M M Mn

Xn

M X M Xr jr

j

n

jr

rj

n

( ) ( ) ( )= = == =

1 11 1

Aplicnd acum inegalitatea lui Cebev, obinem:

( )P M M X M X M Xnr r r r < ( ) ( ) ( ) 1 22

2 - , de unde urmeaz c:

( )lim ( )n r r

P M M X < = 1, ceea ce ne conduce la: M M Xr rP

n ( ), fapt care justific nlocuirea n aplicaii a momentelor teoretice de ordinul r, cnd acestea exist, cu momentele empirice de ordinul r, dac n este suficient de mare.

Momentele centrate de selecie, r

Prin definiie: r j rj

n

nx x=

=1

1

( )

Pentru r = 2 se obine dispersia de selecie necorectat:

Ca i n cazul momentelor teoretice, putem exprima momentele centrate de selecie cu

ajutorul momentelor obinuite de selecie i invers:

rh

h

r

j

n

rh

jr h h h

h

r

rh h

jr h

j

n

h

h

r

rh h

r h

nC X X C X

nX

C X M

= =

= ==

=

=

=

1 1 1 1

1

01 0 1

0

( ) ( )

( )

,

deci r

i M rx r r Xr r r r= + + + 1 2 212( ) ... , r N *

Ne propunem acum s determinm repartiia asimptotic a mediei de selecie X . Teorem. Dac se efectueaz o selecie de volum n: X1, X2,, Xn, dintr-o

colectivitate caracterizat de variabila aleatoare X pentru care exist M(X) = m, M[(X m)2] = 2 0,

x mn n

/ B

Y N(0,1)

Demonstraie: S notm YXnj

j= , 1 j n

Atunci: x Y m MXn

mnjj

n

jj= = = ==1 si M(Yj )

2 2 21

1= = =n x xjj

n

( )

( ) ( ) ( ) ( ) ( )( ) ( )[ ] [ ]

D M M M M M Mn

X Mn

X

nM X

nM X M X

nM X

nM X M X

nM X M X

nM X M X

r r r jr

j

n

jr

j

n

j

n

jr

jr

kr

j k j

n

j jr

kr

j k

jr

jr

j

n

r r

22

2

1

2

1

2

21

22 2

2

12

2 22

12

2

1 1

1 1 1 1

1 1

( ) ( ) ( )

( )

( ) ( )

= =

=

= + =

= =

= =

= =

=

p p

( )[ ]M Y m M X mn nj j j j = = =2 22 2

2

( )M Y m M X mn nj j j j = = =

3 3

3

3

3

3 , 1 j n

S considerm condiiile lui Leapunov:

n

jj

n

jj

n n n

n

n

n=

=

=

= =lim

3

2

1 3

2

1

1 2

3

2

1 3

2 1 2 1 61 0

/

/

/

/ /lim lim

Fiind ndeplinit condiia lui Leapunov, rezult conform teoremei:

n

zx

P x mn

x e dz

Excesul de selecie:

24

22 3=

Coeficientul de corelaie de selecie (empiric):

( )( )( ) ( )

=

=

==

1

1 11

2 2

11

nX X Y Y

nX X

nY Y

j jj

n

j jj

n

j

n

7.3. Selecia dintr-o populaie normal N(m, ) n multe situaii, ne intereseaz repartiia exact a diverselor statistici, Tn(X1, X2,

,Xn), chiar cnd n este mic. Toate rezultatele obinute anterior rmn valabile, inclusiv cele referitoare la repartiie asimptotic a unor funcii de selecie normate convenabil.

Vom presupune acum c populaiile din care se efectueaz seleciile sunt normale N(m, ) i, n aceste condiii, vom cuta s stabilim repartiiile exacte ale celor mai importante funcii de selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit n practic este cel al erorilor de observaie ale msurtorilor, care, dup cum se tie, sunt repartizate dup o lege normal.

Teorem. Dac X1, X2, ,Xn este o selecie de volum n dintr-o populaie caracterizat

de o variabil aleatoare X N(m, ), atunci media de selecie Xn

X jj

n

==1

1

are o lege de

repartiie

N mn

,

Demonstraie. Cum Xj N(m, ), 1 j n, rezult c:

Xj

itm t

t e( ) = 2 2

2 Atunci:

XitX

itn

X

j

n itn

X

j

n

Xj

n itn

mt

nitm

tnt M e M e M e

tn

e ej

j

n

j

j( ) ( ) ,= =

=

=

= =

=

= = =

1

1 1 1

2 21

2 2

2

2 2

care este funcia caracteristic a unei variabile aleatoare normale N m

n,

Urmeaz c densitatea de repartiie a variabilei X este:

f x n eXn x m

( ) ,=

22

2

x R

S artm c variabila abatere normat Z X mn

= / este repartizat normal N(0; 1). ntr-adevr:

( ) Z itZ it n X m it n i t nt M e M e M e e( ) = = =

=

m X

= = =

e t n e e e

i t n

X

i t n nn

ti t n

m m - t m2 2

2

2

2 2 ,

care este funcia caracteristic a unei variabile normale N(0; 1).

Deci densitatea de repartiie a variabilei Z X mn

= / este:

f z eZz

( ) ,= 12

2

2

z R Teorem. Dac X1, X2, ,Xn este o selecie de volum n, dintr-o populaie normal

N(m, ), atunci X i 2 sunt variabile aleatoare independente. Demonstraie. Putem presupune c m = 0, ntruct momentul de selecie 2 este

invariabil la o schimbare a originii.

ntruct: ( )2 21

1= =n X Xkk

n

,

s exprimm:

( )X X X X X nX X n Xk k kkn

k

n

k

n

kk

n

kk

n

= + = === = =

2 2

1

2

11

2

1 1

2

2 1

ns:

( )

Xn

X nn

XX

nnn

XX

n

X X

kk

n

kk

n kk

n

kk

n

n n

2

1 1

2

12

2

23

2

12

1 11

21 2

12

= == =

=

+

+

+ + ...

Deci:

( ) ( )X X n n XX

nnn

XX

n nX Xk

k

n kk

n

kk

n

n n =

+

+ +

== =

21

12

2

23

2

121

121 2

1...

Urmeaz c:

( )Xn

X nn

XX

nnn

XX

nX Xk

k

n

kk

n kk

n

kk

n

n n2

1 1

2

12

2

23

2

121 1

121 2

12= =

= = = +

+

+ + ...

n membrul doi al acestei egaliti avem o sum de n forme ptratice pozitiv definite,

fiecare avnd rangul egal cu unu. Deoarece suma rangurilor acestor forme ptratice pozitiv definite este egal cu n, iar variabilele Xk N(0, ) , 1 k n, din teorema lui Cochran (pe care nu o vom demonstra)* rezult c variabilele:

* Teorema lui Cochran. Fie X1, X2, , Xn variabile aleatoare independente, repartizate normal N(0, ) i Q1, Q2, , QS , forme ptratice n X1, X2, , Xn avnd rangul k1, k2, , kS , respectiv. Dac: Q Xj

j

S

kk

n

= = =

1

2

1

, atunci

condiia necesar i suficient ca variabilele Q1, Q2, , QS s fie independente este ca k1+ k2 + + kS = n.

( )

Y nn

XX

n

Y nn

XX

n

Y X X

Yn

X

kk

n

kk

n

n n n

n kk

n

1 12

2 23

1 1

1

11

21 2

12

1

=

=

=

=

=

=

=

...................................................

sunt independente.

Se constat imediat c: 2 21

11==

n Ykkn

i, prin urmare, rezult c X i 2 sunt independente. Teorem. Variabila aleatoare n2 are o repartiie 2 cu n 1 grade de libertate i parametrul , adic are densitatea de repartiie:

f x x en

n

n

n x( )

,

=

0

1

1

12

12

12

x 01

2, x > 0n-1

2

Variabila aleatoare n2

2 are o repartiie cu n 1 grade de libertate i parametrul = 1. Variabila aleatoare = 2 are densitatea de repartiie:

f x x en n

nnx( )

,

=

0

1

2

2

12

2 2

x 0

2n

2, x > 0

n-12

n-12

Demonstraie. Din 2 12

22

12

= + + + Y Y Yn

n... rezult: n Ykk

n2 21

1

==

, unde Y1, Y2,, Yn-1 sunt variabile aleatoare independente, repartizate normal, de parametri M(Yk) = 0; D2(Yk) = 2. Deci n2 urmeaz o lege de repartiie X 2 cu n 1 grade de libertate i parametru . De asemenea:

n Y

M Y Y

k

k

n

k k

22

2

1

1

0 1

=

=

=

=

; D2

i, deci, variabila aleatoare n2 /2 urmeaz o lege de repartiie a crei densitate este:

f x x enn x

( ),

=

0

12

12

12

x 01

2, x > 0n-1

2

Pentru a obine densitatea de repartiie a variabilei = 2 , pornim de la funcia de repartiie:

( )P( x nx

ny e dyn

n

n ynx

< =

),

,

0

1

2 12

2

12 1

32 2

0

2

2

x 0P n , x > 0

0 x 0

, x 0

2

Derivnd, obinem:

f xn

x en

nnx

( )

,

=

0

12

1

2 2

2

2

x 0

2n

2, x > 0

n-12

n-12

S considerm acum ( )*2 21

1= =n X mkk

n

, unde X1, X2, , Xn este o selecie de

volum n dintr-o colectivitate normal N(m, ). Atunci: n x mk

k

n

*2

2

2

1

= =

n membrul al doilea avem o sum de ptrate de variabile Y X mk k= independente,

repartizate normal N(0, 1). Deci, variabila aleatoare n*2

2 urmeaz o lege de repartiie ( )n2 cu parametrul = 1 S considerm acum variabila aleatoare:

( )s n X Xkkn

2 2

1

11

= = pe care o numim dispersia de selecie corectat. ntruct:

( ) ( ) ( )[ ] ( ) ( ) ( )( ) ( ) ( )X X X m X m X m X m X m

n X m X m n X m

kk

n

k k kk

n

k

n

k

n

kk

n

= = +

+ = = ===

=

2

1

2 2

111

2 2

1

2

2

rezult c:

( )/

n s X m X mn

k

k

n =

=

1 22

2 2

1

Dar, X mkk

n

=

2

1

este o variabil ( )n2 iar X mn

/

2

este o variabil (1)2 independent de ( )n2 .

Rezult c ( )n s12

2 urmeaz o lege de repartiie ( )n12 cu parametrul = 1

Am vzut c M n nn n( ) ; ( )( ) ( ) 2 2 2= = D2 cnd parametrul este 1. Atunci M n n

22 1

= , de unde rezult:

M nn

n n D n( ) ; ( ); ( ) ( ) 22 2

2 42

21 2 1 2 1=

= = D

n2 2 i deci:

D nn

22

4

22 1( ) ( ) =

n acelai timp:

M n s n( ) =

1 12

2 , care conduce la: M(s2) = 2

D n s n22

21 2 1( ) ( ),

= adic D s n

2 2421

( ) =

ntruct x mn

N n = / ( , ), ( )0 1 2 1

2 iar (n -1)s2

Urmeaz c: x m

n

n

x mn

n sn

x ms nn

=

=

/ /( )( )

/( )12 2

2111

are o lege de repartiie Student cu n 1 grade de

libertate. S presupunem c dispunem de dou colectiviti, C1 i C2, caracterizate de o variabil

aleatoare X1 N(m1, T1) respectiv X2 N(m2, T2), X1 i X2 independente. Din colectivitatea C1 se efectueaz o selecie de volum n1: X11, X12, , X n1 1 , iar din

colectivitatea C2 se efectueaz o selecie de volum n2: X21, X22, , X n2 2 .

Pe baza acestor selecii, obinem mediile de selecie X1 i X 2 , dispersiile de selecie:

( )s n X xjjn

12

11 1

2

1

11

1= = , respectiv ( )s n X xkkn

22

22 2

2

1

11

2= = . Variabila aleatoare X1 X 2 urmeaz o lege normal: N m m

n n1 212

1

22

2

+

,

. De aici rezult c: x x m m

n n

N1 2 1 212

1

22

2

0 1 +

( ) ( , )

Evident c: ( )M X X m m1 2 1 2 = D X X D X D X

n n2

1 22

12

212

1

22

2

( ) ( ) ( ) = + = +

Dac 12 22 2= = , atunci variabila aleatoare [ ]1 1 12

1 12

2 22

( ) ( )n s n s + are o repartiie 2 cu n1 + n2 2 grade de libertate.

Rezult c variabila aleatoare: ( ) ( )( )

X X m m

n n

n s n sn n

X X m m

n s n sn n

n nn n

1 2 1 2

12

2

22

2

1 12

2 22

1 22

1 2 1 2

1 12

2 22

1 2

1 2

1 21 12

1 12

+

+ +

= + +

+

( ) ( )

( )

( )

( ) ( )

urmeaz o lege de repartiie Student cu n1 + n2 2 grade de libertate. n virtutea teoremei conform creia dac variabilele ( ) ( ),1 22 2 sunt independente, atunci variabilele aleatoare ( ) ( )/ : /1 22 1 2 2 urmeaz o lege de repartiie Snedecor cu 1, 2 grade de libertate, respectiv, rezult c variabila:

F

n snn sn

ssn1 1 1

1 12

12

2 22

22

12

22

1111

=

=;( )( )( )( )

n2

are o lege de repartiie Snedecor (este o variabil Fn1 1 1 ; n2 cu n1-1, n2-1 grade de libertate respectiv. n aplicaiile practice trebuie s se in seama de faptul c tabelele pentru repartiia Snedecor se construiesc pentru valori ale variabilei Fn1 1 1 ; n2 mai mari dect unu.

Ca atare este necesar s lum la numrtor s s12

22> i, totodat, s avem grij s nu

inversm ordinea gradelor de libertate. Inversiunea ordinei gradelor de libertate este echivalent cu:

F ss s

sFn n1 1

1 122

12

12

122

1 1

1 1

= = =;

; n

n2

2

ceea ce justific de ce s-au construit tabele numai pentru F 1 2 1, > . 7.4. Elemente de teoria estimaiei n toate aplicaiile statisticii matematice, n economie, n tehnic i, n general, n

tiinele experimentale este necesar s cunoatem legitatea dup care are loc evoluia fenomenului studiat, adic legea de repartiie a variabilei aleatoare prin intermediul creia este cuantificat caracteristica studiat a fenomenului. Adesea, cunotinele teoretice sau experiena practic n domeniul investigat ne dau dreptul s admitem c forma legii de repartiie este cunoscut. Pentru a utiliza efectiv o astfel de lege de repartiie, va trebui cunoscut care dintre funciile de repartiie din familia celor de o form dat este cea care trebuie efectiv utilizat. Cu alte cuvinte, trebuie precizat valoarea numeric a parametrului (sau valorile numerice ale parametrilor, n cazul unei legi de repartiie ce depinde de mai muli parametri). Pentru a nelege mai bine cum stau lucrurile, s dm unele exemple.

Dac variabila aleatoare X reprezint numrul de apeluri la o central telefonic ntr-un interval de timp determinat, ales ca unitate, atunci X are o lege de repartiie Poisson:

Xx

e ax

ax:!

, x = 0, 1, 2, ...

adic ( )P X x a e ax

ax

= = ;!, pentru x = 0, 1, 2, ...; a > 0 i avem o lege de repartiie ce

depinde de parametrul a > 0.

n cadrul unui proces de producie, o caracteristic important o constituie procentul p de rebut. Dac X este variabila aleatoare ce d numrul de produse necorespunztoare ce se obin ntr-o selecie repetat de volum n, atunci: ( )P X x p C p pnx x n x= = ; ( ) ,1 x = 0, 1, 2, ... , n S considerm un alt exemplu, cu o variabil aleatoare care admite o densitate de repartiie. Fie T o variabil aleatoare ce reprezint durata de funcionare fr cderi a unei anumite componente. n multe situaii, variabila T este caracterizat de densitatea de repartiie:

f t eT

t

( ; ) ,

,

= >

1 0

0

t

t 0 > 0

Este vorba, iari, de o lege de repartiie de form exponenial cu un singur parametru > 0 .

n fine, dac X reprezint abaterile unei piese prelucrate de la cota nominal menionat n fia tehnologic, atunci X urmeaz o lege normal N(m, ) a crei densitate este:

f x m eX m

( ; , ) ,( )

= 1

2

2

22 x R ,

care este o lege de repartiie cu doi parametri (m, ) Rx(0, ). n toate aceste exemple s-a specificat forma, fr a se preciza care anume repartiie este adic valorile exacte ale parametrilor ce intervin. Ori de cte ori avem forma funciei prin care se exprim legea de repartiie, spunem c avem o problem specificat. Cunoaterea valorilor parametrilor conduce la cunoaterea complet a legii de repartiie adic avem o problem complet specificat. Operaia de evaluare a parametrilor poart numele de estimare a parametrilor, care se face pe baza unei selecii de volum n: X1, X2, , Xn, extras din populaia caracterizat de variabila aleatoare X, cu legea de repartiie specificat. Valorile parametrilor unic determinate pe baza seleciei X1, X2, , Xn, le vom numi estimaii punctuale. Valorile parametrilor le estimm cu ajutorul unei statistici (o funcie de datele de selecie) construite cu ajutorul seleciei X1, X2, , Xn i pe care o vom nota Tn(X1, X2, , Xn). Pentru a preciza ideile, vom presupune c selecia de volum n s-a efectuat dintr-o populaie caracterizat de o variabil aleatoare X care admite legea de repartiie dat de f(x; ), unde f(x; ) este o densitate de repartiie n cazul c exist densitate sau, n cazul unei variabile discrete este P(X = x; ). Cu ajutorul funciei de selecie Tn(X1, X2, , Xn) dorim s estimm parametrul (forma fiind cunoscut). Este clar c dispunem numai de informaie parial asupra populaiei i, ca atare, cu ct volumul de selecie crete, cu att informaia este mai bogat. Deci, Tn(X1, X2, , Xn) trebuie s se apropie tot mai mult de valoarea parametrului , fiind vorba aici de un proces de convergen. Evident c aceast convergen trebuie s aib loc n probabilitate, adic: ( )

nn nP T X X X

< =lim ( , , ..., )1 2 1

Valoarea luat de Tn(X1, , Xn) pentru valori bine determinate ale variabilelor X1, X2, , Xn o vom numi estimaie a parametrului . Din cele prezentate rezult c funcia de estimaie este de natur teoretic, n timp ce estimaia este de natur empiric.

Dac Tn(X1, X2, , Xn) P

n spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru parametrul .

Cum exist o infinitate de funcii Tn(X1, X2, , Xn) care converg n probabilitate ctre , pentru a mri precizia, vom recurge la convergene mai tari, deci care asigur convergena n probabilitate. O atare convergen este convergena n medie ptratic, care prezint avantajul c este comod n calcul. Funcia de estimaie Tn(X1, X2, , Xn) este o funcie de variabilele aleatoare independente X1, X2, , Xn i, deci, o variabil aleatoare cu o funcie de repartiie. Cum am presupus c lucrm cu convergen n medie ptratic, am admis implicit c Tn(X1, X2, , Xn) are momente de ordinul doi cel puin. Definiie. Spunem c statistica Tn(X1, X2, , Xn) este o estimaie nedeplasat a parametrului dac: M(Tn(X1, X2, , Xn)) = . Spunem c statistica Tn(X1, X2, , Xn) este o estimaie deplasat a parametrului , dac: M(Tn(X1, X2, , Xn)) = + h(n) Funcia h(n) pe care o vom numi deplasare a estimaiei are proprietatea c ( )h n = n 0. Este clar c ntre eroarea de estimaie i deplasare exist o clar deosebire. n timp ce eroarea de estimare este Tn(X1, , Xn) - i este o variabil aleatoare, deplasarea h(n) = M(Tn(X1, X2, , Xn)) - este o funcie numeric, care depinde de volumul de selecie i eventual de parametrul de estimat i care reprezint o eroare sistematic n procesul de estimare. Dac deplasarea h(n) > 0 spunem c Tn(X1, X2, , Xn) este pozitiv deplasat, iar dac h(n) < 0 spunem c Tn(X1, X2, , Xn) este negativ deplasat. Din definiia funciei numerice deplasare, h(n), rezult importana cunoaterii n cazul seleciilor de volum mic. Exemple de estimaii nedeplasate sau deplasate putem pune imediat n eviden pe baza unor rezultate pe care le-am obinut deja.

Aa de exemplu, Tn(X1, X2, , Xn) = X nX j

j

n

==1

1

este o estimaie nedeplasat a

mediei teoretice, m , a unei variabile aleatoare: ( )M X m= De asemenea, frecvena relativ k

n este o estimaie nedeplasat a probabilitii, p, de

apariie a unui eveniment n cazul unei repartiii binomiale:

M kn n

M k npn

p = = =

1 ( )

Am vzut c, dac efectum o selecie dintr-o populaie normal i notm:

2 21

1= =n X Xjj

n

( ) (dispersia de selecie necorectat) i cu:

sn

X Xjj

n2 2

1

11

= = ( ) (dispersia de selecie corectat), atunci M

n( ) , ) 2 2

22= = M(s2

Rezult c 2 este o estimaie negativ deplasat a dispersiei teoretice 2, n timp ce s2 este o estimaie nedeplasat a dispersiei teoretice 2 .

Definiie. Spunem c Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul , dac: M(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn)) n 0

Spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru , dac: M(Tn(X1, X2, , Xn)) = + h(n) , h(n) n 0 D2(Tn(X1, X2, , Xn)) n 0 Utiliznd rezultate obinute anterior, se deduce c momentul de selecie de ordinul r,

Mr este o estimaie absolut corect pentru momentul teoretic de ordinul r, Mr(X). ntr-adevr: M( Mr ) = Mr(X)

D2( Mr ) = M X M X

nr r

n2

2

0( ) ( ) n particular, X este estimaie absolut corect pentru M(X) = m.

M(s2) = 2 M(2 ) = 22

n

D sn n

2 2421

0( ) = D n

n n2

2 242 1 0( ) ( ) =

Urmeaz de aici c s2 este o estimaie absolut corect pentru 2, n timp ce 2 este numai corect pentru 2 (n selecii dintr-o populaie normal N(m, )).

Este clar c vom prefera totdeauna s avem o estimaie nedeplasat pentru un parametru . Dar, pot exista, pentru acelai parametru , mai multe estimaii nedeplasate i atunci este natural s o preferm pe aceea care are dispersia mai mic, ntruct valorile statisticii Tn(X1, X2, , Xn) se vor grupa mai bine n jurul valorii . n felul acesta, ne punem problema existenei unei estimaii nedeplasate care s aib cea mai mic dispersie i ct de mic poate s fie dispersia unei estimaii.

n acest sens, dm binecunoscuta teorem a minimului dispersiei, cunoscut i sub numele de teorema lui Rao-Cramer.

7.5. Teorema Rao-Cramer.Dac Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul din repartiia dat de f(x; ) a variabilei aleatoare X (discret sau continu), atunci:

D2(Tn(X1, X2, , Xn)) 1nI( ) , unde I( ) este cantitatea de informaie pe o

observaie i are expresia: I M f x M f x( ) ln ( ; ln ( ; )

=

=

2 2

2

Demonstraie. Din relaia: f x dx( ; ) =

1 se obine, prin derivare n raport cu parametrul :

f x dx f x dx( ; ) ( ; )

= = =0 0 0 sau

lnf(x; ) , adic M lnf(x; )-

Estimaia Tn(X1, X2, , Xn) fiind nedeplasat, obinem:

M(Tn(X1, X2, , Xn))= ... ( , , ..., ) ( ; ) ...T X X X f x dx dxn n j nj

n

1 2 11

=

= Derivnd, i aici, n raport cu , se obine:

... ( , , ..., ) ln ( ; ) ( ; ) ...T X X X f x f x dx dxn nj

n

nj

n

= = =1 2

11

1

1 Pe de alt parte:

...ln ( ; )

( ; ) ...

f x

f x dx dxjj

n

jj

n

n=

= =

11

1

0

nmulind aceast relaie cu i scznd din relaia anterioar, obinem: [ ]... ( , , ... ) ln ( ; ) ( ; ) ... ,T X X X f x f x dx dxn n j

j

n

j nj

n

1 21

11

1 =

= =

adic:

( )M T X X X f xn n jj

n

( , , ..., )ln ( ; )

1 21

1

=

=

Aplicnd inegalitatea lui Schwarz, se obine:

1 2 1 21

21 2

2

1

=

=

M T X X X f x

D T X X X Df x

n nj

n

n nj

j

n

( , , ..., ) ln ( ; )

( ( , , ..., ) )ln ( ; )

ntruct M(Tn(X1, X2, , Xn)) = i X1, X2, , Xn sunt independente, obinem: D2(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn))

D D nD

nM nI

j

n

j

n2

1

2

1

2

2

ln ; ) ln ; ) ln ; )

ln ; )( )

f(x f(x f(x

f(x

j j

= =

=

=

=

=

=

Deci: D2(Tn(X1, X2, , Xn))

12

nM

ln f(x; )

S artm c:

I M f x M f x( ) ln ( ; ) ln ( ; )

=

=

2 2

2

ntr-adevr, din: f x dx( ; )

= 0 rezult: 2

2 0f x dx( ; )

= ns:

2

2

2

2

2

2

2

f x f x x f x f x f x

x f x f x f x x f x

( ; ) ( ; ) ( ; ) ( ; ) ln ( ; ) ( ; )

( ; ) ( ; ) ln ( ; ) ( ; ) ( ; ) ( ; )

= =

= +

+ = +

lnf

lnf lnf

Deci:

2

2 2

2

0ln ( ; ) ( ; ) ln ( ; ) ( ; )f x f x dx f x f x dx+ =

i, deci:

M f x M f x

ln ( ; ) ln ( ; )

=

2 2

2

Definiie. Spunem c estimaia Tn(X1, X2, , Xn) este eficient dac:

D2(Tn(X1, X2, , Xn)) 1nI( )

Fie acum Tn(X1, X2, , Xn) o estimaie absolut corect oarecare. Atunci, vom numi eficien a lui , raportul:

e(Tn(X1, X2, , Xn)) =

1

2nI

D( )

(

T (X , X , ... , X ) )n 1 2 n

Este evident c: 0 e (Tn(X1, X2, , Xn)) 1 i Tn(X1, X2, , Xn) este eficient dac e(Tn(X1, X2, , Xn)) = 1.

Cum eficiena este o funcie de volumul n a seleciei i cum la limit trebuie s obinem cea mai mare informaie posibil, rezult c, dac:

lim (n

e T (X , X , ..., X )) = 1 n 1 2 n , atunci estimaia Tn(X1, X2, , Xn) este asimptotic

eficient. Ilustrm noiunea de eficien a unei estimaii prin dou exemple prin care s

cuprindem o repartiie care admite densitate de repartiie i o repartiie de tip discret.

(1) S se arate c Tn(X1, X2, , Xn) = X nX j

j

n

==1

1

este o estimaie eficient pentru

parametrul m al repartiiei normale N(m; ); (2) S se arate c: Tn(X1, X2, , Xn) = X este o estimaie eficient pentru

parametrul al unei repartiii Poisson. (P(X = x / ) = e

x

x

!, x = 0, 1, 2, ... )

Soluie

(1) Din consideraii anterioare, tim c: M X m Xn

( ) ; ( )= = D2 2

Rmne s artm c: D XnI

2 1( )( )

=

f x m eX m

( ; , ) ,( )

= 1

2

2

22 x R, > 0

ln ( ; , ) ln( ) ( )f x m X m = 2

2

2

2

[ ]

ln ( ; , ) ; ln ( ; , )

( )

f x mm

X m f x mm

M X m

M X m

=

=

=

= =

2

2

2

2

42

2

4 21 1

M

=I m( ) 12 i deci: 1 1

2

2

nI m n n( ) /= =

Cum D XnI m

2 1( )( )

= , rezult c X este estimaie eficient pentru parametrul m.

(2) Pentru o repartiie Poisson, D X D Xn n

22

( ) ( )= =

ln (P X x= | ) ln!

ln ln != = + ex

x xx

ln ( )

( ) ( ) ( )

P X x x

I M x M x x M X M X

= = +

=

= +

= + =

+ + =

1

1 2 1 1 2 1

2 1 1

2 2

2 22

2

2

Cum D XnI

2 1( )( )

= , rezult eficiena estimaiei X pentru parametrul . Am vzut, aadar, cum putem s analizm estimaiile parametrilor n funcie de

proprietile pe care le au, s le clasificm. Vom cuta acum s punem n eviden modaliti sau metode de obinere a unor estimaii. n cele ce urmeaz, ne vom opri asupra a dou metode de obinere a estimaiilor pe care le vom numi estimaii punctuale: metoda momentelor i metoda verosimilitii maxime.

7.6. Metoda momentelor Am vzut c momentele de selecie de ordinul r sunt estimaii absolut corecte ale

momentelor teoretice de acelai ordin: M M M X

D M M X M Xn

r r

rr r

n

( ) ( )

( ) ( ) ( )== 2 2

2

0

Este natural ca, pentru n suficient de mare, s lum n locul momentului teoretic momentul empiric de acelai ordin.

S presupunem c am efectuat o selecie de volum n:x1, x2, , xn, dintr-o populaie caracterizat de variabila aleatoare X care are legea de repartiie dat de f x k( ; , , ..., ) 1 2 , unde f x k( ; , ..., ) 1 este densitatea de repartiie, dac aceasta exist, sau P X x k( ; , , ..., )= 1 2 , dac variabila X este de tip discret. Am considerat, desigur, cazul cnd variabila X este unidimensional i legea depinde de k parametri. Admitem c variabila aleatoare X are moment cel puin pn la ordinul k inclusiv. Atunci: M Xs k( , , ..., ) 1 2 sunt funcii de parametrii necunoscui 1 2, , ..., .k Alctuind sistemul de ecuaii:

M X M

nX

s k s

js

j

n

( , , ..., ) , 1 2

1

1

= =

=

1 s k ,

unde Ms

i presupunnd c sistemul admite soluii reale, se obin: $ $ ( , , ..., ); s s kM M M= 1 2 1 s k care sunt estimaiile parametrilor 1 2, , ..., .k prin metoda momentelor. S observm c nu este necesar s se ia neaprat primele k momente, din contr, putem lua alte momente, inclusiv momente centrate, care s constituie ns un sistem de k ecuaii cu necunoscutele 1 2, , ..., .k i din care s se obin ct mai uor posibil soluia cutat. Vom da acum unele exemple care s ilustreze metoda propus. Exemplu. S se estimeze prin metoda momentelor, pe baza unei selecii de volum n:x1, x2, , xn, extras dintr-o populaie caracterizat de:

[ ][ ]f x( ; , )

, ,

,

1 22 1

2

2

1

0=

dac

dac

x

, x

1

1

, a parametrilor 1 2, .

Soluie. ntruct

( )M X X 1 2 1 2 12 1 2 222 3, ; ( )= + = + + M2 , avem sistemul de ecuaii:

1 21

12

1 2 22

2

2

3

+ =+ + =

M

M,

a crui soluie este:

( ) ( )$ ; $$ ( ) ; $ $ ( )

1 1 2 12

1 2 12

1

3 3

3 1 3 1

= = +

= = + M M M M M M

x s nn

x s nn

, sau

2

2

Lungimea intervalului se estimeaz prin: 2 1 2 3 1 = s nn( )

La aceleai rezultate se ajunge mai simplu, dac lum sistemul:

( ) ( ) 1 2

2 12

2 2 12

2

12

+ = = =

x

M M ,

sau:

1 2

2 1 2

2

2 3

+ = =

x

i se continu, ajungndu-se la acelai rezultat. Exemplu. Estimarea parametrilor a, b din repartiia Beta, care are densitatea:

f x a b a ba b

x xa b( ; , ) ( , )( ) ( )

( ) ,=

0

11 1 , x (0, 1)

x (0, 1) ,

a > 0, b> 0. Prin calcul direct, se obine:

M X a b aa b

D X a b aba b a b

1

22 1

( | , )

( | , )( ) ( )

= += + + +

Estimaiile $, $a b se obin rezolvnd sistemul de ecuaii: a

a bX

aba b a b

s+ =

+ + + =

( ) ( )22

1

De aici rezult:

$ ( ) ; $a X Xs

X=

2

21 1 b = (1 - X) X(1 - X)

s2

Exemplu. Cazul unei repartiii normale N(m; ). Dup cum se tie: M(X| m, ) = m M2(X| m, ) = m2 + 2

i avem, astfel, de rezolvat sistemul de ecuaii:

m Xm M M X

=+ =

= =2 2 2 2 2 2 care conduce la:

m = X2

$$

7.7.Metoda verosimilitii maxime Metoda momentelor pe care am prezentat-o este simpl i uor de aplicat. Prezint, totui, o serie de neajunsuri n ceea ce privete calitile estimatorilor obinui pe aceast cale. De aceea, statisticienii au cutat alte metode de obinere a estimaiilor. Una dintre acestea este metoda verosimilitii maxime elaborat R.A.Fisher i prezint avantajul unui plus de eficacitate. S considerm pentru nceput cazul unui singur parametru i c legea de repartiie a variabilei X ce caracterizeaz populaia din care s-a efectuat selecia de volum n, x1, x2, , xn este dat de f(x; ). Atunci, repartiia vectorului aleator (x1, x2, , xn) este:

P(x1, x2, , xn; ) = f x jj

n

( ; )=

1

, pe care o considerm ca funcie de . Valorile x1, x2, , xn fiind considerate ca date, ele fiind rezultatul experienei, vom considera ca valoare cea mai verosimil a parametrului , valoarea pentru care probabilitatea P(x1, x2, , xn; ) devine maxim, ceea ce ne conduce la faptul c estimaia de verosimilitate maxim , este soluia ecuaiei:

P x x xn( , , ..., ; )1 2 0= Funcia P(x1, x2, , xn; ) poart numele de funcie de verosimilitate. ntruct lnP(x1, x2, , xn; ) i P(x1, x2, , xn; ) sunt n acelai timp cresctoare sau descresctoare, estimaia de verosimilitate maxim se obine ca soluie a ecuaiei.

ln ( , , ..., ; )P x x xn1 2 0=

Funcia L(x1, x2, , xn; ) = ln P(x1, x2, , xn; ) = ln ( ; )f x jj

n

=

1

o vom numi tot funcie de verosimilitate. n cazul cnd repartiia unidimensional depinde de mai muli parametri, f x k( ; , , ..., ) 1 2 , funcia de verosimilitate devine: L x x xn k( , , ..., ; , , ..., )1 2 2 1 , iar

estimaiile de verosimilitate maxim se obin ca soluii ale sistemului de ecuaii:

L(x , x ,... , x ; , , .., ) ; 1 j k1 2 n 1 2 k

j

= 0 Rezolvnd sistemul, se obin: $ $ ( , , ..., ), j j nx x x= 1 2 1 j k , estimaii de verosimilitate maxim.

Ecuaiile L

j

= 0, 1 j k poart numele de ecuaii de verosimilitate.

Fr a intra n amnunte, vom sublinia unele proprieti ale estimaiilor de verosimilitate maxim, care le recomand pentru aplicaii. n cazul unui singur parametru , estimaia de verosimilitate maxim este consistent n probabilitate, dar, pentru valori mari ale lui n, repartiia ei este aproximativ normal, cu media M( $) = i cu dispersia: D

nM f x2

2

1( $)ln ( ; )

=

Altfel spus, estimaia $ obinut prin metoda verosimilitii maxime este asimptotic eficient, n sensul c nu exist o alt estimaie asimptotic normal cu dispersie mai mic. Dac parametrul admite o estimaie eficient, atunci aceasta se obine n mod unic, rezolvnd ecuaia de verosimilitate. Exemple. Pe baza unei selecii de volum n, s se estimeze parametrul din repartiia Poisson:

P X x ex

x x P X x ex

e

x

x

n jj

n x nx

jj

nj

nj

j

n

( )!

,

, , ..., ; ) ( ; )! !

= =

= = = =

=

==

=

x = 0,1,2, ...

P(x1 21

1

1

1

lnP(x1, x2, , xn; ) = L(x1, x2, , xn; ) = + ==n x xj j

j

n

j

n ln ln ( !)11

L x x x nx

nx

nj

j

n

jj

n

( , , ..., ; )1 2 1

1 0

= +

+ =

=

=

,

iar

are soluia: $

( , , ..., ; )

( , , ..., ; $)

= =

=

= 0, z1 = z2 nu convine i, deci, z1 = -z2; z2 = z .

n acest caz, intervalul de ncredere devine:

x zn n

; x + z ; z se determin din relaia: (z) - (-z) = , de unde urmeaz:

2(z) 1 = , sau (z) = 1 21 1

21

2+ = + =

Deci: z este z1

2

, 12

cvantila unei repartiii normale N(0, 1). n final, intervalul de ncredere pentru m, cu nivelul de ncredere = 1 - este:

x zn n

1 2 1 2

; x + z Intervalul de ncredere pentru m cnd este necunoscut. n acest caz, se consider statistica:

T(x1, x2, , xn; n, m) = X ms n

/, s

nx xj

j

n2 2

1

11

= = ( ) Dup cum am vzut, variabila X m

s n

/ urmeaz o lege de repartiie Student cu n-1

grade de libertate. Dar legea de repartiie Student nu depinde de m i n plus X ms n

/ este

funcie continu i strict descresctoare de m. Atunci, pentru un dat, se pot determina numerele t1 i t2 astfel nct:

P t X ms n

t

n

n nt

ndt

n

t

t

1 2

2 22

1 12

11

1

2

=

+

=

/ ( )/

Cum evenimentul t1 X ms n

/ t2 este echivalent cu evenimentul:

x t sn

m x t sn

2 1 , rezult c:

P( x t sn

m x t sn

2 1 ) = i, deci, am determinat un interval de ncredere:

x t sn

x t sn

2 1; care, cu probabilitatea , acoper parametrul m.

Ca i n cazul anterior, punem condiia ca lungimea intervalului s fie minim, cu restricia:

n

n nt

ndt

n

t

t2

1 12

11

2 2

1

2

+

=

( )

Aplicnd, i de data aceasta, metoda multiplicatorilor lui Lagrange se obine din:

H t t sn

t t

n

n nt

ndt

n

t

t

( , , ) ( )( )

1 2 2 1

2 22

1 12

11

1

2

= +

+

i

H t t H t t( , , ) , ( , , )1 2

1

1 2

2

0 0 t

t

= =

c t1 = - t2 , t2 = t1

2

, iar intervalul de ncredere devine:

x t sn

t snn n

1 2 1 1 2 1 ; ;

; x +

Intervalul de ncredere pentru 2

Se consider statistica U(X1, X2, , Xn ; 2) = ( )n s12

2 care, dup cum se tie, are o lege de repartiie ( )n12 (cu n-1 grade de libertate).

Atunci pentru = 1 - fixat se pot determina dou numere 12 i 22 astfel nct: P n s

nx en

n x

12

2

2 22

2

21

21 1

22

12

22

=

= ( )

dx

Dar funcia de repartiie a variabilei ( )n s12

2 este independent de 2 i n plus

( )n s1 22 este funcie continu i strict descresctoare de

2 ceea ce ne conduce la faptul c

evenimentul:

12 ( )n s12

2 22 este echivalent cu evenimentul:

( ) ( )n s n s 1 12

22

22

12

Deci: P( ( ) ( )n sX

n sX

1 12

22

22

12 ) = , adic am determinat un interval:

( ) ; ( )n s n s

1 12

22

2

12 care, cu o probabilitate , acoper parametrul

2.

S stabilim valorile 12 i 22 . Densitatea de repartiie a unei variabile X2 nemaifiind

simetric, i lund numai valori pozitive adoptm urmtoarea regul:

( ) ( )P 2 12 2 222 2< = < =; P , numit i regula cozilor egale. f(x)

1 - /2 /2 0 x

/22 1 22 /

Din modul cum s-a construit tabelele pentru repartiia ( )n2 , se obine: ( )( )

P

P

212

2 12

222

1 2 12

2

12

< = =

< = =

,

,

/ ;

/ ;

deci

deci

12

n

22

n

Urmeaz c intervalul de ncredere de nivel = 1 - este: ( ) ; ( )

/ ; / ;

n s n s

1 12

1 22

2

22 n-1 n-1

Dac ne intereseaz intervalul de ncredere pentru , atunci inem seama de faptul c variabila n 1 s are densitatea de repartiie:

f xn

x enn

x

( ) ,=

01

2 12

32

2 2

2 , x 0

x > 0

Pentru = 1 - fixat, se pot determina dou numere U1 , U2 astfel nct: P U n U

nx en

n x

U

U

1 2 32

2 21 1

2 12

2

1

2

=

s dx =

/

Se obine astfel intervalul: n n

1 1 sU

sU2 1

; care acoper cu o probabilitate valoarea parametrului .

Valorile numerice se pot determina cu ajutorul cuantilelor unei variabile X2. S presupunem acum c dispunem de dou selecii: x11, x12, , x n1 1 efectuat dintr-o populaie N(m1, 1) i x21, x22, , x n2 2 efectuat

dintr-o populaie N(m2, 2). Pe baza acestor selecii, obinem:

( )( )

xn

xn

x x

xn

xn

x x

jj

n

jj

n

jj

n

jj

n

11

11 1

1 1

2

1

22

21 2

2 2

2

1

1 11

1 11

1 1

2 2

= =

= = = =

= =

s

s

12

22

Intervalul de ncredere pentru m1 m2 n cazul cnd 1, 2 sunt cunoscute Se consider statistica:

( )U X X X X m m X X m mn n

n n11 1 21 2 1 21 2 1 2

12

1

22

2

1 2, ..., , , ..., ; ( ) =

+

care este o variabil normal N(0; 1), de unde urmeaz, parcurgnd punct cu punct calea urmat n cazul unei singure selecii, intervalul de ncredere.

x x zn n

x x zn n1 2 1 2

12

1

22

21 2 1

2

12

1

22

2

+ +

; Intervalul de ncredere pentru parametrul m1 m2 n cazul cnd 1, 2 sunt

necunoscute, dar 12 22 2= = Se consider statistica:

( )U X X X X m mX X m m

n n

n s n sn n

n n11 1 21 2 1 2

1 2 1 2

1 2

1 12

2 22

1 2

1 2

1 1

1 12

,..., , , ..., ;

( )

( ) ( ) =

+

+ +

,

care are repartiie Student cu n1 + n2 2 grade de libertate. Atunci procednd ca n cazul unei singure selecii dintr-o populaie normal N(m, ), obinem pentru un fixat, intervalul de ncredere:

x x t n nn n

n s n sn n

x x t n nn n

n s n sn n

n

n

1 2 12

2

1 2

1 2

1 12

2 22

1 2

1 2 12

2

1 2

1 2

1 12

2 22

1 2

2

2

1 12

1 12

+ + +

+ + + +

+

+

;

;

( ) ( ) ;

( ) ( )

n

n

1

1

Acest interval acoper cu probabilitatea valoarea m1 m2 .

Intervalul de ncredere pentru raportul 12

22 .

Am vzut c funcia de selecie:

U X X X X X X

s

sn n( , , ..., , , , ..., ; , )11 12 1 21 22 2 1

222

12

12

22

22

1 2

=

are o repartiie Snedecor cu n1-1, n2-1 grade de libertate. Am notat:

F ssn1 1 1

22

12

12

22 = , n2

i am vzut c funcia de repartiie este independent de 1, 2,

iar Fn1 1 1 , n2 ca funcie de

2

1

2

este continu i strict cresctoare.

Atunci, pentru = 1 - dat, se pot determina dou numere F(1) i F(2), astfel nct: ( )P F F Fn( ) , ( )1 1 1 21 1 = n2 n ipoteza c adoptm cozi egale, se obine:

P F F Fn n

n1 1 1

11 1 1 1 22

1 1 1

= , , ;; , n2 2 n2 n

Cum evenimentul:

F ss

Fn n1 1 1 1 1 1 1 22

22

12

12

22

, , ;; n2 n2

este echivalent cu evenimentul:

ss F

ss F

n n n n

1

2

2

1 1 12

1

2

2

1

2

2

1 12

1 1

1 2 1 2

, ; , ;

,

rezult c am obinut intervalul de ncredere:

ss F

ss F

n n n n

1

2

2

1 1 12

1

2

2

1 12

1 1

1 2 1 2

, ; , ;

;

,

care, cu probabilitatea , acoper valoarea parametrului: 1

2

2

Observaie. ntruct FFk k k k1 2 2 1

1,

,

= , rezult c intervalul de ncredere pentru raportul 12 22/ mai poate fi scris sub forma:

ss

Fss

Fn n n n

1

2

2

1 1 12

1

2

2

1 122 1 2 1

, ; , ;;

n problemele privind durata de funcionare a unui produs, adesea se utilizeaz o repartiie exponenial.

f xe

x( , ),

,

=

01

x 0

x > 0, > 0

Ne propunem s determinm un interval de ncredere pentru parametrul , care are semnificaie de durat medie de funcionare.

Dup cum tim, funcia caracteristic a unei variabile exponenial negative de parametrul este: X t i( ) (= 1 t)-1

S efectum o selecie de volum n:x1, x2, , xn, din populaia caracterizat de aceast variabil aleatoare i s considerm statistica:

( )U X X X Xn jj

n

1 21

2, ,..., ; = = Funcia ei caracteristic este:

( ) u itUit

X it

X

j

n

Xj

n n

t M e M e M et

itj

j

n

j

j( ) = =

=

=

=

=

= =

2 2

1 1

12

12

Deci: ( )U nt it( ) = 1 2 care este funcia de repartiie a unei variabile ( )22 n (cu 2n grade de libertate).

Urmeaz c funcia de selecie:

( )U X X X Xn jj

n

1 21

2, ,..., ; = = urmeaz o lege de repartiie ( )22 n cu 2n grade de libertate.

Atunci, pentru = 1 - dat, putem determina dou numere: 12 i 22 astfel nct: P X

nx e dxj

j

n

nn x

12

22

1

1 22 12

112

22

= = = =

( ) / Adoptnd ipoteza construirii unui interval cu cozi egale, se obine intervalul de ncredere:

2 2

1

12

2

21

22

2

X Xjj

n

n

jj

n

n

=

=

; ;;

care, cu probabilitatea = 1 - , acoper valoarea parametrului . 7.9 Intervale de ncredere pentru parametri n cazul seleciilor de volum mare Am vzut c determinarea unui interval de ncredere pentru parametrul care apare n legea de repartiie f(x; ) se baza pe construirea unei funcii de selecie care s depind de datele de selecie x1, x2, , xn, de volumul de selecie n i de parametrul de estimat . Pentru a putea determina efectiv intervalul de ncredere se fceau ipoteze suplimentare asupra funciei de repartiie a statisticii, printre care i faptul c aceast funcie de repartiie nu depinde de parametrul de estimat. n cazul unei legi normale N(m; ) se puteau obine relativ simplu intervale de ncredere pentru m sau/i , indiferent dac n (volumul seleciei) era mic sau nu. n multe alte situaii, aflarea funciei de repartiie a statisticii este o problem dificil, ns putem determina repartiia asimptotic a unei statistici care conine parametrul necunoscut i, deci, dac n este suficient de mare, erorile pe care le comitem utiliznd repartiia asimptotic sunt cu totul neglijabile. Fie variabila aleatoare X cu densitatea de repartiie f(x; ) ce caracterizeaz o populaie C, din care se efectueaz selecia de volum n; x1, x2, , xn . n ipoteza c valorile de selecie sunt independente, se obine funcia de verosimilitate:

L(x1, x2, , xn,n; ) = f x jj

n

( ; )=

1

De aici urmeaz c:

ln ln ( ; )L f x j

j

n

==

1

Notnd: yf x

jj=

ln ( ; ), 1 j n ,

se obine:

M(Yj) = M

ln ( ; )f x

=

ln ( ; ) ( ; )f x f x dx

= 0 Presupunem c:

0 < M2 ln ( ; )f x

=

ln ( ; ) ( ; )f x f x dx <

2

Atunci:

D2 ln ( ; )f x

= M2

ln ( ; )f x

,

iar variabila:

ln ln

ln

ln ( ; ) ln ( ; )

ln ( ; )

L M L

D L

f xM

f x

Df x

Y

nD

j j

j

n

j

n

j

j

n

jj

n

=

===

=

=

11

2

1

1 ,

unde am notat D2 ln ( ; )f x

= D

2, n baza teoremei lui Liapunov, este asimptotic N(0; 1).

Deci:

n

jj

n

x

a

b

P aY

nDb e dx

= < 0)

Atunci: f(x; p) = px(1-p)1-x x = 0, 1;p (0; 1) Pe baza unei selecii x1, x2, , xn din populaia C caracterizate de variabila aleatoare X, obinem:

L(x1, x2, , xn; p) = f x p p pjx

j

n xjj

n

jj

n

( ; ) ( )(1 )

= = ==

1 11

1

Dac punem: x kjj

n

= =

1

, atunci ln L(x1, x2, , xn, n;p) = k ln p + (n-k) ln(1-p) i, deci:

ln

( )L

pkp

n kp

k npp p

= =1 1

Cum: Y f x pp

xp

xp

x pp p

= = =

ln ( ; )( )

11 1

, avem imediat:

M Y M X pp p

D Y D X pp p p p

D X p p pp p p p

D

( ) ( )( )

( )( ) ( )

( ) ( )( ) ( )

= =

=

= =

= =

10

11

111

11

2 22 2

22 2

2

Atunci variabila:

Y

nD nDP

p np p

k npp p

kn

p

p pn

jj

n

=

= =

=

1 1 111

1 1ln

( )( ) ( )

are o lege de repartiie N(0; 1) i, deci, pentru n suficient de mare:

P

kn

p

p pn

z z z

Documents

verosimilitate maxima