Upload
lavinia-ioana
View
496
Download
2
Embed Size (px)
DESCRIPTION
verosimilitate maxima - maximum likelihood
Citation preview
Capitolul 7
ELEMENTE DE TEORIA SELECIEI I ESTIMAIEI
7.1. Noiuni generale
Orice cercetare statistic pornete de la o colectivitate sau populaie alctuit din elemente sau indivizi care au o caracteristic general i care se difereniaz prin anumite atribute.
Elementele colectivitii (populaiei) le vom numi uniti. n studiul colectivitilor statistice, n majoritatea cazurilor suntem nevoii s studiem
numai pri din ntreaga colectivitate. Ori, n acest caz, se pune n mod natural ntrebarea dac concluziile ce le obinem concord cu rezultatul ce l-am obine dac studiem ntreaga populaie. Apare astfel problema de a studia modul n care valorile tipice (pe baza crora tragem concluzii) ale colectivitii pariale investigate pot furniza informaii asupra valorilor tipice ale ntregii colectiviti.
Vom presupune, n cele ce urmeaz, c urmrim o anumit caracteristic a colectivitii generale i c aceast caracteristic este descris de o variabil aleatoare X definit pe un cmp de probabilitate {, K, P}, n care elementele mulimii sunt tocmai elementele colectivitii generale, K este un corp borelian de pri ale lui , iar P este o probabilitate pe K.
Dup cum se tie, dac este finit, atunci K coincide cu mulimea prilor lui , iar P este o repartiie discret uniform pe .
Faptul c suntem obligai s cercetm numai o anumit parte din populaie este impus de natura concret a colectivitii. Astfel, dac numrul elementelor populaiei este infinit, n mod necesar nu putem cerceta dect un numr finit i deci obinem o informaie trunchiat.
Dar, n cazul cnd numrul elementelor populaiei este finit, atunci cnd cercetarea calitii elementelor conduce la distrugerea lor, evident c se impune alegerea unui numr finit pentru cercetare.
Dac inem seama de faptul c orice investigare (cercetare) implic i anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte din populaia total.
Vom numi selecie (eantion) o colectivitate parial de elemente alese la ntmplare. Numrul elementelor dintr-o selecie l vom numi volumul seleciei.
Spunem c o selecie este repetat, dac elementul ales la ntmplare este reintrodus n colectivitatea general naintea efecturii urmtoarei alegeri.
Selecia este nerepetat dac, elementele alese nu se mai introduc n colectivitatea general.
S efectum deci o selecie de volum n dintr-o colectivitate C i s notm cu x1, x2, , xn valorile de observaie. Acestea se refer la valorile unei variabile aleatoare X care d legitatea caracteristicii studiate.
Considerate aposteriori, valorile de selecie x1, x2, , xn sunt valori bine determinate ale variabilei aleatoare X.
Privite apriori, valorile X1, X2, , Xn pot fi considerate ca variabile aleatoare independente, identic repartizate cu variabila X, n cazul unei selecii repetate.
Dac selecia este nerepetat, atunci variabilele X1, X2, , Xn sunt dependente, dependena fiind de tipul lanurilor cu legturi complete.
Dac volumul colectivitii generale este suficient de mare iar volumul seleciei este suficient de mic, deosebirea dintre o selecie repetat i una nerepetat este nesemnificativ i, ca atare, n aplicaiile practice o selecie nerepetat se trateaz dup metodele seleciei repetate.
Orice funcie de datele de selecie o vom numi funcie de selecie sau statistic. S considerm acum o selecie de volum n: X1, X2, , Xn i s dispunem n ordine
nedescresctoare aceste date: X(1) X(2) X(n) , unde X(1) = min {X1, X2, , Xn}. X(n) = max {X1, X2, , Xn}. Mulimea {X(1), X(2), , X(n)}, constituie o statistic a ordinei. Pornind de la selecia
considerat, putem defini imediat amplitudinea de selecie. ( )W X X X X Xm m1 2, , ..., ( ) (1)= , care este evident o statistic (o funcie de selecie).
Un rol deosebit de important l are n statistica matematic funcia empiric de repartiie, care se definete astfel:
F x nnn
x( ) ,= x R , unde n este volumul seleciei, iar nx este numrul valorilor de selecie mai mici dect x.
Funciei F(x) = P(: X() < x) i vom spune funcie teoretic de repartiie. Noi vom considera numai selecii repetate. Justificarea teoretic a metodei seleciei apare n mod natural din teorema lui
V.I.Glivenko, cunoscut sub numele de teorema fundamental a statisticii matematice. Teorema lui Glivenko Dac F(x) este funcie teoretic de repartiie, iar Fn(x) funcia empiric de repartiie,
atunci: P F x F xn x R
nlim sup ( ) ( ) =
= 0 1
Teorema lui A.N.Kolmogorov ofer posibilitatea de a evalua distana dintre Fn(x) i F(x).
Teorem. Dac F(x) este o funcie continu, atunci:
lim sup ( ) ( ) ( ) ( )n x
nk kP F x F x
nK e cu < 1 02 2 ,
7.2. Momente de selecie Dac este dat selecia de volum n: X1, X2, , Xn , atunci vom numi momentul de
selecie de ordinul r i-l vom nota Mr , variabila aleatoare:
Mn
Xr jr
j
n
==1
1
Pentru r = 1, obinem media de selecie: M xn
X jj
n
11
1= ==
S considerm media i dispersia variabilei aleatoare Mr :
M M Mn
Xn
M X M Xr jr
j
n
jr
rj
n
( ) ( ) ( )= = == =
1 11 1
Aplicnd acum inegalitatea lui Cebev, obinem:
( )P M M X M X M Xnr r r r < ( ) ( ) ( ) 1 22
2 - , de unde urmeaz c:
( )lim ( )n r r
P M M X < = 1, ceea ce ne conduce la: M M Xr rP
n ( ), fapt care justific nlocuirea n aplicaii a momentelor teoretice de ordinul r, cnd acestea exist, cu momentele empirice de ordinul r, dac n este suficient de mare.
Momentele centrate de selecie, r
Prin definiie: r j rj
n
nx x=
=1
1
( )
Pentru r = 2 se obine dispersia de selecie necorectat:
Ca i n cazul momentelor teoretice, putem exprima momentele centrate de selecie cu
ajutorul momentelor obinuite de selecie i invers:
rh
h
r
j
n
rh
jr h h h
h
r
rh h
jr h
j
n
h
h
r
rh h
r h
nC X X C X
nX
C X M
= =
= ==
=
=
=
1 1 1 1
1
01 0 1
0
( ) ( )
( )
,
deci r
i M rx r r Xr r r r= + + + 1 2 212( ) ... , r N *
Ne propunem acum s determinm repartiia asimptotic a mediei de selecie X . Teorem. Dac se efectueaz o selecie de volum n: X1, X2,, Xn, dintr-o
colectivitate caracterizat de variabila aleatoare X pentru care exist M(X) = m, M[(X m)2] = 2 0,
x mn n
/ B
Y N(0,1)
Demonstraie: S notm YXnj
j= , 1 j n
Atunci: x Y m MXn
mnjj
n
jj= = = ==1 si M(Yj )
2 2 21
1= = =n x xjj
n
( )
( ) ( ) ( ) ( ) ( )( ) ( )[ ] [ ]
D M M M M M Mn
X Mn
X
nM X
nM X M X
nM X
nM X M X
nM X M X
nM X M X
r r r jr
j
n
jr
j
n
j
n
jr
jr
kr
j k j
n
j jr
kr
j k
jr
jr
j
n
r r
22
2
1
2
1
2
21
22 2
2
12
2 22
12
2
1 1
1 1 1 1
1 1
( ) ( ) ( )
( )
( ) ( )
= =
=
= + =
= =
= =
= =
=
p p
( )[ ]M Y m M X mn nj j j j = = =2 22 2
2
( )M Y m M X mn nj j j j = = =
3 3
3
3
3
3 , 1 j n
S considerm condiiile lui Leapunov:
n
jj
n
jj
n n n
n
n
n=
=
=
= =lim
3
2
1 3
2
1
1 2
3
2
1 3
2 1 2 1 61 0
/
/
/
/ /lim lim
Fiind ndeplinit condiia lui Leapunov, rezult conform teoremei:
n
zx
P x mn
x e dz
Excesul de selecie:
24
22 3=
Coeficientul de corelaie de selecie (empiric):
( )( )( ) ( )
=
=
==
1
1 11
2 2
11
nX X Y Y
nX X
nY Y
j jj
n
j jj
n
j
n
7.3. Selecia dintr-o populaie normal N(m, ) n multe situaii, ne intereseaz repartiia exact a diverselor statistici, Tn(X1, X2,
,Xn), chiar cnd n este mic. Toate rezultatele obinute anterior rmn valabile, inclusiv cele referitoare la repartiie asimptotic a unor funcii de selecie normate convenabil.
Vom presupune acum c populaiile din care se efectueaz seleciile sunt normale N(m, ) i, n aceste condiii, vom cuta s stabilim repartiiile exacte ale celor mai importante funcii de selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit n practic este cel al erorilor de observaie ale msurtorilor, care, dup cum se tie, sunt repartizate dup o lege normal.
Teorem. Dac X1, X2, ,Xn este o selecie de volum n dintr-o populaie caracterizat
de o variabil aleatoare X N(m, ), atunci media de selecie Xn
X jj
n
==1
1
are o lege de
repartiie
N mn
,
Demonstraie. Cum Xj N(m, ), 1 j n, rezult c:
Xj
itm t
t e( ) = 2 2
2 Atunci:
XitX
itn
X
j
n itn
X
j
n
Xj
n itn
mt
nitm
tnt M e M e M e
tn
e ej
j
n
j
j( ) ( ) ,= =
=
=
= =
=
= = =
1
1 1 1
2 21
2 2
2
2 2
care este funcia caracteristic a unei variabile aleatoare normale N m
n,
Urmeaz c densitatea de repartiie a variabilei X este:
f x n eXn x m
( ) ,=
22
2
x R
S artm c variabila abatere normat Z X mn
= / este repartizat normal N(0; 1). ntr-adevr:
( ) Z itZ it n X m it n i t nt M e M e M e e( ) = = =
=
m X
= = =
e t n e e e
i t n
X
i t n nn
ti t n
m m - t m2 2
2
2
2 2 ,
care este funcia caracteristic a unei variabile normale N(0; 1).
Deci densitatea de repartiie a variabilei Z X mn
= / este:
f z eZz
( ) ,= 12
2
2
z R Teorem. Dac X1, X2, ,Xn este o selecie de volum n, dintr-o populaie normal
N(m, ), atunci X i 2 sunt variabile aleatoare independente. Demonstraie. Putem presupune c m = 0, ntruct momentul de selecie 2 este
invariabil la o schimbare a originii.
ntruct: ( )2 21
1= =n X Xkk
n
,
s exprimm:
( )X X X X X nX X n Xk k kkn
k
n
k
n
kk
n
kk
n
= + = === = =
2 2
1
2
11
2
1 1
2
2 1
ns:
( )
Xn
X nn
XX
nnn
XX
n
X X
kk
n
kk
n kk
n
kk
n
n n
2
1 1
2
12
2
23
2
12
1 11
21 2
12
= == =
=
+
+
+ + ...
Deci:
( ) ( )X X n n XX
nnn
XX
n nX Xk
k
n kk
n
kk
n
n n =
+
+ +
== =
21
12
2
23
2
121
121 2
1...
Urmeaz c:
( )Xn
X nn
XX
nnn
XX
nX Xk
k
n
kk
n kk
n
kk
n
n n2
1 1
2
12
2
23
2
121 1
121 2
12= =
= = = +
+
+ + ...
n membrul doi al acestei egaliti avem o sum de n forme ptratice pozitiv definite,
fiecare avnd rangul egal cu unu. Deoarece suma rangurilor acestor forme ptratice pozitiv definite este egal cu n, iar variabilele Xk N(0, ) , 1 k n, din teorema lui Cochran (pe care nu o vom demonstra)* rezult c variabilele:
* Teorema lui Cochran. Fie X1, X2, , Xn variabile aleatoare independente, repartizate normal N(0, ) i Q1, Q2, , QS , forme ptratice n X1, X2, , Xn avnd rangul k1, k2, , kS , respectiv. Dac: Q Xj
j
S
kk
n
= = =
1
2
1
, atunci
condiia necesar i suficient ca variabilele Q1, Q2, , QS s fie independente este ca k1+ k2 + + kS = n.
( )
Y nn
XX
n
Y nn
XX
n
Y X X
Yn
X
kk
n
kk
n
n n n
n kk
n
1 12
2 23
1 1
1
11
21 2
12
1
=
=
=
=
=
=
=
...................................................
sunt independente.
Se constat imediat c: 2 21
11==
n Ykkn
i, prin urmare, rezult c X i 2 sunt independente. Teorem. Variabila aleatoare n2 are o repartiie 2 cu n 1 grade de libertate i parametrul , adic are densitatea de repartiie:
f x x en
n
n
n x( )
,
=
0
1
1
12
12
12
x 01
2, x > 0n-1
2
Variabila aleatoare n2
2 are o repartiie cu n 1 grade de libertate i parametrul = 1. Variabila aleatoare = 2 are densitatea de repartiie:
f x x en n
nnx( )
,
=
0
1
2
2
12
2 2
x 0
2n
2, x > 0
n-12
n-12
Demonstraie. Din 2 12
22
12
= + + + Y Y Yn
n... rezult: n Ykk
n2 21
1
==
, unde Y1, Y2,, Yn-1 sunt variabile aleatoare independente, repartizate normal, de parametri M(Yk) = 0; D2(Yk) = 2. Deci n2 urmeaz o lege de repartiie X 2 cu n 1 grade de libertate i parametru . De asemenea:
n Y
M Y Y
k
k
n
k k
22
2
1
1
0 1
=
=
=
=
; D2
i, deci, variabila aleatoare n2 /2 urmeaz o lege de repartiie a crei densitate este:
f x x enn x
( ),
=
0
12
12
12
x 01
2, x > 0n-1
2
Pentru a obine densitatea de repartiie a variabilei = 2 , pornim de la funcia de repartiie:
( )P( x nx
ny e dyn
n
n ynx
< =
),
,
0
1
2 12
2
12 1
32 2
0
2
2
x 0P n , x > 0
0 x 0
, x 0
2
Derivnd, obinem:
f xn
x en
nnx
( )
,
=
0
12
1
2 2
2
2
x 0
2n
2, x > 0
n-12
n-12
S considerm acum ( )*2 21
1= =n X mkk
n
, unde X1, X2, , Xn este o selecie de
volum n dintr-o colectivitate normal N(m, ). Atunci: n x mk
k
n
*2
2
2
1
= =
n membrul al doilea avem o sum de ptrate de variabile Y X mk k= independente,
repartizate normal N(0, 1). Deci, variabila aleatoare n*2
2 urmeaz o lege de repartiie ( )n2 cu parametrul = 1 S considerm acum variabila aleatoare:
( )s n X Xkkn
2 2
1
11
= = pe care o numim dispersia de selecie corectat. ntruct:
( ) ( ) ( )[ ] ( ) ( ) ( )( ) ( ) ( )X X X m X m X m X m X m
n X m X m n X m
kk
n
k k kk
n
k
n
k
n
kk
n
= = +
+ = = ===
=
2
1
2 2
111
2 2
1
2
2
rezult c:
( )/
n s X m X mn
k
k
n =
=
1 22
2 2
1
Dar, X mkk
n
=
2
1
este o variabil ( )n2 iar X mn
/
2
este o variabil (1)2 independent de ( )n2 .
Rezult c ( )n s12
2 urmeaz o lege de repartiie ( )n12 cu parametrul = 1
Am vzut c M n nn n( ) ; ( )( ) ( ) 2 2 2= = D2 cnd parametrul este 1. Atunci M n n
22 1
= , de unde rezult:
M nn
n n D n( ) ; ( ); ( ) ( ) 22 2
2 42
21 2 1 2 1=
= = D
n2 2 i deci:
D nn
22
4
22 1( ) ( ) =
n acelai timp:
M n s n( ) =
1 12
2 , care conduce la: M(s2) = 2
D n s n22
21 2 1( ) ( ),
= adic D s n
2 2421
( ) =
ntruct x mn
N n = / ( , ), ( )0 1 2 1
2 iar (n -1)s2
Urmeaz c: x m
n
n
x mn
n sn
x ms nn
=
=
/ /( )( )
/( )12 2
2111
are o lege de repartiie Student cu n 1 grade de
libertate. S presupunem c dispunem de dou colectiviti, C1 i C2, caracterizate de o variabil
aleatoare X1 N(m1, T1) respectiv X2 N(m2, T2), X1 i X2 independente. Din colectivitatea C1 se efectueaz o selecie de volum n1: X11, X12, , X n1 1 , iar din
colectivitatea C2 se efectueaz o selecie de volum n2: X21, X22, , X n2 2 .
Pe baza acestor selecii, obinem mediile de selecie X1 i X 2 , dispersiile de selecie:
( )s n X xjjn
12
11 1
2
1
11
1= = , respectiv ( )s n X xkkn
22
22 2
2
1
11
2= = . Variabila aleatoare X1 X 2 urmeaz o lege normal: N m m
n n1 212
1
22
2
+
,
. De aici rezult c: x x m m
n n
N1 2 1 212
1
22
2
0 1 +
( ) ( , )
Evident c: ( )M X X m m1 2 1 2 = D X X D X D X
n n2
1 22
12
212
1
22
2
( ) ( ) ( ) = + = +
Dac 12 22 2= = , atunci variabila aleatoare [ ]1 1 12
1 12
2 22
( ) ( )n s n s + are o repartiie 2 cu n1 + n2 2 grade de libertate.
Rezult c variabila aleatoare: ( ) ( )( )
X X m m
n n
n s n sn n
X X m m
n s n sn n
n nn n
1 2 1 2
12
2
22
2
1 12
2 22
1 22
1 2 1 2
1 12
2 22
1 2
1 2
1 21 12
1 12
+
+ +
= + +
+
( ) ( )
( )
( )
( ) ( )
urmeaz o lege de repartiie Student cu n1 + n2 2 grade de libertate. n virtutea teoremei conform creia dac variabilele ( ) ( ),1 22 2 sunt independente, atunci variabilele aleatoare ( ) ( )/ : /1 22 1 2 2 urmeaz o lege de repartiie Snedecor cu 1, 2 grade de libertate, respectiv, rezult c variabila:
F
n snn sn
ssn1 1 1
1 12
12
2 22
22
12
22
1111
=
=;( )( )( )( )
n2
are o lege de repartiie Snedecor (este o variabil Fn1 1 1 ; n2 cu n1-1, n2-1 grade de libertate respectiv. n aplicaiile practice trebuie s se in seama de faptul c tabelele pentru repartiia Snedecor se construiesc pentru valori ale variabilei Fn1 1 1 ; n2 mai mari dect unu.
Ca atare este necesar s lum la numrtor s s12
22> i, totodat, s avem grij s nu
inversm ordinea gradelor de libertate. Inversiunea ordinei gradelor de libertate este echivalent cu:
F ss s
sFn n1 1
1 122
12
12
122
1 1
1 1
= = =;
; n
n2
2
ceea ce justific de ce s-au construit tabele numai pentru F 1 2 1, > . 7.4. Elemente de teoria estimaiei n toate aplicaiile statisticii matematice, n economie, n tehnic i, n general, n
tiinele experimentale este necesar s cunoatem legitatea dup care are loc evoluia fenomenului studiat, adic legea de repartiie a variabilei aleatoare prin intermediul creia este cuantificat caracteristica studiat a fenomenului. Adesea, cunotinele teoretice sau experiena practic n domeniul investigat ne dau dreptul s admitem c forma legii de repartiie este cunoscut. Pentru a utiliza efectiv o astfel de lege de repartiie, va trebui cunoscut care dintre funciile de repartiie din familia celor de o form dat este cea care trebuie efectiv utilizat. Cu alte cuvinte, trebuie precizat valoarea numeric a parametrului (sau valorile numerice ale parametrilor, n cazul unei legi de repartiie ce depinde de mai muli parametri). Pentru a nelege mai bine cum stau lucrurile, s dm unele exemple.
Dac variabila aleatoare X reprezint numrul de apeluri la o central telefonic ntr-un interval de timp determinat, ales ca unitate, atunci X are o lege de repartiie Poisson:
Xx
e ax
ax:!
, x = 0, 1, 2, ...
adic ( )P X x a e ax
ax
= = ;!, pentru x = 0, 1, 2, ...; a > 0 i avem o lege de repartiie ce
depinde de parametrul a > 0.
n cadrul unui proces de producie, o caracteristic important o constituie procentul p de rebut. Dac X este variabila aleatoare ce d numrul de produse necorespunztoare ce se obin ntr-o selecie repetat de volum n, atunci: ( )P X x p C p pnx x n x= = ; ( ) ,1 x = 0, 1, 2, ... , n S considerm un alt exemplu, cu o variabil aleatoare care admite o densitate de repartiie. Fie T o variabil aleatoare ce reprezint durata de funcionare fr cderi a unei anumite componente. n multe situaii, variabila T este caracterizat de densitatea de repartiie:
f t eT
t
( ; ) ,
,
= >
1 0
0
t
t 0 > 0
Este vorba, iari, de o lege de repartiie de form exponenial cu un singur parametru > 0 .
n fine, dac X reprezint abaterile unei piese prelucrate de la cota nominal menionat n fia tehnologic, atunci X urmeaz o lege normal N(m, ) a crei densitate este:
f x m eX m
( ; , ) ,( )
= 1
2
2
22 x R ,
care este o lege de repartiie cu doi parametri (m, ) Rx(0, ). n toate aceste exemple s-a specificat forma, fr a se preciza care anume repartiie este adic valorile exacte ale parametrilor ce intervin. Ori de cte ori avem forma funciei prin care se exprim legea de repartiie, spunem c avem o problem specificat. Cunoaterea valorilor parametrilor conduce la cunoaterea complet a legii de repartiie adic avem o problem complet specificat. Operaia de evaluare a parametrilor poart numele de estimare a parametrilor, care se face pe baza unei selecii de volum n: X1, X2, , Xn, extras din populaia caracterizat de variabila aleatoare X, cu legea de repartiie specificat. Valorile parametrilor unic determinate pe baza seleciei X1, X2, , Xn, le vom numi estimaii punctuale. Valorile parametrilor le estimm cu ajutorul unei statistici (o funcie de datele de selecie) construite cu ajutorul seleciei X1, X2, , Xn i pe care o vom nota Tn(X1, X2, , Xn). Pentru a preciza ideile, vom presupune c selecia de volum n s-a efectuat dintr-o populaie caracterizat de o variabil aleatoare X care admite legea de repartiie dat de f(x; ), unde f(x; ) este o densitate de repartiie n cazul c exist densitate sau, n cazul unei variabile discrete este P(X = x; ). Cu ajutorul funciei de selecie Tn(X1, X2, , Xn) dorim s estimm parametrul (forma fiind cunoscut). Este clar c dispunem numai de informaie parial asupra populaiei i, ca atare, cu ct volumul de selecie crete, cu att informaia este mai bogat. Deci, Tn(X1, X2, , Xn) trebuie s se apropie tot mai mult de valoarea parametrului , fiind vorba aici de un proces de convergen. Evident c aceast convergen trebuie s aib loc n probabilitate, adic: ( )
nn nP T X X X
< =lim ( , , ..., )1 2 1
Valoarea luat de Tn(X1, , Xn) pentru valori bine determinate ale variabilelor X1, X2, , Xn o vom numi estimaie a parametrului . Din cele prezentate rezult c funcia de estimaie este de natur teoretic, n timp ce estimaia este de natur empiric.
Dac Tn(X1, X2, , Xn) P
n spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru parametrul .
Cum exist o infinitate de funcii Tn(X1, X2, , Xn) care converg n probabilitate ctre , pentru a mri precizia, vom recurge la convergene mai tari, deci care asigur convergena n probabilitate. O atare convergen este convergena n medie ptratic, care prezint avantajul c este comod n calcul. Funcia de estimaie Tn(X1, X2, , Xn) este o funcie de variabilele aleatoare independente X1, X2, , Xn i, deci, o variabil aleatoare cu o funcie de repartiie. Cum am presupus c lucrm cu convergen n medie ptratic, am admis implicit c Tn(X1, X2, , Xn) are momente de ordinul doi cel puin. Definiie. Spunem c statistica Tn(X1, X2, , Xn) este o estimaie nedeplasat a parametrului dac: M(Tn(X1, X2, , Xn)) = . Spunem c statistica Tn(X1, X2, , Xn) este o estimaie deplasat a parametrului , dac: M(Tn(X1, X2, , Xn)) = + h(n) Funcia h(n) pe care o vom numi deplasare a estimaiei are proprietatea c ( )h n = n 0. Este clar c ntre eroarea de estimaie i deplasare exist o clar deosebire. n timp ce eroarea de estimare este Tn(X1, , Xn) - i este o variabil aleatoare, deplasarea h(n) = M(Tn(X1, X2, , Xn)) - este o funcie numeric, care depinde de volumul de selecie i eventual de parametrul de estimat i care reprezint o eroare sistematic n procesul de estimare. Dac deplasarea h(n) > 0 spunem c Tn(X1, X2, , Xn) este pozitiv deplasat, iar dac h(n) < 0 spunem c Tn(X1, X2, , Xn) este negativ deplasat. Din definiia funciei numerice deplasare, h(n), rezult importana cunoaterii n cazul seleciilor de volum mic. Exemple de estimaii nedeplasate sau deplasate putem pune imediat n eviden pe baza unor rezultate pe care le-am obinut deja.
Aa de exemplu, Tn(X1, X2, , Xn) = X nX j
j
n
==1
1
este o estimaie nedeplasat a
mediei teoretice, m , a unei variabile aleatoare: ( )M X m= De asemenea, frecvena relativ k
n este o estimaie nedeplasat a probabilitii, p, de
apariie a unui eveniment n cazul unei repartiii binomiale:
M kn n
M k npn
p = = =
1 ( )
Am vzut c, dac efectum o selecie dintr-o populaie normal i notm:
2 21
1= =n X Xjj
n
( ) (dispersia de selecie necorectat) i cu:
sn
X Xjj
n2 2
1
11
= = ( ) (dispersia de selecie corectat), atunci M
n( ) , ) 2 2
22= = M(s2
Rezult c 2 este o estimaie negativ deplasat a dispersiei teoretice 2, n timp ce s2 este o estimaie nedeplasat a dispersiei teoretice 2 .
Definiie. Spunem c Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul , dac: M(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn)) n 0
Spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru , dac: M(Tn(X1, X2, , Xn)) = + h(n) , h(n) n 0 D2(Tn(X1, X2, , Xn)) n 0 Utiliznd rezultate obinute anterior, se deduce c momentul de selecie de ordinul r,
Mr este o estimaie absolut corect pentru momentul teoretic de ordinul r, Mr(X). ntr-adevr: M( Mr ) = Mr(X)
D2( Mr ) = M X M X
nr r
n2
2
0( ) ( ) n particular, X este estimaie absolut corect pentru M(X) = m.
M(s2) = 2 M(2 ) = 22
n
D sn n
2 2421
0( ) = D n
n n2
2 242 1 0( ) ( ) =
Urmeaz de aici c s2 este o estimaie absolut corect pentru 2, n timp ce 2 este numai corect pentru 2 (n selecii dintr-o populaie normal N(m, )).
Este clar c vom prefera totdeauna s avem o estimaie nedeplasat pentru un parametru . Dar, pot exista, pentru acelai parametru , mai multe estimaii nedeplasate i atunci este natural s o preferm pe aceea care are dispersia mai mic, ntruct valorile statisticii Tn(X1, X2, , Xn) se vor grupa mai bine n jurul valorii . n felul acesta, ne punem problema existenei unei estimaii nedeplasate care s aib cea mai mic dispersie i ct de mic poate s fie dispersia unei estimaii.
n acest sens, dm binecunoscuta teorem a minimului dispersiei, cunoscut i sub numele de teorema lui Rao-Cramer.
7.5. Teorema Rao-Cramer.Dac Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul din repartiia dat de f(x; ) a variabilei aleatoare X (discret sau continu), atunci:
D2(Tn(X1, X2, , Xn)) 1nI( ) , unde I( ) este cantitatea de informaie pe o
observaie i are expresia: I M f x M f x( ) ln ( ; ln ( ; )
=
=
2 2
2
Demonstraie. Din relaia: f x dx( ; ) =
1 se obine, prin derivare n raport cu parametrul :
f x dx f x dx( ; ) ( ; )
= = =0 0 0 sau
lnf(x; ) , adic M lnf(x; )-
Estimaia Tn(X1, X2, , Xn) fiind nedeplasat, obinem:
M(Tn(X1, X2, , Xn))= ... ( , , ..., ) ( ; ) ...T X X X f x dx dxn n j nj
n
1 2 11
=
= Derivnd, i aici, n raport cu , se obine:
... ( , , ..., ) ln ( ; ) ( ; ) ...T X X X f x f x dx dxn nj
n
nj
n
= = =1 2
11
1
1 Pe de alt parte:
...ln ( ; )
( ; ) ...
f x
f x dx dxjj
n
jj
n
n=
= =
11
1
0
nmulind aceast relaie cu i scznd din relaia anterioar, obinem: [ ]... ( , , ... ) ln ( ; ) ( ; ) ... ,T X X X f x f x dx dxn n j
j
n
j nj
n
1 21
11
1 =
= =
adic:
( )M T X X X f xn n jj
n
( , , ..., )ln ( ; )
1 21
1
=
=
Aplicnd inegalitatea lui Schwarz, se obine:
1 2 1 21
21 2
2
1
=
=
M T X X X f x
D T X X X Df x
n nj
n
n nj
j
n
( , , ..., ) ln ( ; )
( ( , , ..., ) )ln ( ; )
ntruct M(Tn(X1, X2, , Xn)) = i X1, X2, , Xn sunt independente, obinem: D2(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn))
D D nD
nM nI
j
n
j
n2
1
2
1
2
2
ln ; ) ln ; ) ln ; )
ln ; )( )
f(x f(x f(x
f(x
j j
= =
=
=
=
=
=
Deci: D2(Tn(X1, X2, , Xn))
12
nM
ln f(x; )
S artm c:
I M f x M f x( ) ln ( ; ) ln ( ; )
=
=
2 2
2
ntr-adevr, din: f x dx( ; )
= 0 rezult: 2
2 0f x dx( ; )
= ns:
2
2
2
2
2
2
2
f x f x x f x f x f x
x f x f x f x x f x
( ; ) ( ; ) ( ; ) ( ; ) ln ( ; ) ( ; )
( ; ) ( ; ) ln ( ; ) ( ; ) ( ; ) ( ; )
= =
= +
+ = +
lnf
lnf lnf
Deci:
2
2 2
2
0ln ( ; ) ( ; ) ln ( ; ) ( ; )f x f x dx f x f x dx+ =
i, deci:
M f x M f x
ln ( ; ) ln ( ; )
=
2 2
2
Definiie. Spunem c estimaia Tn(X1, X2, , Xn) este eficient dac:
D2(Tn(X1, X2, , Xn)) 1nI( )
Fie acum Tn(X1, X2, , Xn) o estimaie absolut corect oarecare. Atunci, vom numi eficien a lui , raportul:
e(Tn(X1, X2, , Xn)) =
1
2nI
D( )
(
T (X , X , ... , X ) )n 1 2 n
Este evident c: 0 e (Tn(X1, X2, , Xn)) 1 i Tn(X1, X2, , Xn) este eficient dac e(Tn(X1, X2, , Xn)) = 1.
Cum eficiena este o funcie de volumul n a seleciei i cum la limit trebuie s obinem cea mai mare informaie posibil, rezult c, dac:
lim (n
e T (X , X , ..., X )) = 1 n 1 2 n , atunci estimaia Tn(X1, X2, , Xn) este asimptotic
eficient. Ilustrm noiunea de eficien a unei estimaii prin dou exemple prin care s
cuprindem o repartiie care admite densitate de repartiie i o repartiie de tip discret.
(1) S se arate c Tn(X1, X2, , Xn) = X nX j
j
n
==1
1
este o estimaie eficient pentru
parametrul m al repartiiei normale N(m; ); (2) S se arate c: Tn(X1, X2, , Xn) = X este o estimaie eficient pentru
parametrul al unei repartiii Poisson. (P(X = x / ) = e
x
x
!, x = 0, 1, 2, ... )
Soluie
(1) Din consideraii anterioare, tim c: M X m Xn
( ) ; ( )= = D2 2
Rmne s artm c: D XnI
2 1( )( )
=
f x m eX m
( ; , ) ,( )
= 1
2
2
22 x R, > 0
ln ( ; , ) ln( ) ( )f x m X m = 2
2
2
2
[ ]
ln ( ; , ) ; ln ( ; , )
( )
f x mm
X m f x mm
M X m
M X m
=
=
=
= =
2
2
2
2
42
2
4 21 1
M
=I m( ) 12 i deci: 1 1
2
2
nI m n n( ) /= =
Cum D XnI m
2 1( )( )
= , rezult c X este estimaie eficient pentru parametrul m.
(2) Pentru o repartiie Poisson, D X D Xn n
22
( ) ( )= =
ln (P X x= | ) ln!
ln ln != = + ex
x xx
ln ( )
( ) ( ) ( )
P X x x
I M x M x x M X M X
= = +
=
= +
= + =
+ + =
1
1 2 1 1 2 1
2 1 1
2 2
2 22
2
2
Cum D XnI
2 1( )( )
= , rezult eficiena estimaiei X pentru parametrul . Am vzut, aadar, cum putem s analizm estimaiile parametrilor n funcie de
proprietile pe care le au, s le clasificm. Vom cuta acum s punem n eviden modaliti sau metode de obinere a unor estimaii. n cele ce urmeaz, ne vom opri asupra a dou metode de obinere a estimaiilor pe care le vom numi estimaii punctuale: metoda momentelor i metoda verosimilitii maxime.
7.6. Metoda momentelor Am vzut c momentele de selecie de ordinul r sunt estimaii absolut corecte ale
momentelor teoretice de acelai ordin: M M M X
D M M X M Xn
r r
rr r
n
( ) ( )
( ) ( ) ( )== 2 2
2
0
Este natural ca, pentru n suficient de mare, s lum n locul momentului teoretic momentul empiric de acelai ordin.
S presupunem c am efectuat o selecie de volum n:x1, x2, , xn, dintr-o populaie caracterizat de variabila aleatoare X care are legea de repartiie dat de f x k( ; , , ..., ) 1 2 , unde f x k( ; , ..., ) 1 este densitatea de repartiie, dac aceasta exist, sau P X x k( ; , , ..., )= 1 2 , dac variabila X este de tip discret. Am considerat, desigur, cazul cnd variabila X este unidimensional i legea depinde de k parametri. Admitem c variabila aleatoare X are moment cel puin pn la ordinul k inclusiv. Atunci: M Xs k( , , ..., ) 1 2 sunt funcii de parametrii necunoscui 1 2, , ..., .k Alctuind sistemul de ecuaii:
M X M
nX
s k s
js
j
n
( , , ..., ) , 1 2
1
1
= =
=
1 s k ,
unde Ms
i presupunnd c sistemul admite soluii reale, se obin: $ $ ( , , ..., ); s s kM M M= 1 2 1 s k care sunt estimaiile parametrilor 1 2, , ..., .k prin metoda momentelor. S observm c nu este necesar s se ia neaprat primele k momente, din contr, putem lua alte momente, inclusiv momente centrate, care s constituie ns un sistem de k ecuaii cu necunoscutele 1 2, , ..., .k i din care s se obin ct mai uor posibil soluia cutat. Vom da acum unele exemple care s ilustreze metoda propus. Exemplu. S se estimeze prin metoda momentelor, pe baza unei selecii de volum n:x1, x2, , xn, extras dintr-o populaie caracterizat de:
[ ][ ]f x( ; , )
, ,
,
1 22 1
2
2
1
0=
dac
dac
x
, x
1
1
, a parametrilor 1 2, .
Soluie. ntruct
( )M X X 1 2 1 2 12 1 2 222 3, ; ( )= + = + + M2 , avem sistemul de ecuaii:
1 21
12
1 2 22
2
2
3
+ =+ + =
M
M,
a crui soluie este:
( ) ( )$ ; $$ ( ) ; $ $ ( )
1 1 2 12
1 2 12
1
3 3
3 1 3 1
= = +
= = + M M M M M M
x s nn
x s nn
, sau
2
2
Lungimea intervalului se estimeaz prin: 2 1 2 3 1 = s nn( )
La aceleai rezultate se ajunge mai simplu, dac lum sistemul:
( ) ( ) 1 2
2 12
2 2 12
2
12
+ = = =
x
M M ,
sau:
1 2
2 1 2
2
2 3
+ = =
x
i se continu, ajungndu-se la acelai rezultat. Exemplu. Estimarea parametrilor a, b din repartiia Beta, care are densitatea:
f x a b a ba b
x xa b( ; , ) ( , )( ) ( )
( ) ,=
0
11 1 , x (0, 1)
x (0, 1) ,
a > 0, b> 0. Prin calcul direct, se obine:
M X a b aa b
D X a b aba b a b
1
22 1
( | , )
( | , )( ) ( )
= += + + +
Estimaiile $, $a b se obin rezolvnd sistemul de ecuaii: a
a bX
aba b a b
s+ =
+ + + =
( ) ( )22
1
De aici rezult:
$ ( ) ; $a X Xs
X=
2
21 1 b = (1 - X) X(1 - X)
s2
Exemplu. Cazul unei repartiii normale N(m; ). Dup cum se tie: M(X| m, ) = m M2(X| m, ) = m2 + 2
i avem, astfel, de rezolvat sistemul de ecuaii:
m Xm M M X
=+ =
= =2 2 2 2 2 2 care conduce la:
m = X2
$$
7.7.Metoda verosimilitii maxime Metoda momentelor pe care am prezentat-o este simpl i uor de aplicat. Prezint, totui, o serie de neajunsuri n ceea ce privete calitile estimatorilor obinui pe aceast cale. De aceea, statisticienii au cutat alte metode de obinere a estimaiilor. Una dintre acestea este metoda verosimilitii maxime elaborat R.A.Fisher i prezint avantajul unui plus de eficacitate. S considerm pentru nceput cazul unui singur parametru i c legea de repartiie a variabilei X ce caracterizeaz populaia din care s-a efectuat selecia de volum n, x1, x2, , xn este dat de f(x; ). Atunci, repartiia vectorului aleator (x1, x2, , xn) este:
P(x1, x2, , xn; ) = f x jj
n
( ; )=
1
, pe care o considerm ca funcie de . Valorile x1, x2, , xn fiind considerate ca date, ele fiind rezultatul experienei, vom considera ca valoare cea mai verosimil a parametrului , valoarea pentru care probabilitatea P(x1, x2, , xn; ) devine maxim, ceea ce ne conduce la faptul c estimaia de verosimilitate maxim , este soluia ecuaiei:
P x x xn( , , ..., ; )1 2 0= Funcia P(x1, x2, , xn; ) poart numele de funcie de verosimilitate. ntruct lnP(x1, x2, , xn; ) i P(x1, x2, , xn; ) sunt n acelai timp cresctoare sau descresctoare, estimaia de verosimilitate maxim se obine ca soluie a ecuaiei.
ln ( , , ..., ; )P x x xn1 2 0=
Funcia L(x1, x2, , xn; ) = ln P(x1, x2, , xn; ) = ln ( ; )f x jj
n
=
1
o vom numi tot funcie de verosimilitate. n cazul cnd repartiia unidimensional depinde de mai muli parametri, f x k( ; , , ..., ) 1 2 , funcia de verosimilitate devine: L x x xn k( , , ..., ; , , ..., )1 2 2 1 , iar
estimaiile de verosimilitate maxim se obin ca soluii ale sistemului de ecuaii:
L(x , x ,... , x ; , , .., ) ; 1 j k1 2 n 1 2 k
j
= 0 Rezolvnd sistemul, se obin: $ $ ( , , ..., ), j j nx x x= 1 2 1 j k , estimaii de verosimilitate maxim.
Ecuaiile L
j
= 0, 1 j k poart numele de ecuaii de verosimilitate.
Fr a intra n amnunte, vom sublinia unele proprieti ale estimaiilor de verosimilitate maxim, care le recomand pentru aplicaii. n cazul unui singur parametru , estimaia de verosimilitate maxim este consistent n probabilitate, dar, pentru valori mari ale lui n, repartiia ei este aproximativ normal, cu media M( $) = i cu dispersia: D
nM f x2
2
1( $)ln ( ; )
=
Altfel spus, estimaia $ obinut prin metoda verosimilitii maxime este asimptotic eficient, n sensul c nu exist o alt estimaie asimptotic normal cu dispersie mai mic. Dac parametrul admite o estimaie eficient, atunci aceasta se obine n mod unic, rezolvnd ecuaia de verosimilitate. Exemple. Pe baza unei selecii de volum n, s se estimeze parametrul din repartiia Poisson:
P X x ex
x x P X x ex
e
x
x
n jj
n x nx
jj
nj
nj
j
n
( )!
,
, , ..., ; ) ( ; )! !
= =
= = = =
=
==
=
x = 0,1,2, ...
P(x1 21
1
1
1
lnP(x1, x2, , xn; ) = L(x1, x2, , xn; ) = + ==n x xj j
j
n
j
n ln ln ( !)11
L x x x nx
nx
nj
j
n
jj
n
( , , ..., ; )1 2 1
1 0
= +
+ =
=
=
,
iar
are soluia: $
( , , ..., ; )
( , , ..., ; $)
= =
=
= 0, z1 = z2 nu convine i, deci, z1 = -z2; z2 = z .
n acest caz, intervalul de ncredere devine:
x zn n
; x + z ; z se determin din relaia: (z) - (-z) = , de unde urmeaz:
2(z) 1 = , sau (z) = 1 21 1
21
2+ = + =
Deci: z este z1
2
, 12
cvantila unei repartiii normale N(0, 1). n final, intervalul de ncredere pentru m, cu nivelul de ncredere = 1 - este:
x zn n
1 2 1 2
; x + z Intervalul de ncredere pentru m cnd este necunoscut. n acest caz, se consider statistica:
T(x1, x2, , xn; n, m) = X ms n
/, s
nx xj
j
n2 2
1
11
= = ( ) Dup cum am vzut, variabila X m
s n
/ urmeaz o lege de repartiie Student cu n-1
grade de libertate. Dar legea de repartiie Student nu depinde de m i n plus X ms n
/ este
funcie continu i strict descresctoare de m. Atunci, pentru un dat, se pot determina numerele t1 i t2 astfel nct:
P t X ms n
t
n
n nt
ndt
n
t
t
1 2
2 22
1 12
11
1
2
=
+
=
/ ( )/
Cum evenimentul t1 X ms n
/ t2 este echivalent cu evenimentul:
x t sn
m x t sn
2 1 , rezult c:
P( x t sn
m x t sn
2 1 ) = i, deci, am determinat un interval de ncredere:
x t sn
x t sn
2 1; care, cu probabilitatea , acoper parametrul m.
Ca i n cazul anterior, punem condiia ca lungimea intervalului s fie minim, cu restricia:
n
n nt
ndt
n
t
t2
1 12
11
2 2
1
2
+
=
( )
Aplicnd, i de data aceasta, metoda multiplicatorilor lui Lagrange se obine din:
H t t sn
t t
n
n nt
ndt
n
t
t
( , , ) ( )( )
1 2 2 1
2 22
1 12
11
1
2
= +
+
i
H t t H t t( , , ) , ( , , )1 2
1
1 2
2
0 0 t
t
= =
c t1 = - t2 , t2 = t1
2
, iar intervalul de ncredere devine:
x t sn
t snn n
1 2 1 1 2 1 ; ;
; x +
Intervalul de ncredere pentru 2
Se consider statistica U(X1, X2, , Xn ; 2) = ( )n s12
2 care, dup cum se tie, are o lege de repartiie ( )n12 (cu n-1 grade de libertate).
Atunci pentru = 1 - fixat se pot determina dou numere 12 i 22 astfel nct: P n s
nx en
n x
12
2
2 22
2
21
21 1
22
12
22
=
= ( )
dx
Dar funcia de repartiie a variabilei ( )n s12
2 este independent de 2 i n plus
( )n s1 22 este funcie continu i strict descresctoare de
2 ceea ce ne conduce la faptul c
evenimentul:
12 ( )n s12
2 22 este echivalent cu evenimentul:
( ) ( )n s n s 1 12
22
22
12
Deci: P( ( ) ( )n sX
n sX
1 12
22
22
12 ) = , adic am determinat un interval:
( ) ; ( )n s n s
1 12
22
2
12 care, cu o probabilitate , acoper parametrul
2.
S stabilim valorile 12 i 22 . Densitatea de repartiie a unei variabile X2 nemaifiind
simetric, i lund numai valori pozitive adoptm urmtoarea regul:
( ) ( )P 2 12 2 222 2< = < =; P , numit i regula cozilor egale. f(x)
1 - /2 /2 0 x
/22 1 22 /
Din modul cum s-a construit tabelele pentru repartiia ( )n2 , se obine: ( )( )
P
P
212
2 12
222
1 2 12
2
12
< = =
< = =
,
,
/ ;
/ ;
deci
deci
12
n
22
n
Urmeaz c intervalul de ncredere de nivel = 1 - este: ( ) ; ( )
/ ; / ;
n s n s
1 12
1 22
2
22 n-1 n-1
Dac ne intereseaz intervalul de ncredere pentru , atunci inem seama de faptul c variabila n 1 s are densitatea de repartiie:
f xn
x enn
x
( ) ,=
01
2 12
32
2 2
2 , x 0
x > 0
Pentru = 1 - fixat, se pot determina dou numere U1 , U2 astfel nct: P U n U
nx en
n x
U
U
1 2 32
2 21 1
2 12
2
1
2
=
s dx =
/
Se obine astfel intervalul: n n
1 1 sU
sU2 1
; care acoper cu o probabilitate valoarea parametrului .
Valorile numerice se pot determina cu ajutorul cuantilelor unei variabile X2. S presupunem acum c dispunem de dou selecii: x11, x12, , x n1 1 efectuat dintr-o populaie N(m1, 1) i x21, x22, , x n2 2 efectuat
dintr-o populaie N(m2, 2). Pe baza acestor selecii, obinem:
( )( )
xn
xn
x x
xn
xn
x x
jj
n
jj
n
jj
n
jj
n
11
11 1
1 1
2
1
22
21 2
2 2
2
1
1 11
1 11
1 1
2 2
= =
= = = =
= =
s
s
12
22
Intervalul de ncredere pentru m1 m2 n cazul cnd 1, 2 sunt cunoscute Se consider statistica:
( )U X X X X m m X X m mn n
n n11 1 21 2 1 21 2 1 2
12
1
22
2
1 2, ..., , , ..., ; ( ) =
+
care este o variabil normal N(0; 1), de unde urmeaz, parcurgnd punct cu punct calea urmat n cazul unei singure selecii, intervalul de ncredere.
x x zn n
x x zn n1 2 1 2
12
1
22
21 2 1
2
12
1
22
2
+ +
; Intervalul de ncredere pentru parametrul m1 m2 n cazul cnd 1, 2 sunt
necunoscute, dar 12 22 2= = Se consider statistica:
( )U X X X X m mX X m m
n n
n s n sn n
n n11 1 21 2 1 2
1 2 1 2
1 2
1 12
2 22
1 2
1 2
1 1
1 12
,..., , , ..., ;
( )
( ) ( ) =
+
+ +
,
care are repartiie Student cu n1 + n2 2 grade de libertate. Atunci procednd ca n cazul unei singure selecii dintr-o populaie normal N(m, ), obinem pentru un fixat, intervalul de ncredere:
x x t n nn n
n s n sn n
x x t n nn n
n s n sn n
n
n
1 2 12
2
1 2
1 2
1 12
2 22
1 2
1 2 12
2
1 2
1 2
1 12
2 22
1 2
2
2
1 12
1 12
+ + +
+ + + +
+
+
;
;
( ) ( ) ;
( ) ( )
n
n
1
1
Acest interval acoper cu probabilitatea valoarea m1 m2 .
Intervalul de ncredere pentru raportul 12
22 .
Am vzut c funcia de selecie:
U X X X X X X
s
sn n( , , ..., , , , ..., ; , )11 12 1 21 22 2 1
222
12
12
22
22
1 2
=
are o repartiie Snedecor cu n1-1, n2-1 grade de libertate. Am notat:
F ssn1 1 1
22
12
12
22 = , n2
i am vzut c funcia de repartiie este independent de 1, 2,
iar Fn1 1 1 , n2 ca funcie de
2
1
2
este continu i strict cresctoare.
Atunci, pentru = 1 - dat, se pot determina dou numere F(1) i F(2), astfel nct: ( )P F F Fn( ) , ( )1 1 1 21 1 = n2 n ipoteza c adoptm cozi egale, se obine:
P F F Fn n
n1 1 1
11 1 1 1 22
1 1 1
= , , ;; , n2 2 n2 n
Cum evenimentul:
F ss
Fn n1 1 1 1 1 1 1 22
22
12
12
22
, , ;; n2 n2
este echivalent cu evenimentul:
ss F
ss F
n n n n
1
2
2
1 1 12
1
2
2
1
2
2
1 12
1 1
1 2 1 2
, ; , ;
,
rezult c am obinut intervalul de ncredere:
ss F
ss F
n n n n
1
2
2
1 1 12
1
2
2
1 12
1 1
1 2 1 2
, ; , ;
;
,
care, cu probabilitatea , acoper valoarea parametrului: 1
2
2
Observaie. ntruct FFk k k k1 2 2 1
1,
,
= , rezult c intervalul de ncredere pentru raportul 12 22/ mai poate fi scris sub forma:
ss
Fss
Fn n n n
1
2
2
1 1 12
1
2
2
1 122 1 2 1
, ; , ;;
n problemele privind durata de funcionare a unui produs, adesea se utilizeaz o repartiie exponenial.
f xe
x( , ),
,
=
01
x 0
x > 0, > 0
Ne propunem s determinm un interval de ncredere pentru parametrul , care are semnificaie de durat medie de funcionare.
Dup cum tim, funcia caracteristic a unei variabile exponenial negative de parametrul este: X t i( ) (= 1 t)-1
S efectum o selecie de volum n:x1, x2, , xn, din populaia caracterizat de aceast variabil aleatoare i s considerm statistica:
( )U X X X Xn jj
n
1 21
2, ,..., ; = = Funcia ei caracteristic este:
( ) u itUit
X it
X
j
n
Xj
n n
t M e M e M et
itj
j
n
j
j( ) = =
=
=
=
=
= =
2 2
1 1
12
12
Deci: ( )U nt it( ) = 1 2 care este funcia de repartiie a unei variabile ( )22 n (cu 2n grade de libertate).
Urmeaz c funcia de selecie:
( )U X X X Xn jj
n
1 21
2, ,..., ; = = urmeaz o lege de repartiie ( )22 n cu 2n grade de libertate.
Atunci, pentru = 1 - dat, putem determina dou numere: 12 i 22 astfel nct: P X
nx e dxj
j
n
nn x
12
22
1
1 22 12
112
22
= = = =
( ) / Adoptnd ipoteza construirii unui interval cu cozi egale, se obine intervalul de ncredere:
2 2
1
12
2
21
22
2
X Xjj
n
n
jj
n
n
=
=
; ;;
care, cu probabilitatea = 1 - , acoper valoarea parametrului . 7.9 Intervale de ncredere pentru parametri n cazul seleciilor de volum mare Am vzut c determinarea unui interval de ncredere pentru parametrul care apare n legea de repartiie f(x; ) se baza pe construirea unei funcii de selecie care s depind de datele de selecie x1, x2, , xn, de volumul de selecie n i de parametrul de estimat . Pentru a putea determina efectiv intervalul de ncredere se fceau ipoteze suplimentare asupra funciei de repartiie a statisticii, printre care i faptul c aceast funcie de repartiie nu depinde de parametrul de estimat. n cazul unei legi normale N(m; ) se puteau obine relativ simplu intervale de ncredere pentru m sau/i , indiferent dac n (volumul seleciei) era mic sau nu. n multe alte situaii, aflarea funciei de repartiie a statisticii este o problem dificil, ns putem determina repartiia asimptotic a unei statistici care conine parametrul necunoscut i, deci, dac n este suficient de mare, erorile pe care le comitem utiliznd repartiia asimptotic sunt cu totul neglijabile. Fie variabila aleatoare X cu densitatea de repartiie f(x; ) ce caracterizeaz o populaie C, din care se efectueaz selecia de volum n; x1, x2, , xn . n ipoteza c valorile de selecie sunt independente, se obine funcia de verosimilitate:
L(x1, x2, , xn,n; ) = f x jj
n
( ; )=
1
De aici urmeaz c:
ln ln ( ; )L f x j
j
n
==
1
Notnd: yf x
jj=
ln ( ; ), 1 j n ,
se obine:
M(Yj) = M
ln ( ; )f x
=
ln ( ; ) ( ; )f x f x dx
= 0 Presupunem c:
0 < M2 ln ( ; )f x
=
ln ( ; ) ( ; )f x f x dx <
2
Atunci:
D2 ln ( ; )f x
= M2
ln ( ; )f x
,
iar variabila:
ln ln
ln
ln ( ; ) ln ( ; )
ln ( ; )
L M L
D L
f xM
f x
Df x
Y
nD
j j
j
n
j
n
j
j
n
jj
n
=
===
=
=
11
2
1
1 ,
unde am notat D2 ln ( ; )f x
= D
2, n baza teoremei lui Liapunov, este asimptotic N(0; 1).
Deci:
n
jj
n
x
a
b
P aY
nDb e dx
= < 0)
Atunci: f(x; p) = px(1-p)1-x x = 0, 1;p (0; 1) Pe baza unei selecii x1, x2, , xn din populaia C caracterizate de variabila aleatoare X, obinem:
L(x1, x2, , xn; p) = f x p p pjx
j
n xjj
n
jj
n
( ; ) ( )(1 )
= = ==
1 11
1
Dac punem: x kjj
n
= =
1
, atunci ln L(x1, x2, , xn, n;p) = k ln p + (n-k) ln(1-p) i, deci:
ln
( )L
pkp
n kp
k npp p
= =1 1
Cum: Y f x pp
xp
xp
x pp p
= = =
ln ( ; )( )
11 1
, avem imediat:
M Y M X pp p
D Y D X pp p p p
D X p p pp p p p
D
( ) ( )( )
( )( ) ( )
( ) ( )( ) ( )
= =
=
= =
= =
10
11
111
11
2 22 2
22 2
2
Atunci variabila:
Y
nD nDP
p np p
k npp p
kn
p
p pn
jj
n
=
= =
=
1 1 111
1 1ln
( )( ) ( )
are o lege de repartiie N(0; 1) i, deci, pentru n suficient de mare:
P
kn
p
p pn
z z z