verosimilitate maxima

Embed Size (px)

DESCRIPTION

verosimilitate maxima - maximum likelihood

Citation preview

  • Capitolul 7

    ELEMENTE DE TEORIA SELECIEI I ESTIMAIEI

    7.1. Noiuni generale

    Orice cercetare statistic pornete de la o colectivitate sau populaie alctuit din elemente sau indivizi care au o caracteristic general i care se difereniaz prin anumite atribute.

    Elementele colectivitii (populaiei) le vom numi uniti. n studiul colectivitilor statistice, n majoritatea cazurilor suntem nevoii s studiem

    numai pri din ntreaga colectivitate. Ori, n acest caz, se pune n mod natural ntrebarea dac concluziile ce le obinem concord cu rezultatul ce l-am obine dac studiem ntreaga populaie. Apare astfel problema de a studia modul n care valorile tipice (pe baza crora tragem concluzii) ale colectivitii pariale investigate pot furniza informaii asupra valorilor tipice ale ntregii colectiviti.

    Vom presupune, n cele ce urmeaz, c urmrim o anumit caracteristic a colectivitii generale i c aceast caracteristic este descris de o variabil aleatoare X definit pe un cmp de probabilitate {, K, P}, n care elementele mulimii sunt tocmai elementele colectivitii generale, K este un corp borelian de pri ale lui , iar P este o probabilitate pe K.

    Dup cum se tie, dac este finit, atunci K coincide cu mulimea prilor lui , iar P este o repartiie discret uniform pe .

    Faptul c suntem obligai s cercetm numai o anumit parte din populaie este impus de natura concret a colectivitii. Astfel, dac numrul elementelor populaiei este infinit, n mod necesar nu putem cerceta dect un numr finit i deci obinem o informaie trunchiat.

    Dar, n cazul cnd numrul elementelor populaiei este finit, atunci cnd cercetarea calitii elementelor conduce la distrugerea lor, evident c se impune alegerea unui numr finit pentru cercetare.

    Dac inem seama de faptul c orice investigare (cercetare) implic i anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte din populaia total.

    Vom numi selecie (eantion) o colectivitate parial de elemente alese la ntmplare. Numrul elementelor dintr-o selecie l vom numi volumul seleciei.

    Spunem c o selecie este repetat, dac elementul ales la ntmplare este reintrodus n colectivitatea general naintea efecturii urmtoarei alegeri.

    Selecia este nerepetat dac, elementele alese nu se mai introduc n colectivitatea general.

    S efectum deci o selecie de volum n dintr-o colectivitate C i s notm cu x1, x2, , xn valorile de observaie. Acestea se refer la valorile unei variabile aleatoare X care d legitatea caracteristicii studiate.

    Considerate aposteriori, valorile de selecie x1, x2, , xn sunt valori bine determinate ale variabilei aleatoare X.

    Privite apriori, valorile X1, X2, , Xn pot fi considerate ca variabile aleatoare independente, identic repartizate cu variabila X, n cazul unei selecii repetate.

    Dac selecia este nerepetat, atunci variabilele X1, X2, , Xn sunt dependente, dependena fiind de tipul lanurilor cu legturi complete.

    Dac volumul colectivitii generale este suficient de mare iar volumul seleciei este suficient de mic, deosebirea dintre o selecie repetat i una nerepetat este nesemnificativ i, ca atare, n aplicaiile practice o selecie nerepetat se trateaz dup metodele seleciei repetate.

  • Orice funcie de datele de selecie o vom numi funcie de selecie sau statistic. S considerm acum o selecie de volum n: X1, X2, , Xn i s dispunem n ordine

    nedescresctoare aceste date: X(1) X(2) X(n) , unde X(1) = min {X1, X2, , Xn}. X(n) = max {X1, X2, , Xn}. Mulimea {X(1), X(2), , X(n)}, constituie o statistic a ordinei. Pornind de la selecia

    considerat, putem defini imediat amplitudinea de selecie. ( )W X X X X Xm m1 2, , ..., ( ) (1)= , care este evident o statistic (o funcie de selecie).

    Un rol deosebit de important l are n statistica matematic funcia empiric de repartiie, care se definete astfel:

    F x nnn

    x( ) ,= x R , unde n este volumul seleciei, iar nx este numrul valorilor de selecie mai mici dect x.

    Funciei F(x) = P(: X() < x) i vom spune funcie teoretic de repartiie. Noi vom considera numai selecii repetate. Justificarea teoretic a metodei seleciei apare n mod natural din teorema lui

    V.I.Glivenko, cunoscut sub numele de teorema fundamental a statisticii matematice. Teorema lui Glivenko Dac F(x) este funcie teoretic de repartiie, iar Fn(x) funcia empiric de repartiie,

    atunci: P F x F xn x R

    nlim sup ( ) ( ) =

    = 0 1

    Teorema lui A.N.Kolmogorov ofer posibilitatea de a evalua distana dintre Fn(x) i F(x).

    Teorem. Dac F(x) este o funcie continu, atunci:

    lim sup ( ) ( ) ( ) ( )n x

    nk kP F x F x

    nK e cu < 1 02 2 ,

    7.2. Momente de selecie Dac este dat selecia de volum n: X1, X2, , Xn , atunci vom numi momentul de

    selecie de ordinul r i-l vom nota Mr , variabila aleatoare:

    Mn

    Xr jr

    j

    n

    ==1

    1

    Pentru r = 1, obinem media de selecie: M xn

    X jj

    n

    11

    1= ==

    S considerm media i dispersia variabilei aleatoare Mr :

    M M Mn

    Xn

    M X M Xr jr

    j

    n

    jr

    rj

    n

    ( ) ( ) ( )= = == =

    1 11 1

  • Aplicnd acum inegalitatea lui Cebev, obinem:

    ( )P M M X M X M Xnr r r r < ( ) ( ) ( ) 1 22

    2 - , de unde urmeaz c:

    ( )lim ( )n r r

    P M M X < = 1, ceea ce ne conduce la: M M Xr rP

    n ( ), fapt care justific nlocuirea n aplicaii a momentelor teoretice de ordinul r, cnd acestea exist, cu momentele empirice de ordinul r, dac n este suficient de mare.

    Momentele centrate de selecie, r

    Prin definiie: r j rj

    n

    nx x=

    =1

    1

    ( )

    Pentru r = 2 se obine dispersia de selecie necorectat:

    Ca i n cazul momentelor teoretice, putem exprima momentele centrate de selecie cu

    ajutorul momentelor obinuite de selecie i invers:

    rh

    h

    r

    j

    n

    rh

    jr h h h

    h

    r

    rh h

    jr h

    j

    n

    h

    h

    r

    rh h

    r h

    nC X X C X

    nX

    C X M

    = =

    = ==

    =

    =

    =

    1 1 1 1

    1

    01 0 1

    0

    ( ) ( )

    ( )

    ,

    deci r

    i M rx r r Xr r r r= + + + 1 2 212( ) ... , r N *

    Ne propunem acum s determinm repartiia asimptotic a mediei de selecie X . Teorem. Dac se efectueaz o selecie de volum n: X1, X2,, Xn, dintr-o

    colectivitate caracterizat de variabila aleatoare X pentru care exist M(X) = m, M[(X m)2] = 2 0,

    x mn n

    / B

    Y N(0,1)

    Demonstraie: S notm YXnj

    j= , 1 j n

    Atunci: x Y m MXn

    mnjj

    n

    jj= = = ==1 si M(Yj )

    2 2 21

    1= = =n x xjj

    n

    ( )

    ( ) ( ) ( ) ( ) ( )( ) ( )[ ] [ ]

    D M M M M M Mn

    X Mn

    X

    nM X

    nM X M X

    nM X

    nM X M X

    nM X M X

    nM X M X

    r r r jr

    j

    n

    jr

    j

    n

    j

    n

    jr

    jr

    kr

    j k j

    n

    j jr

    kr

    j k

    jr

    jr

    j

    n

    r r

    22

    2

    1

    2

    1

    2

    21

    22 2

    2

    12

    2 22

    12

    2

    1 1

    1 1 1 1

    1 1

    ( ) ( ) ( )

    ( )

    ( ) ( )

    = =

    =

    = + =

    = =

    = =

    = =

    =

    p p

  • ( )[ ]M Y m M X mn nj j j j = = =2 22 2

    2

    ( )M Y m M X mn nj j j j = = =

    3 3

    3

    3

    3

    3 , 1 j n

    S considerm condiiile lui Leapunov:

    n

    jj

    n

    jj

    n n n

    n

    n

    n=

    =

    =

    = =lim

    3

    2

    1 3

    2

    1

    1 2

    3

    2

    1 3

    2 1 2 1 61 0

    /

    /

    /

    / /lim lim

    Fiind ndeplinit condiia lui Leapunov, rezult conform teoremei:

    n

    zx

    P x mn

    x e dz

  • Excesul de selecie:

    24

    22 3=

    Coeficientul de corelaie de selecie (empiric):

    ( )( )( ) ( )

    =

    =

    ==

    1

    1 11

    2 2

    11

    nX X Y Y

    nX X

    nY Y

    j jj

    n

    j jj

    n

    j

    n

    7.3. Selecia dintr-o populaie normal N(m, ) n multe situaii, ne intereseaz repartiia exact a diverselor statistici, Tn(X1, X2,

    ,Xn), chiar cnd n este mic. Toate rezultatele obinute anterior rmn valabile, inclusiv cele referitoare la repartiie asimptotic a unor funcii de selecie normate convenabil.

    Vom presupune acum c populaiile din care se efectueaz seleciile sunt normale N(m, ) i, n aceste condiii, vom cuta s stabilim repartiiile exacte ale celor mai importante funcii de selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit n practic este cel al erorilor de observaie ale msurtorilor, care, dup cum se tie, sunt repartizate dup o lege normal.

    Teorem. Dac X1, X2, ,Xn este o selecie de volum n dintr-o populaie caracterizat

    de o variabil aleatoare X N(m, ), atunci media de selecie Xn

    X jj

    n

    ==1

    1

    are o lege de

    repartiie

    N mn

    ,

    Demonstraie. Cum Xj N(m, ), 1 j n, rezult c:

    Xj

    itm t

    t e( ) = 2 2

    2 Atunci:

    XitX

    itn

    X

    j

    n itn

    X

    j

    n

    Xj

    n itn

    mt

    nitm

    tnt M e M e M e

    tn

    e ej

    j

    n

    j

    j( ) ( ) ,= =

    =

    =

    = =

    =

    = = =

    1

    1 1 1

    2 21

    2 2

    2

    2 2

    care este funcia caracteristic a unei variabile aleatoare normale N m

    n,

    Urmeaz c densitatea de repartiie a variabilei X este:

    f x n eXn x m

    ( ) ,=

    22

    2

    x R

    S artm c variabila abatere normat Z X mn

    = / este repartizat normal N(0; 1). ntr-adevr:

    ( ) Z itZ it n X m it n i t nt M e M e M e e( ) = = =

    =

    m X

    = = =

    e t n e e e

    i t n

    X

    i t n nn

    ti t n

    m m - t m2 2

    2

    2

    2 2 ,

    care este funcia caracteristic a unei variabile normale N(0; 1).

  • Deci densitatea de repartiie a variabilei Z X mn

    = / este:

    f z eZz

    ( ) ,= 12

    2

    2

    z R Teorem. Dac X1, X2, ,Xn este o selecie de volum n, dintr-o populaie normal

    N(m, ), atunci X i 2 sunt variabile aleatoare independente. Demonstraie. Putem presupune c m = 0, ntruct momentul de selecie 2 este

    invariabil la o schimbare a originii.

    ntruct: ( )2 21

    1= =n X Xkk

    n

    ,

    s exprimm:

    ( )X X X X X nX X n Xk k kkn

    k

    n

    k

    n

    kk

    n

    kk

    n

    = + = === = =

    2 2

    1

    2

    11

    2

    1 1

    2

    2 1

    ns:

    ( )

    Xn

    X nn

    XX

    nnn

    XX

    n

    X X

    kk

    n

    kk

    n kk

    n

    kk

    n

    n n

    2

    1 1

    2

    12

    2

    23

    2

    12

    1 11

    21 2

    12

    = == =

    =

    +

    +

    + + ...

    Deci:

    ( ) ( )X X n n XX

    nnn

    XX

    n nX Xk

    k

    n kk

    n

    kk

    n

    n n =

    +

    + +

    == =

    21

    12

    2

    23

    2

    121

    121 2

    1...

    Urmeaz c:

    ( )Xn

    X nn

    XX

    nnn

    XX

    nX Xk

    k

    n

    kk

    n kk

    n

    kk

    n

    n n2

    1 1

    2

    12

    2

    23

    2

    121 1

    121 2

    12= =

    = = = +

    +

    + + ...

    n membrul doi al acestei egaliti avem o sum de n forme ptratice pozitiv definite,

    fiecare avnd rangul egal cu unu. Deoarece suma rangurilor acestor forme ptratice pozitiv definite este egal cu n, iar variabilele Xk N(0, ) , 1 k n, din teorema lui Cochran (pe care nu o vom demonstra)* rezult c variabilele:

    * Teorema lui Cochran. Fie X1, X2, , Xn variabile aleatoare independente, repartizate normal N(0, ) i Q1, Q2, , QS , forme ptratice n X1, X2, , Xn avnd rangul k1, k2, , kS , respectiv. Dac: Q Xj

    j

    S

    kk

    n

    = = =

    1

    2

    1

    , atunci

    condiia necesar i suficient ca variabilele Q1, Q2, , QS s fie independente este ca k1+ k2 + + kS = n.

  • ( )

    Y nn

    XX

    n

    Y nn

    XX

    n

    Y X X

    Yn

    X

    kk

    n

    kk

    n

    n n n

    n kk

    n

    1 12

    2 23

    1 1

    1

    11

    21 2

    12

    1

    =

    =

    =

    =

    =

    =

    =

    ...................................................

    sunt independente.

    Se constat imediat c: 2 21

    11==

    n Ykkn

    i, prin urmare, rezult c X i 2 sunt independente. Teorem. Variabila aleatoare n2 are o repartiie 2 cu n 1 grade de libertate i parametrul , adic are densitatea de repartiie:

    f x x en

    n

    n

    n x( )

    ,

    =

    0

    1

    1

    12

    12

    12

    x 01

    2, x > 0n-1

    2

    Variabila aleatoare n2

    2 are o repartiie cu n 1 grade de libertate i parametrul = 1. Variabila aleatoare = 2 are densitatea de repartiie:

    f x x en n

    nnx( )

    ,

    =

    0

    1

    2

    2

    12

    2 2

    x 0

    2n

    2, x > 0

    n-12

    n-12

    Demonstraie. Din 2 12

    22

    12

    = + + + Y Y Yn

    n... rezult: n Ykk

    n2 21

    1

    ==

    , unde Y1, Y2,, Yn-1 sunt variabile aleatoare independente, repartizate normal, de parametri M(Yk) = 0; D2(Yk) = 2. Deci n2 urmeaz o lege de repartiie X 2 cu n 1 grade de libertate i parametru . De asemenea:

    n Y

    M Y Y

    k

    k

    n

    k k

    22

    2

    1

    1

    0 1

    =

    =

    =

    =

    ; D2

    i, deci, variabila aleatoare n2 /2 urmeaz o lege de repartiie a crei densitate este:

  • f x x enn x

    ( ),

    =

    0

    12

    12

    12

    x 01

    2, x > 0n-1

    2

    Pentru a obine densitatea de repartiie a variabilei = 2 , pornim de la funcia de repartiie:

    ( )P( x nx

    ny e dyn

    n

    n ynx

    < =

    ),

    ,

    0

    1

    2 12

    2

    12 1

    32 2

    0

    2

    2

    x 0P n , x > 0

    0 x 0

    , x 0

    2

    Derivnd, obinem:

    f xn

    x en

    nnx

    ( )

    ,

    =

    0

    12

    1

    2 2

    2

    2

    x 0

    2n

    2, x > 0

    n-12

    n-12

    S considerm acum ( )*2 21

    1= =n X mkk

    n

    , unde X1, X2, , Xn este o selecie de

    volum n dintr-o colectivitate normal N(m, ). Atunci: n x mk

    k

    n

    *2

    2

    2

    1

    = =

    n membrul al doilea avem o sum de ptrate de variabile Y X mk k= independente,

    repartizate normal N(0, 1). Deci, variabila aleatoare n*2

    2 urmeaz o lege de repartiie ( )n2 cu parametrul = 1 S considerm acum variabila aleatoare:

    ( )s n X Xkkn

    2 2

    1

    11

    = = pe care o numim dispersia de selecie corectat. ntruct:

    ( ) ( ) ( )[ ] ( ) ( ) ( )( ) ( ) ( )X X X m X m X m X m X m

    n X m X m n X m

    kk

    n

    k k kk

    n

    k

    n

    k

    n

    kk

    n

    = = +

    + = = ===

    =

    2

    1

    2 2

    111

    2 2

    1

    2

    2

    rezult c:

    ( )/

    n s X m X mn

    k

    k

    n =

    =

    1 22

    2 2

    1

    Dar, X mkk

    n

    =

    2

    1

    este o variabil ( )n2 iar X mn

    /

    2

    este o variabil (1)2 independent de ( )n2 .

  • Rezult c ( )n s12

    2 urmeaz o lege de repartiie ( )n12 cu parametrul = 1

    Am vzut c M n nn n( ) ; ( )( ) ( ) 2 2 2= = D2 cnd parametrul este 1. Atunci M n n

    22 1

    = , de unde rezult:

    M nn

    n n D n( ) ; ( ); ( ) ( ) 22 2

    2 42

    21 2 1 2 1=

    = = D

    n2 2 i deci:

    D nn

    22

    4

    22 1( ) ( ) =

    n acelai timp:

    M n s n( ) =

    1 12

    2 , care conduce la: M(s2) = 2

    D n s n22

    21 2 1( ) ( ),

    = adic D s n

    2 2421

    ( ) =

    ntruct x mn

    N n = / ( , ), ( )0 1 2 1

    2 iar (n -1)s2

    Urmeaz c: x m

    n

    n

    x mn

    n sn

    x ms nn

    =

    =

    / /( )( )

    /( )12 2

    2111

    are o lege de repartiie Student cu n 1 grade de

    libertate. S presupunem c dispunem de dou colectiviti, C1 i C2, caracterizate de o variabil

    aleatoare X1 N(m1, T1) respectiv X2 N(m2, T2), X1 i X2 independente. Din colectivitatea C1 se efectueaz o selecie de volum n1: X11, X12, , X n1 1 , iar din

    colectivitatea C2 se efectueaz o selecie de volum n2: X21, X22, , X n2 2 .

    Pe baza acestor selecii, obinem mediile de selecie X1 i X 2 , dispersiile de selecie:

    ( )s n X xjjn

    12

    11 1

    2

    1

    11

    1= = , respectiv ( )s n X xkkn

    22

    22 2

    2

    1

    11

    2= = . Variabila aleatoare X1 X 2 urmeaz o lege normal: N m m

    n n1 212

    1

    22

    2

    +

    ,

    . De aici rezult c: x x m m

    n n

    N1 2 1 212

    1

    22

    2

    0 1 +

    ( ) ( , )

    Evident c: ( )M X X m m1 2 1 2 = D X X D X D X

    n n2

    1 22

    12

    212

    1

    22

    2

    ( ) ( ) ( ) = + = +

    Dac 12 22 2= = , atunci variabila aleatoare [ ]1 1 12

    1 12

    2 22

    ( ) ( )n s n s + are o repartiie 2 cu n1 + n2 2 grade de libertate.

  • Rezult c variabila aleatoare: ( ) ( )( )

    X X m m

    n n

    n s n sn n

    X X m m

    n s n sn n

    n nn n

    1 2 1 2

    12

    2

    22

    2

    1 12

    2 22

    1 22

    1 2 1 2

    1 12

    2 22

    1 2

    1 2

    1 21 12

    1 12

    +

    + +

    = + +

    +

    ( ) ( )

    ( )

    ( )

    ( ) ( )

    urmeaz o lege de repartiie Student cu n1 + n2 2 grade de libertate. n virtutea teoremei conform creia dac variabilele ( ) ( ),1 22 2 sunt independente, atunci variabilele aleatoare ( ) ( )/ : /1 22 1 2 2 urmeaz o lege de repartiie Snedecor cu 1, 2 grade de libertate, respectiv, rezult c variabila:

    F

    n snn sn

    ssn1 1 1

    1 12

    12

    2 22

    22

    12

    22

    1111

    =

    =;( )( )( )( )

    n2

    are o lege de repartiie Snedecor (este o variabil Fn1 1 1 ; n2 cu n1-1, n2-1 grade de libertate respectiv. n aplicaiile practice trebuie s se in seama de faptul c tabelele pentru repartiia Snedecor se construiesc pentru valori ale variabilei Fn1 1 1 ; n2 mai mari dect unu.

    Ca atare este necesar s lum la numrtor s s12

    22> i, totodat, s avem grij s nu

    inversm ordinea gradelor de libertate. Inversiunea ordinei gradelor de libertate este echivalent cu:

    F ss s

    sFn n1 1

    1 122

    12

    12

    122

    1 1

    1 1

    = = =;

    ; n

    n2

    2

    ceea ce justific de ce s-au construit tabele numai pentru F 1 2 1, > . 7.4. Elemente de teoria estimaiei n toate aplicaiile statisticii matematice, n economie, n tehnic i, n general, n

    tiinele experimentale este necesar s cunoatem legitatea dup care are loc evoluia fenomenului studiat, adic legea de repartiie a variabilei aleatoare prin intermediul creia este cuantificat caracteristica studiat a fenomenului. Adesea, cunotinele teoretice sau experiena practic n domeniul investigat ne dau dreptul s admitem c forma legii de repartiie este cunoscut. Pentru a utiliza efectiv o astfel de lege de repartiie, va trebui cunoscut care dintre funciile de repartiie din familia celor de o form dat este cea care trebuie efectiv utilizat. Cu alte cuvinte, trebuie precizat valoarea numeric a parametrului (sau valorile numerice ale parametrilor, n cazul unei legi de repartiie ce depinde de mai muli parametri). Pentru a nelege mai bine cum stau lucrurile, s dm unele exemple.

    Dac variabila aleatoare X reprezint numrul de apeluri la o central telefonic ntr-un interval de timp determinat, ales ca unitate, atunci X are o lege de repartiie Poisson:

    Xx

    e ax

    ax:!

    , x = 0, 1, 2, ...

    adic ( )P X x a e ax

    ax

    = = ;!, pentru x = 0, 1, 2, ...; a > 0 i avem o lege de repartiie ce

    depinde de parametrul a > 0.

  • n cadrul unui proces de producie, o caracteristic important o constituie procentul p de rebut. Dac X este variabila aleatoare ce d numrul de produse necorespunztoare ce se obin ntr-o selecie repetat de volum n, atunci: ( )P X x p C p pnx x n x= = ; ( ) ,1 x = 0, 1, 2, ... , n S considerm un alt exemplu, cu o variabil aleatoare care admite o densitate de repartiie. Fie T o variabil aleatoare ce reprezint durata de funcionare fr cderi a unei anumite componente. n multe situaii, variabila T este caracterizat de densitatea de repartiie:

    f t eT

    t

    ( ; ) ,

    ,

    = >

    1 0

    0

    t

    t 0 > 0

    Este vorba, iari, de o lege de repartiie de form exponenial cu un singur parametru > 0 .

    n fine, dac X reprezint abaterile unei piese prelucrate de la cota nominal menionat n fia tehnologic, atunci X urmeaz o lege normal N(m, ) a crei densitate este:

    f x m eX m

    ( ; , ) ,( )

    = 1

    2

    2

    22 x R ,

    care este o lege de repartiie cu doi parametri (m, ) Rx(0, ). n toate aceste exemple s-a specificat forma, fr a se preciza care anume repartiie este adic valorile exacte ale parametrilor ce intervin. Ori de cte ori avem forma funciei prin care se exprim legea de repartiie, spunem c avem o problem specificat. Cunoaterea valorilor parametrilor conduce la cunoaterea complet a legii de repartiie adic avem o problem complet specificat. Operaia de evaluare a parametrilor poart numele de estimare a parametrilor, care se face pe baza unei selecii de volum n: X1, X2, , Xn, extras din populaia caracterizat de variabila aleatoare X, cu legea de repartiie specificat. Valorile parametrilor unic determinate pe baza seleciei X1, X2, , Xn, le vom numi estimaii punctuale. Valorile parametrilor le estimm cu ajutorul unei statistici (o funcie de datele de selecie) construite cu ajutorul seleciei X1, X2, , Xn i pe care o vom nota Tn(X1, X2, , Xn). Pentru a preciza ideile, vom presupune c selecia de volum n s-a efectuat dintr-o populaie caracterizat de o variabil aleatoare X care admite legea de repartiie dat de f(x; ), unde f(x; ) este o densitate de repartiie n cazul c exist densitate sau, n cazul unei variabile discrete este P(X = x; ). Cu ajutorul funciei de selecie Tn(X1, X2, , Xn) dorim s estimm parametrul (forma fiind cunoscut). Este clar c dispunem numai de informaie parial asupra populaiei i, ca atare, cu ct volumul de selecie crete, cu att informaia este mai bogat. Deci, Tn(X1, X2, , Xn) trebuie s se apropie tot mai mult de valoarea parametrului , fiind vorba aici de un proces de convergen. Evident c aceast convergen trebuie s aib loc n probabilitate, adic: ( )

    nn nP T X X X

    < =lim ( , , ..., )1 2 1

    Valoarea luat de Tn(X1, , Xn) pentru valori bine determinate ale variabilelor X1, X2, , Xn o vom numi estimaie a parametrului . Din cele prezentate rezult c funcia de estimaie este de natur teoretic, n timp ce estimaia este de natur empiric.

    Dac Tn(X1, X2, , Xn) P

    n spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru parametrul .

  • Cum exist o infinitate de funcii Tn(X1, X2, , Xn) care converg n probabilitate ctre , pentru a mri precizia, vom recurge la convergene mai tari, deci care asigur convergena n probabilitate. O atare convergen este convergena n medie ptratic, care prezint avantajul c este comod n calcul. Funcia de estimaie Tn(X1, X2, , Xn) este o funcie de variabilele aleatoare independente X1, X2, , Xn i, deci, o variabil aleatoare cu o funcie de repartiie. Cum am presupus c lucrm cu convergen n medie ptratic, am admis implicit c Tn(X1, X2, , Xn) are momente de ordinul doi cel puin. Definiie. Spunem c statistica Tn(X1, X2, , Xn) este o estimaie nedeplasat a parametrului dac: M(Tn(X1, X2, , Xn)) = . Spunem c statistica Tn(X1, X2, , Xn) este o estimaie deplasat a parametrului , dac: M(Tn(X1, X2, , Xn)) = + h(n) Funcia h(n) pe care o vom numi deplasare a estimaiei are proprietatea c ( )h n = n 0. Este clar c ntre eroarea de estimaie i deplasare exist o clar deosebire. n timp ce eroarea de estimare este Tn(X1, , Xn) - i este o variabil aleatoare, deplasarea h(n) = M(Tn(X1, X2, , Xn)) - este o funcie numeric, care depinde de volumul de selecie i eventual de parametrul de estimat i care reprezint o eroare sistematic n procesul de estimare. Dac deplasarea h(n) > 0 spunem c Tn(X1, X2, , Xn) este pozitiv deplasat, iar dac h(n) < 0 spunem c Tn(X1, X2, , Xn) este negativ deplasat. Din definiia funciei numerice deplasare, h(n), rezult importana cunoaterii n cazul seleciilor de volum mic. Exemple de estimaii nedeplasate sau deplasate putem pune imediat n eviden pe baza unor rezultate pe care le-am obinut deja.

    Aa de exemplu, Tn(X1, X2, , Xn) = X nX j

    j

    n

    ==1

    1

    este o estimaie nedeplasat a

    mediei teoretice, m , a unei variabile aleatoare: ( )M X m= De asemenea, frecvena relativ k

    n este o estimaie nedeplasat a probabilitii, p, de

    apariie a unui eveniment n cazul unei repartiii binomiale:

    M kn n

    M k npn

    p = = =

    1 ( )

    Am vzut c, dac efectum o selecie dintr-o populaie normal i notm:

    2 21

    1= =n X Xjj

    n

    ( ) (dispersia de selecie necorectat) i cu:

    sn

    X Xjj

    n2 2

    1

    11

    = = ( ) (dispersia de selecie corectat), atunci M

    n( ) , ) 2 2

    22= = M(s2

    Rezult c 2 este o estimaie negativ deplasat a dispersiei teoretice 2, n timp ce s2 este o estimaie nedeplasat a dispersiei teoretice 2 .

    Definiie. Spunem c Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul , dac: M(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn)) n 0

  • Spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru , dac: M(Tn(X1, X2, , Xn)) = + h(n) , h(n) n 0 D2(Tn(X1, X2, , Xn)) n 0 Utiliznd rezultate obinute anterior, se deduce c momentul de selecie de ordinul r,

    Mr este o estimaie absolut corect pentru momentul teoretic de ordinul r, Mr(X). ntr-adevr: M( Mr ) = Mr(X)

    D2( Mr ) = M X M X

    nr r

    n2

    2

    0( ) ( ) n particular, X este estimaie absolut corect pentru M(X) = m.

    M(s2) = 2 M(2 ) = 22

    n

    D sn n

    2 2421

    0( ) = D n

    n n2

    2 242 1 0( ) ( ) =

    Urmeaz de aici c s2 este o estimaie absolut corect pentru 2, n timp ce 2 este numai corect pentru 2 (n selecii dintr-o populaie normal N(m, )).

    Este clar c vom prefera totdeauna s avem o estimaie nedeplasat pentru un parametru . Dar, pot exista, pentru acelai parametru , mai multe estimaii nedeplasate i atunci este natural s o preferm pe aceea care are dispersia mai mic, ntruct valorile statisticii Tn(X1, X2, , Xn) se vor grupa mai bine n jurul valorii . n felul acesta, ne punem problema existenei unei estimaii nedeplasate care s aib cea mai mic dispersie i ct de mic poate s fie dispersia unei estimaii.

    n acest sens, dm binecunoscuta teorem a minimului dispersiei, cunoscut i sub numele de teorema lui Rao-Cramer.

    7.5. Teorema Rao-Cramer.Dac Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul din repartiia dat de f(x; ) a variabilei aleatoare X (discret sau continu), atunci:

    D2(Tn(X1, X2, , Xn)) 1nI( ) , unde I( ) este cantitatea de informaie pe o

    observaie i are expresia: I M f x M f x( ) ln ( ; ln ( ; )

    =

    =

    2 2

    2

    Demonstraie. Din relaia: f x dx( ; ) =

    1 se obine, prin derivare n raport cu parametrul :

    f x dx f x dx( ; ) ( ; )

    = = =0 0 0 sau

    lnf(x; ) , adic M lnf(x; )-

    Estimaia Tn(X1, X2, , Xn) fiind nedeplasat, obinem:

    M(Tn(X1, X2, , Xn))= ... ( , , ..., ) ( ; ) ...T X X X f x dx dxn n j nj

    n

    1 2 11

    =

    = Derivnd, i aici, n raport cu , se obine:

    ... ( , , ..., ) ln ( ; ) ( ; ) ...T X X X f x f x dx dxn nj

    n

    nj

    n

    = = =1 2

    11

    1

    1 Pe de alt parte:

    ...ln ( ; )

    ( ; ) ...

    f x

    f x dx dxjj

    n

    jj

    n

    n=

    = =

    11

    1

    0

  • nmulind aceast relaie cu i scznd din relaia anterioar, obinem: [ ]... ( , , ... ) ln ( ; ) ( ; ) ... ,T X X X f x f x dx dxn n j

    j

    n

    j nj

    n

    1 21

    11

    1 =

    = =

    adic:

    ( )M T X X X f xn n jj

    n

    ( , , ..., )ln ( ; )

    1 21

    1

    =

    =

    Aplicnd inegalitatea lui Schwarz, se obine:

    1 2 1 21

    21 2

    2

    1

    =

    =

    M T X X X f x

    D T X X X Df x

    n nj

    n

    n nj

    j

    n

    ( , , ..., ) ln ( ; )

    ( ( , , ..., ) )ln ( ; )

    ntruct M(Tn(X1, X2, , Xn)) = i X1, X2, , Xn sunt independente, obinem: D2(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn))

    D D nD

    nM nI

    j

    n

    j

    n2

    1

    2

    1

    2

    2

    ln ; ) ln ; ) ln ; )

    ln ; )( )

    f(x f(x f(x

    f(x

    j j

    = =

    =

    =

    =

    =

    =

    Deci: D2(Tn(X1, X2, , Xn))

    12

    nM

    ln f(x; )

    S artm c:

    I M f x M f x( ) ln ( ; ) ln ( ; )

    =

    =

    2 2

    2

    ntr-adevr, din: f x dx( ; )

    = 0 rezult: 2

    2 0f x dx( ; )

    = ns:

    2

    2

    2

    2

    2

    2

    2

    f x f x x f x f x f x

    x f x f x f x x f x

    ( ; ) ( ; ) ( ; ) ( ; ) ln ( ; ) ( ; )

    ( ; ) ( ; ) ln ( ; ) ( ; ) ( ; ) ( ; )

    = =

    = +

    + = +

    lnf

    lnf lnf

    Deci:

    2

    2 2

    2

    0ln ( ; ) ( ; ) ln ( ; ) ( ; )f x f x dx f x f x dx+ =

    i, deci:

    M f x M f x

    ln ( ; ) ln ( ; )

    =

    2 2

    2

    Definiie. Spunem c estimaia Tn(X1, X2, , Xn) este eficient dac:

    D2(Tn(X1, X2, , Xn)) 1nI( )

  • Fie acum Tn(X1, X2, , Xn) o estimaie absolut corect oarecare. Atunci, vom numi eficien a lui , raportul:

    e(Tn(X1, X2, , Xn)) =

    1

    2nI

    D( )

    (

    T (X , X , ... , X ) )n 1 2 n

    Este evident c: 0 e (Tn(X1, X2, , Xn)) 1 i Tn(X1, X2, , Xn) este eficient dac e(Tn(X1, X2, , Xn)) = 1.

    Cum eficiena este o funcie de volumul n a seleciei i cum la limit trebuie s obinem cea mai mare informaie posibil, rezult c, dac:

    lim (n

    e T (X , X , ..., X )) = 1 n 1 2 n , atunci estimaia Tn(X1, X2, , Xn) este asimptotic

    eficient. Ilustrm noiunea de eficien a unei estimaii prin dou exemple prin care s

    cuprindem o repartiie care admite densitate de repartiie i o repartiie de tip discret.

    (1) S se arate c Tn(X1, X2, , Xn) = X nX j

    j

    n

    ==1

    1

    este o estimaie eficient pentru

    parametrul m al repartiiei normale N(m; ); (2) S se arate c: Tn(X1, X2, , Xn) = X este o estimaie eficient pentru

    parametrul al unei repartiii Poisson. (P(X = x / ) = e

    x

    x

    !, x = 0, 1, 2, ... )

    Soluie

    (1) Din consideraii anterioare, tim c: M X m Xn

    ( ) ; ( )= = D2 2

    Rmne s artm c: D XnI

    2 1( )( )

    =

    f x m eX m

    ( ; , ) ,( )

    = 1

    2

    2

    22 x R, > 0

    ln ( ; , ) ln( ) ( )f x m X m = 2

    2

    2

    2

    [ ]

    ln ( ; , ) ; ln ( ; , )

    ( )

    f x mm

    X m f x mm

    M X m

    M X m

    =

    =

    =

    = =

    2

    2

    2

    2

    42

    2

    4 21 1

    M

    =I m( ) 12 i deci: 1 1

    2

    2

    nI m n n( ) /= =

    Cum D XnI m

    2 1( )( )

    = , rezult c X este estimaie eficient pentru parametrul m.

    (2) Pentru o repartiie Poisson, D X D Xn n

    22

    ( ) ( )= =

    ln (P X x= | ) ln!

    ln ln != = + ex

    x xx

  • ln ( )

    ( ) ( ) ( )

    P X x x

    I M x M x x M X M X

    = = +

    =

    = +

    = + =

    + + =

    1

    1 2 1 1 2 1

    2 1 1

    2 2

    2 22

    2

    2

    Cum D XnI

    2 1( )( )

    = , rezult eficiena estimaiei X pentru parametrul . Am vzut, aadar, cum putem s analizm estimaiile parametrilor n funcie de

    proprietile pe care le au, s le clasificm. Vom cuta acum s punem n eviden modaliti sau metode de obinere a unor estimaii. n cele ce urmeaz, ne vom opri asupra a dou metode de obinere a estimaiilor pe care le vom numi estimaii punctuale: metoda momentelor i metoda verosimilitii maxime.

    7.6. Metoda momentelor Am vzut c momentele de selecie de ordinul r sunt estimaii absolut corecte ale

    momentelor teoretice de acelai ordin: M M M X

    D M M X M Xn

    r r

    rr r

    n

    ( ) ( )

    ( ) ( ) ( )== 2 2

    2

    0

    Este natural ca, pentru n suficient de mare, s lum n locul momentului teoretic momentul empiric de acelai ordin.

    S presupunem c am efectuat o selecie de volum n:x1, x2, , xn, dintr-o populaie caracterizat de variabila aleatoare X care are legea de repartiie dat de f x k( ; , , ..., ) 1 2 , unde f x k( ; , ..., ) 1 este densitatea de repartiie, dac aceasta exist, sau P X x k( ; , , ..., )= 1 2 , dac variabila X este de tip discret. Am considerat, desigur, cazul cnd variabila X este unidimensional i legea depinde de k parametri. Admitem c variabila aleatoare X are moment cel puin pn la ordinul k inclusiv. Atunci: M Xs k( , , ..., ) 1 2 sunt funcii de parametrii necunoscui 1 2, , ..., .k Alctuind sistemul de ecuaii:

    M X M

    nX

    s k s

    js

    j

    n

    ( , , ..., ) , 1 2

    1

    1

    = =

    =

    1 s k ,

    unde Ms

    i presupunnd c sistemul admite soluii reale, se obin: $ $ ( , , ..., ); s s kM M M= 1 2 1 s k care sunt estimaiile parametrilor 1 2, , ..., .k prin metoda momentelor. S observm c nu este necesar s se ia neaprat primele k momente, din contr, putem lua alte momente, inclusiv momente centrate, care s constituie ns un sistem de k ecuaii cu necunoscutele 1 2, , ..., .k i din care s se obin ct mai uor posibil soluia cutat. Vom da acum unele exemple care s ilustreze metoda propus. Exemplu. S se estimeze prin metoda momentelor, pe baza unei selecii de volum n:x1, x2, , xn, extras dintr-o populaie caracterizat de:

  • [ ][ ]f x( ; , )

    , ,

    ,

    1 22 1

    2

    2

    1

    0=

    dac

    dac

    x

    , x

    1

    1

    , a parametrilor 1 2, .

    Soluie. ntruct

    ( )M X X 1 2 1 2 12 1 2 222 3, ; ( )= + = + + M2 , avem sistemul de ecuaii:

    1 21

    12

    1 2 22

    2

    2

    3

    + =+ + =

    M

    M,

    a crui soluie este:

    ( ) ( )$ ; $$ ( ) ; $ $ ( )

    1 1 2 12

    1 2 12

    1

    3 3

    3 1 3 1

    = = +

    = = + M M M M M M

    x s nn

    x s nn

    , sau

    2

    2

    Lungimea intervalului se estimeaz prin: 2 1 2 3 1 = s nn( )

    La aceleai rezultate se ajunge mai simplu, dac lum sistemul:

    ( ) ( ) 1 2

    2 12

    2 2 12

    2

    12

    + = = =

    x

    M M ,

    sau:

    1 2

    2 1 2

    2

    2 3

    + = =

    x

    i se continu, ajungndu-se la acelai rezultat. Exemplu. Estimarea parametrilor a, b din repartiia Beta, care are densitatea:

    f x a b a ba b

    x xa b( ; , ) ( , )( ) ( )

    ( ) ,=

    0

    11 1 , x (0, 1)

    x (0, 1) ,

    a > 0, b> 0. Prin calcul direct, se obine:

    M X a b aa b

    D X a b aba b a b

    1

    22 1

    ( | , )

    ( | , )( ) ( )

    = += + + +

    Estimaiile $, $a b se obin rezolvnd sistemul de ecuaii: a

    a bX

    aba b a b

    s+ =

    + + + =

    ( ) ( )22

    1

  • De aici rezult:

    $ ( ) ; $a X Xs

    X=

    2

    21 1 b = (1 - X) X(1 - X)

    s2

    Exemplu. Cazul unei repartiii normale N(m; ). Dup cum se tie: M(X| m, ) = m M2(X| m, ) = m2 + 2

    i avem, astfel, de rezolvat sistemul de ecuaii:

    m Xm M M X

    =+ =

    = =2 2 2 2 2 2 care conduce la:

    m = X2

    $$

    7.7.Metoda verosimilitii maxime Metoda momentelor pe care am prezentat-o este simpl i uor de aplicat. Prezint, totui, o serie de neajunsuri n ceea ce privete calitile estimatorilor obinui pe aceast cale. De aceea, statisticienii au cutat alte metode de obinere a estimaiilor. Una dintre acestea este metoda verosimilitii maxime elaborat R.A.Fisher i prezint avantajul unui plus de eficacitate. S considerm pentru nceput cazul unui singur parametru i c legea de repartiie a variabilei X ce caracterizeaz populaia din care s-a efectuat selecia de volum n, x1, x2, , xn este dat de f(x; ). Atunci, repartiia vectorului aleator (x1, x2, , xn) este:

    P(x1, x2, , xn; ) = f x jj

    n

    ( ; )=

    1

    , pe care o considerm ca funcie de . Valorile x1, x2, , xn fiind considerate ca date, ele fiind rezultatul experienei, vom considera ca valoare cea mai verosimil a parametrului , valoarea pentru care probabilitatea P(x1, x2, , xn; ) devine maxim, ceea ce ne conduce la faptul c estimaia de verosimilitate maxim , este soluia ecuaiei:

    P x x xn( , , ..., ; )1 2 0= Funcia P(x1, x2, , xn; ) poart numele de funcie de verosimilitate. ntruct lnP(x1, x2, , xn; ) i P(x1, x2, , xn; ) sunt n acelai timp cresctoare sau descresctoare, estimaia de verosimilitate maxim se obine ca soluie a ecuaiei.

    ln ( , , ..., ; )P x x xn1 2 0=

    Funcia L(x1, x2, , xn; ) = ln P(x1, x2, , xn; ) = ln ( ; )f x jj

    n

    =

    1

    o vom numi tot funcie de verosimilitate. n cazul cnd repartiia unidimensional depinde de mai muli parametri, f x k( ; , , ..., ) 1 2 , funcia de verosimilitate devine: L x x xn k( , , ..., ; , , ..., )1 2 2 1 , iar

    estimaiile de verosimilitate maxim se obin ca soluii ale sistemului de ecuaii:

    L(x , x ,... , x ; , , .., ) ; 1 j k1 2 n 1 2 k

    j

    = 0 Rezolvnd sistemul, se obin: $ $ ( , , ..., ), j j nx x x= 1 2 1 j k , estimaii de verosimilitate maxim.

    Ecuaiile L

    j

    = 0, 1 j k poart numele de ecuaii de verosimilitate.

  • Fr a intra n amnunte, vom sublinia unele proprieti ale estimaiilor de verosimilitate maxim, care le recomand pentru aplicaii. n cazul unui singur parametru , estimaia de verosimilitate maxim este consistent n probabilitate, dar, pentru valori mari ale lui n, repartiia ei este aproximativ normal, cu media M( $) = i cu dispersia: D

    nM f x2

    2

    1( $)ln ( ; )

    =

    Altfel spus, estimaia $ obinut prin metoda verosimilitii maxime este asimptotic eficient, n sensul c nu exist o alt estimaie asimptotic normal cu dispersie mai mic. Dac parametrul admite o estimaie eficient, atunci aceasta se obine n mod unic, rezolvnd ecuaia de verosimilitate. Exemple. Pe baza unei selecii de volum n, s se estimeze parametrul din repartiia Poisson:

    P X x ex

    x x P X x ex

    e

    x

    x

    n jj

    n x nx

    jj

    nj

    nj

    j

    n

    ( )!

    ,

    , , ..., ; ) ( ; )! !

    = =

    = = = =

    =

    ==

    =

    x = 0,1,2, ...

    P(x1 21

    1

    1

    1

    lnP(x1, x2, , xn; ) = L(x1, x2, , xn; ) = + ==n x xj j

    j

    n

    j

    n ln ln ( !)11

    L x x x nx

    nx

    nj

    j

    n

    jj

    n

    ( , , ..., ; )1 2 1

    1 0

    = +

    + =

    =

    =

    ,

    iar

    are soluia: $

    ( , , ..., ; )

    ( , , ..., ; $)

    = =

    =

    = 0, z1 = z2 nu convine i, deci, z1 = -z2; z2 = z .

    n acest caz, intervalul de ncredere devine:

    x zn n

    ; x + z ; z se determin din relaia: (z) - (-z) = , de unde urmeaz:

  • 2(z) 1 = , sau (z) = 1 21 1

    21

    2+ = + =

    Deci: z este z1

    2

    , 12

    cvantila unei repartiii normale N(0, 1). n final, intervalul de ncredere pentru m, cu nivelul de ncredere = 1 - este:

    x zn n

    1 2 1 2

    ; x + z Intervalul de ncredere pentru m cnd este necunoscut. n acest caz, se consider statistica:

    T(x1, x2, , xn; n, m) = X ms n

    /, s

    nx xj

    j

    n2 2

    1

    11

    = = ( ) Dup cum am vzut, variabila X m

    s n

    / urmeaz o lege de repartiie Student cu n-1

    grade de libertate. Dar legea de repartiie Student nu depinde de m i n plus X ms n

    / este

    funcie continu i strict descresctoare de m. Atunci, pentru un dat, se pot determina numerele t1 i t2 astfel nct:

    P t X ms n

    t

    n

    n nt

    ndt

    n

    t

    t

    1 2

    2 22

    1 12

    11

    1

    2

    =

    +

    =

    / ( )/

    Cum evenimentul t1 X ms n

    / t2 este echivalent cu evenimentul:

    x t sn

    m x t sn

    2 1 , rezult c:

    P( x t sn

    m x t sn

    2 1 ) = i, deci, am determinat un interval de ncredere:

    x t sn

    x t sn

    2 1; care, cu probabilitatea , acoper parametrul m.

    Ca i n cazul anterior, punem condiia ca lungimea intervalului s fie minim, cu restricia:

    n

    n nt

    ndt

    n

    t

    t2

    1 12

    11

    2 2

    1

    2

    +

    =

    ( )

    Aplicnd, i de data aceasta, metoda multiplicatorilor lui Lagrange se obine din:

    H t t sn

    t t

    n

    n nt

    ndt

    n

    t

    t

    ( , , ) ( )( )

    1 2 2 1

    2 22

    1 12

    11

    1

    2

    = +

    +

    i

    H t t H t t( , , ) , ( , , )1 2

    1

    1 2

    2

    0 0 t

    t

    = =

  • c t1 = - t2 , t2 = t1

    2

    , iar intervalul de ncredere devine:

    x t sn

    t snn n

    1 2 1 1 2 1 ; ;

    ; x +

    Intervalul de ncredere pentru 2

    Se consider statistica U(X1, X2, , Xn ; 2) = ( )n s12

    2 care, dup cum se tie, are o lege de repartiie ( )n12 (cu n-1 grade de libertate).

    Atunci pentru = 1 - fixat se pot determina dou numere 12 i 22 astfel nct: P n s

    nx en

    n x

    12

    2

    2 22

    2

    21

    21 1

    22

    12

    22

    =

    = ( )

    dx

    Dar funcia de repartiie a variabilei ( )n s12

    2 este independent de 2 i n plus

    ( )n s1 22 este funcie continu i strict descresctoare de

    2 ceea ce ne conduce la faptul c

    evenimentul:

    12 ( )n s12

    2 22 este echivalent cu evenimentul:

    ( ) ( )n s n s 1 12

    22

    22

    12

    Deci: P( ( ) ( )n sX

    n sX

    1 12

    22

    22

    12 ) = , adic am determinat un interval:

    ( ) ; ( )n s n s

    1 12

    22

    2

    12 care, cu o probabilitate , acoper parametrul

    2.

    S stabilim valorile 12 i 22 . Densitatea de repartiie a unei variabile X2 nemaifiind

    simetric, i lund numai valori pozitive adoptm urmtoarea regul:

    ( ) ( )P 2 12 2 222 2< = < =; P , numit i regula cozilor egale. f(x)

    1 - /2 /2 0 x

    /22 1 22 /

  • Din modul cum s-a construit tabelele pentru repartiia ( )n2 , se obine: ( )( )

    P

    P

    212

    2 12

    222

    1 2 12

    2

    12

    < = =

    < = =

    ,

    ,

    / ;

    / ;

    deci

    deci

    12

    n

    22

    n

    Urmeaz c intervalul de ncredere de nivel = 1 - este: ( ) ; ( )

    / ; / ;

    n s n s

    1 12

    1 22

    2

    22 n-1 n-1

    Dac ne intereseaz intervalul de ncredere pentru , atunci inem seama de faptul c variabila n 1 s are densitatea de repartiie:

    f xn

    x enn

    x

    ( ) ,=

    01

    2 12

    32

    2 2

    2 , x 0

    x > 0

    Pentru = 1 - fixat, se pot determina dou numere U1 , U2 astfel nct: P U n U

    nx en

    n x

    U

    U

    1 2 32

    2 21 1

    2 12

    2

    1

    2

    =

    s dx =

    /

    Se obine astfel intervalul: n n

    1 1 sU

    sU2 1

    ; care acoper cu o probabilitate valoarea parametrului .

    Valorile numerice se pot determina cu ajutorul cuantilelor unei variabile X2. S presupunem acum c dispunem de dou selecii: x11, x12, , x n1 1 efectuat dintr-o populaie N(m1, 1) i x21, x22, , x n2 2 efectuat

    dintr-o populaie N(m2, 2). Pe baza acestor selecii, obinem:

    ( )( )

    xn

    xn

    x x

    xn

    xn

    x x

    jj

    n

    jj

    n

    jj

    n

    jj

    n

    11

    11 1

    1 1

    2

    1

    22

    21 2

    2 2

    2

    1

    1 11

    1 11

    1 1

    2 2

    = =

    = = = =

    = =

    s

    s

    12

    22

    Intervalul de ncredere pentru m1 m2 n cazul cnd 1, 2 sunt cunoscute Se consider statistica:

    ( )U X X X X m m X X m mn n

    n n11 1 21 2 1 21 2 1 2

    12

    1

    22

    2

    1 2, ..., , , ..., ; ( ) =

    +

    care este o variabil normal N(0; 1), de unde urmeaz, parcurgnd punct cu punct calea urmat n cazul unei singure selecii, intervalul de ncredere.

  • x x zn n

    x x zn n1 2 1 2

    12

    1

    22

    21 2 1

    2

    12

    1

    22

    2

    + +

    ; Intervalul de ncredere pentru parametrul m1 m2 n cazul cnd 1, 2 sunt

    necunoscute, dar 12 22 2= = Se consider statistica:

    ( )U X X X X m mX X m m

    n n

    n s n sn n

    n n11 1 21 2 1 2

    1 2 1 2

    1 2

    1 12

    2 22

    1 2

    1 2

    1 1

    1 12

    ,..., , , ..., ;

    ( )

    ( ) ( ) =

    +

    + +

    ,

    care are repartiie Student cu n1 + n2 2 grade de libertate. Atunci procednd ca n cazul unei singure selecii dintr-o populaie normal N(m, ), obinem pentru un fixat, intervalul de ncredere:

    x x t n nn n

    n s n sn n

    x x t n nn n

    n s n sn n

    n

    n

    1 2 12

    2

    1 2

    1 2

    1 12

    2 22

    1 2

    1 2 12

    2

    1 2

    1 2

    1 12

    2 22

    1 2

    2

    2

    1 12

    1 12

    + + +

    + + + +

    +

    +

    ;

    ;

    ( ) ( ) ;

    ( ) ( )

    n

    n

    1

    1

    Acest interval acoper cu probabilitatea valoarea m1 m2 .

    Intervalul de ncredere pentru raportul 12

    22 .

    Am vzut c funcia de selecie:

    U X X X X X X

    s

    sn n( , , ..., , , , ..., ; , )11 12 1 21 22 2 1

    222

    12

    12

    22

    22

    1 2

    =

    are o repartiie Snedecor cu n1-1, n2-1 grade de libertate. Am notat:

    F ssn1 1 1

    22

    12

    12

    22 = , n2

    i am vzut c funcia de repartiie este independent de 1, 2,

    iar Fn1 1 1 , n2 ca funcie de

    2

    1

    2

    este continu i strict cresctoare.

    Atunci, pentru = 1 - dat, se pot determina dou numere F(1) i F(2), astfel nct: ( )P F F Fn( ) , ( )1 1 1 21 1 = n2 n ipoteza c adoptm cozi egale, se obine:

    P F F Fn n

    n1 1 1

    11 1 1 1 22

    1 1 1

    = , , ;; , n2 2 n2 n

  • Cum evenimentul:

    F ss

    Fn n1 1 1 1 1 1 1 22

    22

    12

    12

    22

    , , ;; n2 n2

    este echivalent cu evenimentul:

    ss F

    ss F

    n n n n

    1

    2

    2

    1 1 12

    1

    2

    2

    1

    2

    2

    1 12

    1 1

    1 2 1 2

    , ; , ;

    ,

    rezult c am obinut intervalul de ncredere:

    ss F

    ss F

    n n n n

    1

    2

    2

    1 1 12

    1

    2

    2

    1 12

    1 1

    1 2 1 2

    , ; , ;

    ;

    ,

    care, cu probabilitatea , acoper valoarea parametrului: 1

    2

    2

    Observaie. ntruct FFk k k k1 2 2 1

    1,

    ,

    = , rezult c intervalul de ncredere pentru raportul 12 22/ mai poate fi scris sub forma:

    ss

    Fss

    Fn n n n

    1

    2

    2

    1 1 12

    1

    2

    2

    1 122 1 2 1

    , ; , ;;

    n problemele privind durata de funcionare a unui produs, adesea se utilizeaz o repartiie exponenial.

    f xe

    x( , ),

    ,

    =

    01

    x 0

    x > 0, > 0

    Ne propunem s determinm un interval de ncredere pentru parametrul , care are semnificaie de durat medie de funcionare.

    Dup cum tim, funcia caracteristic a unei variabile exponenial negative de parametrul este: X t i( ) (= 1 t)-1

    S efectum o selecie de volum n:x1, x2, , xn, din populaia caracterizat de aceast variabil aleatoare i s considerm statistica:

    ( )U X X X Xn jj

    n

    1 21

    2, ,..., ; = = Funcia ei caracteristic este:

    ( ) u itUit

    X it

    X

    j

    n

    Xj

    n n

    t M e M e M et

    itj

    j

    n

    j

    j( ) = =

    =

    =

    =

    =

    = =

    2 2

    1 1

    12

    12

    Deci: ( )U nt it( ) = 1 2 care este funcia de repartiie a unei variabile ( )22 n (cu 2n grade de libertate).

    Urmeaz c funcia de selecie:

    ( )U X X X Xn jj

    n

    1 21

    2, ,..., ; = = urmeaz o lege de repartiie ( )22 n cu 2n grade de libertate.

  • Atunci, pentru = 1 - dat, putem determina dou numere: 12 i 22 astfel nct: P X

    nx e dxj

    j

    n

    nn x

    12

    22

    1

    1 22 12

    112

    22

    = = = =

    ( ) / Adoptnd ipoteza construirii unui interval cu cozi egale, se obine intervalul de ncredere:

    2 2

    1

    12

    2

    21

    22

    2

    X Xjj

    n

    n

    jj

    n

    n

    =

    =

    ; ;;

    care, cu probabilitatea = 1 - , acoper valoarea parametrului . 7.9 Intervale de ncredere pentru parametri n cazul seleciilor de volum mare Am vzut c determinarea unui interval de ncredere pentru parametrul care apare n legea de repartiie f(x; ) se baza pe construirea unei funcii de selecie care s depind de datele de selecie x1, x2, , xn, de volumul de selecie n i de parametrul de estimat . Pentru a putea determina efectiv intervalul de ncredere se fceau ipoteze suplimentare asupra funciei de repartiie a statisticii, printre care i faptul c aceast funcie de repartiie nu depinde de parametrul de estimat. n cazul unei legi normale N(m; ) se puteau obine relativ simplu intervale de ncredere pentru m sau/i , indiferent dac n (volumul seleciei) era mic sau nu. n multe alte situaii, aflarea funciei de repartiie a statisticii este o problem dificil, ns putem determina repartiia asimptotic a unei statistici care conine parametrul necunoscut i, deci, dac n este suficient de mare, erorile pe care le comitem utiliznd repartiia asimptotic sunt cu totul neglijabile. Fie variabila aleatoare X cu densitatea de repartiie f(x; ) ce caracterizeaz o populaie C, din care se efectueaz selecia de volum n; x1, x2, , xn . n ipoteza c valorile de selecie sunt independente, se obine funcia de verosimilitate:

    L(x1, x2, , xn,n; ) = f x jj

    n

    ( ; )=

    1

    De aici urmeaz c:

    ln ln ( ; )L f x j

    j

    n

    ==

    1

    Notnd: yf x

    jj=

    ln ( ; ), 1 j n ,

    se obine:

    M(Yj) = M

    ln ( ; )f x

    =

    ln ( ; ) ( ; )f x f x dx

    = 0 Presupunem c:

    0 < M2 ln ( ; )f x

    =

    ln ( ; ) ( ; )f x f x dx <

    2

    Atunci:

    D2 ln ( ; )f x

    = M2

    ln ( ; )f x

    ,

    iar variabila:

  • ln ln

    ln

    ln ( ; ) ln ( ; )

    ln ( ; )

    L M L

    D L

    f xM

    f x

    Df x

    Y

    nD

    j j

    j

    n

    j

    n

    j

    j

    n

    jj

    n

    =

    ===

    =

    =

    11

    2

    1

    1 ,

    unde am notat D2 ln ( ; )f x

    = D

    2, n baza teoremei lui Liapunov, este asimptotic N(0; 1).

    Deci:

    n

    jj

    n

    x

    a

    b

    P aY

    nDb e dx

    = < 0)

    Atunci: f(x; p) = px(1-p)1-x x = 0, 1;p (0; 1) Pe baza unei selecii x1, x2, , xn din populaia C caracterizate de variabila aleatoare X, obinem:

    L(x1, x2, , xn; p) = f x p p pjx

    j

    n xjj

    n

    jj

    n

    ( ; ) ( )(1 )

    = = ==

    1 11

    1

    Dac punem: x kjj

    n

    = =

    1

    , atunci ln L(x1, x2, , xn, n;p) = k ln p + (n-k) ln(1-p) i, deci:

    ln

    ( )L

    pkp

    n kp

    k npp p

    = =1 1

    Cum: Y f x pp

    xp

    xp

    x pp p

    = = =

    ln ( ; )( )

    11 1

    , avem imediat:

    M Y M X pp p

    D Y D X pp p p p

    D X p p pp p p p

    D

    ( ) ( )( )

    ( )( ) ( )

    ( ) ( )( ) ( )

    = =

    =

    = =

    = =

    10

    11

    111

    11

    2 22 2

    22 2

    2

  • Atunci variabila:

    Y

    nD nDP

    p np p

    k npp p

    kn

    p

    p pn

    jj

    n

    =

    = =

    =

    1 1 111

    1 1ln

    ( )( ) ( )

    are o lege de repartiie N(0; 1) i, deci, pentru n suficient de mare:

    P

    kn

    p

    p pn

    z z z