19
1 11 MATEMATI ˇ CKA STATISTIKA POVIJESNI PREGLED poˇ cetak XIX. st. - Ketle kraj XIX. st.-K. Pearson poˇ cetak XX. st. Fisher suvremena matematiˇ cka statistika sredina XX. st. Neumann, Vold Matematiˇ cka statistika je znanstvena disciplina koja provjerava mate- matiˇ cke modele sluˇ cajnog pokusa u realnosti. Prouˇ cava svojstva sluˇ cajnog uzoraka i donosi zakljuˇ cke o populaciji iz koje je uzet sluˇ cajni uzorak. Sta- tistiˇ cke metode daju zakljuˇ cke s nekom vjerojatnoˇ cu pa se temelje na teoriji vjerojatnosti. Deskriptivna statistika bavi se ure divanjem prikupljenih, empirijskih po- dataka, njihovim grafiˇ ckim prikazivanjem i opisivanjem pomo´ cu numeriˇ ckih vrijednosti: prosjek, standardna devijacija, korelacijski koeficijent,... Induktivna statistika bavi se metodama koje se zasnivaju na teoriji vje- rojatnosti i koje omogu´ cavaju da se donose zakljuˇ cci o populaciji pomo´ cu uzoraka iz populacije. Tri pravca u matematˇ ckoj statistici (induktivnoj statististici) su: teorija procjene , teorija testiranja statistiˇ ckih hipoteza , teorija planiranja eksperimenata . U teoriji procjene osvnut ´ cemo se na: toˇ ckaste procjenitelje , metodu maksimalne vjerojatnosti za odre divanje procjenitelja , intervale povjerenja za procjenitelje za parametre normalne razdiobe . U teoriji testiranja osvnut ´ cemo se na: test hipoteze o parametrima normalne razdiobe , 1 VIS -V: ˇ CULJAK-(radni materijal 2006.) 1

Predavanja 12 Iz PMIS-A (2012- 2013) - Osnovni Pojmovi Iz Deskriptivne Statistike i Statistièke (Pr)Ocjene

Embed Size (px)

DESCRIPTION

osnovni pojmovi

Citation preview

  • 111 MATEMATICKA STATISTIKA

    POVIJESNI PREGLEDpocetak XIX. st. - Ketlekraj XIX. st.-K. Pearsonpocetak XX. st. Fishersuvremena matematicka statistikasredina XX. st. Neumann, VoldMatematicka statistika je znanstvena disciplina koja provjerava mate-

    maticke modele slucajnog pokusa u realnosti. Proucava svojstva slucajnoguzoraka i donosi zakljucke o populaciji iz koje je uzet slucajni uzorak. Sta-tisticke metode daju zakljucke s nekom vjerojatnoscu pa se temelje na teorijivjerojatnosti.

    Deskriptivna statistika bavi se uredivanjem prikupljenih, empirijskih po-dataka, njihovim grafickim prikazivanjem i opisivanjem pomocu numerickihvrijednosti: prosjek, standardna devijacija, korelacijski koeficijent,...

    Induktivna statistika bavi se metodama koje se zasnivaju na teoriji vje-rojatnosti i koje omogucavaju da se donose zakljucci o populaciji pomocuuzoraka iz populacije.

    Tri pravca u matematckoj statistici (induktivnoj statististici) su:teorija procjene,teorija testiranja statistickih hipoteza,teorija planiranja eksperimenata.

    U teoriji procjene osvnut cemo se na:tockaste procjenitelje,metodu maksimalne vjerojatnosti za odredivanje procjenitelja,intervale povjerenja za procjenitelje za parametre normalne razdiobe.

    U teoriji testiranja osvnut cemo se na:test hipoteze o parametrima normalne razdiobe,

    1VIS -V:CULJAK-(radni materijal 2006.)

    1

  • Teorija planiranja eksperimenta razvija metodu sekvencijalne analize ,broj promatranja je slucajan , pa se provjera statstickih hipoteza ovom me-todom izvodi postepeno, u etapama. Hipoteza se moze prihhvatiti, odbiti iliproduziti eksperiment .

    11.1 DESKRIPTIVNA STATISTIKA

    Definicija 11.1 (POPULACIJA)Populaija (osnovni skup, statisticki skup) je skup svih elemenata od kojih

    bismo mogli uzeti podatke o odredenim velicinama.Populacija moze biti konacna ili beskonacna.

    PRIMJER 11.1 Populacija - sve obitelji u jednoj zgradi.Velicine koje mozemo razmatrati: broj djece, mjesecni dohodak..

    Definicija 11.2 (STATISTICKA VARIJABLA-OBILJEZJE)Statisticko obiljezje (vaijabla) je numericko svojstvo elemenata statistickog

    skupa.Ako je skup vrijednosti R(X) statistickog obiljezja diskretan onda za X

    kazemo da je diskretno obiljezje, a ako je R(X) R kazemo da je kontinu-irano obiljezje.

    Uzorak je podskup populacije koji uzimamo na unaprijed odreden nacin.

    Definicija 11.3 (FREKVENCIJA, RELATIVNA FREKVENCIJA, KU-MULATIVNA RELATIVNA FREKVENCIJA, ARITMETICKA SREDINA,VARIJANCA, STANDARDN DEVIJACIJA)

    Neka je X statisticko obiljezje i neka se mjerenje ponovi n, konacnomnogo puta (nezavisno) i dobije n statistickih podataka xi, i = 1, .., n. SlikaR(X)={xk, k = 1, .., r} sadrzi r razlicitih statistickih podataka. Ako se xk po-javi fk puta onda kazemo da x

    k pripada frekvencija fk i relativna frekvencija

    fkn, za k,= 1, .., r.

    Vrijedi:r

    k=1

    fk = n,r

    k=1

    fkn= 1

    Za x R kazemo da ima kumulativnu relativnu frekvenciju Fn(x)=

    k,xkxfkn.

    Aritmeticka sredina n statistickih podataka xi, i = 1, .., n.

    x = 1n

    ni=1

    xi.

    2

  • x = 1n

    rk=1

    xkfk.

    Varijanca n statistickih podataka xi, i = 1, .., n.

    2 = 1n

    ni=1

    (xi x)2 = 1nni=1

    x2i x2.

    2 = 1n

    rk=1

    (xk x)2fk = 1nr

    k=1

    (xk)2fk x2.

    Standardna devijacija je .

    Statisticke podatke koji se dobiju mjerenjem statistickog obiljezja X mozemoprikazati:

    tablicno: tablicom frekvencija i tablicom relativnih frekvencija,graficki: grafikonom frekvencija, relativnih frekvencija, kumulativnih frek-

    vencija,histogramom (nad dobivenim podacima xk nacrtani su pravokutnici visine

    jednake frekvenciji fkili relativnoj frekvencijifkn),

    poligonom (izlomljena linija koja spaja tocke (xk, fk)).Ako je n veliki i skup vrijednosti ima veliki broj elemenata (posebno kod

    kontinuirane slucajne varijable-statistickog obiljezja) formiramo r razreda.Prilikom tablicnog i grafickog prikazivanja vrijednosti slucajnog uzorka naapscisu nanosimo r podintervala (razreda), sa sredinama razreda xksr, a naordinatu sumu frekvencija fk elemenata iz tog razreda.

    Broj razreda r nekad se racuna po formulama:r=n, r=2 3

    n .

    U praksi se koristi slijedeca shema za izbor broja razreda:n r40-60 6-860-100 7-10100-200 8-12200-500 12-17> 500 21

    PRIMJER 11.2 Mjerenjem kontinuirane slucajne varijable X= prosjecnetezine studenata jednog turnusa na uzorku velicine 100 dobivena je vrijednostslucajnog uzorka (x1, x2, ..., x100) dana u tablici:

    3

  • razred xksr fkfkn

    Fn(x)60-62 61 5 0,05 0,0563-65 64 18 0,18 0,2366-68 67 42 0,42 0,6569-71 70 27 0,27 0,9272-74 73 8 0,08 1,00ukupno n=100 1,00

    Relativne frekvencije odgovaraju pojmu statisticke vjerojatnosti.P (66 < X < 68) 0, 42Slike histogrami: frekvencija i relativnih frekvencija:ftbpF173.375pt110.4375pt0ptFigureftbpF179.0625pt114.0625pt0ptFigureSlika: graf kumulativnih relativnih frekvencijaftbpF174.125pt110.9375pt0ptFigure

    Definicija 11.4 (STATISTICKA RAZDIOBA)Statisticko obiljezje (slucajna varijabla) X sa skupom vrijednosti R(X)

    opisano grafom relativnih frekvencija ili grafom kumulativnih relativnih frek-vencija ima statisticku funkciju distribucije Fn(x). Slucajna varijabla X imai teorijsku funkciju distribucije F (x).

    TEOREM 11.1 (GLIVENKO)Ako su vrijednosti u uzorku slucajne varijable X (statistickog obiljezja)

    nezavisni, onda jeP (sup

  • PRIMJER 11.3 Racunanje medijana statistickog obiljezja X:(A) Ako je niz statistickih podataka, vrijednosti nekog statistickog obiljezja Xrastuci

    x1 x2 ... xn, onda jeMe = xn+1

    2, za n neparan

    Me =xn2+xn

    2 +1

    2, za n paran.

    PRIMJER 11.4 Odredite medijan za zadani niz statistickih podataka3 4 4 5 6 8 8 8 10,n=9, neparanMe = xn+1

    2= x5 = 6.

    PRIMJER 11.5 Racunanje medijana statistickog obiljezja X:(B) Ako su vrijednosti statistickog obiljezja date u razredima s odgovarajucimfrekvencijama fi onda je

    Me = LMe + d n2(f1+f2+...+fk)

    fk+1,

    gdje je k izabran tako da jeFk = (f1 + f2 + ...+ fk) n2 f1 + f2 + ...+ fk + fk+1 = F

    k+1,

    LMe je lijevi rub k + 1 razreda,d je sirina razreda.

    PRIMJER 11.6 Racunanje prvog kvartila statistickog obiljezja X:(A) Ako je niz statistickih podataka, vrijednosti nekog statistickog obiljezja Xrastuci

    x1 x2 ... xn, onda jeQ1 = xcijelo(n

    4+1), za n nije djeljiv s 4

    Q1 =xn4+xn

    4 +1

    2, za n djeljiv s 4.

    PRIMJER 11.7 Odredite prvi kvartil za niz statistickih podataka.3 4 4 5 6 8 8 8 10,n=9, nije djeljiv s 4Q1 = xcijelo(n

    4+1) = x3 = 4.

    PRIMJER 11.8 Racunanje prvog kvartila statistickog obiljezja X:(B)Ako su vrijednosti statistickog obiljezja date u razredima s odgovarajucimfrekvencijama fi onda je

    Q1 = LQ1 + d n4(f1+f2+...+fk)

    fk+1,

    5

  • gdje je k izabran tako da jeFk = (f1 + f2 + ...+ fk) n4 f1 + f2 + ...+ fk + fk+1 = F

    k+1,

    LQ1 je lijevi rub k + 1 razreda,d je sirina razreda.

    PRIMJER 11.9 Racunanje treceg kvartila:(A) Ako je niz statistickih podataka, vrijednosti nekog statistickog obiljezja Xrastuci

    x1 x2 ... xn, onda jeQ3 = xcijelo( 3n

    4+1), za n nije djeljiv s 4

    Q3 =x 3n4+x 3n

    4 +1

    2, za n djeljiv s 4.

    PRIMJER 11.10 Odredite treci kvartil niz statistickih podataka3 4 4 5 6 8 8 8 10,n=9, nije djeljiv s 4Q3 = xcijelo( 3n

    4+1) = x7 = 8

    PRIMJER 11.11 Racunanje treceg kvartila:(B) Ako su vrijednosti statistickog obiljezja date u razredima s odgovarajucimfrekvencijama fi onda je

    Q3 = LQ3 + d 3n4(f1+f2+...+fk)

    fk+1,

    gdje je k izabran tako da jeFk = (f1 + f2 + ...+ fk) 3n4 f1 + f2 + ...+ fk + fk+1 = F

    k+1,

    LQ1 je lijevi rub k + 1 razreda,d je sirina razreda.

    Definicija 11.6 (mod)Mod je vrijednost statistickog obiljezja koja ima najvecu frekvenciju. Mozese desiti da mod ne postoji ili da postoji vise modova.

    PRIMJER 11.12 Odredite mod niza statistickih podataka3 4 4 5 6 8 8 8 10,xi fi3 14 25 16 18 310 1

    6

  • xi = 8 ima maksimalnu frekvenciju fi = 3.Mo = 8.

    PRIMJER 11.13 Racunanje moda :Ako su vrijednosti statistickog obiljezja date u razredima s odgovarajucimfrekvencijama fi onda je

    Mo = LMo + d 11+2 ,gdje je k izabran tako da je fk maksimalanLMo je lijevi rub k tog razreda,d je sirina razreda,1 = fk fk1, 2 = fk fk+1.

    Definicija 11.7 (koeficijent varijacije)Koeficijent varijacije je relativna mjera standardne devijacija

    i racuna se na dva nacinaKV =

    x 100% ili pomocu kvartila

    KV =Q3Q1Q3+Q1

    .

    Definicija 11.8 (koeficijent asimetrije)Koeficijent asimetrije za slucajnu varijablu X je broj KA koji karakterizirasimetriju razdiobe i definira se kao kvocijent treceg centralnog momenta i kubastandardne devijacije :

    KA =33.

    Definicija 11.9 Koeficijent asimetrije statistickog obiljezja X, ako su vri-jednosti statistickog obiljezja date kao niz xi s frekvencijama fi , i = 1, ...r,definira se kao

    KA =33, gdje je

    3 =1n

    ri=1(x

    isr x)3fi, (

    ri=1 fi = n);

    2 = 1n

    ri=1(x

    isr x)2fi, (

    ri=1 fi = n).

    NAPOMENA 11.1 Ako je KA = 0 onda je razdioba frekvencija simetricnau odnosu na pravac x = x onda se poklapaju x = Me = Mo. (Normalnarazdioba ima KA = 0)

    Ako je KA > 0 onda je razdioba frekvencija asimetricna u odnosu napravac x = x, asimetrija je pozitivna i vrijedi x > Me > Mo.

    Ako je KA < 0 onda je razdioba frekvencija asimetricna u odnosu napravac x = x, asimetrija je negativna i vrijedi x < Me < Mo.

    7

  • Definicija 11.10 koeficijent spljostenosti (eksces)Koeficijent spljostenosti slucajne varijable X je broj KE koji karakterizirazaobljenost razdiobe i definira se kao pomocu kvocijenta cetvrtog centralnogmomenta i cetvrte potencije standardne devijacije :

    KE =44 3.

    Definicija 11.11 Koeficijent spljostenosti statistickog obiljezja X, ako suvrijednosti statistickog obiljezja date kao niz xi s frekvencijama fi , i = 1, ...r,definira se kao

    KE =44 3, gdje je

    4 =1n

    ri=1(x

    isr x)4fi, (

    ri=1 fi = n);

    2 = 1n

    ri=1(x

    isr x)2fi, (

    ri=1 fi = n).

    NAPOMENA 11.2 Ako je KE = 0 onda je razdioba frekvencija normalnarazdioba. (Normalna razdioba ima KE = 0)

    Ako je KE > 0 onda je graf funkcije razdiobe frekvencija uzi od grafanormalne razdiobe(spljostenost je manja).

    Ako je KE < 0 onda je graf funkcije razdioba frekvencija siri od normalnerazdiobe (spljostenost je veca).

    PRIMJER 11.14 Mjerenjem kontinuirane slucajne varijable X= prosjecnetezine studenata jednog turnusa na uzorku velicine 100 dobivena je vrijednostslucajnog uzorka (x1, x2, ..., x100) dana u tablici:

    razred xisr fi Fi

    fin

    Fn(x)60-62 61 5 5 0,05 0,0563-65 64 18 23 0,18 0,2366-68 67 42 65 0,42 0,6569-71 70 27 92 0,27 0,9272-74 73 8 100 0,08 1,00ukupno n=100 1,00Odrediti ocekivanje, varjancu, standardnu devijaciju, mod, medijan, prvi

    kvartil, treci kvartil, koeficijent varijacije, koeficijent asimetrije, koeficijentspljostenosti.

    NAPOMENA: Razredi su u tablici dati smbolicno npr. razred 60 62 jerazred 59.5 62.5 tako da je sirina razdreda d = 3.Rjesenje:

    ocekivanjex = 1

    100

    5i=1 x

    isrfi = 67.45

    8

  • varijanca2 = 1

    n

    ri=1(x

    isr x)2fi = 8.527

    medijan

    Me = LMe + d n2(f1+f2+...+fk)

    fk+1,

    gdje je k + 1 = 3 izabran tako da jeFk = f1 + f2 = 23 n2 = 50 f1 + f2 + f3 = 65 = F

    k+1,

    LMe = 65.5 je lijevi rub k + 1 = 3. razreda,d = 3 je sirina razreda.

    Me = LMe + d n2(f1+f2+...+fk)

    fk+1= 65.5 + 3 5023

    42= 67.4.

    prvi kvartil

    Q1 = LQ1 + d n4(f1+f2+...+fk)

    fk+1,

    gdje je k + 1 = 3 izabran tako da jeFk = f1 + f2 = 23 n4 = 25 f1 + f2 + f3 = 65 = F

    k+1,

    LQ1 = 65.5 je lijevi rub k + 1 = 3. razreda,d = 3 je sirina razreda.

    Q1 = LQ1 + d n4(f1+f2+...+fk)

    fk+1= 65.5 + 3 2523

    42= 65.643

    treci kvartilQ3 = LQ3 + d

    3n4(f1+f2+...+fk)

    fk+1,

    gdje je k + 1 = 4 izabran tako da jeFk = f1 + f2 + f3 = 65 3n4 = 75 f1 + f2 + f + f4 = 92 = F

    k+1,

    LQ3 = 68.5 je lijevi rub k + 1 = 4. razreda,d = 3 je sirina razreda.

    Q3 = LQ3 + d 3n4(f1+f2+...+fk)

    fk+1= 68.5 + 3 7565

    27= 69.611.

    modMo = LMo + d 11+2 ,

    gdje je k = 3 izabran tako da je fk = 42maksimalanLMo = 65.5 je lijevi rub k = 3. razreda,d = 3 je sirina razreda,1 = fk fk1 = f3 f2 = 42 18,2 = fk fk+1 = f3 f4 = 42 27.Mo = LMo + d 11+2 = 65.5 + 3 2424+15 = 67.346.koeficijent varijacije

    KV =x 100% =

    8.52767.45

    100% = 4.32%

    KV =Q3Q1Q3+Q1

    = 69.61165.64369.611+65.643

    = 2.933 7 102koeficijet asimetrije i spljostenosti

    9

  • 3 =1n

    ri=1(x

    isr x)3fi = 2.293

    4 =1n

    ri=1(x

    isr x)4fi = 199.37

    KA =33

    = 0.14KE =

    44 3 = 0.26

    11.2 TEORIJA PROCJENA

    Teorija procjene sastoji se u konstrukciji metoda za ocjenu vrijednosti jednogili vise parametara razdiobe slucajne varijable. (Kolmogorov, Smirnov ,Vold).

    Definicija 11.12 (SLUCAJNI UZORAK velicine n)Neka je X slucajna varijabla (statisticko obiljezje populacije) s funkci-

    jom distribucije F(x). Slucajni uzorak velicine n za slucajnu varijablu X jeslucajni vektor (X1, X2, ..., Xn), gdje su sve slucajne varijable Xi , i=1,...,n,nezavisne sa zajednickom funkcijom distribucije vjerojatnosti F(x).

    Vrijednost slucajnog uzorka je uredena n-torka (x1, x2, ..., xn) ako je iz-mjerena vrijednost slucajnih varijabli Xi jednaka xi R(X),i=1,...,n.

    Ako je X diskretna slucajna varijabla (R(X) je konacan ili prebrojiv),onda je (X1, X2, ..., Xn) diskretni slucajni uzorak , a ako je X kontinuiranaslucajna varijabla (R(X) R), onda je (X1, X2, ..., Xn) kontinuirani slucajniuzorak.

    Definicija 11.13 (STATISTIKA)Ako je Y=h(X1, X2, ..., Xn), gdje je h funkcija od n varijabli, onda se

    slucajna varijabla Y naziva statistika.

    NAPOMENA 11.3 Odabrani elementi uzorka velicine n iz populacije tre-baju biti izabrani slucajno. Trebamo koristiti tablicu slucajnih brojeva za izborn slucajnih brojeva ili program za generiranje slucajnih brojeva.

    PRIMJER 11.15 Zadana je diskretna slucajna varijabla X s funkcijom vje-rojatnosti

    xi 0 1 2pi

    12

    13

    16

    Sto je uzorak velicine 2 za ovu slucajnu varijablu?Odredi sve moguce vrijednosti slucajnog uzorka velicine 2 za X.

    10

  • Rjesenje:Slucajni uzorak velicine 2 za slucajnu varijablu X je slucajni vektor (X1, X2),

    gdje su sve slucajne varijable X1 i X2 nezavisne i jednake funkcije distribucijekao i X.

    Slika slucajne varijable X je R(X)={0,1,2}. Slucajne varijableX1 iX2 mogupoprimiti iste vrijednosti kao i X. Vrijednost slucajnog uzorka

    je uredena dvojka (x1, x2) elemenata iz R(X), tj. to je varijacija s po-navljanjem r=2-og razreda od n=3 elemenata. Broj svih takvih varijacija jeV(2)3 = 3

    2 = 9.Sve moguce vrijednosti slucajnog uzorka velicine 2 za slucajnu varijablu

    X:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2).

    11.3 TOCKASTE PROCJENE PARAMETARA

    Slucajna varijabla je odredena svojom funkcijom distribucije. Mnoga sta-tisticka obiljezja imaju zajednicku teorijsku funkciju distribucije pa govorimoo poznatim distribucijama (razdiobama): binomna, uniformna, normalna,Poissonova,....

    Svaka razdioba karakterizirana je svojim parametrima n, p,a,b, , 2, , ...:X B(n, p),X U(a, b),X N(, 2),X Po(), ....Ako zelimo odrediti vezu izmedu teorijske i statisticke razdiobe postav-

    ljaju se dva zadatka:1. parametarske procjene, kada pretpostavimo teorijsku razdiobu i mo-

    ramo odrediti (procijeniti) parametre te razdiobe.2. neparametaske procjene, kada moramo odabrati razdiobu.

    Definicija 11.14 (PROCJENITELJ ILI ESTIMATOR)

    Procjenitelj nepznatog parametra t je funkcija slucajnog uzorka T = h(X1, X2, ..., Xn).Procjenitelj je statistika.

    Zadatak je odrediti procjenitelj T za parametar t koji ce najbolje pro-cijeniti t.

    11

  • Za procjenu jednog parametra mozemo izabirati razne procjenitelje (funk-cije h).

    Definicija 11.15 (NEPRISTRANI PROCJENITELJ)

    Procjenitelj T je nepristran za parametar t ako je ocekivanje od T jednakovrijednosti parametra t: E(T ) = t.

    Definicija 11.16 (ASIMPTOTSKI NORMALAN PROCJENITELJ)

    Procjenitelj T je asimptotski normalan za parametar t ako slucajnoj vari-

    jabli TtV ar(T )

    asimptotski, kad n, pripada standardna normalna razdioba(distribucija) N(0,1).

    Definicija 11.17 (UZORACKA ARITMETICKA SREDINA)

    Statistika X = h(X1, X2, ..., Xn) =1n

    ni=1

    Xi zove se uzoracka aritmeticka

    sredina.Vrijednost uzoracke aritmeticke sredine racuna pomocu

    x = h(x1, x2, ..., xn) =1n

    ni=1

    xi.

    x = 1n

    rk=1

    xkfk.

    TEOREM 11.2 (Svojstva uzoracke aritmeticke sredine)(i) Neka je X slucajna varijabla s teorijskim ocekivanjem , i varijancom

    2,0 < 2 < , koju ispitujemo pomocu slucajnog uzorka (X1, X2, ..., Xn).Uzoracka aritmeticka sredinaX je pouzdan procjenitelj za :

    E(X) = .(ii) V ar(X) = 1

    n2.

    (iii) X N(, 1n2)

    (iv) Uzoracka aritmeticka sredinaX je asimptotski normalan procjeniteljza :

    X= X

    V ar(X) N(0, 1).

    Dokaz:

    (i) E(X) = E( 1n

    ni=1

    Xi) =1n

    ni=1

    E(Xi) =1n

    ni=1

    = .

    12

  • (ii) V ar(X) = V ar( 1n

    ni=1

    Xi)

    = 1n2V ar(

    ni=1

    Xi)

    = 1n2V ar(

    ni=1

    Xi)

    = 1n2

    ni=1

    V ar(Xi)

    = 1n2n V ar(Xi)

    = 1n2

    (iii) prema (i) i (ii).(iv) Prisjetimo se centralnog granicnog teorema:Neka je Sn = X1 +X2 + ...+Xn,tada slucajna varijablaSnnn

    konvergira k N(0,1).

    X= X

    V ar(X)=

    Snn1n2

    = Snnn

    konvergira (n) k N(0,1).

    PRIMJER 11.16 Izracunati P (69 < X < 75), ako je X uzoracka arit-meticka sredina uzorka velicine n=36 iz normalne razdiobe X N(70, 144).

    Rjesenje:Ako je X N(70, 144) i n=36, onda je X N(70, 4),X=nX

    = X70

    2 N(0, 1).

    P (69 < X < 75) = F (n75

    ) F (n59

    )

    = F (75702

    ) F (69702

    )= F (2.5) F (0.5)= 0.68.

    PRIMJER 11.17 Koliki uzorak iz normalne razdiobe s varijancom 81 trebabiti da bi s vjerojatnoscu 0.9544 apsolutna razlika uzoracke aritmeticke sre-dine i ocekivanja bila manja od 5.5?

    Rjesenje:Neka je X N(, 81) i P (|X | < 5.5) 0.9544.Trebamo odrediti velicinu uzorka n.Znamo da je X N(, 81

    n), a X

    =nX

    =nX

    9 N(0, 1).

    P (|X | < 5.5) = P (|nX| < n5.5

    )

    = P (|X| n5.5)

    13

  • = 2F (n5.5

    ) 1.

    Iz zadane vjerojatnosti dobivamo:2F (

    n5.5

    ) 1 0.9544,

    F (n5.5

    ) 0.9772,

    n5.5 2,

    n 11.

    Definicija 11.18 (UZORACKA VARIJANCA)

    Statistika 2 = 1n

    ni=1

    (Xi X)2 zove se uzoracka varijanca.

    2 = 1n

    ni=1

    X2i X2

    Vrijednost uzoracke varijance racuna se formulom

    2 = 1n

    ni=1

    (xi x)2 = 1nni=1

    x2i x2.

    2 = 1n

    rk=1

    (xk x)2fk = 1nr

    k=1

    (xk)2fk x2.

    TEOREM 11.3 (Svojstva uzoracke varijance)Neka je X slucajna varijabla s teorijskim ocekivanjem i varijancom 2,

    koju ispitujemo pomocu slucajnog uzorka (X1, X2, ..., Xn). Uzoracka vari-

    janca 2 nije pouzdan procjenitelj za 2: E(2) = n1n2.

    Dokaz:Prisjetimo se da je V ar(X)=E(X2) E(X)2 i V ar(X) = 1

    n2.

    E(2) = E( 1n

    ni=1

    X2i X2)

    = 1n

    ni=1

    E(X2i ) E(X2)

    = 1n

    ni=1

    [V ar(Xi) + E(Xi)2] [V ar(X) + E(X)2]

    = [V ar(Xi) + E(Xi)2] [V ar(X) + E(X)2]

    = [2 + 2] [ 1n2 + 2]

    = n1n2.

    Definicija 11.19 (KORIGIRANA UZORACKA VARIJANCA)

    Statistika S2 = 1n1

    ni=1

    (Xi X)2 zove se korigirana uzoracka varijanca.

    14

  • S2 = nn1

    2 = 1n1(

    ni=1

    X2i nX2).Vrijednost korigirane uzoracke varijance racuna se formulom

    s2 = 1n1

    ni=1

    (xi x)2 = 1n1(ni=1

    x2i nx2).

    s2 = 1n1

    rk=1

    (xk x)2fk = 1n1(r

    k=1

    (xk)2fk nx2).

    TEOREM 11.4 (Svojstva korigirane uzoracke varijance)Neka je X slucajna varijabla s teorijskim ocekivanjem i varijancom 2,

    koju ispitujemo pomocu slucajnog uzorka (X1, X2, ..., Xn).

    Korigirana uzoracka varijanca S2 je pouzdan procjenitelj za 2: E(S2) =2.

    Dokaz:Prisjetimo se da je E(2) = n1

    n2.

    E(S2) = E( nn1

    2) = nn1E(

    2) = nn1 n1n 2 = 2.

    TEOREM 11.5 (O VEZI S2, 2 I DISTIBUCIJA 2(n 1), t(n 1))Neka su X, S2, 2 statistike slucajnog uzorka (X1, X2, ..., Xn) iz normalne

    razdiobe X N(, 2).Tada vrijedi:(i) Statistika n1

    2S2 = n

    22 2(n 1),

    (ii) StatistikanX

    S=n 1X

    t(n 1).

    Dokaz:(i) Dokaz je slozen i koristi svojstvo 2(n) distribucije: Y 2(n) ako je

    Y = Y 21 + Y22 + ...+ Y

    2n , Yi N(0, 1).

    (ii)Koristimo svojstvo Studentove distribucije s n stupnjeva slobode t(n) :Z t(n) ako je

    Z = Y

    nU, za Y N(0, 1), U 2(n).

    Racunamo za X N(, 2), X N(, 2n), X

    =nX

    N(0, 1) :

    nXS

    =nX

    n1n1 1S2

    =nX

    n1n12

    1S2

    =nX

    n1n12

    S2.

    15

  • Prema tvrdnji (i) zakljucujemonX

    S t(n 1).

    Koristeci S2 = nn1

    2 mozemo dobiti i tvrdnjun 1X

    t(n 1).

    PRIMJER 11.18 Izracunati uzoracku aritmeticku sredinu, uzoracku vari-jancu i korigiranu uzoracku varijancu u primjeru tezina studenata.

    xksr fk61 564 1867 4270 2773 8

    n=100

    Rjesenje:

    x = 1n

    rk=1

    xkfk.

    x = 1n

    rk=1

    xksrfk

    = 1100

    (61 5 + 64 18 + 67 42 + 70 27 + 73 8)= 1349

    20

    = 67, 45

    s2 = 1n1(

    rk=1

    (xk)2fk nx2)

    s2 = 1n1(

    rk=1

    (xksr)2fk nx2)

    = 37944

    = 8, 6136

    2 = 1n

    rk=1

    (xk)2fk x2.

    2 = 1n

    rk=1

    (xksr)2fk x2

    = 3411400

    = 8, 5275

    11.4 METODA NAJVECE VJEROJATNOSTI (ML)

    Definicija 11.20 (FUNKCIJA VJERODOSTOJNOSTI) Neka je X slucajnavarijabla (statisticko obiljezje) sa teorijskom funkcijom distribucije F(x,t) s

    16

  • nepoznatim parametrom t i sa funkcijom vjerojatnosti za diskretnu razdiobu ifunkcijom gustoce vjerojatnosti za kontinuiranu f(x,t). Neka je (x1, x2, ..., xn)vrijednost slucajnog uzorka (X1, X2, ..., Xn) za promatranu varijablu.

    Za diskretnu razdiobu funkcija vjerodostojnosti L(t) definira se kao funk-cija vjerojatnosti slucajnog uzorka (slucajnog vektora):

    L(t) = P (X1 = x1, t) P (X1 = x2, t) ... P (X1 = xn, t).Za kontinuiranu razdiobu funkcija vjerodostojnosti L(t) definira se kao

    funkcija gustoce vjerojatnosti slucajnog uzorka (slucajnog vektora):L(t) = f(x1, t) f(x2, t) ... f(xn, t).Metoda najvece vjerojatnosti (ML=maximum likelihood method), (Fi-

    sher) za odredivanje procjenitelja T , = h(X1, X2, ..., Xn) za nepoznati para-metar t sastoji se u izboru one funkcije h takve da funkcija vjerodostojnostiL(t) (ili lnL(t)) dostize najvecu vrijednost za t = h(x1, x2, ..., xn).

    ddtL(t) = 0 t = h(x1, x2, ..., xn) T = h(X1, X2, ..., Xn).

    PRIMJER 11.19 Metodom najvece vjerojatnosti odrediti procjenitelj T zaparametar u populaciji s Poisonovom razdiobom Po().

    Rjesenje:Neka je X Po(). Teorijska funkcija vjerojatnosti jef(x, )=P (X = x, ) =

    x

    x!e.Trebamo naci ML-procjenitelj za .

    Funkcija vjerodostojnosti jeL() = P (X1 = x1, ) P (X1 = x2, ) ... P (X1 = xn, )

    = x1

    x1!e x2

    x2!e ... xn

    xn!e

    = xi

    x1!x2!...xn!en.

    Trazimo maksimum funkcije vjerodostojnosti lnL():lnL() = n+xi ln ln(xi!),ddlnL() = n+ 1

    xi.

    ddlnL() = 0 = 1

    n

    ni=1

    xi = x.

    = h(x1, x2, ..., xn) =1n

    ni=1

    xi.

    T = h(X1, X2, ..., Xn) =1n

    ni=1

    Xi.

    ML-procjenitelj za u Poisonovoj razdiobi je T = X.Mozemo pokazati da je T nepristrani procjenitelj E(T ) = .Prisjetimo se da je E(X)= i da jeX nepristrani procjenitelj za ocekivanje.

    17

  • E(T ) = E(X) = E(X) = .

    PRIMJER 11.20 Metodom najvece vjerojatnosti odrediti procjenitelj T(a) za parametar u populaciji s Normalnom razdiobom N(, 2) ako je

    2 poznato.(b) za parametar 2 u populaciji s Normalnom razdiobom N(, 2) ako je

    poznato.

    Rjesenje:Neka je X N(, 2). Teorijska funkcija gustoce vjerojatnosti jef(x, , 2) = 1

    2pie

    (x)222 .Trebamo naci ML-procjenitelje za i 2.

    Funkcija vjerodostojnosti je:L(, 2) = f(x1, t) f(x2, t) ... f(xn, t)

    = ( 12pi)n e 122

    (xi)2 .

    lnL(, 2) = 122

    (xi )2 n ln n ln

    2pi.

    (a) ddlnL(, 2) = 1

    2

    ni=1

    (xi ) = 0,ddlnL(, 2) = 0 = 1

    n

    ni=1

    xi = x,

    ML-procjenitelj za ocekivanje u normalnoj razdiobi jeT = X. To je nepristrani procjenitelj za jer je E(T )=.

    (b) ddlnL(, 2) = 1

    3

    ni=1

    (xi )2 n = 0,ddlnL(, 2) = 0 2 = 1

    n

    ni=1

    (xi )2 = , uzoracka varijanca.ML-procjenitelj za varijancu u normalnoj razdiobi jeT = 2. To nije nepristrani procjenitelj za 2 jer je E(T )=n1

    n2.

    PRIMJER 11.21 Metodom najvece vjerojatnosti odrediti procjenitelj T zaparametar p u populaciji s Binomnom razdiobom B(m, p) uz pretpostavkuda je m poznato.

    Rjesenje:Neka je X B(m, p). Teorijska funkcija vjerojatnosti jef(x,m, p)=P (X = x,m, p) =

    (mx

    )(1 p)mxpx.

    Trebamo naci ML-procjenitelj za p.Funkcija vjerodostojnosti jeL(p) = P (X1 = x1,m, p) P (X1 = x2,m, p) ... P (X1 = xn,m, p)

    18

  • =ni=1

    (mxi

    )(1 p)mxipxi

    Trazimo maksimum funkcije vjerodostojnosti lnL(p):lnL(p) =

    [ln(mxi

    )+ (m xi) ln(1 p) + xi ln p],

    ddplnL(p) = 1

    1p(m xi) + 1p

    xi

    ddlnL() = 0 p = 1

    m 1n

    ni=1

    xi =1mx.

    p = h(x1, x2, ..., xn) =1m 1n

    ni=1

    xi =1mx.

    T = h(X1, X2, ..., Xn) =1m 1n

    ni=1

    Xi =1mX.

    ML-procjenitelj za p u Binomnoj razdiobi B(m, p) s poznatim m je T =1mX.

    Mozemo pokazati da je T nepristrani procjenitelj E(T ) = p.Prisjetimo se da je E(X)=mp i da je X nepristrani procjenitelj za

    ocekivanje.E(T ) = E( 1

    mX) = 1

    mE(X) = 1

    mE(X) = 1

    mmp = p.

    19