134
Ž. Branović Statističke metode beleške

Statisticke metode

Embed Size (px)

DESCRIPTION

Statisticke metode - TF Mihajlo Pupin, Zrenjanin, Srbija

Citation preview

. Branovi

Statistike metodebeleke

Beograd, 2005.

Sadraj pitanja za usmeni deo ispita str. 1. Algebra dogaaja 2.Definicije verovatnoe dogaaja 3. Osobine verovatnoa 4.Uslovne verovatnoe 5. Nezavisnost dogaaja 6. Sluajne promenljive 7. Dvodimenzionalne sluajne promenljive 8. Funkcije sluajne promenljive 9. Numerike karakteristike sluajne promenljive 10. Koeficijent korelacije 11.Mere centralne tendencije 12. Mere varijacije 13.Mere asimetrije i spljotenosti 14. Zadatak statistike 15. Uzorak 16. Centralna teorema statistike 17. Takaste ocene parametara 18. Intervalno ocenjivanje 19. Testiranje statistikih hipoteza 20. T-test 21. 2 test 22. Regresije 23. Trendovi 1 5 9 10 12 14 19 22 24 27 29 35 36 41 43 45 46 49 52 57 60 63 67

1. Uvod u teoriju verovatnoe Ostvarivanjem odreenih uslova koji su neophodni za izvoenje nekog opita (eksperimenta) ne dobijaju se uvek jednoznani (deterministiki) rezultati. Za teoriju verovatnoa je bitna upravo situacija kada se na osnovu realizovanja odreenog kompleksa uslova mogu oekivati razliiti sluajni ishodi (rezultati). Tipian primer je bacanje kocke za igru. Ovde ostvarivanje kompleksa uslova znai kocka je baena, dok je ishod, ili dogaaj, ili rezultat broj taaka na gornjoj strani kada kocka pada. Teorija verovatnoa se bavi matematikom analizom sluajnih ili stohastikih pojava. Poetak ove teorije se vezuje za prouavanje zakona koji vladaju kod hazardnih igara (Paskal, 1654.) da bi, naroito u XIX stoleu, matematiki modeli sluajnosti postali znatno sloeniji i apstraktniji tako da je Kolmogorov, 1933. godine aksiomatski zasnovao teoriju verovatnoa. 1.1. Algebra dogaaja Skup svih moguih ishoda (dogaaja) koji se mogu oekivati pri nekom opitu -eksperimentu- ostvarenju kompleksa neophodnih uslova oznaava se sa , dok se elementi tog skupa, tj. pojedini ishodi ili rezultati nazivaju elementarni dogaaji i oznaavaju sa i. Pod dogaajem A se podrazumeva bilo koji podskup A skupa . Kaemo da se dogaaj A realizovao ako i samo ako se ostvari neki ishod i koji pripada podskupu A. Dogaaji se oznaavaju velikim slovima abecede, sa indeksima ili bez njih. Skup dogaaja je dogaaj koji se realizuje uvek pa se on zove siguran ili izvestan dogaaj. Prazan podskup zove se nemogu dogaaj. Predstavljanje dogaaja kao podskupova skupa omoguava da se meu dogaajima posmatraju relacije i operacije koje su analogne sa najvanijim relacijama i operacijama u Teoriji skupova.

Relacija implikacije. Kae se da dogaaj A implicira dogaaj B (piemo A B) ako i samo ako kad se realizuje dogaaj A onda se realizuje i dogaaj B. Relacija identinosti. Ako za neka dva dogaaja A i B vai A B i B A onda su A i B identini dogaaji i piemo A = B Operacija komplementiranja. Datom dogaaju A se moe pridruiti dogaaj Ac (zove se komplementaran ili suprotan dogaaj) koji se realizuje ako i samo ako se dogaaj A ne realizuje. Operacija presek (proizvod) dogaaja. Datim dogaajima A i B se moe pridruiti novi dogaaj- presek ili proizvod, oznaka A B ili AB. To je dogaaj koji se realizuje ako i samo ako se realizuju i dogaaj A i dogaaj B. Ako je A B = AB = kae se da dogaaji A i B disjunktni (uzajamno se iskljuuju pa se ne mogu istovremeno ostvariti). Jasno je da je A Ac = AAc = . Operacija uniranja. Unija dogaaja A i B ( oznaka je A B ) je dogaaj koji se ostvaruje ako i samo ako se ostvaruje bar jedan od dogaaja A i B. Unija dva disjunktna dogaaja A i B se oznaava sa A+B. Oigledno da je A Ac = A+B = . Razlika dogaaja. Razlika dogaaja A i B (oznaka A-B ili A\ B ) je dogaaj koji se realizuje ako i samo ako se realizuju oni ishodi koji pripadaju dogaaju A , a ne pripadaju dogaaju B. Oigledno je A- B = ABc. Simetrina razlika dogaaja A i B, oznaka AB , definie se sa AB = (A-B) (B-A) = (A B) AB Operacije i se mogu proiriti na konano, pa i prebrojivo mnogo dogaaja, tako da je : A1A2

...

An

= Aii =1

n

dogaaj koji se realizuje ako i samo ako se realizuje bar jedan od dogaaja Ai i {1, 2, 3, ... , n};

A1 A1

A2

...

An

= Aii= 1

n

dogaaj koji se realizuje ako i samo ako se realizuje svaki od dogaaja Ai ; A2

... = Aii= 1

dogaaj koji se realizuje ako i samo ako se realizuje svaki od dogaaja A1,A2, ... ; A1 A2 ... = Aii =1

dogaaj koji se realizuje ako i samo ako se realizuje bar jedan od dogaaja A1,A2, ... . Specijalno, ako je AiAj = A Ai piemo

i

A j = za ij onda umesto

i =1

Ai = A1 + A2 + A3 + ... .i =1

Primer 1.1. Igra se zavrava kada prvi put kod bacanja kocke padne broj 6. Neka je Ai dogaaj da u i-tom bacanju padne 6. Dogaaj igra je zavrena je Ai.i =1

Ako je A = B1+ B2 + ... + Bn , pri emu je Bi Bj = za ij , kaemo da je dogaaj A rastavljen na n posebnih sluajeva. Posebno, ako je B1+B2 + ... + Bn = onda se kae da dogaaji B1, B2, ... , Bn obrazuju potpunu grupu dogaaja. Na dogaaje se, oigledno, mogu preneti identiteti koji vae kod skupova, kao to su: A (B C) = (A B) (A C) ; (A B)c = Ac Bc ; (A B)c = Ac Bc, itd.

Primer 1.2. Dogaaji A, Ac B i (A B)c obrazuju potpunu grupu dogaaja jer je A (Ac B) (A B)c = A (Ac B) (Ac Bc) = A (Ac (B Bc) = A (Ac ) = A Ac = .Primer 1.3. Strelac gaa u cilj koji je oblika krune mete poluprenika r, pri emu se meri rastojanje x pogotka od centra mete. Opisati skup ishoda. Reenje. = { x : 0 x r } { promaaj}

Primer 1.3. Student polae tri ispita. Ako su A, B i C redom dogaaji: student je poloio prvi, odnosno drugi ili trei ispit sledee dogaaje izraavamo na sledei nain: a) student je poloio sva tri ispita ABC = A B C b) student je poloio bar jedan ispit A B C = Ac Bc Cc = (A B C)c c) student je poloio samo jedan ispit A BcCc + Ac B Cc + Ac Bc C d) student nije poloio ni jedan ispit (ABC)c Primer 1.4. Neka je skup ishoda u nekom eksperimentu dat sa = {0,1,2,3,4,5,6,7,8,9}. Uoeni su sledei dogaaji: A = {1,3,5,7,9}; B = {0,2,4,6,8} ; C ={4,5,6,7,8,9}. Odrediti sledee dogaaje : a)ABC ; b) (A B)c ; c) CcBc = Cc Bc ; d) A e) A B C ; f) Ac A ; g) Ac (B Cc) ; h) (A B C )c

2. Definicije verovatnoe dogaaja Klasina definicija verovatnoe. Pretpostavimo da je data potpuna grupa disjunktnih dogaaja E1, E2,..., En od kojih se nijedan ne moe dalje razloiti na posebne sluajeve. Pretpostavimo dalje i da su svi ti dogaaji Ei jednako mogui, tj. svi se mogu oekivati sa istom verovatnoom. Ako se dati dogaaj moe rastaviti na m takvih dogaaja (to znai da on nastupa kada se ostvari bilo koji od tih m dogaaja) onda se za verovatnou dogaaja A (oznaka p(A) ) uzima broj m / n. Jednakost p(A) = m / n predstavlja tzv. klasinu definiciju verovatnoe dogaaja. Intuitivno je jasno da je verovatnoa izvesnog dogaaja jednaka 1( jer se on razlae na n dogaaja, pa je tada m = n). Isto tako, verovatnoa nemogueg dogaaja je 0 (jer je u tom sluaju m = 0). Kako je za bilo koji

sluajni dogaaj m n, sledi da je razlomak m / n pravi razlomak pa je otuda verovatnoa ma kog sluajnog dogaaja neki broj izmeu 0 i 1. Pretpostavka o tome da su svi dogaaji Ei jednako mogui je ozbiljni nedostatak ove definicije verovatnoe dogaaja. Statistika definicija verovatnoe. Zamislimo eksperimenat koji se moe ponavljati n puta i u svakom od tih ponavljanja se registruje da li se realizovao neki dogaaj A. Broj realizacija tog dogaaja u n ponovljenih eksperimenata oznaimo sa n(A) (0 n(A) n ) . Kolinik n(A) / n nazivamo relativna uestalost (relativna frekvencija) dogaaja A u n ponovljenih eksperimenata (pokuaja). Ljudsko iskustvo, kao i neposredna intuicija, pokazuju da se sa uveanjem broja n (kada n )vrednosti kolinika n(A) / n sve vie grupiu oko jednog fiksnog broja p(A) koji se onda zove verovatnoa dogaaja A. To je tzv. statistika definicija verovatnoe dogaaja A saglasno kojoj je to granina vrednost (limes) relativne frekvencije kada se broj pokuaja (ekspeimenata) n neogranieno poveava. Tokom XVII i XVIII veka su vreni razliiti eksperimenti i utvrivane su onda odgovarajue relativne frekvencije. Tako su, recimo, za dogaaj da kod numerisane kocke padne broj 6 na gornjoj strani utvreni sledei podaci: n n(A) n(A) / n 600 84 0,140 6000 957 0,160 60000 9847 0,164 120000 19936 0,166 Vidi se da se vrednosti relativnih frekvencija grupiu oko broja 1/6 ( 0,166), to prema klasinoj definiciji predstavlja verovatnou uoenog dogaaja. Pirson, engleski matematiar, je bacao novi i beleio koliko se puta pojavilo pismo. Dobio je sledee rezultate: n 4040 12000 n(A) 2048 6019 n(A) / n 0,5070 0,5016

24000

12012

0,5005

Oigledno je da se frekvencija sve vie pribliava broju 0,5. Poznato je da je relativna frekvencija roenja mukog deteta 0,515 i da se taj broj pokazao vrlo stabilan u raznim vekovima i u raznim krajevima sveta. Ozbiljno ogranienje kod statistike definicije verovatnoe je svakako to to ne postoji efektivan postupak za odreivanje tane granine vrednosti ( a time i verovatnoe dogaaja) kojoj se pribliava niz relativnih frekvencija kada se broj ponavljanja eksperimenta uveava. Postoji i tzv. geometrijski definisana verovatnoa koja se odnosi na sluajeve kada je prostor svih ishoda neki neprebrojiv skup. Da bi se otklonili uoeni nedostaci u pojedinim od navedenih definicija uoava se jedna posebna kolekcija ili skup dogaaja na kome se pojam verovatnoe uvodi pomou aksioma. Ta kolekcija, (onaena sa F ) zadovoljava sledee zahteve: 1. F, 2. Ako A F , onda i Ac F, i 3. Ako Ai F, n = 1,2, ... , tada i A i F. i =1

Kolekcija dogaaja F se naziva polje ili - algebra ili Borelovo polje dogaaja. Verovatnoa p je numerika funkcija definisana nad Borelovim poljem dogaaja tako da zadovoljava sledee aksiome: A1) nenegativnost: Svakom sluajnom dogaaju A iz polja F odgovara nenegativan broj p(A) koji se zove verovatnoa dogaaja A. A2) normiranost. Verovatnoa sigurnog dogaaja je 1, tj. p () = 1. A3) - aditivnost. Ako je niz dogaaja An iz F takav da je Ai Aj = Ai Aj = za i j , onda je p ( Ai) = p(Ai).i =1

i =1

Ureena trojka (, F, p ) se zove prostor verovatnoe. Kae se i da je zadavanje prostora verovatnoe upravo zadavanje prebrojivo aditivne nenegativne mere koja je jo i normirana na merljivom prostoru. Na osnovu navedenih aksioma se dalje moe izgraivati sadrajna matematika teorija koja se temelji na tzv. teoriji mere. Konaan prostor verovatnoa. Neka je = {1, 2, ..., n} , n konaan prirodni broj, i neka su p1, p2, ... , pn brojevi koji zadovoljavaju uslov pi0, i = 1, 2, ... , n in

pi = 1. F je skup svih podskupova od kojih imai =1

n

2 ukljuujui i . Verovatnou moemo definisati na sledei nain: p(A) = pi pri emu se indeks i odnosi na one i koji pripadaju datom dogaaju A. Lako se proverava da je sada (, F, p ) prostor verovatnoe, odnosno da su zadovoljene aksiome A1, A2 i A3. Ako se pretpostavi da je pi = p(i ) = 1/n za i = 1,2,..., n dobija se klasina definicija verovatnoe za konaan prostor jednako verovatnih dogaaja, tj. p(A) = (broj i u A ) / n. Primer 2.1. Na 8 listia su zapisani brojevi 2, 4, 6, 7, 8, 11, 12, i 13. Na sluajan nain se biraju dva listia. Odrediti verovatnou da se razlomak formiran od izvuenih brojeva moe skratiti. Broj svih mogunosti n jednak je broju kombinacija druge klase od 8 elemenata, tj. n = 8! /(2! (8-2)!) = 28, dok je broj sluajeva m koji odgovaraju datom dogaaju jednak broju kombinacija druge klase od 5 elemenata (ima 5 parnih brojeva), tj. m = 5! / (2!(5-2)!) = 10. Otuda je verovatnoa datog dogaaja 5/14.

3. Osobine verovatnoe

Neposredne posledice aksioma pomou kojih se definie verovatnoa nekog dogaaja su, recimo: 1. p() = 0, jer je = + + + ... = ; 2. Konana aditivnost : p( Ai ) = p(Ai) kao posledica - aditivnostii =1 i =1 n n

budui da je Ai = A1+A2+ ... + An + + + ... ;i =1

n

3. p(A )= 1 p(A), jer je A + Ac = ; 4. Ako je A B onda je p(A) p(B) , jer je onda B = A + AcB ; 5. Za A F je 0 p(A) 1 , jer je A ; 6. p(A B ) = p(A) + p(B) p(AB) , jer je A = A + ABc i B = AB + AcB; 7. p(A B ) P(A) + p(B) Na osnovu pojmova verovatnoe dogaaja p definiu se pojmovi skoro siguran dogaaj A - ako je p(A) = 1, i skoro nemogu dogaaj A ako je p(A) = 0. To je zato to iz p(A) = 1 ne mora da sledi da je A = , niti iz p(A) = 0 da je A = . Primer 3.1. Koristei osobinu 6. moe se dobiti da je p(A B C) = p(A (B C)) = p(A) + p(B C) p (A(B C)) = p(A) + p(B) + p(C) p(BC) p(AB AC)) = p(A)+p(B) + p(C) p(BC) ( p(AB) + p(AC) p(ABAC)) = p(A) + p(B) + p(C) p(AB) p(AC) p(BC) + p(ABC).

c

4. Uslovne verovatnoe

esto se javlja potreba da se odredi verovatnoa dogaaja B pod uslovom da se ve ostvario dogaaj A ija je verovatnoa pozitivna. Takve ce verovatnoe nazivaju uslovne i oznaavaju sa pA (B) ili p(B/ A) . Uslovna verovatnoa pA(B) odreuje, opisno govorei, koji deo dogaaja A obuhvata dogaaj B. Primer 4.1. Verovatnoa dogaaja B : kod bacanja numerisane kocke pao je broj 2 je 1/6. Neka je poznato da je nastupio dogaaj A : pao je paran broj. Verovatnoa dogaaja B pod uslovom da je nastupio dogaaj A je onda 1/3. U aksiomatskom zasnivanju teorije verovatnoe uslovna verovatnoa se uvodi definicijom. Neka je (, F, p) prostor verovatnoe, A F i p(A) > 0 , tada je sa pA (B) = p(B/A) = p(AB) / p(A) = p(A B) / p(A) za svako B F odreena nova verovatnoa pA i novi prostor verovatnoe (, F, pA). Lako se moe proveriti da ova nova verovatnoa zadovoljava napred navedene aksiome verovatnoe A1, A2 i A3. Iz definicije uslovne verovatnoe sledi tzv. pravilo mnoenja p(AB) = p(A) p(B/A) = p(B) p(A/B) koje se moe onda proiriti na proizvod konano mnogo dogaaja p(A1A2... An) = p(A1) p(A2/A1) p(A3/A1A2) ... p(An/A1A2A3...An-1) Sa uslovnim verovatnoama su povezane i dve vane formule u teoriji verovatnoa. Formula totalne verovatnoe. Ako su A1,A2, ..., An uzajamno disjunktni dogaaji sa pozitivnim verovatnoama tako da je Ai = , onda za svaki dogaaj B F vai:i =1 n

p(B) = p(A1) p(B/A1) + p(A2) p(B/A2)+ ... + p(An) p(B/An) = p(Ai)i =1

n

p(B/Ai) Zaista, disjunktnost dogaaja Ai i = 1,2, ... ,n povlai i disjunktnost dogaaja Ai B = Ai B , a kako je B = B = B(A1+ A2+ ... + An) = A1B + A2B + ... AnB to se, uzimanjem verovatnoa, dobija navedena formula. Dogaaji A1, A2, ... , An se esto nazivaju i hipoteze. To znai da ako neki dogaaj nastupa uz odreene hipoteze, onda njegova verovatnoa zavisi od verovatnoa tih hipoteza i uslovnih verovatnoa tog dogaaja pod uslovom da su se realizovale te hipoteze. Verovatnoe p(Ai) i = 1,2, ..., n su obino poznate unapred, pre realizacije nekog eksperimenta, pa se esto nazivaju i apriornim verovatnoama. Bajesova formula. Saglasno pravilu mnoenja je p(AiB) = p(Ai) p(B/Ai) = p(B) p(Ai /B) za i = 1, 2, ..., n. Iz zadnje dve jednakosti, uz korienje formule o totalnoj verovatnoi, dobija se p(Ai /B) = p(Ai ) p(B/ Ai) / p(B) = p(Ai) p(B/ Ai) / p(Aj) p(B/Aj) za j =1 B F.n

Ova se formula obino interpretira na sledei nain: Dogaaj B se moe realizovati pod razliitim uzrocima, pretpostavkama, hipotezama A1,..., An . Dogaaj B se realizovao. Tada je p(Ai / B) verovatnoa dogaaja realizacija dogaaja B je nastupila pod uzrokom, hipotezom Ai, tj. verovatnoa hipoteze pod uslovom da se realizovao dogaaj B. Zbog toga se verovatnoe p(Ai/ B) nazivaju i aposteriorne verovatnoe. Primer 4.1. Pojava simptoma B u laboratorijskoj analizi krvi sree se kod bolesti Ai, i= 1,2,...,n . Poznata je verovatnoa pojavljivanja svake bolesti Ai i verovatnoa pojavljivanja simptoma B kod svake bolesti Ai, i = 1,2,...,n. Bajesova formula omoguava da se odredi verovatnoa da je u pitanju bolest Ai , odnosno daje vrednost od p(Ai/ B).

Primer 4.2. Ako je p(A) = 0,9 ; p(B) = 0,8 pokazati da je p(A/ B) 0,875. p(A/ B) = p(AB) / p(B) = (p(A)+p(B) p(A B))/ p(B) (0,9 +0,8 1)/0,8= 0,875 budui da je p(A B) 1.

5. Nezavisnost dogaaja Dogaaj A je nezavisan od dogaaja B ako i samo ako je pA(B) = p(B). U tom sluaju ranije navedeno pravilo mnoenja dobija oblik p(AB) = p(A) p(B) Kako je u tom sluaju i pB(A) = p(AB) / p(B) = p(A) p(B) / p(B) = p(A) to znai da ako je B nezavisan od A tada je i A nezavisan od B. U praktinim primenama nije lako proveriti nezavisnost dogaaja pomou definicije. Nezavisnost dogaaja se obino pretpostavlja (ili ne pretpostavlja) na osnovu fizikih uslova eksperimenta u kome te dogaaje posmatramo. Neki od nezavisnih dogaaja se lako uoavaju: 1. Proizvoljni dogaaj A i sigurni dogaaj su nezavisni. Zaista, zbog A = A i p() = 1 je p(A) = p(A) = p(A)1 = p(A) p() 2. Proizvoljni dogaaj A i nemogui dogaaj su nezavisni. Zbog A = i p() = 0 je p(A) = p() = 0 = 0p(A ) = p() p(A) . 3. Ako su dogaaji A i B nezavisni tada su to i dogaaji a) A i Bc , b) Ac i B , c) Ac i Bc .

Zaista, iz 1 = pB () = pB (A+Ac) = pB(A) + pB(Ac) = p(A) + pB(Ac) , odakle je pB(Ac) = 1 p(A) = p(Ac) ime je pokazano da vai b). Proveri sam ostala tvrenja! 4. Ako su A i B1 nezavisni, a isto tako i A i B2 , gde je B1B2 = , tada su i A i B1 + B2 nezavisni. Oigledno je p(A(B1 + B2)) = p(AB1+AB2) = p(A) p(B1) + p(A) p(B2)= p(A) (p(B1) + p(B2)) = p(A) p(B1+B2). Dogaaji A1, A2, ... , An su nezavisni u ukupnosti ako postoji meusobna nezavisnost za proizvoljnih r (r n) takvih dogaaja, tj. za ma koju konanu kolekciju Ai1, Ai2, ..., Air , 1 i1 i2 ... ir vai p(Ai1Ai2 ... Air) = p(Ai1) p(Ai2) ... p(Air). To znai i da je za ma kojih n dogaaja A1, A2, ... , An koji su nezavisni u ukupnosti: p(A1A2 ... An) = p(A1) p(A2) ... p(An) Da nezavisnost u parovima (bilo koja dva dogaaja su meusobno nezavisna) nije dovoljna za nezavisnost u ukupnosti pokazuje sledei jednostavan primer. Tri strane pravilnog teatraedra su obojene redom crvenom, plavom i utom bojom, dok je etvrta strana obojena sa sve te tri boje. Neka A oznaava dogaaj da prilikom bacanja tetraedra padne crvena boja, B- plava i C uta. Oigledno je da je p(A) = p(B) = p(C) = 2/4 = .Takoe je p(AB) = = = p(A) p(B) , a isto vai i za dogaaje AC i BC. To znai da su dogaaji u parovima nezavisni. Meutim, p(ABC) = p(A) p(B) p(C) = = odnosno, dogaaji A, B i C nisu nezavisni u ukupnosti. Primer 5.1. Dogaaji A1, A2, ... , An su nezavisni. Odrediti: a) verovatnou da se bar jedan od njih realizuje, b) verovatnou da se svi ne realizuju, c) verovatnou da se samo A3 realizuje. a) Posmatrani dogaaj je B = (A1cA2c... Anc)c pa je

p(B) = 1 p(A1cA2c ... Anc) = 1 p(A1c) p(A2c) ... p(Anc) = 1 (1-p(A1)) (1-p(A2)) ... (1-p(An)). b) C = (A1A2 ... An)c , pa je p(C) = 1- p(A1) p(A2) ... p(An). Primer 5.2. Pokazati da dogaaji A i Ac nisu meusobno nezavisni. Zaista , ako je 0 < p(A) < 1 onda je i 0 < p(Ac) < 1 pa je p(Ac/ A) = p(AAc) / p(A) = p() / p(A) = 0 p(Ac).

6. Sluajne promenljive U svakodnevnom ivotu, kao i u naunoj praksi, esto se deava da se nekom moguem ishodu pridruuje neka numerika karakteristika ili obeleje, zapravo neki realni broj. Sluajnim dogaajima, kao skupovima elementarnih ishoda, se onda pridruuje odreeni skup realnih brojeva. Tako se, povezivanjem prostora dogaaja sa skupom realnih brojeva, dolazi do novog pojma sluajna veliina (promenljiva, varijabla). Preciznije, u prostoru (, F , p) je neki elementarni dogaaj iz F. Sluajna promenljiva X() je preslikavanje R pri emu je za svaki

podskup S R data verovatnoa da X() S, tj. p(X S) = p(: X() S) je poznata (ili se moe odrediti). Primer 6.1. Pri bacanju numerisane kocke elementarnim ishodima 1, 2, ..., 6 pridruimo redom brojeve 1,2, ... ,6. Ti brojevi se mogu smatrati vrednostima sluajne promenljive X = X(). Ishod i se interpretira kao dogaaj u kome je promenljiva X uzela vrednost i (i = 1,2, ..., 6). Pri tome je p(X = i ) = 1/6. Primer 6.2. Neka je A dogaaj : duina sluajno izabranog predmeta je u granicama od 30 d0 35 cm. Tu se zapravo radi o dogaaju da neka sluajna promenljiva uzme vrednost iz intervala (30, 35) , tj. dogaaju A = { X : 30 X 35} ili, krae A = {30 X 35}. Primeuje se da promenljiva X moe uzeti bilo koju vrednost iz datog intervala, pa postoji, dakle, beskonano, neprebrojivo (kontinuum) moguih vrednosti te promenljive. Oznaimo sa pX(S) verovatnou p(X S) = p(: X() S). Ona se zove zakon raspodele verovatnoa za sluajnu promenljivu X. Sluajna promenljiva je odreena kada je poznat njen zakon raspodele. Na osnovu zakona raspodele se moe precizirati tip sluajne promenljive. Sluajna promenljiva je diskretnog tipa ako i samo ako postoji prebrojiv skup realnih brojeva RX = { x1, x2 , ... } takav da je pX(RX) = p(X RX) = 1 i pri tome su poznate sve verovatnoe p(xi) = p(X =xi) = pi za svako xi RX. Uobiajeno je da se u tom sluaju zakon verovatnoe zapisuje u obliku x1 x2 x3 ... X : ( =1 p(x1) p(x2) p(x3) ... Zakon verovatnoe se moe predstaviti i putem tabele X x1 x2 ...),

p(xi) > 0 , p(xi)i =1

p

p1

p2

...

Sluajna promenljiva je odreena svojim zakonom raspodele verovatnoa pX(S) = p( X S). U sluaju da je S = (- , x) , x R dobija se pX(S) = pX(- , x) = pX(X< x) = F(x). Funkcija F(x) se zove funkcija raspodele verovatnoa (ili raspored) i ona, takoe, u potpunosti odreuje sluajnu promenljivu. Ako su sve realizacije sluajne promenljive u skupu RX = {x1, x2, ...} pri emu je p(xi) = p(X=xi) i = 1,2, ... onda funkcija raspodele ima oblik F(x) = p(xi) xi me > mo. za 3 < 0 , re je o negativno asimetrinoj distribuciji ili levoj distribuciji, pri emu je EX < me < mo. - ako se vrednosti od 3 kreu od -2 d0 +2 , ili se pribliavaju broju 2, odnosno 2 , onda je ta distribucija jako ili izrazito asimetrina. Pored navedenog, postoje i druge mere asimetrije rasporeda. Tako je Pearson uveo sledei koeficijent asimetrinosti, oznaka Sk, : Sk = (EX mo) /

U formuli se pojavljuje razlika izmeu aritmetike sredine i modusa, koja je kod simetrinih rasporeda jednaka nuli. Mera je oznaena sa Sk od skewness nagnutost. Za koeficijent Sk se moe dobiti i sledei izraz: Sk = 3(EX me) / Vrednosti od Sk se kreu od 3 do +3 i to je Sk blii nuli to je asimetrija rasporeda manja, odnosno raspored je simetriniji. Sk je pozitivan kod pozitivno asimetrine distribucije, a negativan kod negativno asimetrine distribucije. Merama spljotenosti (ili zaobljenosti) raspodele opisuje se homogenost, tj. koncentracija vrednosti u odnosu na aritmetiku sredinu. Za koeficijent spljotenosti , oznaka 4 , izabran je odnos centralnog momenta etvrtog reda i etvrtog stepena standardne devijacije, tj. 4 = 4 / 4 Ovaj koeficijent ima samo pozitivne vrednosti jer je re o stepenovanju parnim brojem. Za normalnu Gausovu raspodelu vrednost ovog koeficijenta je 3 i u odnosu na tu raspodelu se odreuje zaobljenost drugih raspodela. -Ako je za neku raspodelu 4 = 3, onda je ta raspodela normalne visine; Ako je > 3 distribucija je izduenog oblika (visoka distribucijavea je koncentracija vrednosti sluajne promenljive oko aritmetike sredine); Ako je < 3 onda je distribucija spljotenog oblika (niska distribucija manja je koncentracija vrednosti obeleja oko aritmetike sredine). Primer 11.1. Odrediti EX, 2, 3 i 4 za sledei raspored :xi X : fi 6 4 8 5 10 3 11 2 12 5 14 1 15 2

Iz sledee radne tabele sledi :

xi 6 8 10 11 12 14 15

fi 4 5 3 2 5 1 2 22

fi xi di = xi EX 24 -4 40 -2 30 0 22 1 60 2 14 4 30 5 220

di2 fi di2 16 64 4 20 0 0 1 2 4 20 16 16 25 50 172

fi di3 -256 -40 0 2 40 64 250 60

fi di4 1024 80 0 2 80 256 1250 2692

EX = x = fi xi / N = 220/22 = 10; 2 = fi (xi EX)2/ N = 172 / 22 = 7,82, = 7,821/2 = 2,80; 3= 21,90 ; 4 = 61,15; 3 = 3 / 3 = ( fi (xi EX)3/ N): 3 =( 60/22) : 21,90 = 0,13 (desna asimetrija) 4 = 4 / 4 = ( fi (xi EX)4/N): 4 = (2692/ 22): 61,15 = 2 (spljoteniji raspored od normalnog). Primer 11.2. Koeficijent asimetrije i koeficijent spljotenosti se odreuje na osnovu sledee intervalne distribucije:Teina u kp 56-60 broj studenata 7 60-64 15 64-68 28 68-72 24 72-76 16 76-80 10

Iz radne tabele (sa xi su oznaene sredine gornjih podintervala) sledi:

xi 58 62 66 70 74 78

fi 7 15 28 24 16 10 100

xi fi 406 930 1848 1680 1184 780 6828

di= xi - EX -10,28 -6,28 -2,28 1,72 5,72 9,72

di2 105,68 39,44 5,20 2,95 32,72 94,47

fi di2 739,76 591,6 145,6 70,8 523,52 944,7 3015,98

fi di3 -7604,73 -3715,25 -331,97 121,77 2994,53 9182,48 643,83

fi di4 78176,62 23331,77 756,89 209,44 17128,71 89253,7 208857,13

EX = xi fi / N = 6828/100 = 68,28i =1

6

2 = fi di2 /N = 3015,98/100 = 30,16 ; = 5,4918; 3= 165,63;i =1

6

= 909,62 3 = fi di3 / N = 646,83 / 100 = 6,47i =1 6

4

pa je

3 = 3 /3 = 6,47 / 165,63 = 0,0391 4 = fi di4 /N = 208857,13 / 100 = 2088,57 pa je 4 = 4 / 4 = 2,296.i =1 6

Primer 11.3. Dobijeno je sledeih 50 podataka o nekom obeleju:69 61 65 70 70 63 66 71 76 83 65 80 73 81 82 68 62 73 78 66 83 88 72 71 67 75 75 80 79 73 76 79 84 69 70 74 72 83 78 78 85 86 82 78 76 74 84 75 77 87

Potrebno je da se formiraju intervali frekvencija, a zatim odrede koeficijenti asimetije i spljotenosti. Vrednosti sluajne promenljive se grupiu u podintervale pri emu se za broj i irinu intervala koristi tzv. pravilo Sturgesa: K = 1 + 3,3 log N - broj intervala; d = (xmax xmin) / K - irina jednog podintervala. K = 1 + 3,3 log 50 = 7 ; d = (88 61) / 7 = 4 Radna tabela ima oblik : (d=4, A = 74 , N= 50, yi = (xi 74) /4 )razmak 60-64 64-68 68-72 72-76 76-80 80-84 84-88 xi 62 66 70 74 78 82 86 fi 3 6 8 12 9 8 4 50 yi -3 -2 -1 0 1 2 3 fi yi -9 -12 -8 0 9 16 12 8 fi yi2 27 24 8 0 9 32 36 136 fi yi3 -81 -48 -8 0 9 64 108 44 fi yi4 243 96 8 0 9 128 324 808

EY = m1 = 8/50 = 0,16 ; m2 = EY2 = 136/50 = 2,72 ; m3 = EY3= 44/50 = 0,88 ; m4 = EY4 = 808/50 = 16,16, a kako je X= 4Y + 74 to je EX = 40,16 +74 = 74,64; 2X = 2(4Y + 74) = 16 2Y = 16(EY2 - (EY)2) = 16(2,72- 0,162) = 162,6944, pa je X= = 6,56. Iz k = E( X EX)k = E( 4Y +74 4EY 74)k = E(4(Y EY))k = 4k E(Y EY)k dobija se 3 = 43E(Y EY)3 = 43 E(Y3- 3Y2 EY + 3 Y(EY)2 - (EY)3) = 43(EY3- 3EY2 EY + 3 EY (EY)2 - (EY)3) =

43(m3 3m1m2 +2m13) = 43(0,88 - 30,162,72 + 20,163) = -26,7; 4 = 44 E(Y EY)4 = 44 E(Y4-4Y3 EY +6Y2(EY)2-4 Y (EY)3+(EY)4)= 44(m4 4m1m3+6m12m2-3m14)= 4099 , pa je 3 = 3/ 3 = (-2,67)/ 6,563 = -0,09 ; 4 = 4 / 4 = 2,2

14. Zadatak statistike Statistika, krai naziv za matematiku statistiku, se obino definie kao skup metoda za kvantitativno istraivanje pojava i to ne na pojedinim ve na mnotvu sluajeva. Predmet njenog istraivanja su skupovi (populacije ili mase sveukupnosti) iji su elementi (tzv. statistike jedinice) meusobno slini i povezani s nekom optom vezom (recimo posedovanje iste osobine-obeleja). Statistika je opta metoda saznavanja koja koristi rezultate teorije verovatnoa. U njoj se masovno i opte saznaje na osnovu posebnog i pojedinanog, dok se kvalitet upoznaje na osnovu kvantiteta. Re statistika se, takoe, esto odnosi i na rezultate kvantitatativnog istraivanja pojava. Statistike jedinice, po pravilu, poseduju, vie razliitih obeleja (karakteristika, svojstava, vrednosti neke sluajne promenljive). Ta obeleja mogu biti numerikog karaktera, ali i opisnog, atributivnog karaktera (pol, zanimanje, boja oiju). Ljudsko iskustvo pokazuje da ako se posmatra mali broj statistikih jedinica onda vrednosti obeleja pokazuju od elementa do elementa znaajna kolebanja. Meutim, ako se broj posmatranih jedinica povea onda se jae manifestuje odreena zakonitost kod kolebanja tog obeleja.

Cilj statistikih istraivanja je da se doe do adekvatnih informacija o karakteristikama posmatrane populacije. Te se karakteristike izraavaju pomou odreenih parametara kao to su sredine (EX, G, H), varijanse, momenti proizvoljnog reda, medijana, modus, koeficijent korelacije itd. Takvi parametri se posmatraju i izraunavaju na odreenim podskupovima populacije koji se tovu uzorci. esto se odreene karakteristike, tj. odgovarajui parametri na uzorku, nazivaju i statistike. Kako se u razliitim uzorcima mogu nalaziti razliiti elementi populacije to se vrednosti jedne iste statistike menjaju od uzorka do uzorka, tj. prisutna je odreena fluktuacija uzorka. Ako se iz iste populacije uzme odreeni broj uzoraka sa po n elemenata (kaemo da se radi o uzorcima obima n ), i za svaki uzorak izrauna vrednost jedne iste statistike, dobija se niz vrednosti te statistike od kojih se moe obrazovati odgovarajui raspored frekvencija. Raspored frekvencija jedne statistike koji bi se dobio kada broj takvih uzoraka od n elemenata neogranieno raste, zove se raspored statistike. Kao i svaki raspored i ovaj raspored moe imati svoje parametre- sredine, varijansu, medijanu i sl. Dakle, na statistiku se moe gledati kao na jednu sluajnu promenljivu. Statistika se moe posmatrati i kao nauka o tzv. induktivnom ponaanju oveka (i ne samo oveka) u situacijama kada je on prinuen da na osnovu nedeterministikog eksperimenta dolazi do reenja na najbri i najekonominiji nain.Najire posmatrano, u statistiku spada sve to je vezano za stvaranje i korienje metoda za prikupljanje i obradu pojedinih podataka u cilju dolaenja do odreenih saznanja odnosno do izvoenja odreenih naunih i praktinih zakljuaka. Konkretnije, osnovni zadaci statistike su: -prikupljanje podataka o nekoj pojavi, obeleju, stavu, ...;

-obrada podataka u cilju dobijanja informacija neophodnih za dobijanje zakljuaka, formulisanje zakonitosti ili proveravanje neke unapred zadate pretpostavke (hipoteze); -predvianje (predikcija) i donoenje odluka.

Primer 12.1 . Za mnoge proizvode je bitno obeleje vek trajanja (npr sijalice) koji je nemogue tano unapred odrediti. Iskustvo pokazuje da ako se proizvodni proces ne menja onda se ta trajanja X1, X2, ... mogu posmatrati kao nezavisne i jednako rasporeene sluajne promenljive. Parametar vezan za vek trajanja prirodno je povezati sa EXi , i = 1,2,... Jedan od osnovnih zadataka u statistici je da se odredi parametar . U tom cilju se uzima n gotovih proizvoda i na njima se vri provera datog svojstva registruje se vek trajanja konkretne sijalice. Neka su sa x1, x2 , ... , xn oznaena vremena trajanja posmatranih n proizvoda. Prirodno je oekivati da broj x =1 x n ii =1 n

pri dovoljno velikom n bude blizu , tj. da se se moe zameniti sa x , a da se pri tome ne napravi velika pogreka. Svakako da je od interesa da n bude to manje (npr. da se to manje sijalica rtvuje), kao i da je tzv. ocena parametra to pouzdanija. Primer 12.2. Neka se neki eksperiment prvo n puta izvodi u uslovima A, a zatim m puta u uslovima B. Postavlja se pitanje uticaja uslova eksperimenta na rezultate eksperimenta. Tako, recimo, ako se posmatra uticaj nekog preparata na rast biljaka onda se izvode dve serije eksperimenata (sa preparatom i bez njega) i vri

poreenje dobijenih rezultata. Analogno je i kod raznih pedagokih istraivanja (kontrolna i eksperimentalna grupa). 15. Uzorak Generalni skup (populaciju) oznaimo sa , a njegove elemente sa . Za ma koji se uoava posmatrano obeleje X(). X = X() je sluajna veliina koja je, kao to znamo, potpuno odreena svojom funkcijom raspodele F(x) , koju emo u daljem zvati teorijska funkcija rasspodele populacije. Ukoliko bi populacija bila sa manje elemenata i za svaki od njih se utvrdila vrednost obeleja X onda bi i funkcija F(x) bila potpuno odreena. U praksi obino nije tako, ve se registrovanje zadatog svojstava vri nad nekim pravim podskupom iz populacije, na uzorku. Uzorci se dele u dve osnovne grupe u zavisnosti od toga da li svi elementi populacije imaju jednaku verovatnou da uu u uzorak tada se radi o prostom sluajnom uzorku ili se radi o uzorcima gde svaki elemenat populacije ima odreenu, ali ne uvek i podjednaku verovatnou, da bude izabran za uzorak- tada je re o kontrolisanim uzorcima. Najei kontrolisani uzorci su: - stratifikovani uzorak. Ako se uzorak izabere iz populacije gde su prisutne velike varijacije kod obeleja onda e se kod evidentiranog svojstva pojaviti velike razlike u odnosu na svojstvo kod cele populacije. Te se razlike mogu smanjiti poveavanjem obima uzorka, ali i tako to bi se heterogeni skup podelio na vie

homogenijih podskupova-stratuma pa se onda uzorci birali iz stratuma. Na takvim uzorcima bi se registrovala vrednost obeleja, odnosno vrednost nekog parametra (statistike) obeleja, a onda bi se, uz odgovarajue ponderisanje, izraunavala vrednost tog parametra za celu populaciju. Na taj nain se dolazi do informacija ne samo o karakteristikama cele populacije, ve podskupova te populacije. -viefazni uzorak. Ako je re o istraivanju gde je nemogue ili vrlo skupo (ili skopano sa rizicima) neposredno ispitivanje ak i na uzorku tada se u prvoj fazi izvre sva ona ispitivanja koja su mogua, dok se u drugoj fazi izvri u odreenoj grupaciji specifino ispitivanje koje se nije primenilo na ceo uzorak. -viestepeni uzorak. Ova se uzorak koristi kada je u pitanju velika teritorija, pa je otean direktan izbor elemenata za uzorak. Tada se u prvom stepenu odabiraju elementi iz kojih e se vriti odabir elemenata drugog reda i tako redom. sistematski uzorak. Radi se o varijanti viestepenog uzorka pri emu se odabiranje elemenata vri po odreenom algoritmu. Obino se prvo odredi korak izbora K = N/n (N broj jedinica cele populacije, n obim uzorka). Prvo se odredi prvi element uzorka a (a K) . Ostali elementi uzorka su onda a+K, a+2K, a+3K , ... Pokazuje se da se na osnovu registrovanih vrednosti u prostom sluajnom uzorku , pri dovoljno velikom n moe , sa dosta velikom tanou,ustanoviti nepoznata funkcija raspodele odgovarajue sluajne promenljive obeleja

populacije. Da bi se to postiglo mora se obezbediti reprezentativnost uzorka, tako da saznanje izvueno iz njega bude to tanije za celu populaciju. Reprezentativnost se postie ako je izbor elemenata u uzorak sluajan i nezavisan od obeleja koje se posmatra. Sluajni izbor se najbolje postie ako se koriste tablice sluajnih brojeva koje su sastavljene tako da parni i neparni brojevi imaju ansu od 50% da uu u uzorak, a brojevi od 0 do 9 verovatnou od 10%. Za korienje tablica mora se utvrditi obim populacije (N), izvriti njeno numerisanje i utvrditi obim uzorka (n).Za n 30 govori se o malom uzorku, a u protivnom o velikom uzorku. Tako, recimo, ako je N = 3300 uenika, a treba izabrati uzorak od n = 85 uenika prvo se u tablicama sluajnih brojeva bira poetni broj (naravno ne vei od 3300) a zatim se vri odabiranje etvorocifrenih brojeva (jer je N etvorocifreni broj) sve dok se ne popuni broj od 85 uenika. Pri odabiranju brojeva moe se ii horizontalno, vertikalno ili dijagonalno po tablicama - bitno je da se po izabranom postupku izbor sprovede do kraja. Pomou spiska utvrdie se onda o kojim se uenicima radi. Ako su elementi uzorka obima n izabrani sluajno onda imamo n nezavisnih ishoda 1, 2, ... , n, kojim u odnosu na posmatrano obeleje odgovara n- dimenzionalna sluajna veliina (X1, X2, ... , Xn) gde je Xk = X(k) ; k = 1,2,..., n koja se zove sluajni uzorak. U konkretnom sluaju konkretnom utvrivanju svojstva dobija se registrovana vrednost uzorka (x1 , x2 , ... , xn) ili, to je isto, realizovana vrednost date n dimenzionalne sluajne veliine.

Sluajni uzorak je prost ako su sve sluajne veliine X1, X2, ..., Xn meusobno nezavisne i sve imaju istu funkciju raspodele kao i obeleje populacije X. To znai da se kod uzorka radi o registrovanju n nezavisnih vrednosti obeleja X. U daljem e se uvek pretpostavljati da se radi o prostom sluajnom uzorku. Primer 13.1. Poznato je da je zakon verovatnoe (gustina) obeleja populacije f(x) = (x+1) za -1 < x < 1 i f(x) = 0 u ostalim sluajevima. Iz populacije je uzet uzorak obima 5. Potrebno je odrediti verovatnou da su tano tri izvuena elementa iz uzorka pozitivna. Za ma koji elemenat Xi iz sluajnog uzorka (X1, X2, X3, X4, X5) je p(Xi > 0 ) = f(x) dx = 1/2 (x+1) dx = 0,75,1 0

1

0

pa je p(Xi 0) = 1 0,75= 0,25; i = 1,2,3,4,5. Uzorak oblika (X1 0, X2 0 , X3> 0, X4>0, X5 > 0) ispunjava uslove zadatka a verovatnoa njegovog izbora je p(X1 0 ) p(X2 0) p(X3> 0) p(X4> 0) p (X5> 0) = 0,252 0,752 . Kako takvih uzoraka ima koliko i kombinacija bez ponavljanja druge klase od 5 elemenata to je traena verovatnoa p = 5!/2! 0,252 0,752 = 135/512. 16. Centralna teorema statistike Na osnovu uzorka (X1, X2, ... , Xn) definie se empirijska funkcija raspodele Fn*(x) na sledei nain: Fn (x) = 1/n I (Xk< x) gde je funkcija indikator dogaaja A, oznaka I(A)*k =1 n

definisana sa I(A) = 1 , ako se dogaaj A ostvario, 0, ako se dogaaj A nije ostvario. Za zadati realni broj x dogaaja Fn*(x) pokazuje relativnu uestalost

A = (Xk< x). Oigledno je da se ova funkcija za registrovani uzorak poklapa sa funkcijom raspodele kod diskretne uniformno raspodeljene sluajne promenljive. Sledei iskaz je od odluujueg znaaja za zakljuivanja koja se izvode u statistici i poznat je pod imenom centralna teorema statistike (GlivenkoKanteli): Ako je F(x) teorijska funkcija raspodele obeleja populacije i Fn*(x) empirijska funkcija raspodele koja odgovara prostom uzorku (X1, X2, ..., Xn) onda p( sup| F(x) - Fn*(x)|0, kada n ) = 1 za svako x R. To znai da sve realizacije funkcije Fn*(x), izuzev moda onih koje odgovaraju dogaaju ija je verovatnoa 0, konvergiraju ka odgovarajuim vrednostima teorijske funkcije raspodele, i to za svaki realni broj x. Time se opravdava zakljuivanje sa uzorka na populaciju tj. da su zakljuci dobijeni sa dovoljno dobrog uzorka tani , sa verovatnoom koja je bliska 1, i za celu populaciju. Drugim reima, ako je obim uzorka dovoljno veliki (n ) verovatnoa razlikovanja empirijske i teorijske funkcije raspodele je veoma mala. Na osnovu poznavanja empirijske funkcije raspodele mogu se izraunati razliiti uzoraki parametri kao to su obini i centralni momenti, medijana i sl. Jedna od posledica centralne teorme statistike je da obini i centralni uzoraki momenti konvergiraju ka odgovarajuim momentima sluajne promenljive X obeleja cele populacije (kada se obim uzorka poveava). Iz tog razloga se u

praksi umesto nepoznatih parametara obeleja populacije koriste izraunate vrednosti odgovarajuih uzorakih parametara iz realizovanog uzorka. Uobiajeno je da se sa x = xn i s2= sn2 oznaavaju redom izraunata uzoraka aritmetika sredina i uzoraka disperzija (varijansa). 17. Takaste ocene parametara Ponekad su o nepoznatoj funkciji raspodele obeleja populacije dostupne neke informacije. Tako je, recimo, poznato da se radi o raspodeli odreene vrste (normalnoj, binomnoj, uniformnoj,...). Pri tome je nepoznat odreeni parametar u takvoj raspodeli, ili se, eventualno, moe ukazati na interval u kome bi se on mogao nalaziti. Kae se da je u takvim sluajevima nepoznata raspodela smetena u skup dopustivih raspodela koje zavise od nekog nepoznatog parametra, odnosno X : {F(x,) , } gde je sa oznaen skup u kome se moe nalaziti nepoznati parametar u raspodeli oznaen sa . Tako, recimo, oznaka X: { N (m,) - < m < , > 0 } ukazuje na to da je re o normalno rasporeenom obeleju sa dva nepoznata parametra od kojih je drugi pozitivan. Jedan od zadataka u statistici je da se na osnovu sluajnog uzorka uzetog iz populacije ije obeleje ima funkciju raspodele F(x,) na neki nain odredi vrednost parametra a time i konani analitiki oblik te funkcije raspodele. Radi se o oceni (estimaciji) nepoznatog parametra, tj. o dobijanju njegove vrednosti, odnosno o tzv. takastoj oceni parametra raspodele. U tom cilju se na osnovu registrovanih vrednosti u uzorku izraunava neka prikladna vrednost (statistika), obino oznaena

sa , koja se moe proglasiti za ocenu nepoznatog parametra . Da bi takva ocena bila dovoljno dobra uvode se zahtevi kao to su: Nepristrasnost ocene. Dobijena ocena od paramerta je nepristrasna (centrirana) ako je E() = . Napomenimo da se izraunava na osnovu sluajnog uzorka pa je re o sluajnoj veliini koja moe imati svoje matematiko oekivanje. Korektnost ocene. Ocena je korektna (asimptotski centrirana) ako E() kada n , tj. obim uzorka neogranieno raste. Konzistentnost ocene. Ocena je konzistentna ukoliko E(- )20 , kada n . Drugim reima radi se o najmanjoj moguoj disperziji te ocene u odnosu na dati raspored. Primer 14.1. Moe se pokazati da je oekivana vrednost uzorake aritmetike sredine jednaka matematikom oekivanju obeleja populacije, to znai da je aritmetika sredina registrovanih vrednosti u uzorku nepristrasna ocena za matematiko oekivanje kod populacije. Isto tako, moe se dobiti da je E(sn2) = (n-1)2/n gde 2 predstavlja varijansu obeleja populacije. To znai da uzoraka varijansa nije nepristrasna ocena varijanse populacije. Meutim, kako (n-1)2/n 2 kada n to uzoraka disperzija jeste korektna ocena disperzije populacije. Primetimo da bi veliina n sn2/(n-1) mogla biti nepristrasna ocena disperzije. Metod maksimalne verodostojnosti je esto koriena metoda za dobijanje korektnih takastih ocena nepoznatog parametra u funkciji raspodele obeleja za celu populaciju.

Neka su {p(xk, ) } k= 1,2,..., n ; ili {f(x,) } familije dopustivih raspodela obeleja populacije X u zavisnosti od toga da li je obeleje X sluajna promenljiva diskretnog ili neprekidnog tipa (f(x,) je gustina raspodele sa nepoznatim parametrom ). Broj za koji tzv. funkcija verodostojnosti L(, x1, x2 , ... , xn) = L() dostie maksimum je korektna ocena napoznatog paramerta . Funkcija verodostojnosti za dati sluajni uzorak (X1 , X2 , ... , Xn) ima oblik: L() = p(X1,) p(X2, ) ... p(Xn, ) u diskretnom sluaju, odnosno L() = f(X1,) f(X2, ) ... f (Xn, ) u neprekidnom sluaju. Ako se posmatra realizovani uzorak onda je L() = L(, x1, x2, ..., xn) funkcija od jedne promenljive pa se diferenciranjem po toj promenljivoj moe zapoeti sa traenjem mogueg maksimuma po toj promenljivoj. Napomenimo da je ponekad pogodnije da se prvo funkcija L() logaritmuje pa onda diferencira (naravno, uz uslov da diferenciranje ima smisla). Primer 14.1. Poznato je da obeleje X populacije ima gustinu raspodele: X : xi pi -2 /5 0 /5 7 1-2/5 0 < < 5/2

Potrebno je da se na osnovu realizovanih vrednosti u uzorku obima 4 (0, -2, 7, -2 ) odredi ocena maksimalne verodostojnosti za nepoznati parametar . Kako je L() = p(X1,) p(X2, ) p(X3,) p(X4,) = p(X1= 0) p(X2= -2) p(X3= 7) p(X4=-2) = /5 /5 (1-2/5)/5 = (/5)3(1-2/5), to iz L() = 32/125 - 83/625 = 0 sledi = 15/8. Primer 14.2.Obeleje populacije ima gustinu sa nepoznatim parametrom :

f(x, ) = ( 1) x- za x 1 i f(x,) = 0 u ostalim sluajevima. Na osnovu uzorka obima n , odnosno realizacija (x1,x2, ... , xn) dobija se: L() = (-1) x1- (-1) x2- ... (-1) xn- = (-1)n (x1 x2 ... xn)- lnL() = n ln(-1) (lnx1+ lnx2 + ... + lnxn), pa iz (lnL()) = n/(-1) (lnx1+ lnx2 + ... + lnxn) = 0 sledi = 1 + n/(lnx1+ lnx2 + ... + lnxn)

18. Intervalno ocenjivanje Ocena nepozmatog parametra u raspodeli obeleja populacije se moe vriti i tako da se na osnovu sluajnog uzorka odredi interval u kome se nalazi taj parametar. Na osnovu realizovane vrednosti uzorka (X1, X2, ... , Xn) odreuju se dva broja u1 i u2 ( u1 < u2) tako da se sa unapred zadatom verovatnoom 1 ( tzv. koeficijent pouzdanosti ili nivo poverenja) moe tvrditi da se nepoznati parametar nalazi u intervalu ( u1, u2) = I( X1 , X2 , ... , Xn)= I . Znai: p ( I ) = p(u1 u2) = p( I(X1 , X2 , ... , Xn) = 1 . Interval I = I(X1 , X2 , ... , Xn) je sluajna promenljiva koja se menja od uzorka do uzorka. Neki od tih intervala e sadrati parametar , a neki ne. Ipak, u duoj seriji uzoraka relativna frekvencija sluajeva kada e dobijeni interval sadrati je priblino 1 . Ako je, recimo, u pitanju 95% nivo poverenja, tj. 1 = 0,95 ( = 0,05) onda se moe oekivati da e 95% uzoraka generisati intervale koji e sadrati , (koji e pokrivati ).

Na ovaj nain se dolazi do intervala u kome sa zadatom (obino visokom preko 90%) verovatnoom treba traiti pravu , ali nepoznatu vrednost parametra . Prirodno je da se eli da je dobijeni intervala I = (u1 , u2) to ui, a da je nivo poverenja to vii, ali su ova dva zahteva, u optem sluaju, suprotna. U sledeim primerima razmotriemo odreivanje intervalne ocene parametara u pojedinim sluajevima. A. Pretpostavimo da je poznato da obeleje populacije ima normalni raspored sa parametrima m i , pri emu je poznato. Potrebno je da se odredi interval poverenja za nepoznato matematiko oekivanje m (srednja vrednost) sa nivoom poverenja 1 . Za ocenu nepoznatog parametra m (aritmetika sredina) koristi se odgovarajua vrednost tog parametra u uzorku. Moe se pokazati da ako je obeleje rasporeeno normalno, onda sluajna veliina koja za svoje vrednosti ima uzorake sredine, oznaka Xn takoe ima normalni raspored sa izmenjenom disperzijom (odnosno standardnom devijacijom). Naime, vai: Ako je X : N ( m , ) onda je Xn : N (m, / n1/2). (Pokuajte da sami napiete zakon verovatnoe za sluajnu veliinu Xn ). Kako je za sluajnu veliinu X: p(m t 2 sloena. Obino se testira jedna prosta hipoteza H0 koja se naziva u nulta hipoteza.

Suprotna hipoteza H1 nultoj hipotezi se zove obino alternativna hipoteza i ona moe biti i prosta i sloena. Prilikom verifikacije hipoteze mogue je napraviti dve vrste greaka : -greke prve vrste koje se sastoje u tome da se odbaci H0 ako je ona faktiki tana (opovrgavanje tane hipoteze), i -greke druge vrste da se prihvati hipoteza H0 i ako ona nije tana (potvrivanje netane hipoteze). Jasno je da do pravilnog reenja u postupku sprovoenja statistikog testa dolazi u dva sluaja: -hipoteza se prihvata pri emu je ona stvarno i pravilno postavljena (istinita), i -hipoteza se odbacuje , a ona je istovremeno i nepravilna. Ako se hipoteza odnosi na parametre raspodele onda se odgovarajui test za njenu proveru naziva parametarski, dok su ostali testovi neparametarski. Postupak za proveru kod parametarskih testova emo opisati na primeru provere hipoteze H0 : = 0 protiv hipoteze H1: 0 . Na osnovu uzorka (X1 , X2, ... , Xn) se bira statistika n = f (X1, X2, ... , Xn) kojom ce ocenjuje nepoznati parametar . Kada je re o konkretnom uzorku onda statistika n postaje odreeni broj vn ( vn= f(x1,x2,...,xn)) pa je od interesa da se posmatra odstupanje | vn n| i postavi pitanje da li je to odstupanje bitno ili ne za prihvatanje hipoteze H0. U tom cilju treba odrediti broj vn, takav da verovatnoa da se pojavi odstupanje ne manje od vn, iznosi , ukoliko je hipoteza H0 tana tj. p( |n | vn, ) = Broj se naziva prag (nivo) znaajnosti, on je unapred zadat i obino je mali broj, najee = 5 % ili = 1 %.

Ako izraunato odstupanje na osnovu uzorka nije manje od vn, hipotezu H0 odbacujemo, dok u sluaju da je dobijeno odstupanje koje je manje od vn, hipotezu H0 nema razloga da odbacimo ( kaemo i : rezultati testiranja ne protivuree hipotezi H0). Pogledacemo neke sluajeve testiranja hipoteza. A. Obeleje X je N(m, ) i poznato je . Testira se hipoteza H0 : m = m0 protiv hipoteze H1 : m m0. Iz datog uzorka (x1,x2,...,xn) izraunava se uzoraka sredina xn i onda nae vrednost izraza C = 1 - 2(| xn- m0|/ ( n-1/2)) = p(|Xn- m0||xn m0| ) koja se poredi sa zadatim pragom znaajnosti . U sluaju da je C hipotezu H0 treba odbaciti, a ako je C > zakljuuje se da uzorak ne protivurei hipotezi. Primer 16.2. Iz uzorka od 50 vekni hleba naena je srednja vrednost teine koja iznosi 596 grama. Ako je standardno odstupanje = 20 grama sa pragom znaajnosti = 5 % = 0,05 testirati hipotezu H0 : m = 600 grama protiv alternativne hipoteze H1 : m 600 grama. Kako je C = 1 - 2(| 596 - 600|/ (2050-1/2) = 1 - 2(1,41) = 0,16 > 0,05 nema razloga da se odbaci hipoteza H0 odnosno odstupanje od 4 grama se moe smatrati sluajnim. B. Neka je obeleje X : N(m, ) pi emu nije poznato. Testira se ponovo hipoteza H0: m = m0 protiv H1 : m m0. Iz zadatog uzorka (x1,x2,...,xn) se izraunavaju uzoraka sredina xn i uzoraka standardna devijacija sn a zatim vrednost veliine C = |xn m0|(n 1 )1/2 / sn

Iz tablice Student-ove raspodele se itaju tzv. kritine vrednosti tn-1, ( je zadati prag znaajnosti). Ako je C tn-1, hipotezu H0 odbacujemo, a ako je C < tn-1, zakljuujemo da uzorak ne protivurei hipotezi. Primer 16.3. Obrano je 17 stabala vianja i naen je prosean rod po stablu x17 = 20,2 kg uz standardno odstupanje s17 = 0,64 kg. Da li je pretpostavka o prosenom prinosu po stablu od m = 20 kg tana ili ne, uz prag znaajnosti od 5 % = 0,05. Kako je C = |20,2 - 20|(17 1)1/2 / 0,64 = 1,25, a t16, 0,05 = 2,12 > 1,25 zakljuuje se uzorak ne protivurei postavljenoj hipotezi. C. Testira se hipoteza H0 : m1 = m2 kod dva normalno rasporeena obeleja. U tom cilju se iz uzetih uzoraka izraunavaju sredine i standardne devijacije tj. xn1 , yn2, sn1 i sn2 , a zatim se izrauna vrednost od C = (| xn1 yn2| (n1n2(n1+n2- 2)/(n1+ n2))1/2 / (n1 (sn1 )2+ n2 ( sn2)2)1/2 ) Iz tablica za raspodelu Student-a se ita broj tn1 +n2 2 , pa ako je C tn1 + n2 2 , hipotezu H0 se odbacuje, dok se u ostalim sluajevima prihvata. Primer 16.4. Na prijemnom ispitu iz matematike je: 80 uenika prve kole osvojilo proseno po 14,2 poena uz standardno odstupanje od 3,1 poena; 100 uenika iz druge kole postiglo proseno 13,8 poena uz standardno odstupanje od 3,1 poen. Moe li se smatrati da je na obe populacije normalna raspodela sa istim matematikim oekivanjem i disperzijom, uz prag znaajnosti od 1%. Kako je C = (|13,8 14,2|(80100(80 + 100 2)/(80 + 100))1/2/ (803,12 +1003,42)1/2 odnosno C = 1,467 a zbog n1 + n2 2 = 178 ne vredi koristiti raspodelu studenta ve normalnu raspodelu odnosno broj t , 0,01 = 2,576. Kako je C < 2,576 to se moe smatrati da je hipoteza tana razlike u raspodelama nisu

znaajne. D. Testiranje hipoteze o disperziji H0 : 2> 20 kod normalne raspodele. Iz uzorka se rauna uzoraka disperzia sn2, a zatim veliina C = n sn2/20 pa se iz tablice za 2 raspodelu nalazi broj 2n-1, i za C 2n-1, se H0 odbacuje , a u protivnom se H0 prihvata. Primer 16.5. Maina pakuje mleko u vreice od 1 l , sa disperzijom od 20 = 0,001 l. Posle nekog vremena radnik je izvrio proveru jedne gajbe mleka od 20 komada i konstatovao da je disperzija s202= 0,0013 l. Ispitati da li je proces normalan ili se maina ratelovala , uz prag znaajnosti od 5 %. Zbog C = 200,0013/ 0,001 = 26 < 30,144 = 219, 0,05 zakljuuje se da je proces normalan (ali kako je broj C blizu granine vrednosti treba biti oprezan). E. Testiranje hipoteze o koeficijentu korelacije H0 : XY = 0 protiv alternativne hipoteze H1 : XY 0. Iz uzorka (x1,y1) , (x2,y2) , ... , (xn,yn) se izraunava uzoraki koeficijent korelacije rXY 0 pa zatim veliina C = |rXY | (n 2)1/2 / (1 rXY 2)1/2. Iz tablica za raspodelu Studenta se nalazi vrednost tn-2 , i u sluaju C tn-2, odbacuje se H0. Primer 16.6. Na sistematskom pregledu 29 uenika konstatovano je da kada se posmatraju visina i teina je rXY = 0,64. Testirati hipotezu da ne postoji linearna veza protiv hipoteze da ta veza postoji. C = 0,64 (29 2)1/2 /(1- 0,4096)1/2 = 4,33 > 2,771= t27, 0,01 pa se odbacuje hipoteza.

20. T test Procena vrednosti nekog parametra (recimo aritmetike sredine) je tanija ukoliko je uzorak vei i ukoliko je obeleje koje posmatramo manje varijabilno. Kako se na varijabilitet ne moe delovati, jedino je mogue poveanjem uzorka smanjiti greku procene koja se vezuje uz nae merenje. Pri tome je poznato da greka u merenju opada srazmerno kvadratnom korenu broja elemenata uzetih u uzorak. Tako je, recimo, standardna greka aritmetike sredine, oznaka SE, data sa SE = / n1/2 = standardna devijacija obeleja populacije / n1/2 Kako je, po pravilu, nepoznato, to se ona zamenjuje sa standardnom devijacijom sn iz uzorka (SD uzorka = sn ) tako da se dobija procena standardne greke aritmetike sredine SE = sn / n1/2 = standardna devijacija uzorka / n1/2 = SD uzorka/ n1/2 saglasno, tzv. pravilu sigmi mogue je uz pomo standardne greke oceniti interval u kome se kree aritmetika sredina populacije koju ne znamo. Uz verovatnou od 68,3 % prava sredina je u untervalu xn SE , uz verovatnou od 95,5 % je prava sredina u intervalu xn 2 SE, dok je uz verovatnou 99,7 % prava sredina u intervalu xn 3 SE, tj. p( xn 3 SE 50). Isto tako, podskupove Sk treba odabrati tako da je r to vee, ali i da je mk > 5 za k = 1,2,...,r. Primer 18.1. Na alteru banke je registrovan broj ljudi u jednakim vremenskim raznacima koji je dat tabelom: broj ljudi xi 0 1 2 3 4 broj intervala ni 80 76 36 15 5 2 Koristei test sa nivoom znaajnosti = 0,05 ispitati da li je ova raspodela Puasonova. ( Pusaonova raspodela P() je diskretna raspodela za koju je p(X = k) = e- k/k! , k = 0,1,2,... pri emu je EX = x = i 2X = .) Kako je za Puasonovu raspodelu parametar jednak matematikom oekivanju (aritmetikoj sredini) to je : = (080 + 176 + 236 +315 + 45)/(80+76+36+15+5) 1.

Iz tablica za Puasonovu raspodelu nalazimo teorijske verovatnoe sa pretpostavkom da je hipoteza tana i to: p1= 0,367879 p2= 0,367879 p3 = 0,183940 p4 = 0,061313 p5 = 0,018989 Izraunavaju se proizvodi npi (oekivani brojevi ljudi na alteru): np1= 212 0,367879 = 77,99 78 np2 = 212 0,367879 78 np3 = 212 0,183940 39 np4 = 212 0,061313 13 np5 = 212 0,018989 4 C = (80 78)2/78 + (76 78)2/78 + (36 39)2/39 + (15-13)2/13 + (5-4)2/4 = =0,891< 7,815 = 25-1-1, 0,05 pa se hipoteza da je raspodela Puasonova prihvata. (Broj stepeni slobode se umanjuje za 1 jer se izraunava jedan nepoznati parametar raspodele ). Primer 18.2. Uspeh studenata se poentira sa 0 do 100 poena i oni se dele u 5 grupa: A : 90 100; B: 80-89 ; C : 70-79 ; D : 60 69 i E : 0-59. Pretpostavlja se da je re o normalnom rasporedu sa parametrima m = 75 i = 10. U posmatranom ocenjivanju 200 studenata je konstatovano sledee: A : 20 ; B : 60;C : 75 ; D : 35 i E : 10. Testirati hipotezu H0 : X : N(75, 10) uz nivo znaajnosti = 1 %. Kako je r = 5, m1= 20; m2 = 60; m3 = 75; m4 = 35 i m5 = 10, a zatim p1 = p(90 X 100) = p((90-75)/10 (X 75)/10 (100 75)/10) = (2,5) (1,5) = 0,07; p2 = p( 80 X 89) = 0,24 ; p3 = 0,38 ; p4 = 0,24 i p5= 0,07 dobija se:

C = (mk npk)2/ npk = 10,25 < 13,28 = 24; 0,01.k =1

5

Nema razloga za odbacivanje hipoteze.

22. Regresije Fransis Galton je 1855. godine analizirao zavisnost izmeu visine oeva i sinova i pri tome zakljuio da sinovi ekstremno visokih oeva nisu toliko visoki, ve da regresiraju. Tada je i uvedena re regresija. est je sluaj da se na osnovu vrednosti (ili ponaanja) jedne sluajne promenljive zakljuuje neto o drugoj sluajnoj promenljivoj (ili o vie njih). U prirodnim naukama se posmatraju deterministiki zakoni oblika y = f(x) u kojima se uvek pretpostavljaju idealni uslovi (npr. vakuum, konstantnost temperature i sl.). Meutim, ukoliko se veliine X i Y posmatraju u realnim uslovima , uvek postoji deo zavisnosti izmeu njih koji se ne moe opisati deterministikim zakonom. Ako bi postojala jednoznana funkcionalna zavisnost izmeu dve sluajne promenljive X i Y onda bi svakoj vrednosti za X odgovarala neka vrednost od Y i tada bi govorili o funkciji sluajne veliine ( o emu je ve bilo rei). Ako bi bio poznat zakon raspodele sistema (X , Y) , odnosno odgovarajue dvodimenzionalne promenljive onda bi se mogle odreivati uslovne verovatnoe u diskretnom, odnosno uslovne gustine u neprekidnom sluaju, tj. p(Y = yj / X = xi) = pX = xi(Y = yj) = p(xi, yj)/ p(xi) = pij / pi. =p(yj/xi) i f(y / x) = fx (y) = f(x,y) / f1(x), odnosno f(x / y) = fy(x) = f(x,y) /f2(y) Ako je zavisnost meu sluajnim veliinama samo delimina, tj. neke vrednosti sluajne promenljive Y zavise od nekih vrednosti sluajne promenljive X,a druge ne (sa obe strane) moe se govoriti samo o oekivanoj vezi meu X i Y. Radi se o tzv. uslovnom matematikom oekivanju y(x) = E( Y / X = x) = R(X)

koje u diskretnom sluaju ima oblik R(X) = y(x) = yj p(yj/xi) dok je za neprekidni sluajj

R(X) = y(x) = y f(y/x) dy

Oigledno je da funkcija R(X) ima smisla samo za one vrednosti od X = x za koje je p(x) > 0 , odnosno f1(x) > 0. Funkcija y = R(X) se zove regresija Y na X , a njen grafik je regresiona kriva. Da bi se dolo do oblika regresione zavisnosti, tj. do R(X), konstruiu se razliite aproksimativne krive kao to su: polinomi razliitog stepena y = a0 +a1x , y = a0+a1x+a2x2, ..., hiperbole y = 1/(a0+a1x) , eksponencijalne krive y = abx, geometrijske krive y = axb, modifikovane eksponencijalne krive y = abx+c, logistike krive y = 1/( abx+c), itd. Najboljom aproksimativnom krivom se smatra ona kod koje je greka odstupanja najmanja. Moe se pokazati da za ma koju krivu y = g(X) greka aproksimacije E(Y g(X))2 najmanja ako se za g(X) izabere upravo R(X). Na tome ze zasniva tzv. metoda najmanjih kvadrata putem koje se dolazi do konkretnog analitikog izraza za neku regrecionu krivu. Razmotrimo, u svojstvu primera, sluaj linearne regresije kada se trai da aproksimativna kriva bude linearna, tj. oblika Y = X + . Parametri i e se odrediti iz uslova da izraz G( , ) = E(Y ( X + ))2 ima najmanju vrednost. Potrebno je da se odredi minimum funkcije od dve promenljive. Korienjem osobina matematikog oekivanja i uslova G = 0 i G = 0 dobija se sistem tzv. normalnih jednaina u obliku: EX2 + EX = E(XY) i EX + = EY

iz koga se, reavanjem po nepoznatim i i zamenom dobijenih vrednosti u izraz y = x + dobija oblik linearne regresije Y na X : y = XY X/ Y (x EX) + EY ili (y EY)/Y = (x EX) / X gde su EX, EY, X, Y , = XY - parametri koje smo ve upoznali ranije i koji se esto mogu izraunati i bez poznavanja zakona raspodele dvodimenzionalne sluajne promenljive (X,Y). Primer 19.1.Na osnovu datih podataka o uticaju investicija na poveanje dohotka firme odrediti jednainu regresione prave Y na X.

investicije (milioni din.) poveanje dohotka Na osnovu sledee radne tabele: X 15 20 30 40 60

15 6

20 8

30 10

40 12

60 15

Y 90 160 300 480 900 51

XY

X2

Y2

6 8 10 12 15 165n

225 36 400 64 900 100 1600 144 3600 225 1930 6725 569

EX = 1/n xi = 165/5 = 33 ; EY = 51/5 = 10,2 sXY = 1/n xiyi EX EY = 1930/5 - 3310,2 = 49,4 sx2 = 1/n xi2 (EX)2 = 6725/5 332 ) = 256 ; sx = 16i =1

sy2 = 569/5 10,22 = 9,8, sy = 3,13 = XY = sXY / sx sy = 49,4 /(163,13) = 0,987 Vidi se da je koeficijent korelacije veoma blizak broju 1, tj. da postoji jaka linearna zavisnost. Unoenjem naenih vrednosti u ranije datu formulu dobija se oblik regresije y = 0,19 x + 3,97. Primer 19.2. Sistem (X, Y) je zadat tabelom

Y X 1 2 3 4

0 1 1

2 2 1 2

3 2 1 1

4

5

1 1

1

Potrebno je da se odredi regresija Y na X. Iz sledee radne tabele dobija se: yi xi 1 2 3 4 fi 0 1 1 2 2 1 2 5 3 2 1 1 4 4 5 fi 3 4 4 3 14 fi xi fi xi2 fij yj 3 8 12 12 35 3 16 36 48 103 4 8 11 12 xi fij yj 4 16 33 48 101

1 1

1

2

2 1

fj yj fj yj2 fijxi yj fij xi

0 10 12 8 5 35 0 20 36 32 25 113 3 10 11 7 4 35 0 20 33 28 20 101

EX = x = 1/n fi xi = 35/14 = 2,5; EY = y = 1/n fj yj = 35/14 = 2,5; s2x = 1/n fi xi2 (EX)2 = 103/14 2,52 = 1,11, sx = 1,05 ; sy = 1,35 sxy = 1/n fij xi yj EX EY )= = 1/n (xi fij yj ) EX EY = 1/n (yj fij xi ) EX EY = = 101/14 2,5 2,5 = 0,96 = xy = sxy /sx sy = 0,686 ; y = 0,87 x + 0,33 23. Trendovi Pod pojmom trend podrazumeva se oekivani razvoj (kae se i razvojna tendencija) neke pojave u u odreenom buduem periodu, a na osnovu posmatranja te pojave u nekom dosadanjem (dovoljno dugom) periodu vremena. Na osnovu podataka o kretanju pojave u dosadanjem periodu (serije podataka iz odreenih prethodnih vremenskih uzastopnih perioda) bira se matematika funkcija koja na najbolji nain prati te podatke ( koja najvie odgovara tim podacima) pa se onda ta funkcija produava u budunost. Naime, pretpostavlja se da e se ta pojava, bar u neposrednoj budunosti, i dalje razvijati na nain koji je iskorien za dobijanje pomenute matematike funkcije. Najee birane funkcije pomou kojih se vri izraavanje trenda su : -linearna funkcija y = a + bx i trend izraen ovom funkcijom je linearni; -kvadratna funkcija y = a +bx + cx2 i onda je re o parabolikom trendu; -eksponencijalna funkcija y = abx , radi se o eksponencijalnom trendu;

-pomerena eksponencijalna funkcija y = k + abx modifikovani eksponencijalni trend; -reciprona vrednost pomerene eksponencijalne funkcije y = 1 /(k + x ab ) trend logistike krive , itd. Odreivanje vrednosti nepoznatih parametara kod funkcija koje se koriste za izraavanje trenda se vri na osnovu podataka koji su poznati iz nekog ranijeg perioda i to primenom metode najmanjih kvadrata koji smo upoznali kod kriva regresije. U sluaju linearnog trenda na raspolaganju treba da postoje podaci iz dvodimenzionalnog uzorka ( (x1,y1) , (x2,y2) , ... , (xn,yn)) . Neophodno je da se proveri da li meu podacima postoji izraena linearna zavisnost koja se ogleda u koeficijentu korelacije: = xy = ( (xi EX) (yi EY))/ ( (xi EX)2( yi EY)2)1/2i =1 i =1 n n

Smatra se da za: 0 2

EX = 0 , 2X = n/(n-2) ,

Koijeva raspodela f(x) = / ((1 + x 2)) Relejeva raspodela f(x) = x/ 2 exp (- x 2/ 2 2) , x > 0 f(x) = /(2) 1/2 , 2X = 2(4-)/2 Laplasova raspodela f(x) = 1/2 exp (-(x-)/) EX = , 2X = 2 2 Vejbulova raspodela V(, ) f(x) = / 2 x-1 exp(-(x/) ), Lognormalna raspodela L(, ) f(x) = 1/((2)1/2 x) exp( -(ln x )2/22) x>0