15
1. STATISTIKA je nauka o varijacijama obiljezja, zakonitostima razvoja i odnosa masovnih pojava i njihovih elemenata u vremenu i prostoru. Silvio Elazar daje ovu def.: "MATEMATICKA STATISTIKA je nauka koja se bavi proucavanjem zakona slucajnih dogadjaja na osnovu teorije vjerovatnoce, matematickom obradom podataka mjerenja masovnih pojava.", dok neki drugi autori daju i ovu definiciju: "Nauka koja proucava pojave koje obuhvataju vrlo veliki broj elemenata, koji imaju neko zajednicko svojstvo (obiljezje) naziva se matematicka statistika. Statisticke metode istrazivanja primjenjuju se na gotovo sva podrucja ljudske djelatnosti, gdje god se javlja veliki broj eksperimentisanja i mjerenja ( kao npr. pri izucavanju problema dohotka, profita, nataliteta, mortaliteta, te raznih mjerenja u fizici, hemiji, tehnici,...) U statistici se prvo prikupe podaci o pojavama koje se istrazuju pomocu opazanja, anketa, popisa i dr., pa se ti podaci obradjuju i izvode odredjeni zakjlucci: prognoze. Osnovni predmet razmatranja u statistici su skupovi elemenata koji imaju izvjesne zajednicke karakteristike. 2. POPULACIJA (Osnovni skup) je skup svih istorodnih elemenata koji podlijezu (statistickom) ispitivana koje Iju. Skup elemenata sa nekom zajednickom osobinom cija mjera vrijednosti je osnovni skup. STATISTICKI SKUP predstavlja cjelinu sastavljenu od

Statistika

  • Upload
    nedimz1

  • View
    48

  • Download
    0

Embed Size (px)

DESCRIPTION

djonovi za ispit :)

Citation preview

Page 1: Statistika

1. STATISTIKA je nauka o varijacijama obiljezja, zakonitostima razvoja i odnosa masovnih pojava i njihovih elemenata u vremenu i prostoru. Silvio Elazar daje ovu def.: "MATEMATICKA STATISTIKA je nauka koja se bavi proucavanjem zakona slucajnih dogadjaja na osnovu teorije vjerovatnoce, matematickom obradom podataka mjerenja masovnih pojava.", dok neki drugi autori daju i ovu definiciju: "Nauka koja proucava pojave koje obuhvataju vrlo veliki broj elemenata, koji imaju neko zajednicko svojstvo (obiljezje) naziva se matematicka statistika. Statisticke metode istrazivanja primjenjuju se na gotovo sva podrucja ljudske djelatnosti, gdje god se javlja veliki broj eksperimentisanja i mjerenja ( kao npr. pri izucavanju problema dohotka, profita, nataliteta, mortaliteta, te raznih mjerenja u fizici, hemiji, tehnici,...) U statistici se prvo prikupe podaci o pojavama koje se istrazuju pomocu opazanja, anketa, popisa i dr., pa se ti podaci obradjuju i izvode odredjeni zakjlucci: prognoze. Osnovni predmet razmatranja u statistici su skupovi elemenata koji imaju izvjesne zajednicke karakteristike. 2. POPULACIJA (Osnovni skup) je skup svih istorodnih elemenata koji podlijezu (statistickom) ispitivana koje Iju. Skup elemenata sa nekom zajednickom osobinom cija mjera vrijednosti je osnovni skup. STATISTICKI SKUP predstavlja cjelinu sastavljenu od istovrsnih, medjusobno uporedivih elemenata sa zajednickim varijabilnim obiljezjem, sto je ustvari tekuca varijabla (npr.x_i) slucajne promjenljive(X). Zajednicka osobina odredjenog osnovnog skupa zove se OBILJEZJE tog skupa. Obiljezje moze biti numerickog, ali i atributivnog karaktera. 3. Za koje se obiljezje kaze da je numericko? Navedite primjere numerickih obiljezja i primjere obiljezja koja nisu numericka (Kako nazivamo ta obiljezja?). Numericko obiljezje je ono obiljezje koje je numerickog karaktera odn. numerickih karakteristika, gdje su bitni pojmovi: obim osnovnog skupa, raspodjela ili distribucija, frekvencija (relativne ili apsolutne) itd. Obiljezja koja nisu numericka nazivaju se atributivna i ona se mogu svesti na obiljezja numerickog karaktera. 4. Pod statistickim pokusom ili statistickim eksperimentom podrazumijeva se registriranje vrijednosti obiljezja X kod elemenata iz

Page 2: Statistika

nekog podskupa osnovnog skupa. Osnovni predmet statistickih zakljucivanja jeste da se na osnovu statistickih pokusa nesto zakljuci o distribuciji F_x(x)obiljezja X. Pretpostavimo da treba ispitati neko svojstvo (obiljezje) koje karakterise skup istorodnih objekata, tj. neki osnovni skup “. Da bi to uradili moze se sprovesti potpuno ispitivanje posmatranog skupa. No, ocigledno je da ako je “ konacan i statistickim pokusom registrujemo obiljezje X svakog elementa ” “ , onda je distribucija F_x potpuno odredena. Medutim, redovna je situacija takva da statisticki pokus sproveden nad pravim podskupom od koji se naziva uzorak. Razlozi za to mogu biti slijedeci: 1)principijelna nemogucnost da se obiljezje X registruje kod svakog elementa ” “, odnosno da pri velikom broju objekata (elemenata) ostvariti potpuno ispitivanje nije moguce; 2)troskovi ili prakticna besmislenost takvog postupka tj. ispitivanje vezano za unistavanje objekata ili je vezano za velike materijalne troskove, (npr., ako je osnovni skup mjesecna proizvodnja jedne fabrike sijalaica, a obiljezje X recimo "vijek" trajanja sijalice, registriranje obiljezja na cijeloj populaciji dovodi do unistavanja cijele mjesecne proizvodnje). Razmatranja u teoriji vjerovatnoce navode nas kako treba "uzeti" uzorak da bi on bio reprezentativan. naime elemente osnovnog skupa treba birati u uzorak slucajno, jer onda ocekujemo da se "neutralisu" sve moguce zavisnosti izmedu posmatranog obiljezja i uzorka. Tako izabran uzorak zove se slucajni uzorak. Kako elemente osnovnog skupa biramo u uzorak slucajno to imamo n - slucajnih ishoda ” 1....” n naseg statistickog pokusa. Obiljezje X naseg statistickog pokusa posmatrano kod svakog od tih n ishoda daje n - dimenzionalnu slucajnu velicinu (X 1...X n), gdje je X k=X(” k) za k=1...n. Kako cemo se uglavnom baviti samo jednim obiljezjem, npr. X , to imamo n - dimenzionalnu slucajnu velicinu (X_1...X_n) koju cemo takode zvati slucajni uzorak. Otuda vidimo da se sa formalnog aspekta moze reci da je jednodimenzionalni slucajni uzorak obima n ustvari n - dimenzionalna slucajna velicina (X_1...X_n) Ako pak posmatramo dva obiljezja, recimo X i Y , tj. ako se radi o dvodimenzionalnom statistickom skupu, onda njemu odgovara slucajni uzorak oblika ((X_1,Y_1)...(X_n,Y_n)) Opcenito se moze posmatrati k - dimenzionalan statisticki skup, gdje je k prirodan broj.

Page 3: Statistika

5. Pojam empirijske funkcije distribucije i fundamentalni teorem statistike. F_n je svuda sa kvakom iznad u ovom pitanju -U cilju davanja odgovora na pitanje reprezentativnosti uzorka, tj.u kom slucaju uzorak(X_1...X_n) daje potpunu informaciju o raspodjeli F(X) obiljezja X na cijelom osnovnom skupu ”, definise se prvo tzv. empirijska funkcija distribucije. Def. Neka je (X_1, X_2,., X_n) slucajni uzorak obima n iz funkcije distribucije F,tj.neka su X_1, X_2, .,X_n jednako distribuirane slucajne velicine sa zajednickom funkcijom distribucije F. Funkcija F_n(ili F*) definirana na R izrazom F_n(X)=( broj Xi-ova koji su manji od X )/n (XR), tj. F n(X)=(1/n)*Ž{X{Xi<X}, i=1, n} ili F n(X)=Ž{fi/n, X<Xi, n} zove se empirijska funkcija distribucije(raspodjele) uzorka ili statisticka funkcija raspodjele. Dakle,za svako fiksirani XR,F_n(X) predstavlja relativnu frekvenciju dogadaja{X<x} u n-ponovljenih nezavisnih pokusa, odnosno F_n(X) je slucajna velicina. Centralna teorema statistike (fundamentalna teorema statistike) ili tzv. Glivenko-Cantelli, tvrdi da je konvergencija cak uniformna po X [gotovo (sigurno) svuda]. Ona glasi: Neka je {X_n}, F_n, F_n kao u prethodnoj definiciji, tj. neka je (X_1,X_2,.,X_n) prost slucajan uzorak sa obiljezjem X cija je funkcija distribucije F(teoretska) i F_n empirijska funkcija distribucije uzorka. Tada vrijedi: P({lim[sup_(XR)|F_n(X)-F(X)|, n ¾]=0})=1 7. Definirajte pojmove slabog i jakog zakona velikih brojeva, a zatim formulisite Bernulijev zakon velikih brojeva! formulacija zakona velikih brojeva: Neka je {X_n} niz nezavisnih slucajnih velicina (definiranih na fiksnom prostoru vjerovatnoce (“,F,P)). Posmatra se konvergencija niza (1/n)*(ŽX i,i=1,n)-(1/n)*(ŽE(X i),i=1,n) (n=1,2,...) ka 0 (ili, opstije, niza S_n/n ili niza S_n-a_n/n ka konsanti, gdje je S n=(ŽX i,i=1,n), a nR, (n=1,2,...)). Ako je u pitanju konvergencija u vjerovatnoci odgovarajuca teorema zove se slabi zakon velikih brojeva, a kod skoro sigurne konvergencije zove se strogi(jaki) zakon velikih brojeva. //Bernulijev slabi zakon velikih brojeva. U Bernulijevoj semi (tj. ako je S_n ~ B(n,p), tj. ako je S_n binomna slucajna velicina) za svaki †>0 vrijedi da je P{ [|(S_n/n)-p|ž†] } --_ 0, (n-- ¾), tj. (1/n)*(ŽX i,i=1,n)--_p, (n-- ¾).

Page 4: Statistika

(Ovaj zakon govori o konvergenciji po vjerovatnoci niza relativnih frekvencija u Bernulijevoj semi u svakom pojedinom pokusu. Ovaj zakon pretpostavlja klasican rezultat teorije vjerovatnoce i jedan je od prvih vaznijih teorema teorije vjerovatnoce a objavljen je 1715. godine.) 8. Definirajte pojam statistike u uzem smislu i pojam dopustive familije distribucija, a zatim navedite nekoliko vaznih primjera statistika. Definicija: Neka je (X_1,X_2,...X_n) uzorak obiljezja X iz funkcije distribucije F i g: R^n--_R Borelova funkcija (tj. ako je g^(-1)(B)B^n, svaki BB^n gdje je B^n - algebra na R^n generisana familijom svih otvorenih podskupova na R^n, tj. B^n je algebra Borelovih skupova na R^n (za svaki n=1,2,...). Slucajna velicina Y=g(X_1,X_2,...X_n), u kojoj ne figurisu nepoznati parametri, tj. ne zavisi eksplicitno od nepoznatih parametara, zove se statistika (u uzem smislu rijeci, za razliku od pojma statistike, u sirem smislu, kao naucne discipline). Osnovni problem u statistici je da se pomocu uzorka (X_1,X_2,...X_n) nesto zakljuci o raspodjeli F(x) obiljezja X. Najcesce je situacija takva da o raspodjeli F(x) imamo neke prethodne informacije ili pretpostavke koje ne podvrgavamo provjeravanju. Ako su nam matematicko ocekivanje m i varijansa ^2 obiljezje X nepoznati, onda mozemo reci da X ima raspodjelu koja pripada familiji raspodjela //Sada je "N" pisano// { N(m, ^2) }, -¾<m<+¾, ^2>0, ili recimo, imamo dovoljno razloga da pretpostavimo da X ima uniformnu raspodjelu na segmentu [0,b], pri cemu je b nepoznat. Tada je familija raspodjela kojoj pripada raspodjela za X data sa //_ je unija// { _(0,b) , b>0 }. Uopste, redovno pretpostavljamo da obiljezje X ima distribuciju (raspodjelu) koja pripada familiji distribucija { F(x,ˆ), ˆA } gdje je A skup dopustivih vrijednosti. Ova familija se naziva DOPUSTIVA FAMILIJA DISTRIBUCIJA. // Primjera nema 9. Objasniti kako se vrsi ocjena parametara po uzorku, te definisite pojam centrirana ocjena nepoznatog parametra. Neka slucajna velicina X ima distribuciju F(x,€) gdje je x nepoznat parametar. Pretpostavimo da treba ocjeniti parametar €, odnosno da treba odrediti priblizno njegovu vrijednost u zavisnosti od nekog uzorka n:x_1,...,x_n. oznacimo tu promjenu sa €_sa crtom iznad.(u daljem textu:‚). Ocigledno ‚ zavisi od uzorka n:x 1,...,x n, tj: ‚=‚(x 1,..,x_n). Kako u i-toj seriji iz "n" ogleda ‚ uzima neku vrijednost ‚ i, to se ‚ javlja kao slucajna velicina ‚:“ R, te se moze govoriti o distribuciji te velicine , a i o njenim numerickim karakteritikama. Da bi ocjena ‚ nepoznatog parametra € imala prakticnu vrijednost, na nju se postavljaju odredjeni zahtjevi. Odatle imamo sljedecu definiciju o ocjenama parametara: Ocjena ‚=‚(x 1,..,x n) nepoznatog parametra € zove se centralna (nepristrasna,

Page 5: Statistika

nepromjenljiva) ako je E(‚)=€ -jednacina(1). Ako svojstvo (1) nije ispunjeno, onda je ocjena prisrasna, i tada je E(‚)=€+ƒ, ili E(‚)=€*ƒ, gdje je ƒ pristrasnost. Eliminacijom ƒ(pristrasnosti), odnosno‚=‚-ƒ, ili ‚=€/ƒ dobije se nepristrasna funkcija. 10. Definirajte pojmove stalna (postojana, konzistentna, mocna) ocjena parametra-1, najefikasnija ocjena parametra-2. definicija-1: ocjena €_se crtom iznad (u daljem textu:‚) parametra € zove se stabilna (postojana, konzistentna) ako za proizvoljan †>0 vrijedi da je: lim(n ¾) P{|‚-€|>=†}=1, tj. ‚ (iznad crte je "p")€ definicija-2: nepristrasna i stabilna ocjena ‚ zove se nejefikasnijom (najefektivnijom) ako ima najmanju varijansu (disperziju) od svih nepristrasnih i stabilnih ocjena parametra € iz familije ˆ, tj. Var‚=infvar‚ (ispod inf: ‚ˆ). napomenimo da se cesto efektivnost definise u klasi nepristrasnih ocjena(procjena) 11. OSNOVNOM SREDINOM naziva se aritmeticka sredina obiljezja X osnovnog skupa. Oznacimo osnovnu sredinu sa x_0. Ako su sve vrijednosti x_1...x_n obiljezja X osnovnog skupa obima N razlicite, onda prema datoj definiciji imamo x o=1/N *Ž{x i, i=1, N} p=1/N,onda je matematicko ocekivanje takve slucajne velicine dato sa E(x)=x 1*1/N+x 2*1/N+...+x n*1/N=1/n *Ž{x i, i=1, n}, tj. slijedi da je ocekivanje obiljezja x dato izrazom E(x)=š 0 Ako vrijednosti x_1...x_k imaju respektivno frekvenciju N_1...N_k pri cemu je suma(i=1 do k) N i=N onda je š 0=1/N suma (i=1 do k) N i*x i Za neprekidnu raspodjelu obiljezja X uzima se po definiciji da je š 0=E(X) SREDINA UZORKA - š n naziva se aritmeticka sredina vrijednosti obiljezja uzorka. Ako su sve vrijednosti x 1...x n razlicite, onda š n=1/n *Ž{x i, i=1, n} Ako ipak vrijednosti x_1...x_k imaju, respektivne frekvencije n_1...n_k, pri cemu je n 1+...n k=n onda je š n=1/n Ž{n i*x i, i=1, k} VARIJANSA je sredina kvadrata odstupanja vrijednosti obiljezja X osnovnog skupa od njegove srednje vrijednosti š 0. Ako su sve vrijednosti x_1...x_N obiljezja x osnovnog skupa obima N razlicite, onda je prema datoj definiciji D 0=1/N Ž{(x i-X_0)^2, i=1, N} a ako vrijednosti x_1...x_k imaju respektivno frekvencije n_1...n_k, n 1+...+n k=n onda je D 0=1/N Ž{n i(x i-X_0)^2,i=1,k} DISPERZIJOM UZORKA D_n naziva se aritmeticka sredina kvadrata odstupanja. Ako su vrijednosti x_1...x_n obiljezja X uzorka obima n sve razlicite, onda je D n=1/n Ž{(x i-š n)^2, i=1, n} a ako vrijednosti x 1...x k imaju respektivno frekvencije n_1 ...n_k, za koje je n_1+n_2...+n k=n onda je D n=1/n Ž{n i(x i-š n)^2, i=1, k} EMPIRIJSKA DISPERZIJA S^2 definise se izrazom S^2=n/(n-1)*D_n. Odatle imamo da je S^2=n/(n-1)*1/n *Ž{n i*(x i-š n)^2, i=1, k}=1/(n-1) *Ž{n i*(x i-š n)^2, i=1, k} kako je E(S^2)=E((n-1)/n*D_n)=n/(n-1)*E(D_n)=n/(n-1)*(n-1)/n*D_0=D_0, to je empirijska disperzija nepristrasna ocjena osnovne disperzije.

Page 6: Statistika

12. Dokazite da je disperzija D_n uzorka pomjerljiva ocjena osnovne disperzije D_0. d 0=š^2 0-(š 0)^2, odnosno vazi E(D n)=(n-1)/n*D_o Kako je ocekivanje E(D_n) D 0, te se disperzija uzorka D n smatra pomjerljivom (nije centrirana) ocjenom osnovne disperzije D_n. Da bismo dobili nepomjerljivu ocjenu (centriranu) osnovne disperzije D_0, uvodi se pojam EMPIRIJSKE disperzije S^2. 13. Dokazite da empirijska disperzija S^2 nepomjerljiva ocjena osnovne disperzije D_0, tj. da je E(S^2)= D_0 EMPIRIJSKA DISPERZIJA S^2 definise se izrazom S^2=n/(n-1)*D_n. Odatle imamo da je S^2=n/(n-1)*1/n *Ž{n i*(x i-š n)^2, i=1, k}=1/(n-1) *Ž{n i*(x i-š n)^2, i=1, k} kako je E(S^2)=E((n-1)/n*D_n)=n/(n-1)*E(D_n)=n/(n-1)*(n-1)/n*D_0=D_0 E(S^2)= D_0 14. Kojom vrstom grafika prikazujemo distribuciju frekvencija ili numericki niz ( numericku seriju)? objasnite kako se crta poligon frekvencija, a kako histogram. -Distribucija frekvencija se prikazuje pomocu poligona i histograma. -Izlomljena linija koja povezuje uredjene parove (x_i,f_i) zove se poligon frekvencija, gdje se x_i nanosi na apcisu, a f_i na ordinatu. -Histogram podrazumjeva liniju pravougaonika cije osnovicena osi apcise x imaju mjerni broj duzine 1, a takodjer su sredista osnovica vrijednosti x_i posmatranog obiljezja v, a mjerni brojevi visina su jednaki vrijednosti pojedinih frekvencija. 15. Empiriske distribucije i njihove karakteristike ( relevantna frekvencija g_i, funkcija relativnih frekvencija f*, kumultativna funkcija F*, sredine, varijansa, standardna devijacija, centralni r-ti moment μ r / za diskretni slucaj i opcenito u vjerovatnoci /, koeficient astrometrije ƒ 3 i koeficient splostenosti ƒ 4, mod M i medijan m). -Standardna devijacija je prosjecno odstupanje orginalnih vrijednosti od aritmeticke sredine, tj. pozitivni drugi korijen iz varijanse …=¨(μ). -Varijansa (…^2,μ) pretstavlja srednje kvadratno odstupanje podataka u seriji, od aritmeticke sredine te serije, ovo je kvadratna velicina izrazena prema aritmetickoj sredini i njena se vrijednost krece od nule do +¾ za proste serije μ=…^2=(Ž(x_i-š)/n za srednje serije μ=…^2=(Žf i(x i-š)^2)/Žf i. -Koeficijent asimetrije ƒ 3 je odnos (μ 3)/(…^3)=centralni moment sredine/standardna devijacija na treci stepen. -Koeficient splostenosti ƒ 4 ƒ 4=(μ 4)/(…^4)=cetvrti moment oko sredine/standardna deviacija na cetvrti stepen.

Page 7: Statistika

16. Statisticke procjene (Metode statistickih procjena. Najosnovnije formule. Metod Maximum- Likelihood (tackasta procjena). Intervalna procjena). Metode statistickih procjena su sve one metode kojima se zakljucuje na osnovu uzoraka o nepoznatim katakteristikama osnovnog skupa(generalni skup). Prema tome metoda statisticke procjene je indirektni metod zakljucivanja i u tom smislu uvest cemo formule pomocu kojih se provode metode statistickih procjena. Razlikujemo metode za tackaste ststisticke procjene i metode za intervalne statisticke procjene(za odredjivanje intervala pouzdanosti) A) Tackasta procjena osnovna metoda za tackaste statisticke procjene je takozvana metoda Maksimum-Likehood. Ova formula se sastoji od sljedeceg ako su x_1.....x_k slucajno odabrane vrijednosti iz osnovnog skupa koji ima obiljezje X sa zakonom vjerovatnoce f`(pisano f)(x,p) gdje je p nepoznati parametar, distribucija obiljezja X onda se prema navedenoj metodi parametar p ocjenjuje na sljedeci nacin Definiramo funkcije L:=f`(x_1,p)f`(x_2,p)....f`(x_k,p) Likehood funkciju koju treba maximizirat i iz tog uslova odrediti vrijednost parametra p to jest iz uslova za stacionarnu tacku diferencijabilne funkcije od k promjenjivih to jest treba rijesiti jednacinu …L/…p=0 ili to je ekvivalentno sa …(lnL)/…p=0 B) postoje razne metode za procjenu intervala oko neke tacke ti intervali se nazivaju intervali pouzdanosti u tom smislu navedimo ovaj tip intervalne porcjene a)interval pouzdanosti za sredinu osnovnog skupa E(X) Za sredinu sa poznatom varijansom standardnom devijacijom sa statistickom sigurnoscu € u tom smislu posmatra se izraz P(š-(c /(¨n))oeE(X)oeš+( /(¨ n))= € gdje je const c odredjuje iz standarizirane gausove distribucije koristeci uslov P(-c<yoec)=€ b) osnovni skup je beskonacan N=+¾(n>30) i koristimo relaciju formulu da je P(x(nadvuceno)-(cS/¨n)<E(X)<x(nadvuceno)+cS/¨ n)= € c) Osnovni skup N je beskonacan N=+¾ a osnovni uzorak n malen (n<30) P(š-ts/¨ (n<E(x)<š+ts/¨n) = gdje se t odredjuje prema t distribuciji koja se naziva studentova distribucija sa n-1 stepena slobode iz uslova da he P(-t<yoet)= 17. ZNANSTVENA HIPOTEZA- Predstavlja nagadjanje, naslucivanje i pretpostavke koje motiviraju istrazivanje.Iz znanstvene hipoteze izvodi se statisticka hipoteza. STATISTICKA HIPOTEZA-iskazuje se na nacin da moze biti vrednovana statisticko-analitickim postupcima.Statisticka hipoteza matematicki je izraz koji predstavlja polaznu osnovu na kojoj se temelji kalkulacija statistickog testa. NULTA HIPOTEZA-Ho ,pretostavka je o izostanku efekta to jest da ne postoji razlika medju uzorcima u populaciji od interesa.To je hipoteza koja se testira, hipoteza da nema razlike.Postavlja se (najvecima) u svrhu odbacivanja.Odbacuje se ili prihvata.Primjer Ho: u muskaraca i zena u populaciji jednak je postotak pusaca.

Page 8: Statistika

ALTERNATIVNA HIPOTEZA- Hi, vrijedi ako nulta hipoteza nije istinita. Najcesce se direktno odnosi na teorijsku pretpostavku koja se zeli istraziti to jest cesto je alternativna hipoteza upravo hipoteza istrazivaca.Primjer Hi : u muskaraca i zena u populaciji razlicit je postotak pusaca. 18. Navedite osnovne pretpstavke i neparametarske testove, a zatim opisite studentov test( T-test), Fisher-ov test ili Medijana test ili Hi-kvadrat test. Parametarske testove primjenjujemo ukoliko su poznati oblik i karakteristike rasporeda numericke promjenjive u osnovnom skupu. Medju najznacajnijim i najcesce primjenjenim testovima u postupku testiranja statistickim hipotezama navescemo 3: T-test, F-test,x^2(hi-kvadrat)-test Neparametarski testovi ne postavljaju takav tip zahtjeva, premda i oni predpostavljaju uvjete pod kojima ih se smije primjeniti. X^2(Hi-kvadrat)-test: Ovaj test u statistickoj analizi ima dvojaku primjenu. Prva znacajna karakteristika njegove primjene jeste u tome da se vrsi u noim slucajevima kada osnovni skup koji zelimo da istrazujemo na osnovu uzoraka, odnosno njegove karakteristike koje su predmet istarazivanja, ne zna se u kojoj vrsti distribucije su rasporedjeni. Pretpostavka od koje se polazi u takvim slucajevima je da su velicine te karakteristike normalno rasporedjeni. To se provjerava X^2-testom. Druga karakteistika primjene X^2-testa je u tome sto se tom metodom prosiruje staticko reprezentativno istrazivanje na ustanovljavanje odnosno procjenu sinjifikantnosti i razlike proporcija vise od dva skupa. Ocjena se vrsi prema obrascu: X^2=Ž( (fi-fc)^2 / fc ) Fi-stvarne frekvencije dobivene iz uzorka, fc-ocekivane frekvencije .Znacaj X^2-testa u statistickoj analizi postaje sve veca (u poljoprivredi, industriji) 19. Metoda najmanjih kvadrata --Nacela na kojima se zasniva metoda najmanjih kvadrata Metoda najmanjih kvadrata zasniva se na nacelu da su najbolji oni parametri a,b za koje je suma kvadrata razlika izmedju njihivih vrijednosti Y_i, i=1,2,....,n i izracunatih vrijednosti f(x_i,a,b) minimalna. Napominjemo da bije dobro razmatrati zbroj razlika experimentalnih i teoretskih podataka, jer se pozitivne i negativne razlike(odstupanja) ponistavaju. Matematicari su posmatrali apsolutne vrijednosti razlika i trazili da njihova suma bude minimalna. To nije los kriterij ali su apsolutne vrijednosti nepogodne jer se ne mogu opcenito derivirati. Taj ali i neki drugi razlozi, prevagnuli su u korist sume kvadrata. --Postupak odredjivanja parametara mrtodom najmanjih kvadrata Oznacimo i-to odstupanje kao D_i=Y_i-f(x_i,a,b) To je razlika izmedju mjerene (experimentalne) vrijednosti y_i i teoretske vrijednosti f(x_i,a,b), tj. vrijednosti funkcije f(x,a,b) za x=x_i. Prema metodi najmanjihj kvadrata, parametre odredjujemo tako da suma: D_1^2+D_2^2+....+D_n^2 bude minimalna. Odredjivanje regresiskog pravca: Tu je f(x,a,b):= ax+b pa je f(x_i,a,b)=ax_i+b …f(x i,a,b)/…a=x i

Page 9: Statistika

i …f(x i,a,b)/…b=1 Dobijemo konacnu formulu a=(nŽx iy i - Žx iŽy i) / (nŽx i^2 - (Žx i)^2) i b=(Žx i^2Žy i - Žx iŽx iy i) / (nŽx i^2 - (Žx i)^2) 20. Ako izmedju dvaju ili vise obiljezja x_1, x_2,...,x_k postoji veza onda se kaze da su ta obiljezja u korelaciji ili da su koreliranosti. Matematicki zakon koji reprezentira tu vezu zove se funkcija regresije. Stepen povezanosti ili koreliranosti mjeri se koeficijentom korelacije. Koeficijent korelacije r (x 1,x 2)= (Ž{Ž{(x 1i - š 1)(x 2i - š 2)*h*(x 1i,x 2i),i},i}/¨(Ž{(x 1i - š 1)^2*f(x 1i),i}*(Ž{(x 2i - š 2)^2*g(x 2i),i}). Regresiona funkcija x_1= a+b_2x_2 x_1= a+b_2x_2 + b_3x_3 Visestruka korelacija R (x 1*x 2,x 3)¨((r^2 (x 1, x 2)+r^2 (x 1, x 3)-2r_(x_1, x_2)*r_(x_1, x_3)*r_(x_2, x_3))/(1-r^2_(x_2, x_3))) Ako se promatraju samo dvije varijable ili dva obiljezja onda se govori o jednostrukoj korelaciji.