Transcript
Page 1: Skripta Za II Parcijalu Iz Poslovne Statistike

OSNOVNI SKUP I UZORAK Pored potpunog stat posmatranja i ispitivanja u praksi se vrlo cesto primjenjuju nepotpuna posmatranja i ispitivanja pojava. Osnovna karakt svih nacina nepotpunog ili djelimicnog posmatranja i prikupljanja podataka jeste ta da izborom manjeg ili veceg broja jedinica iz populacije dolazimo do informacija o cijeloj posmatranoj pojavi. Uzorak je dio osnovnog skupa pomocu kojeg zelimo saznati podatke o cjelini. Nepoznate karakteristike osnovnog skupa koje procjenjujemo na osnovu uzoraka nazivaju se parametrima. Skup postupaka pomocu kojih se na osnovu poznavanja ogranicenog broja elemenata osnovnog skupa zakljucuje o karakt cjeline naziva se METODA UZORKA ILI REPREZENTATIVNA METODA. Za ovu metodu se u stranoj literaturi koristi i naziv induktivna statistika. Inferencijalna statistika se bavi donosenjem zakljucaka na bazi djelimicnog stat posmatranja, koje podrazumijeva prikupljanje podataka o varijacijama obiljezja i njihovo pridruzivanje jedinicama za samo jedan dio populacije. Mora se voditi racuna o tome da uzorak vjerno odrazava stanje u populaciji, tj da bude reprezentativan. Kad se moze odrediti broj elemenata u osnovnom skupu, kazemo da se radi o KONACNOM SKUPU, dok je BESKONACAN OSNOVNI SKUP onaj kod kojeg je broj elemenata neodrediv ili prakticno neodrediv. U vezi izbora uzorka razlikujemo uzorak sa ponavljanjem i uzorak bez ponavljanja. Ako izabrana jedinica u uzorak moze ponovo da ucestvuje u izboru slijedece jedinice, onda se radi o uzorku sa ponavljanjem, dok kod uzorka bez ponavljanja to nije moguce.

PREDNOSTI I NEDOSTACI METODE UZORAKAOsnovni cilj koristenja metode uzorka je da obezbijedi potrebne informcije sa pouzdanoscu koja se zahtijeva uz minimalne troskove ili da makrimizira stepen pouzdanosti dobijenih informacija uz date troskove. Prednosti metode uzorka su:

1) u mnogim slucajevima je neekonomicno, a u nekim i nemoguce prikupiti podatak za svaku jedinicu populacije2) veca brzina prikupljanja podataka i dobivenih rezultata3) nizi troskovi u odnosu na troskove popisa cjelokupne populacije4) veca pouzdanost rezultata jer istrazivanje vrse statisticati i specijalno pripremljeni anketari- kontrolori, cije je angazovanje opravdano zbog smanjenog obima poslovanja5) veca fleksibilnost u vidu razlicitih vrsta podataka koji se mogu prikupiti6) moguce je optimizirati velicinu uzorka uz odgovarajuci rizik koji su istrazivaci spremni prihvatiti

Nedostaci metode uzorka su:

1) Razultati sadrze gresku uzorka2) Neophodna je specijalna obuka kadrova i rukovodjenje statisticara3) Uzorak ne daje podatak za svaku jedinicu posmatrane populacije4) Kod neprobabilistickih(nisu bazirani na vjerovatnoci) uzoraka ne mogu se donositi

procjene parametara populacije u strogo naucnom smislu5) I dalje ostaje potreba za periodicnim i potpunim posmatranjima masovnih pojava

putem popisa, evidencija i registracija

Page 2: Skripta Za II Parcijalu Iz Poslovne Statistike

Metod uzorka moze da obezbijedi kvalitetnije podatke, pored toga sto je efikasniji i ekonomicniji od popisa.

IZRADA PLANA UZORKOVANJACesto se pojmovi uzorak i uzorkovanje poistovjecuju, ali treba praviti razliku jer je uzorak skup elemenata kod se UZORKOVANJE odnosi na nacin njihovog odabira. Plan uzorkovanja se sastoji od nekoliko koraka: definisanje osnovnog skupa, utvrdjivanje okvira izbora, odluka o vrsti uzorka, velicina uzorka, provodjenje uzorkovanja. Osnovni skup ili populacija je skup iz kojeg se bira uzorak. Osnovni skup cine jedinice koje imaju neke zajednicke karakt koje zelimo istraziti. Da bi se nedvosmisleno znalo koji elementi pripadaju osnovnom skupu a koji ne, potrebno je precizno definisati elemente, i to sadrzajno, prostorno i vremenski. Statisticki skup treba da bude homogen, cjeloviz i izdiferenciran u pogledu posmatranih karakteristika. Stat skup je homogen ako su izabrane jedinice skupa istovrsne i uporedive. Stat skup se sastoji iz istovrsnih elemenata sto ne znaci jednakih, vec izdiferenciranih prema modalitetima zajednickog obiljezja. Osnovni zahtjev koji mora biti ispunjen da bi okvir izbora uzorka uopste postojao je da se precizno odredi evidencija, lokacija ili adresa jedinica. Okvir izbora je najcesce formiran od lista, imenika, spiskova ili mapa. Osnovni kriterij za podjelu uzoraka je racun vjerovatnoce. Na velicinu uzorka znacajno utice pouzdanost procjene trazenog parametra populacije. Kako se smanjuje stepen pouzdanosti procjene, tako se smanjuje velicina uzorka i obratno. Sva istrazivanja se provode pod odredjenim finansijskim ogranicenjima, ta cinjenica ne utice samo na odluku o velicini uzorka vec i na vrstu uzorka i nacin prikupljanja podataka.

VRSTE UZORAKAPrema kriterijumu vjerovatnoce razlikujemo: 1) uzorke koje se zasnivaju na principima teorije vjerovatnoce 2) uzorke koji se ne zasnivaju na principima teorije vjerovatnoce

UZORCI BAZIRANI NA TEORIJI VJEROVATNOCE- najcesce koristene vrste ovih uzoraka su: jednostavni slucajni uzorak, stratifikovani uzorak, uzorak grupa, sistematski uzorak, visefazni uzorak

JEDNOSTAVNI SLUCAJNI UZORAK velicine n elemenata dobit ce se iz jedinstvenog osnovnog skupa koji ima N elemenata, ako svaka jedinica tog skupa ima istu vjerovatnocu da bude izabrana u uzorak. Pri tome je izbor jednog elementa u uzorak nezavisan od izbora drugog elementa. Na osnovu teorije vjerovatnoce slucajan uzorak bi trebao da sadrzi najveci broj jedinica sa osobinama koje su najcesce a najmanji broj onih jedinica sa rijetkim osobinama u osnovnom skupu. Iz osnovnog skupa velicine N moguce je izabrati odredjeni broj uzoraka velicine n koji se medjusobno razlikuju barem u jednom elementu. Ako je C broj svih razlicitih uzoraka, onda je: Postupak izbora jedinica u uzorak, gdje svaka jedinica ima istu vjerovatnocu izbora nazivamo uzorkom bez ponavljanja. U postupku izbora uzorka sa ponavljanjem element koji smo izabrali u uzorak vracamo u osnovni skup prije izbora slijedeceg elementa, tako da isti element mozemo izabrati u uzorak vise puta. U praksi se vise koriste uzorci bez ponavljanja. Najcesci nacini slucajnog izbora jedinica su: upotreba tablice slucajnih brojeva, izbor jedinica u pravilnim intervalima sa liste, izbor prema redovima u popisu, pomocu RNG funkcije, pomocu screena, izvlacenjem brojeva iz kutije i drugi. Pored

Page 3: Skripta Za II Parcijalu Iz Poslovne Statistike

slucajnog uzorka postoje i drugi metodi slucajnog izbora elemenata u uzorak. Njihova osnovna karakteristika je da se ne biraju iz jedinstvenog osnovnog skupa i da svaka jedinica ima poznatu ali ne obavezno i jednaku vjerovatnocu izbora u uzorak. Zbog ovih osobina nazivaju se kontrolisani slucajni uzorci, medju kojima su najpoznatiji: sistematski, stratifikovani, uzorak grupa i viseetapni uzorak.

SISTEMATSKI UZORAK- kod sistematskog izbora postoji za svaki element u osnovnom skupu jednaka mogucnost da bude izabran u uzorak, ako je broj elemenata koji se bira tacan djelitelj broja elemenata u osnovnom skupu. Prednost ovog uzorka je i u tome sto se moze koristiti i kada ne postoji popis elemenata osnovnog skupa. Istrazivac takodjer ne mora voditi racuna da ce se neki elemenat pojaviti vise puta jer je ta mogucnost iskljucena. Ovaj uzorak ce imati vecu preciznost od jednostavnog slucajnog uzorka kada su elementi osnovnog skupa uredjeni prema osobini koja je vazna u istrazivanju.

STRATIFIKOVANI UZORAK- se temelji na podjeli osnovnog skupa na stratume(lat, stratum-sloj, podskup) a iz njih se biraju manji jednostavni slucajni uzorci. Ovaj uzorak omogucava da uradimo procjene ne samo za osnovni skup nego i za njegove podskupove, tako da mozemo da uradimo posebnu analizu svakog stratuma. Upotreba ovog uzorka zahtijeva dobro poznavanje rapodjele karakteristicnih obiljezja populacije, sto osigurava odabir svih interesantnih populacijskih podskupova. Porast broja stratuma povecava preciznost procjene ali istovremeno otezava realizaciju i povecava troskove. Znacajan problem u primjeni ovog uzorka predst raspored ukupnog uzorka na pojedine stratume. U vezi s tim razlikujemo proporcionalni i optimalni raspored. U praksi se cesce koristi proporcionalni stratifikovani uzorak, jer mu je standardna greska manja i u slucajevima kada izvrsimo losiju stratifikaciju, a izbor jedinica kod proporcionalnog stratifikovanog uzorka je mnogo laksi nego kod optimalnog strat uzorka, i trece obicno se ne dobija mnogo bolji rezultat nego proporcionalnim uzorkom.

UZORAK GRUPA- ono sto ovaj uzorak razlikuje od drugih slucajnih nacina izabiranja elemenata u uzorak je to sto se vrsi primarna selekcija jedinica u grupe. Kod ovog uzorka primarna jedinica izbora je grupa, definisana kao element ili grupa elemenata koje uzimamo za izbor u nekoj etapi izbora uzorka. Ove grupe predst na odredjeni nacin vec formirane cjeline unutar osnovnog skupa i uglavnom se razlikuju po velicini. Klasteri(grupa, blok) se biraju na slucajan nacin, najcesce jednostavnim ili sistematskim izborom. Razlikujemo: jednoetapno, dvoetapno i viseetapno uzorkovanje. Kod jednoetapnog klaster uzorka svi elementi odabrane grupe ulaze u uzorak, dok dvi i viseetapni uzorak obuhvataju samo odredjene clanove grupe. Primjena uzorka grupa je jedan od prakticnih postupaka za segmentiranje trzista.

VISEFAZNI UZORAK- osnovna karakt ovog uzorka je da se koristi kada vrsimo posredno posmatranje karakteristika pojava koje su predmet istrazivanja. To proucavanje vrsimo preko nekog drugog obiljezja koje je u korelaciji sa predmetom istrazivanja. Ovaj uzorak je dosta slican viseetapnom uzorku. Razlika se manifestuje u tome da su kod viseetapnog uzorka elementi u etapama razliciti, dok kod visefaznog uzorka to nije slucaj, tj elementi su u svakoj fazi isti.

Page 4: Skripta Za II Parcijalu Iz Poslovne Statistike

UZORCI KOJI NISU BAZIRANI NA TEORIJI VJEROVATNOCENajcesce se koriste: kvotni uzorak, ekspertni uzorak(namjerni uzorak), uzorak „grudva“ i prigodni uzorak.

KVOTNI UZORAK- se po svojoj logici najvise priblizava slucajnim uzorcima.ovaj uzorak je na neki nacin kombinacija stratifikovanog i namjernog uzorka, jer se u uzorak biraju jedinice koje po procjeni istrazivaca najbolje odgovaraju cilju istrazivanja. Kvotni uzorak cine razlicite podgrupe osnovnog skupa, prema njihovim vaznim osobinama. Osnovni nedostatak kvotnog uzorka sastoji se u tome sto istrazivacu ostaje puna sloboda u izboru elemenata u uzorak, pa se u tom postupku neminovno provlace elementi pristrasnosti. Prednosti kvotnog uzorkovanja se ogledaju u sl.: jedan od glavnih razloga zasto se kvotno uzorkovanje dosta koristi u praksi ; nezavisno od postojanja okvira izbora, kvotno uzorkovanje je cesto i jedini primjenljiv metod uzorkovanja za populacije za koje ne postoji okvir. Osnovni nedostatak ogleda se u tome sto ovo uzorkovanje koje nije bazirano na vjerovatnoci ne omogucava da se procjene standardne greske povezu sa rezultatom iz uzorka.

EKSPERTNI UZORAK- ima samo teznju da bude reprezentativan. Za ovaj uzorak katakt je da strucnjaci prema nahodjenju odabiru one jedinice koje smatraju najtipicnijima za populaciju koja se istrazuje. Ekspertni uzorak pripada grupi tzv promisljenih uzoraka. Kod ovog uzorka istrazivaci moraju dobro poznavati populaciju kako bi izabrali one elemente koji se adekvatno predstavljati takav osnovni skup. Dakle, cilj istrazivaca nije da zabiljezi prosjecne vrijednosti populacije, vec namjerno bira jedinice koje imaju vazne karakt za nase proucavanje. Primjena ovog uzorka je opravdana kod eksplorativnih istrazivanja i kada je osnovni skup veoma mali. Pored toga, koristi se kod populacija za koje pretpostavljamo da su homogene prema posmatranim karakteristikama.

PRIGODNI UZORAK- predst niz slucajeva do kojih smo u nekom trenutku jedino mogli doci ili koji su nam se slucajno nasli na raspolaganju. Kao sto sam naziv govori, ovaj uzorak se bira prema prigodi a ne slucajno niti prema nahodjenju. Prigodni uzorak ne zadovoljava stroge kriterije reprezentativnosti. Cesto se primjenjuje u panel istrazivanjima, kod testiranja novih proizvoda i sl, dok kod istrazivanja koja se odnose na mentalno- sadrzajne osobine kao sto su stavovi, misljenja, motivi i namjere, ovaj uzorak ne moze biti reprezentativan. Njegova glavna prednost je u tome sto omogucava da jednostavno brzo i jeftino dodjemo do podataka.

SNOWBALL UZORAK- u praksi je cest slucaj da karakt populacije nisu poznate prije odabira jedinica u uzorak, tako da primjena kvotnog i ekspertnog uzorka je iskljucena. Iz tog razloga se javljaju druge tehnike koje zahtijevaju znanje eksperta. Snowball ili visestruki uzorak se formira tako sto istrazivac vrsi inicijalno identifikovanje nekoliko osoba koje imaju proucavanu osobinu. Osnovna prednost ovog uzorka je ekonomicnost, dok je glavni nedostatak nemogucnost objektivne procjene standardne greske.

Page 5: Skripta Za II Parcijalu Iz Poslovne Statistike

OSNOVNI PROBLEMI PRIMJENE I IZBORA VRSTE UZORKA U vezi primjene uzorka u svakom konkretnom slucaju trebalo bi razmotriti slijedece faktore: znacaj prikupljenih podataka za poslovanje preduzeca, velicinu populacije, raspoloziva sredstva, troskove prikupljanja podataka, vrijeme potrebno za realizaciju istrazivanja, potrebne kadrove i zeljeni stepen pouzdanosti podataka. Nekada se ovi faktori medjusobno iskljucuju. Odlucujuci faktori pri opredjeljenju za potpuno posmatranje ili primjenu uzorka najcesce su raspoloziva sredstva, vrijeme i kadrovi. Nakon odluke o primjeni uzorka u istrazivanju slijedece pitanje na koje treba dati odgovor je izbor vrste uzorka. Za koji cemo se od predstavljenih uzoraka opredijeliti zavisi od:

1) Prethodnog poznavanja strukture i karakteristika osnovnog skupa2) Stepena zeljene pouzdanosti informacija3) Troskova prikupljanja podataka po jedinici ispitivanja4) Neophodnih strucnih kadrova5) Raspolozivog vremena za realizaciju nekog istrazivanja

Prethodno poznavanje strukture i karakteristika osnovnog skupa je veoma vazno za uzorak grupa, stratifikovani, kvotni, ekspertni i snowball uzorak, dok kod jednostavnog slucajnog uzorka to nije neophodno.

Procjena parametra osnovnog skupaKarakteristika koja se izračunava za cijelu populaciju na osnovu podataka koji su rezultat potpunog statistickog posmatranja naziva se parametar populacije. Prametri koji se najcesce koriste su : aritmeticka sredina ( µ) , standardna devijacija ( σ ) i proporicja ( π) . Inferencijalna statistika se bavi procjenjivanjem ili donošenjem sudova o vrijednostima parametara populacije na osnovu statistika izracunatih u uzorku. Kada je rijec o slucajnim uzorcima, nije izvjesno koju ce vrijednost poprimiti procjenitelj uzorka pa kazemo da je statistika uzoraka slucajno promjenljiva. Za razliku od parametara populacije koja predstavlja konstantu , statistika uzoraka je slucajna promjenljiva. Distribucija vjerovatnoce prema kojoj slucajna varijabla poprima svoje vrijednosti naziva se sampling distribucija i predstavlja teorijsku distribuciju vjerovatnoce procjenitelja. Ova distribucija ne formira se nikada u praksi jer je broj uzoraka koji se mogu izabrati iz neke populacije izuzetno veliki. Zbog toga se koriste rezultati teorijske statistike o njihovim oblicima. Poželjno je da procjenitelj ima sl. Osobine nepristrasnost, konzistentnost i najmanja varijansa . O nepristrasnoj procjeni govorimo ako je ocekivana vrijednost procjenitelja jednaka tom pokazatelju osnovnog skupa. Ako sa povecanjem velicine uzorka stand.devijacija procjenitelja tezi nuli kazemo da je on konzistentan. Inferencijalnom statistikom ne mogu se donositi apsolutno precizni zakljucci, mego tek interval u kome, uz vecu ili manju pouzdanost mozemo ocekivati da se nalazi vrijednost parametra. Odstupanja koja cemo dobiti pri procjenjivanju nose zajednicki naziv standardna greska.

Page 6: Skripta Za II Parcijalu Iz Poslovne Statistike

Sampling distribucija aritmetickih sredina Sampling distribuciju aritm.sredina obuhvata 4 etape : 1) iz osnovnog skupa velicine N izvlacimo sve moguce slucajne uzorke velicine n. 2.) za svaki jednostavni slucajan uzorak izracunavamo vrijednost aritmeticke sredine 3) formiramo distribuciju frekvencija aritmetikcih sredina svih slucajnih uzoraka od n elemenata i 4) odredjujemo distribuciju vjerovatnoce aritm.sredina uzorka. Distribucija ima svoju aritmeticku sredinu i standardnu devijaciju. Aritmeticka sredina distribucije sredina uzorka jednaka je omjeru zbira aritmetickih sredina svih uzoraka velicine n i broja uzorak akoji mogu biti izabrani iz

osnovnog skupa:

Distribucija aritmetickih sredina ima i svoju varijanu, odnosno standardnu devijaciju. Varijansa pokazuje u kojoj mjeri aritmeticke sredine uzoraka odstupaju od aritmeticke sredine osnovnog skupa i jednaka je omjeru varijanse osnovnog skupa i velicine uzorka.

Stadnardna devijacija distribucije sredina uzorka predstavlja standardnu gresku procjene aritmeticke sredine osnovnog skupa i jednaka je omjeru varijanse osnovnog skupa ili skraceno standardna greska:

Sampling distribucija aritmetickih sredima ima sljedece osobine :

Aritm.sredina distribucije aritm.sredina uzoraka velicine n koji se mogu izabrati iz jednog osnovnog skupa uvijek je jednaka aritm.sredini tog skupa

Ukoliko je ocekivana vrijednost nekog procjenitelja jednaka parametru osnovnog skupa onda ta statistika uzorka predstavlja nepristrasnu procjenu parametara osnovnog skupa

Za slucajan uzorak velicine n izabran iz osnovnog skupa koji ima karakteristike normalne distribucije, njegova aritm.sredina je slucajna varijabla koja se ravna po normalnoj distribuciji sa ocekivanom vrijednosti µ i standardnom devijacijom σẋ

Prema centralnoj granicnoj teoremi nezavisno od oblika distribucije osnovnog skupa raspored aritmetickih sredina uzoraka bice priblizno normalan ako se izaberu dovoljno veliki slucajni uzorci ( n ≥ 30 ). Dakle ako osnovni skup nije normalno distibuiran, sampling distribucija sredina uzorka ( uz uslov da je n ≥ 30 ) bice vrlo blizu normalnoj distribuciji sa aritmetickom sredinom µ i standardnom devijaciom σẋ

Uzorak manji od 30 jedinica nazivamo malim uzorkom. Ako je mali uzorak izabran iz normalne populacije sa sredinom µi nepoznatom standardnom devijacijom σ ,

Page 7: Skripta Za II Parcijalu Iz Poslovne Statistike

varijabla t je slucajna varijabla koja pripada studentovoj distribuciji.

Procjena aritmetičke sredine osnovnog skupaAritmetička sredina osnovnog skupa pomoću artimetičke sredine iz uzorka može se procjeniti na dva načina. Prvi način predstavlja procjenu jednim brojem ili tačkom, a drugi je intervalna procjena. Aritmetička sredina uzorka predstavlja procjenitelj aritmetičke sredine osnovnog skupa brojem, dok se intervalni procjenitelj oslanja na oblik i karakteristike normalne ili Studentove sampling- distribucije sredina. Kod procjene artimetičke sredine brojem nije moguće zaključivati o nivou pouzdanosti sa kojom se ona može upotrijebiti. Interval pouzdanosti ili povjerenja u kome se procjenjuje vrijednost aritmetičke sredine osnovnog skupa glasi: (formula 179 strana).

Tumačenje intervala pouzdanosti je slijedeće: sa vjerovatnoćom 100 (1-α)% očekujemo da će se između donje i gornje granice naći nepoznata aritmetička sredina osnovnog skupa. Procjena je pouzdanija što je interval širi, odnosno veća je vjerovatnoća da će se u njemu naći aritmetička sredina populacije. S druge strane, uži je interval daje precizniju procjenu, ali će i vjerovatnoća pogrešne procjene biti veća. U slučaju intervalne procjene koeficijent pouzdanosti Zi=Zα/2. Njegova vrijednost se očitava iz tablice. Ova distribucija je simetrična pa je u tablicama navedena površina samo na jednoj strani rasporeda. Površina ispod normalne krive se očitava za polovinu pouzdanosti, a samim time i za polovinu vjerovatnoće greške u procjeni. Kod procjene artimetičke sredine osnovnog skupa izračunavanje standardne greške se razlikuje kod malih i velikih uzoraka. U slučaju kada je frakcija (stopa) izbora mala koristimo formulu 77, a kada je velia koristimo formulu 76. Standardnu devijaciju skupa možemo zamjeniti standardnom devijacijom uzorka ako je on veći od 50 jedinica.interval pouzdanosti ce imati isti oblik ( strana 179) i kada veliki uzorak (n> 30)potiče iz osnovnog skupa sa nepoznatom standardnom devijacijom. U ovom slučaju kod računanja standardne greške koristiće se njena nepristrasna procjena. Formula 81.

Page 8: Skripta Za II Parcijalu Iz Poslovne Statistike

Određivanje veličine uzorkaOptimalan uzorak je onaj uzorak koji uz minimum angažovanja vremena i sredstava obezbjeđuje zadovoljavajuće i dovoljno precizne rezultate. Broj jedinica u uzorku je direktno proporcionalan sa varijansom osnovnog skupa a obrnuto proporcionalan sa varijansom sampling distribucije aritmetičkih sredina uzoraka. Uzorak do 30 jedinica definišemo kao mali uzorak,a preko 30 jedinica kao veliki uzorak. Na veličinu uzorka utiče veličina populacije pa uzimamo da uzorci čija je frakcija izbora manje od 5% predstavljaju male uzorke. Prije nego odredimo veličinu uzorka potrebno je odlučiti se uz koji stepen pouzdanosti želimo donositi zakjučke i koliku smo maksimalnu grešku u procjeni voljni tolerisati. Ako je greška u procjeni izražena u mjernoj jedinici u kojoj e dato obilježje onda se veličina uzorka računa prema izrazu: 84 formula.Ukoliko je prethodna veličina uzorka manje od 5% onda ona predstavlja konačan broj elemenata koje treba izabrati u uzorak. Ako je frakcija izbora veća ili jednaka 5%, onda konačnu veličinu uzorka računamo pomoću 85 formule.U slučajevima kada je greška u procjeni izražena relativno, onda se veličina uzorka računa prema 86 formuli.

Maksimalna greška procjene koju smo voljni tolerisati uz dati koeficijent pouzdanosti iznosi d=zσx, i predstavlja razliku između gornje granice intervala pouzdanosti i aritmetičke sredine osnovnog skupa. Za koji ćemo se od izraza opredjeliti zavisi od toga da li raspolažemo informacijama o disperziji populacije u apsolutnom ili relativnom izrazu.

3.1.3. Procjena totala osnovnog skupaTotal je zbir vrijednosti numeričkog obilježja. Aritmetička sredina osnovnog skupa jednaka je omjeru totala I njegovog obima. Iz toga slijedi da je total osnovnog skupa jednak proizvodu broja elemenata osnovnog skupa I njihove aritmetičke sredine. Međutim kako aritmetička sredina osnovnog skupa, uglavno, nije poznata veličina, nju ćemo zamijeniti aritmetičkom sredinom uzorka I tako dobiti total. Za procjenu totala osnovnog skupa brojem koristimo aritmetičku sredinu uzorka pomnoženu brojem elemenata.Za procjenu totala intervalom potrebna nam je standardna greška totala koja se računa kao proizvod obima skupa I standardne greške procjene aritmetičke sredine.Procjena totala osnovnog skupa svodi se na postupak procjenjivanja aritmetičke sredine osnovnog skupa. Granice interval procjene totala osnovnog skupa izračunavaju se množenjem granica interval procjene aritmetičke sredine skupa sa brojem članova osnovnog skupa N.

3.1.4. Procjena standardne devijacije osnovnog skupaStandardna devijacija predstavlja prosječno odstupanje vrijednosti numeričkih obilježja od njihove aritmetičke sredine. Ona se izražava u mjernim jedinicama obilježja i najvažnija je apsolutna mjera disperzije. Elementi intervala pouzdanosti su: P- oznaka za vjerovatnoću; δδ – standardna greška standardne devijacije; δ – standardna devijacija osnovnog skupa i 1-α – stepen pouzdanosti intervala procjene.

3.1.5. Procjena proporcije osnovnog skupa

Page 9: Skripta Za II Parcijalu Iz Poslovne Statistike

Ukoliko želimo utvrditi kolika je proporcija ispravnih proizvoda u populaciji, moramo podijeliti broj ispravnih proizvoda (M) sa obimom skupa (N): π=M/N, 0≤π≤1.Sampling distribucija za slučajne uzorke veličine n iz beskonačnog skupa ima oblik binomne distribucije. Proporcija uzorka predstavlja procjenu proporcije osnovnog skupa π brojem, a interval procjene proporcije za velike uzorke ima sljedeći oblik: (Tablice ista formula kao 82 samo što je umjesto ẋ ubačeno ṗ). Elementi intervala pouzdanosti su: P – oznaka za vjerovatnoću; ṗ - proporcija uzorka; z - koeficijent pouzdanosti sa kojim procjenjujemo interval pouzdanosti; δṗ - standardna greška procjene proporcije; π – proporcija osnovnog skupa i α – vjerovatnoća greške u procjeni propocije.Sampling distribucija proporcija uzoraka izabranih bez ponavljanja za slučajne uzorke veličine n iz konačnog skupa ima oblik hipergeometrijske distribucije. Sa povećanjem veličine uzorka ova distribucija se približava binomnoj distribuciji, odnosno kakda je uzorak dovoljno velikhipergeometrijska distribucija se aproksimira normalnom distribucijom. Međutim u praksi se događa da primijenjena aproksimacija nije zadovoljavajuća. To je slučaj ako je donja granica intervala pouzdanosti negativna ili a ko je gornja granica jednaka ili veća od 1.Ako je veličina uzorka manja od 5% populacije,, onda ona predstavlja konačan broj elemenata koje treba izabrati u uzorak. Ukoliko je frakcija izbora jednaka ili veća od 5% onda konačnu veličinu uzorka računamo pomoću izraza (Tablice formula 85).

3.2. Testiranje statističkih hipotezaTestiranje statističke hipoteze je naučni metod kojim se donosi odluka o prihvatanju ili neprihvatanju pretpostavke na osnvu slučajnog uzorka. Da bi provjerili istinitost te pretpostavke, neophodno je u slučajno izabranom uzorku iz populacije izračunati vrijednost traženog parametra. Zatim se izračunata vrijednost iz uzorka upoređuje sa pretpostavljenom vrijednosti parametra populacije. Na osnovu tog odstupanja donosimo zaključak: - Pretpostavka se prihvata ako odstupanje nije veliko, odnosno razlika se smatra slučajnom, ili- Pretpostavka se odbacuje ako je razlika prevelika, tj. razlika se ne može smatrati slučajnom.Postušak testiranja hipoteze polazi od nulte i alternativne hipoteze koje su međusobno disjuktivne, što znači, da se prihvatanjem jedne odbacuje druga hipoteza. Kod testiranja hipoteza je prisutan rizik greške, tj mogu se pojavviti dvije vrste grešaka: a) greška I vrste (kad se odbaci istinita nulta hipoteza) i b) greška II vrste (kad se prihvata nulta hipoteza.Testovi se u inferencijalnoj statistici dijele na parametarske i neparametarske. Prvi testovi se odnose na parametre populacije i njihova primjena zavisi od ispunjenosti striktnih pretpostavki o populaciji iz koje se uzima uzorak. Za razliku od parametarskih testova, neparametarski testovi se mogu koristiti i za vrijednost obilježja kvalitativnih varijabli.

FALI DIO OD 198 – 211 ( od 3.2.1 do 3.2.1.4.)

IZRAČUNAVANJE GREŠKE II VRSTE I SNAGA TESTAKod testiranja hipoteze mogu da nastanu dvije vrste grešaka: greška I vrste α i greška II vrste

Page 10: Skripta Za II Parcijalu Iz Poslovne Statistike

β.Prilikom,odlučivanja možemo napraviti samo jednu grešku,pa nastojimo da odredimo vjerovatnoće njihovog javljanja i da ih po mogućnosti smanjimo.

Grešku II vrste pravimo ako prihvatimo lažnu H0 kao moguću.Međutim,veličina rizika β može se izračunati samo u slučaju kada je poznata stvarna vrijednost testiranog parametra osnovnog skupa.

Na rizik greške II vrste β utiči slijedeći faktori: nivo značajnosti testa α,stvarna vrijednost posmatranog parametra populacije,oblik testa i veličina uzorka.

Za istu veličinu uzorka,sa porastom rizika α smanjuje se rizik greške β,i obratno.I jedan i drugi rizik pri testiranju ovise o širini intervala prihvatanja H0.Ako je interval uži,veća je vjerovatnoća da ćemo napraviti grešku I vrste,a manja da ćemo napraviti grešku II vrste.Samo primjena velikih uzoraka omogućava nam da smanjimo vjerovatnoću nastajanja jedne greške a da istovremeno ne povećamo vjerovatnoću druge greške.

Rizik greške II vrste određen je stvarnom vrijednosi testiranog parametra (µ1).Ako je stvarna vrijednost testiranog parametra bliža hipotetičkoj vrijednosti µ0,veća je i mogućnost da prihvatimo lažnu H0 i obrnuto.Veličina greške II vrste izračunava se kao dio površine pod sampling distribucijom sa alternativnom sredinom µ1,koji se nalazi u području prihvatanja H0.Za vjerovatnoću odbacivanja lažne H0 koristi se naziv snaga testa S,koja se računa prema izrazu:

S=1- β

Kako se razlika između alternativne i pretpostavljene vrijednosti testiranog parametra povećava,tako snaga testa raste.Snaga testa se ogleda u vjerovatnoći izbjegavanja rizika β.Rizik β određen je i oblikom izabranog testa.Za istu veličinu uzorka nivo značajnosti,jednosmjerni test sa većom vjerovatnoćom odbacuje lažnu H0 od dvosmjernog testa.Ako se ne uzima u obzir greška II vrste,onda će se pri određivanju veličine uzorka upotrebljavati isti izrazi koje smo koristili kod procjene aritmetičke sredine.Pored navedenih faktora na grešku II vrste utiče i veličina uzorka.U vezi s tim,potrebno je odrediti najmanju veličinu uzorka sa kojom zadržavamo veličinu greške I i II vrste na željenim nivoima.

TESTIRANJE HIPOTEZE O JEDNAKOSTI ARITMETIČKIH SREDINA DVA SKUPAU društvenim istraživanjima često se vrši uspoređivanje dvije aritmetičke sredine i testiranje jednakosti među njima.Npr. testiramo hipotezu da su domaći i uvozni proizvodi jednakog kvaliteta.

Predmet testiranja je razlika D= µ1- µ2 .Može se dokazati da razlike aritmetičkih sredina uzoraka imaju normalan raspored pri čemu je aritmetička sredina svih razlika jednaka razlici aritmetičkih sredina osnovnih skupova iz kojih su uzorci izabrani.

Testiranjem hipoteze mi želimo da ispitamo da li je razlika između aritmetičkih sredina dva osnovna skupa slučajna ili statistički značajna.Iz predhodnih izlaganja je poznato da

Page 11: Skripta Za II Parcijalu Iz Poslovne Statistike

postojanje statistički značajne razlike znači da razlika koja je nađena nije slučajna,već da ona vrlo vjerojatno postoji između stvarne i pretpostavljene vrijednosti parametra.

Ako želimo da testiramo hipotezu da je aritmetička sredina jednog osnovnog skupa jednaka aritmetičkoj sredini nekog drugog skupa,postavit ćemo slijedeće hipoteze:

H0: µ1=µ2 ili što je isto H0 : µ1-µ2=0

H1: µ1≠µ2 ili što je isto H1: µ1-µ2≠0

U ovom slučaju radi se o dvosmjernom testu hipoteze o razlici aritmetičkih sredina dvaju osnovnih skupova pomoću velikih nezavisnih uzoraka,izabranih iz normalno raspoređenih osnovnih skupova sa poznatim varijansama.

Sampling distribucija razlike aritmetičkih sredina uzoraka izabranih iz prvog i drugog osnovnog skupa ima približno oblik normalne raspodjele sa aritmetičkom sredinom µ1-µ2=0 i tandardnom greškom:FORMULA 99

Pod predpostavkom da su varijanse osnovnih skupova jednake,standardna greška se može računati i pomoću izraza:isto kao gore samo što je pod korjenom 1/n1 + 1/n2Poznato nam je da standardna devijacija skupa najčešće nije poznata pa se zamjenjuje procjenom iz uzorka pa je u tom slučaju standardna greška jednaka : formula 101

Značajnost neke razlike možemo provjeriti pomoću kritičnih granica ili upotrebom odgovarajućeg testa.Testiranje razlike između aritmetičkih sredina takođe možemo provesti na 2 načina. Kod određivanja kritičnih granica polazna tačka je nula a to je rezultat pretpostavke da nema razlike između aritmetičkih sredina dva osnovna skupa.Nulta hipoteza se odbacuje ako se razlika između aritmetičkih sredina uzoraka nalazi izvan kritičnih granica,onda se H0 prihvata kao moguća.

Drugi način testiranja značajnosti razlike između aritm. Sredina sastoji se u tome da izmjerimo razliku između aritmetičkih sredina uzoraka jedinicama standardnih grešaka procjena između aritmetičkih sredina FORMULA 107

Odluka o prihvatanju ili odbacivanju H0 donosi se poređenjem realizovane testovne veličine z sa teorijskom vrednošću koeficijenta značajnosti.ako je apsolutna testovna veličina |z| manja od tablične vrijednosti za Zα/Zr H0 se prihvata i obratno.

Kada se osnovni skupovi baziraju na studentovoj distribuciji kao sampling distribucije razlike sredina koristi se t test Formula 107 samo umjesto z uvrštavamo t.

Uslovi za primjenu ovog testa je da su osnovni skupovi normalno raspoređeni i da su nepoznate varijanse međusobno jednake.

Page 12: Skripta Za II Parcijalu Iz Poslovne Statistike

Pored testiranja hipoteze kojom ispitujemo jednakost aritmetičkih sredina dva skupa možemo provjeravati i pretpostavku u kojem skupu je vrijednost posmatranog parametra veća ili manjaH0 : µ1≤µ2 H1: µ1>µ2H0 : µ1≥µ2 H1: µ1<µ2

Ako se vrijednosti iz uzorka dobivaju ponovnim mjerenjem određenog obilježja na istim jedinicama izabranim u uzorak u različitim vremenskim trenucima onda kažemo da su uzorci zavisni.Rezultati su međusobno povezani,jer se mjerenje odnosi na iste jedinice u različitim periodima,odnosno nakon provedenog experimenta.

3.2.1.6.TESTIRANJE HIPOTEZE JEDNAKOSTI ARITMETICKIH SREDINA VISE ONOSNIH SKUPOVA

Analiza varijanse je statisticki metod koji koristimo kada zelimo da istovremeno ispitamo jednakost aritmetickih sredina vise skupova.U opstem slucaju u jednofaktorskoj analizi varijanse nultu I alternativnu hipotezu postavljamo na sljedeci nacin

Ho mi1=mi2=….=mik=mi

H1 aritmeticke sredine barem dva skupova se medju sobom razlikuju.Analiza varijanse sastoji se u tome da varijabilitet svih dobivenih rezultata rasclani na dijelove od kojih je sastavljen –na varijabilitet koji nastaje unutar svake pojedine grupe rezultata I na varijabilitet izmedju pojedinih grupa. Ako je varijabilitet izmedju grupa statisticki znacajno veci od varijabiliteta unutar grupa onda se moze zakljuciti da se radi o grupama koje su medjusobno razlicite tj,da ne pripadaju istoj ili razlicitim populacijama sa jednakom aritmetickom sredinom Suprotno, ako varijabilitet izmedju grupa nije znacajno veci od varijabiliteta unutar grupa, onda su njihove razlike samo slucajne, pa kazemo da sve grupe poticu iz iste maticne populacije.Prema tome, odstupanje nekog rezultata u masi drugih rezultata I drugih grupa od njihove zajednicke arithmeticke sredine mozemo podijeliti na dvije komponente:

1. Odstupanje tog rezultata od aritmeticke sredine grupe, kojoj taj rezultat pripada2. Odstupanje aritmeticke sredine kojoj pripada taj rezultat od zajednicke aritmeticke

sredine

Da bi smo testirali odnos izmedju dvije varijanse, potrebno je da vidimo koji teorijiski raspored ima statistika F. Ako posmatrani osnovni skupovi imaju normalan raspored tad ace omjer dvije nezavisne procjene varijanse imati SNEDECOROV F RASPORED. Ovaj raspored se ubraja u grupu neprekidnih teorijskih rasporeda I asimetrican je udesno. Ni jedan F omjer ne moze biti manji od nule, dok neki eksremni mogu biti vrlo visoki .

Pomocu SNEDECOROVIH F tablica mozemo utrditi koliko najmanje puta mora varijabilitet izmedju grupa biti veci od varijabiliteta unutar grupa da bi razlika bila zanacajna. F tablica se koristi tako da se stepeni slobode brojnika odredjuju u zaglavlju tablice a stepeni slobode nazivnika u pretkoloni. Na mjestu ukrstanja uz odredjen nivo znacajnosti mozemo procitati tablicnu vrijednost za F. Ako je izracunata F velicina manja od tablicne, onda se razlike

Page 13: Skripta Za II Parcijalu Iz Poslovne Statistike

izmedju dviju procjena varijanse mogu pripisati slucaju. U tom slucaj uprihvatamo Ho da ne postoji statisticki znacajna razlika izmedju aritmetickih sredina k osnovnih skupova.

Ako je F velicina veca od tablicne onda se razlike izmedju dvije procjne varijanse ne mogu pripisati slucaju . razlika se moze javitikao posljedica aritmetickih sredina ili razlika medju varijansama. Kako se pretpostavlja das u varijanse osnovnih skupova jednake, onda se razlika medju varijansama javlja kao posljedica razlicitih aritmetickih sredina. Tada se prihvata ALTERNATIVNA hipoteza po kojoj se aritmeticke sredine barem dva skupa medjusobno razlikuju. U slucaju kada odbacimo Ho cesto nas moze interesovati koji se uzroci medjusobno statisticki znacajno razlikuju. Na osnovu testiranja, jedino u sto mozemo biti sigurni je samo to da se barem dva uzroka medjusobno statisticki razlikuju I najvjerovatnije je das u to uzorak sa najvecom I uzorak sa najmanjom aritmetickoj sredinom.

3.2.2 TESTIRANJE HIPOTEZE O PROPORCIJI OSNOVNOG SKUPA SA VELIKIM UZORKOMKod testiranja hipoteze o nepoznatoj proporciji osnovnog skupa sampling distribucija se moze aproksimirati normalnom distribucijom samo u situacijama kada se radi o velikom uzorku. Kada se testiranja obavlja pomocu malih uzoraka,onda se hipoteza o proporciji populacije provodi upotrebom njene nepristrasne procjene, koja ima binomni raspored I hipergeometrijski raspored kod uzorka bez ponavljanja.

3.2.2.1 TESTIRANJE HIPOTEZE DA JE PROPORCIJA OSNOVNOG SKUPA JEDNAKA NEKOJ PRETPOSTAVLJENOJ PROPORCIJIPostupak testiranja hipoteze o nepoznatoj proporciji osnovnog skupa provodimo u nekoliko koraka: a) odredjivanje nulte I alternativne hipoteze, b) izbor izraza za testovnu velicinu I izracunavanje njegove vrijednosti,c)odabir nivoa znacajnosti testa, d) odredjivanje kriticnih granica I donosenja odluke o odbacivanju ili neodbacivanju nulte hipoteze.

Ho: π=πo ili Ho:π-πo=0 i

H1: π≠πo ili H1: π-πo≠0

Ovako formulisanom nultom hipotezom tvrdi se da je priporcija populacije π jednaka nekoj pretpostavljenoj vrijednosti πo. Alternativnom hipotezom izrazava se tvrdnja koju postupkom testiranja nastojimo da potvrdimo pa se ona naziva ISTRAZIVACKOM HIPOTEZOM.

NULTA HIPOTEZA JE prosta,jer se njome tvrdi da se proporcija populacije jednaka tacno jednoj numerickoj vrijednosti, dok je alternativna hipoteza slozena,jer je za ovu tvrdnju smijer odstupanja nije odredjen. Dakle radi se o dvosmijernom testiranju razlike jer je moguca odstupanja p od π pratimo u oba smijera.

Koristimo li proporciju uzorka kao testovnu velicinu onda se odluka donosi pomocu kriticnih granica koja se za dvosmijerni test racuna :

C1=πo-zα|2σp, C2=πo+zα|2σp

Page 14: Skripta Za II Parcijalu Iz Poslovne Statistike

3.2.2.2TESTIRANJE HIPOTEZE O PROPORCIJI OSNOVNOG SKUPA POMOCU VELIKOG UZORKAPostupak jednosmijernog testiranja hipoteze o nepoznatoj proporciji osnovnog skupa ne razlikuje se od istovjetnog postupka kod pretpostavljene aritmeticke sredine,koji se provodi na velikom uzorku. Razlika postoji kod opisanih izmjena u oznakama. U praksi se cesce testira istrazivacka hipoteza da je proporcija osnovnog skupa manja ili veca od pretpostavljene. Na primjer, ako zelimo da testiramo hipotezu da je proporcija osnovnog skupa manja od neke pretpostavljene numericke vrijednosti onda hipoteza glasi:

Ho: π≥πo ili Ho: π-πo≥0

H1: π≤πo ili H1: π-πo≤0

Nultom hipotezom tvrdimo da proporcija osnovnog skupa prelazi ili je jednaka pretpostavljenoj vrijednosti a alternativnom hipotezom suprotno.

Testiranje hipoteze o jednakosti proporcija dva osnovna skupa – provodimo analogno kao test hipoteze da su aritmetičke sredine dvaju osnovnih skupova međusobno jednake. Predmet testiranja je razlika D=π1-π2. Može se dokazati da razlike proporcija velikih uzoraka možemo aproksimirati normalnim rasporedom: (π1-π2):N(µpٛ1-pٛ2, σ2 pٛ1-pٛ2), pri čemu je aritmetička sredina razlika proporcija svih uzoraka jednaka razlici proporcija osnovnih skupova iz kojih su uzorci izabrani. Ako želimo da testiramo hipotezu da je proporcija jednog osnovnog skupa jednaka proporciji nekog drugog skupa, postavit ćemo sljedeće hipoteze:

H0: π1=π2 ili H0: π1-π2 = 0 i

H1: π1≠π2 ili H1: π1-π2 ≠ 0

U ovom slučaju radi se o dvosmjernom testu hipoteze o jednakosti proporcija dvaju osnovnih skupova pomoću velikih nezavisnih uzoraka izabranih iz normalno raspoređenih osnovnih skupova, pri čemu vjerovatnoće „uspjeha“ ostaju konstantne pri izboru elemenata u uzorke.

Prilikom određivanja kritičkih granica polazna tačka je nula, što je rezultat pretpostavke da nema razlike između proporcija dva osnovna skupa. Za veliki uzrok intervala prihvatanja određuje se prema izrazu:

0±z σpٛ1-pٛ2

Nulta hipoteza se prihvata kao moguća ako se razlika između proporcija uzorka nalazi između kritičnih granica. Međutim, ako se razlika između proporcija nalazi izvan kritičkih granica, onda se H0 odbacuje.

Standardnu grešku koja je potrebna za formiranje intervala prihvatanja H0 dobit ćemo ako u izraz kao varijansu prvog uzorka uvrstimo p ٛ1qٛ1, a kao varijansu drugog uzora p ٛ2qٛ2 : formula br. 105.

Page 15: Skripta Za II Parcijalu Iz Poslovne Statistike

Pod uslovom da je H0 tačna, uzorke iz dva skupa možemo da posmatramo kao uzorke koji potiču iz istog osnovnog skupa, tj.možemo da ih posmatramo kao jedan veći uzorak: druga formula 106.

tako da standardnu grešku možemo računati prema izrazu:

prva formula 106.

Prema tome, statistika z testa glasi:

pٛ1-p ٛ2

z= ──────────

√p ٛ qٛ (1/n1 + 1/n2 )

Ako je apsolutna testovna veličina |z| manja od tablične vrijednosti za zɑ/2 , H0 se prihvata i obratno. Pored testiranja hipoteze kojom ispitujemo jednakost proporcija dva skupa, možemo provjeravati pretpostavku u kojem skupu je vrijednost posmatranog parametra veća ili manja:

H0: π1≤π2 H1: π1>π2

H0: π1≥π2 H1: π1<π2

Postupak odlučivanja kod jednosmjernog testa, takođe, provodi se pomoću z-testa, kritičkih granica i empirijskog nivoa značajnosti.

Odabrani neparametarski testovi

Svi objašnjeni postupci statističkog zaključivanja pomoću uzorka zasnovani su na određenim teorijskim pretpostavkama. Te pretpostavke se odnose na oblik rasporeda osnovnog skupa poznatih opštih karakteristika. Metodi kojima se testiraju hipoteze ili vrše procjene nepoznatih parametara skupa, uz pretpostavku da je raspored skupa iz kojeg se uzima uzorak normalan i homogen, nazivaju se parametarski ili klasični metodi.

Parametarski testovi su velikim dijelom nastali u prvim decenijama prošlog stoljeća, kada je preovladavalo mišljenje da skoro sve pojave u prirodi i društvu slijede normalnu distribuciju. Međutim, ovi testovi se ne mogu primjeniti u slučajevima kada uzorak potiče iz populacije koja nema normalan raspored ili za koju oblik rasporeda nije poznat, kao i kada su podaci mjereni na normalnoj ili ordinalnoj skali. Interno teorijsko stajalište s početka prošlog stoljeća nije moglo suviše dugo potrajati, pa se javlja veliki broj radova na ovu temu, koji je rezultirao kreiranjem testova nezavisnih od pretpostavki o normalnosti skupa. Dio statističke teorije koji oni formiraju predstavljaju neparametarsku statistiku, dok za testove koristimo naziv neparametarski testovi ili testovi nezavisni od rasporeda. Ovi testovi, najčešće, zahtijevaju ispunjenje samo jedne pretpostavke, da populacija iz koje se uzima uzorak ima neprekidan raspored. Za neki test kažemo da je neparametarski ako se može primjeniti na intervalnoj ili omjernij skali a da se pri tome ne specifikuje raspored skupa, tj.da se može primjeniti na

Page 16: Skripta Za II Parcijalu Iz Poslovne Statistike

nominalnoj ili ordinalnoj mjernoj skali. Testovi nezavisni od rasporeda se odnose na jedan, dva ili više skupova i imaju raznovrsnu primjenu: koriste se za testiranje hipoteze da osnovni skup ima određeni raspored (normalni, binomni, uniformni i dr.); kod testova koji se ne odnose samo na parametre skupa; za analizu varijanse jednog faktora varijabiliteta sa rangiraim podacima; za donošenje zaključaka o lokaciji skupa; za testiranje značajnosti razlike proporcija tri i više osnovnih skupova za testiranje hipoteze o jednakosti oblika dviju distribucija pomoću dva nezavisna uzorka i dr. Najznačajnije prednosti neparametarskih testova su:

Nezavisnos od rasporeda osnovnog skupa. Ovi testovi imaju veću rezintentnost (manje su osjetljivi) od parametarskih testova.

Mogu se primjeniti na podatke koji su na nivou nominalne skale, dok za takve podatke ne postoje odgovarajući parametarki testovi.

Pomoću njih moguće je istraživati podatke date samo u rangovima. U ekonomskim i društvenim istraživanjima to je velika prednost, jer se veliki broj varijabli može mjeriti samo do ordinalne mjerne skale.

Omogućavaju istraživanja statističkih problema koji se ne odnose na paramete populacije, kao što su testovi saglasnosti empirijskog rasporeda teorijskom rasporedu, tesovi za ispitivanje slučajnosti uzorka i dr.

Područje njihove upotrebe jer se zasnivaju na manjem broju pretpostavki, najčešće ispunjenim u praktičkim istraživanjima.

Neparametarski testovi pokazuju i određene nedostatke u odnosu na parametarske testove.

Ako se primjene na podatke u slučaju kada su ispunjene pretpostavke za primjenu parametarskog testa, tada oni rasipaju informaciju uzorka.

Ukoliko nije dostupna odgovarajuća aproksimacija, kod velikih uzoraka većina neparametarskih testova zahtijeva znatno dužu obradu podataka od parametarskih (zbog transformacije u rangove).

U praksi su istraživačima mnogo dostupniji statistički softveri koji uključuju parametarske testove u odnosu na neparametarske.

Treba napomenuti da, za razliku od parametarskih testova koji koriste aritmetičku sredinu, neparametarski testovi za srednju vrijednost koriste medijan.

Testiranje hipoteze bazirane na jednom uzorku

Hi kvadrat test oblika rasporeda

Hi kvadrat test je vrlo praktičan test, koji se koristi kada trebamo donijeti odluku da li neke opažene (empirijske, stvarne) frekvencije značajno odstupaju od očekivanih (teorijskih) frekvencija, kao i u nekim drugim statističkim postupcima. Označava se malim grčkim slovom hi (χ2) , i računa kao zbir odnosa kvadrata razlika između opaženih i očekivanih frekvencija prema očekivanim frekvencijama. – formula br.114 ( umjesto mi je ƒi .. i umjesto ei je ƒ*i ) .

Gdje je ƒi opažena, a ƒ*i očekivana frekvencija, a k broj grupa frekvencija.

Page 17: Skripta Za II Parcijalu Iz Poslovne Statistike

Hi kvadrat raspored je pozitivno asimetričan raspored i zavisi samo od broja stepeni slobode. Aritmetička sredina rasporeda jednaka je broju stepeni slobode, a varijansa dvostrukoj vrijednosti tog broja. Shodno tome, nultu hipotezu sigurno možemo prihvatiti ako je testovna vrijednost hi kvadrata jednaka ili manja broju stepeni slobode. Za određivanje broja stepeni

slobode koristi se izraz: v= k-g-1 pri čemu k predstavlja broj posmatranih modaliteta, a g broj parametara koji se mora procijeniti da bi se izračunale očekivane frekvencije. Odluka se donosi poređenjem testovne (empirijske) veličine sa odgovarajućom tabličnom (kritičnom) vrijednošću hi kvadrat statistike. Nulta hipoteza se prihvaća ako je testovna vrijednost jednaka ili manja od tablične, odnosno odbacit ćemo je kao neistinitu ako je testovna vrijednost veća od tablične. Postavlja se uslov upotrebe velikog uzorka, te da sve očekvane frekvencije moraju biti jednake ili veće od 5. U slučajevima kada su očekivane frekvencije manje od onih koje propisuje primjenjeno pravilo, pristupa se spajanju susjednih grupa. Za svaku izgubljenu grupu (modalitet) smanjuje se jedan stepen slobode. Test oblika rasporeda treba da pokaže da li se stvarni raspored uzorka razlikuje od očekivanog. Na osnovu pretpostavljene distribucije skupa računaju se očekivane frekvencije, koje se upoređuju sa opaženim frekvencijama. Nulta hipoteza se prihvaća ako je testovna vrijednost hi kvadrata jednaka ili manja od tablične, a odbacuje kada je testovna vrijednost veća od tablične.

Kolmogorov – Smirnov test Za testiranje oblika funkcije distribucije kontinuirane varijable koristi se test Kolmogorov-Smirnov. Ako funkcija distribucije skupa nije poznata, nultom hipotezom se pretpostavlja da ima odgovarajući oblik. Razlike između vrijednosti empirijske funkcije distribucije i pretpostavljene funkcije distribucije nisu značajne kada je nulta hipoteza tačna, i obrnuto. Zbog toga najveća apsolutna razlika vrijednosti empirijske i teorijske funkcije distribucije predstavlja testovnu vrijednost. Preliminarna test vrijednost jednaka je najvećoj apsolutnoj razlici empirijske i teorijske funkcije distribucije.

D1=sup|F ٛ0 (x) – F0 (x)|.

S obzirom na to da najveća razlika funkcija distribucije ne mora biti u vezi s bilo kojom opaženom vrijednosti posmatrane varijable, to najveća izračunata razlika D ne mora biti najveća izračunata apsolutna razlika funkcija distribucije. Zbog toga se računa i pomoćna test vrijednost:

D2=sup|F ٛ0 (xi-1) – F0 (xi)|, F ٛ0 (x0)=0

Konačna test vrijednost je veća razlika, odnosno D=max§{D1,D2}. Odluka se donosi poređenjem testovne vrijednosti D s odgovarajućom kritičnom vrijednosti kvantila Kolmogorov-Smirnov sampling distribucije. Kritične vrijednosti se obično utvrđuju računarskim programom. Ako je testovna vrijednost manja od kritične, uz određeni nivo značajnosti, nulta hipoteza se ne odbacuje. Kolmogorov-Smirnov test je baziran na definisanom obliku funkcije distribucije s poznatim parametrima. Test se ne može primjeniti u izvornom obliku ako parametri nisu poznati.

Test predznaka-jedan uzorak – se ubraja u neparametarske testove, jer njegova primjena nije uslovljena oblikom rasporeda skupa. Naziv je dobio po tome što se podaci radi statističke

Page 18: Skripta Za II Parcijalu Iz Poslovne Statistike

analize pretvaraju u nizove znakova plus i minus. Pretpostavke za primjenu testa su: da je u slučajnom uzorku posmatrana varijabla kontinuirana i da su podaci dostupni barem u nivou skale ranga. Za male uzorke odluka se donosi na osnovu binomnog rasporeda vjerovatnoće, dok se kod velikih uzoraka koristi normalna raspodjela, gdje je osnova za donošenje odluke slučajna promjenljiva Z (empirijski z omjer). Da ne bi bilo nesporazuma zbog korištenja z omjera, treba istaknuti da neparametarski testovi nisu uslovljeni oblikom rasporeda skupa, ali jesu oblikom očekivane varijacije i rasporeda uzoraka.

Kod dvosmjernog testa nulta hipoteza se odbacuje ako je vjerovatnoća pojavljivanja c i manje predznaka u uzorku jednaka ili manja od ɑ/2. Kod jednosmjernog testa na gornju granicu H0 se odbacuje ako je vjerovatnoća pojavljivanja c i manje negativnih predznaka u uzorku jednaka ili manja od ɑ. Kod jednosmjernog testa na donju granicu nulta hipoteza se ne prihvata ako je vjerovatnoća pojavljivanja c i manje pozitivnih predznaka u uzorku jednaka ili manja od ɑ.

Wilcoxonov test ranga sa predznakomTest koji se najčešće koristi kod donošenja zaključaka o lokaciji skupa na osnovu posmatranja jednog uzorka jeste Wilcoxonov test ranga sa predznakom. Da bismo mogli provesti ovaj test potrebno je da pored neprekidnosti rasporeda osnovnog skupa,raspored bude simetričan i da raspolažemo podacima barem u nivou intervalne skale.

Prvi korak se svodi na izračunavanje razlika između vrijednosti obilježja jedinica uzorka i predpostavljene vrijednosti medijane.Iz daljeg postupka se isključuje svaki podatak kome je razlika jednaka nuli,a uzorak se smanjuje za broj razlika jednakih nuli.Zatim se apsolutne vrijednosti razlika rangiraju.Pri tome se najmanjoj apsolutnoj vrijednosti razlike pridružuje jedan,slijedećoj po veličini 2 i tako redom sve do najveće razlike kojoj pridružujemo n. Kod modaliteta iste veličine se dodjeljuje rang koji predstavlja aritmetičku sredinu njihovih redoslijednih rangova. U daljem postupku svakom rangu pridružujemo + ako je pripadajuća razlika veća od nule,odnosno predznak – ako je pripadajuća razlika manja od nule. Test veličina je zbir rangova sa pozitivnim predznakom W+ ili zbir rangova sa negativnim predznakom W-. Ukupan zbir rangova sa pozitivnim i negativnim predznakom jednak je ½ n(n+1) . Odluka se donosi poređenjem testovne i teorijske vrijednosti. Ako je nulta hipoteza tačna,onda očekujemo približno jednak broj pozitivnih i negativnih razlika,a kada H0 nije tačna onda očujemo znatno veći broj pozitivnih ili negativnih razlika.

Testiranje hipoteze na dva uzorkaHi kvadrat nezavisnosti dva obilježja – uzorci nezavisniOvim testom se provjerava hipoteza o nezavisnosti obilježja u dvodimenzionalnoj tabeli kontigencije.Elemente osnovnog skupa možemo istovremeno grupisati prema modalitetima obilježja A i obilježja B,čime se dobiva dvodimenzionalni raspored koji se predstavlja u tabeli kontingencije reda r x k . Kod ovog testa očekivane frekvencije se računaju kao omjer proizvoda marginalnih frekvencija i veličine uzorka tj. Računaju se prema izrazu

Page 19: Skripta Za II Parcijalu Iz Poslovne Statistike

Fij = fi. – f.j

NOdluka se donosi poređenjem testovne vrijednosti sa tabličnom vrijednošću hi kvadrat distribucije. Uslovi koji moraju biti ispunjeni za primjenu hi kvadrat testa su : test se može računati samo sa frekvencijama; jasno i precizno određivanje sadržaja nulte hipoteze; zbir očekivanih frekvencija mora biti jednak zbiru originalnih frekvencija; očekivane frekvencije ne smiju biti previše male ; frekvencije u pojedinim poljima moraju biti nezavisne ; test se može koristiti samo za utvrđivanje vjerovatnoće,ali ne i visine povezanosti dvije varijable te neophodno je provesti Yatesovu korekciju kada prilikom testiranja imamo samo jedan stepen slobode. Yatesova korekcija se sastoji u tome da se za 0,5 mjernih jedinica smanji svaka opažena frekvencija,koja je veća od teorijske i obratno.

Još jedna praktična strana hi kvadrat testa ogleda se u tome da posjeduje aditivna svojstva.To znači da možemo sabrati n vrijednosti hi kvadrata iz istih istraživanja,a zatim zaključivati na osnovu tog zbira, s tim da saberemo i njihove stepene slobode.Upotreba ovog svojstva omogućava da rezultati testiranja postanu razumljiviji.

Wilcoxon-Mann-Whitneyev test – uzorci nezavisni

Ovaj test je uveo Frank Wilcoxon, te je prvobitni naziv bio Wilcoxonov test sume rangova. Mann i Whitney su dvije godine kasnije formulisali U test, ekvivalentan Wilcoxonovom testu sume rangova. U praksi se često prikupljaju podaci koji značajno odstupaju od normalnog rasporeda ili su dati deskriptivno ali se mogu rangirati. Kada imamo dva uzorka koji su međusobno nezavisni odluka se svodi na izbor između testa sume rangova i t testa. Za uzorke kažemo da su nezavisni ako slučajno izabrani elementi jednog uzorka ne zavise od elemenata drugog uzorka, a unutar svakog uzorka pojedinačno elementi su međusobno nezavisni. Ako su podaci iz skupa koji nema normalan raspored odabraćemo test sume rangova, i obrnuto. U slučaju da jedan od skupova nema normalan raspored nema potrebe da analiziramo drugi uzorak. Test sume rangova koristimo da utvrdimo da li dva jednaka rasporeda (simetrična ili asimetrična) imaju jednaku medijanu. Test sume rangova se koristi kada posmatramo dva nezavisna slučajna uzorka sa neprekidnom varijablom koja se mjeri bar na ordinalnoj mjernoj skali. Neophodno je da se ispune 4 pretpostavke: dva slučajna uzorka, međusobno nezavisni uzorci, neprekidna varijabla i mjerenje barem na ordinalnoj skali. Primjenjuje se dakle kada nisu ispunjene pretpostavke t-testa, i kada se upoređuju aritmetičke sredine dva simetrična skupa na osnovu malih nezavisnih uzoraka. Široku primjenu testa omogućava transformacija empirijskih podataka u rangove. Najbolju procjenu značajnosti obezbjeđuju neprekidne vrijednosti. Ovaj test se bazira na pretpostavci da su nezavisni uzorci izabrani iz istog osnovnog skupa ili osnovnih skupova jednakih kako po obliku rasporeda(simetričan, asimetričan) tako i po vrijednosti medijana. Na odbacivanje hipoteze o jednakim medijanama oba skupa upućuju slučajevi kada se u jednom od uzoraka javljaju ekstremne (veće ili manje ) vrijednosti. Tada se može pretpostaviti da je kod tog uzorka medijana pomjerena udesno ili ulijevo. Osnovna karakteristika testa sume rangova je formiranje niza empirijskih podataka oba nezavisna uzorka zajedno. Rangirana transformacija ima rastući karakter. Najmanji

Page 20: Skripta Za II Parcijalu Iz Poslovne Statistike

rezultat dobija rang 1, sljedeći po veličini dobija rang 2, pa sve do najvećeg rezultata koji dobija rang n. Jedinice koje imaju isti rezultat, dobivaju jednaki rang, koji se izračunava tako što se saberu rangovi koje bi oni zauzimali i zbir podijeli s brojem tih rangova. Statistika testa jednaka je zbiru rangova u manjem uzorku, a ukoliko uzorci imaju jednak broj elemenata onda je svejedno koji ćemo uzorak izabrati za izračunavanje statistike testa. U zavisnosti od veličine uzorka razlikujemo dva postupka razlikujemo 2 postupka određivanja kritičnih granica. 1. Slučaj – kada su oba uzorka manja od 11 onda koristimo tablicu radi određivanja kritičnih granica. Ona se čita na osnovu veličine uzorka. Da bi dobro rangirali podatke možemo provjeriti pomoću izraza: Wa + Wb = n(n+1)/2, prema kojem je zbir suma rangova oba uzorka jednak zbiru uzastopnih n prirodnih brojeva. U drugom slučaju- kada su oba uzorka veća od 10 računa se testovna z veličina. Primjena z testa je opravdanija što su uzorci veći, jer se raspodjela vrijednosti sume rangova bolje aproksimira normalnom raspodjelom.

Hi kvadrat test nezavisnosti dva obilježja – uzorci zavisni

Kada radimo sa zavisnim uzorcima postupak testiranja je nešto drugačiji nego kada testiranje provodimo na jednom uzorku. Naime, kod zavisnih uzoraka vršimo mjerenje 2 puta na istim elementima (prije/poslije) ili radimo sa dvije grupe elemenata u kojima svaki element jedne grupe ima svoj par u drugoj grupi. Primjer: Slučajan uzorak izabran iz skupa kandidata za upis u I godinu studija na Univerzitetu u Tuzli za akademsku 2011/12. Godinu dao je sljedeći rezultat:

uspjeh u srednjoj školi

Uspjeh na kvalifikacionom ispitu

odličanvrlo dobar dobar

odličan 238 99 62vrlo dobar 84 105 86dobar 33 48 81

Uz nivo značajnosti od 0,05 ispitati da li je uspjeh kandidata na kvalifikacionom ispitu za upis na fakultet nezavisan od njihovog uspjeha u srednjoj školi. Na osnovu pretpostavki u zadatku možemo konstatovati da su uzorci zavisni, jer je mjerenje rezultata izvršeno nad istim kandidatima. Dakle, radi se o testu nezavisnosti modaliteta dva obilježja – dva zavisna uzorka. Nulta i alternativna hipoteza glase: H0 : Uspjeh kandidata u srednjoj školi i na kvalifikacionom ispitu su nezavisni. H1: Uspjeh kandidata u srednjoj školi i na kvalifikacionom ispitu su zavisni. U nastavku računamo teorijske frekvencije i provodimo testiranje po već objašnjenoj proceduri. Teorijske frekvencije se računaju kao omjer između proizvoda elemenata zbirnog reda i kolone (koji se ukrštavaju u ćeliji datog elementa) i ukupnog broja elemenata. Ove frekvencije su prikazane u drugoj koloni radne tabele.

Page 21: Skripta Za II Parcijalu Iz Poslovne Statistike

Tablična vrijednost se određuje uz v=(k-1)(r-1) stepen slobode, i rizik greške od 0,05. U našem primjeru v=(3-1)(3-

1)=4 stepena slobode, pa tablična vrijednost iznosi

=9,488. Empirijski hi kvadrat (117,45) je veći od tablične

vrijednosti (9,488) i pada u područje odbacivanja nulte hipoteze. Dakle, uz nivo značajnosti prihvata se alternativna hipoteza, po kojoj su posmatrana obilježja zavisna, odnosno da su uspjeh kandidata u srednjoj školi i na kvalifikacionom ispitu zavisni.

Vrijednost koeficijenta kontringencije iznosi:

C= = 0,351, pri čemu je = = 0,816. Izračunata vrijednost koeficijenta C

pokazuje da između posmatranih modaliteta dva obilježja postoji slaganje srednje jačine.

Mc Nemarov test – uzorci zavisniZa procjenu značajnosti razlike učestalosti dihotomnih modaliteta posmatranog obilježja vezanog (koreliranog) uzorka koristi se Mc Nemarov test. To je testiranje značajnosti razlike između dviju proporcija. Test se primjenjuje u slučajevima kada je posmatrano obilježje registrovano dva puta na istim jedinicama uzorka, tj. kada su emirijski podaci vezani. Mc Nemarov test se izražava pomoću hi kvadrat testa, jer se proporcije ne mogu izračunati bez apsolutnih frekvencija.

Da bi se testom procijenila značajnost razlike na osnovu izvornog atributivnog ili numeričkog obilježja, ono mora biti obavezno dihotomno. Empirijski podaci za koje se koristi ovaj test moraju biti apsolutne frekvencije. Dihodomne gradacije posmatranih obilježja obično se označavaju sa pozitivno-negativno, za-protiv, zdrav-bolestan itd. Gradacije su tipa prije-poslije tretmana, učenja, liječenja itd. Specifičnost procedure primjene testa sastoji se u određivanju validnih apsolutnih frekvencija, izračunavanju teorijskih frekvencija i izračunavanju testovne vrijednosti. Izračunavanje stepena slobode, određivanje kritične granice iz tablice i donošenje zaključka sprovodi se po principima hi kvadrat testa.

Razvrstavanjem jedinica uzorka po dihotomnim gradacijama posmatranog obilježja dobijamo četiri korelirane empirijske frekvencije, od kojih dvije pokazuju slaganje gradacija, bilo u + ili – smislu. Druge dvije frekvencije rezultat su različitog uticaja gradacija empirijske situacije. Testovna vrijednost označava se isto kao vrijednost hi kvadrat testa, uz dopisivanje u indexu inicijala autora:

x²McN=

fi fi*238 169,43 27,75

84 116,78 9,233 68,79 18,6299 120,27 3,76

105 82,89 5,8948 48,83 0,0162 109,3 20,4786 75,33 1,5181 44,38 30,23

836 836 117,45

Page 22: Skripta Za II Parcijalu Iz Poslovne Statistike

Da bi odgovarale zahtjevima nulte hipoteze, teorijske frekvencije moraju imati značenje aritmetičke sredine, tj. biće jednake prosjeku zbira validnih empirijskih frekvencija. Iz toga slijedi da je Mc Nemarova testovna vrijednost jednaka količniku kvadrirane razlike i zbira validnih frekvencija. Test nema naučnu vrijednost ukoliko teorijske frekvencije nisu jednake ili veće od pet. Kod primjene testa preporučuje se upotreba Yatesove korekcije u svim slučajevima, jer se testovna vrijednost računa samo na osnovu dvije validne frekvencije. Mc Nemarov test ne treba koristiti u slučajevima kada neki tretman primijenjen na grupu ispitanika može kod njih proizvesti suprotne efekte. To može rezultirati jednakim ili slični frekvencijama u ćelijama a i d (Yatesova korekcija). Lažno ukazuje na male promjene.

Kada se zbog malih frekvencija test ne može primijeniti, značajnost razlike frekvencija koreliranog uzorka može se procijeniti izračunavanjem vjerovatnoće konkretnog slučaja prema binomnoj distribuciji. Za dovoljno velik broj validnih frekvencija značajnost razlike frekvencija koreliranog uzorka može se procijeniti pomoću Mc Nemarovog z testa.

Test predznaka – uzorci zavisniTest predznaka može se upotrijebiti u slučaju analize jednog ili dva zavisna uzorka, pri čemu može biti jednosmjeran dvosmjeran test.

Primjer: Proizvodni radnici jednog preduzeća su, radi povećanja produktivnosti rada, prošli dodatnu obuku na specijalističkom kursu. Izabran je slučajan uzorak od 12 radnika, za koje je u narednoj tabeli evidentiran broj proizvoda koje su oni proizveli u jedinici vremena prije i poslije specijalističkog kursa.

Radnici 1 2 3 4 5 6 7 8 9 10 11 12

Prije 43 52 37 46 47 56 44 40 39 42 47 44

Poslije 46 51 39 49 48 56 42 42 40 44 48 47

Petpostavljamo da raspored razlika u proizvodnji značajno odstupa od normalne distribucije. Primjenom odg. testa, uz rizik greške 3%, utvrditi da li je ovaj vid dodatne obuke značajno uticao na povećanje produktivnosti proizvodnih radnika posmatranog preduzeća.

Potrebno je primijeniti neparametarski test jer podaci značajno odstupaju od norm. distribucije. Uzorci su zavisni, jer je mjerenje rezultata (prije i poslije kursa) izvršeno na istim radnicima. Opredjeljujemo se za test predznaka – dva zavisna uzorka. Ako je nulta hipoteza tačna očekujemo jednaku vjerovatnoću javljanja kako + tako i – znakova. Za alternativnu hipotezu postavljamo jednosmjerni test na gornju granicu (veći broj pozitivnih znakova u odnosu na negativne), jer ispitujemo da li dodatna obuka na specijalističkom kursu povećava produktivnost.

H0: P(+)=P(-)

H1: P(+)>P(-)

Page 23: Skripta Za II Parcijalu Iz Poslovne Statistike

Promjene u broju proizvedenih komada su prikazane u četvrtom redu tabele predznakom +,- ili * (nema promjene). Sa znakom + označili smo onu dodatnu obuku kod koje se povećao broj proizvedenih komada nakon specijal. kursa (obuka je bila efikasna), i obratno. Rezultat mjerenja bez promjene isključuje se iz dalje analize, pa će se u našem primjeru veličina uzorka smanjiti za 11.

Radnici 1 2 3 4 5 6 7 8 9 10 11 12

Prije 43 52 37 46 47 56 44 40 39 42 47 44

Poslije 46 51 39 49 48 56 42 42 40 44 48 47

Promjena + - + + + * - + + + + +

Binomna distribucija može aproksimirati normalnu distribuciju kada je np>5 i nq>5. Kako je u našem primjeru p=0,5 ; možemo zaključiti da su ovi uslovi ispunjeni za uzorke veće od 10 jedinica. Tada odluku donosimo poređenjem empirijskog z omjera sa teorijskom vrijednošću

jediničnog normalnog rasporeda: z =

S- statistika testa (zbir pozitivnih ili negativnih znakova u zavisnosti od alternativne hipoteze)

U našem slučaju S predstavlja broj pozitivnih primjera i iznosi 9 tako da je z=2,11

Područje nulte hipoteze je sa desne strane za vrijednosti veće od 1,88,što odgovara riziku od 3%. S obzirom da je izrač. Vrij. 2,11 > 1,88 (kritčne vrijednosti), odbacujemo nultu hipotezu i zaključujemo da dva zavisna uzorka pripadaju različitim populacijama, tj. da je došlo do produktivnosti radnika.

Testiranje hipoteze bazirano na tri ili više uzorka

Hi kvadrat test jednakosti proporcija i Kruskal-Wallisov test se koriste za testiranje hipoteza koji su bazirani na zavisnim uzorcima.

Hi kvadrat test jednakosti proporcija tri ili više skupa

Kod testiranja hipoteze da su proporcije tri ili više skupova međusobno jednake, postavljamo slijedeće hipoteze:

Budući da ćemo hipotezu testirati pomoću uzoraka, moramo iz svkog osnovnog skupa izabrati uzorak i utvrditi broj elemenata sa obilježjem koje nas interesuje. Ako proporcija osnovnog

Page 24: Skripta Za II Parcijalu Iz Poslovne Statistike

skupa nije poznata, onda se ona procjenjuje na osnovu podataka iz nezavisnih uzoraka u stratumima:

Očekivane frekvencije se dobiju tako što se izračunata zajednička proporcija primijeni na svaki od uzoraka, tj. pomnoži sa pripadajućim veličinama uzoraka. Zatim se očekivane frekvencije upoređuju sa opaženim frekvencijama. Zbir opaženih i očekivanih frekvencija mora biti jednak. Time se gubi jedan stepen slobode , pa se testiranje hipoteze provodi sa k-1 stepeni slobode. Uz dati nivo značajnosti, nulta hipoteza se prihvaća ako je empirijska vrijednost hi kvadrata jednaka ili manja od tablične, a odbacuje kada je empirijska vrijednost veća od tablične.

Kruskal-Wallisov test-uzorci nezavisni

U slučajevima kada populacije znatno odstupaju od normalne distribucije, ili kada se radi o rangiranim podacima, preporučuje se upotreba Kruskal-Wallisovog testa, koji predstavlja neparametarsku alternativu jednifaktorskoj analizi varijanse. Drugim riječima, radi se o testu analize varijanse, samo se umjesto numeričkih podataka koriste rangovi. Rang varijable mogu biti izvorne ili se radi o kvantitativnim varijablama transformisanim u rangove. Ovaj test ima jednake karakteristike efikasnosti u odnosu na F test kao test sume rangova prema t testu.

Za primjenu ovog testa ne uvodimo nikakve pretpostavke o rasporedu populacija iz kojih se biraju uzorci. Međutim, potrebno je uvesti neke druge pretpostavke: da sve populacije koje posmatramo imaju jednake oblike, da slučajni nezavisni uzorci pripadaju neprekidnim populacijama i da su podaci dostupni barem u nivou skale ranga. Bez obzira na prethodno navedeno ovaj test ima blaže pretpostavke u odnosu na parametarsku jednofaktorsku analizu varijanse.

Page 25: Skripta Za II Parcijalu Iz Poslovne Statistike

Pomoću Kruskal-Wallisovog testa provjeravamo nultu hipotezu da k nezavisnih uzoraka pripadaju istoj populaciji, tj. da su izabrani iz populacija koje imaju jednake medijane. Naravno, ako posmatrane populacije imaju simetrične rasporede, nulta hipoteza se može postaviti i pomoću aritemtičke sredine.

Vrijednost testa se računa prema slijedećem izrazu:

Gdje su:

n= ukupan broj opažanja

Ri= zbir rangova u i-tom uzorku

ni= broj elemenata u i-tom uzorku

k= broj uzoraka

Dakle, Kruskal-Wallisov test mjeri koliko se k uzoraka razlikuje u pogledu rangova dodijeljenih njihovim vrijednostima. Test je mjera varijanse aritmetičkih sredina vrijednosti rangova za različite uzorke.

Friedmanov test - uzorci zavisniFriedmanov test je neparametarska alternativa dvofaktorskoj analizi varijanse. Koristimo ga kada istražujemo problem analize tri i više uzoraka sa neprekidnim rasporedima, pri čemu se podaci mogu mjeriti barem na ordinalnoj skali. Test omogućava da na istoj grupi ispitanika vršimo mjerenje u različitim uslovima i da testiramo značajnost razlike između uzoraka.

Test se izračunava prema izrazu :

.

Postupak se sastoji u tome da se rezultati prvo razvrstaju u tabelu sa r redova i k kolona. Jedinice se razvrstaju prema odabranim kriterijima radi njihove raspodjele u homogene grupe koje čine tzv. blokove. Svi k uzorci su jednake veličine. Zatim se unutar svakog reda primjenjuje k eksperimentalnih tretmana. Rangiranje se vrši odvojeno unutar pojedinih redova. Svaki red sadrži niz od k rangova. U slučaju jednakih rezultata postoje vezani rangovi, ali to prema Freidmanu ne utiče na vrijednost testa.Rangovi se u svakoj koloni saberu.Kada nema razlike u tretmanima zbirovi rangova teže sličnim vrijednostima, a ako je neki tretman boljih od ostalih onda očekujemo da se u određenoj koloni nađe veliki ili mali rang. Test je jednosmjeran na gornju granicu. Velika vrijednost Fr ukazuje na veliku razliku između zbira rangova. Nulta hipoteza se odbacuje ako je Fr veći od kritične vrijednosti koja

Page 26: Skripta Za II Parcijalu Iz Poslovne Statistike

razdvaja područje prihvatanja od odbacivanja nulte hipoteze. Za male vrijednosti n i k postoje posebne tablice za očitavanje kritičnih vrijednosti Fr uz nivo 5 % ili 1 % značajnosti.

Cochranov Q test – uzorci zavisniZa testiranje razlika između proporcija nekog obilježja u različitim uslovima pogodan je Cochranov Q test. Koristimo ga kada na istoj grupi ispitanika vršimo mjerenje u različitim uslovima, pri čemu su rezultati dihotomni. Dihotomne gradacije posmatranih obilježja obično označavaju sa ispravan- neispravan, pao- prošao, zdrav-bolestan i sl. Test se može primjeniti i na različitim grupama ispitanika ali tada svaki ispitanik mora imati svog para u drugim grupama, koji mu je veoma sličan u svim važnim karakteristikama.

Specifičnost procedure primjene ovog testa sastoji se u sumiranju rezultata svakog ispitanika za svih k eksperimantalnih situacija, kvadratiranju zbirova redova, te sumiranju svih kolona. Izračunavanje stepeni slobode k-1, određivanje kritične granice iz tablica i donošenje zaključka sprovodi se po principima hi kvadrat testa.

Test veličina se računa po izrazu:

Slično kao i kod analize varijanse, ovaj test nam daje informaciju da rezultati različitih uslova pripadaju ili ne pripadaju istom skupu. U slučajevima kada odbacimo nultu hipotezu, Q test nam daje informaciju koji se rezultati međusobno značajno razlikuju. Međutim često nam je bitno raspolagati informacijama koji se uzroci međusobno značajno razlikuju. Na osnovu testiranja , kada odbacimo nultu hipotezu, jedino u što možemo biti sigurni je samo to da se barem dva uzorka međusobno statistički značajno razlikuju i najvjerovatnije je da su to uzorak s najvećim i uzorak sa najmanjim zbirom eksperimentalne situacije.Jedan od načina da dođemo do odgovora jeste da po dvije situacije međusobno uporedimo testom dva zavisna uzorka sličnog tipa, tj. testom predznaka.


Recommended