452
 Zašto statistika?

Osnove statistike

Embed Size (px)

Citation preview

Zatostatistika?Ako se upitamo ta je statistika?, budui da ima preko 100 definicija, teko se uputati u neku od njih.I bez definicije, manje-vie, svi znamo da statistika znai obradu brojanih podataka radi jasnijeg prikazivanja.Poeci statistike metodologije nastali su iz potpuno praktinih razloga i problema svakodnevnog ivota (tj. iz problema na koje su nailazili profesionalni kockari i hazarderi!).Kada su se matematiari ozbiljno zainteresovali za te probleme, i kada su razradili statistiku kao granu primijenjene matematike, statistika je postala teko dostupna ovjeku, koji nije bio ili po profesiji ili po svom hobiju matematiar.Moda je to bio uzrok to se statistika do prije 80-90 godina malo primjenjivala u drutvenim i prirodnim naukama.Npr. u primijenjenoj psihologiji statistika se prvi put pojavljujeoko 1920. god. kada su postavljene neke hipoteze o nastanku nesree, pa je predloeno da se te hipoteze provjere tako to bi se usporeivalo to se pod vidom tih hipoteza moe oekivati s onim to se zapravo dogaa.Statistika metodologija postala je u savremenom ivotu donekle, ak, i dio opteg obrazovanja i opte kulture, jer je danas teko zamisliti ovjeka bilo koje struke, ako posjeduje visoko obrazovanje, da su mu nepoznati npr. pojmovi aritmetike sredine, korelacije, varijabiliteta i sl.Za savremenog ovjeka koji se bavi naunim radom moe se rei da postoje etiri nivoa na kojima on treba statistiku:1. Praenje strune i naune literature2. Obrada podataka radi deskripcije ianalize rezultata3. Zakljuivanje iz konkretnog sluaja u opti zakon (primjer visine u dva grada)4. Planiranje istraivanja i eksperimenta (primjer eksperi. i kontr. gr., veliina uzorka)Glavni razlozi negativnog stava velikog broja ljudi prema statistici:1. Mnogi izraz statistika upotrebljavaju za oznaavanje tablinog pregleda nekih ispitanih podataka i kau imam statistike podatke (a u tabelema su predstavljene samo sume svake kategorije).Glavni razlozi negativnog stava velikog broja ljudi prema statistici:2. Mnogi su frustrirani pred statistikom zbog njezinog, za njih, nerazumljivog jezika, a naroito zbog malo poznatih simbola na koje nailazimo u statistici. Poetnika u statistici moe posebno obeshrabriti injenica to svi statistiki simboli nisu jo uvijek unificirani, pa za isti pojam autori koriste razliite simbole.Glavni razlozi negativnog stava velikog broja ljudi prema statistici:3. Mnogi smatraju da je statistiku nemogue razumjeti i savladati bez matematike, to nije tano. Glavni statistiki principi i nain miljenja mogu se usvojiti potpuno logikim putem, a od matematike je potrebno poznavati samo etiri osnovne matematike operacije.Vana napomena:Automobil moemo voziti i bez nekog naroitog poznavanja mehanike i elektrike njegovih ureaja. Isto tako statistiku moemo uspjeno upotrebljavati i bez poznavanja matematike.Automobil se ui voziti vjebom (vonjom).Uspjean rad na raunaru postie se praksom.Statistika praksa!Osnovni pojmovi vjerovatnoeStari Egipani su ve 3.500 god. p.n.e. igrali igre sline naim igrama kockom. Igranje kockom je nastavljeno i tokom narednih vijekova, ali pravilo da e kod ispravne igrae kocke svaka njezina strana pasti otpilike jednako puta novijeg je datuma, datira negdje oko 1560. god.Italijanski ljekar, profesor geometrije i strastveni kockar Girolamo Cardano (1501-1576) u knjizi Liber de ludo alea (Knjiga o igrama kockom) je napisao: Svaka polovica stranica kocke pojavljuje se jednako esto... Na primjer, ja mogu jednako lako baciti kockom 1, 3 ili 5, kao to mogu baciti 2, 4 ili 6.Cardano je izraunao da je vjerovatnoa svake strane kocke 1/6 i upozorio je da to vrijedi samo kod ispravne, tj. potene igrae kocke.Napomena:Cardano se inae bavio i astrologijom, u koju je vrsto vjerovao. Izmeu ostalog, prorekao je i dan svoje smrti, i kada je taj dan doao da bi potvrdio tanost svog proroanstva Cardano je poinio samoubitstvo!Knjiga je tampana 85 god. nakon Cardanove smrti, a otkrie se brzo proirilo meu matematiare.Galileo Galilei je 1620. god. objavio Razmiljanja o igrama kockom i dio rukopisa je posvetio vjerovatnoi razliitih ishoda ako se igra dvjema kockama.Rekao je Budui da igraa kocka ima est strana, kada je bacimo, ona moe pasti na bilo koju stranu... Ali ako zajedno s prvom kockom bacimo i drugu kocku, koja takoe ima est strana, moemo dobiti 36 razliitih ishoda, jer svaka strana prve kocke moe se kombinovati sa svakom stranom druge kocke... to ini 6 puta 6, tj. 36 kombinacija.Najosnovnija pravilaOAko je potpuno sigurno da e se neto dogoditi, onda je vjerovatnoa tog dogaaja maksimalna i biljei se s p=1. (Primjer: Potpuno je sigurno da e ovjek koji je danas roenjednog dana umrijeti)./vjerovatnoa lat.: probabilitas/Ako je potpuno sigurno da se neto nee dogoditi, vjerovatnoa tog dogaaja nije nikakva i biljei se: p=0 (Primjer: Potpuno je sigurno da ovjek svojom snagom ne moe skoiti 100 metara uvis).Izmeu apsolutne sigurnosati (p=1) i apsolutne nemogunosti (p=0) nalaze se svi ostali sluajevi manje ili vee vjerovatnoe.Primjer: ansa je 50:50 da emo kod bacanja novia dobiti pismo.Bacanjem igrae kocke, vjerovatnoa da emo dobiti broj 3 je 1/6.Najosnovnija pravilaOVjerovatnoa da e se izmeu N dogaaja, koji su jednako vjerovatni, a meusobno nezavisni, dogoditi jedan odreeni meu njima jeste 1/N. (Primjer: Vjerovatnoa da emo izmeu 32 igrae karte izvui pikovu damu = 1/32, tj. p= 0,03125 neto vie od 3%).Najosnovnija pravilaOVjerovatnoa da e se dogoditi bilo koji od nekoliko moguih nezavisnih dogaaja suma je vjerovatnoa svakog pojedinanog dogaaja.(Primjer: Vjerovatnoa da emo jednim bacanjem kocke dobiti ili broj 5 ili broj 3 ili broj 2 je 1/6 + 1/6 + 1/6 = 3/6 = = 0,5Najosnovnija pravilaOVjerovatnoa da e se zajedno dogoditi dva ili vie nezavisnih dogaaja proizvodje vjerovatnoa svakog od tih dogaaja. (Primjer: vjerovatnoa da emo kockom dva puta redom /ili da emo s dvije kocke istovremeno/ dobiti broj 6 je 1/61/6 = 1/36 = 0,028 (ispod 3%). Najosnovnija pravilaO(Primjer: vjerovatnoa da emo pet puta zaredom dobiti pismo (ili na pet novia dobiti pismo) = 1/21/21/21/21/2=1/32 = 0,031To se moe dogoditi u prosjeku samo 3 puta u 100 pokuaja bacanja 5 novia (tanije jedanput u trideset pokuaja).Najosnovnija pravilaO(Primjer: Ako jedan novi bacimo 6 puta zaredom koji je od ishoda najvjerovatniji?)A:GPPGPGB:GGGPPPC:P PPPPPOdgovor: Svaki od predloenih ishoda je jednako vjerovatan (1/2 1/2 1/2 1/2 1/2 1/2=1/64=0,0156)Najosnovnija pravilaO(Primjer: Kolika je vjerovatnoa da emo bacanjem kocke dobiti broj 3, da emo nakon toga bacanjem novia dobiti pismo i napokon od 4 asa izvui herc?)Odgovor: p = 1/61/21/4 =1/48 = 0,02083Najosnovnija pravilaOPrimjer: Bacanjem dvije kocke mogu se dobiti sljedee kombinacije:(I-prva kocka, II-druga kocka)I II I II I II I II I II I II1 1 2 1 3 1 4 1 5 1 6 11 2 2 2 3 2 4 2 5 2 6 21 3 2 3 3 3 4 3 5 3 6 31 4 2 4 3 4 4 4 5 4 6 41 5 2 5 3 5 4 5 5 5 6 51 6 2 6 3 6 4 6 5 6 6 6p=1/61/6=1/36Najosnovnija pravilaO(Primjer: Kolika je vjerovatnoa da e neki roditelji, koji planiraju etvoro djece, dobiti 4 keri?Odgovor: p = 1/21/21/2 1/2 =1/16To ne znai da e u posjeku na 16 brakova s djecom nai jedan brak sa etvoro enske djece, nego to znai da e se na 16 brakova sa etvoro djece nai u prosjeku 1 brak sa 4 keri (takoe i 1 brak sa 4 sina).Najosnovnija pravilaO(Primjer: Kolika je vjerovatnoa da e na jednoj kocki pasti broj 3, a na drugoj broj 4?)Odgovor: p = 1/61/6=1/36To vrijedi samo ako je definisano da na prvoj kocki treba pasti broj 3, a na drugoj broj 4.Najosnovnija pravilaO(Primjer: Kolika je vjerovatnoa da e na jednoj kocki pasti broj 3, a na drugoj broj 4?)Odgovor: p = 1/36 +1/36=2/36=1/18Ako je svejedno na kojoj kocki je pala 3, a na kojoj 4, kolika je vjerovatnoa?Prema prethodnoj tabeli postoje dvije od 36 mogunosti, i to: 3-4 i 4-3.Najosnovnija pravilaOAko neko ima N mogunosti da uradi jedan zadatak, r mogunosti da uradi drugi zadatak i p mogunosti da uradi trei zadatak, onda je broj svih moguih kombinacija tih triju zadataka:N r pNajosnovnija pravilaO(Primjer: Koliko je moguih kombinacija u sportskoj prognozi ako treba pogoditi rezultate 12 utakmica, od kojih svaka moe imati tri ishoda /0, 1 ili 2/?)Vjerovatnoa da e se pogoditi kombinacija: p = 1/531.441=0,0000019, to praktino znai 2 na milionBroj moguih kombinacija:333333333333 = 531.441Najosnovnija pravilaO(Primjer: Ako se u restoranu moe dobiti ruak koji se sastoji od supe, mesa, kuhanja i kolaa, a moe se birati izmeu 4 supe, 3 vrste mesa, 5 vrsta kuhanja i 4 vrste kolaa, koliko je moguih kombinacija?)Broj moguih kombinacija:4 3 5 4 = 240Najosnovnija pravilaOAko imamo npr. 4 broja, koliko postoji kombinacija kojima ih moemo poredati?1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 42 2 3 3 4 4 1 1 3 3 4 4 1 1 2 2 4 4 1 1 2 2 3 33 4 2 4 2 3 3 4 1 4 1 3 2 4 1 4 1 2 2 3 1 3 1 24 3 4 2 3 2 4 3 4 1 3 1 4 2 4 1 2 1 3 2 3 1 2 1Mogue kombinacije se raunaju:4321 = 24Biljei se kao 4!, a ita se etiri faktorijel.Vjerovatnoa: p = 1/24 = 0,042Najosnovnija pravilaOZnai:Formula za izraunavanje svih moguih kombinacija glasi:n!Najosnovnija pravilaO(Primjer: Zamislimo da neka domaica ima osmoro gostiju na veeri. Na koliko naina oni mogu sjesti oko stola?)Prvi gost moe sjesti na bilo koju od 8 stolica, drugi na bilo koju od 7 stolica, itd. Broj kombinacija: 87654321=8!=40.320 Najosnovnija pravilaOAko meu n predmeta elimo ustanoviti koliko je moguih permutacija za r tih predmeta, koristi se formula:)! (!r nnNajosnovnija pravilaO(Primjer: Ako je maloprije pomenuta domaica zabrinuta kako smjestiti etvoro od osmoro gostiju, koristie se formula:5 6 7 81 2 3 41 2 3 4 5 6 7 8! 4! 8)! 4 8 (! 8)! (!r nnto iznosi: 1.680)Ako se ova formula primijeni na prethodni primjer:! 8! 0! 8)! 8 8 (! 80! = 1Najosnovnija pravilaOAko nam nije vaanredoslijed ljudi ili stvari, raun je drugaiji.(Primjer: Koja je vjerovatnoa da izmeu brojeva 1 i 10 izvuemo brojeve 3 i 5?)90! 8! 10)! 2 10 (! 10)! (!r nnAko bi se traio taan redoslijed:45! 8 ! 2! 10)! 2 10 ( ! 2! 10)! ( !!r n rnAko redoslijed nije vaan:(p=1/90)(p=1/45)Najosnovnija pravilaONapomena: Moe se izraunati i na drugi nain!(Primjer: Koja je vjerovatnoa da izmeu brojeva 1 i 10 izvuemo brojeve 3 i 5?)Vjerovatnoa da emo prvo izvui broj 3 je 1/10, a vjerovatnoa da emo iz preostalih 9 brojeva izvui 5 je 1/9. Onda je vjerovatnoa za oba broja 1/101/9=1/90. Ista je vjerovatnoa i za drugi redoslijed.Najosnovnija pravilaO (Primjer: Koja je vjerovatnoa da emo u nekoj igri pogaanja /npr. loto/ od 49 brojeva pogoditi 6 brojeva?)Vjerovatnoa iznosi 1 : 14 miliona816 . 983 . 131 2 3 4 5 644 45 46 47 48 49! 43 ! 6! 49)! 6 49 ( ! 6! 49)! ( !!r n rnBayes-ovistatistiki principiBayes-ovistatistiki principiBayes je bio engleski svetenik koji se pasionirano bavio problemima vjerovatnoe, te je pronaao neke zakone (prije 260 god.) koji se poneto razlikuju od klasinog pristupa pitanju vjerovatnoe.Konkretno izradio je matematike postupke (formule) koji omoguuju mijenjanje vjerovatnoe nekog ishoda pod uticajem novih informacija.Bayes-ovistatistiki principiBudui da Bayes-ov princip danas zauzima kljuno mjesto u teoriji odluivanja, postupak emo opisati na jednom jednostavnom primjeru.Pretpostavimo da imamo skupinu od 50 mukaraca i 50 ena i da znamo da meu mukarcima 30% njih ima svijetlu kosu, a meu enama 20%.Bayes-ovistatistiki principi1/2 1/22/103/108/107/1050 m 50 Primjer za Bayes-ovo izraunavanje vjerovatnoeBayes-ovistatistiki principiAko sluajno izaberemo, bez vidne kontrole, jednu od ovih 100 osoba, onda vjerovatnoa da je ta osoba mukarac iznosi 50% (to je tzv. priorna vjerovatnoa).Ako nakon toga dobijemo informaciju da izvuena osoba ima svijetlu kosu, vjerovatnoa da je to mukarac sada postaje vea od 50%, jer mukaraca sa svijetlom kosom ima vie nego ena sa svijetlom kosom.Bayes-ovistatistiki principiTo je tzv. posteriorna vjerovatnoa. Prema prethodnoj slici: vjerovatnoa se izraunava iz povrine: Da bude mukarac p=1/2, a vjerovatnoa da bude mukarac svijetle kose: 1/23/10=3/20=0,15Da bude ena svijetle kose p=1/22/10=1/10=0,1Da bude osoba sa svijetlom kosom: 1/23/10+1/22/10=0,15+0,1=0,25Bayes-ovistatistiki principiVjerovatnoa da izabrana osoba sa svijetlom kosom bude mukarac:Vidimo da je posteriornavjerovatnoa sada vea od priornevjerovatnoevjerovatnoa mukarca svijetle kosevjerovatnoa svih uesnika svijetle kose60 , 025 , 015 , 010 , 0 15 , 015 , 0Bayes-ovistatistiki principiAko se nakon toga pojavi nova informacija, npr. da svi mukarci svijetle kose imaju plave oi, a da svaka druga ena sa svijetlom kosom ima plave oi; onda bi podatak da izvuena osoba ima plave oi jo vie povisio vjerovatnou da se radi o mukarcu.75 , 02 , 015 , 05 , 0 10 , 0 15 , 015 , 0vjerovatnoa mukarca svijetle kose i plavih oijuvjerovatnoa svih uesnika svijetle kose i plavih oijuPsiholoki uzroci nekim pogrekama kod prosuivanja vjerovatnoeO Poznavajui vjerovatnou pojavljivanja neke pojave oekujemo da e se dugo nepojavljivanje te pojave nadoknaditi kasnijim pojavljivanjem.Npr. Kod bacanja novca ako neko 10 puta zaredom igra na pismo i svih deset puta padne glava, igra ima osjeaj da sada konano mora doi pismo.Psiholoki uzroci nekim pogrekama kod prosuivanja vjerovatnoeO(Primjer: Godine 1913. u jednoj igraonici u Monte Karlu crno (p=0,5) na ruletu je izilo 26 puta zaredom, a vjerovatnoa takvog ishoda je 0,526 = 0,0000000149 ili 1 u vie od 67 miliona okretaja).Psiholoki uzroci nekim pogrekama kod prosuivanja vjerovatnoeO esto smatramo da e se kod velikog broja pokuaja jednake anse izjednaiti po broju ishoda.Npr. Dvojica ljudi igraju igru bacanja novca, jedan igra na pismo, a drugi na glavu, onda je mogue po tom pogrenom stanovitu da u 10 bacanja ne ispadne tano 5 puta glava i 5 puta pismo, ali u, npr., 10.000 bacanja broj glava i broj pisama morao bi se praktino izjednaiti.Psiholoki uzroci nekim pogrekama kod prosuivanja vjerovatnoeO Najvjerovatnije e se dogoditi upravo obrnuto!Apsolutna razlika e se vjerovatno poveavati, a smanjivae se vjerovatno razlika u proporciji, tj. to je vei broj bacanja, to e postotak ishoda glava i pismo biti sve blii 50%:50%.Psiholoki uzroci nekim pogrekama kod prosuivanja vjerovatnoeONpr. Ako od 10 bacanja bude 4G, onda je proporcija ishoda 4/10=40%, a razlika od oekivanog broja = 1 (5-4).Ako od npr. 200 bacanja (115P)57,5% (prema oekivanih 50%), a apsolutna razlika iznosi 15 (115-100).Ako od npr. 1.000 bacanja (520P)52% (prema oekivanih 50%), a apsolutna razlika iznosi 20 (520-500).I na kraju ...Formula kojom se izraunava vjerovatnoa da e seu nekoj igri sluaja kod razliitog broja pokuaja neki odreeni rezultat pojaviti barem jedanput:mq 1q vjerovatnoa da se taj rezultat nee dogoditim broj pokuajaPrimjer 1: Izraunati vjerovatnou pojavljivanja barem jedne estice u etiri bacanja igrae kocke. 52 , 0 48 , 0 1651 14mq pPrimjer 2: Izraunati vjerovatnou pojavljivanja barem jedne dvanaestice u 24 bacanja dvije igrae kocke. 49 , 0 51 , 0 136351 124mq pPrimjer 3: Izraunati vjerovatnou izvlaenja asa karo izmeu 52 karte u 10 pokuaja.18 , 052511 110mq pOsnovestatistikeOsnove statistike sadre niz statistikih postupaka koji se odnose na: - prikupljanje podataka, - sreivanje i prikazivanje prikupljenihpodataka, - statistiku analizu tih podataka i - tzv. statistiko zakljuivanje na osnovu rezultata statistikog sreivanja i analiziranja prikupljenih podataka.Prikupljanje brojanih podatakaDo ovih podataka se moemo doi brojanjem i mjerenjem.Brojanje se sastoji u odreivanju estine javljanja, tj. odbrojavanju frekvencije (f) pojedinih, tano definisanih sluajeva.Mjerenje se sastoji u primjeni prikladnog instrumenta kojim odmjeravamo, u mjernim jedinicama tano definisane skale, stepen, odnosno zastupljenost mjerene karakteristike obiljeja, dobijajui tako brojane podatke o pojavi koja nas zanima.Sreivanje i prikazivanje prikupljanje podatakaPodaci se mogu grupisati ili klasifikovati tako da tvore pregledne tabele.Brojani podaci i frekvencije sluajeva, kao i tabelarni podaci, mogu se i grafiki prikazati kako bi se dobila preglednija slika prikupljenih podataka nego to je daju negrupisani ili samo tabelarni podaci.Statistika analizaMoe se primijeniti na skupovima brojanih podataka.Ako podaci pokazuju tendenciju vee uestalosti ili grupisanja oko neke vrijednosti, moemo takvu sredinju vrijednost odrediti pimjenom postupaka za dobijanje ili izraunavanje centralne (c) i dominantne (D) vrijednosti, ili tzv. aritmetike sredine (X)Statistika analizaMoemo odrediti i kakav je varijabilitet meu vrijednostima koje se javljaju u skupu podataka npr. izraunavanjemstepena odstupanja pojedinanih podataka od sredinje vrijednosti svih podataka, to nam ujedno daje i informaciju o reprezentativnosti te sredinje vrijednosti, itd.Statistiko zakljuivanjePostupci statistikog sreivanja i prikazivanja prikupljenih podataka, kao i postupci statistike analize unutar nekog skupa podataka, samo su priprema za statistiko zakljuivanje pri kojem se provjeravaju hipoteze i postavljaju tvrdnje o karakteristikama pojava koje su predmet naeg interesa.Statistiko zakljuivanjeProvjeravanje hipoteza i postavljanje tvrdnji sa to manjim stepenom rizika da u tome grijeimo, zasniva se na statistikim postupcima u kojima se skupine podataka uporeuju s drugim skupinama vrijednosti koje su, ili teoretski pretpostavljene, ili prikupljene nekim drugim brojanjem, odnosno mjerenjem na istoj ili nekoj drugoj skupini, iji su lanovi nosioci obiljeja karakteristike koja je predmet naeg interesovanja.Statistiko zakljuivanjeTakvi postupci koji su svojevrsna testiranja razlika i slinosti meu grupama brojanih podataka ili fekvencijama, dozvoljavaju da se neto zakljui o pojavi ili objektu koji je bio predmet naeg interesovanja, da se potvrdi ili odbaci neka prije postavljena hipoteza ili da se na osnovu statistiki potvrenog nalaza, pokua djelovati na pojavu mijenjajui je u eljenom smjeru.Prikupljanje podatakaPrikupljanje podatakaStatistiki pristup zapoinje prikupljanjem podataka.U svakom zanimanju potrebno je raspolagati podacima koji se odnose na podruje tog zanimanja , kao npr. to su:- Podaci o aktivnostima uposlenika,- Opti podaci o uposlenicima (npr. dob, pol, struna sprema, radni sta, itd.), tj. svi lini podaci koji bi mogli biti u vezi s predmetom nekog naeg ispitivanja ili analiziranja,U svakom zanimanju potrebno je raspolagati sa podacima koji se odnose na podruje tog zanimanja , kao npr. to su:- Podaci o naroito opasnim radnim mjestima ili podaci o posebnim prinadlenostima (npr. dravni slubenik, OSL i sl.)- Podaci o preduzimanju mjera i radnji,- Podaci o drugim preduzeima koji se odnose na navedena podruja, itd.Ovi (i neki drugi) podaci mogu biti prikupljani zbog uobiajenog (rutinskog) evidentiranja, ali mogu posluiti i za provoenje statistikih analiza koje nam dozvoljavaju da poneto i zakljuimo o predmetu naeg interesa i o faktorima koji su u uskoj vezi (npr. uzrono-posljedinoj) s onim to ispitujemo, analiziramo.Cilj takve statistike analize i zakljuivanja najee je potreba djelovanja na npr. zatitne mjere, na radnike ili na elemente radnih procesa u smislu poveanja sigurnosti (bezbjednosti) pri radu i pri preduzimanju mjera i radnji radi ouvanja sigurnosti (bezbjednosti).Prikupljanje podataka o karakteristikama neke pojave, nekih dogaaja ili nekih osoba (npr. radnika) obino se sastoji u brojanju ili mjerenju.Brojanje je klasifikacija kojoj prethodi definisanje kategorija, jer moramo znati ta brojimo!Primjer: Moe nas interesovati postoji li razlika u broju ena i mukaraca koji doivljavaju nezgodu pri radu.Radnike koji doiljavaju nezgode klasifikovali bismo u dvije grupe kategorije, prema polu i za svaku kategoriju odredili bismo frekvenciju (f), tj. prebrojali bismo lanove svake kategorije. Kada se ustanovi kolika je veliina (frekvencija) svake od tih dviju grupa, moglo bi se provesti njihovo uporeivanje, vodei rauna o ukupnom broju mukaraca i ena.Vrijednost poreenja kategorija, formiranih na osnovu brojanja, zavisna je o jasnoi razlike karakteristika na osnovu kojih se provodi klasifikacija, kao i o naoj osposobljenosti da razlikujemo pojedince prema toj karakteristicitokom kategorizacije.U navedenom primjeru, klasifikacija prema polu je laka, jer je bioloka razlika ljudi prema polu jasno evidentna.Mjerenje je postupak po kome se proizvode podaci kroz opservaciju ili eksperimentaciju.Mjerenje se provodi tako da se razliitim stepenima neke karakteristike pridaju brojevi. Takvo pridavanje brojeva razliitim veliinama obiljeja koje odmjeravamomoemo izvesti od strane jednog ili vie procjenitelja. MjerenjaU statistikoj praksi se sreemo sa razliitim vrstama podataka. U analizi se za razliite tipove podataka koriste razliite statistike metode. Dobro poznavanje svih tipova podataka, njihove razlike i poznavanje statistikih metoda primijenljivih na odreeni tip podataka, predstavlja osnovu za svakog ko se bavi ili koristi statistiku. SkalemjerenjaSkalamjerenja predstavlja definisan skup pravila po kojima se osobama, objektima ili dogaajima dodjeljuju brojevi.Osnovna i najjednostavnija operacija u bilo kojoj nauci jeste operacija klasifikacije. U klasifikovanju pokuavamo da sortiramo elemente po odreenoj karakteristici, tj. elemente sortiramo po kategorijama. Na primjer:Sortiramo osobe prema religiji (pravoslavci, katolici, protestanti, muslimani, ...), a onda ispitujemo da li je religija povezana sa odreenim predrasudama ili politikim konzervatizmom. Zbog toga je klasifikacija osnovna operacija za svaku nauku, a svi drugi nivoi mjerenja obavezno ukljuuju i klasifikaciju kao minimalni zahtjev.Klasifikaciju, vrimo preko najnieg nivoa mjerenja. Vrijednosti promjenljive su iskljuivo oznake kategorija, tj. dodjeljujemo odgovarajua imena kategorijama, ali tako da ih ona lako i to potpunije opisuju. Izmeu kategorija ne postavljamo nikakvu relaciju, niti ih stavljamo u bilo kakav odnos ("vei od", "manji od", "bogatiji od", itd.). Dokle god kategorije obuhvataju sve elemente i ne preklapaju se, imamo minimalne uslove za primjenu statistikih procedura. Ovakvom, najjednostavnijem nivou mjerenja dajemo naziv "nominalna skala" ba zbog toga to je osnovna operacija u ovakvom mjerenju razlikovanje i imenovanje kategorija.Tipovi skala mjerenja:1. Nominalna2. Ordinalna3. Intervalna4. OmjernaPostoje etiri tipa skala mjerenja, koje se razlikuju po tipu brojeva koje proizvodi mjerenje specifine varijable (Stivensonova klasifikacija).NominalnaskalaNominalnaskala je najjednostavnija i najmanje informativna.Kod mjerenja varijable ukljuuje samo imenovanje, kategorizaciju ili klasifikaciju njenih moguih vrijednosti.Proizvedena mjerenja su kvalitativna u smislu da su kategorije potpuno razliite.Ako kategorijama dodjeljujemo brojeve, to su samo kodovi i ne predstavljaju stvarne kvantitete.Varijabla Mogue vrijednostiPol enski, Muki (ili kodovi 1 i 2)Krvna grupa 0, A, B, ABPrimjer varijabli mjerenih nominalnom skalomNajea obiljeja mjerena nominalnom skalom su ona koja imaju samo dva ishoda (kategorije): Da ili Ne; Tano ili Netano itd.Ordinalna skala Ordinalna skala je sljedei nivo mjerenja i ukljuuje rangiranje vrijednosti varijable (prvi, drugi ili trei po ostvarenom rezultatu itd. npr.).Brojevi pridrueni ordinalnoj skali oznaavaju odnose meu mjerenjima. S njom mogu biti iznesena tvrenja o rangovima. Svaka vrijednost (kategorija) ima tano odreeni poloaj u odnosu na ostale vrijednosti (kategorije). Rastojanje izmeu vrijednosti (kategorija) ne moemo mjeriti. Tipian primjer ordinalne skale je klasifikacija zaposlenih prema strunoj spremi. Varijabla Mogue vrijednostiOzbiljnost sluaja Blag (1), Umjeren (2), Ozbiljan (3), Kritian (4)Starosna grupa Beba, Dijete, Odrasli, StariZadovoljstvo strankeZadovoljan (1), Neodluan (2), Nezadovoljan (3)Primjer varijabli mjerenih ordinalnom skalomIntervalna skala Intervalna skala je skala mjerenja na kojoj se razlike izmeu sukcesivnih vrijednosti varijabli uvijek jednake, ali bez apsolutne nulte take ve samo arbitrarne (recimo IQ). IQ od nula (0) ne predstavlja nepostojanje inteligencije, ve ozbiljan intelektualni ili perceptualni problem u korienju materijala teksta.Upotreba intervalne skale omoguava identifiaciju jednakih intervala izmeu (bilo koja) dva mjerenja.Moemo rei da je A B = B C.Npr. Ako je A = 150, B = 100, a C = 50; tano je da je A B = B C.Ne moemo rei da je A = 3C (tj. da je A tri puta inteligentniji od C).Varijabla Mogue vrijednostiTemperatura -10C, 20CKoeficijent inteligencije45, 100, 85Ocjene na ispitu iz Informatike7, 6, 5, 9Primjer varijabli mjerenih intervalnom skalomOmjerna skala Omjerna skala pored jednakosti rastojanja izmeu uzastopnih vrijednosti ima i apsolutnu nulu. Varijabla Mogue vrijednostiTjelesna masa 70 kg, 80 kg, ...Visina 182 cm, 175cm, ...Pritisak 115 mmHg, 130 mmHg, ...Primjer varijabli mjerenih omjernom skalomIzbor skale mjerenja zavisi od istraivaa.Npr. Visina moe biti mjerena bilo kojom od ove etiri skale:Omjernom u cm od neke podloge na kojoj osoba stoji,Intervalnom u cm od arbitrirane (npr. od visine stola iza kojeg osoba stoji,Ordinalnom od niskih do izuzetno visokih iNominalnom u kategorije normalnog ili patolokog rasta.KarakteristikeNivomjerenjaNominalni Ordinalni Intervalni OmjerniRazliitostX X X XRedoslijedX X XJednaki intervaliX XApsolutna nulaXNajvanije karakteristike opisanih skalaRazliitost razliiti brojevi se dodjeljuju razliitim vrijednostima ili osobinamaRedoslijed vee vrijednosti predstavljaju vie od osobine Jednaki intervali ista distanca izmeu taaka na skali Apsolutna nula nulta vrijednost predstavlja odsustvo osobine Instrument je tehnologija koja se koristi za mjerenje.Instrument enkoduje procedure koje se koriste za odreivanje prisustva, odsustva ili koliine varijable u jedinici posmatranja.Instrumenti mjerenjaInstrumenti mjerenjaProces prikupljanja podataka informacija koje je zabiljeio istraiva, podrazumijeva primjenu tehnika instrumenata mjerenja, kao to su:- intervju,- upitnik,- opservacija,- direktno fiziko mjerenje i- korienje standardizovanih testovaUpitnikUpitnik je vaan mjerni instrument. Konstruiui ga vodimo rauna o: definisanju oblasti i izboru varijabli koje emo upitnikom mjeriti; njegovoj prvoj verziji i pretestiranju; finalizaciji instrumenta i njegovoj primjeni.Njegovi formati su razliiti, mogu imati zatvorene ili otvorene odgovore; moe ga popunjavati ispitanik ili anketar.IntervjuIntervju se moe definisati kao razgovor izmeu intervjuisanog i intervjuera i cilju izdvajanja odreene informacije.Moe biti struktuiran ili nestruktuiran, a biljeenje informacija iz intervjua realizuje se: video ili audio snimcima, posebnim listama ili nestruktuisanim biljekama. Biljeenje informacija veoma je vano jer je to izvor podataka za kasnije analize.OpservacijaOpsevacija je uobiajeni nain prikupljanja podataka. Ona ukljuuje zahtjev da je posmatra blizu stvarima, tako da je u mogunosti da direktno vidi i biljei specifine aspekte okoline koja se istrauje. Pristupi opserviranju su razliiti. OpservacijaU zavisnosti od fenomena koji se istrauje donosi se odlukao tri kljuna aspekta opservacije:O Ko e opservirati, tj. ko e biti posmatra?O U kom e se okruenju opserviranje vriti?O Kako e se opserviranje obaviti?OpservacijaO Ko e opservirati, tj. ko e biti posmatra?Prva odluka predstavlja izbor izmeu samoposmatranja i spoljanjeg posmatraa. OpservacijaO U kom e se okruenju opserviranje vriti?Druga odluka predstavlja izbor izmeu prirodnog okruenja i laboratorijskog okruenja.OpservacijaO Kako e se opserviranje obaviti?Trea odluka predstavlja izbor izmeu opservacije bez ikakvih pomagala i korienja instrumenata i ureaja u toku procesa opservacije. Mnogi fenomeni se tano mogu opservirati samo pomou ula, dok drugi fenomeni nisu dostupni posmatrau jer su ili vrlo sloeni ili se relativno brzo pojavljuju i nestaju (npr. ljudski pokreti).Objektivne i subjektivne mjereObjektivno mjerenje se vri nekom mjernom opremom, a subjektivno predstavlja ocjene, rangove, miljenja ili stavove ljudi (istraivaa ili eksperata) o ljudskim kvalitetima ili kvantitetima.Objektivno i subjektivno ne treba mijeati sa pojmovima dobro i loe mjerenje. Objektivne i subjektivne mjereRazlozi su:O Nemogunost mjerenja mnogih kvantiteta ili kvaliteta nekom mjernom opremom (npr. odnos pacijent ljekar)O Neadekvatnost mjerne opreme (nekalibrisana ili loe kalibrisana, komplikovana za upotrebu ili pokvarena tokom istraivnja)Standardizovane mjereitestoviStandardizovane mjereitestovi predstavljaju one mjere koje imaju poznatu pouzdanost i validnost. Razvijen standard podrazumijeva da posjedujemo instrument za poreenje mjerenja jedne varijable unutar samog istraivanja kao i instrument za poreenje sa drugim istraivanjima./Primjer Apgar skor/OuzorkuPri aktivnosti prikupljanja podataka esto se suoavamo s injenicama da je broj statistikih jedinica vrlo velik (npr. neka institucija u kojoj prikupljamo podatke o njihovim radnicima moe imati i vie hiljada zaposlenih), ili je postupak mjerenja komplikovan i dugotrajan, ili se tokom mjerenja dogaaju takve promjene na objektu mjerenja da postaje neupotrebljiv.OuzorkuTada je prikupljanje podataka o svim pripadnicima itave, tano definisane grupe populacije, esto neizvodivo, bilo zbog vremenskih ogranienja i neekonominosti, ili zbog toga to samim mjerenjem uprotavamo objekt mjerenja.U takvim sluajevima se pribjegava odabiranju uzorka.OuzorkuUzorak je skup statistikih jedinica, na kojima obavljamo promatranja, brojanje ili mjerenje, iji ukupan broj predstavlja samo dio svih statistikih jedinica cijele populacije.Pri odabiranju uzorka treba nastojati da broj lanova (n) bude to vei, tj. to blii broju lanova populacije (N), jer e podaci koje prikupljamo, u tom sluaju biti sliniji podacima koje bismo dobili uzimajui u obzir itavu populaciju.Formirajui tzv. sluajni uzorak nastojimo da svaki lan ima jednaku vjerovatnou da bude izabran u uzorak.Zbog toga sluajni uzorak formiramo drei se odreenih pravila koja osiguravaju tu traenu jednaku vjerovatnou.Najee upotrebljavamo tzv. tablicu sluajnih brojeva.Drugi nain formiranja sluajnog uzorka moemo primijeniti ako imamo katalogizirane lanove populacije, npr. u nekoj kartoteci.Tada, odluivi unaprijed o veliini uzorka, podijelimo ukupan broj lanova populacije s brojem lanova uzorka (N/n), dobivi tako koje lanove populacije, odbrojavajui redom, trebamo uzeti u uzorak.Primjer: Ako od 100 radnika elimo ukljuiti u ispitivanje 20, mi emo u uzorak odabrati svakog petog radnika, uzimajui njihova imena iz kartoteke u kojoj su npr. postavljeni abecednim redom. Uzimamo svakog petog (100/20). Odbrojavanje moe poeti od bilo kojeg od prvih pet imena u kartoteci. Tako postiemo da u asu pristupanja odbrojavanju svaki od 100 radnika ima jednaku ansu da bude izabran za uzorak.Tako dobiveni uzorak nazivamo sistematskim sluajnim uzorkom.Stratifikovani uzorak moe biti jednako reprezentatvan kao i sluajni ili sistematski uzorak.Pri formiranju stratifikovanog uzorka, populaciju dijelimo u slojeve (stratume) prema nekoj karakteristici (npr. radnike neke firme moemo prema starosti podijeliti u tri grupe mlae, srednjih godna i starije), a zatim iz svake grupe stratuma, odaberemo sluajni uzorak, vodei rauna o tome da je veliina svakog sluajnog uzorka proporcionalna veliini stratuma.Prigodni uzorak najmanje je reprezentativan u odnosu na populaciju, jer se najee sastoji od onih lanova populacije koji su momentno raspoloivi za ispitivanje, kategorizaciju ili mjerenje. to je vei stepen sluajnosti i to je ukupan broj lanova takve skupine vei, blii populaciji, to je takav uzorak sliniji sluajnom uzorku i reprezentativniji u odnosu na populaciju.Veliina uzorka kojom emo se zadovoljiti, zavisi o varijabilnosti obiljeja koje mjerimo (to je vea varijabilnost, potreban je vei uzorak), o eljenoj tanosti naeg mjerenja i o stepenu rizika koji moemo podnijeti pri zakljuivanju o slinosti imenovanih obiljeja na lanovima uzorka s obiljejima populacije (vei uzorak omoguuje veu tanost i time manji rizik u zakljuivanju).Sreivanje i prikazivanje prikupljenih podatakaPodaci koji se nalaze npr. u kartoteciesto ine skupine od nekoliko desetaka, stotina ili ak hiljada brojeva razliitih veliina.Te podatke treba uiniti preglednijim i pogodnijim za statistiku obradu.To postiemo uspostavljanjem odreenog redoslijeda meu podacima, grupisanjem, formiranjem tzv. razreda i distribucija; jednostavnim preraunavanjem u, npr. proporcije ili postotke i formiranjem tabela od tako sreenih podataka. Sreene ili tabelirane podatke moemo i grafiki prikazati u formi dijagrama ili grafikih prikaza u koordinatnom sistemu kao krive ili distribucije frekvencija.Grupisanje i tabeliranjeGrupisanje ili klasifikacija je sreivanje rezultata pri kojem se, analogno postupku brojanja kod prikupljenih podataka, odbrojavaju sluajevi (frekvencije) koji imaju neku odreenu karakteristiku (obiljeje). Pri tome se formira tabela u kojoj su navedena obiljeja i ukupne frekvencije s tim obiljejem. Primjer: Brojanjem radnica i radnika nekog preduzea, od ukupno 114 zaposlenih, ustanovljeo je da ih je 74 enskog, a 43 mukog pola. Formira se tabela:Pol ispitanika frekvencija (f)enski 71muki 43Ukupno 114Tabela 1Broj (f) mukaraca i ena radnikazaposlenih u firmi ( ) . . . ; . , . . , () , . . : , . : . , ; , ; ; ( , ) . , ( ) ; : , . ( , ., ), ( , , , .); . : ; () ; , (. ); : , ; ( ); . / . . - . , : , . , , . . . , , , . . . . . , . : , , ( ) ( ). . , . , : , ; ; ). : , , ; ; . . , , , . . . , , . .Primjer: /ve prikazan/Brojanjem radnica i radnika nekog preduzea, od ukupno 114 zaposlenih, ustanovljeo je da ih je 74 enskog, a 43 mukog pola. Formira se tabela:Pol ispitanika frekvencija (f)enski 71muki 43Ukupno 14Tabela 1Broj (f) mukaraca i ena radnikazaposlenih u firmiPodatke frekvencije (f) moemo izraziti i u formi tzv. proporcija.Proporcije (p) predstavljaju relativni odnos frekvencija (f) svake kategorije obiljeja prema ukupnom broju lanova (N):NfpU ovom primjeru imamo dvije frekvencije: frekvenciju radnica (f1) i frekvenciju radnika (f2).Slijedi:62 , 01147111Nfp38 , 01144321NfpNa osnovu dobivenih propocija moemo formirati tabelu:Pol ispitanika proporcija (p)enski 0,62muki 0,38Ukupno 1,00Tabela 2Proporcije mukaraca i ena radnikazaposlenih u firmiUkupan zbir proporcija svih kategorija nekog obiljeja uvijek iznosi 1,00.Ako pomnoimo proporciju sa 100 dobivamo postotak (%):100 * 100 * (%)Nfp PNajjednostavniji postupak sreivanja podataka dobijenih mjerenjem je redanje po veliini, pri kojem se rezultatine navode kako bilo, nego poevi od najnieg po vrijednosti do najvieg i obrnuto.Primjer: Mjerimo vrijeme potrebno za aktiviranje protivpoarnog aparata kod 30 radnika.Dobiveni su sljedei rezultati:12, 9, 14, 15, 11, 10, 17, 5, 13, 8, 15, 21, 12, 12, 4, 13, 18, 12, 10, 13, 16, 12, 9, 11, 19, 6, 13, 14, 11, 14.Ako dobivene rezultate poredamo po veliini, poevi od najkraeg do najdueg vremena, dobiem slijedei niz vrijednosti:4, 5, 6, 8, 9, 9, 10, 10, 11, 11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 14, 14, 14, 15, 15, 16, 17, 18, 19, 21.Ovako poredani podaci su pregledniji, jer ve na prvi pogled uoavamo koje je vrijeme najkrae, a koje najdue.Pojedine vrijednosti moemo pretvoriti i u rangove, tako da najkrae vrijeme (4 sek.) proglasimo najboljim i pridamo mu prvi rang (1.), slijedei rezultat e biti drugi u rangu (2.), zatim dolazi trei itd., sve do posljednjeg rezultata (21 sek.) koji e imati rang (30.).Rezultati koji su jednaki po vrijednostima dijele isti rang koji predstavlja srednju vrijednost rangova. Npr. rezultat 9 sek. su postigla dva radnika, i kako bi njihov rang trebao biti peti i esti, njihov zajedniki rang e biti 5,5 - jer je:26 5Ili, rezultat od 11 sek. postigla su tri radnika koji bi trebali biti 9., 10. i 11. u rangu, pa prema tome, dijele srednji rang 10. -311 10 9Tako formirani rangovi rezultata naeg primjera bili bi slijedei:1. 2. 3. 4. 5,5. 5,5. 7,5. 7,5. 10. 10. 10. 14. 14. 14. 14. 14. 18,5. 18,5. 18,5. 18,5. 22. 22. 22. 24,5. 24,5. 26. 27. 28. 29. 30.Slijedei korak u sreivanju podataka, mogao bi se sastojati u tome da za svaku razliitu vrijednost odredimo uestalost (frekvenciju), tj. koliko se puta odreena vrijednost pojavila kao rezultat, i na osnovu toga formiramo tabelu.Iz naeg primjera bi za svaku od moguih vrijednosti rezultata (X), od 4 do 21, ustanovili frekvenciju (f), tj. broj radnika koji su postigli odreeni rezultat Tabela 3.Tabela 3Frekvencije rezultata pri mjerenjubrzine aktiviranja protivpo. aparataRezultat (sek.) X Frekvencija (f)4 15 16 17 08 19 210 211 312 513 414 315 216 117 118 119 120 021 1Iz ovako sreenih podataka jasno je koji je rezultat najmanji, koji najvii, koliko je razliitih vrijednosti rezultata, i postoji li tendencija grupisanja oko neke vrijednosti u sredini.Grupisanje u razredeGrupisanje u razrede izvodi se s podacima dobivenim mjerenjem, i to tako to se odrede razredi, zavisno o vrijednosti, a zatim poinje odbrojavanje broja podataka (f) koji, s obzirom na svoju vrijednost, pripadaju pojedinim razredima. Za grupisanje podataka u razrede i odreivanje frekvencije podataka za pojedine razrede, postoje odreena pravila kojih se pridravamo pri: - odreivanju broja razreda, - granica svakog razreda, - intervala izmeu susjednih razreda i - odbrojavanju frekvencija kojepripadaju pojedinim razredima. Grupisanjem podataka u razrede mi, u stvari, obavljamo svojevrsnu klasifikaciju rezultata u kvantitativne kategorije, koje se meusobno razlikuju po veliinama rezultata koje sadre, pri emu te kategorije imaju jednak interval (i) jednak broj moguih vrijednosti rezultata, dok je obino razliit broj rezultata frekvencija (f) koje sadri pojedina kategorija razred.Rezultat (i) svake kategorije razreda, odreujemo tako da sveukupan interval vrijednosti rezultata (I), koji je jednak razlici izmeu najvee i najmanje vrijednosti, uveanoj za jedinicu mjerenja (j.m.) podijelimo eljenim brojem razreda (k):km j X XkIi. .min maxJedinica mjerenja zavisi o tanosti kojom mjerimo. Moe biti cijeli broj (npr. 1) ili decimalni broj (npr. 0,1 ili 0,05). Obino je jednaka najmanjoj razlici izmeu susjednih vrijednosti podataka poredanih po veliini.Iz naeg primjera ako rezultate elimo grupisati npr. u 7 razreda:km j X XkIi. .min max21 sek. 4 sek. 173 6 , 271871 1771 4 21iRazrede formiramo tako da odredimo donju i gornju graninu vrijednost koje e sadravati svaki od razreda.Ako rezultati pokazuju tendenciju grupisanja oko neke sredinje vrijednosti, najbolje je da odredimo prvo granine vrijednosti srednjeg razreda, tako da sredinja vrijednost tog razredaodgovara onom rezultatu oko kojeg se grupie veina ostalih rezultata (to jeobino rezultat koji se najee javlja).'XZatim odreujemo granine vrijednosti susjednih razreda, vodei rauna o jednakosti intervala svakog razreda i intervala graninih vrijednosti susjednih razreda.Razlika izmeu posljednje vrijednosti jednog razreda i prve vrijednosti susjednog razreda, ne smije biti vea od jedinice mjerenja.U naem primjeru postoji tendencija grupisanja rezultata oko vrijednosti X=12.Rezultat (sek.) X Frekvencija (f)4 15 16 17 08 19 210 211 312 513 414 315 216 117 118 119 120 021 1Izraunati interval 7 razreda je 3Svaki razred e sadravati rezultate triju razliitih vrijednostiSredinji razred e sadravati tri vrijednosti:111213Odreivanje prvog nieg i prvog vieg azreda:Rezultat (sek.) X Frekvencija (f)4 15 16 17 08 19 210 211 312 513 414 315 216 117 118 119 120 021 1Prvi nii razred: 8 - 10Prvi vii razred: 14-16Slino odreujemo i ostale razrede:razredi2 45 78 1011 1314 1617 1920 - 22Kada su formirani razredi, pristupamo odreivanju frekvencija rezultata koji pripadaju pojedinom razredu.Ako su rezultati poredani po veliini, frekvencije odreujemo lako i tano odbrojavanjem, tj. brojanjem rezultata koji svojom veliinom pripadaju pojedinim razredima.razredi f2 4 15 7 28 10 511 13 1214 16 617 19 320 - 22 1Tabela 4Tabela frekvencija rezultata kojipripadaju pojedinim razredimaKako interval razreda zavisi o broju razreda kojima pokrivamo ukupni interval vrijednosti rezultata, treba paziti da broj razreda ne bude isuvie mali, ako je ukupni interval velik. Pri odreivanju ukupnog broja razreda, treba zauzeti stanovite da broj razreda ne bude premalen, ali ni prevelik. Neki statistiari preporuuju da se ne upotrebljava broj razreda manji od 5, ni vei od 15. Za rezultate grupisane u razrede, moemo odrediti tzv. kumulativne frekvencije (cf) koje nam pokazuju koliki je broj rezultatajednakih ili manjih od rezultata, kojem je vrijednost jednaka gornjoj graninoj vrijednosti razreda s tom kumulativnom frekvencijom.Kumulativne frekvencije svakog razreda dobivamo jednostavnim pribrajanjem frekvencija svih razreda do onog kojem odreujemo kumulativnu frekvenciju, ukljuujui i njegovu frekvenciju.razredi f cf2 4 1 15 7 2 38 10 5 811 13 12 2014 16 6 2617 19 3 2920 - 22 1 30Tabela 5Tabela kumulativnih frekvencija rezultata koji pripadaju pojedinim razredimaPosljednja kumulativna frekvencija uvijek je jednaka ukupnom broju rezultata (n), jer je i zbir frekvencija (f) svih razreda jednak ukupnom broju rezultata. . : , / . , : , . . : . . . ; 05101520 . . , . ; 05101520 . 2003. 0100200 . 2003. 050100150200I II III IV V VI VII VIII IX X XI XII . . (, , .). . (, .) . 2003. 050100150200I II III IV V VI VII VIII IX X XI XII ( ) . . , . 2003. 0100200300400I II III IV V VI VII VIII IX X XI XII ( ) , , . , ( ) . 23.37%22.53%27.65%26.45%I - II - III - IV - IV - 23.37%I - 22.53%II - 27.65%III - 26.45% . ( ) : (), , .0100200300400500600I -II -III -IV - . . . ( ) : , ; () ; ( ) . (). . , , ( ) , . .SredinjevrijednostiU svakodnevnom ivotu se esto sluimo izrazom prosjek, prosjean i sl.: govorimo o ovjeku prosjene visine, o prosjenoj cijeni neke namirnice, o prosjenom broju posjetilaca na utakmici, o prosjenoj plati itd. Tim izrazom obino mislimo na neku srednju vrijednost koja najbolje reprezentuje onu pojavu o kojoj dajemo miljenje, tj. mislimo na vrijednost oko koje se obino kree najvie rezultata u toj pojavi.Prosjean ne znai uvijek i prosjean u smislu aritmetike sredine.Obradiemo neke od najvanijih mjera prosjeka i upozoriti na razlike meu njima.Aritmetika sredinaAritmetika sredina predstavlja jedan od najee izvoenih rauna za statistike potrebe.Osnovna formula za izraunavanje aritmetike sredine:rezutata brojrezultata svih sumaaritmetika sredinaAritmetika sredinaStatistikim simbolima se pie:NX X X XXn 3 2 1aritmetika sredinaRezultati od prvog do zadnjegBroj rezultataAritmetika sredinaSkraeno se formula pie:NXXita se sigma, a znai sumuAritmetika sredinaPrimjer: Ako smo izvrili 10 mjerenja pulsa nekog ovjeka i dobili vrijednosti:8 , 63106381064 65 61 63 62 70 62 68 60 63X63, 60, 68, 62, 70, 62, 63, 61, 65, 64Aritmetika sredina se izraunava:Aritmetika sredinaAko se radi o velikom broju rezultata, oni se grupiu u razrede, a aritmetiku sredinu izraunavamo upotrebljavajui sredine svakog razreda (X) kao stvarne rezultate, i to onoliko puta koliko rezultata sadri odreeni razred, tj. kolika mu je pripadna frekvencija (f).NX fX'razredi f Sredina razreda X'(f X)2 4 1 3 35 7 2 6 128 10 5 9 4511 13 12 12 14414 16 6 15 9017 19 3 18 5420 - 22 1 21 21(f X) = 369Slijedi primjena - prethodni primjer: 3 , 1230369'NX fXZajednika aritmetika sredinaesto smo u praksi neku pojavu izmjerili nekoliko puta i svaki put smo izraunali aritmeiku sredinu iz vie mjerenja.Ako elimo dobiti zajedniku aritmetiku sredinu svih tih mjerenja, ne smijemo sabrati aritmetike sredine i podijeliti ih njihovim brojem (razliit je broj mjerenja).Zajednika aritmetika sredinaPoto je: -aritmetika sredinaNXXslijedi:zajednika aritmetika sredinamjerenja broj ukupanrezultata svih sumaAko je:NXXslijedi:X X Npa je:Zajednika aritmetika sredinazajednikannnN N NX N X N X NX2 12211Zajednika aritmetika sredinaPrimjer: Mjerenje smo ponavljali est puta i dobili rezultate:1. mjerenje55 , 2011NX2. mjerenje400 , 2222NX3. mjerenje171 , 2333NX4. mjerenje352 , 2244NX5. mjerenje198 , 2255NX6. mjerenje256 , 2266NXzajednika25 19 35 17 40 56 , 22 25 8 , 22 19 2 , 22 35 1 , 23 17 22 40 5 , 20 5Xzaj.34 , 221414 , 3150Dominantna vrijednost (D)Vrijednost ili obiljeje koje je najee u nekom skupu podataka nazivamo dominantnom vrijednou ili obiljejem.razredi f2 4 15 7 28 10 511 13 1214 16 617 19 320 - 22 1125126310246810121 2 3 4 5 6 7Centralna vrijednost (C)Vrijednost koja se nalazi tano u sredini rezultata, poredanih po veliini, nazivamo centralnom vrijednou (C).Odreuje se izrazom:2) 1 (NCPrimjer: Ako imamo devet mjerenja (N+9) poredanih po veliini: 12, 13, 14, 15, 15, 16, 17, 18, 19Poloaj C: 521 92) 1 (NCDakle, peti rezultat je centralna vrijednost, a to je 15 (C+15).Centralna vrijednost (C)Ako imamo paran broj rezultata, centralnu vrijednost odreuju pomou dva srednja rezultata, ije vrijednosti saberemo i podijelimo s dva.4, 5, 6, 8, 9, 9, 10, 10, 11, 11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 14, 14, 14, 15, 15, 16, 17, 18, 19, 21.Iz primjera sa pr. po. ap.:5 , 1521 302) 1 (NC15. i 16. rezultat12212 12CCentralna vrijednost (C)Ako imamo rezultate grupisane u razrede, centralnu vrijednost moemo izraunati upotrebom kumulativnih frekvencija razreda prema formuli:cfcf Ni G C21gdje je:G -donja granica razreda u kome je smjetena C vrijednosti interval razredaN (ili n za uzorak) ukupan broj podatakacf kumulativna frekvencija svih rezultata do onog u kome je smjetena C vrijednostfc frekvencija razreda u kome je smjetena C-vrijednostCentralna vrijednost (C)Razred u kome je smjetena C-vrijednost, nalazimo pomou kumulativnih frekvencija. To je onaj razred u kome se nalazi N/2. rezultat, tj. onaj razred ija je kumulativna fekvencija jednaka ili prva via od iznosa N/2.Slijedi primjer prot. po. ap.razredi f cf2 4 1 15 7 2 38 10 5 811 13 12 2014 16 6 2617 19 3 2920 - 22 1 30Centralna vrijednost (C)Razred u kome je centr. fr.G=10,5cf=8fc=1225 , 12128 30213 5 , 1021cfcf Ni G CGeometrijska sredinaGeometrijska sredina (G) je n-ti korijen iz proizvoda N brojeva.nnx x x G2 1Preteno se koristi kao mjera prosjene brzine nekih promjena.G se ne moe izraunati ako je bilo koji broj negativan ili nula!Geometrijska sredinaPrimjer:puta x x x Gnn3 9 2 5 , 42 1Neko mjesto je 2000. god. imalo 2000 stanovnika, 2001-9000, a 2002.-18000 stanovnika. 2001. 4,5 puta vie nego 2000.-te 2002. 2 puta vie nego 2001.-e Harmonika sredinaHarmonika sredina (H) se izraunava prema formuli:xNH1Upotrebljava se kada elimo dobiti prosjeke nekih odnosa (npr. prosjene kilometre na sat, prosjean broj slova u minuti i sl.)Harmonika sredinaPrimjer 1: Ako je voza udaljenost od 100 km vozio brzinom od 100 km/h, a natrag je vozio brzinom 50 km/h, kojom je prosjenom brzinom vozio?Napomena: Uzeli smo u obzir samo brzinu!, a ne i vrijeme.h kmxNH / 7 , 66501100121Ako je vrijeme jednako (po 1 sat) brzina bi bila 75 km-hHarmonika sredinaPrimjer 2: Anketirane tri domaice koliko traje staklenka od 1 kg eurokrema.Odgovori: A 5 dana, B-10 dana, C-15 dana.danaxNH 2 , 81511015131H se ne moe izraunati ako je bilo koji broj negativan ili nula!Odnosi meu srednjim vrijednostimaPozitivna asimetrina distribucijaD C XfxD CXOdnosi meu srednjim vrijednostimaNegativna asimetrina distribucijaX C Dfx D CXOdnosi meu srednjim vrijednostimaSimetrina distribucijaD C Xfx=D=CXMjere varijabiliteta rezultataRezultati dobiveni mjerenjem, mogu se distribuirati oko sredinjih vrijednosti tako da u veoj ili manjoj mjeri od nje odstupaju.Oni mogu biti meusobno vrijednosno slini, tj. grupisani oko sredinje vrijednosti u uskom intervalu, ili mogu biti razliiti, tj. zauzimati iroki interval vrijednosti.Na stepen reprezentativnosti sredinjih vrijednosti ukazuje nam raznolikost rezultata i njihovo odstupanje (varijabilitet) od sredinje vrijednosti.Ako su vrijednosti gusto grupisane oko srednje vrijednosti, tada srednja vrijednost dobro reprezentuje te rezultate. naredna slikafXXGrafiki prikaz distribucija rezultata razliitog stepena varijabilitetaSama aritmetika sredina nije jo uvijek nikakva garancija da se rezultati grupiu oko te aritmetike sredine, zato je uvijek potrebno znati kako i koliko se oni grupiu, tj. da li je dobivena aritmetika sredina dobar ili lo reprezentant naih rezultata.RasponNajjednostavnija (ali i najnetanija) mjera grupisanja rezultata oko neke srednje vrijednosti je tzv. raspon, tj. razlika izmeu najveeg i najmanjeg rezultata.. min . maxx x RasponRasponPrimjer: Tokom dva puta po 10 mjerenja neke pojave, dobiveni su rezultati (poredani po veliini):1. mjerenje 8 8,5 8,5 9 9 9 9 9,5 9,5 102. mjerenje 1 2 3 5 9 9 13 15 16 17U oba sluaja suma je 90, a aritmetika sredina je 9.Rezultati prvog mjerenja znatno bolje se grupiu oko svoje aritmetike sredine, nego rezultati drugog mjerenja.Prvi sluaj: raspon je 2Drugi sluaj: raspon je 16RasponRaspon je vrlo nesigurna i varljiva mjera varijabilnosti rezultata, jer bilo koji osamljeni ekstremni rezultat znatno poveava raspon, a da se grupacija rezultata oko aritmetike sredine ipak nije bitno promijenila.Srednje odstupanje rezultata -Srednje odstupanje rezultata odreuje se na osnovu razlika (devijacija) izmeu rezultata i izraunate srednje vrijednosti (bez obzira na predznak).DNX XDApsolutna veliina odstupanja, bez obzira na predznakSrednje odstupanje rezultata -Primjer:D51050XRezultati5746565246 = 50Odstupanje0211010311 = 1011010NX XDSrednje odstupanje rezultata -Ako su rezultati grupisani u razrede, prosjenu devijaciju dobiemo tako da sredine razreda X uzmemo kao prave rezultate, traei apsolutnu razliku tih sredina od sredinje vrijednosti, mnoei je s frekvencijom dotinog razreda; sumirajui dobivene umnoke i dijelei sumu s ukupnim brojem rezultata:DNX X fDSrednje odstupanje rezultata -Primjer:D8 , 23084NX X fDrazredi fSredina razreda X'|X'-X| (f|X'-X|)2 4 1 3 9,3 9,35 7 2 6 6,3 12,68 10 5 9 3,3 16,511 13 12 12 0,3 3,614 16 6 15 2,7 16,217 19 3 18 5,7 17,120 - 22 1 21 8,7 8,730 84,0Rezultati prosjeno odstupaju od svoje aritmetike sredine za 2,8 sekundi.Aritmetika sredina = 12,3Standardna devijacijaStandardna devijacija (SD) se najee upotrebljava kao mjera varijabiliteta.Izraunavanje se zasniva na kvadratnim razlikama izmeu pojedinih rezultata (X) i aritmetike sredine tih rezultata ().XFormula za izraunavanje standardne devijacije:NX XSD2pojedini rezultataritm. sredinaukupan broj rezultataStandardna devijacijaPrimjer:Ako imamo 12 rezultata nekog mjerenja X: 3, 4, 5, 6, 7, 7, 7, 7, 8, 8, 9, 1075 , 61281NXXAritmetika sredina se rauna:Pri raunanju standardne devijacije potrebno je od svakog rezultata oduzeti aritmetiku sredinu, zatim dobivenu vrijednost kvadrirati, sumirati kvadrate razlika i uvrstiti u formulu potrebne vrijednosti:Standardna devijacijaX (X- ) (X- )23 -3,75 14,06254 -2,75 7,56255 -1,75 3,06256 -0,75 0,56257 0,25 0,06257 0,25 0,06257 0,25 0,06257 0,25 0,06258 1,25 1,56258 1,25 1,56259 2,25 5,062510 3,25 10,5625(X- )2=44,25X XXNX XSD292 , 11225 , 44SDStandardna devijacijaUkoliko su rezultati mjerenja dobiveni na uzorku, naroito ako je uzorak malen (n30ne treba provoditi korekciju!esto se koristi obrazac:lanovi uzorka X Y X2Y2XYAA 2 4 4 16 8AB 3 2 9 4 6AC 5 6 25 36 30AD 5 4 25 16 20AE 6 3 36 9 18AF 6 5 36 25 30AG 6 5 36 25 30AH 7 4 49 16 28AI 7 5 49 25 35AJ 8 9 64 81 72AK 9 6 81 36 54AL 9 7 81 49 63 72 60 478 338 3882 2 2 2) ( ) ( ) ( ) () ( ) ( ) (Y Y n X X nY X Y X nrr=+0,67Nakon korekcije:r'=+0,61Dva niza podataka, ako ih je veliki broj (npr.: 100) moemo grupisati tako da formiramo tablicu frekvencija sa dva ulaza, pri emu e svaki lan uzorka pripasti jednom od polja tako formirane tablice, u zavisnosti od vrijednosti rezultata X i Y koje je postigao, a za koje smo formirali odreen broj razreda.Na osnovu sredine razreda (X' i Y') i pripadajuih frekvencija izraunavamo koeficijent korelacije r prema obrascu:2 2 2 2) ( ) ( ) ( ) () ( ) ( ) (Y f Y f n X f X f nY f X f Y X f nrZnaenje vrijednosti koeficijenta korelacije moe se grubo odrediti za velike uzorke (n>30) sluei se tabelom:Koeficijent korelacijePovezanostZajedniki faktori (%)manji od 0,22 nikakva manje od 5%od 0,23 do 0,44 niska 5 19od 0,45 do 0,70 znaajna 20 49od 0,71 do 0,90 visoka 50 79vei od 0,90 potpuna vie od 80%Postotak zajednikih faktora, tzv. stepen determinacije (d) dobija se iz:100 (%)2r dStatistiku znaajnost r koeficijenta korelacije moemo odrediti izraunavanjem t-vrijednosti za znaajnost nekog konkretnog koeficijenta korelacije r, koja nam, ako je vea od granine t-vrijednosti (Tabela B), za broj SS=n-2, dozvoljava uz odreeni stepen rizika (1% ili 5%) da tvrdimo: vrijednost izraunatog r koeficijenta korelacije statistikise znaajno razlikuje od 0,00.Obrazac za izraunavanje:212rnr tZa koeficijent korelacije koji smo izraunali za12parova rezultata i koji iznosi +0,61, t-vrijednost iznosi:SS = 12-2= 10Granina t-vrijednost:1% rizika: 3,175% rizika: 2,2343 , 261 , 0 12 1261 , 0122 2rnr tMoemo tvrditi uz neto manje od 5% rizika da grijeimo da je dobivena vrijednost r koeficijenta korelacije statistiki znaajno razliita od 0,00.Testiranje statistikih hipotezaAko se izuzme statistika teorija (iznalazi nove statistike metode), primijenjena statistika se dijeli u dvije grupe: - deskriptivna i- inferencijalna.Deskriptivna statistika se sastoji od metoda za prikupljanje, obradu i prikazivanje podataka korienjem tabela, grafikona i sumarnih lista.Inferencijalna statistika podrazumijeva one statistike metode koji koriste uzorak u cilju donoenja zakljuka o osnovnom skupu.Cilj inferencijalne statistike je da se na osnovu informacije iz uzorka doe do to je mogue preciznije informacije o statistikom skupu.Dvije osnovne metode inferencijalne statistike (ili statistike zakljuivanja) jesu:1. Ocjenjivanje i2. Testiranje statistikih hipoteza.Ocjenjivanje se koristilo kada istraiva nije imao nikakvu prethodnu informaciju o posmatranom skupu. Kao krajnji proizvod ocjenjivanja dobija se interval povjerenja. Testiranje statistikih hipoteza se tradicionalno koristilo kada o skupu imamo neko prethodno saznanje. Cilj testiranja je da se ispita prihvatljivost nekih tvrenja ili pretpostavki koje se tiu osobina jednog ili vie osnovnih skupova. Npr. testiranjem se moe provjeriti da li je osnovano tvrenje: - proizvoaa da prosjeno trajanje baterije iznosi najmanje 100 asova;- da postoji veza izmeu stope nezaposlenosti i stope inflacije;- proporcija biraa koji bi glasali za neku stranku u dva grada je jednaka, itd.Primijetimo:Na svako od postavljenih pitanje postoje samo dva mogua odgovora: da ili ne.Prilikom testiranja statistikih hipoteza koristimo uzorak na osnovu koga donosimo odluku da li su postavljene pretpostavke prihvatljive ili nisu.Statistika hipoteza je precizno formulisano tvrenje ili pretpostavka o nekoj vanoj karakteristici jednog ili vie skupova.Statistiki metod kojim se empirijska evidencija uzorka koristi radi procjenjivanja njene prihvatljivosti naziva se testiranje hipoteze, a procedura statistikim testom.Preporuke za izbor izmeu ocjenjivanja i testiranja:Ocjenjivanje se koristi kada je potrebno samo doi do informacije o nepoznatom parametru osnovnog skupa.Testiranje statistikih hipoteza koristimo ako su istovremeno ispunjeni uslovi:- Na istraivako pitanje (problem) postoje samo dva mogua odgovora da ili ne;- Problem se rjeava korienjem uzorka.Prilikom testiranja hipoteze uvijek je prisutan rizik da emo u odluci pogrijeiti.Kod testiranja moemo napraviti dvije vrste greaka, koje se mogu kontrolisati.Podjela statistikih testovaStatistiki testovi se mogu podijeliti u tri grupe:1. Testovi zasnovani na jednom uzorku2. Testovi zasnovani na dva uzorka3. Testovi zasnovani na tri i vie uzorakaPodjela prema broju uzorakaPodjela statistikih testovaStatistiki testovi se mogu podijeliti u dvije grupe:1. Parametarski (klasini) testovi2. Neparametarski testoviPodjela prema vrsti i jaini pretpostavkiParametarski testovi dijele preduslov da osnovni skup (skupovi) kome pripada analizirani uzorak (uzorci) ima normalan raspored.Ako je ovaj preduslov ispunjen tada su parametarski testovi optimalan izbor.Neparametarski testovi ne zavise od rasporeda skupa.Klasifikacija najpoznatijih statistikih testovaPatrametarski NeparametarskiTestovi zasnovani na jednom uzorkuz-test, t-test Test znakova, Wilcoxon-ov test ranga sa znakomTestovi zasnovani na dva uzorkaz-test, t-test Test znakova, Wilcoxon-ov test ranga sa znakom, Test sume rangovaTestovi zasnovani na tri i vie uzorakaAnaliza varijanse2test, Kruskal-Wallis, FriedmanKontroverze i ogranienja statistikog testiranja hipotezaNajpoznatiji statistiar prolog vijeka Sir Ronald Fisher (1890-1962) je smatrao da se procedura testiranja hipotezatreba zasnivati na postavljanjusamo jedne hipoteze i na tzv. p-vrijednosti.Kontroverze i ogranienja statistikog testiranja hipotezaEgon Pearson (1895-1980) i Jerzy Newman (1894-1981): testiranje se zasniva na nultoj i alternativnoj hipotezi, na nivou znaajnosti testa i na kritinim oblastima testa.Polemika voena od 1930. do 1962. god.Kontroverze i ogranienja statistikog testiranja hipotezaRevolucijom kompjuterske tehnologije izraunavanje p-vrijednosti je postalo krajnje jednostavno (uz pomo statistikog softvera). Svi statistiki softveri bazirali su testiranje iskljuivo na osnovu p-vrijednosti.Mi emo se bazirati na integraciji oba pravca.Postupak statistikog testiranja hipoteza1. Na osnovu postavljenog problema formulie se nulta i alternativna hipoteza i bira se tzv. nivo znaajnosti.2. Uzima se sluajan uzorak, bira odgovarajui test i izraunava tzv. statistika testa.3. Provjerava se da li su ispunjene pretpostavke na kojima se izabrani test zasniva. Ako nisu, prekida se proces testiranja i bira se neki drugi test. 4. Odreuje se p-vrijednost.5. Formulie se pravilo odluivanja i donosi odluka o odbacivanju ili neodbacivanju nulte hipoteze.6. Formulie se zakljuak u kontekstu postavljenog problema.Nulta i alternativna hipotezaNulta i alternativna hipoteza predstavljaju dva precizna, meu sobom iskljuujua tvrenja ili postavke.Nulta hipoteza (H0) je postavka (iskaz) o vrijednosti nepoznatog parametra skupa. Da bi se H0odbacila potrebno je pronai dovoljno ubjedljive dokaze u uzorku. Konkretna nulta hipoteza varira od problema do problema, ali tipino se ona postavlja u vidu status quo, tj. da nema razlike, nema uticaja, ili da nema promjena.Nulta i alternativna hipotezaNulta hipoteza moe biti prosta i sloena.Nulta hipoteza je prosta ako se njom tvrdi da je parametar jednak tano jednoj, unaprijed poznatoj numerikoj vrijednosti, tzv. hipotetikoj vrijednosti. Nultu hipotezu, npr. moemo simboliki napisati: H0:=500 grama, i itamo: nulta hipoteza glasi da je aritmetika sredina skupa jednaka 500 grama. H0:500 grama je sloena. Bez obzira kako je postavljena , nulta hipoteza uvijek mora da sadri znak jednakosti.Nulta i alternativna hipotezaSvakoj nultoj hipotezi suprostavljamo alternativnu hipotezu i oznaavamo je sa H1ili Ha.Alternativna hipoteza je tvrenje o parametru skupa koje e biti prihvaeno samo kada se nau dovoljno ubjedljivi dokazi o uzorku.Najee se postavlja u vidu da ima razlike, da postoji uticaj ili da je dolo do promjene.Nulta i alternativna hipotezaAlternativna hipoteza najee sadri sve vrijednosti koje parametar moe imati, a koje nisu obuhvaene nultom hipotezom. Zbog toga je, u pravilu, data u obliku sloene hipoteze. H1se u naunim istraivanjima esto naziva i istraivakom hipotezom, jer njom istraiva izraava miljenje koje postupkom testiranja nastoji da potvrdi. Usljed toga, u praksi esto najprije postavljamo alternativnu hipotezu, a tek zatim nultu.Nulta i alternativna hipotezaPrimjer 1: Pretpostavimo da postoji sumnja da prosjena potronja benzina novog modela automobila marke Audi u gradskoj vonji (na 100 km) odstupa od deklarisane, koja iznosi 8 litara. Osnovanost ove sumnje provjeriemo postavljanjem hipoteza u vidu:H0: = 8 l H1: # 8 lProsta hipoteza Sloena hipotezaNulta i alternativna hipotezaPrimjer 2: Pretpostavimo da proizvoa CD-ova tvrdi da je uee karta u njegovoj isporuci manje od 1%. Za kupca je kritino ako je uee vee od 1%, pa e on prvo postavi alternativnu hipotezu u vidu >0,01. Tek nakon toga suprostavie joj odgovarajuu nultu 0,01.H0: 0,01H1: >0,01p-vrijednostp-vrijednost je vjerovatnoa, izraunata pod pretpostavkom da je nulta hipoteza tana, da statistika testa uzme vrijednost koja je toliko ekstremna ili jo ekstremnija od one upravo realizovane. to je manja p-vrijednost, jai su dokazi protiv nulte hipoteze.to je p-vrijednost manja, podaci su manje konzistentni sa nultom hipotezom.p-vrijednostPostavlja se pitanje Koliko mala (bliska nuli) treba da bude p-vrijednost da bismo odbacili nultu hipotezu?Uvijek postoji mogunost da emo da emo odbaciti istinitu nultu hipotezu. Logino je da uporedimo dobijenu p-vrijednost sa nivoom znaajnosti , koji ukazuje na vjerovatnou odbacivanja istinite nulte hipoteze.p-vrijednostPravilo odluivanja na osnovu p-vrijednosti glasi:Ako je p-vrijednost manja od nivoa znaajnosti , nulta hipoteza se odbacuje. U suprotnom, kazaemo da nemamo dovoljno argumenata daodbacimo H0.p-vrijednostZbog estih greaka u praksi u tumaenju p-vrijednosti, potrebno je voditi rauna o sljedeem:a) p-vrijednost nije vjerovatnoa da je nulta hipoteza tana,b) p-vrijednost nita ne govori o veliini razlike izmeu hipotetine vrijednosti i dobijenog rezultata na osnovu uzorka.p-vrijednostAko je p-vrijednost manja od nivoa znaajnosti , kaemo da je dobijeni rezultat statistiki znaajan ili signifikantan. U suprotnom, kaemo da rezultat nije statistiki znaajan.Ako je p-vrijednost jednaka ili manja od nivoa znaajnosti , kaemo da je rezultat statistiki znaajan na nivou .p-vrijednostInterpretacija jaine argumenata protiv nulte hipoteze:p-vrijednost> 0,05Nemamo dovoljno dokaza protiv nulte hipoteze (H0)p-vrijednost < 0,05Jaki dokazi da je H0pogrenap-vrijednost< 0,01Veoma jaki dokazi da je H0pogrenap-vrijednost< 0,001Izuzetno jaki dokazi da je H0pogrena