Osnovi statistike

  • View
    51

  • Download
    5

Embed Size (px)

DESCRIPTION

osnovi statistike

Text of Osnovi statistike

  • TESTIRANJE STATISTIKIH HIPOTEZA

    U ovom poglavlju upoznaemo se sa jednim od najznaajnijih, najkorisnijih, ali ujedno i najkontroverznijih statistikih metoda, testiranjem hipoteza. Testiranje hipoteza ima veliku primenu kako u praktinim tako i u teorijskim istraivanjima. Danas je, na primer, u SAD nezamislivo dobiti odobrenje za distribuciju novog leka od FDA (Food and Drug Administration) pre detaljnog ispitivanja efektivnosti i sigurnosti tog leka, u kome kljunu ulogu ima testiranje hipoteza. Takoe, publikovanje radova u referentnim strunim asopisima iz razliitih oblasti (medicine, farmacije, psihologije, pedagogije, biologije, poljoprivrede, istraivanja trita) esto podrazumeva da su tvrenja i hipoteze potkrepljeni rezultatima nekog statistikog testa. Podsetimo se da je cilj statistikog zakljuivanja da se na osnovu informacije iz uzorka doe do to je mogue pouzdanije i preciznije informacije o populaciji. U prethodnom poglavlju smo detaljnije govorili o ocenjivanju nepoznatih parametara skupa. Rekli smo da se ono koristi kada istraiva nema nikakvo prethodno saznanje o relevantnim karakteristikama posmatranog skupa. Krajnji proizvod ocenjivanja je interval poverenja u kome se sa odgovarajuom pouzdanou nalazi nepoznati parametar. Druga oblast statistikog zakljuivanja, testiranje statistikih hipoteza, koristi se kada o skupu imamo neku prethodnu informaciju. Cilj testiranja je

    8. g

    lava

    CILJEVI POGLAVLJA

    Nakon itanja ovoga poglavlja biete u stanju da:

    1. shvatite logiku, znaaj i ogranienja statistikog testiranja hipoteza

    2. razumete razliku izmeu testiranja na osnovu kritinih vrednosti i p-vrednosti

    3. primenite najpoznati je parametarske testove u sluaju jednog i dva uzorka

    4. protuma i te raunarski iz laz testiranja hipoteza ako korist ite stat ist iki softver i l i Excel

  • 170 OSNOVI STATISTIKE

    da se ispita prihvatljivost nekog tvrenja ili pretpostavke koja se tie karakteristike jednog ili vie osnovnih skupova. Na primer, testiranjem se moe proveriti :

    da li je osnovano tvrenje proizvoaa da proseno trajanje baterija za mobilni telefon Nokia N95, pre dopunjavanja, iznosi najmanje 380 asova,

    da li 35% mladih u Srbiji smatra da je najvei problem u naoj zemlji alkoholizam,

    da li je prosena duina studiranja na privatnim i dravnim univerzitetima jednaka,

    da li visina studenata Vaeg univerziteta priblino sledi normalan raspored,

    postoji li veza izmeu broja nezaposlenih i broja kriminalnih dela, da li uzimanje antioksidanata usporava starenje, i sl. Primetimo da na svako od postavljenih pitanja postoje samo dva mogua odgovora: da ili ne.

    Na osnovu reenog moemo dati generalnu preporuku da se testiranje hipoteza primenjuje ako su istovremeno ispunjena sledea tri uslova:

    a) Raspolaemo nekim prethodnim saznanjem (pretpostavkom) o karakteristici skupa;

    b) Na istraivako pitanje (problem) postoje samo dva mogua odgovora, da ili ne;

    c) Problem se reava korienjem sluajnog uzorka.

    Kao to smo vie puta naglasili, tanu vrednost parametra skupa moemo odrediti samo na osnovu svih elemenata skupa. Zato smo zakljuak ocenjivanja uvek donosili sa rezervom, tj. tvrdili smo sa pouzdanou manjom od 100% da interval poverenja sadri nepoznati parametar. Analogno, da bismo bili potpuno sigurni u tanost odreene pretpostavke ili tvrenja o karakteristici populacije, morali bismo da izvrimo popis. Kako iz ve poznatih razloga to najee ne inimo, rezultat testiranja koji donosimo na osnovu informacije iz uzorka ne moe biti da je polazna pretpostavka tana ili pogrena. Umesto toga, u zakljuku sa odgovarajuim rizikom tvrdimo da je pretpostavka prihvatljiva ili da nije prihvatljiva.

    Statistika hipoteza je precizno formulisana pretpostavka (iskaz) o nekoj vanoj osobini jednog ili vie skupova. Statistiki metod koji na sistematski nain empirijske podatke uzorka koristi radi utvrivanja prihvatljivosti hipoteze naziva se testiranjem hipoteze, a sama procedura statistikim testom.

  • POGLAVLJE 8 Testiranje statistikih hipoteza 171

    8.1 KLASIFIKACIJA TESTOVA I IZBOR OPTIMALNOG TESTA

    Sve statistike testove moemo klasifikovati po tri osnova:

    Prema prirodi problema koje reavamo razlikujemo: testove o parametrima skupa (aritmetikoj sredini, proporciji, medijani, varijansi itd.), o obliku rasporeda skupa, o nezavisnosti dva obeleja, o sluajnosti uzorka, itd.

    Prema broju uzoraka na kojima zasnivamo testiranje testove delimo u tri grupe:

    Prema vrsti i jaini preduslova na kojima se zasnivaju razlikujemo:

    Zadrimo se za trenutak na treoj podeli. Parametarski testovi se ponekad nazivaju klasinim testovima, jer su formulisani znatno pre neparametarskih, poetkom XX-og veka. Njihova teorijska podloga se bazira na tadanjem uverenju istraivaa da u prirodi i drutvu preovladava samo jedan, normalan raspored. Otuda parametarski testovi imaju zajedniki preduslov da osnovni skup (ili skupovi) kome pripada analizirani uzorak (odnosno uzorci) sledi normalan raspored. Nasuprot njima, neparametarski testovi, koji su nastali uglavnom sredinom XX veka, predstavljaju loginu reakciju statistiara na injenicu da se pretpostavka o normalnosti svih pojava pokazala netanom. Ovi testovi se zasnivaju na mnogo blaim uslovima o obliku osnovnog skupa, a mogu se primenjivati i na kvalitativna obeleja. Zbog velikog broja razliitih testova, svakom korisniku statistike neminovno se namee jednostavno pitanje: Koji test treba da primenim da bih reio svoj istraivaki problem? Odgovor nije trivijalan, jer je u statistikoj teoriji formulisan ne samo veliki broj testova sa razliitom namenom, ve se ponekad ista hipoteza moe proveravati primenom vie razliitih testova. Budui da svaki test poiva na specifinim preduslovima koji moraju biti ispunjeni da bi

    Statistiki testovi Parametarski testovi

    Neparametarski testovi

    Testovi zasnovani na jednom uzorku

    Testovi zasnovani na dva uzorka

    Testovi zasnovani na tri i vie uzoraka

    Statistiki testovi

  • 172 OSNOVI STATISTIKE

    rezultat bio validan, treba izabrati onaj test koji je optimalan u datoj situaciji, a to znai test za koji su preduslovi primene zadovoljeni. Recimo, ipak, da je ovakav pristup testiranju relativno nov. Naime, tokom veeg dela XX veka korieni su iskljuivo parametarski testovi, pri emu je uslov normalnosti skupa retko proveravan zbog komplikovane i nepouzdane procedure. Situacija se potpuno izmenila u poslednjih deset godina. Sa optom dostupnou raunara i statistikog softvera, preduslovi primene testova se mogu lako proveriti, a sam test primeniti na podatke iz uzorka. Zbog toga naglasak u modernom testiranju hipoteza vie nije puka primena nekog testa, ve pre svega:

    1) ispitivanje da li su preduslovi na kojima se test zasniva ispunjeni i 2) korektna interpretacija rezultata.

    U ovom poglavlju razmatraemo parametarske testove kojima se testira aritmetika sredina i proporcija jednog i dva osnovna skupa. U sledeem poglavlju posmatraemo parametarski test zasnovan na vie uzoraka kojim se testira hipoteza o jednakosti aritmetikih sredina vie osnovnih skupova. Parametarske testove emo, takoe, primenjivati i u regresionoj i korelacionoj analizi, koje su predmet razmatranja u 12. i 13. poglavlju. Neparametarskim testovima emo se baviti u 11. poglavlju.

    8.2 POSTUPAK TESTIRANJA STATISTIKIH HIPOTEZA

    Pre nego to preemo na proceduru testiranja daemo dva primera, da bi se shvatile mogunosti primene i logika samog testiranja.

    PRIMER 8.11: U jednom od najpoznatijih sudskih procesa u prolom veku, poznati ameriki fudbaler i glumac O. J. Simpson je optuen za ubistvo svoje bive supruge Nikol i njenog dvadesetpetogodinjeg poznanika Ronalda Goldmena. Proces je trajao 133 dana, kotao je preko 15 miliona dolara i kontinuirano je prenoen na televiziji. Iako je policija smatrala da je prikupila dovoljno dokaza za njegovu krivicu, porota je 03. 10. 1995. presudila da Simpson nije kriv. Istoga dana Galup je sproveo anketu i procenio da je ak 56% amerikih graana smatralo presudu pogrenom, a samo 33% je podralo. Pravni sistem u velikom broju zemalja optuenog smatra nevinim sve dok se ne nae dovoljno dokaza da se on proglasi krivim. Ovo emo statistiki nazvati nultom hipotezom: optueni nije kriv za poinjeno delo. Nultu hipotezu smatramo tanom sve dok ne sakupimo dokaze da je ona pogrena, odnosno da je tana alternativna hipoteza: optueni je kriv. Pri svemu tome,

    1 O suenju O. J. Simpsona pogledati, na primer, http://www.law.umkc.edu/faculty/projects/ftrials/Simpson/simpson.htm

  • POGLAVLJE 8 Testiranje statistikih hipoteza 173

    nastojimo da koliko je mogue smanjimo (poeljno na 0) verovatnou da osudimo nevinu osobu, tj. da odbacimo istinitu nultu hipotezu. Naalost, kao posledica, poveava se verovatnoa da nainimo drugaiju greku: da oslobodimo optuenog iako je on stvarno kriv. Statistiki reeno, postoji verovatnoa da ne odbacimo pogrenu nultu hipotezu. Za shvatanje koncepcije testiranja napomenimo da porota nikada ne donosi odluku da je optueni nevin, ve samo da nije kriv. Iako ovo izgleda kao finesa, razgranienje je jako bitno u proceduri testiranja. Odmah napomenimo da se u statistici nikada ne zakljuuje da je nulta hipoteza stvarno istinita, ve samo da nemamo dovoljno dokaza da je odbacimo. Da li je O. J. Simpson stvarno bio nevin? Odgovor je verovatno negativan, ali porota nije nala dovoljno dokaza da ga proglasi krivim za ubistvo bive supruge. PRIMER 8.2