Upload
konstruktivacgik
View
27
Download
1
Embed Size (px)
Citation preview
UNIVERZITET U BANJOJ LUCI ARHITEKTONSKO-GRAĐEVINSKO-GEODETSKI FAKULTET BANJA LUKA PREDMET: VJEROVATNOĆA I STATISTIKA
SEMINARSKI RAD: TESTIRANJE STATISTIČKIH HIPOTEZA
PROFESOR: dr Milenko Pikula STUDENT: Petar Praštalo 23/12
Sadržaj:
1.UVOD .................................................................................................................................................... 1
1.TESTIRANJE HIPOTEZA .......................................................................................................................... 2
2.TEST HIPOTEZE ZA VJEROVATNOST BINOMNE DISTRIBUCIJE n ................................................. 4
3.TESTIRANJE HIPOTEZE ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA POZNATA .... 5
4.TESTIRANJE HIPOTEZA ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA NEPOZNATA 7
5.ZAKLJUČAK ......................................................................................................................................... 10
6.LITERATURA ........................................................................................................................................ 11
1
1.UVOD
Statističko testiranje ili testiranje statističkih hipoteza je način da se dodje od kvalitetna odluke na osnovu prikupljenih podataka i određenih pretpostavki. Statističko testiranje ima široku upotrebu u raznim oblastima biologije, medicine, tehnike, ekonomije, agronomije i drugih nauka. Statistička hipoteza je pretpostavka o karakteristikama osnovnog skupa koja se može statistički provjeriti, a ta provjera zove se statističko testiranje i podrazumjeva odbacivanje ili neodbacivanje hipoteze na osnovu posmatranja uzorka, tj. odlučivanja. U ovom radu ću da objasnim šta je statističko testiranje kroz teoriju, odnosno definicije i kroz realne primjere koji se pojavljuju u praksi da bi bolje razumjeli materiju.
Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama
(najčešće naučnim ili iskustvenim). Jednom formirana hipoteza se koristi za izvođenje
zaključaka o posmatranom problemu uz pomoć odgovarajućeg statističkog metoda.
Podela testova: Parametarski testovi. Neparametarski testovi.
Postupak testiranja hipoteze se izvodi u nekoliko koraka: 1. Definišu se nulta i alternativna hipoteza. 2. Izbor modela teorijskog rasporeda. 3. Određuje se nivo značajnosti testa αodnosno verovatnoća (1−α). 4. Definisanje uzorka. 5. Izračunavanje statistike testa na osnovu uzorka. 6. Iz tablice teorijskog rasporeda očitava se tablična vrednost (kriterijum). 7. Upoređivanje statistike testa sa tabličnom vrednošću. 8. Odluka o prihvatanju ili odbacivanju formulisane hipoteze.
2
1.TESTIRANJE HIPOTEZA
Teorija testiranja statističkih hipoteza sastoji se u određivanju kriterija na osnovu
kojeg pomoću eksperimentalnih vrijednosti slu·cajne varijable mozemo odlučiti prihvaćamo li ili odbacujemo hipotezu. Parametarske hipoteze odnose se na parametre poznate funkcije distribucije slučajne varijable, a neparam-etarske se odnose na nepoznatu razdiobu. Definicija statitstičke hipoteze: je bilo koja pretpostavka o distribuciji neke slučajne varijable (slučajnog vektora). Neparametarska hipoteza je pretpostavka o funkciji distribucije neke slučajne varijable. Parametarska hipoteza je pretpostavka o parametrima poznate distribucije neke slučajne varijable. Statističke hipoteze označavamo sa H0; H1; ::; Hn. PRIMJER: H0( λ = λ0) je parametarska hipoteza za parametar λ u Poissonovoj diatribuciji. Definicija proste hipoteze: Parametarska hipoteza je prosta hipoteza ako sadrzi samo jednu pretpostavku o parametru (npr. H0(μ = μ 0)). Parametarska hipoteza je složena ako se sastoji od konačno ili beskonačno mnogo prostih hipoteza (npr. H1(μ > μ 0);H1(μ < μ 0);H1(μ 6= μ 0);). Definicija statističkog testa: Testiranje statističkih hipoteza moguće je ako postaje barem dvije alternativne hipoteze: H0 nulta hipoteza i njoj alternativna H1 hipoteza (u nekom smislu suprotna). Statistiku T na uzorku (X1;X2; :::;Xn) pomoću koje se donosi odluka o prihvćanju nulte hipoteze ili prihvaćanju neke od alternativno postavljenih hipoteza ako je dobivena vrijednost slučajnog uzorka (x1; x2; :::; xn) zovemo statističkim testom. Test statistika ima svoju poznatu distribuciju. PRIMJER: Neka je nulhipoteza H0( = ) za slučajne varijable koje imaju normalnu
distribuciju. Test statistika T = ima distibuciju Fishera.
PRIMJER: Neka je nulhipoteza H0(p = p0) za slučcajne varijable koje imaju B(1; p) binomnu distribuciju.
Test statistika T = ima normalnu distribuciju
T N (p, p(1 - p)), za n .
Definicija greške prve vrste, nivo značajnosti: Testom je napravljena greška prve vrste ako se nije prihvatila ispravna nulhipoteza. Vjerojatnost da se napravi greška prve vrste naziva se nivo (razina) značajnosti i označava s . Definicija greške druge vrste, jakost testa: Testom je napravljena greška druge vrste ako se prihvatila lažna nulta hipoteza. Vjerojatnost da se napravi greška druge vrste označava se s . Vjerojatnost da se ne napravi greška druge vrste zove se jakost testa i označava se s .
3
(Jakost testa je vjerojatnost da se odbaci lažna nulta hipoteza.) Definicija kritično područje: Vrijednost statistike T na uzorku (X1;X2; :::;Xn) na osnovu koje odlučujemo prihvacamo li ili odbacujemo nultu hipotezu H0 zove se kritična tačka. Skup vrijednosti statistike T za koje se prihvaća H0 zove se područje prihavaćanja nulte hipoteze, a skup vrijednosti statistike T za koje se ne prihvaća H0 zove se kritično područje. Jednostrano kritično područje može biti odredeno s uvjetom T > za > 0 ili uvjetom T < za < 0. Dvostrano kritično područje odredeno je s uvjetom T < i T > za < . NAPOMENA: Neka je zadan nivo značajnosti i test statistika T za parametarsku hipotezu H0(parametar = parametar0). Za jednostrani test, desnu kritičnu tačku ( > 0) odredujemo iz uvjeta da P(T> )= . Za jednostrani test, lijevu kritičnu tačku ( < 0) odredujemo iz uvjeta da P(T< )= . Za dvostrani test kritične tačke , , određujemo iz uvjeta P(T< )+P(T> )= . U slučaju simetrične distribucije test statistike T kritične tačke , , određujemo iz
uvjeta P(T < ) =
P(T > ) = .
= kvantil za F funkciju distribucije test statistike T,
= kvantil za F funkciju distribucije test statistike T.
NAPOMENA: Vrijednosti ; ovise o Zelimo da obje greške budu male a to je kontradiktorno (ako opada, se miče u desno i raste. U praksi se na početku izabere ( = 0:05 ili = 0:01), zatim se odredi i na kraju se izračuna . Ako je veliko onda ponavljamo test pomoću većeg uzorka.
4
2.TEST HIPOTEZE ZA VJEROVATNOST BINOMNE DISTRIBUCIJE n
Teorem: Ako se testira: Nulta hipoteza ( = ) i alternativna ( )
Pomoću dvostranog testa, izaberemo test statistiku T = koja ima standardnu
normalnu distribuciju T N (0,1), za n . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke
, , određujemo iz uvjeta
P(T < ) =
P(T > ) =
= = su kvantili za F*, funkciju distribucije T .
Područje prihvaćanja za nultu hipotezu ( = ) za nivo značajnosti je ( , . Ako je vrijednost test statistike T( …… ),
i = ( , prihvaćamo nultu hipotezu ( = ).
Primjer: Napravljen je slučajni pokus bacanje novčića. Pokus je ponovljen n=4040 puta i dobiveno je 2048 glava. Znamo da je uspjeh u pokusu binomna slučajna varijabla s parametrom vjerovatnost da padne glava. Testiramo hipotezu ( = ) tj. testiramo hipotezu da je novčić ispravan. Alternativna hipoteza je ( ). Neka je nivo značajnosti Rješenje:
( = ) ( ) ( ( ).
Test statistike je T = ima standardnu normalnu distribuciju T N (0,1), za
n . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke
, , određujemo iz uvjeta
P(T < ) =
P(T > ) = .
= = su kvantili za F*, funkciju distribucije T .
Za zadani test = = su kvantili za F*, funkciju distribucije T
= = = 1,96, = = 1,96.
Područje prihvatanja za nultu hipotezu ( = ) za nivo značajnosti je ( , = (-1.96, 1.96) Vrijednost test statistike T( …… ),
t = = i = = 0.88104,
5
( , je unutar područja prihvatljivosti nulte hipoteze, pa prihvaćamo nultu hipotezu ( = ), novčić je ispravan.
3.TESTIRANJE HIPOTEZE ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA POZNATA Teorem: Ako se testira : Nulta hipoteza i alternativna .
Pomoću dvostranog testa, izabiremo test statistiku T = koja ima standardnu
normalnu distribuciju T . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke
određujemo iz uvjeta
P (T ) =
P (T ) =
= z , = - su kvantili za funkciju distribucije T N (0,1).
Područje prihvaćanja za nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),
t = ( ) prihvaćamo nultu hipotezu ).
(b) Ako se testira : Nulta hipoteza ( ) i alternativna ( )
Pomoću jednostranog testa, izabiremo test statistiku T = koja ima standardnu
normalnu distribuciju T . Za jednostrani test, kritičnu tačku određujem iz uvjeta P (T ) =
, je kvantil za , funkciju distribucije test statistike T . Kritično područje za nultu hipotezu za nivo značajnosti je ).
Ako je vrijednost test statistike T ( ), t = ( ) odbacujemo
nultu hipotezu i prihvaćamo alternativnu hipotezu ( ). (c) Ako se testira : Nulta hipoteza i alternativna ( ) pomoću jednostranog testa,
izabiremo test statistiku T = koja ima standardnu normalnu distribuciju
T . Za jednostrani test, kritičnu tačku određujemo iz uvjeta P (T ) =
, je kvantil za , funkciju distribucije test statistike T . Kritično područje za nultu hipotezu za nivo značajnosti je ( , ).
Ako je vrijednost test statistike T ( ), t = ( , ) odbacujemo nultu
hipotezu i prihvaćamo alternativnu hipotezu ( ).
6
PRIMJER : Slučajna varijabla X N , = 4). U uzorku veličine n=25 vrijednost uzoračke aritmetičke sredine je = 14,7. Za nivo značajnosti = 0.01. Testirati :
(a) Nultu hipotezu ( = 16) i alternativnu hipotezu ( 16). (b) Nultu hipotezu ( = 16) i alternativnu hipotezu ( 16).
Rješenje : (a) Ako se testira :
Nulta hipoteza i alternativna .
Pomoću dvostranog testa, izabiremo test statistiku T = koja ima standardnu
normalnu distribuciju T . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke
određujemo iz uvjeta
P (T ) =
P (T ) =
= z , = - su kvantili za funkciju distribucije T N (0,1).
Za = 0,01
= z = = 2,58,
= - = 2,58.
Područje prihvaćanja za nultu hipotezu za nivo značajnosti = 0,01 je ( , = (-2,58, 2,58). Vrijednost test statistike T ( ),
t = = i = = -3.25 ( , nije upala u područje prihvaćanja,
odbacujemo nultu hipotezu prihvaćamo alternativnu hipotezu .
(b) Ako je se testira nulta hipoteza i alternativna ( ) pomoću
jednostranog testa, izabiremo test statistiku T = koja ima standardnu
normalnu distribuciju T . Za jednostrani test, kritičnu tačku određujemo iz uvjeta P (T ) =
= je kvantil za funkciju distribucije test statistike T N (0,1). Za
= = = -2.33
Kritično područje za nultu hipotezu za nivo značajnosti je (-
(- Vrijednost test statistike T ( ),
t = = i = = -3.25 ( , upala u kritično područje,
odbacujemo nultu hipotezu i prihvaćamo alternativnu hipotezu .
7
4.TESTIRANJE HIPOTEZA ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA NEPOZNATA Teorem:
(a) Ako je se testira: nulta hipoteza i alternativna pomoću
dvostranog testa, izabiramo test statistiku T = koja ima studentovu
distribuciju T t (n-1). Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke
određujemo iz uvjeta
P (T ) =
P (T ) =
= , = su kvantili za funkciju distribucije T t (n-1).
Područje prihvaćanja za nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),
t = ( ) prihvaćamo nultu hipotezu ).
(b) Ako je se testira: nulta hipoteza i alternativna pomoću
jednostranog testa, izabiramo test statistiku T = koja ima studentovu
distribuciju T t (n-1). Za jednostrani test, kritične tačke određujemo iz uvjeta P (T ) =
= je kvantil za F, funkciju distribucije test statistike T t (n-1). Kritično područje nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),
t = ( ) odbacujemo nultu hipotezu i prihvaćamo alternativnu hipotezu
).
(c) Ako je se testira: nulta hipoteza i alternativna pomoću
jednostranog testa, izabiramo test statistiku T = koja ima studentovu
distribuciju T t (n-1). Za jednostrani test, kritične tačke određujemo iz uvjeta P (T ) =
= je kvantil za F, funkciju distribucije test statistike T t (n-1). Kritično područje nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),
t = ( , ) odbacujemo nultu hipotezu i prihvaćamo alternativnu hipotezu
). Napomena:
8
Kvantili za studentovu distribuciju za n= 5, t(4), F ( ) = :
0.05 0.01 -2.13 -1.53
2.13 1.53
0.05 0.01
0.025 0.005
-2.78 -4.60
2.78 4.60
Primjer: Neka slučajna varijabla ima normalnu distribuciju X N ( ) nepoznate varijanse Uzet je uzorak veličine n = 5 i dobivena je vrijednost uzoračke aritmetičke sredine
=10.2, i vrijednost korigirane uzoračke varijanse =0.64. Za nivo značajnosti testirati:
(a) Nultu hipotezu i alternativnu hipotezu . (b) Nultu hipotezu i alternativnu hipotezu .
Rješenje:
(a) Ako je se testira: nulta hipoteza i alternativna pomoću
dvostranog testa, izabiramo test statistiku T = koja ima studentovu
distribuciju T t (n-1).
Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke određujemo iz uvjeta
P (T ) =
P (T ) =
= , = su kvantili za funkciju distribucije T t (n-1).
Za , n-1 = 4 = = = 2,78,
= = 2,78.
Područje prihvaćanja za nultu hipotezu za nivo značajnosti = 0,05 je ( , = (-2.78, 2.78). Vrijednost test statistike T ( ),
t = = = 0.55902 ( , je upala u područje prihvaćanja, pa
prihvaćamo nultu hipotezu
9
(b) Ako je se testira nulta hipoteza i alternativna ( ) pomoću
jednostranog testa, izabiremo test statistiku T = koja ima standardnu
normalnu distribuciju T .
Za jednostrani test, kritičnu tačku određujemo iz uvjeta P (T ) =
= je kvantil za funkciju distribucije test statistike T N (0-1). Za
= = = = 2.13, = -2.13
Kritično područje za nultu hipotezu za nivo značajnosti je (-
(- Vrijednost test statistike T ( ),
t = = = 0.559 ( , nije upala u kritično područje za nultu
hipotezu, pa prihvaćamo nultu hipotezu .
10
5.ZAKLJUČAK
U ovom radu sam obradio temu statističkih testova i njihove primjere kako bi
bolje shvatili za što se najviše koriste u praksi. Jasno nam je da kroz definicije i primjere vidimo da statistički testovi mogu imati veoma široku primjenu u praksi u više različitih nauka i oblati a njihova rješenja doprinose odlučivanju na osnovu parametara podataka i rezultata. Kroz ovaj rad naučili smo šta je statističko testiranje, koje vrste hipoteza se postavljaju, šta je kritično područje i nivo značajnosti. A kroz primjere smo mogli vidjejeti da kako se nulta hipoteza testira u odnosu na alternativnu pod određenim i različitim uslovima, te na osnovu rezultata da li je prihvatiti ili ne.
11
6.LITERATURA
1. Statističke metode u menadžmentu, Đuro Mikić, Nebojša Ralević, Prijedor,
2006.god. 2. Nevenka skakić, Vjerovatnoća i statistika, Banja Luka. 3. Testiranje statističkih hipoteza, Vida Šimić, Ksenija Smoljak, Kristina Krulić,
(http://www.ttf.unizg.hr/b-news/news_upload_files/2009/vijest_27-02-2009_49a83133421c0/parametarski_testovi_prez.pdf)
4. Testiranje hipoteza, Mirjana Kujundžić Tiljak, Davor Ivanković (http://www.mef.unizg.hr/meddb/slike/pisac15/file1525p15.pdf)
5. Testiranje hipoteza, (http://www.grad.hr/vera/webnastava/vjerojatnostistatistika/testhipocek.pdf)