Statistika_Testiranje statistickih hipoteza.pdf

UNIVERZITET U BANJOJ LUCI ARHITEKTONSKO-GRAĐEVINSKO-GEODETSKI FAKULTET BANJA LUKA PREDMET: VJEROVATNOĆA I STATISTIKA

SEMINARSKI RAD: TESTIRANJE STATISTIČKIH HIPOTEZA

PROFESOR: dr Milenko Pikula STUDENT: Petar Praštalo 23/12

Sadržaj:

1.UVOD .................................................................................................................................................... 1

1.TESTIRANJE HIPOTEZA .......................................................................................................................... 2

2.TEST HIPOTEZE ZA VJEROVATNOST BINOMNE DISTRIBUCIJE n ................................................. 4

3.TESTIRANJE HIPOTEZE ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA POZNATA .... 5

4.TESTIRANJE HIPOTEZA ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA NEPOZNATA 7

5.ZAKLJUČAK ......................................................................................................................................... 10

6.LITERATURA ........................................................................................................................................ 11

1

1.UVOD

Statističko testiranje ili testiranje statističkih hipoteza je način da se dodje od kvalitetna odluke na osnovu prikupljenih podataka i određenih pretpostavki. Statističko testiranje ima široku upotrebu u raznim oblastima biologije, medicine, tehnike, ekonomije, agronomije i drugih nauka. Statistička hipoteza je pretpostavka o karakteristikama osnovnog skupa koja se može statistički provjeriti, a ta provjera zove se statističko testiranje i podrazumjeva odbacivanje ili neodbacivanje hipoteze na osnovu posmatranja uzorka, tj. odlučivanja. U ovom radu ću da objasnim šta je statističko testiranje kroz teoriju, odnosno definicije i kroz realne primjere koji se pojavljuju u praksi da bi bolje razumjeli materiju.

Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama

(najčešće naučnim ili iskustvenim). Jednom formirana hipoteza se koristi za izvođenje

zaključaka o posmatranom problemu uz pomoć odgovarajućeg statističkog metoda.

Podela testova: Parametarski testovi. Neparametarski testovi.

Postupak testiranja hipoteze se izvodi u nekoliko koraka: 1. Definišu se nulta i alternativna hipoteza. 2. Izbor modela teorijskog rasporeda. 3. Određuje se nivo značajnosti testa αodnosno verovatnoća (1−α). 4. Definisanje uzorka. 5. Izračunavanje statistike testa na osnovu uzorka. 6. Iz tablice teorijskog rasporeda očitava se tablična vrednost (kriterijum). 7. Upoređivanje statistike testa sa tabličnom vrednošću. 8. Odluka o prihvatanju ili odbacivanju formulisane hipoteze.

2

1.TESTIRANJE HIPOTEZA

Teorija testiranja statističkih hipoteza sastoji se u određivanju kriterija na osnovu

kojeg pomoću eksperimentalnih vrijednosti slu·cajne varijable mozemo odlučiti prihvaćamo li ili odbacujemo hipotezu. Parametarske hipoteze odnose se na parametre poznate funkcije distribucije slučajne varijable, a neparam-etarske se odnose na nepoznatu razdiobu. Definicija statitstičke hipoteze: je bilo koja pretpostavka o distribuciji neke slučajne varijable (slučajnog vektora). Neparametarska hipoteza je pretpostavka o funkciji distribucije neke slučajne varijable. Parametarska hipoteza je pretpostavka o parametrima poznate distribucije neke slučajne varijable. Statističke hipoteze označavamo sa H0; H1; ::; Hn. PRIMJER: H0( λ = λ0) je parametarska hipoteza za parametar λ u Poissonovoj diatribuciji. Definicija proste hipoteze: Parametarska hipoteza je prosta hipoteza ako sadrzi samo jednu pretpostavku o parametru (npr. H0(μ = μ 0)). Parametarska hipoteza je složena ako se sastoji od konačno ili beskonačno mnogo prostih hipoteza (npr. H1(μ > μ 0);H1(μ < μ 0);H1(μ 6= μ 0);). Definicija statističkog testa: Testiranje statističkih hipoteza moguće je ako postaje barem dvije alternativne hipoteze: H0 nulta hipoteza i njoj alternativna H1 hipoteza (u nekom smislu suprotna). Statistiku T na uzorku (X1;X2; :::;Xn) pomoću koje se donosi odluka o prihvćanju nulte hipoteze ili prihvaćanju neke od alternativno postavljenih hipoteza ako je dobivena vrijednost slučajnog uzorka (x1; x2; :::; xn) zovemo statističkim testom. Test statistika ima svoju poznatu distribuciju. PRIMJER: Neka je nulhipoteza H0( = ) za slučajne varijable koje imaju normalnu

distribuciju. Test statistika T = ima distibuciju Fishera.

PRIMJER: Neka je nulhipoteza H0(p = p0) za slučcajne varijable koje imaju B(1; p) binomnu distribuciju.

Test statistika T = ima normalnu distribuciju

T N (p, p(1 - p)), za n .

Definicija greške prve vrste, nivo značajnosti: Testom je napravljena greška prve vrste ako se nije prihvatila ispravna nulhipoteza. Vjerojatnost da se napravi greška prve vrste naziva se nivo (razina) značajnosti i označava s . Definicija greške druge vrste, jakost testa: Testom je napravljena greška druge vrste ako se prihvatila lažna nulta hipoteza. Vjerojatnost da se napravi greška druge vrste označava se s . Vjerojatnost da se ne napravi greška druge vrste zove se jakost testa i označava se s .

3

(Jakost testa je vjerojatnost da se odbaci lažna nulta hipoteza.) Definicija kritično područje: Vrijednost statistike T na uzorku (X1;X2; :::;Xn) na osnovu koje odlučujemo prihvacamo li ili odbacujemo nultu hipotezu H0 zove se kritična tačka. Skup vrijednosti statistike T za koje se prihvaća H0 zove se područje prihavaćanja nulte hipoteze, a skup vrijednosti statistike T za koje se ne prihvaća H0 zove se kritično područje. Jednostrano kritično područje može biti odredeno s uvjetom T > za > 0 ili uvjetom T < za < 0. Dvostrano kritično područje odredeno je s uvjetom T < i T > za < . NAPOMENA: Neka je zadan nivo značajnosti i test statistika T za parametarsku hipotezu H0(parametar = parametar0). Za jednostrani test, desnu kritičnu tačku ( > 0) odredujemo iz uvjeta da P(T> )= . Za jednostrani test, lijevu kritičnu tačku ( < 0) odredujemo iz uvjeta da P(T< )= . Za dvostrani test kritične tačke , , određujemo iz uvjeta P(T< )+P(T> )= . U slučaju simetrične distribucije test statistike T kritične tačke , , određujemo iz

uvjeta P(T < ) =

P(T > ) = .

= kvantil za F funkciju distribucije test statistike T,

= kvantil za F funkciju distribucije test statistike T.

NAPOMENA: Vrijednosti ; ovise o Zelimo da obje greške budu male a to je kontradiktorno (ako opada, se miče u desno i raste. U praksi se na početku izabere ( = 0:05 ili = 0:01), zatim se odredi i na kraju se izračuna . Ako je veliko onda ponavljamo test pomoću većeg uzorka.

4

2.TEST HIPOTEZE ZA VJEROVATNOST BINOMNE DISTRIBUCIJE n

Teorem: Ako se testira: Nulta hipoteza ( = ) i alternativna ( )

Pomoću dvostranog testa, izaberemo test statistiku T = koja ima standardnu

normalnu distribuciju T N (0,1), za n . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke

, , određujemo iz uvjeta

P(T < ) =

P(T > ) =

= = su kvantili za F*, funkciju distribucije T .

Područje prihvaćanja za nultu hipotezu ( = ) za nivo značajnosti je ( , . Ako je vrijednost test statistike T( …… ),

i = ( , prihvaćamo nultu hipotezu ( = ).

Primjer: Napravljen je slučajni pokus bacanje novčića. Pokus je ponovljen n=4040 puta i dobiveno je 2048 glava. Znamo da je uspjeh u pokusu binomna slučajna varijabla s parametrom vjerovatnost da padne glava. Testiramo hipotezu ( = ) tj. testiramo hipotezu da je novčić ispravan. Alternativna hipoteza je ( ). Neka je nivo značajnosti Rješenje:

( = ) ( ) ( ( ).

Test statistike je T = ima standardnu normalnu distribuciju T N (0,1), za

n . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke

, , određujemo iz uvjeta

P(T < ) =

P(T > ) = .

= = su kvantili za F*, funkciju distribucije T .

Za zadani test = = su kvantili za F*, funkciju distribucije T

= = = 1,96, = = 1,96.

Područje prihvatanja za nultu hipotezu ( = ) za nivo značajnosti je ( , = (-1.96, 1.96) Vrijednost test statistike T( …… ),

t = = i = = 0.88104,

5

( , je unutar područja prihvatljivosti nulte hipoteze, pa prihvaćamo nultu hipotezu ( = ), novčić je ispravan.

3.TESTIRANJE HIPOTEZE ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA POZNATA Teorem: Ako se testira : Nulta hipoteza i alternativna .

Pomoću dvostranog testa, izabiremo test statistiku T = koja ima standardnu

normalnu distribuciju T . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke

određujemo iz uvjeta

P (T ) =

P (T ) =

= z , = - su kvantili za funkciju distribucije T N (0,1).

Područje prihvaćanja za nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),

t = ( ) prihvaćamo nultu hipotezu ).

(b) Ako se testira : Nulta hipoteza ( ) i alternativna ( )

Pomoću jednostranog testa, izabiremo test statistiku T = koja ima standardnu

normalnu distribuciju T . Za jednostrani test, kritičnu tačku određujem iz uvjeta P (T ) =

, je kvantil za , funkciju distribucije test statistike T . Kritično područje za nultu hipotezu za nivo značajnosti je ).

Ako je vrijednost test statistike T ( ), t = ( ) odbacujemo

nultu hipotezu i prihvaćamo alternativnu hipotezu ( ). (c) Ako se testira : Nulta hipoteza i alternativna ( ) pomoću jednostranog testa,

izabiremo test statistiku T = koja ima standardnu normalnu distribuciju

T . Za jednostrani test, kritičnu tačku određujemo iz uvjeta P (T ) =

, je kvantil za , funkciju distribucije test statistike T . Kritično područje za nultu hipotezu za nivo značajnosti je ( , ).

Ako je vrijednost test statistike T ( ), t = ( , ) odbacujemo nultu

hipotezu i prihvaćamo alternativnu hipotezu ( ).

6

PRIMJER : Slučajna varijabla X N , = 4). U uzorku veličine n=25 vrijednost uzoračke aritmetičke sredine je = 14,7. Za nivo značajnosti = 0.01. Testirati :

(a) Nultu hipotezu ( = 16) i alternativnu hipotezu ( 16). (b) Nultu hipotezu ( = 16) i alternativnu hipotezu ( 16).

Rješenje : (a) Ako se testira :

Nulta hipoteza i alternativna .

Pomoću dvostranog testa, izabiremo test statistiku T = koja ima standardnu

normalnu distribuciju T . Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke


P (T ) =

P (T ) =

= z , = - su kvantili za funkciju distribucije T N (0,1).

Za = 0,01

= z = = 2,58,

= - = 2,58.

Područje prihvaćanja za nultu hipotezu za nivo značajnosti = 0,01 je ( , = (-2,58, 2,58). Vrijednost test statistike T ( ),

t = = i = = -3.25 ( , nije upala u područje prihvaćanja,

odbacujemo nultu hipotezu prihvaćamo alternativnu hipotezu .

(b) Ako je se testira nulta hipoteza i alternativna ( ) pomoću

jednostranog testa, izabiremo test statistiku T = koja ima standardnu

normalnu distribuciju T . Za jednostrani test, kritičnu tačku određujemo iz uvjeta P (T ) =

= je kvantil za funkciju distribucije test statistike T N (0,1). Za

= = = -2.33

Kritično područje za nultu hipotezu za nivo značajnosti je (-

(- Vrijednost test statistike T ( ),

t = = i = = -3.25 ( , upala u kritično područje,

odbacujemo nultu hipotezu i prihvaćamo alternativnu hipotezu .

7

4.TESTIRANJE HIPOTEZA ZA OČEKIVANJE NORMALNE DISTRIBUCIJE KADA JE VARIJANSA NEPOZNATA Teorem:

(a) Ako je se testira: nulta hipoteza i alternativna pomoću

dvostranog testa, izabiramo test statistiku T = koja ima studentovu

distribuciju T t (n-1). Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke


P (T ) =

P (T ) =

= , = su kvantili za funkciju distribucije T t (n-1).

Područje prihvaćanja za nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),

t = ( ) prihvaćamo nultu hipotezu ).

(b) Ako je se testira: nulta hipoteza i alternativna pomoću

jednostranog testa, izabiramo test statistiku T = koja ima studentovu

distribuciju T t (n-1). Za jednostrani test, kritične tačke određujemo iz uvjeta P (T ) =

= je kvantil za F, funkciju distribucije test statistike T t (n-1). Kritično područje nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),

t = ( ) odbacujemo nultu hipotezu i prihvaćamo alternativnu hipotezu

).

(c) Ako je se testira: nulta hipoteza i alternativna pomoću

jednostranog testa, izabiramo test statistiku T = koja ima studentovu

distribuciju T t (n-1). Za jednostrani test, kritične tačke određujemo iz uvjeta P (T ) =

= je kvantil za F, funkciju distribucije test statistike T t (n-1). Kritično područje nultu hipotezu ( = ) za nivo značajnosti je ( , ). Ako je vrijednost test statistike T ( ),

t = ( , ) odbacujemo nultu hipotezu i prihvaćamo alternativnu hipotezu

). Napomena:

8

Kvantili za studentovu distribuciju za n= 5, t(4), F ( ) = :

0.05 0.01 -2.13 -1.53

2.13 1.53

0.05 0.01

0.025 0.005

-2.78 -4.60

2.78 4.60

Primjer: Neka slučajna varijabla ima normalnu distribuciju X N ( ) nepoznate varijanse Uzet je uzorak veličine n = 5 i dobivena je vrijednost uzoračke aritmetičke sredine

=10.2, i vrijednost korigirane uzoračke varijanse =0.64. Za nivo značajnosti testirati:

(a) Nultu hipotezu i alternativnu hipotezu . (b) Nultu hipotezu i alternativnu hipotezu .

Rješenje:

(a) Ako je se testira: nulta hipoteza i alternativna pomoću

dvostranog testa, izabiramo test statistiku T = koja ima studentovu

distribuciju T t (n-1).

Za dvostrani test, u slučaju simetrične distribucije test statistike T kritične tačke određujemo iz uvjeta

P (T ) =

P (T ) =

= , = su kvantili za funkciju distribucije T t (n-1).

Za , n-1 = 4 = = = 2,78,

= = 2,78.

Područje prihvaćanja za nultu hipotezu za nivo značajnosti = 0,05 je ( , = (-2.78, 2.78). Vrijednost test statistike T ( ),

t = = = 0.55902 ( , je upala u područje prihvaćanja, pa

prihvaćamo nultu hipotezu

9

(b) Ako je se testira nulta hipoteza i alternativna ( ) pomoću

jednostranog testa, izabiremo test statistiku T = koja ima standardnu

normalnu distribuciju T .

Za jednostrani test, kritičnu tačku određujemo iz uvjeta P (T ) =

= je kvantil za funkciju distribucije test statistike T N (0-1). Za

= = = = 2.13, = -2.13

Kritično područje za nultu hipotezu za nivo značajnosti je (-

(- Vrijednost test statistike T ( ),

t = = = 0.559 ( , nije upala u kritično područje za nultu

hipotezu, pa prihvaćamo nultu hipotezu .

10

5.ZAKLJUČAK

U ovom radu sam obradio temu statističkih testova i njihove primjere kako bi

bolje shvatili za što se najviše koriste u praksi. Jasno nam je da kroz definicije i primjere vidimo da statistički testovi mogu imati veoma široku primjenu u praksi u više različitih nauka i oblati a njihova rješenja doprinose odlučivanju na osnovu parametara podataka i rezultata. Kroz ovaj rad naučili smo šta je statističko testiranje, koje vrste hipoteza se postavljaju, šta je kritično područje i nivo značajnosti. A kroz primjere smo mogli vidjejeti da kako se nulta hipoteza testira u odnosu na alternativnu pod određenim i različitim uslovima, te na osnovu rezultata da li je prihvatiti ili ne.

11

6.LITERATURA

1. Statističke metode u menadžmentu, Đuro Mikić, Nebojša Ralević, Prijedor,

2006.god. 2. Nevenka skakić, Vjerovatnoća i statistika, Banja Luka. 3. Testiranje statističkih hipoteza, Vida Šimić, Ksenija Smoljak, Kristina Krulić,

(http://www.ttf.unizg.hr/b-news/news_upload_files/2009/vijest_27-02-2009_49a83133421c0/parametarski_testovi_prez.pdf)

4. Testiranje hipoteza, Mirjana Kujundžić Tiljak, Davor Ivanković (http://www.mef.unizg.hr/meddb/slike/pisac15/file1525p15.pdf)

5. Testiranje hipoteza, (http://www.grad.hr/vera/webnastava/vjerojatnostistatistika/testhipocek.pdf)

http://www.ttf.unizg.hr/b-news/news_upload_files/2009/vijest_27-02-2009_49a83133421c0/parametarski_testovi_prez.pdf

http://www.ttf.unizg.hr/b-news/news_upload_files/2009/vijest_27-02-2009_49a83133421c0/parametarski_testovi_prez.pdf

http://www.mef.unizg.hr/meddb/slike/pisac15/file1525p15.pdf

http://www.grad.hr/vera/webnastava/vjerojatnostistatistika/testhipocek.pdf

Documents

Statistika_Testiranje statistickih hipoteza.pdf