10
8.4 TESTIRANJE HIPOTEZE ZASNOVANO NA DVA UZORKA Neki autori smatraju da ovi metodi spadaju među najkorisnije statističke metode u eksperimentalnoj praksi. Predmet testiranja ne mora biti sama vrijednost jednog parametra u dva skupa, već razlika između ovih vrijednosti. Ako dva skupa obilježimo sa 1 i 2, a vrijednosti istog parametra u njima sa θ 1 i θ 2 ,  predmet testiranja je razlika   D = θ 1  θ 2 . Ako sa  D 0 obilježimo hipotetičnu vrijednost ove razlike, nultu i alternativnu hipotezu možemo prikazati jednim od tri moguća oblika: A.  H 0  : D =  D 0  H 1 : D D 0 dvosmjerna alternativna hipoteza, B.  H 0 : D  D 0   H 1 : D > D 0 jednosmjerna alternativna hipoteza, C.  H 0 : D   D 0   H 1 : D < D 0 jednosmjerna alternativna hipoteza. Nultu hipotezu testiramo po identičnom postupku kao u slučaju jednog skupa. Dakl e, na ko n fo rmul isan ja nulte, alternativne hi po teze i sp ecif ik ov an ja nivoa znač ajno sti, u drug om koraku testiran ja izabraće mo odgo vara jući test i izra čunat i statistiku testa; nakon provjere uslova, na osnovu realizovane vrijednosti ove statistike, odredićemo  p-vrijednost i donijeti odluku da li nultu hipotezu da odbacimo ili ne odbacimo. U posljednjem kor aku formulišemo zak ljučak u kont ekstu posta vlje nog problema. Statistika testa i ovdje u suštini ima generalni oblik 8.1, s tim što se svuda umjesto  jednog parametra uzima razl ika iz među p arametara dva skupa. Ocjena razlike - Hipoteti č na vrijednost razlike Statistika te sta = Sta ndardna greška oc jene razlike Budući da smo razliku između parametara dva skupa označili sa  D, ocjenu te razlike označićemo sa µ D  ("  D kapa"). Slijedeći istu logiku kao kod testova zasnovanih na jednom uzorku, i ovdje se mogu formulisati dva parametarska testa  Z i t sa statistikama testa oblika 8.6: µ µ 0 - D D D  Z σ =  t = µ µ 0 - D D D S , gdje je µ D σ standarna greška razlike parametara dva skupa, a µ D s ocijenjena standardna greška razlike. Hipotetična vrijednost razlike,  D 0  = (θ 1  θ 2 ) 0 , mo že biti bilo ko ja numeri čka vrijednost. U praksi se najčće uzima nula. U tom slučaju nulta hipoteza oblika (A) se svodi na H 0 : D = θ 1  θ 2 = 0, odnosno,  H 0 : θ 1 = θ 2 . U tom slučaju testiranjem hipoteze oblika A ispitujemo jednakost parametara dva skupa, dok pr i tes ti ranj u hi po tez a ob li ka (B) il i (C) ut vr đuje mo u ko m skupu je vr ij ed nost (8.6)

Testiranje Hipoteza Zasnovano Na Dva Uzorka

Embed Size (px)

DESCRIPTION

Predavanja

Citation preview

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 1/10

8.4 TESTIRANJE HIPOTEZE ZASNOVANO NA DVAUZORKA

Neki autori smatraju da ovi metodi spadaju među najkorisnije statističke metode

u eksperimentalnoj praksi.Predmet testiranja ne mora biti sama vrijednost jednog parametra u dva skupa, već

razlika između ovih vrijednosti.

Ako dva skupa obilježimo sa 1 i 2, a vrijednosti istog parametra u njima sa θ 1 i θ 2, predmet testiranja je razlika  D = θ 1 –  θ 2. Ako sa  D0 obilježimo hipotetičnu vrijednost overazlike, nultu i alternativnu hipotezu možemo prikazati jednim od tri moguća oblika:

A.  H 0 : D = D0  H 1 : D≠ D0 dvosmjerna alternativna hipoteza,

B.  H 0 : D ≤ D0   H 1 : D > D0 jednosmjerna alternativna hipoteza,

C.  H 0 : D ≥  D0   H 1 : D < D0 jednosmjerna alternativna hipoteza.

Nultu hipotezu testiramo po identičnom postupku kao u slučaju jednog skupa.Dakle, nakon formulisanja nulte, alternativne hipoteze i specifikovanja nivoaznačajnosti, u drugom koraku testiranja izabraćemo odgovarajući test i izračunatistatistiku testa; nakon provjere uslova, na osnovu realizovane vrijednosti ove statistike,odredićemo  p-vrijednost i donijeti odluku da li nultu hipotezu da odbacimo ili neodbacimo. U posljednjem koraku formulišemo zaključak u kontekstu postavljenogproblema.

Statistika testa i ovdje u suštini ima generalni oblik 8.1, s tim što se svuda umjesto

 jednog parametra uzima razlika između parametara dva skupa.

Ocjena razlike - Hipotetična vrijednost razlikeStatistika testa =

Standardna greška ocjene razlike

Budući da smo razliku između parametara dva skupa označili sa  D, ocjenu te razlike

označićemo sa µD   (" D kapa"). Slijedeći istu logiku kao kod testova zasnovanih na jednom

uzorku, i ovdje se mogu formulisati dva parametarska testa  Z  i t sa statistikama testa oblika8.6:

µ

µ

0-

D

D D Z 

σ 

=   t = µ

µ

0-

D

D D

S,

gdje je µDσ  standarna greška razlike parametara dva skupa, a µD

s ocijenjena standardna

greška razlike.

Hipotetična vrijednost razlike,  D0  =  (θ 1 –  θ 2)0, može biti bilo koja numeričkavrijednost. U praksi se najčešće uzima nula. U tom slučaju nulta hipoteza oblika (A) sesvodi na H 0 : D = θ 1 – θ 2 = 0, odnosno,

 H 0 : θ 1 = θ 2.

U tom slučaju testiranjem hipoteze oblika A ispitujemo jednakost parametara dva skupa,dok pri testiranju hipoteza oblika (B) ili (C) utvrđujemo u kom skupu je vrijednost

(8.6)

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 2/10

STATISTIČKA ANALIZA – Metodi i primjena

 posmatranog parametra veća:

A)  H 0 : θ 1 = θ 2  H 1 : θ 1 ≠  θ 2

B)  H 0 : θ 1 ≤ θ 2  H 1 : θ 1 > θ 2

C)  H 0 : θ 1 ≥ θ 2  H 1 : θ 1 < θ 2

Ograničićemo se samo na slučaj kada su oba slučajna uzorka međusobno nezavisna,odnosno kada nijedan elemenat prvog uzorka nije ni u kakvoj povezanosti sa bilo kojimelementom drugog uzorka.

8.4.1 Testiranje hipoteze o jednakosti aritmetičkih sredina dva skupa

Z test

Osnovne informacije vezane za primjenu Z testa u slučaju testiranja jednakosti aritmetičkihsredina dva skupa prikazane su u Tabeli 8.6.

Tabela 8.6 Testiranje hipoteze o razlici aritmetičkih sredina dva skupa primjenom Z testa

Uslovi za primjenu Z testa:

1) Osnovni skupovi imaju normalan raspored ili može da se primijeniCentralna Granična Teorema, odnosno oba uzorka imaju više od 30elemenata.

2) Standardne devijacije oba osnovna skupa su poznate.

Izbor oblika nulte i alternativne hipoteze:

A)  H 0 : D = D0  H 1 : D  ≠   D0

B)  H 0 : D ≤ D0  H 1 : D > D0

C)  H 0 : D ≥  D0  H 1 : D < D0

gdje je D = µ1 - µ2, a D0 hipotetična razlika (najčešće D0 = 0).

Statistika testa:

 µ µ 

σ σ 

− − −=

+

1 2 1 2 0

2 2

1 2

1 2

( ) ( ) 

 X X  Z 

n n

 pod uslovom da je H 0 istinita ima standardizovan normalan

raspored Z : N (0, 1).

Identična ograničenja vezana za primjenu  Z  i t -testa pri testiranju aritmetičkesredine jednog skupa važe i ovdje. Dakle, Z test se zasniva na nerealnoj pretpostavci dasu standardne devijacije oba skupa poznate, pa u praksi preporučujemo primjenu t testa.

Zadržaćemo se na obliku (A) i posmatrati samo slučaj kada je hipotetična

vrijednost razlike aritmetičkih sredina dva skupa jednaka nuli ( D0 = ( µ1 - µ2 )0 =

0), tj:

248

(8.6)

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 3/10

POGLAVLJE 8 – Testiranje statističkih hipoteza

 H 0 : µ1 = µ2  H 1 : µ1 ≠   µ2.

Testiranje hipoteze o jednakosti aritmetičkih sredina dva skupa sprovodimoanalogno testiranju u slučaju jednog uzorka. Iz oba skupa uzećemo po jedan prostslučajan uzorak, kao na Slici 8.3.

Ideja testiranja je u sljedećem: ako su razlike između aritmetičkih sredina uzorakamale, nećemo imati dovoljno razloga da tvrdimo da zaista postoje razlike izmeđuaritmetičkih sredina skupova kojima uzorci pripadaju. Drugim riječima, takva razlikapojavila bi se zbog slučajnog kolebanja uzoraka. U suprotnom, ako su razlike izmeđuaritmetičkih sredina uzoraka relativno velike, imaćemo dovoljno argumenata daodbacimo nultu hipotezu.

 

Slika 8.3 Grafički prikaz logike testiranja jednakosti aritmetičke sredine dva skupa

Već smo vidjeli da ako osnovni skup ima normalan raspored, i aritmetičke sredineuzoraka iz tog skupa će slijediti normalan raspored.

Zaključujemo da će i razlika aritmetičkih sredina dva uzorka imati normalan raspored .

Pošto razlika aritmetičkih sredina uzoraka slijedi normalan raspored, testiranjećemo sprovesti primjenom Z testa. Statistika Z testa glasi:

σ −

−=1 2

2 2  X X 

 X X  Z  ,

gdje je σ −1 2 X X  standardna greška razlike dvije aritmetičke sredine. Može se pokazati da

njena formula glasi slično formuli u slučaju jednog skupa ( σ σ = / X  n ):

1 2

2 2

1 2

1 2

  X X  n n

σ σ σ 

−= +  

Statistiku Z možemo napisati u sljedećem obliku:

249

(8.7)(8.7)

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 4/10

STATISTIČKA ANALIZA – Metodi i primjena

1 2

2 2

1 1 2 2

 / /

 X X  Z 

n nσ σ 

−=

+

Pod uslovom da je H 0 istinita, statistika Z ima standardizovan normalan raspored.

Studentov t test

Osnovne informacije vezane za primjenu t  testa u slučaju testiranja jednakosti aritmetičkihsredina dva skupa prikazane su u Tabeli 8.7.

Tabela 8.7 Testiranje hipoteze o jednakosti aritmetičkih sredina dva skupa primjenom t testa(nepoznate varijanse skupova su među sobom jednake)

Uslovi za primjenu t testa:

1) Oba osnovna skupa imaju normalan raspored ili može da

se primjeni Centralna Granična Teorema (oba uzorkaimaju više od 30 elemenata).

2) Varijanse oba skupa su međusobom jednake (2 2

1 2σ = σ ).

Izbor oblika nulte i alternativne hipoteze:

A)  H 0 : D = D0,  H 1 : D ≠ D0

B)  H 0 : D ≤ D0,  H 1 : D > D0

C)  H 0 : D ≥ D0,  H 1 : D < D0

gdje je 1 2-D µ µ= , a  D0 hipotetična razlika (najčešće D0 = 0).

Statistika testa:1 2

1 2 1 2 0( ) ( )

 X X 

 X X t 

S

 µ µ 

− − −=

1 21 2

1 1= P X X 

S Sn n−

× +  

2 2

1 1 2 2

1 2

( 1) ( 1)

2 P

n S n SS

n n

− × + − ×=

+ −,

 pod uslovom da je H 0 istinita ima Studentov raspored sa

1 2- 2n n+ stepeni slobode. 

Kao i kod Z testa zadržaćemo se samo na slučaju ispitivanja da li su aritmetičkesredine dva skupa među sobom jednake, odnosno na hipotezama postavljenim u vidu:

 H 0 : µ1 = µ2  H 1 : µ1 ≠   µ2.

Prije nego što razmotrimo logiku statistike t testa u slučaju dva uzorka podsjetimose t testa u slučaju jednog uzorka.

Statistika t testa kod jednog uzorka ima skoro isti oblik kao ona kod Z testa:

250

Statistika Z testa

(8.9)

(8.8)

(8.10)

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 5/10

POGLAVLJE 8 – Testiranje statističkih hipoteza

 µ µ 

σ  σ = =0 0- -

/ X 

 X X  Z 

 µ µ = =0 0- -

/ X 

 X X t 

S S n.

Jedina je razlika u tome što se kod t testa standardna greška ocjenjuje tako što seumjesto standardne devijacije skupa uzima standardna devijacija uzorka. Postavlja sepitanje, da li kod dva uzorka možemo primijeniti istu logiku, i u izrazu za Z statistikutesta (8.8) umjesto nepoznatih varijansi skupova staviti varijanse uzoraka?

Odgovor je, nažalost, negativan, jer rezultirajući izraz ne slijedi egzaktno t raspored. Da bi takva statistika zaista imala t  raspored mora da se uvede dodatnapretpostavka: oba skupa imaju  jednake varijanse. Ova pretpostavka u statistici senaziva pretpostavkom homogenosti varijansi. Ako smo spremni da usvojimo ovupretpostavku, tada se takav t test naziva ponderisani t test (pooled t test).

Problem sa praktičnom primjenom ovakvoga testa je u tome što ne postojepouzdani načini da se ispita ispunjenost pretpostavke homogenosti varijansi 1. Brojniradovi koji su sprovedeni u drugoj polovini XX-og vijeka ipak su pokazali da se ponderisani t test može koristiti u praksi kada su narušene njegove pretpostavke, ali pod uslovom da obauzorka imaju jednaki broj elemenata.

Usljed svega navedenog, preporučujemo da istraživač tako planira svojeistraživanje da obezbijedi podjednaku veličinu oba uzorka. Ako, pak, imamo nejednakeuzorke, bolje je koristiti t test koji ne zahtijeva homogenost varijansi.

Iako je trend u statističkoj literaturi u posljednjih 5 godina da se ponderisani t testpolako napušta, mi ćemo ipak samo njega prikazati, i to iz dva razloga.

Prvo, aproksimativan izraz za broj stepeni slobode je suviše komplikovan. Drugo,svaki korisnik 3BStata može jednostavno da primijeni neponderisani t  test, uporedirezultat sa ponderisanim t testom i vidi da li postoje neke bitne razlike.

Ponderisani t  test je dobio naziv po tome što se standardna greška računa naosnovu ponderisanih varijansi oba uzorka. Takva, ponderisana, varijansa 2

PS  izračunava se po formuli:

2 2

2 1 1 2 2

1 2

( 1) ( 1)

2P

n S n SS

n n

− × + − ×

= + −

(indeks p ukazuje da se radi o ponderisanoj ocjeni varijanse i ne treba je dovoditiu vezu sa ocjenom varijanse proporcije uzorka 2

 pS  ).

Usljed toga, statistika ponderisanog t testa glasi:

1Testovi koji ispituju jednakost varijansi dva skupa (recimo F test) su neprecizni, jer strogo zahtijevaju da oba

skupa imaju normalan raspored.

251

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 6/10

STATISTIČKA ANALIZA – Metodi i primjena

Statistika

t testa

−=

+1 2

1 2

 

(1/ 1/ )P

 X X t 

S n n

Pod pretpostavkom da je H 0 istinita, statistika testa (8.11) ima Studentov raspored sa n1 + n2 -

2 stepeni slobode.

8.4.2 Testiranje hipoteze o jednakosti proporcija dva skupa

Tabela 8.8 Testiranje hipoteze o jednakosti proporcija dva skupaprimjenom Z testa

Uslovi za primjenu Z testa:

  1 1 1 1 2 2 2 2( 5 i (1- ) 5) i ( 5 i (1- ) 5).n n n nπ π π π  > > > >

Izbor oblika nulte i alternativne hipoteze:

A) H 0 : D = D0 H 1 : D ≠ D0

B) H 0 : D ≤ D0 H 1 : D > D0

C) H 0 : D ≥ D0   H 1 : D < D0

gdje su π 1 i π 2 hipotetička proporcija prvog i drugog skupa,respektivno,  D = π 1 –  π 2 , a  D0 hipotetična razlika između

 proporcija dva skupa (najčešće D0 = 0).

Statistika testa:

− − −=

− −

+

1 2 1 2 0

1 1 2 2

1 2

( ) ( ) 

(1 ) (1 )

 

 p p Z 

n n

π π 

π π π π   ,

 pod uslovom da je H 0 istinita ima standardizovan

normalan raspored, Z : N (0, 1).

Testiranje hipoteze o razlici proporcija dva skupa, π 1 – π 2 = D, zasniva se na razliciproporcija uzoraka izabranih iz ovih skupova, 1 2( - ) p p = µD .

Za potrebe testiranja hipoteze moramo da znamo raspored vjerovatnoće ocjene µD. Ako iz skupova biramo velike uzorke (tj, ako važe nejednakosti 5i in π × ≥ i

(1 - ) 5i in π × ≥ , za i  = 1,2), onda raspored razlike 1 2( ) p p−   možemo aproksimiratinormalnim rasporedom.

Kao i kod prethodna dva testa zadržaćemo se samo na slučaju ispitivanja jednakosti proporcija dva skupa i na dvosmjernom testu.

Nulta i alternativna hipoteza date su sa:

0 1 2:H π π =   0 1 2:H π π ≠ .

Pod uslovom da je  H 0  istinita, jedinstvenu vrijednost proporcije u oba skupamožemo da obilježimo sa π (tj. π 1 = π 2 = π ).

Tada uzorke iz ova dva skupa možemo da tretiramo kao uzorke koji potiču iz istog

252

(8.11)

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 7/10

POGLAVLJE 8 – Testiranje statističkih hipoteza

osnovnog skupa sa proporcijom π . Logika testiranja je slična kao kod ponderisanog t testa. Dakle, kombinovaćemo informacije o proporciji skupa na osnovu dobijenihinformacija iz oba uzorka.

Izraz za takvu kombinovanu, odnosno ponderisanu, ocjenu proporcije označićemo

sa ( )P i on glasi:

1 1 2 2 1 2

1 2 1 2

 n p n p f f  P

n n n n

+ += =

+ +  

Ocjenu standardne greške formulisaćemo generalizacijom formule za ocjenuproporcije jednog skupa:

0 0(1 - )  pS

n

π π = .

Dakle, vodeći računa da sada imamo dva skupa izraz za ocjenjenu standardnugrešku razlike dvije proporcije glasi:

( )1 2

1 2 1 2

(1 ) (1 ) 1 11 , p p

 p p p pS p p

n n n n−

 − −= + = − + ÷  

pa statistika Z testa glasi:

StatistikaZ testa

1 2

1 2

 

(1 )(1/ 1/ )

 p p Z 

 p p n n

−=

− +

8.5 VEZA IZMEĐU TESTIRANJA HIPOTEZA I INTERVALAPOVJERENJA

Sumirajmo ključne razlike između intervala povjerenja i testiranja hipoteza.

Intervali povjerenja:

♦  bira se koeficijent povjerenja (najčešće 95% ili 99%);

♦ uz odabrani koeficijent formira se interval mogućih vrijednosti koje parametar može

da ima, a koje su konzistentne podacima uzorka.

Statistički test:

♦ Samo jedna moguća vrijednost parametra, nazvana hipotetična vrijednost, se testira.

Utvrđuje se jačina argumenata protiv postavke da je parametar stvarno jednak tojhipotetičnoj vrijednosti.

Iako na prvi pogled izgleda da su ova dva osnovna metoda inferencijalne statistikenepovezana, pokazaćemo da između njih postoji veoma bliska veza. Zadržaćemo sesamo na dvosmjernim testovima.

Na osnovu ovoga formulisaćemo sljedeću povezanost između intervala povjerenja istatističkog testiranja.

253

(8.12)

(8.13)

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 8/10

STATISTIČKA ANALIZA – Metodi i primjena

• Ako se hipotetična vrijednost dvosmjerne hipoteze nalazi unutar (1 – α)100%

intervala povjerenja (recimo 95%), ona neće biti odbačena pri nivou značajnosti α(recimo 0,05).

• Ako se hipotetična vrijednost dvosmjerne hipoteze nalazi izvan (1 – α)100% intervala

 povjerenja (recimo 95%), nulta hipoteza će biti odbačena pri nivou značajnosti α (recimo0,05).

 Navedenu vezu možemo grafički ilustrovati na Slici 8.4.

 Slika 8.4 Grafički prikaz povezanosti između intervala povjerenja i statističkog testiranja

Možemo zaključiti da interval povjerenja sadrži daleko veću i važniju informacijuod odgovarajućeg statističkog testa, jer se sastoji od svih hipotetičnih vrijednosti koje nebi bile odbačene pri testiranju. Istovremeno, ukazuje na sve hipotetične vrijednosti kojebi bile odbačene statističkim testom.

8.6 ČESTE GREŠKE U PRAKSI I PREPORUKE PRITESTIRANJU HIPOTEZA

U velikom broju radova koji su objavljeni tokom posljednjih desetak godina sa

pravom se ističe da veoma mali broj korisnika statistike korektno tumači rezultatestatističkih testova. Usljed toga, navešćemo tipična pogrešna tumačenja zaključaka, kaoi preporuke koje bi trebalo usvojiti da bi se minimiziralo pogrešno shvatanje rezultatatestiranja.

1. Tumačenje nesignifikantnog rezultata na način da se "nulta hipoteza usvaja".

 Ne zaboravite –  nultu hipotezu nikada ne usvajamo. Testiranjem hipoteza nikada sene može dokazati da je nulta hipoteza zaista tačna. Nesignifikantan rezultat isključivo implicirada nemamo dovoljno argumenata da tvrdimo da je nulta hipoteza pogrešna.

2.Pri odbacivanju nulte hipoteze kazati da se "parametar značajno razlikuje od

hipotetične vrijednosti".

254

Donja granica

intervala povjerenja

Gornja granica

intervala povjerenja

Svaka nulta hipoteza koja se bazirana bilo kojoj vrijednosti unutarintervala neće biti odbačena

Odbacuje se H0

Odbacuje se H0

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 9/10

POGLAVLJE 8 – Testiranje statističkih hipoteza

Ovakve izjave se veoma često mogu sresti u literaturi i u člancima. One su jakoštetne, jer navode onoga ko ne poznaje statistiku na pogrešno uvjerenje da je dokazanavažna (čitaj velika) razlika između hipotetične i stvarne vrijednosti parametra. Akoželite da procijenite tu razliku konstruišite interval povjerenja.

3. " p vrijednost je vjerovatnoća da je nulta hipoteza tačna ili pogrešna". p vrijednost je nešto drugo, to je vjerovatnoća koja se odnosi na realizaciju naših

 podataka, pod pretpostavkom da je nulta hipoteza tačna.

4. "α = 0,05 je standard koji je zasnovan na nekom objektivnom kriterijumu".

α = 0,05 je samo opšte usvojena konvencija koja nema nikakvu objektivnupodlogu.

5."Veoma male  p vrijednosti  ukazuju na veliki efekat, odnosno na veliku razlikuizmeđu hipotetične i stvarne vrijednosti parametra".

Pogrešno:  p-vrijednost ništa ne govori o veličini efekta, odnosno razlike izmeđuhipotetične i stvarne vrijednosti parametra.

6. "Statistička značajnost rezultata ukazuje da je rezultat praktično važan".

Ovo je pogrešno, jer statistička značajnost samo ukazuje da smo našli dovoljnoargumenata da tvrdimo da je nulta hipoteza pogrešna, a to nikako ne znači da taj rezultat imaneku praktičnu važnost.

7."Odbacivanje nulte hipoteze znači da smo sa sigurnošću dokazali da je nultahipoteza pogrešna".

Ovakav stav je pogrešan iz prostog razloga što se testiranje zasniva na uzorku i usljedtoga uvijek postoji mogućnost da smo napravili grešku. Konkretno, kad god odbacimo  H 0uvijek postoji mogućnost da smo napravili grešku I vrste. Zato zaključak uvijek mora da seinterpretira riječima: uz dati rizik greške (recimo 0,05) tvrdimo da je alternativna hipotezatačna.

Zbog svih prethodno navedenih kontroverzi, kao i čestih nekorektnih tumačenja

rezultata, preporučujemo sljedeće:

255

7/16/2019 Testiranje Hipoteza Zasnovano Na Dva Uzorka

http://slidepdf.com/reader/full/testiranje-hipoteza-zasnovano-na-dva-uzorka 10/10

STATISTIČKA ANALIZA – Metodi i primjena

1.  Nikada ne koristite riječ "značajan" kod testiranja hipoteza, već samo "statistički značajan".

2. Kad god je to moguće, rezultatima testiranja pridružite i odgovarajući interval povjerenja.

3.  Nikada ne koristite suviše veliki uzorak pri testiranju dvosmjernih hipoteza zasnovanih na jednom uzorku, jer ćete uvijek dokazati da je nulta hipoteza pogrešna.

4. Prilikom testiranja dvosmjernih hipoteza zasnovanih na dva uzorka preporučujemo daspecifikujete određenu, hipotetičnu, razliku između parametara i zatim nultu hipotezu

 postavite u vidu da između parametara dva skupa postoji ta razlika.  Na primjer, ako testiramoaritmetičke sredine dva skupa, umjesto da H 0 postavimo u vidu  H 0: μ1 = μ2, bolje je postaviti uvidu  H 0: μ1 –  μ2 = D0, gdje je D0 hipotetična razlika. U suprotnom, sa suviše velikim uzorkomuvijek ćete odbaciti nultu hipotezu, čak i kada su razlike između parametara besmisleno male.Smatramo da ovakav način postavljanja hipoteza daje puno opravdanje korišćenju statističkihtestova.

8.6.1 Berksonov paradoks kod testiranja hipoteza

Postavimo sebi sljedeće pitanje: kakvo je obilježje (ili promjenljiva) težina? To jenumeričko neprekidno obilježje ili neprekidna slučajna promjenljiva. Koliko ona možeuzeti različitih vrijednosti? Odgovor je naravno: beskonačno mnogo. Pa kolika je ondavjerovatnoća da će od tih beskonačno mnogo vrijednosti promjenljiva imati prosječnuvrijednost baš 1? Teorijski, vjerovatnoća je nula, što smo i vidjeli pri objašnjavanjuneprekidne slučajne promjenljive. 

Dakle, mi unaprijed znamo da je nemoguće da će prosječna težina iznositi egzaktno 1kg. Pa,zašto onda testiramo nultu hipotezu kada unaprijed znamo da ćemo je odbaciti?

Ovaj način rezonovanja nazivamo Berksonov paradoks.

Kod malih uzoraka još i postoji šansa da ne odbacimo nultu hipotezu, ali sa povećanjemveličine uzorka naš test će imati sve veću jačinu i konačno će odbaciti nultu hipotezučak i u slučaju da se prosječna težina razlikuje i na milionitoj decimali od 1 kg. Usljedtoga smo i u preporukama pod c sugerisali da nikada ne koristite suviše veliki uzorak .2

2Ovakva preporuka može izgledati kontradiktorna standardnom načinu razmišljanja, jer se sa povećanjem uzorka

dobija preciznija informacija o skupu.

256