Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Ciljna populacija
Uzoračka populacija
Uzorak
Statistički zaključak o populaciji
sa određenim stepenom
nesigurnosti
Analiza
StatistiStatističko zaključivanječko zaključivanje
Donošenje zaključka o populaciji na osnovu opservacija Donošenje zaključka o populaciji na osnovu opservacija
iz uzorka. Zaključak je probabilističke prirode, jer se iz uzorka. Zaključak je probabilističke prirode, jer se
donosi na osnovu uzoračkih podataka, i praćen je donosi na osnovu uzoračkih podataka, i praćen je
izvesnim stepnom nesigurnostiizvesnim stepnom nesigurnosti
Uzoračka statistika
(uzorački statistik)
•Pretpostavka o svetu oko nas
•Pretpostavka koju je moguće testirati i odbaciti
•Prepostavka koja je unapred navedena kao verovatna
istina, a koju istraživač ima nameru da testira na osnovu
podataka
Istraživačka hipoteza može imati fomu očekivanja,
verovanja, dedukcije ili sumnje. Pokretač je istraživanja i
zahteva aktuelno dokazivanje. Istraživačku hipotezu
prevodimo u statističke hipoteze kako bi mogle biti
testirane statističkim tehnikama.
Hipoteza
•Statistička hipoteza je pretpostavka ili tvrđenje o jednoj ili
više populacija (pretpostavka o vrednostima parametara u
populaciji).
Uvek se formulišu dve hipoteze - nulta i alternativna:
•Nulta hipoteza (H0) je tvrđenje o tačnoj vrednosti
parametra u populaciji
•Alternativna hipoteza (HA ili H1) ili istraživačka hipoteza je
tvrđenje da je vrednost parametra u populaciji različita od
tvrđenja u nultoj hipotezi
Statistička hipoteza
•Nulta i alternativna hipoteza su komplementarne. Samo
jedna je tačna.
•U postupku testiranja hipoteza testira se samo nulta
hipoteza.
•Moguće odluke na osnovu statističke analize uzoračkih
podataka su: (1) prihvatanje H0 i odbacivanje H1, ili (2)
odbacivanje H0 i prihvatanje H1
Testiranje hipoteza – komplementarnost
nulte i alternativne hipoteze
Dvosmeno i jednosmerno testiranje
hipoteza
Dvosmerni test – test u kojem je alternativna hipoteza
dvosmerna (nije direktivna) odnosno ima oblik tvrđenja da je
jedan populacioni parametar ili veći ili manji od drugog:
H0: μ1 = μ2 H1: μ1 ≠ μ2
Jednosmerni test – test u kojem je alternativna hipoteza
jednosmerna (direktivna je) odnosno ima oblik tvrđenja da je
jedan populacioni parametar veći ili manji od drugog:
H1: μ1 > μ2
H1: μ1 < μ2
Testiranje hipoteza – matrica
statističkog odlučivanja
U prirodiU prirodi
Naš zaključakNaš zaključak
Nulta hipoteza Nulta hipoteza
tačnatačna
Nulta hipoteza Nulta hipoteza
pogrešnapogrešna
Prihvatamo nultu Prihvatamo nultu
hipotezuhipotezu
11--
greška greška --
greška drugogreška drugogg
tipatipa
Odbacujemo Odbacujemo
nultu hipotezunultu hipotezu
greška greška --
greška prvog greška prvog
tipatipa
11--
•Statistička hipoteza (H: A) je bilo koja pretpostavka o tome da obeležje X ima
raspodelu koja pripada nekom podskupu A skupa dopustivih raspodela (F(x, )).
Nasuprot njoj je tzv. alternativna hipoteza H: AC.
Hipoteza se pored oblika raspodele obeležja može odnositi i na:
•vrednost nekog parametra kod raspodele
•jednakosti parametara dve ili više raspodela
•nezavisnost uzoraka
•jednakosti raspodela dva različita obeležja
Hipoteza može biti prosta, ako je A jednočlan skup, ili složena, ako se sastoji od
više prostih hipoteza.
Za verifikaciju hipoteza koristi se statistički test:
•za određenu hipotezu H uoči se skup CRn – kritična oblast za H (kritična
oblast testa)
•ako realizovani uzorak (X1,X2,...,Xn) pripada oblasti C, hipoteza H se odbacuje
•ako (X1,X2,...,Xn) ne pripada oblasti C, hipoteza se ne odbacuje, već se tumači:
"rezultati testiranja ne protivureče hipotezi H".
U postupku verifikacije hipoteze mogu se javiti dve osnovne vrste grešaka:
•greška prve vrste – opovrgnuta tačna hipoteza
•greška druge vrste – prihvaćena netačna hipoteza
Verovatnoća pojave greške prve vrste se označava sa i zove nivo značajnosti,
najčešće 0.05 ili 0.01.
Greška prvog tipa – odbacivanje tačne nulte hipoteze.
Greška drugog tipa – neodbacivanje pogrešne nulte hipoteze.
Istovremeno se može napraviti samo jedan tip greške.
Greška prvog tipa se neposedno kontroliše izborom nivoa
značajnostii.
Greške prvog i drugog tipa su zavisne. Smanjenje verovatnoće
greške prvog tipa dovodi do povećanja verovatnoće greške
drugog tipa, i obrnuto.
Povećanje uzorka uopšteno smanjuje verovatnoću oba tipa
grešaka.
Verovatnoća greške drugog tipa se smanjuje sa povećanjem
razlike aritmetičkih sredina (kada se testira razlika aritmetičkih
sredina).
Snaga ili moć (1-) statističkog testa je verovatnoća
odbacivanja nulte hipoteze kada je alternativna hipoteza tačna.
Greške u testiranju hipoteza
Parametarski testovi
•Za proveru hipoteza koje se odnose na vrednosti parametara u raspodeli koriste se parametarski testovi, npr:
Testiranje hipoteze H0(m=m0) protiv hipoteze H1(mm0) kada je disperzija poznata (obeležje populacije X:N(m, )) Ako je * hipoteza H se odbacuje, u suprotnom uzorak ne protivureči hipotezi.
*0
00/
21
n
mxmxmXp
n
nn
Računa se odgovarajuća vrednost iz uzorka: Koja se poredi sa iz tablica Studentove raspodele. Ako je: hipoteza H se odbacuje, u protivnom konstatuje se da rezultat iz uzorka ne protivureči toj hipotezi.
Testiranje hipoteze H0(m=m0) protiv hipoteze H1(mm0) kada disperzija
nije poznata
10
1
ns
mxt
n
nn
,1nt
,11 nn tt
•Statistički testovi vezani za oblik funkcije raspodele obeležja populacije se zovu
neparametarski testovi. Najpoznatiji među njima je Pirsonov 2 test.
Potrebno je:
•skup svih mogućih vrednosti obeležja X (realna osa u opštem slučaju) podeliti na
r disjunktnih podskupova (intervala), S1, S2, ... , Sr (r2)
•odrediti verovatnoće pk i verovatnoće da vrednosti obeležja X budu u intervalu Sk,
k=1,2,...,r
•sa mk se označi broj xj iz uzorka koji su u Sk, pa je
obim uzorka
•Za dati nivo značajnosti kritična oblast je skup tačaka za koje je
•Hipoteza se odbacuje ako je . Da bi se primenio ovaj test, obim uzorka
mora da je bar n50, zatim skupove Sk odrediti tako da je r što veće, ali i da je mk
5, k=1,2,...,r.
Neparametarski testovi
nxxx ,...,, 21 nmmm r ...21
2
,1
1
2
r
n
k k
kk
np
npmA
2
,1 rA
Nivo značajnosti i p-vrednost
( nivo, nivo značajnosti) - maksimalno dozvoljena
greška prvog tipa. U procesu testiranja hipoteza
običajeno se bira nivo značajnosti od 0.05.
p-vrednost (opservirani nivo značajnosti, verovatnoća
značajnosti) – verovatnoća da se, pod pretpostavkom
tačne nulte hipoteze, na osnovu slučajnosti opserviraju
rezultati koji su jednaki ili ekstremniji od aktuelno
opserviranih. Ako je p-vrednost manja od nivoa
značajnosti (p0.05), odbacuje se nulta hipoteza i
dobijeni rezultati označava se statistički značajnim.
1. Formulisati H0 i H1
2. Odabrati nivo značajnosti ( nivo)
3. Odabrati dvosmerno ili jednosmerno testiranje zavisno
od formulacije alternativne hipoteze
4. Odabrati statistički test i izračunati statistiku testa
(empirijska vrednost).
5. Odrediti oblast odbacivanja – teorijska (granična,
kritična) vrednost.
6. Uporediti empirijsku i teorijsku vrednost test statistike.
Odbaciti H0 i prihvatiti H1 ako je statistika testa u
regionu odbacivanja (p ). Prihvatiti H0 ako statistika
testa nije u regionu odbacivanja (p > ).
Koraci u testiranju hipoteza
Literatura: Goran, Trajković Statistika u istraživačkom procesu – statističko zaključivanje i statističko modelovanje, januar 2013.