16

Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje
Page 2: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Ciljna populacija

Uzoračka populacija

Uzorak

Statistički zaključak o populaciji

sa određenim stepenom

nesigurnosti

Analiza

StatistiStatističko zaključivanječko zaključivanje

Donošenje zaključka o populaciji na osnovu opservacija Donošenje zaključka o populaciji na osnovu opservacija

iz uzorka. Zaključak je probabilističke prirode, jer se iz uzorka. Zaključak je probabilističke prirode, jer se

donosi na osnovu uzoračkih podataka, i praćen je donosi na osnovu uzoračkih podataka, i praćen je

izvesnim stepnom nesigurnostiizvesnim stepnom nesigurnosti

Uzoračka statistika

(uzorački statistik)

Page 3: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

•Pretpostavka o svetu oko nas

•Pretpostavka koju je moguće testirati i odbaciti

•Prepostavka koja je unapred navedena kao verovatna

istina, a koju istraživač ima nameru da testira na osnovu

podataka

Istraživačka hipoteza može imati fomu očekivanja,

verovanja, dedukcije ili sumnje. Pokretač je istraživanja i

zahteva aktuelno dokazivanje. Istraživačku hipotezu

prevodimo u statističke hipoteze kako bi mogle biti

testirane statističkim tehnikama.

Hipoteza

Page 4: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

•Statistička hipoteza je pretpostavka ili tvrđenje o jednoj ili

više populacija (pretpostavka o vrednostima parametara u

populaciji).

Uvek se formulišu dve hipoteze - nulta i alternativna:

•Nulta hipoteza (H0) je tvrđenje o tačnoj vrednosti

parametra u populaciji

•Alternativna hipoteza (HA ili H1) ili istraživačka hipoteza je

tvrđenje da je vrednost parametra u populaciji različita od

tvrđenja u nultoj hipotezi

Statistička hipoteza

Page 5: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

•Nulta i alternativna hipoteza su komplementarne. Samo

jedna je tačna.

•U postupku testiranja hipoteza testira se samo nulta

hipoteza.

•Moguće odluke na osnovu statističke analize uzoračkih

podataka su: (1) prihvatanje H0 i odbacivanje H1, ili (2)

odbacivanje H0 i prihvatanje H1

Testiranje hipoteza – komplementarnost

nulte i alternativne hipoteze

Page 6: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Dvosmeno i jednosmerno testiranje

hipoteza

Dvosmerni test – test u kojem je alternativna hipoteza

dvosmerna (nije direktivna) odnosno ima oblik tvrđenja da je

jedan populacioni parametar ili veći ili manji od drugog:

H0: μ1 = μ2 H1: μ1 ≠ μ2

Jednosmerni test – test u kojem je alternativna hipoteza

jednosmerna (direktivna je) odnosno ima oblik tvrđenja da je

jedan populacioni parametar veći ili manji od drugog:

H1: μ1 > μ2

H1: μ1 < μ2

Page 7: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Testiranje hipoteza – matrica

statističkog odlučivanja

U prirodiU prirodi

Naš zaključakNaš zaključak

Nulta hipoteza Nulta hipoteza

tačnatačna

Nulta hipoteza Nulta hipoteza

pogrešnapogrešna

Prihvatamo nultu Prihvatamo nultu

hipotezuhipotezu

11--

greška greška --

greška drugogreška drugogg

tipatipa

Odbacujemo Odbacujemo

nultu hipotezunultu hipotezu

greška greška --

greška prvog greška prvog

tipatipa

11--

Page 8: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

•Statistička hipoteza (H: A) je bilo koja pretpostavka o tome da obeležje X ima

raspodelu koja pripada nekom podskupu A skupa dopustivih raspodela (F(x, )).

Nasuprot njoj je tzv. alternativna hipoteza H: AC.

Hipoteza se pored oblika raspodele obeležja može odnositi i na:

•vrednost nekog parametra kod raspodele

•jednakosti parametara dve ili više raspodela

•nezavisnost uzoraka

•jednakosti raspodela dva različita obeležja

Hipoteza može biti prosta, ako je A jednočlan skup, ili složena, ako se sastoji od

više prostih hipoteza.

Page 9: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Za verifikaciju hipoteza koristi se statistički test:

•za određenu hipotezu H uoči se skup CRn – kritična oblast za H (kritična

oblast testa)

•ako realizovani uzorak (X1,X2,...,Xn) pripada oblasti C, hipoteza H se odbacuje

•ako (X1,X2,...,Xn) ne pripada oblasti C, hipoteza se ne odbacuje, već se tumači:

"rezultati testiranja ne protivureče hipotezi H".

U postupku verifikacije hipoteze mogu se javiti dve osnovne vrste grešaka:

•greška prve vrste – opovrgnuta tačna hipoteza

•greška druge vrste – prihvaćena netačna hipoteza

Verovatnoća pojave greške prve vrste se označava sa i zove nivo značajnosti,

najčešće 0.05 ili 0.01.

Page 10: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Greška prvog tipa – odbacivanje tačne nulte hipoteze.

Greška drugog tipa – neodbacivanje pogrešne nulte hipoteze.

Istovremeno se može napraviti samo jedan tip greške.

Greška prvog tipa se neposedno kontroliše izborom nivoa

značajnostii.

Greške prvog i drugog tipa su zavisne. Smanjenje verovatnoće

greške prvog tipa dovodi do povećanja verovatnoće greške

drugog tipa, i obrnuto.

Povećanje uzorka uopšteno smanjuje verovatnoću oba tipa

grešaka.

Verovatnoća greške drugog tipa se smanjuje sa povećanjem

razlike aritmetičkih sredina (kada se testira razlika aritmetičkih

sredina).

Snaga ili moć (1-) statističkog testa je verovatnoća

odbacivanja nulte hipoteze kada je alternativna hipoteza tačna.

Greške u testiranju hipoteza

Page 11: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Parametarski testovi

•Za proveru hipoteza koje se odnose na vrednosti parametara u raspodeli koriste se parametarski testovi, npr:

Testiranje hipoteze H0(m=m0) protiv hipoteze H1(mm0) kada je disperzija poznata (obeležje populacije X:N(m, )) Ako je * hipoteza H se odbacuje, u suprotnom uzorak ne protivureči hipotezi.

*0

00/

21

n

mxmxmXp

n

nn

Page 12: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Računa se odgovarajuća vrednost iz uzorka: Koja se poredi sa iz tablica Studentove raspodele. Ako je: hipoteza H se odbacuje, u protivnom konstatuje se da rezultat iz uzorka ne protivureči toj hipotezi.

Testiranje hipoteze H0(m=m0) protiv hipoteze H1(mm0) kada disperzija

nije poznata

10

1

ns

mxt

n

nn

,1nt

,11 nn tt

Page 13: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

•Statistički testovi vezani za oblik funkcije raspodele obeležja populacije se zovu

neparametarski testovi. Najpoznatiji među njima je Pirsonov 2 test.

Potrebno je:

•skup svih mogućih vrednosti obeležja X (realna osa u opštem slučaju) podeliti na

r disjunktnih podskupova (intervala), S1, S2, ... , Sr (r2)

•odrediti verovatnoće pk i verovatnoće da vrednosti obeležja X budu u intervalu Sk,

k=1,2,...,r

•sa mk se označi broj xj iz uzorka koji su u Sk, pa je

obim uzorka

•Za dati nivo značajnosti kritična oblast je skup tačaka za koje je

•Hipoteza se odbacuje ako je . Da bi se primenio ovaj test, obim uzorka

mora da je bar n50, zatim skupove Sk odrediti tako da je r što veće, ali i da je mk

5, k=1,2,...,r.

Neparametarski testovi

nxxx ,...,, 21 nmmm r ...21

2

,1

1

2

r

n

k k

kk

np

npmA

2

,1 rA

Page 14: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Nivo značajnosti i p-vrednost

( nivo, nivo značajnosti) - maksimalno dozvoljena

greška prvog tipa. U procesu testiranja hipoteza

običajeno se bira nivo značajnosti od 0.05.

p-vrednost (opservirani nivo značajnosti, verovatnoća

značajnosti) – verovatnoća da se, pod pretpostavkom

tačne nulte hipoteze, na osnovu slučajnosti opserviraju

rezultati koji su jednaki ili ekstremniji od aktuelno

opserviranih. Ako je p-vrednost manja od nivoa

značajnosti (p0.05), odbacuje se nulta hipoteza i

dobijeni rezultati označava se statistički značajnim.

Page 15: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

1. Formulisati H0 i H1

2. Odabrati nivo značajnosti ( nivo)

3. Odabrati dvosmerno ili jednosmerno testiranje zavisno

od formulacije alternativne hipoteze

4. Odabrati statistički test i izračunati statistiku testa

(empirijska vrednost).

5. Odrediti oblast odbacivanja – teorijska (granična,

kritična) vrednost.

6. Uporediti empirijsku i teorijsku vrednost test statistike.

Odbaciti H0 i prihvatiti H1 ako je statistika testa u

regionu odbacivanja (p ). Prihvatiti H0 ako statistika

testa nije u regionu odbacivanja (p > ).

Koraci u testiranju hipoteza

Page 16: Ciljna populacija - TFZR 5.pdf · Ciljna populacija Uzoračka populacija Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti Analiza Statističko zaključivanje

Literatura: Goran, Trajković Statistika u istraživačkom procesu – statističko zaključivanje i statističko modelovanje, januar 2013.