Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
Osnove statistike u demografiji
Predavanje 7
Procjene parametara jedne populacije
• Zaključci o karakteristikama pojave mogu se donijeti: o Prikupljanjem podataka o svim jedinicama promatrane pojave koje čine
populaciju (osnovni skup), ili
o o samo jednom dijelu jedinica
• Uzorak (engl. sample)
• Inferencijalna statistika: na temelju uzorka nastoje se
donijeti što točniji zaključci o karakteristikama populacije
koje se nazivaju parametrima
• Reprezentativan uzorak: dobro opisuje karakteristike
populacije (osnovnog skupa)
• Jednostavni slučajni uzorak. Izbor u: o konačnim i
o beskonačnim populacijama
2
Procjene parametara jedne populacije
• Vrijednosti parametara populacije su nepoznate i
one se procjenjuju s pomoću uzorka
• Zaključci o vrijednostima parametara populacije mogu se donijeti samo uz određenu razinu pouzdanosti
• Dvije su skupine metoda inferencijalne statistike: o Procjena parametara
o Testiranje hipoteza
3
Procjene parametara • Potrebno je definirati procjenitelja i odrediti oblik njegove
distribucije vjerojatnosti (sampling distribucija procjenitelja)
• Mogu se izračunati: o procjena parametra jednim brojem i
o intervalna procjena
4
Testiranje hipoteza • Procjenitelju odabranog parametra pridružuje se
standardizirana varijabla
• Na temelju podataka iz slučajno izabranog uzorka
veličine n i poznavanja distribucije vjerojatnosti
standardiziranog procjenitelja donosi odluka o
odbacivanju ili ne odbacivanju postavljene
hipoteze u skladu s odgovarajućim pravilom
odlučivanja
5
Metode izbora uzorka • Metode inferencijalne statistike temelje se na rezultatima
teorije vjerojatnosti.
• Uvjet za primjenu teorije vjerojatnosti je slučajan izbor jedinica u uzorak
• Inferencijalna statistika bavi se poopćavanjem
• Kako bi poopćavanje bilo što kvalitetnije i vjerodostojnije uzorak mora biti reprezentativan
• Reprezentativnost, mogućnost poopćavanja rezultata i primjerenost primjene statističkih metoda ovise o načinu izbora uzorka iz populacije
• Izbor uzorka može biti: o namjeran ili
o slučajan
6
Metode izbora uzorka • Namjerni izbor: subjektivan; zato često nije
reprezentativan
• Slučajni izbor: objektivan
• Na rezultate slučajnog uzorka može se primijeniti teorija vjerojatnosti, što omogućava poopćavanje: o Procjenu parametara
o Testiranje hipoteza
• Slučajni uzorci nazivaju se još probabilističkima (engl. random samples): o jednostavni slučajni uzorak,
o sistematski uzorak,
o stratificirani uzorak i
o uzorak skupina
• Plan uzorka je skup pravila i postupaka određenog načina izbora uzorka iz populacije
7
Jednostavni slučajni uzorak
• Svaka jedinica populacije ima jednaku vjerojatnost
da bude izabrana u uzorak
8
Sistematski uzorak • Slučajni uzorak u kojem izbor jedinica ovisi o koraku
izbora k
• Frakcija izbora
• Na primjer, ako se iz populacije N = 50 kućanstava u
jednom selu izabire uzorak veličine n = 10 , tada je
korak izbora k = 5.
• Popis numeriranih jedinica cijele populacije naziva
se okvir izbora
9
Stratificirani uzorak • Prikladan kada osnovni skup nije homogen
• Tada se osnovni skup može podijeliti u grupe s
obzirom na promatrano obilježje koje se ispituje,
tako da jedinice izabrane iz tih grupa budu što
homogenije.
• Takve grupe su disjunktni podskupovi i nazivaju
se stratumima.
• Stratuma može biti više i ne moraju biti jednakih
veličina
10
Uzorak skupina • Često se primjenjuje u istraživanju tržišta
(segmentacija potrošača)
• Formira se u dva koraka: o Cijela se populacija podijeli na konačan broj skupina (klastera) te se na slučajan način
izabiru određene skupine (klasteri).
o Zatim se iz svake izabrane skupine na slučajan način izabiru jedinice
11
Procjenitelj parametra, vrijednost procjene i
sampling-distribucija procjenitelja
• Postupak procjenjivanja nepoznatog parametra
populacije provodi se s pomoću procjenitelja
• Procjenitelj (engl. estimator) je slučajna varijabla
kojom se procjenjuje parametar populacije, dok se
konkretna vrijednost procjenitelja, dobivena na
uzorku podataka, naziva procjenom (engl.
estimate).
• “Kvaliteta” procjenitelja ovis o njegovim svojstvima.
• Ako se želi odrediti koja svojstva ima procjenitelj određenog parametra, treba poznavati distribuciju vjerojatnosti tog procjenitelja
12
Sampling-distribucija procjenitelja
• Konkretne vrijednosti procjenitelja određenog parametara razlikovat de se od uzorka do uzorka.
• Prosječno odstupanje vrijednosti procjenitelja od stvarne vrijednosti parametra populacije krede se u granicama slučajnih varijacija.
• Te varijacije se nazivaju sampling-varijacije, a distribucija vjerojatnosti procjenitelja se naziva sampling-distribucija
• Poželjno je da se vrijednosti procjenitelja na izabranim uzorcima “gomilaju” oko stvarne vrijednosti parametra populacije (nepristranost)
• Da je prosječno odstupanje od stvarne vrijednosti parametra populacije što manje (efikasnost).
• Ponekad je dovoljno da statistička svojstva vrijede asimptotski, tj. da s porastom veličine uzorka n procjenitelj ima navedena svojstva
13
Procjena aritmetičke sredine populacije
14
Standardna pogreška procjene
aritmetičke sredine • Standardna devijacija procjenitelja 𝑋 je prosječno
odstupanje aritmetičkih sredina uzoraka od sredine populacije
• Kada se slučajni uzorak izabire bez ponavljanja iz konačne populacije, rezultati izbora jedinica u uzorak nisu nezavisni, tj. kovarijance između varijabli uzorka X1, X2,. . . , Xn nisu jednake nuli. U tom slučaju je standardna pogreška aritmetičke sredine
• Faktor korekcije za konačne populacije o Izostavlja se ako je
15
Sampling-distribucija procjenitelja 𝑋
• Ako je jednostavni slučajni uzorak izabran iz
normalno distribuirane populacije sampling-
distribucija procjenitelja 𝑋 je normalna distribucija
(za bilo koju veličinu uzorka n)
• Ako populacija nije normalno distribuirana,
sampling-distribucija procjenitelja 𝑋 bit će približno
normalnog oblika samo za velike uzorke (n > 30), što
je posljedica centralnog graničnog teorema
16
Procjena aritmetičke sredine populacije kada je varijanca populacije poznata
• Intervalna procjena
• Razina pouzdanosti (engl. confidence level): 1 − α
17
Procjena aritmetičke sredine populacije kada je
varijanca populacije poznata
• Interval procjene sredine μ normalno distribuirane
populacije s poznatom varijancom σ2 , uz razinu
pouzdanosti 1 −α
18
Primjer 6.11. Procjena parametra μ jednim brojem i intervalom na temelju velikog uzorka,
poznata standardna devijacija populacije
• Bahovec i Erjavec (2015.) str. 262
19
Procjena aritmetičke sredine populacije kada
varijanca populacije nije poznata
20
Procjena proporcije populacije
• Potrebno je utvrditi svojstva procjenitelja od p, te
odrediti sampling-distribuciju standardiziranog
procjenitelja od p
21
Svojstva procjenitelja proporcije populacije
• Pretpostavlja se da je varijabla X Bernoullijeva slučajna varijabla s nepoznatom očekivanom vrijednosti, p , koja se procjenjuje na temelju jednostavnog slučajnog uzorka.
• Varijable uzorka X1 , X2 ,. . . , Xn su nezavisne i jednako distribuirane.
• Varijable uzorka X1 , X2 ,. . . , Xn također su Bernoullijeve slučajne varijable koje su nezavisne, te mogu poprimiti vrijednosti 0 ili 1.
• Procjenitelj parametra p definira se kao aritmetička sredina varijabli uzorka
22
Svojstva procjenitelja proporcije populacije
• Zbroj n Bernullijevih nezavisnih slučajnih varijabli je
slučajna varijabla koja ima binomnu distribuciju
• Očekivana vrijednost i varijanca procjenitelja 𝑝
23
Svojstva procjenitelja proporcije populacije
• Sampling-distribucija procjenitelja 𝑝 je binomna
distribucija
• Procjena proporcije populacije jednim brojem
• Standardna pogreška procjene proporcije je
• Ako je tada je standardna pogreška procjene
proporcije
24
Procjena proporcije populacije s
pomoću velikog uzorka • Proporcija populacije može se procijeniti jednim
brojem i intervalom.
• Postupak procjenjivanja proporcije populacije
intervalom provodi se samo za velike uzorke.
• Za velike uzorke (n > 30) sampling-distribucija
procjenitelja 𝑝 se dobro aproksimira normalnom
distribucijom
• Interval procjene proporcije p s pomoću velikog
uzorka je
25
Primjer 6.22. Interval procjene
proporcije populacije • Bahovec i Erjavec (2015.) str. 279
26