26
Osnove statistike u demografiji Predavanje 7

Osnove statistike u demografiji - unizg.hr

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Osnove statistike u demografiji - unizg.hr

Osnove statistike u demografiji

Predavanje 7

Page 2: Osnove statistike u demografiji - unizg.hr

Procjene parametara jedne populacije

• Zaključci o karakteristikama pojave mogu se donijeti: o Prikupljanjem podataka o svim jedinicama promatrane pojave koje čine

populaciju (osnovni skup), ili

o o samo jednom dijelu jedinica

• Uzorak (engl. sample)

• Inferencijalna statistika: na temelju uzorka nastoje se

donijeti što točniji zaključci o karakteristikama populacije

koje se nazivaju parametrima

• Reprezentativan uzorak: dobro opisuje karakteristike

populacije (osnovnog skupa)

• Jednostavni slučajni uzorak. Izbor u: o konačnim i

o beskonačnim populacijama

2

Page 3: Osnove statistike u demografiji - unizg.hr

Procjene parametara jedne populacije

• Vrijednosti parametara populacije su nepoznate i

one se procjenjuju s pomoću uzorka

• Zaključci o vrijednostima parametara populacije mogu se donijeti samo uz određenu razinu pouzdanosti

• Dvije su skupine metoda inferencijalne statistike: o Procjena parametara

o Testiranje hipoteza

3

Page 4: Osnove statistike u demografiji - unizg.hr

Procjene parametara • Potrebno je definirati procjenitelja i odrediti oblik njegove

distribucije vjerojatnosti (sampling distribucija procjenitelja)

• Mogu se izračunati: o procjena parametra jednim brojem i

o intervalna procjena

4

Page 5: Osnove statistike u demografiji - unizg.hr

Testiranje hipoteza • Procjenitelju odabranog parametra pridružuje se

standardizirana varijabla

• Na temelju podataka iz slučajno izabranog uzorka

veličine n i poznavanja distribucije vjerojatnosti

standardiziranog procjenitelja donosi odluka o

odbacivanju ili ne odbacivanju postavljene

hipoteze u skladu s odgovarajućim pravilom

odlučivanja

5

Page 6: Osnove statistike u demografiji - unizg.hr

Metode izbora uzorka • Metode inferencijalne statistike temelje se na rezultatima

teorije vjerojatnosti.

• Uvjet za primjenu teorije vjerojatnosti je slučajan izbor jedinica u uzorak

• Inferencijalna statistika bavi se poopćavanjem

• Kako bi poopćavanje bilo što kvalitetnije i vjerodostojnije uzorak mora biti reprezentativan

• Reprezentativnost, mogućnost poopćavanja rezultata i primjerenost primjene statističkih metoda ovise o načinu izbora uzorka iz populacije

• Izbor uzorka može biti: o namjeran ili

o slučajan

6

Page 7: Osnove statistike u demografiji - unizg.hr

Metode izbora uzorka • Namjerni izbor: subjektivan; zato često nije

reprezentativan

• Slučajni izbor: objektivan

• Na rezultate slučajnog uzorka može se primijeniti teorija vjerojatnosti, što omogućava poopćavanje: o Procjenu parametara

o Testiranje hipoteza

• Slučajni uzorci nazivaju se još probabilističkima (engl. random samples): o jednostavni slučajni uzorak,

o sistematski uzorak,

o stratificirani uzorak i

o uzorak skupina

• Plan uzorka je skup pravila i postupaka određenog načina izbora uzorka iz populacije

7

Page 8: Osnove statistike u demografiji - unizg.hr

Jednostavni slučajni uzorak

• Svaka jedinica populacije ima jednaku vjerojatnost

da bude izabrana u uzorak

8

Page 9: Osnove statistike u demografiji - unizg.hr

Sistematski uzorak • Slučajni uzorak u kojem izbor jedinica ovisi o koraku

izbora k

• Frakcija izbora

• Na primjer, ako se iz populacije N = 50 kućanstava u

jednom selu izabire uzorak veličine n = 10 , tada je

korak izbora k = 5.

• Popis numeriranih jedinica cijele populacije naziva

se okvir izbora

9

Page 10: Osnove statistike u demografiji - unizg.hr

Stratificirani uzorak • Prikladan kada osnovni skup nije homogen

• Tada se osnovni skup može podijeliti u grupe s

obzirom na promatrano obilježje koje se ispituje,

tako da jedinice izabrane iz tih grupa budu što

homogenije.

• Takve grupe su disjunktni podskupovi i nazivaju

se stratumima.

• Stratuma može biti više i ne moraju biti jednakih

veličina

10

Page 11: Osnove statistike u demografiji - unizg.hr

Uzorak skupina • Često se primjenjuje u istraživanju tržišta

(segmentacija potrošača)

• Formira se u dva koraka: o Cijela se populacija podijeli na konačan broj skupina (klastera) te se na slučajan način

izabiru određene skupine (klasteri).

o Zatim se iz svake izabrane skupine na slučajan način izabiru jedinice

11

Page 12: Osnove statistike u demografiji - unizg.hr

Procjenitelj parametra, vrijednost procjene i

sampling-distribucija procjenitelja

• Postupak procjenjivanja nepoznatog parametra

populacije provodi se s pomoću procjenitelja

• Procjenitelj (engl. estimator) je slučajna varijabla

kojom se procjenjuje parametar populacije, dok se

konkretna vrijednost procjenitelja, dobivena na

uzorku podataka, naziva procjenom (engl.

estimate).

• “Kvaliteta” procjenitelja ovis o njegovim svojstvima.

• Ako se želi odrediti koja svojstva ima procjenitelj određenog parametra, treba poznavati distribuciju vjerojatnosti tog procjenitelja

12

Page 13: Osnove statistike u demografiji - unizg.hr

Sampling-distribucija procjenitelja

• Konkretne vrijednosti procjenitelja određenog parametara razlikovat de se od uzorka do uzorka.

• Prosječno odstupanje vrijednosti procjenitelja od stvarne vrijednosti parametra populacije krede se u granicama slučajnih varijacija.

• Te varijacije se nazivaju sampling-varijacije, a distribucija vjerojatnosti procjenitelja se naziva sampling-distribucija

• Poželjno je da se vrijednosti procjenitelja na izabranim uzorcima “gomilaju” oko stvarne vrijednosti parametra populacije (nepristranost)

• Da je prosječno odstupanje od stvarne vrijednosti parametra populacije što manje (efikasnost).

• Ponekad je dovoljno da statistička svojstva vrijede asimptotski, tj. da s porastom veličine uzorka n procjenitelj ima navedena svojstva

13

Page 14: Osnove statistike u demografiji - unizg.hr

Procjena aritmetičke sredine populacije

14

Page 15: Osnove statistike u demografiji - unizg.hr

Standardna pogreška procjene

aritmetičke sredine • Standardna devijacija procjenitelja 𝑋 je prosječno

odstupanje aritmetičkih sredina uzoraka od sredine populacije

• Kada se slučajni uzorak izabire bez ponavljanja iz konačne populacije, rezultati izbora jedinica u uzorak nisu nezavisni, tj. kovarijance između varijabli uzorka X1, X2,. . . , Xn nisu jednake nuli. U tom slučaju je standardna pogreška aritmetičke sredine

• Faktor korekcije za konačne populacije o Izostavlja se ako je

15

Page 16: Osnove statistike u demografiji - unizg.hr

Sampling-distribucija procjenitelja 𝑋

• Ako je jednostavni slučajni uzorak izabran iz

normalno distribuirane populacije sampling-

distribucija procjenitelja 𝑋 je normalna distribucija

(za bilo koju veličinu uzorka n)

• Ako populacija nije normalno distribuirana,

sampling-distribucija procjenitelja 𝑋 bit će približno

normalnog oblika samo za velike uzorke (n > 30), što

je posljedica centralnog graničnog teorema

16

Page 17: Osnove statistike u demografiji - unizg.hr

Procjena aritmetičke sredine populacije kada je varijanca populacije poznata

• Intervalna procjena

• Razina pouzdanosti (engl. confidence level): 1 − α

17

Page 18: Osnove statistike u demografiji - unizg.hr

Procjena aritmetičke sredine populacije kada je

varijanca populacije poznata

• Interval procjene sredine μ normalno distribuirane

populacije s poznatom varijancom σ2 , uz razinu

pouzdanosti 1 −α

18

Page 19: Osnove statistike u demografiji - unizg.hr

Primjer 6.11. Procjena parametra μ jednim brojem i intervalom na temelju velikog uzorka,

poznata standardna devijacija populacije

• Bahovec i Erjavec (2015.) str. 262

19

Page 20: Osnove statistike u demografiji - unizg.hr

Procjena aritmetičke sredine populacije kada

varijanca populacije nije poznata

20

Page 21: Osnove statistike u demografiji - unizg.hr

Procjena proporcije populacije

• Potrebno je utvrditi svojstva procjenitelja od p, te

odrediti sampling-distribuciju standardiziranog

procjenitelja od p

21

Page 22: Osnove statistike u demografiji - unizg.hr

Svojstva procjenitelja proporcije populacije

• Pretpostavlja se da je varijabla X Bernoullijeva slučajna varijabla s nepoznatom očekivanom vrijednosti, p , koja se procjenjuje na temelju jednostavnog slučajnog uzorka.

• Varijable uzorka X1 , X2 ,. . . , Xn su nezavisne i jednako distribuirane.

• Varijable uzorka X1 , X2 ,. . . , Xn također su Bernoullijeve slučajne varijable koje su nezavisne, te mogu poprimiti vrijednosti 0 ili 1.

• Procjenitelj parametra p definira se kao aritmetička sredina varijabli uzorka

22

Page 23: Osnove statistike u demografiji - unizg.hr

Svojstva procjenitelja proporcije populacije

• Zbroj n Bernullijevih nezavisnih slučajnih varijabli je

slučajna varijabla koja ima binomnu distribuciju

• Očekivana vrijednost i varijanca procjenitelja 𝑝

23

Page 24: Osnove statistike u demografiji - unizg.hr

Svojstva procjenitelja proporcije populacije

• Sampling-distribucija procjenitelja 𝑝 je binomna

distribucija

• Procjena proporcije populacije jednim brojem

• Standardna pogreška procjene proporcije je

• Ako je tada je standardna pogreška procjene

proporcije

24

Page 25: Osnove statistike u demografiji - unizg.hr

Procjena proporcije populacije s

pomoću velikog uzorka • Proporcija populacije može se procijeniti jednim

brojem i intervalom.

• Postupak procjenjivanja proporcije populacije

intervalom provodi se samo za velike uzorke.

• Za velike uzorke (n > 30) sampling-distribucija

procjenitelja 𝑝 se dobro aproksimira normalnom

distribucijom

• Interval procjene proporcije p s pomoću velikog

uzorka je

25

Page 26: Osnove statistike u demografiji - unizg.hr

Primjer 6.22. Interval procjene

proporcije populacije • Bahovec i Erjavec (2015.) str. 279

26