91
STATISTIKA STATISTIKA Prof.dr.sc.Smiljana Leinert Novosel, Prof.dr.sc.Smiljana Leinert Novosel, Fakultet političkih znanosti Fakultet političkih znanosti Sveučilište u Zagrebu Sveučilište u Zagrebu

Cjelokupno predavanje (Statistika)

Embed Size (px)

DESCRIPTION

Fakultet političkih znanosti, Sveučilište u Zagrebu

Citation preview

Page 1: Cjelokupno predavanje (Statistika)

STATISTIKASTATISTIKA

Prof.dr.sc.Smiljana Leinert Novosel, Prof.dr.sc.Smiljana Leinert Novosel, Fakultet političkih znanostiFakultet političkih znanosti

Sveučilište u ZagrebuSveučilište u Zagrebu

Page 2: Cjelokupno predavanje (Statistika)

Zašto STATISTIKA?Zašto STATISTIKA?• više od 100 definicijaviše od 100 definicija• zajedničko: - prikupitizajedničko: - prikupiti -- obraditiobraditi - prikazati- prikazati• primjene: - različite sfere životaprimjene: - različite sfere života - prve primjene u psihologiji oko 1920. - prve primjene u psihologiji oko 1920.

-- oko 2.svj.rata- prodor oko 2.svj.rata- prodor statističkog načina mišljenja u statističkog načina mišljenja u razne grane i područja (društvena,razne grane i područja (društvena, tehnička, sport, medicina…)tehnička, sport, medicina…) - danas: dio općeg obrazovanja i kulture- danas: dio općeg obrazovanja i kulture

Page 3: Cjelokupno predavanje (Statistika)

• Ključni cilj - POZNAVANJE POJMOVA + Ključni cilj - POZNAVANJE POJMOVA +

STATISTIČKI NAČIN STATISTIČKI NAČIN

MIŠLJENJAMIŠLJENJA

Page 4: Cjelokupno predavanje (Statistika)

• U znanosti: U znanosti:

a) za praćenje literaturea) za praćenje literature

b) za istraživanja (tablice, grafički prikazi,b) za istraživanja (tablice, grafički prikazi,

srednje vrijednosti)- DESKRIPTIVNAsrednje vrijednosti)- DESKRIPTIVNA

STATISTIKASTATISTIKA

c) zbog zaključivanja (konkretno/općenito)-c) zbog zaključivanja (konkretno/općenito)-

INFERENCIJALNA STATISTIKAINFERENCIJALNA STATISTIKA

d) pri planiranju istraživanja i eksperimenata:d) pri planiranju istraživanja i eksperimenata:

veličina uzorka (veća preciznost, veći uzorak; veličina uzorka (veća preciznost, veći uzorak;

veća varijabilnost pojave, veći uzorak; rjeđa veća varijabilnost pojave, veći uzorak; rjeđa

pojava, veći uzorak) pojava, veći uzorak)

Page 5: Cjelokupno predavanje (Statistika)

• Pozitivni i negativni efekti statistike ili kakoPozitivni i negativni efekti statistike ili kako

lagati statistikomlagati statistikom

• Odbojnost prema statisticiOdbojnost prema statistici

a) pojednostavnjenja a) pojednostavnjenja

b) novi simboli i pojmovib) novi simboli i pojmovi

c) može li bez matematike? (logika + c) može li bez matematike? (logika +

elementi matematike)elementi matematike)

Page 6: Cjelokupno predavanje (Statistika)

Obilježja u statisticiObilježja u statistici

a) zemljopisno/geografsko obilježjea) zemljopisno/geografsko obilježje

b) atributivno obilježjeb) atributivno obilježje

c) vremensko obilježjec) vremensko obilježje

d) numeričko obilježje d) numeričko obilježje - kontinuirano- kontinuirano - diskontinuirano - diskontinuirano

Page 7: Cjelokupno predavanje (Statistika)

PRIMJERIPRIMJERI

1. Nove članice EU od 2004. prema broju 1. Nove članice EU od 2004. prema broju stanovnikastanovnika

ZEMLJE ČLANICEZEMLJE ČLANICE BR. STANOVNIKA (milj.)BR. STANOVNIKA (milj.) Mađarska 9,9Mađarska 9,9

Poljska 38,6Poljska 38,6 Slovačka 5,4Slovačka 5,4 Slovenija 2,0Slovenija 2,0 Češka 10,3Češka 10,3 Estonija 1,4Estonija 1,4 Letonija 2,3Letonija 2,3 Litva 3,4Litva 3,4

Cipar 0,8Cipar 0,8

Malta 0,4Malta 0,4

Page 8: Cjelokupno predavanje (Statistika)

2. Fakulteti zagrebačkog sveučilišta prema2. Fakulteti zagrebačkog sveučilišta prema

broju diplomiranih (2005.)broju diplomiranih (2005.)

FAKULTET BR. DIPLOMIRANIHFAKULTET BR. DIPLOMIRANIH Arhitektonski 189Arhitektonski 189

Ekonomski 365Ekonomski 365

Medicinski 204Medicinski 204

Agronomski 118Agronomski 118

Pravni 205Pravni 205

PMF 185PMF 185

Filozofski 245Filozofski 245

Veterinarski 132Veterinarski 132

FER 198FER 198

FPZ 163FPZ 163

Page 9: Cjelokupno predavanje (Statistika)

3.Studenti FPZ-a (redoviti i izvanredni) 3.Studenti FPZ-a (redoviti i izvanredni) upisani po godinama upisani po godinama

GODINA BR. STUDENATAGODINA BR. STUDENATA 1998. 2181998. 218

1999. 1951999. 195 2000. 1852000. 185 2001. 2042001. 204 2002. 1802002. 180 2003. 2082003. 208 2004. 2132004. 213 2005. 1952005. 195

Page 10: Cjelokupno predavanje (Statistika)

4.Stanovi prema površinama stambenih4.Stanovi prema površinama stambenih prostoraprostora POVRŠINA BR. STAN. PRAVE GR. VEL. RAZ. RAZ. SR. COR. FR. CUM. FR.POVRŠINA BR. STAN. PRAVE GR. VEL. RAZ. RAZ. SR. COR. FR. CUM. FR. (16)- 25 5 (15,5)- 25,5 10 20,5 2,5 5(16)- 25 5 (15,5)- 25,5 10 20,5 2,5 5 26- 30 8 25,5- 30,5 5 28,0 8 1326- 30 8 25,5- 30,5 5 28,0 8 13 31- 35 9 30,5- 35,5 5 33,0 9 2231- 35 9 30,5- 35,5 5 33,0 9 22 36- 40 12 35,5- 40,5 5 38,0 12 3436- 40 12 35,5- 40,5 5 38,0 12 34 41- 45 15 40,5- 45,5 5 43,0 15 4941- 45 15 40,5- 45,5 5 43,0 15 49 46- 50 20 45,5- 50,5 5 48,0 20 6946- 50 20 45,5- 50,5 5 48,0 20 69 51- 55 21 50,5- 55,5 5 53,0 21 9051- 55 21 50,5- 55,5 5 53,0 21 90 56- 60 30 55,5- 60,5 5 58,0 30 12056- 60 30 55,5- 60,5 5 58,0 30 120 61- 65 12 60,5- 65,5 5 63,0 12 13261- 65 12 60,5- 65,5 5 63,0 12 132 66- 75 4 65,5- 75,5 10 70,5 2 13666- 75 4 65,5- 75,5 10 70,5 2 136 76- (100) 2 75,5- (100,5) 25 88,0 0,4 13876- (100) 2 75,5- (100,5) 25 88,0 0,4 138 138138

Kontinuirani numerički niz s elementima!Kontinuirani numerički niz s elementima!

Page 11: Cjelokupno predavanje (Statistika)

Broj pacijenata obzirom na godine starostiBroj pacijenata obzirom na godine starosti

GOD. STAR. BR. PAC. PRAVE GR. VEL. RAZ. RAZ. SR. COR. FR CUM. FR.GOD. STAR. BR. PAC. PRAVE GR. VEL. RAZ. RAZ. SR. COR. FR CUM. FR.

(1)- 10 4 (1)- 11 10 6 2 4(1)- 10 4 (1)- 11 10 6 2 4

11- 15 20 11-16 5 13,5 20 2411- 15 20 11-16 5 13,5 20 24

16- 20 31 16- 21 5 18,5 31 5516- 20 31 16- 21 5 18,5 31 55

21- 25 30 21- 26 5 23,5 30 8521- 25 30 21- 26 5 23,5 30 85

26- 30 34 26- 31 5 28,5 34 11926- 30 34 26- 31 5 28,5 34 119

31- 35 38 31- 36 5 33,5 38 15731- 35 38 31- 36 5 33,5 38 157

36- 40 40 36- 41 5 38,5 40 19736- 40 40 36- 41 5 38,5 40 197

41- 50 9 41- 51 10 46,0 4,5 20641- 50 9 41- 51 10 46,0 4,5 206

51- (70) 1 51- (71) 20 61,0 0,25 20751- (70) 1 51- (71) 20 61,0 0,25 207

207207

Page 12: Cjelokupno predavanje (Statistika)

Broj poduzeća obzirom na broj zaposlenihBroj poduzeća obzirom na broj zaposlenih

ZAPOSLENICI BR. POD. VEL. RAZ. RAZ. SR. COR. FR. CUM. FR.ZAPOSLENICI BR. POD. VEL. RAZ. RAZ. SR. COR. FR. CUM. FR.

(5)- 10 5 6 7,5 4,17 5(5)- 10 5 6 7,5 4,17 5

11- 15 8 5 13 8 1311- 15 8 5 13 8 13

16- 20 10 5 18 10 2316- 20 10 5 18 10 23

21- 25 30 5 23 30 5321- 25 30 5 23 30 53

26- 30 31 5 28 31 8426- 30 31 5 28 31 84

31- 35 38 5 33 38 12231- 35 38 5 33 38 122

36- 40 45 5 38 45 16736- 40 45 5 38 45 167

41- 45 50 5 43 50 21741- 45 50 5 43 50 217

46- 50 70 5 48 70 28746- 50 70 5 48 70 287

51- 55 20 5 53 20 30751- 55 20 5 53 20 307

56- 60 12 5 58 12 31956- 60 12 5 58 12 319

61- 80 4 20 70,5 1,0 32361- 80 4 20 70,5 1,0 323

81- (100) 2 20 90,5 0,5 32581- (100) 2 20 90,5 0,5 325

325325

Diskontinuirani numerički niz!Diskontinuirani numerički niz!

Page 13: Cjelokupno predavanje (Statistika)

Skale mjerenjaSkale mjerenja

1.Nominalna skala1.Nominalna skala

2.Ordinalna skala2.Ordinalna skala

3.Intervalna skala3.Intervalna skala

4.Omjerna skala4.Omjerna skala

- Skale obzirom na vrste obilježja - Skale obzirom na vrste obilježja

Page 14: Cjelokupno predavanje (Statistika)

PRIMJERI SKALAPRIMJERI SKALA

a) Nominalnaa) Nominalna Džeparac dobivam od: Džeparac dobivam od: - od roditelja 85- od roditelja 85 - sam zarađujem 4- sam zarađujem 4 - stipendist 2- stipendist 2 9191 Način korištenja slobodnog vremena zap. žene:Način korištenja slobodnog vremena zap. žene: - odmor 62- odmor 62 - razonoda 66- razonoda 66 - druš. aktiv. 3- druš. aktiv. 3 - s djecom 54- s djecom 54 - u učenju 7- u učenju 7 - na dr. način 6- na dr. način 6 198198

Page 15: Cjelokupno predavanje (Statistika)

b) Ordinalnab) Ordinalna

Percepcija životnog standardaPercepcija životnog standarda

- izrazito loš 20- izrazito loš 20

- loš 14- loš 14

- osrednji 52- osrednji 52

- veoma dobar 10- veoma dobar 10

- odličan 3- odličan 3

9999

Ocjena iz statistikeOcjena iz statistike

- nedovoljan 9- nedovoljan 9

- dovoljan 21- dovoljan 21

- dobar 72- dobar 72

- vrlo dobar 10- vrlo dobar 10

- odličan 4- odličan 4

116116

Page 16: Cjelokupno predavanje (Statistika)

Načini prikazivanja podatakaNačini prikazivanja podataka

1.TABELARNI (TABLIČNI) PRIKAZ1.TABELARNI (TABLIČNI) PRIKAZ

2.GRAFIČKI PRIKAZ2.GRAFIČKI PRIKAZ

Ad 1. preciznost, detalji, preglednostAd 1. preciznost, detalji, preglednost

Ad 2. vizualni dojam- redukcija suvišnih Ad 2. vizualni dojam- redukcija suvišnih podataka, odnosi, trendovipodataka, odnosi, trendovi

Page 17: Cjelokupno predavanje (Statistika)

1. Osnovni elementi tablice: broj, naslov,1. Osnovni elementi tablice: broj, naslov,

tablični dio, izvortablični dio, izvor

2. Vrste tablica: a) jednostavne2. Vrste tablica: a) jednostavne

b) skupneb) skupne

c) kombiniranec) kombinirane

Page 18: Cjelokupno predavanje (Statistika)

Primjeri tablicaPrimjeri tablica

JEDNOSTAVNA JEDNOSTAVNA

T1.T1.

RAZLOZI UPISA NA RAZLOZI UPISA NA FPZ (anketa FPZ,2004.)FPZ (anketa FPZ,2004.)

RazloziRazlozi Br. stud.Br. stud.

Isključiva željaIsključiva želja 180180

Nisam uspio drugdjeNisam uspio drugdje 3131

Bilo mi je svejednoBilo mi je svejedno 1212

UkupnoUkupno 223223

Page 19: Cjelokupno predavanje (Statistika)

SKUPNASKUPNA T2T2

Izvor: anketa FPZ, 2004.Izvor: anketa FPZ, 2004.

RAZLOZI UPISA RAZLOZI UPISA OBZIROM NA OBZIROM NA SPOLSPOL

RazloziRazlozi ŽŽ MM

Isključiva željaIsključiva želja 9191 8989

Nisam uspio Nisam uspio drugdjedrugdje

1111 2020

Bilo mi je Bilo mi je svejednosvejedno

55 77

UkupnoUkupno 107107 116116

Page 20: Cjelokupno predavanje (Statistika)

KOMBINIRANAKOMBINIRANA

T3T3

Postoji li veza između obrazovanja žena i broja rođene djece?Postoji li veza između obrazovanja žena i broja rođene djece?

Izvor: Istraž. FPZ, 2003.Izvor: Istraž. FPZ, 2003.

Razina obrazovanja Razina obrazovanja ženažena

Broj Broj djecedjece

Ukup.Ukup.

jednojedno dvojedvoje troje i troje i viševiše

NižeNiže 1616 2828 3131 7575

SrednjeSrednje 2828 3939 1919 8686

Više i visokoViše i visoko 3232 1616 44 5252

UkupnoUkupno 7676 8383 5454 213213

Page 21: Cjelokupno predavanje (Statistika)

Grafičko prikazivanje:Grafičko prikazivanje:

1. površinskim prikazima1. površinskim prikazima

2. linijskim prikazima2. linijskim prikazima

Ad 1. pravokutnici (stupci): Ad 1. pravokutnici (stupci):

a) jednostruki (vertikalni, horizontalni)a) jednostruki (vertikalni, horizontalni)

b) dvostruki (grupirani)b) dvostruki (grupirani)

c) razdijeljeni c) razdijeljeni

Page 22: Cjelokupno predavanje (Statistika)

Primjeri površinskih prikazaPrimjeri površinskih prikaza

BROJ DIPLOMIRANIH NA FPZ-u (2000.- 2005.)BROJ DIPLOMIRANIH NA FPZ-u (2000.- 2005.)

0

50

100

150

200

250

2000. 2002. 2004.

Br. dipl.

Page 23: Cjelokupno predavanje (Statistika)

STUDENTI OBZIROM NA SMJEŠTAJ TIJEKOM STUDIJASTUDENTI OBZIROM NA SMJEŠTAJ TIJEKOM STUDIJA

0 50 100 150 200

S roditelj.

Privatno

Stud. Dom

Vlast. Stan

Studenti

Page 24: Cjelokupno predavanje (Statistika)

BROJ DIPLOMIRANIH NA FPZ- u OBZIROM NA SPOLBROJ DIPLOMIRANIH NA FPZ- u OBZIROM NA SPOL

(2000.- 2005.)(2000.- 2005.)

0

20

40

60

80

100

120

2000. 2001. 2002. 2003. 2004. 2005.

M

Ž

Page 25: Cjelokupno predavanje (Statistika)

STUDENTI OBZIROM NA SMJEŠTAJ TIJEKOM STUDIJA I SPOLSTUDENTI OBZIROM NA SMJEŠTAJ TIJEKOM STUDIJA I SPOL

0 50 100 150 200

S roditelj.

Privatno

Stud. Dom

Vlast. Stan

M

Ž

Page 26: Cjelokupno predavanje (Statistika)

Grafički prikaz strukturnim krugom- Grafički prikaz strukturnim krugom- prikaz postotakaprikaz postotaka

S roditelj.PrivatnoStud. DomVlast. Stan

Page 27: Cjelokupno predavanje (Statistika)

Grafički prikazi zemljopisnog obilježjaGrafički prikazi zemljopisnog obilježja

( kartogrami )( kartogrami )

a) Dijagramska kartaa) Dijagramska karta

b) Piktogramb) Piktogram

Page 28: Cjelokupno predavanje (Statistika)

Grafički prikaz linijskim grafikonomGrafički prikaz linijskim grafikonom

BROJ ZAPOSLENIH ŽENA PREMA STAROSTIBROJ ZAPOSLENIH ŽENA PREMA STAROSTI

0

5

10

15

20

25

30

35

18-20

25-29

35-39

45-49

55-64

Starost žena

Page 29: Cjelokupno predavanje (Statistika)

Metode relativnih brojevaMetode relativnih brojeva

Skupina metoda kojima opisujemo karakter pojave stavljajući Skupina metoda kojima opisujemo karakter pojave stavljajući u odnos dijelove sa cjelinom ili međusobno; koriste se i za u odnos dijelove sa cjelinom ili međusobno; koriste se i za praćenje promjena tijekom vremena ili u različitim praćenje promjena tijekom vremena ili u različitim zemljopisnim situacijama.zemljopisnim situacijama.

- Relativne frekvencije- Relativne frekvencije

- Postoci (horizontalni 100, vertikalni 100)- Postoci (horizontalni 100, vertikalni 100)

- Proporcije - Proporcije

- Relativni broj koordinacije- Relativni broj koordinacije

- Metoda indeksa- Metoda indeksa

Page 30: Cjelokupno predavanje (Statistika)

Obrazloženja i primjeriObrazloženja i primjeri

a) Relativne frekvencijea) Relativne frekvencije

Noćenja turista po županijama (u tisućama), 2003.god.Noćenja turista po županijama (u tisućama), 2003.god.

ŽUPANIJE BR. NOĆENJA ŽUPANIJE BR. NOĆENJA REL. FR.REL. FR.

Istarska 3280 0,261Istarska 3280 0,261

Splitsko-dalmatinska 2320 0,184Splitsko-dalmatinska 2320 0,184

Ličko-senjska 940 0,075Ličko-senjska 940 0,075

Šibensko-kninska 2030 0,161Šibensko-kninska 2030 0,161

Zadarska 1405 0,112Zadarska 1405 0,112

Dubrovačko- neret. 2607 0,207Dubrovačko- neret. 2607 0,207

12582 1,00012582 1,000

Page 31: Cjelokupno predavanje (Statistika)

b) Postocib) PostociHorizontalni 100Horizontalni 100Način dolaska na posao žena i muškaraca zaposlenih u “Plivi”Način dolaska na posao žena i muškaraca zaposlenih u “Plivi”NAČIN DOLASKA M Ž Uk M% Ž% Uk%NAČIN DOLASKA M Ž Uk M% Ž% Uk% auto 21 18 39 53,85 46,15 100,00auto 21 18 39 53,85 46,15 100,00 bus 9 13 22 40,91 59,09 100,00bus 9 13 22 40,91 59,09 100,00 bus-tram. 24 21 45 53,33 46,67 100,00bus-tram. 24 21 45 53,33 46,67 100,00 tram. 39 52 91 42,86 57,14 100,00tram. 39 52 91 42,86 57,14 100,00 pješice 20 18 38 52,63 47,37 100,00pješice 20 18 38 52,63 47,37 100,00 113 122 235 48,09 51,91 100,00113 122 235 48,09 51,91 100,00

Vertikalni 100Vertikalni 100NAČIN DOLASKA M ŽNAČIN DOLASKA M Ž auto 18,58 14,75auto 18,58 14,75 bus 7,96 10,66bus 7,96 10,66 bus-tram. 21,25 17,21bus-tram. 21,25 17,21 tram. 34,51 42,62tram. 34,51 42,62 pješice 17,70 14,76pješice 17,70 14,76 100,00 100,00100,00 100,00

Page 32: Cjelokupno predavanje (Statistika)

Horizontalni 100- grafičkiHorizontalni 100- grafički

0

20

40

60

80

100

Auto Bus-tram.

Pješice

Ž

M

Page 33: Cjelokupno predavanje (Statistika)

Vertikalni 100- grafičkiVertikalni 100- grafički

- koristi se prikaz strukturnim krugom- koristi se prikaz strukturnim krugom

Page 34: Cjelokupno predavanje (Statistika)

c) Proporcijec) ProporcijeOd ukupnog broja osoba koje su na dan ispitivanja uzete u Od ukupnog broja osoba koje su na dan ispitivanja uzete u

uzorak, od njih 235, zanima nas proporcija onih koji su uzorak, od njih 235, zanima nas proporcija onih koji su stigli autobusom i tramvajem. stigli autobusom i tramvajem.

45 / 235 = 0,191 p = 0,19145 / 235 = 0,191 p = 0,191

190 / 235 = 0,809 q = 0,809190 / 235 = 0,809 q = 0,809

p + q = 1p + q = 1

Page 35: Cjelokupno predavanje (Statistika)

d) Relativni broj koordinacijed) Relativni broj koordinacijeU visoko školskim obrazovnim institucijama među U visoko školskim obrazovnim institucijama među

znanstveno- nastavnim osobljem bilo je 2001. god. znanstveno- nastavnim osobljem bilo je 2001. god. zaposleno 898 muškaraca i 216 žena. zaposleno 898 muškaraca i 216 žena.

Zanima nas koliko je te godine muškaraca nastavnika bilo Zanima nas koliko je te godine muškaraca nastavnika bilo zaposleno na 100 žena nastavnica!zaposleno na 100 žena nastavnica!

898 / 216 x 100 = 415,7898 / 216 x 100 = 415,7

Na 100 nastavnica te je godine dolazilo 416 zaposlenih Na 100 nastavnica te je godine dolazilo 416 zaposlenih nastavnika.nastavnika.

Page 36: Cjelokupno predavanje (Statistika)

e) Metoda indeksae) Metoda indeksa- Interpretiraju se kao postoci- Interpretiraju se kao postoci

- Nikad negativan broj, samo veći ili manji od 100- Nikad negativan broj, samo veći ili manji od 100

VRSTE INDEKSAVRSTE INDEKSA

a) Obzirom na izračunavanjea) Obzirom na izračunavanje

- Indeksi na stalnoj bazi- bazni indeksi- Indeksi na stalnoj bazi- bazni indeksi

- Indeksi na promjenjivoj bazi- verižni, lančani indeksi- Indeksi na promjenjivoj bazi- verižni, lančani indeksi

b) Obzirom na obilježje u predkoloni b) Obzirom na obilježje u predkoloni

- Zemljopisni- Zemljopisni

- Vremenski- Vremenski

c) Obzirom na broj podataka c) Obzirom na broj podataka

- Individualni indeksi- Individualni indeksi

- Skupni indeksi- Skupni indeksi

Page 37: Cjelokupno predavanje (Statistika)

PRIMJERIPRIMJERI

Broj nezaposlenih žena u Zagrebačkoj županiji po godinamaBroj nezaposlenih žena u Zagrebačkoj županiji po godinama

GODINA BR. ŽENA baza=2000. GODINA BR. ŽENA baza=2000.

1986. 1628 63,6 -1986. 1628 63,6 -

1997. 1672 65,3 102,7 1997. 1672 65,3 102,7

1998. 1705 66,6 101,971998. 1705 66,6 101,97

1999. 1422 55,5 83,41999. 1422 55,5 83,4

2000. 2560 100,0 180,02000. 2560 100,0 180,0

2001. 4080 159,4 159,42001. 4080 159,4 159,4

2002. 5842 228,2 143,22002. 5842 228,2 143,2

2003. 6308 246,2 107,98 2003. 6308 246,2 107,98

Page 38: Cjelokupno predavanje (Statistika)

Mjere srednjih vrijednostiMjere srednjih vrijednosti(centralne tendencije)(centralne tendencije)

- Kroz jednu vrijednost govore o karakteru pojave- Kroz jednu vrijednost govore o karakteru pojave

- Dijele se na POZICIONE i IZVEDENE - Dijele se na POZICIONE i IZVEDENE a) POZICIONE (lokacijske)a) POZICIONE (lokacijske) - vrijednost uvjetovana pozicijom u nizu- vrijednost uvjetovana pozicijom u nizu - karakteristične pozicije: najveća koncentracija - karakteristične pozicije: najveća koncentracija frekvencija, vrijednost niza na polovini, četvrtini, petini,frekvencija, vrijednost niza na polovini, četvrtini, petini, desetini, stotini…desetini, stotini… - Mod, Medijan, Kvartili 1 i 3, Kvintili, Decili, Centili- Mod, Medijan, Kvartili 1 i 3, Kvintili, Decili, Centili

Page 39: Cjelokupno predavanje (Statistika)

MODMOD

- simbol = Mo- simbol = Mo

- mjesto najgušće koncentracije jedinica niza- mjesto najgušće koncentracije jedinica niza

- tipična vrijednost u nizu - dominantna vrijednost- tipična vrijednost u nizu - dominantna vrijednost

- primjenjuje se na numeričke nizove, ali i atributivne- primjenjuje se na numeričke nizove, ali i atributivne

- primjenjuje se na individualne i grupirane podatke- primjenjuje se na individualne i grupirane podatke

- jedan apsolutni Mo i nekoliko relativnih (unimodalna- jedan apsolutni Mo i nekoliko relativnih (unimodalna

i polimodalna krivulja)i polimodalna krivulja)

- način interpretacije: najveća, najjača, dominantna - način interpretacije: najveća, najjača, dominantna

vrijednost u nizuvrijednost u nizu

Page 40: Cjelokupno predavanje (Statistika)

Primjer izračunavanja MoPrimjer izračunavanja Mo

Zanima nas najčešća dužina radnog staža zaposlenih osobaZanima nas najčešća dužina radnog staža zaposlenih osoba

RADNI STAŽ BR. ZAP. VEL. RAZ. COR. FR.RADNI STAŽ BR. ZAP. VEL. RAZ. COR. FR.

(GOD.)(GOD.)

0- 1 3 0- 1,5 1,5 100- 1 3 0- 1,5 1,5 10

2- 3 8 1,5- 3,5 2 202- 3 8 1,5- 3,5 2 20

4- 5 9 3,5- 5,5 2 4- 5 9 3,5- 5,5 2 22,522,5

6- 10 12 5,5- 10,5 5 126- 10 12 5,5- 10,5 5 12

11- 15 18 10,5- 15,5 5 1811- 15 18 10,5- 15,5 5 18

16- 20 21 15,5- 20,5 5 2116- 20 21 15,5- 20,5 5 21

21- 25 17 20,5- 25,5 5 1721- 25 17 20,5- 25,5 5 17

26- 30 10 25,5- 30,5 5 1026- 30 10 25,5- 30,5 5 10

31- (45) 6 30,5- (45,5) 15 2 31- (45) 6 30,5- (45,5) 15 2

Mo= 3,5 + 2,5/2,5 +10,5 x 2 Mo= 3,88 godinaMo= 3,5 + 2,5/2,5 +10,5 x 2 Mo= 3,88 godina

Page 41: Cjelokupno predavanje (Statistika)

MedijanMedijan

- simbol = Me- simbol = Me

- nalazi se na samoj polovini niza, odnosno, - nalazi se na samoj polovini niza, odnosno,

raspolavlja ga na dva jednaka dijelaraspolavlja ga na dva jednaka dijela

- za izračunavanje potrebna kolona kumulativnih - za izračunavanje potrebna kolona kumulativnih

frekvencijafrekvencija

- interpretacija: prvih 50% članova niza ima - interpretacija: prvih 50% članova niza ima

vrijednost Me i manje od toga sve do najmanjevrijednost Me i manje od toga sve do najmanje

vrijednosti u nizu, dok drugih 50% članova nizavrijednosti u nizu, dok drugih 50% članova niza

ima također vrijednost Me i više od toga sve doima također vrijednost Me i više od toga sve do

najveće vrijednosti nizanajveće vrijednosti niza

Page 42: Cjelokupno predavanje (Statistika)

KvartiliKvartili - simboli = Q1 i Q3- simboli = Q1 i Q3

- govore o vrijednosti pojave na prvoj, odnosno, trećoj- govore o vrijednosti pojave na prvoj, odnosno, trećoj

četvrtini nizačetvrtini niza

- za izračunavanje potrebne su kumulativne frekvencije- za izračunavanje potrebne su kumulativne frekvencije

- interpretacija Q1: prvih 25% članova niza ima - interpretacija Q1: prvih 25% članova niza ima

vrijednost Q1 i manje sve do najmanje vrijednosti u vrijednost Q1 i manje sve do najmanje vrijednosti u

nizu; pri tome preostalih 75% članova niza ima nizu; pri tome preostalih 75% članova niza ima

također vrijednost Q1 i više sve do najveće vrijednostitakođer vrijednost Q1 i više sve do najveće vrijednosti

nizaniza

- interpretacija Q3: posljednjih 25% članova niza ima - interpretacija Q3: posljednjih 25% članova niza ima

vrijednost Q3 i više od toga sve do najveće vrijednostivrijednost Q3 i više od toga sve do najveće vrijednosti

niza… niza…

Page 43: Cjelokupno predavanje (Statistika)

Primjer izračunavanja Me, Q1 i Q3Primjer izračunavanja Me, Q1 i Q3

Kolika je središnja starost novinara članova novinarskog društva?Kolika je središnja starost novinara članova novinarskog društva?

STAR. NOV. BR. NOV. VEL. RAZ. CUM. FREK. STAR. NOV. BR. NOV. VEL. RAZ. CUM. FREK.

(GOD.)(GOD.)

(18)- 20 12 (18)- 21 3 12(18)- 20 12 (18)- 21 3 12

21- 22 29 21- 23 2 4121- 22 29 21- 23 2 41

23- 25 31 23- 26 3 7223- 25 31 23- 26 3 72

26- 28 42 26- 29 3 11426- 28 42 26- 29 3 114

29- 31 49 29- 32 3 16329- 31 49 29- 32 3 163

32- 34 58 32- 35 3 32- 34 58 32- 35 3 221221

35- 37 42 35- 38 3 26335- 37 42 35- 38 3 263

38- 41 34 38- 42 4 29738- 41 34 38- 42 4 297

42- 49 27 42- 50 8 32442- 49 27 42- 50 8 324

50- (59) 11 50- (60) 10 33550- (59) 11 50- (60) 10 335

335335

Me= 32 + (167,5 – 163) / 58 x 3 Me= 32,23 godina Me= 32 + (167,5 – 163) / 58 x 3 Me= 32,23 godina

Q1= 26 + (83,75 – 32) / 42 x 3 Q1= 26,84 godinaQ1= 26 + (83,75 – 32) / 42 x 3 Q1= 26,84 godina

Q3= 35 + (251,25 – 221) / 42 x 3 Q3= 37,16 godina Q3= 35 + (251,25 – 221) / 42 x 3 Q3= 37,16 godina

Page 44: Cjelokupno predavanje (Statistika)

Mjere raspršenosti (disperzije)Mjere raspršenosti (disperzije) - nužno je znati kakvog je karaktera numerički niz iz- nužno je znati kakvog je karaktera numerički niz iz

kojeg su izračunavani kvartili kojeg su izračunavani kvartili

- ukoliko je riječ o homogenom nizu, odnosno, o maloj- ukoliko je riječ o homogenom nizu, odnosno, o maloj

disperziji jedinica niza, izračunate srednje vrijednostidisperziji jedinica niza, izračunate srednje vrijednosti

su kvalitetni pokazatelji niza; kod heterogenog niza,su kvalitetni pokazatelji niza; kod heterogenog niza,

onog sa velikom disperzijom jedinica, izračunati onog sa velikom disperzijom jedinica, izračunati

pokazatelji gube na kvaliteti pri interpretaciji pojavepokazatelji gube na kvaliteti pri interpretaciji pojave

- nužno je izračunati pokazatelje raspršenosti za svaki- nužno je izračunati pokazatelje raspršenosti za svaki

niz; oni se dijele na: apsolutni pokazatelj i relativniniz; oni se dijele na: apsolutni pokazatelj i relativni

pokazatelj disperzijepokazatelj disperzije

Page 45: Cjelokupno predavanje (Statistika)

Apsolutni pokazatelj= Apsolutni pokazatelj= interkvartilinterkvartil Q = Q3 – Q1Q = Q3 – Q1

Relativni pokazatelj= Relativni pokazatelj= koeficijent kvartilne devijacijekoeficijent kvartilne devijacije Vq = Q3 – Q1 / Q3 + Q1Vq = Q3 – Q1 / Q3 + Q1

- Vq se uvijek kreće između 0 i 1- Vq se uvijek kreće između 0 i 1

- što je rezultat bliži 0 raspršenost je manja, a niz - što je rezultat bliži 0 raspršenost je manja, a niz

homogeniji; rezultat bliži 1 govori o većoj raspršenosti ihomogeniji; rezultat bliži 1 govori o većoj raspršenosti i

heterogenom nizu heterogenom nizu

- 0 – 0,4 (mala raspršenost)- 0 – 0,4 (mala raspršenost)

- 0,5 – 0,7 (srednja raspršenost)- 0,5 – 0,7 (srednja raspršenost)

- 0,7 i više (velika raspršenost)- 0,7 i više (velika raspršenost)

Page 46: Cjelokupno predavanje (Statistika)

Prethodni primjer:Prethodni primjer:

Q = Q3 – Q1Q = Q3 – Q1

Q = 37,16 – 26,84Q = 37,16 – 26,84

Q = 10,32Q = 10,32

Vq = Q3 – Q1 / Q3 + Q1Vq = Q3 – Q1 / Q3 + Q1

Vq = 10,32 / 64,00Vq = 10,32 / 64,00

Vq = 0,16Vq = 0,16

Page 47: Cjelokupno predavanje (Statistika)

b) IZVEDENE SREDNJE VRIJEDNOSTIb) IZVEDENE SREDNJE VRIJEDNOSTI

- nisu povezane s nekom određenom pozicijom u - nisu povezane s nekom određenom pozicijom u

numeričkom nizu, već na njih djeluju podjednakonumeričkom nizu, već na njih djeluju podjednako

sve vrijednostisve vrijednosti

- nazivaju se i mjerama središnje tendencije masovne- nazivaju se i mjerama središnje tendencije masovne

pojavepojave

- ovdje spadaju kronološka, harmonijska, geometrijska,- ovdje spadaju kronološka, harmonijska, geometrijska,

te najpoznatija te najpoznatija aritmetičkaaritmetička sredinasredina

Page 48: Cjelokupno predavanje (Statistika)

Aritmetička sredinaAritmetička sredina - simbol = X- simbol = X

- dobije se kada se individualne vrijednosti obilježja - dobije se kada se individualne vrijednosti obilježja

u nekom skupu podijele sa brojem elemenata u nekom skupu podijele sa brojem elemenata

skupaskupa

- uvijek se interpretira kao PROSJEK- uvijek se interpretira kao PROSJEK

- razlikujemo jednostavnu i ponderiranu aritmetičku- razlikujemo jednostavnu i ponderiranu aritmetičku

sredinusredinu

- suma odstupanja pojedinih članova niza od X - suma odstupanja pojedinih članova niza od X

uvijek je jednaka 0uvijek je jednaka 0

- kvaliteta aritmetičke sredine ovisi o karakteru- kvaliteta aritmetičke sredine ovisi o karakteru

numeričkog niza iz kojeg je računamo; uz X uvijeknumeričkog niza iz kojeg je računamo; uz X uvijek

je potrebno izračunati i odstupanja od njeje potrebno izračunati i odstupanja od nje

Page 49: Cjelokupno predavanje (Statistika)

Mjere raspršenosti ili disperzijeMjere raspršenosti ili disperzije- govore o karakteru numeričkog niza iz kojeg se- govore o karakteru numeričkog niza iz kojeg se izračunava aritmetička sredinaizračunava aritmetička sredina

Dijele se na: a) apsolutne Dijele se na: a) apsolutne b) relativneb) relativne

Ad. a) Varijanca (Ad. a) Varijanca (σ σ ²²)) - prosječno kvadratno odstupanje - prosječno kvadratno odstupanje Standardna devijacija (Standardna devijacija (σσ))- drugi korijen iz varijance- drugi korijen iz varijance (potpuno definiran razmak na skali rezultata)(potpuno definiran razmak na skali rezultata)Ad. b) Koeficijent varijacije (V)- odnos između standardne Ad. b) Koeficijent varijacije (V)- odnos između standardne devijacije i aritmetičke sredine koji se iskazuje u devijacije i aritmetičke sredine koji se iskazuje u postocima; niži postotak znači manju raspršenost, apostocima; niži postotak znači manju raspršenost, a rezultat može ići i preko 100% i tad govori orezultat može ići i preko 100% i tad govori o heterogenom nizuheterogenom nizu

Page 50: Cjelokupno predavanje (Statistika)

Primjeri izračunavanja aritmetičke sredine i mjeraPrimjeri izračunavanja aritmetičke sredine i mjeradisperzijedisperzije

Godine rad. staža br. zap. x f(x) f(x)Godine rad. staža br. zap. x f(x) f(x) ²² 0- 1 21 0- 1,5 0,75 15,75 11,81250- 1 21 0- 1,5 0,75 15,75 11,8125 2- 3 20 1,5- 3,5 2,5 50 1252- 3 20 1,5- 3,5 2,5 50 125 4- 5 19 3,5- 5,5 4,5 85,5 384,754- 5 19 3,5- 5,5 4,5 85,5 384,75 6- 10 22 5,5- 10,5 8,0 176 14086- 10 22 5,5- 10,5 8,0 176 1408 11- 15 23 10,5- 15,5 13,0 299 388711- 15 23 10,5- 15,5 13,0 299 3887 16- 20 25 15,5- 20,5 18,0 450 810016- 20 25 15,5- 20,5 18,0 450 8100 21- 25 19 20,5- 25,5 23,0 437 1005,121- 25 19 20,5- 25,5 23,0 437 1005,1 26- 30 15 25,5- 30,5 28,0 420 11760 26- 30 15 25,5- 30,5 28,0 420 11760 31- (45) 9 30,5- (45,5) 38,0 342 1299631- (45) 9 30,5- (45,5) 38,0 342 12996 173 2275,25 39677,6625173 2275,25 39677,6625

X= X= ΣΣ f(x) / f(x) / ΣΣ f X= 2275,25 / 173 X= 13,15 god. rad. staža f X= 2275,25 / 173 X= 13,15 god. rad. stažaσσ= korijen iz = korijen iz ΣΣ f(x) f(x)²² / / ΣΣ f - ( f - (ΣΣ f(x) / f(x) / ΣΣ f) f)²² σσ= 7,51 god. rad. staža= 7,51 god. rad. stažaV= V= σσ / X x 100% V= (7,51 / 13,15) x 100% V=57,11% / X x 100% V= (7,51 / 13,15) x 100% V=57,11%

Page 51: Cjelokupno predavanje (Statistika)

Normalna raspodjela (distribucija)Normalna raspodjela (distribucija)

Rezultati pojave pokazuju dvije dominantne tendencije:Rezultati pojave pokazuju dvije dominantne tendencije:

a) tendenciju GRUPIRANJA oko centralne vrijednostia) tendenciju GRUPIRANJA oko centralne vrijednosti

b) tendenciju RASPRŠENJAb) tendenciju RASPRŠENJA

Primjer sa Galtonovom “daskom s čavlima”Primjer sa Galtonovom “daskom s čavlima”

Primjer sa bacanjem dva novčićaPrimjer sa bacanjem dva novčića

GL - PI PI - PI 25%GL - PI PI - PI 25%

PI - PI GL - PI 50% PI - PI GL - PI 50%

GL - GL GL - GL 25%GL - GL GL - GL 25%

PI - GLPI - GL

Page 52: Cjelokupno predavanje (Statistika)

Rezultat se prepoznaje kroz normalnu distribuciju koja se grafički prikazuje Rezultat se prepoznaje kroz normalnu distribuciju koja se grafički prikazuje normalnom krivuljom (Gauss).normalnom krivuljom (Gauss).

Osobine te krivulje: - simetričnaOsobine te krivulje: - simetrična

- zvonolika- zvonolika

- u središtu se nalazi aritmetička sredina cijele pojave- u središtu se nalazi aritmetička sredina cijele pojave

- lijevo i desno od ar. sredine nalaze se pojasevi - lijevo i desno od ar. sredine nalaze se pojasevi

odstupanja (standardne devijacije)odstupanja (standardne devijacije)

Page 53: Cjelokupno predavanje (Statistika)

Normalna (Gaussova) krivuljaNormalna (Gaussova) krivulja

0

10

20

30

40

50

60

70

80

90

1st Qtr 2nd Qtr 3rd Qtr 4th Qtr

1st Qtr

2nd Qtr

3rd Qtr

4th Qtr

Page 54: Cjelokupno predavanje (Statistika)

±± 1 standardna devijacija 1 standardna devijacija 68,26% rezultata68,26% rezultata

±± 2 standardne devijacije 95,44% 2 standardne devijacije 95,44%

±± 3 standardne devijacije 99,73%3 standardne devijacije 99,73%

Page 55: Cjelokupno predavanje (Statistika)

Metoda uzorkaMetoda uzorka

- Razlozi korištenja uzorka u istraživačke svrhe- Razlozi korištenja uzorka u istraživačke svrhe

- Kriteriji pri uzorkovanju: - Kriteriji pri uzorkovanju:

- reprezentativan- reprezentativan

- određene veličine- određene veličine

- bolji od drugog- bolji od drugog

Na temelju izračunatih parametra iz uzorka (npr. aritmetičke Na temelju izračunatih parametra iz uzorka (npr. aritmetičke sredine ili proporcije), procjenjujemo istoimeni parametar za sredine ili proporcije), procjenjujemo istoimeni parametar za cijelu populaciju (pojavu); teorijska podloga proizlazi iz cijelu populaciju (pojavu); teorijska podloga proizlazi iz zakonitosti normalne distribucije. zakonitosti normalne distribucije.

Page 56: Cjelokupno predavanje (Statistika)

Vrste populacija: Vrste populacija: a) konačnaa) konačnab) beskonačnab) beskonačna

Vrste uzoraka (način odabira jedinica u uzorak Vrste uzoraka (način odabira jedinica u uzorak određuje njegov naziv):određuje njegov naziv):

- slučajni (sa ponavljanjem ili bez ponavljanja)- slučajni (sa ponavljanjem ili bez ponavljanja)- namjerni: - sistematski- namjerni: - sistematski - stratificirani (proporcionalni)- stratificirani (proporcionalni) - klaster (slučajni i stratificirani)- klaster (slučajni i stratificirani) - kvota- kvota - prigodni- prigodni

Page 57: Cjelokupno predavanje (Statistika)

Uzorci mogu biti:Uzorci mogu biti:- jednoetapni- jednoetapni

- višeetapni- višeetapni

Pogreške kod uzorkovanja:Pogreške kod uzorkovanja:a) izvan uzorka (kriva metoda, obrada i sl.)a) izvan uzorka (kriva metoda, obrada i sl.)

b) pogreška uzorkab) pogreška uzorka

Razlika u simbolima za parametre iz uzorka i Razlika u simbolima za parametre iz uzorka i populacijepopulacije

Page 58: Cjelokupno predavanje (Statistika)

Ocjena aritmetičke sredine populacije Ocjena aritmetičke sredine populacije na bazi uzorkana bazi uzorka

PRIMJER: Iz populacije zaposlenih žena izdvojen je uzorak odPRIMJER: Iz populacije zaposlenih žena izdvojen je uzorak od

10%; zanima nas ocjena aritmetičke sredine cijele10%; zanima nas ocjena aritmetičke sredine cijele

populacije na bazi tog uzorka, uz pouzdanost od populacije na bazi tog uzorka, uz pouzdanost od

95%!95%! God. živ. Br. žena x f x f xGod. živ. Br. žena x f x f x ²²

(18)- 20 8 (18)- 21 19,5 156 3042(18)- 20 8 (18)- 21 19,5 156 3042

21- 22 10 21- 22 10

23- 24 1223- 24 12

25- 29 1325- 29 13

30- 34 1530- 34 15

35- 39 2035- 39 20

40- 44 1540- 44 15

45- 49 1045- 49 10

50- (64) 750- (64) 7

110 3774 141394110 3774 141394

Page 59: Cjelokupno predavanje (Statistika)

X = X = ΣΣ fx / fx / ΣΣ f X = 3774 / 110 X = 34,31 god. f X = 3774 / 110 X = 34,31 god.

Prosječna starost žena Prosječna starost žena u uzorkuu uzorku iznosila je 34,31 god. iznosila je 34,31 god.

s = korijen iz s = korijen iz ΣΣ f(x) f(x)²² / / ΣΣ f - ( f - (ΣΣ f(x) / f(x) / ΣΣ f) f)²² s = 10,40 god.s = 10,40 god.

Prosječno kvadratno odstupanje od aritmetičke sredine Prosječno kvadratno odstupanje od aritmetičke sredine u uzorkuu uzorku iznosilo je 10,40 god. iznosilo je 10,40 god.

s s x x = (s / √ n) = (s / √ n) ·· (√ N – n / √ N – 1) (√ N – n / √ N – 1)s s x x = (10,40 / √ 110) = (10,40 / √ 110) ·· (√ 1100 – 110 / √ 1099) (√ 1100 – 110 / √ 1099)s s x x = 0,8933356= 0,8933356

X = X = XX ±± t t ·· s s x x X = X = 34,3134,31 ±± 1,96 1,96 ·· 0,8933356 0,8933356

Page 60: Cjelokupno predavanje (Statistika)

X = X = 34,31 34,31 ±± 1,7509 1,7509

32,559 32,559 << X X << 36,061 36,061

Aritmetička sredina cijele populacije, dakle svih 1100 Aritmetička sredina cijele populacije, dakle svih 1100

zaposlenih žena kreće se u intervalu između 32,6 i 36,1 zaposlenih žena kreće se u intervalu između 32,6 i 36,1 godine starosti; to tvrdimo sa 95% pouzdanošću.godine starosti; to tvrdimo sa 95% pouzdanošću.

X = X = 34,31 34,31 ±± 2,58 2,58 ·· 0,8933356 0,8933356

X = X = 34,31 34,31 ±± 2,3048 2,3048

32,005 32,005 << X X << 36,615 36,615

Uz pouzdanost od 99% aritmetička sredina cijele populacije Uz pouzdanost od 99% aritmetička sredina cijele populacije kretat će se od 32,005 do 36,615 godina.kretat će se od 32,005 do 36,615 godina.

Page 61: Cjelokupno predavanje (Statistika)

Procjena proporcije populacije na bazi Procjena proporcije populacije na bazi uzorkauzorka

PRIMJER: U uzorku od 120 studenata na ispitu, njih 55 bili su studenti za PRIMJER: U uzorku od 120 studenata na ispitu, njih 55 bili su studenti za osobne potrebe. Na bazi tog uzorka zanima nas procjena broja takvih osobne potrebe. Na bazi tog uzorka zanima nas procjena broja takvih studenata u cjelokupnoj studentskoj populaciji koji pristupaju zimskim studenata u cjelokupnoj studentskoj populaciji koji pristupaju zimskim rokovima; pouzdanost iznosi 99%.rokovima; pouzdanost iznosi 99%.

n = 120n = 120m = 55m = 55pouzd. = 99%pouzd. = 99%

p = 55 / 120 p = 0,458p = 55 / 120 p = 0,458 q = 0,542 q = 0,542

PP = p = p ±± t t ·· s s p p s s p p = = √ 0,458 √ 0,458 ·· 0,542 / √ 120 0,542 / √ 120

s s p p = 0,04548= 0,04548

P P = 0,458 = 0,458 ±± 2,58 2,58 ·· 0,04548 0,3407 0,04548 0,3407 << P P << 0,57530,5753

34,07% 34,07% << P P << 57,53% 57,53%

Page 62: Cjelokupno predavanje (Statistika)

Raspon između donje i gornje granice intervala procjene Raspon između donje i gornje granice intervala procjene naziva se apsolutni interval ( 2 Inaziva se apsolutni interval ( 2 Iap ap ).).

2 I2 Iap ap = 0,234 odnosno, 23,4%= 0,234 odnosno, 23,4%

Ukoliko je pouzdanost 95% procjena proporcije populacije: Ukoliko je pouzdanost 95% procjena proporcije populacije:

P = P = 0,458 0,458 ±± 1,96 1,96 ·· 0,04548 0,04548

36,9% 36,9% << P P << 54,5% 54,5%

2 I2 Iap ap = 0,176 , odnosno, 17,6%= 0,176 , odnosno, 17,6%

Page 63: Cjelokupno predavanje (Statistika)

Na temelju 85 ispitanika iz uzorka pronađeno je 8% studenata koji su ispite Na temelju 85 ispitanika iz uzorka pronađeno je 8% studenata koji su ispite u prosijeku spremali dulje od 1,8 mjeseci. Uz 95% pouzdanost zanima u prosijeku spremali dulje od 1,8 mjeseci. Uz 95% pouzdanost zanima nas procjena broja takvih studenata za cijelu populaciju koja iznosi nas procjena broja takvih studenata za cijelu populaciju koja iznosi 1214 studenata.1214 studenata.

N = 1214N = 1214n = 85n = 85p = 0,08p = 0,08q = 0,92q = 0,92

P = P = p p ±± t t ·· s s p p

s s p p = (√ 0,08 = (√ 0,08 ·· 0,92 / √ 85) 0,92 / √ 85) ·· (√1214 – 85 / 1213) (√1214 – 85 / 1213)s s p p = 0,028387= 0,028387

P =P = 0,08 0,08 ±± 1,96 1,96 ·· 0,02839 0,02839

0,0244 0,0244 << P P << 0,1356 0,1356

2,44% 2,44% << P P << 13,6% Procjena proporcije populacije kreće se 13,6% Procjena proporcije populacije kreće se

između 2,44% i 13,6%, uz 95% pouzdanost.između 2,44% i 13,6%, uz 95% pouzdanost.

Page 64: Cjelokupno predavanje (Statistika)

Veličina uzorkaVeličina uzorka1.) Ukoliko nismo zadovoljni preciznošću procjene određenog parametra, 1.) Ukoliko nismo zadovoljni preciznošću procjene određenog parametra,

postupamo na sljedeći način:postupamo na sljedeći način:

- mijenjamo koeficijent pouzdanosti (smanjujemo pouzdanost procjene)- mijenjamo koeficijent pouzdanosti (smanjujemo pouzdanost procjene)

- izračunavamo novu veličinu uzorka koja u pravilu mora biti veća od - izračunavamo novu veličinu uzorka koja u pravilu mora biti veća od

dosadašnjedosadašnje

2.) Ukoliko još nismo formirali uzorak, pa tek krećemo u određivanje 2.) Ukoliko još nismo formirali uzorak, pa tek krećemo u određivanje njegove veličinenjegove veličine

Page 65: Cjelokupno predavanje (Statistika)

Kod izračunavanja potrebne veličine uzorka Kod izračunavanja potrebne veličine uzorka

- susrećemo se sa apsolutnim intervalom (I- susrećemo se sa apsolutnim intervalom (Iapap), te ), te relativnim intervalom (Irelativnim intervalom (Irr).).

- apsolutni interval= 2 I- apsolutni interval= 2 Iapap; on je razlika između gornje; on je razlika između gornje

i donje granice procjene parametrai donje granice procjene parametra

- relativni interval= I- relativni interval= Irr; on je omjer između t; on je omjer između t··sp/psp/p

(npr. I(npr. Irr od 7% znači: od 7% znači:

(1 – 0,07) (1 – 0,07) ·· p p << P P << (1 + 0,07) (1 + 0,07) ·· p p

- susrećemo se sa slučajevima konačne i - susrećemo se sa slučajevima konačne i beskonačne populacijebeskonačne populacije

Page 66: Cjelokupno predavanje (Statistika)

Izrazi za izračunavanje veličine uzorkaIzrazi za izračunavanje veličine uzorka

1.) Uz apsolutni interval i nepoznato N1.) Uz apsolutni interval i nepoznato N

n = tn = t²²PQ / PQ / IIapap²²

2.) Uz 2.) Uz apsolutni interval i poznato Napsolutni interval i poznato N

n = tn = t²²PQN / PQN / [[tt²²PQ + (N – 1) PQ + (N – 1) IIapap²²]]

3.) Uz relativni interval i nepoznato N3.) Uz relativni interval i nepoznato N

n = n = tt²²VV²² / / IIr r ²² V V²² = Q / P = Q / P

4.) Uz relativni interval i poznato N4.) Uz relativni interval i poznato N

n = n = tt²²VV²²N / N / [[tt²²VV²² + (N – 1) + (N – 1) IIr r ²²

Page 67: Cjelokupno predavanje (Statistika)

Primjer:Primjer: anketiranjem maturanata, njih 86, saznali smo da se anketiranjem maturanata, njih 86, saznali smo da se još uvijek ne mogu odlučiti za vrstu budućeg studija. Njih 28 još uvijek ne mogu odlučiti za vrstu budućeg studija. Njih 28 je izjavilo da će se upisati na bilo koji studij gdje budu je izjavilo da će se upisati na bilo koji studij gdje budu primljeni. Sa 99% pouzdanošću želimo procjenu broja primljeni. Sa 99% pouzdanošću želimo procjenu broja studenata koji ovako razmišljaju!studenata koji ovako razmišljaju!

n = 86n = 86

m = 28 p = m / n p = 28 / 86 p = 0,326m = 28 p = m / n p = 28 / 86 p = 0,326

q = 0,674q = 0,674

sp = sp = √pq / √n sp = 0,05053√pq / √n sp = 0,05053

P = P = p p ±± t t ·· s p s p 0,19193 0,19193 << P P << 0,4559 0,4559

22 Iap = 0,26397Iap = 0,26397

želimo novi želimo novi 22 Iap 0,131985Iap 0,131985

koliko nam sada treba jedinica u uzorak?koliko nam sada treba jedinica u uzorak?

Page 68: Cjelokupno predavanje (Statistika)

n = tn = t²²PQ / PQ / IIapap²² n =n = 6,6564 6,6564 ·· 0,326 0,326 ·· 0,674 / 0,06599 0,674 / 0,06599²²

n = 335n = 335

Uz traženu pouzdanost i preciznost i upola veću preciznost Uz traženu pouzdanost i preciznost i upola veću preciznost nego ranije, trebamo 335 jedinica u uzorak.nego ranije, trebamo 335 jedinica u uzorak.

Page 69: Cjelokupno predavanje (Statistika)

Testiranje hipotezaTestiranje hipoteza

Svako istraživanje pretpostavlja formiranje određene Svako istraživanje pretpostavlja formiranje određene tvrdnje, odnosno pretpostavke (hipoteze) koja se tvrdnje, odnosno pretpostavke (hipoteze) koja se tim istraživanjem želi potvrditi ili odbaciti polaznu, tim istraživanjem želi potvrditi ili odbaciti polaznu, te formulirati novu.te formulirati novu.

Kod testiranja susrećemo se sa dva slučaja testiranja Kod testiranja susrećemo se sa dva slučaja testiranja i sa dvije hipoteze: i sa dvije hipoteze:

1.) prvi slučaj govori o testiranju značajnosti razlika 1.) prvi slučaj govori o testiranju značajnosti razlika između istoimenih parametara u uzorku i populacijiizmeđu istoimenih parametara u uzorku i populaciji

2.) drugi slučaj govori o testiranju značajnosti 2.) drugi slučaj govori o testiranju značajnosti razlika između istoimenih parametara dvaju razlika između istoimenih parametara dvaju uzoraka uzoraka

Page 70: Cjelokupno predavanje (Statistika)

Ovdje se susrećemo sa dvije hipoteze: HOvdje se susrećemo sa dvije hipoteze: H0 0 (nulta (nulta hipoteza) te Hhipoteza) te Halt alt (alternativna hipoteza).(alternativna hipoteza).

HH0 0 govori o nepostojanju statistički značajnih razlika govori o nepostojanju statistički značajnih razlika između testiranih parametara; ostaje se pri između testiranih parametara; ostaje se pri početnoj tvrdnji (hipotezi)početnoj tvrdnji (hipotezi)

HHalt alt govori o statistički značajnim razlikama između govori o statistički značajnim razlikama između testiranih parametara, što vodi odbacivanju testiranih parametara, što vodi odbacivanju početne hipoteze i formuliranju nove tvrdnje.početne hipoteze i formuliranju nove tvrdnje.

Page 71: Cjelokupno predavanje (Statistika)

Kada odbacujemo postojeću tvrdnju i krećemo u Kada odbacujemo postojeću tvrdnju i krećemo u postavljenje nove?postavljenje nove?

Kad rezultat testiranja istoimenih parametara pada u Kad rezultat testiranja istoimenih parametara pada u pojas predviđen razinom testiranja, ostajemo kod pojas predviđen razinom testiranja, ostajemo kod

HH0 0 (dakle ne radi se o statistički značajnim (dakle ne radi se o statistički značajnim razlikama; uz t = 95% granica je razlikama; uz t = 95% granica je ±±1,96; uz t = 99% 1,96; uz t = 99% granica je granica je ±±2,582,58).).

Kad rezultat testiranja istoimenih parametara pada Kad rezultat testiranja istoimenih parametara pada izvan pojasa predviđenog razinom testiranja, izvan pojasa predviđenog razinom testiranja, odbacuje se polazna hipoteza i prihvaća Hodbacuje se polazna hipoteza i prihvaća Halt alt (dakle (dakle radi se o statistički značajnim razlikama).radi se o statistički značajnim razlikama).

Page 72: Cjelokupno predavanje (Statistika)

Testiranje može biti dvosmjerno i jednosmjerno Testiranje može biti dvosmjerno i jednosmjerno

- kod dvosmjernog promatramo da li rezultat- kod dvosmjernog promatramo da li rezultat

pada u obje strane intervala predviđenogpada u obje strane intervala predviđenog

razinom testiranja (zanima nas je li razlikarazinom testiranja (zanima nas je li razlika

statistički značajna ili nije)statistički značajna ili nije)

- kod jednosmjernog testiranja zanima nas - kod jednosmjernog testiranja zanima nas

samo jedna strana intervala predviđenog samo jedna strana intervala predviđenog

razinom testiranja; je li riječ o statistički većemrazinom testiranja; je li riječ o statistički većem

ili manjem parametruili manjem parametru

Ovdje su granice intervala drugačije nego kod Ovdje su granice intervala drugačije nego kod

dvosmjernog testiranja: uz t = 95% granica jedvosmjernog testiranja: uz t = 95% granica je

1,56 , uz t = 99% granica je 2,331,56 , uz t = 99% granica je 2,33

Page 73: Cjelokupno predavanje (Statistika)

Izrazi za testiranje hipotezaIzrazi za testiranje hipoteza

1. slučaj: 1. slučaj:

T = x – X / sT = x – X / sxx T = p – P / s T = p – P / spp

2. slučaj: 2. slučaj: T = xT = x1 1 – x– x2 2 / s/ sx1,2 x1,2 T = pT = p1 1 – p– p2 2 / s / sp1,2p1,2

ssx1,2 x1,2 = = √s√s11²² / √n / √n1 1 + √s+ √s2 2 ²² / √n / √n22

ssp1,2 p1,2 = = √p√p11qq1 1 / √n/ √n11 + √p + √p22qq2 2 / √n/ √n22

Page 74: Cjelokupno predavanje (Statistika)

KorelacijaKorelacija- između dvije pojave može postojati ZAVISNOST, - između dvije pojave može postojati ZAVISNOST,

POVEZANOST, ASOCIJACIJA POVEZANOST, ASOCIJACIJA (visina- težina; ek. status- zdr. stanje; količina kiše- (visina- težina; ek. status- zdr. stanje; količina kiše- vegetacija)vegetacija)- stupanj povezanosti (Pearson) je nazvao - stupanj povezanosti (Pearson) je nazvao

KOEFICIJENTOM KORELACIJEKOEFICIJENTOM KORELACIJE (Galton: visina očeva i sinova; intelig. očeva i (Galton: visina očeva i sinova; intelig. očeva i

sinova)sinova)- intenzitet povezanosti- intenzitet povezanosti- smjer povezanosti- smjer povezanosti- a) linearna povezanost b) zakrivljena - a) linearna povezanost b) zakrivljena

Page 75: Cjelokupno predavanje (Statistika)

Korelacija rangaKorelacija ranga

Jednostavna metoda ispitivanja povezanosti između Jednostavna metoda ispitivanja povezanosti između dvije varijable povezane zajedničkim obilježjem u dvije varijable povezane zajedničkim obilježjem u predkoloni.predkoloni.

Neparametrijska metoda kod koje se vrijednost Neparametrijska metoda kod koje se vrijednost zamjenjuju rangovima:zamjenjuju rangovima:

- najmanja vrijednost dobiva rang 1, prva veća- najmanja vrijednost dobiva rang 1, prva veća

rang 2, itd.rang 2, itd.

- za svaku pojavu formiraju se rangovi, - za svaku pojavu formiraju se rangovi,

odnosno, dolazimo do parova vrijednostiodnosno, dolazimo do parova vrijednosti

Metodom izračunavanja dolazimo do koeficijenta Metodom izračunavanja dolazimo do koeficijenta korelacije ranga (korelacije ranga (ρρ = ro). = ro).

Page 76: Cjelokupno predavanje (Statistika)

Veličina koeficijenta upućuje na količinu povezanosti Veličina koeficijenta upućuje na količinu povezanosti (1- max. povezanost, 0- min. povezanost)(1- max. povezanost, 0- min. povezanost)

Predznak koeficijenta određuje smjer kretanja veze Predznak koeficijenta određuje smjer kretanja veze

(- govori o raznosmjernom kretanju veze, što znači (- govori o raznosmjernom kretanju veze, što znači da kad jedna pojava raste, druga pada i obrnuto; da kad jedna pojava raste, druga pada i obrnuto;

+ govori o istosmjernom kretanju pojave, što znači + govori o istosmjernom kretanju pojave, što znači da kad jedna pojava raste, raste i druga i obrnuto)da kad jedna pojava raste, raste i druga i obrnuto)

Page 77: Cjelokupno predavanje (Statistika)

Primjer:Primjer: postoji li povezanost između dužine postoji li povezanost između dužine priprema i ostvarenog rezultata na testu?priprema i ostvarenog rezultata na testu?

ISPITANIK DUŽ. PRIP. BOD. RISPITANIK DUŽ. PRIP. BOD. Rxx R Ryy R Rxx – R – Ry y D D²²

1 8 9 8 7 1 11 8 9 8 7 1 1

2 7 11 7 8 -1 12 7 11 7 8 -1 1

3 6 8 6 6 0 03 6 8 6 6 0 0

4 5 6 4,5 4,5 0 04 5 6 4,5 4,5 0 0

5 5 4 4,5 3 1,5 2,255 5 4 4,5 3 1,5 2,25

6 4 6 3 4,5 -1,5 2,256 4 6 3 4,5 -1,5 2,25

7 3 2 2 2 0 07 3 2 2 2 0 0

8 2 1 1 1 0 08 2 1 1 1 0 0

Σ Σ DD²² = 6,50 = 6,50

ρρ = 1 - 6 = 1 - 6 Σ Σ DD²² / N (N/ N (N²² - 1) - 1)

ρρ = 1 - 6 = 1 - 6 ·· 6,50 / 8 (64 - 1) 6,50 / 8 (64 - 1)

ρρ = 0,9226 = 0,9226

Page 78: Cjelokupno predavanje (Statistika)

Testiranje značajnosti rang korelacijeTestiranje značajnosti rang korelacije

Kako je ona samo aproksimacija koeficijenta Kako je ona samo aproksimacija koeficijenta povezanosti između dvije varijable, ako je N povezanosti između dvije varijable, ako je N << 10, 10, vrijedi to izračunati.vrijedi to izračunati.

t = t = ρ√ρ√N - 2 / √1- N - 2 / √1- ρρ²²

t = 0,9226 t = 0,9226 √√8 - 2 / √1 - 0,92268 - 2 / √1 - 0,9226²²

t = 5,86t = 5,86

df = N - 2 df = N - 2

t iz tablica = 2,26 uz 5% pouzdanostit iz tablica = 2,26 uz 5% pouzdanosti

Rezultat je veći od graničnog, što govori o Rezultat je veći od graničnog, što govori o značajnosti rang korelacije.značajnosti rang korelacije.

Page 79: Cjelokupno predavanje (Statistika)

Hi- kvadrat testHi- kvadrat test

Neki računi korelacije mogu se primijeniti samo na Neki računi korelacije mogu se primijeniti samo na kvantitativne brojčane podatke koji su normalno kvantitativne brojčane podatke koji su normalno raspoređeni ili barem simetrično; ako su podaci raspoređeni ili barem simetrično; ako su podaci kvalitativni ili im distribucija značajno odstupa od kvalitativni ili im distribucija značajno odstupa od normalne, većinom se upotrebljava hi- kvadrat test.normalne, većinom se upotrebljava hi- kvadrat test.

- samo se računa s frekvencijama- samo se računa s frekvencijama

(nikako mjerne jedinice)(nikako mjerne jedinice)

- dok račun korelacije pokazuje stupanj povezanosti - dok račun korelacije pokazuje stupanj povezanosti između dvije varijable hi- kvadrat test pokazuje tek između dvije varijable hi- kvadrat test pokazuje tek vjerojatnost povezanostivjerojatnost povezanosti

Page 80: Cjelokupno predavanje (Statistika)

Upotreba: Upotreba: - kad imamo frekvenciju jednog uzorka pa želimo - kad imamo frekvenciju jednog uzorka pa želimo

ustanoviti odstupaju li one od frekvencija koje ustanoviti odstupaju li one od frekvencija koje očekujemo uz neku hipotezu (dakle očekujemo uz neku hipotezu (dakle pretpostavljenih, očekivanih frekvencija)pretpostavljenih, očekivanih frekvencija)

- kad imamo dvije ukrštene pojave, pa nas zanima - kad imamo dvije ukrštene pojave, pa nas zanima postoji li slučajna ili značajna razlika između postoji li slučajna ili značajna razlika između opaženih i očekivanih frekvencijaopaženih i očekivanih frekvencija

- postupak izračunavanja dovodi do rezultata za hi- - postupak izračunavanja dovodi do rezultata za hi- kvadrat; njega je moguće interpretirati tek uz pomoć kvadrat; njega je moguće interpretirati tek uz pomoć stupnjeva slobode (df) i razine pouzdanostistupnjeva slobode (df) i razine pouzdanosti

df = broj modaliteta nekog obilježja umanjen df = broj modaliteta nekog obilježja umanjen za 1 i pomnožen sa brojem modaliteta za 1 i pomnožen sa brojem modaliteta drugog obilježja također umanjenog za 1 drugog obilježja također umanjenog za 1

Page 81: Cjelokupno predavanje (Statistika)

Iz Tablice graničnih vrijednosti hi- kvadrata Iz Tablice graničnih vrijednosti hi- kvadrata

očitavamo broj koji se nalazi u sjecištu df iočitavamo broj koji se nalazi u sjecištu df i

koef. pouzdanosti: to je granični hi- kvadratkoef. pouzdanosti: to je granični hi- kvadrat

za naš slučaj.za naš slučaj.

Interpretacija povezanosti ovisi o tome je li naš Interpretacija povezanosti ovisi o tome je li naš izračunati hi- kvadrat veći ili manji od graničnog hi- izračunati hi- kvadrat veći ili manji od graničnog hi- kvadrata: ukoliko je manji znači da ne postoje kvadrata: ukoliko je manji znači da ne postoje statistički značajne razlike između opaženih i statistički značajne razlike između opaženih i očekivanih frekvencija, te da nema povezanosti očekivanih frekvencija, te da nema povezanosti među našim pojavama; ukoliko je veći, znači da među našim pojavama; ukoliko je veći, znači da postoje značajne razlike između opaženih i postoje značajne razlike između opaženih i očekivanih frekvencija, te da postoji povezanost očekivanih frekvencija, te da postoji povezanost među našim pojavama.među našim pojavama.

Page 82: Cjelokupno predavanje (Statistika)

Primjeri: Primjeri: slučaj 1.)slučaj 1.)

Skupina zaposlenih (njih 75) upitana je smatraju li medije Skupina zaposlenih (njih 75) upitana je smatraju li medije ključnim izvorom informiranosti o političkim zbivanjima! 49 ključnim izvorom informiranosti o političkim zbivanjima! 49 odgovorilo je potvrdno, 14 negativno, 12 nije znalo odgovorilo je potvrdno, 14 negativno, 12 nije znalo odgovoriti. Odstupaju li ti odgovori od onih koje bi dobili odgovoriti. Odstupaju li ti odgovori od onih koje bi dobili nasumce, odnosno slučajnom (P = 1%)?nasumce, odnosno slučajnom (P = 1%)?

DA NE ZNAM NE UKUPNODA NE ZNAM NE UKUPNO

ffo o 49 12 14 75 49 12 14 75

ffcc 25 25 25 75 25 25 25 75

P = 1% (0,01)P = 1% (0,01)

ffo o ffc c ffo o -- ffc c (f(fo o –– ffcc))²² (f(fo o –– ffcc))²² / / ffcc

49 25 24 576 23,0449 25 24 576 23,04

12 25 -13 169 6,7612 25 -13 169 6,76

14 25 -11 121 4,8414 25 -11 121 4,84

ΣΣ = 34,64 = 34,64

Page 83: Cjelokupno predavanje (Statistika)

df = 1 P = 0,01df = 1 P = 0,01

Hi- kvadrat granični (iz tablice) = 6,63Hi- kvadrat granični (iz tablice) = 6,63

Naš izračunati hi- kvadrat je veći od graničnog, što Naš izračunati hi- kvadrat je veći od graničnog, što govori o značajnom odstupanju dobivenih govori o značajnom odstupanju dobivenih odgovora u odnosu na očekivane. odgovora u odnosu na očekivane.

Page 84: Cjelokupno predavanje (Statistika)

Slučaj 2.) Slučaj 2.) Postoji li povezanost između veličine mjesta življenja i broja Postoji li povezanost između veličine mjesta življenja i broja

sklopljenih brakova? P = 0,01sklopljenih brakova? P = 0,01

VEL. MJESTA BR. SKLOP. BRAKOVA UKUPNOVEL. MJESTA BR. SKLOP. BRAKOVA UKUPNO Jedan Više od jedanJedan Više od jedan Grad 94 136 230Grad 94 136 230 Selo 48 12 60Selo 48 12 60 Ukupno 142 148 290Ukupno 142 148 290

ffo o ffc c ffo o -- ffc c (f(fo o –– ffcc))²² (f(fo o –– ffcc))²² / / ffcc

94 113 -19 361 3,19594 113 -19 361 3,195 136 117 19 361 3,085136 117 19 361 3,085 48 29 19 361 12,44848 29 19 361 12,448 12 31 -19 361 11,64512 31 -19 361 11,645 hi- kv. = 30,373hi- kv. = 30,373 df = 1df = 1 hi- kv. granični = 6,63hi- kv. granični = 6,63

Page 85: Cjelokupno predavanje (Statistika)

Interpretacija:Interpretacija: izračunati hi- kvadrat veći je od izračunati hi- kvadrat veći je od graničnog što upućuje na značajnu razliku opaženih graničnog što upućuje na značajnu razliku opaženih i očekivanih frekvencija; budući očekivane tvrde o i očekivanih frekvencija; budući očekivane tvrde o nepostojanju razlika, zaključujemo da nepostojanju razlika, zaključujemo da postoji postoji povezanostpovezanost među našim pojavama. među našim pojavama.

Kakva je ta povezanost?Kakva je ta povezanost?

Page 86: Cjelokupno predavanje (Statistika)

Koeficijenti korelacije / kontingencijeKoeficijenti korelacije / kontingencijeJouleov QJouleov Q

Q = ad – bc / ad + bcQ = ad – bc / ad + bc- informativni pokazatelj- informativni pokazatelj- prednost: pokazuje smjer kretanja pojave (- - prednost: pokazuje smjer kretanja pojave (-

raznosmjerno kretanje, + istosmjerno)raznosmjerno kretanje, + istosmjerno)- grubi pokazatelj povezanosti (gotovo 60% pokazuje - grubi pokazatelj povezanosti (gotovo 60% pokazuje

jaču vezu); bliži 1- jača veza, bliži 0- slabija vezajaču vezu); bliži 1- jača veza, bliži 0- slabija veza- primjenjiv samo na tabele 2 - primjenjiv samo na tabele 2 xx 2 2 Q = (1128 – 6528) / (1128 + 6528)Q = (1128 – 6528) / (1128 + 6528) Q = - 0,705Q = - 0,705

Page 87: Cjelokupno predavanje (Statistika)

Jouleov FiJouleov Fi

1. slučaj: Fi = ad – bc / 1. slučaj: Fi = ad – bc / √(a + b)(a + c)(b + d)(c + d)√(a + b)(a + c)(b + d)(c + d)

2. slučaj: Fi = √hi- kvadrat / N2. slučaj: Fi = √hi- kvadrat / N

- mnogo precizniji pokazatelj od prethodnog - mnogo precizniji pokazatelj od prethodnog

- prvi slučaj moguće je koristiti i bez prethodnog - prvi slučaj moguće je koristiti i bez prethodnog izračunavanja hi- kvadrata; pokazuje smjer izračunavanja hi- kvadrata; pokazuje smjer kretanjakretanja

- drugi slučaj zahtjeva izračunavanje hi- kvadrata, - drugi slučaj zahtjeva izračunavanje hi- kvadrata, precizan je pokazatelj, ali ne daje informacije o precizan je pokazatelj, ali ne daje informacije o smjeru povezanostismjeru povezanosti

- primjenjiv je na sve vrste tabela- primjenjiv je na sve vrste tabela

Fi = √hi- kvadrat / N Fi = √30,373 / 290Fi = √hi- kvadrat / N Fi = √30,373 / 290

Fi = 0,323Fi = 0,323

Page 88: Cjelokupno predavanje (Statistika)

Koeficijent kontingencije CKoeficijent kontingencije CC = C = √hi- kvadrat / √hi- kvadrat + N√hi- kvadrat / √hi- kvadrat + N

- izrazito kvalitetan pokazatelj intenziteta veze- izrazito kvalitetan pokazatelj intenziteta veze

- kreće se od 0 do 1, što je bliži 0, veza je slabija, što je bliži 1, - kreće se od 0 do 1, što je bliži 0, veza je slabija, što je bliži 1, veza je jača (do 0,20= neznatna veza, od 0,20 do 0,40= veza je jača (do 0,20= neznatna veza, od 0,20 do 0,40= lagana povezanost, od 0,40 do 0,70= značajna povezanost, lagana povezanost, od 0,40 do 0,70= značajna povezanost, od 0,70 do 1= vrlo visoka povezanost) od 0,70 do 1= vrlo visoka povezanost)

- izračunava se nakon dobivenog hi- kvadrata i primjenjiv je na - izračunava se nakon dobivenog hi- kvadrata i primjenjiv je na sve vrste tabelasve vrste tabela

- problem određivanja smjera povezanosti- problem određivanja smjera povezanosti

- kod kvadratičnih tabela moguće je izračunati maksimalnu - kod kvadratičnih tabela moguće je izračunati maksimalnu moguću povezanost među pojavama (to pomaže pri moguću povezanost među pojavama (to pomaže pri interpretaciji)interpretaciji)

C max = √k – 1 / √k k je broj redova tabeleC max = √k – 1 / √k k je broj redova tabele

Page 89: Cjelokupno predavanje (Statistika)

Primjer: Primjer: C = C = √30,373 / √30,373 + 290 C = 0,308√30,373 / √30,373 + 290 C = 0,308

C max = √2 – 1 / √2 C max = 0,71C max = √2 – 1 / √2 C max = 0,71

Cramerov Fi = √hi- kvadrat / √N (s – 1)Cramerov Fi = √hi- kvadrat / √N (s – 1)

Cr. Fi = 0,33 s = manji broj stupaca,Cr. Fi = 0,33 s = manji broj stupaca,

redovaredova

Page 90: Cjelokupno predavanje (Statistika)

Parcijalna korelacijaParcijalna korelacija

Korelaciju između dviju varijabli kod koje isključujemo Korelaciju između dviju varijabli kod koje isključujemo utjecaj jednog ili više faktora koji nam smetaju, utjecaj jednog ili više faktora koji nam smetaju, zovemo parcijalnom korelacijom.zovemo parcijalnom korelacijom.

Npr. : - duljina stopala i sposobnost pisanja Npr. : - duljina stopala i sposobnost pisanja (isključeno starenje)(isključeno starenje)

- broj izostanaka i visina plaće (isključena - broj izostanaka i visina plaće (isključena dužina radnog staža) dužina radnog staža)

Page 91: Cjelokupno predavanje (Statistika)

Analiza vremenskih nizova (serija)Analiza vremenskih nizova (serija)Vremenski nizovi dijele se na:Vremenski nizovi dijele se na: a) trenutačnea) trenutačne b) intervalneb) intervalneStatističke metode primjenjive na takve nizove:Statističke metode primjenjive na takve nizove: a) metode relativnih brojeva (indeksna a) metode relativnih brojeva (indeksna metoda)metoda) b) srednje vrijednosti (aritmetička sredina,b) srednje vrijednosti (aritmetička sredina, kronološka, geometrijska) kronološka, geometrijska) G = G = √y√y1 1 / y/ y00 - prosječni tempo rasta / pada neke - prosječni tempo rasta / pada neke pojavepojave - prosječna stopa rasta / pada (prosječni tempo- prosječna stopa rasta / pada (prosječni tempo promjene)promjene) - dobar pokazatelj ukoliko nisu prevelika - dobar pokazatelj ukoliko nisu prevelika odstupanja između yodstupanja između y0 0 i yi y11