91
1 Predavanja iz Statistike Autor: dr.sc. Zdenka Zenzerović

Predavanja iz Statistike

Embed Size (px)

DESCRIPTION

Predavanja iz Statistike, dr. sc. Zdenka Zenzerović

Citation preview

Page 1: Predavanja iz Statistike

1

Predavanja iz Statistike

Autor: dr.sc. Zdenka Zenzerović

Page 2: Predavanja iz Statistike

2

1. UVOD

Pojam masovne pojave – statistička masa – definicija statistike – statistička jedinica –

statističko obilježje – vrste statističkog obilježja – faze statističkog rada – pojam

statističke tabele i tablice – formiranje statističkog niza – vrste statističkih nizova.

Masovna pojava je svaka pojava koja sadrţi velik broj jedinica; primjerice: studenti

Sveuĉilišta u Rijeci, dnevni broj putnika prevezenih gradskim autobusima, iznos ostvarenog

bruto domaćeg proizvoda u promatranoj vremenskoj jedinici, promet tereta u hrvatskim

lukama, itd.

Statistička masa je ona masovna pojava koja je odabrana za predmet statistiĉkog

istraţivanja i koja se ispituje odgovarajućim statistiĉkim metodama s ciljem odreĊivanja

znaĉajki promatrane pojave.

Statistika je znanstvena disciplina koja prouĉava masovne pojave primjenjujući na

njih odgovarajuće statistiĉke metode i koristeći pritom brojĉani i grafiĉki naĉin izraţavanja.

Statistiĉka masa je skup jedinica i kao svaki skup moţe se grafiĉki prikazati krugom, a

toĉkama unutar kruga jedinice sadrţane u statistiĉkoj masi. Primjerice, broj zaposlenih u

privredi Republike Hrvatske u 2000. godini prikazan je na shemi 1.

Shema 1. Prikaz statistiĉke mase

Zaposlene osobe u RH u 2000.god.

.= jedna zaposlena osoba

Broj jedinica u promatranoj statistiĉkoj masi je konaĉan ili beskonaĉan broj. Za svaku

pojavu za koju se moţe odrediti ukupan broj jedinica je skup s konaĉnim brojem, primjerice,

broj zaposlenih u privredi Republike Hrvatske, meĊutim za neke pojave nije iz objektivnih

razloga moguće odrediti ukupan broj jedinica pa je rijeĉ o skupovima s beskonaĉnim brojem

jedinica, primjerice: broj vozila u gradu tijekom dana,….

Statistička jedinica je, dakle, element statistiĉke mase. Broj statistiĉkih jedinica

naziva se frekvencijom i oznaĉava simbolom f .

Statistiĉka masa treba biti definirana prostorno, vremenski i pojmovno, tj. potrebno je

odrediti prostor i vrijeme na koje se odnosi statistiĉka jedinica kao i svojstva koja mora imati

jedinica da bi bila ukljuĉena u odgovarajuću statistiĉku masu.

Page 3: Predavanja iz Statistike

3

Primjerice, za pojavu iz prethodne sheme statistiĉka jedinica je jedna osoba zaposlena

u privredi Republike Hrvatske u 2000. godini u radnom odnosu na neodreĊeno vrijeme.1

Statistiĉke jedinice imaju niz svojstava po kojima se podudaraju jedna s drugom, ali i

po kojima se meĊusobno razlikuju. MeĊutim, najmanje jedno svojstvo mora biti zajedniĉko

da bi jedinice pripadale istom skupu, a te osobine proizlaze iz definicije statistiĉke mase.

Statističko obiljeţje je svojstvo ili osobina statistiĉke jedinice. Svaka statistiĉka

jedinica ima relativno velik broj svojstava koja se mogu grupirati u ĉetiri skupine: atributivno,

prostorno, vremensko i numeriĉko obiljeţje.

Prostorno obiljeţje oznaĉava prostor (geografsko podruĉje), vremensko obiljeţava

vrijeme na koje se odnosi statistiĉka jedinica; numeriĉko obiljeţje jest ono koje se moţe

izraziti samo brojem, a atributivno rijeĉima (ako obiljeţje nije prostorno ili vremensko).

Primjerice, osoba zaposlena u privredi Republike Hrvatske u 2000. godini ima ova

obiljeţja: spol, struĉna sprema, godine radnog staţa, iznos plaće, godine starosti, djelatnost,

vrijeme zapošljavanja: godine, mjeseci, podruĉje: općine, ţupanije, mjesto boravka, itd.

Analizom pojedinih svojstava statistiĉke jedinice mogu se odrediti znaĉajke

promatrane pojave. Da bi se ostvario postavljeni cilj istraţivanja potrebno je provesti

odreĊene faze statističkog rada, i to:

1. Statističko promatranje - faza prikupljanja informacija o statistiĉkim jedinicama

obuhvaćenih promatranom statistiĉkom masom. S obzirom na obuhvat jedinica

promatranje je iscrpno ili reprezentativno, prema vremenu provoĊenja jednokratno,

periodiĉno ili tekuće promatranje, a prema naĉinu, prikupljanje se organizira pisanim ili

usmenim putem.

2. Grupiranje (klasifikacija) - faza grupiranja informacija prema jednom ili više odabranih

statistiĉkih obiljeţja u kojoj se kao rezultat dobivaju statistiĉki podaci. Statistiĉki podatak

je sreĊena, odnosno obraĊena informacija i predstavlja broj statistiĉkih jedinica

(frekvenciju) koje pripadaju pojedinom obliku statistiĉkog obiljeţja.

3. Statistička analiza - faza u kojoj se, na podatke o jednoj ili više promatranih statistiĉkih

masa, primjenjuju odgovarajuće statistiĉke metode da bi se odredile znaĉajke tih pojava.

Radi preglednosti informacije2 o statistiĉkim jedinicama i statistiĉki podaci prikazuju

se u statistiĉkoj tabeli, i to rezultati statistiĉkog promatranja u izvještajnoj, a rezultati

grupiranja u analitiĉkoj tabeli. U praksi te u struĉnoj i znanstvenoj literaturi u zadnje se

vrijeme ĉesto koristi termin tablica umjesto tabela. MeĊutim, statistiĉka tablica ne nastaje kao

rezultat faze statistiĉkog promatranja, već se sastoji od niza brojeva dobivenih primjenom

odgovarajućih raĉunskih radnji ili iznosa odreĊenih veliĉina koje se upotrebljavaju u

1 Prema statistiĉkoj metodologiji zaposlenom osobom smatra se osoba koja je s poslodavcem sklopila ugovor o

zasnivanju radnog odnosa na neodreĊeno vrijeme. Općenito, pojmovno definiranje statistiĉke mase propisano je i

obrazloţeno u Statistiĉkoj metodologiji Drţavnog zavoda za statistiku Republike Hrvatske. 2 Statistiĉki podatak je sreĊena, grupirana informacija. Informacija je da su u vremenu od 10 do 10.15 sati

evidentirani sljedeći prijelazi automobila preko raskršća: u 10.01 – jedan bijeli automobil, u 10.05 – jedan crveni

automobil, u 10.06 – jedan crveni automobil, u 10.10 – niti bijeli, niti crveni automobil, u 10.15 – jedan crveni

automobil. Podatak je da su u vremenu od 10 do 10.15 sati prošli kroz promatrano raskršće jedan bijeli

automobil, tri crvena automobila i jedan automobil boje razliĉite od bijele i crvene.

Page 4: Predavanja iz Statistike

4

rješavanju raznih zadataka. U Rjeĉniku hrvatskog jezika [Anić, str. 733.] dopušta se termin

tablica i kao sinonim za tabelu.

Primjerice, grupirani podaci o broju zaposlenih prema djelatnosti prikazuju se u obliku

statistiĉke tabele, a logaritmi brojeva, sluĉajni brojevi, vjerojatnosti pri odreĊenim teorijskim

razdiobama nalaze se u statistiĉkim tablicama.

Statistička tabela je skup statistiĉkih jedinica jedne ili više pojava razvrstanih prema

jednom ili više obiljeţja statistiĉkih jedinica te, radi preglednosti, prikazanih u odgovarajućem

broju redaka i stupaca. Sadrţaj i oblik statistiĉke tabele prikazani su na shemi 2.

Shema 2. Sadrţaj statistiĉke tabele

Broj tabele

NASLOV TABELE

Tumaĉ redaka

predstupac ili

pretkolona

Tumaĉ stupaca-zaglavlje

Ukupno Oznaka

stupca

Oznaka

stupca

Oznaka retka Redak

Oznaka retka Redak

Polje tabele

Polje tabele

Ukupno Zbrojni redak

Opaska Oznaka izvora

Izvor: Serdar, V.-Šošić, I.: Uvod u statistiku, Školska knjiga, Zagreb, 1986., str.17.

U praksi se pojavljuju tri vrste analitičkih tabela:

Jednostavna tabela - tabela s jednim stupcem za prikazivanje statistiĉkih podataka jedne

statistiĉke mase kod koje su statistiĉke jedinice razvrstane prema jednom obiljeţju.

Sloţena tabela - tabela s dva ili više stupaca za prikazivanje statistiĉkih podataka dviju ili

više statistiĉkih masa kod kojih su statistiĉke jedinice razvrstane prema jednom obiljeţju.

Kombinirana tabela - tabela s dva ili više ulaza za prikazivanje statistiĉkih podataka jedne ili

više statistiĉkih masa kod kojih su statistiĉke jedinice grupirane istodobno prema više od

jednog obiljeţja.

Grupiranjem statistiĉkih jedinica prema odabranom obiljeţju dobiva se statistiĉki niz.

Statistički niz je niz podataka koji se odnose na statistiĉke jedinice grupirane prema jednom

odabranom obiljeţju i koji su prikazani u statistiĉkoj tabeli.

Obiljeţje prema kojem je obavljeno grupiranje odreĊuje vrstu statistiĉkog niza. Tako

se razlikuju: atributivni, geografski, numeriĉki i vremenski nizovi.

stu

pac

stu

pac

Zb

rojn

i st

up

ac

Page 5: Predavanja iz Statistike

5

U tabeli 1 dani su podaci o broju zaposlenih i bruto domaćem proizvodu u privredi

Republike Hrvatske u 2000. godini prema djelatnostima, a u tabeli 2 podaci o prometu robe u

hrvatskim lukama u 2002. godini po pravcima kretanja i predstavljaju primjere atributivnog,

odnosno atributivnog i geografskog niza.

U tabelama 3, 4 i 5 statistiĉke jedinice (grupe zaposlenika u tabeli 3, broj dana u tabeli

4 te tone tereta u tabeli 5), grupirane su prema numeriĉkom obiljeţju (broj sati, broj poziva i

udaljenost u km) zato se nizovi iz tih tabela svrstavaju u numeriĉke nizove.

Podaci iz tabela 6 i 7 odnose se na broj prevezenih putnika u gradskom i zraĉnom

prijevozu Republike Hrvatske u razdoblju od 1991. do 2001.godine, odnosno na svjetsku

kontejnersku flotu u razdoblju od 1992. do 2001. godine i predstavljaju primjere vremenskih

nizova.

TABELA 1. Broj zaposlenih i bruto domaći proizvod u privredi Republike Hrvatske

u 2000. godini prema djelatnostima (stanje 31.3.)

Šifra DJELATNOST

BROJ ZAPOSLENIH

(stanje 31.03.)

BRUTO DOMAĆI

PROIZVOD

(u mil. kuna) UKUPNO ŢENE

A Poljoprivreda, lov i šumarstvo 30 017 7 882 10 951,3

D PreraĊivaĉka industrija 251 440 104 508 26 835,0

E Opskrba elektriĉnom

energijom, plinom i vodom

27 351

5 484

3 854,1

F GraĊevinarstvo 60 986 8 203 5 875,9

G Trgovina na veliko i na malo 136 059 70 521 13 159,7

H Hoteli i restorani 34 516 19 808 4 217,5

I Prijevoz, skladištenje i veze 80 356 22 411 12 425,3

J,K Financijske i druge usluge 73 591 39 090 18 863,6

B,Ĉ Ostalo 9 121 1 385 1 138,4

UKUPNO PRIVREDA 703 437 279 292 97 320,8

Napomena: Bruto domaći proizvod izraţen je u tekućim cijenama.

Šifra J obuhvaća financijsko posredovanje, šifra K poslovanje nekretninama, iznajmljivanje i

poslovne usluge, šifra B ribarstvo te šifra C rudarstvo i vaĊenje.

Izvor: SLJH-2001., str. 126.; SLJH-2002., str. 196.

TABELA 2. Promet robe u glavnim hrvatskim lukama u 2002. godini prema pravcima

kretanja (u tonama)

LUKA

UKUPAN

PROMET

(u tonama)

PRAVCI KRETANJA

UNUTRAŠNJI

PROMET

IZVOZ UVOZ TRANZIT

Dubrovnik 19 573 19 299 – 98 176

Ploĉe 972 055 65 278 3 938 75 090 827 749

Pula 538 232 1 480 468 722 64 993 3 037

Rijeka 4 983 272 1 357 191 1 045 840 1 124 850 1 455 391

Split 1 533 059 659 597 523 342 350 120 –

Šibenik 481 742 10 135 86 708 380 480 4 419

Zadar 351 483 39 567 37 957 273 959 –

UKUPNO 8 879 416 2 152 547 2 166 507 2 269 590 2 290 772

Izvor: Promet brodova po mjesecima i luĉkim kapetanijama u 2002. godini, Drţavni zavod za statistiku Republike Hrvatske,

Zagreb, tabela 18.

Page 6: Predavanja iz Statistike

6

TABELA 3. Skupine zaposlenika prema vremenu utrošenom za montažu brodskog motora

BROJ

UTROŠENIH

SATI

SKUPINA

ZAPOSLENIKA

1 800 A

2 000 B

2 100 Ĉ

2 200 D

2 300 E

2 500 F

Izvor: Prema predavanjima J. Ĉaval

TABELA 4. Razdioba dana za rujan, listopad, studeni i prosinac 2001. godine prema

broju telefonskih poziva dnevno

Broj

poziva

dnevno

0 1 2 3 4 5 6 7 8 9 10 11 12

Broj dana 6 13 26 19 17 14 7 3 4 4 2 3 2

Izvor: Ispis poziva HT odabranog pretplatnika

TABELA 5. Prevezena roba u cestovnom prometu Republike Hrvatske u 2000. godini

prema udaljenosti

UDALJENOST

(u km)

PREVEZENA

ROBA

(u 000 tona)

do 24 934,2

25 – 49 1 178,1

50 – 149 794,0

150 – 299 783,7

300 – 499 579,6

500 – 699 166,7

700 – 999 226,7

preko 1000 209,1

UKUPNO 4 872,1

Napomena: Podaci o prevezenoj robi prikupljeni su od poduzeća ĉija je osnovna djelatnost prijevoz robe, što znaĉi da nije

obuhvaćena ona roba koju prevoze fiziĉke osobe registrirane kao obrtnici.

Izvor: Prijevoz, skladištenje i veze u 2000., str.44.

Page 7: Predavanja iz Statistike

7

TABELA 6. Prevezeni putnici u gradskom i zračnom prijevozu Republike Hrvatske u razdoblju

od 1991. do 2001. godine

GODINA

BROJ PREVEZENIH

PUTNIKA

Gradski

prijevoz

(u mil.)

Zraĉni

prijevoz

(u tisućama)

1991. 427,4 139

1992. 419,1 238

1993. 415,3 507

1994. 418,7 661

1995. 411,7 679

1996. 393,4 824

1997. 395,5 866

1998. 379,7 920

1999. 386,0 926

2000. 389,3 1 072

2001. 398,5 1 245

Napomena: Broj putnika u gradskom prijevozu obuhvaća broj prevezenih putnika u tramvajima i autobusima. Broj putnika u

zraĉnom prijevozu obuhvaća putnike prevezene u domaćem i meĊunarodnom prijevozu.

Izvor: SLJH-97, str. 290., Prijevoz, skladištenje i veze u 1999., str. 54, Prijevoz, skladištenje i veze u 2001., str. 51.,

SLJH-00, str. 303., SLJH-02, str. 319.

TABELA 7. Svjetska kontejnerska flota u razdoblju od 1992. do 2001. godine – stanje

krajem godine

GODINA BROJ

BRODOVA

TEU

(u 000)

1992. 1414 1 957,6

1993. 1461 2 114,5

1994. 1603 2 367,0

1995. 1763 2 688,8

1996. 1949 3 072,1

1997. 2187 3 585,7

1998. 2382 4 046,5

1999. 2457 4 278,7

2000. 2590 4 720,2

2001. 2756 5 314,7

Izvor: World Fleet Statistics, Lloyd’s Register, 1992. – 2001.

Page 8: Predavanja iz Statistike

8

VJEŢBA 1. Statistička tabela

Zadatak 1.1. Je li svaka statistiĉka masa masovna pojava i obrnuto? Objasniti pojmove

masovna pojava i statistiĉka masa na odabranim primjerima.

Zadatak 1.2. Za tabele od 1. do 7. odrediti statistiĉke mase koje su predmet statistiĉke analize,

statistiĉke jedinice te obiljeţje ili obiljeţja prema kojima su grupirane statistiĉke

jedinice.

Zadatak 1.3. Navesti neka obiljeţja jedne zaposlene osobe i grupirati ih prema vrstama

statistiĉkog obiljeţja. O kojoj se vrsti statistiĉkog niza radi ako se u tabeli nalaze

podaci o osobama zaposlenim u Republici Hrvatskoj u 2000. godini prema

djelatnostima, odnosno o zaposlenim osobama u Republici Hrvatskoj u

razdoblju od 1990. do 2000. godine ?

Analogno objasniti sluĉaj da su na raspolaganju podaci o zaposlenim osobama u

2000. godini po ţupanijama Republike Hrvatske.

Zadatak 1.4. Opisati faze rada koje treba provesti da bi se dobila odgovarajuća statistiĉka

tabela. Za ilustraciju uzeti tabele 1. i 2.

Zadatak 1.5. Opisati postupak sastavljanja statistiĉke tabele: odreĊivanje naslova, broja

redaka i stupaca, zbrojnog retka ili stupca, navoĊenje izvora, opaske ili

napomene.

Objasniti osnovnu podjelu tabele na tekstualni dio (predstupac i zaglavlje tabele)

i brojĉani dio (m x n polja u kojima se nalaze frekvencije, odnosno broj

statistiĉkih jedinica koje pripadaju nekom retku i nekom stupcu tabele).

Objasniti sadrţaj pojedinih oznaka koje se nalaze u poljima tabele umjesto

frekvencija.

Zadatak 1.6. Iz tabela 1. do 7. odrediti vrstu statistiĉke tabele, vrstu statistiĉkog niza te,

koristeći prethodna objašnjenja, objasniti odgovore.

Page 9: Predavanja iz Statistike

9

RJEŠENJA.

1.1. Masovna pojava je širi pojam od statistiĉke mase, jer je statistiĉka masa ona masovna

pojava koja je odabrana za predmet statistiĉkog istraţivanja. Primjeri za statistiĉke mase su:

zaposleni u Republici Hrvatskoj, promet u tonama po lukama, zaposleni prema broju

utrošenih sati, tone tereta prema udaljenosti, prevezeni putnici po granama prijevoza,... .

1.2. Svaka statistiĉka masa sadrţi konaĉan ili beskonaĉan broj statistiĉkih jedinica koje su

grupirane prema jednom ili više statistiĉkih obiljeţja, ovisno o ĉemu formira odgovarajuću

vrstu statistiĉkoga niza.

Red.

broj

1. stat.masa 2. stat. masa 1. stat.

obiljeţje

2. stat.

obiljeţje

Vrsta

stat. niza

Vrsta

tabele

1. zaposleni BDP u mil. djelatnost − atributivni sloţena

2. tone tereta − luke pravci

kretanja

geografsko-

atributivni

kombinirana

3. skupine

zaposlenika

− broj

utrošenih

sati

numeriĉki jednostavna

4. dani − broj poziva

dnevno

− numeriĉki jednostavna

5. tone tereta − udaljenost

u km

− numeriĉki jednostavna

6. putnici u

gradskom

putnici u

zraĉnom pr.

godine − vremenski

(intervalni)

sloţena

7. brodovi TEU u 000 godine − vremenski

(trenutaĉni)

sloţena

1.3. Obiljeţje jedne zaposlene osobe u RH:

- djelatnost (A)

- razdoblje od 1990. do 2000. godine (V)

- ţupanije RH (G)

- spol (A)

- struĉna sprema (A)

- godine starosti (N)

- godine radnog staţa (N), .....

1.4. Statistiĉka tabela je skup podataka poredanih u odreĊenom broju redaka i stupaca. Da bi

se dobila odgovarajuća statistiĉka tabela potrebno je:

- definirati statistiĉku masu i obiljeţje koje će biti predmet statistiĉkog promatranja; statistiĉka

masa se definira prostorno, vremenski i pojmovno.

- pisanim ili usmenim putem prikupiti informacije o svakoj statistiĉkoj jedinici promatrane

statistiĉke mase

- prikupljene informacije grupirati prema zadanom obiljeţju; grupiranjem informacija dobiva

se statistiĉki podatak

- statistiĉki podaci se unose u tabelu u odgovarajuće polje ovisno o retku i stupcu tabele.

1.5. Postupak sastavljanja tabele- prema shemi 2. na stranici 4.

Page 10: Predavanja iz Statistike

10

1.6. Tabela se sastoji od tekstualnog dijela, i to :

- zaglavlja u kojem se objašnjava što predstavljaju brojevi u stupcima i

- pretkolone ( predstupca) u kojoj je objašnjeno što znaĉe brojevi u pojedinim retcima tabela.

1.7. – nema pojave

0 frekvencija je manja od 0.5

... ne raspolaţe se podatkom

Ø prosjeĉna vrijednost frekvencije

1) oznaka za napomenu (opasku) ispod tabele.

1.8. Rješenje je dano u 1.2. ■

Page 11: Predavanja iz Statistike

11

2. ANALIZA ATRIBUTIVNIH I GEOGRAFSKIH

NIZOVA

Atributivni i geografski nizovi se dobivaju grupiranjem statistiĉkih jedinica prema

atributivnom, odnosno geografskom obiljeţju. Radi preglednosti takvi se nizovi prikazuju

statistiĉkim tabelama odgovarajućeg oblika.

Analiza navedenih vrsta nizova obuhvaća grafiĉko prikazivanje i izraĉunavanje

relativnih brojeva za podatke koji se nalaze u tim tabelama.

2.1. Grafičko prikazivanje

Prednosti i nedostaci grafičkih prikaza – vrste grafičkih prikaza – površinski grafikoni

– stupci – kvadrati – krugovi – polukrugovi – kartogrami – dijagramska karta –

piktogram – statistička karta.

Grafiĉki prikaz podataka jednog ili više nizova iz statistiĉke tabele ima niz prednosti

od kojih je najvaţnija da se grafikonom moţe postići jasna, zorna slika o promatranoj pojavi

te brzo uoĉavanje njezinih znaĉajki i meĊusobnih odnosa pojedinih podataka.

Grafiĉki prikaz ima i nedostataka, izmeĊu ostalog, da grafikon nikad ne moţe dostići

toĉnost podataka iz statistiĉke tabele. MeĊutim, prednosti su znatno veće od nedostataka pa

se, zahvaljujući razvoju osobnih raĉunala i programske podrške, za grafiĉki prikaz kaţe da

“govori više od tisuću rijeĉi” Petz.

Grafičko prikazivanje atributivnih nizova

Atributivni se nizovi prikazuju grafiĉki površinskim grafikonima u kojima su

statistiĉke jedinice (frekvencije) predstavljene odgovarajućim površinama odabranih

geometrijskih likova.

Vrste površinskih grafikona su:

Površinski grafikon pomoću stupaca: jednostavnih

razdijeljenih (strukturnih)

dvostrukih

Površinski grafikon pomoću kvadrata

Površinski grafikon pomoću kruga i sektora kruga

Površinski grafikon pomoću polukruga i sektora polukruga.

Stupci se ucrtavaju u grafikon s pravokutnim koordinatnim sustavom, a ostali

geometrijski likovi: kvadrati, krugovi i polukrugovi u grafikon bez koordinatnog sustava.

Pravokutnici imaju jednake baze pa se frekvencije mogu usporeĊivati prema visini stupca.

Page 12: Predavanja iz Statistike

12

Jednostavni stupci se koriste za prikazivanje frekvencija jedne statistiĉke mase.

Primjerice, grafiĉki prikaz broja zaposlenih u privredi Republike Hrvatske u 2000. godini

prema djelatnostima.

Razdijeljeni stupci se primjenjuju za prikazivanje ukupne frekvencije i parcijalnih

frekvencija koje su dio ukupne frekvencije jedne statistiĉke mase. Primjerice, grafiĉki prikaz

broja zaposlenih u privredi Republike Hrvatske u 2000. godini prema djelatnostima i spolu.

Visina stupca prikazuje ukupan broj zaposlenih, a posebno oznaĉena površina unutar stupca

broj muškaraca, odnosno ţena.

Dvostruki stupci su naĉin prikazivanja frekvencija dviju ili više pojava izraţenih u

istim jedinicama mjere ili za sluĉajeve umjesto razdijeljenih stupaca. Primjerice, broj

zaposlenih u privredi i neprivredi Republike Hrvatske u 2000. godini prema djelatnostima ili

za prethodni primjer prikaza zaposlenih muškaraca i ţena.

Kvadrati se koriste u sluĉaju kad se usporeĊuje manji broj frekvencija (dvije do tri).

Površina kvadrata odreĊena je stranicom

a P , 1

gdje P oznaĉava frekvenciju koja se prikazuje kvadratom. Pritom je vaţno odabrati

odgovarajuće mjerilo (s kojim se frekvencija P podijeli) kako bi stranica kvadrata a

odgovarala predviĊenoj veliĉini grafikona. Primjerice, ako se za grafiĉki prikaz ukupnog broja

zaposlenih u privredi Republike Hrvatske u 1999. i 2000. godini odabere mjerilo: 1 cm2

= 40

000 zaposlenih, tada će broj zaposlenih u Republici Hrvatskoj u 1999. godini biti prikazan

kvadratom sa stranicom od 4,22 cm, a u 2000. godini sa stranicom kvadrata od 4,19 cm.

Krugovi su naĉin prikazivanja podataka u sluĉajevima analognim kvadratu ali s

prednošću pred kvadratom jer se sektorima kruga moţe grafiĉki prikazati i struktura pojave.

Veliĉina kruga odreĊena je polumjerom

r P / . 2

Mjerilo se odabire prema veliĉini frekvencije koja se prikazuje krugom P te veliĉini

grafikona. Sektor kruga, izraţen brojem stupnjeva sektora kruga, izraĉuna se na sljedeći naĉin

x = (dio / cjelina) 360 . 3

Primjerice, za prethodni primjer broj zaposlenih jedne godine predstavljen je

odgovarajućom površinom kruga, a broj zaposlenih pojedine djelatnosti odgovarajućim

sektorom kruga.

Polukrugovi se koriste u sluĉajevima analognim kvadratu i krugu, ali najĉešće kad je

rijeĉ o samo dva polukruga. Ako su frekvencije obje pojave izraţene u istim jedinicama mjere

(broj zaposlenih u 1999. i 2000. godini) tada su polukrugovi s nejednakim polumjerom

zavisno od veliĉine frekvencije (jer se odabire jedno mjerilo za oba polukruga), a u obrnutom

sluĉaju kad su frekvencije dviju pojava izraţene u razliĉitim jedinicama mjere (broj

zaposlenih i bruto domaći proizvod), tada jedno mjerilo ne moţe vrijediti za obje pojave pa se

uzimaju dva polukruga s jednakim, proizvoljno velikim polumjerom. U tom sluĉaju polukrug

Page 13: Predavanja iz Statistike

13

ne prikazuje veliĉinu pojave, ali sektori polukrugova prikazuju strukturu obje pojave prema

odabranom obiljeţju (djelatnosti).

Broj stupnjeva sektora polukruga izraĉunava se prema formuli

x = (dio / cjelina) 180 4

Naĉin odabira te izradba pojedine vrste navedenih grafiĉkih prikaza dani su u

rješenjima vjeţbe 2.1., koja se odnosi na grafiĉko prikazivanje atributivnih i geografskih

nizova.

Grafičko prikazivanje geografskih nizova

Geografski se nizovi grafiĉki prikazuju u svim oblicima površinskih grafikona

navedenim za atributivne nizove te još jednom vrstom površinskih grafikona koji se nazivaju

kartogramima.

Kartogram je geografska karta u kojoj su frekvencije predstavljene odgovarajućim

površinama odabranih geometrijskih likova ili odabranih znakova, odnosno šrafura razliĉitog

intenziteta. Prednost kartograma u odnosu na prethodno objašnjene površinske grafikone je u

ĉinjenici da kartogram zorno prikazuje geografsku (prostornu) razdiobu promatrane pojave.

Razlikuju se tri vrste kartograma:

Dijagramska karta – vrsta kartograma u kojem su frekvencije promatrane pojave

prikazane odgovarajućim površinama pravokutnika (stupaca), kvadrata, kruga ili polukruga.

Ova vrsta kartograma preporuĉuje se u sluĉajevima prikazivanja manjeg broja statistiĉkih

jedinica (frekvencija) geografskog niza. Naĉin izraĉunavanja tih površina objašnjen je u dijelu

o grafiĉkom prikazivanju atributivnih nizova.

Primjerice, promet roba u hrvatskim lukama u 2002. godini po pravcima kretanja

moţe se prikazati tako da se na karti jadranske obale oznaĉe luke i na tom mjestu ucrtaju

odgovarajući krugovi i sektori kruga kojima je predoĉen ukupan promet pojedine luke i udio

pojedinih pravaca kretanja.

Piktogram – vrsta kartograma u kojem se frekvencije prikazuju pomoću znakova tako

da se proizvoljno odabrani znak za odreĊeni broj jedinica ucrtava na površinu pripadajuće

geografske grupe. Ova vrsta grafikona veoma je ilustrativna za prikazivanje nizova s velikim

brojem geografskih grupa.

Primjerice, ako jedna toĉka oznaĉava 100 automobila onda na podruĉju općine koja

ima 10000 registriranih automobila bit će ucrtano 100 toĉkica.

Statistička karta – vrsta kartograma u kojem se frekvencije prikazuju šrafurama ili

bojama razliĉitog intenziteta. Ova vrsta grafikona preporuĉuje se u sluĉajevima kad

geografski niz ima veliki broj grupa, a frekvencije nisu apsolutni, već relativni brojevi.

Primjerice: veliĉina opasnosti od poţara, postotak nepismenih, postotak glasaĉa koji su

izašli na birališta, dubina mora, … .

Page 14: Predavanja iz Statistike

14

U praksi se mogu koristiti razliĉite kombinacije navedenih grafiĉkih prikaza,

primjerice: dvostruki razdijeljeni stupci, trostruki stupci, i sliĉno, i to je opravdano ako

grafikon na ispravan i jasan naĉin prikazuje podatke iz statistiĉke tabele i omogućuje

donošenje zakljuĉaka o znaĉajkama promatrane pojave. Isto tako, neki grafiĉki prikazi

navedeni za atributivne i geografske nizove mogu se takoĊer koristiti i za numeriĉke i

vremenske nizove. Takvi sluĉajevi navedeni su u zadacima za vjeţbu u sljedećim

poglavljima.

Page 15: Predavanja iz Statistike

15

VJEŢBA 2.1. Grafičko prikazivanje atributivnih i geografskih nizova

Zadatak 2.1.1. Grafiĉki prikazati broj zaposlenih u privredi Republike Hrvatske u 2000.

godini prema djelatnostima (podaci iz tabele 1.). Koji zakljuĉak proizlazi iz

grafikona?

Zadatak 2.1.2. Grafiĉki prikazati broj zaposlenih u privredi Republike Hrvatske u 2000.

godini prema djelatnostima i spolu. Usporediti moguće varijante grafiĉkog

prikaza.

Zadatak 2.1.3. Ukupan broj zaposlenih u privredi Republike Hrvatske u 1999. godini iznosio

je 712 771 osobu, a u 2000. godini 703 437 osoba. Prikazati ove dvije

frekvencije odgovarajućim grafikonom. Usporediti moguće varijante grafiĉkog

prikazivanja.

Zadatak 2.1.4. Broj zaposlenih u privredi Republike Hrvatske u 1999. godini prema

djelatnostima iznosio je prema SLJH-2000., str. 120., 175.:

Djelatnost Broj zaposlenih

Poljoprivreda, lov i šumarstvo 30 968

PreraĊivaĉka industrija 259 120

Opskrba elektriĉnom energijom,

plinom i vodom 26 944

GraĊevinarstvo 65 537

Trgovina na veliko i na malo 134 115

Hoteli i restorani 35 482

Prijevoz, skladištenje i veze 80 627

Financijske i druge usluge 70 734

Ostalo 9 244

Na temelju podataka za 1999. godinu i podataka iz tabele 1. za 2000. godinu

grafiĉki prikazati strukturu zaposlenih prema djelatnostima. Usporediti

strukturu zaposlenih u 2000. godini sa strukturom zaposlenih u 1999. godini.

Zadatak 2.1.5. Grafiĉki prikazati broj zaposlenih i bruto domaći proizvod u privredi

Republike Hrvatske u 2000. godini prema djelatnostima. Usporediti zaposleno

osoblje i bruto domaći proizvod prema pojedinim djelatnostima.

Zadatak 2.1.6. Pomoću odgovarajućih stupaca grafiĉki prikazati promet robe u glavnim

lukama Republike Hrvatske u 2002. godini po pravcima kretanja. Obrazloţiti

dobiveni grafikon.

Zadatak 2.1.7. Kojom bi se vrstom kartograma najbolje prikazali podaci o prometu robe u

lukama Republike Hrvatske u 2002. godini? Konstruirati odgovarajući

grafikon.

Page 16: Predavanja iz Statistike

16

RJEŠENJA.

2.1.1. Grafiĉki prikaz pomoću jednostavnih stupaca.

2.1.2. Grafiĉki prikaz pomoću razdijeljenih (strukturnih) ili dvostrukih stupaca.

2.1.3. Grafiĉki prikaz pomoću dva kruga, svaki krug svojom površinom odgovara veliĉini

frekvencije koju taj krug prikazuje. Zbog toga je potrebno odabrati mjerilo;

primjerice, 1 cm2= 40000 zaposlenih pa je za 1999. godinu r1999 = 4,22 cm, a za 2000. godinu

r2000 = 4,19 cm.

2.1.4. Koristeći grafiĉki prikaz iz zadatka 2.1.3. preporuĉuje se u krugove ucrtati sektore

kruga koji prikazuju strukturu zaposlenih u R Hrvatskoj prema djelatnostima:

A D E F G H I J,K B,C Ukupno

___________________________________________________________________________

1999. 16 131 14 33 68 18 40 35 5 360

2000. 40 100 14 22 49 15 46 70 4 360

___________________________________________________________________________

2.1.5. Zaposleno osoblje i bruto domaći proizvod u privredi R Hrvatske su dvije pojave koje

su izraţene u razliĉitim jedinicama mjere, pa u takvim sluĉajevima statistika predlaţe grafiĉki

prikaz pomoću jednakih krugova ili polukrugova proizvoljne veliĉine, a sektorima kruga,

odnosno polukruga udio pojedine djelatnosti u ukupnom broju zaposlenih u R Hrvatskoj ili

ukupnom iznosu bruto domaćeg proizvoda.

Sektori kruga:

A D E F G H I J,K B,C Ukupno

___________________________________________________________________________

Zap. osoblje 15 129 14 31 70 17 41 38 5 360

BDP 40 100 14 22 49 15 46 70 4 360

__________________________________________________________________________

Sektori polukruga x0

= dio/cjelina*180, pa su sektori polukruga dvostruko manji od navedenih

sektora kruga.

2.1.6. Promet robe u glavnim lukama R Hrvatske u 2002. godini po pravcima kretanja moţe

se prikazati razdijeljenim ili dvostrukim (višestrukim) stupcima.

2.1.7. Podaci iz prethodnog zadatka mogu se prikazati dijagramskom kartom. Potrebno je

odabrati mjerilo koje ovisi o veliĉini grafikona, zatim izraĉunati polumjer kruga za svaku luku

posebno te sektore kruga kojim je prikazan udio pojedinog pravca kretanja.

Sektori kruga:

Dbk Ploĉe Pula Rijeka Split Šibenik Zadar

___________________________________________________________________________

Unutr. promet 355 24 1 98 155 8 40

Izvoz - 1 314 76 123 65 39

Uvoz 2 28 43 81 82 284 281

Tranzit 3 307 2 105 - 3 -

Page 17: Predavanja iz Statistike

17

___________________________________________________________________________

360 360 360 360 360 360 360

Za ilustraciju je priloţena dijagramska karta koju je izradio izvanredni student

Pomorskog fakulteta kap. Ronald Ruţić (2006.)

Page 18: Predavanja iz Statistike

18

2.2. Relativni brojevi

Pojam apsolutnog broja (frekvencije) – pojam relativnog broja (frekvencije) – vrste

relativnih brojeva – izračunavanje i grafičko prikazivanje relativnih brojeva – postoci

– relativni brojevi koordinacije – indeksi .

Apsolutna frekvencija je broj statistiĉkih jedinica dobiven nakon obavljene faze

statistiĉkog promatranja i grupiranja jedinica prema odabranom obiljeţju.

Primjerice, brojevi o zaposlenima i bruto domaćem proizvodu u tabeli 1. su apsolutne

frekvencije, kao i sve frekvencije u ostalim tabelama od broja 2. do 7.: broj tona tereta u

cestovnom prijevozu, broj prevezenih putnika u gradskom prijevozu, itd.

U praksi se javlja potreba usporeĊivanja apsolutnih frekvencija: broj zaposlenih u

preraĊivaĉkoj industriji s ukupnim brojem zaposlenih, bruto domaći proizvod s brojem

zaposlenih, broj zaposlenih u preraĊivaĉkoj industriji s brojem zaposlenih u djelatnosti

prijevoza, skladištenja i veza, itd. Rezultat takve usporedbe su relativni brojevi.

Relativni broj je broj kojim je izraţen odnos izmeĊu dviju i više apsolutnih

frekvencija:

fr = f1 / f2 . 5

Zavisno od frekvencije koja se nalazi u brojniku i frekvencije iz nazivnika relativnog

broja razlikuju se tri vrste relativnih brojeva: postoci, relativni brojevi koordinacije i

indeksi. Svaka vrsta relativnog broja izraĉunava se i grafiĉki prikazuje odgovarajućim

naĉinom.

Postoci (%)

Postotak je relativan broj koji pokazuje odnos jednog dijela statistiĉkih jedinica prema

ukupnom broju statistiĉkih jedinica promatrane pojave.

Iz definicije da je postotak udio parcijalne frekvencije u ukupnoj frekvenciji slijedi da

se postotak izraĉunava tako da se parcijalna frekvencija (frekvencija koja se usporeĊuje)

podijeli s ukupnom frekvencijom (koja je baza usporedbe):

% = (dio / cjelina) 100 . 6

Primjerice, udio broja zaposlenih u preraĊivaĉkoj industriji u ukupnom broju

zaposlenih u Republici Hrvatskoj u 2000. godini iznosio je 35,7%; udio pojedine luke,

primjerice luke Rijeka u ukupnom prometu svih hrvatskih luka u 2002. godini bio je 56,1%,

odnosno nešto više od polovice cjelokupnog prometa hrvatskih luka, itd.

Postotak teorijski moţe zauzeti vrijednosti u intervalu 0 % 100 , ali u praksi taj

interval glasi: 0 % 100 .

Page 19: Predavanja iz Statistike

19

3.2. Srednje vrijednosti

Pojam srednje vrijednosti – aritmetička sredina – medijan – mod – prosjek

aritmetičkih sredina – prosjek relativnih brojeva .

Srednja vrijednost numeriĉkog niza je reprezentant pojedinaĉnih vrijednosti

numeriĉkog obiljeţja u promatranom numeriĉkom nizu. Primjerice: iznos sati koji u prosjeku

utroši jedna grupa zaposlenika, prosjeĉan broj telefonskih poziva dnevno, udaljenost u

kilometrima koju prelazi 50% od ukupne koliĉine tereta, i sliĉno.

Aritmetička sredina ( X )

Aritmetiĉka sredina predstavlja prosjeĉnu vrijednost numeriĉkog obiljeţja; to je

vrijednost numeriĉkog obiljeţja koja u prosjeku pripada jednoj statistiĉkoj jedinici.

Izraĉunavanje aritmetiĉke sredine zavisi od tipa numeriĉkog niza i dobiva se

dijeljenjem totala (sume vrijednosti numeriĉkog obiljeţja) s ukupnim brojem statistiĉkih

jedinica ( ukupnom frekvencijom):

Tip I. Jednostavna aritmetiĉka sredina

X

x

N

ii

n

1

Tip II. Vagana (ponderirana) aritmetiĉka sredina

X

f x

f

i ii

n

ii

n

1

1

Tip III. Vagana (ponderirana) aritmetiĉka sredina

X

f x

f

i ii

n

ii

n

1

1

gdje je:

xi = vrijednost numeriĉkog obiljeţja, razredna sredina za III. tip niza, i = 1,…,n

fi = frekvencija, i = 1,…,n .

Page 20: Predavanja iz Statistike

20

Medijan (M)

Medijan je pozicijska srednja vrijednost koja se odreĊuje prema poloţaju jedinica u

nizu.

Medijan je vrijednost numeriĉkog obiljeţja koja pripada središnjoj jedinici, N/2, tj.

frekvenciji koja dijeli razdiobu na dva jednaka dijela. Medijan je takva vrijednost numeriĉkog

obiljeţja za koju vrijedi da 50 % jedinica ima vrijednost jednaku i manju od medijana, a

preostalih 50% jedinica vrijednost numeriĉkog obiljeţja jednaku i veću od medijana.

OdreĊivanje medijana ovisi o tipu numeriĉkog niza:

Tip I. Oĉita se vrijednost numeriĉkog obiljeţja koja pripada središnjoj jedinici; ako je broj

jedinica paran, onda je medijan prosjek vrijednosti koji pripada dvjema središnjim

jedinicama.

Tip II. Sastavi se kumulativni niz “manje od”, pronaĊe središnja jedinica N/2 i vrijednost koja

pripada središnjoj jedinici je medijan.

Tip III. Sastavi se kumulativni niz “manje od”, pronaĊe N/2 i toj frekvenciji pripadajući

medijalni razred. Za odreĊivanje toĉne vrijednosti medijana koristi se sljedeća formula

1

1

med

/ 2N fM L i

f

gdje je:

N/2 – središnja jedinica

L1 – donja granica medijalnog razreda

i – veliĉina medijalnog razreda

f med – frekvencija medijalnog razreda

f 1– suma svih frekvencija do medijalnog razreda.

Medijan se moţe odrediti i grafiĉkim putem da se u pravokutnom koordinatnom

sustavu unesu frekvencije kumulativnog niza “manje od”, na osi y oznaĉi središnja jedinica

N/2, zatim povuĉe paralela s osi x do kumulante i u sjecištu s linijom kumulativnog niza

spusti okomica do osi x. Ta vrijednost na osi apscise je vrijednost medijana.

Mod (Mo)

Mod je vrijednost numeriĉkog obiljeţja koja pripada najvećoj frekvenciji. Drugim

rijeĉima, mod je najĉešća vrijednost numeriĉkog obiljeţja u nizu.

Mod se ne moţe odrediti za razdiobe u kojoj su sve frekvencije meĊusobno jednake

(tip I.). Ako razdioba ima dva jednaka vrha (bimodalna razdioba) tada se oĉitaju dvije

vrijednosti moda.

Page 21: Predavanja iz Statistike

21

OdreĊivanje moda ovisi o tipu numeriĉkog niza:

Tip I. Nema moda

Tip II. Oĉita se vrijednost numeriĉkog obiljeţja koja pripada najvećoj frekvenciji.

Tip III. PronaĊe se najveća frekvencija; razred koji joj pripada je modalni razred. Toĉna

vrijednost moda dobije se prema formuli

1( ) ( )

o

b aM L i

b a b c

gdje je:

oM – mod

b – najveća frekvencija u nizu (korigirana kod nejednakih razreda)

a – frekvencija iznad b

c – frekvencija ispod b

L1 – donja granica modalnog razreda

i – veliĉina modalnog razreda.

Mod se moţe odrediti i grafiĉkim putem: to je vrijednost numeriĉkog obiljeţja koja se

dobije spuštanjem okomice iz vrha krivulje na os x.

Prosjek aritmetičkih sredina ( X )

Prosjek aritmetiĉkih sredina je aritmetiĉka sredina aritmetiĉkih sredina i izraĉunava se

kao vagana aritmetiĉka sredina srednjih vrijednosti

1

1

k

i i

i

k

i

i

X N

X

N

gdje je :

X – prosjek aritmetiĉkih sredina

1,..., kX X – aritmetiĉke sredine

N1, ..., Nk – broj jedinica iz kojih su izraĉunate aritmetiĉke sredine

Prosjek postotaka ( P )

Prosjeĉan postotak izraĉunava se ili harmonijskom ili aritmetiĉkom sredinom . Vagana

aritmetiĉka sredina se koristi kad su zadani postoci (P) i ukupne frekvencije (C), tj.

frekvencije koje se nalaze u nazivniku pri izraĉunavanju postotaka

Page 22: Predavanja iz Statistike

22

1

1

k

i i

i

k

i

i

PC

P

C

gdje je:

P – prosjek postotaka

P1, ..., Pk – postoci

C1, ..., Ck – ukupne frekvencije.

Prosjek relativnih brojeva koordinacije ( R )

Analogno prethodnim srednjim vrijednostima prosjek relativnih brojeva kkoordinacije

dobiva se po formuli za vaganu sredinu

1

1

k

i i

i

k

i

i

R B

R

B

gdje je :

R – prosjek relativnih brojeva koordinacije

R1, ..., Rk – relativni brojevi koordinacije

B1, ..., Bk – baze relativnog broja koordinacije.

Page 23: Predavanja iz Statistike

23

VJEŢBA 3.2. Srednje vrijednosti

Zadatak 3.2.1. Izraĉunati total za vrijednosti numeriĉkih obiljeţja zadanih u tabelama 3., 4. i

5. Postoje li razlike u izraĉunavanju totala za pojedine tipove numeriĉkog niza?

Zadatak 3.2.2. Koliko iznosi broj sati koji je u prosjeku potreban jednoj skupini zaposlenika

za montaţu brodskog motora (tabela 3.)? Koje skupine zaposlenika utroše

manje, a koje više vremena od prosjeka?

Zadatak 3.2.3. Na temelju podataka iz tabele 4. izraĉunati prosjeĉan broj telefonskih poziva

po jednom danu. Koliki je udio dana s brojem poziva manjim od prosjeka, a

koliki s većim brojem poziva od prosjeka? Po ĉemu se izraĉunavanje prosjeka

u ovom zadatku razlikuje od izraĉunavanja u zadatku 3.2.2.?

Zadatak 3.2.4. Ako udaljenost koju prelazi jedna tona tereta u cestovnom prijevozu Republike

Hrvatske u 2000. godini poprima vrijednosti od 0 do 1500 km, kolika je

udaljenost koju prelazi u prosjeku jedna tona? Na koliko se naĉina moţe

izraĉunati traţena vrijednost? Provjeriti je li se, bez obzira na metodu, uvijek

dobiva isti rezultat.

Zadatak 3.2.5. Ako jednaki broj skupina zaposlenika utroši manje ili više sati u odnosu na

neku vrijednost numeriĉkog obiljeţja, kako se zove takva srednja vrijednost?

Koliko ona iznosi za podatke u tabeli 3.?

Zadatak 3.2.6. Koliki broj telefonskih poziva ostvaruje 50% od ukupnog broja dana u tabeli

4., a koliki broj poziva najveći broj dana? Traţene vrijednosti moguće je oĉitati

iz grafikona. Usporediti rezultate.

Zadatak 3.2.7. Koju udaljenost prelazi 50% od ukupne koliĉine tereta u cestovnom prijevozu

Republike Hrvatske u 2000. godini? O kojoj je srednjoj vrijednosti rijeĉ?

Rezultat provjeriti na grafikonu.

Zadatak 3.2.8. Zašto nije moguće odrediti u tabeli 3. broj sati koji je utrošio najveći broj

skupina zaposlenika? Je li bi to bilo moguće kada bi frekvencije u tabeli 3.

iznosile 2,2,2,2,2,2 ili 1,1,2,1,2,1? Objasniti pojedine sluĉajeve.

Zadatak 3.2.9. Izraĉunati udaljenost u kilometrima koju prelazi najveći broj tona tereta u

cestovnom prijevozu Republike Hrvatske u 2000. godini. Rezultat provjeriti na

grafikonu.

Zadatak 3.2.10.Usporediti rezultate dobivenih srednjih vrijednosti za nizove iz tabela 3., 4. i

5. U kakvom su odnosu pojedine srednje vrijednosti s obzirom na njihov

poredak na osi x ? Utjeĉe li poredak srednjih vrijednosti na osi x na oblik

krivulje? Objasniti to na zadanim primjerima.

Zadatak 3.2.11.Prosjeĉno ostvarenje norme u jednom poduzeću za ĉetiri radne jedinice

iznosilo je: 98,7%, 102%, 85,6% i 94,9%. Broj zaposlenih po jedinicama

iznosio je: 141, 98, 120 i 100 zaposlenih. Izraĉunati prosjeĉno ostvarenje

Page 24: Predavanja iz Statistike

24

norme u promatranom poduzeću. U kojim se jedinicama norma ostvaruje

ispod, a u kojima iznad prosjeka poduzeća?

Zadatak 3.2.12.Za tri poduzeća raspoloţivi su ovi podaci:

Poduzeće

Broj

zaposlenih

Prosjeĉna

plaća

u kunama

Nabavna

vrijednost osnov.

sredst. u 000 kn

% amortizacije od

nab.vrijed.

A 278 2020 1520 40

B 90 3010 3650 55

C 132 2150 4870 27

Prema I. Šošić Uvod u statistiku, 2002., str. 43.

Za promatrana poduzeća izraĉunati:

1) prosjeĉan iznos plaće u kunama po jednoj zaposlenoj osobi,

2) prosjeĉan postotak amortizacije,

3) prosjeĉan iznos nabavne vrijednosti u kunama po jednoj zaposlenoj osobi.

Page 25: Predavanja iz Statistike

25

RJEŠENJA.

3.2.1. Total je zbroj vrijednosti numeriĉkoga obiljeţja; za numeriĉke nizove tipa I. iznosi X , a za ostale

tipove II. i III. fX :

X = 12900 sati

fX = 468 poziva

fX = 1 097 518,7 km.

3.2.2. X = 2150 sati

3.2.3. X = 3,9 telefonskih poziva dnevno; za tip II. numeriĉkog niza potrebno je primijeniti vaganu

(ponderiranu) aritmetiĉku sredinu.

3.2.4. X = 225,27 km; taj se rezultat moţe dobiti pomoću vagane aritmetiĉke sredine i pomoću metode linearne

transformacije obiljeţja ( koja se ne obraĊuje na predavanjima ).

3.2.5. Medijan iznosi M = 2150 sati.

3.2.6. M = 3 poziva, Mo = 2 poziva dnevno. Navedene srednje vrijednosti mogu se oĉitati iz grafikona; mod

spuštanjem okomice s vrha krivulje na os x, a medijan iz grafiĉkog prikaza kumulativnog niza.

3.2.7. M = 90,77 km.

3.2.8. Mod se ne moţe odrediti ako razdioba nema vrha; u tabeli 3. jer su sve frekvencije jednake i iznose 1,

takoĊer ako su sve frekvencije jednake i iznose 2. U trećem sluĉaju razdioba ima dva moda, za treću i petu

vrijednost numeriĉkog obiljeţja.

3.2.9. Mo = 29,98 km.

3.2.10.

Tab. 3. X = 2150 sati , M = 2150 sati, Mo = nema ga

Tab. 4. X = 3,9 poziva, M = 3 poziva, Mo= 2 poziva

Tab. 5. X = 225,67 km, M = 90,77 km, Mo= 29,98 km.

Ako je razdioba simetriĉna onda sve tri srednje vrijednosti imaju jednaku vrijednost numeriĉkog obiljeţja; ako

X > M > Mo razdioba je desnostrano asimetriĉna, a u obrnutom sluĉaju ljevostrano asimetriĉna.

3.2.11. X = 95,15 %

3.2.12. Prosjeĉan iznos plaće po jednoj zaposlenoj osobi je prosjek aritmetiĉke sredine X = 2232,52 kn,

prosjeĉan postotak amortizacije je prosjek postotaka P = 39,15 %, a prosjeĉan iznos nabavne vrijednosti/1

zaposlenoj osobi je prosjek relativnih brojeva koordinacije R = 20 080 kn.

Page 26: Predavanja iz Statistike

26

3.3. Mjere disperzije

Pojam disperzije – mjere disperzije – vrste mjera disperzije – raspon varijacije –

varijanca, standardna devijacija – koeficijent varijacije – interkvartil – koeficijent

kvartilne devijacije – momenti .

Disperzija je pojam za raspršenost ĉlanova numeriĉkog niza od neke srednje

vrijednosti.

Mjere disperzije su veliĉine kojim se utvrĊuje veliĉina raspršenosti ĉlanova

numeriĉkog niza od neke srednje vrijednosti, odnosno utvrĊuje reprezentativnost srednjih

vrijednosti.

Apsolutne mjere disperzije su izraţene u istim jedinicama mjere kao i numeriĉko

obiljeţje. To su: raspon varijacije, varijanca, standardna devijacija, interkvartil. Njihov je

nedostatak što ne omogućuju usporedbu disperzije raznorodnih nizova.

Relativne mjere disperzije izraţene su u relativnim brojevima: koeficijent varijacije,

koeficijent kvartilne devijacije.

Raspon varijacije (R) je interval izmeĊu najveće i najmanje vrijednosti numeriĉkog

obiljeţja

R = xmax - xmin .

Varijanca (2) je aritmetiĉka sredina kvadrata odstupanja vrijednosti numeriĉkog

obiljeţja od njihove aritmetiĉke sredine. Izraţena je u istim jedinicama mjere kao i numeriĉko

obiljeţje.

Standardna devijacija ()

Standardna devijacija je prosjeĉno odstupanje pojedinaĉnih vrijednosti numeriĉkog

obiljeţja od aritmetiĉke sredine.

Ako je odstupanje maleno to ukazuje na malu raspršenost, odnosno disperziju ĉlanova

numeriĉkog niza od aritmetiĉke sredine iz ĉega slijedi dobra reprezentativnost aritmetiĉke

sredine. U obrnutom sluĉaju kad je disperzija velika, reprezentativnost aritmetiĉke sredine je

slaba.

Standardna devijacija se izraĉunava zavisno od tipa numeriĉkog niza:

Tip I.

2

1

( )N

i

i

x X

N

Page 27: Predavanja iz Statistike

27

Tip II.

2

2

1 1

1 1

n n

i i i i

i i

n n

i i

i i

f x f x

f f

Tip III.

2

2

1 1

1 1

n n

i i i i

i i

n n

i i

i i

f x f x

f f

gdje je:

– standardna devijacija

N – ukupan broj jedinica

xi – vrijednost numeriĉkog obiljeţja (ako je obiljeţje u razredima tada xi oznaĉava razrednu

sredinu, i=1,...,n)

X – aritmetiĉka sredina

fi – frekvencija, i=1,...,n

Koeficijent varijacije (V) je relativna mjera disperzije izraţena u % koja se

izraĉunava prema formuli

V = / X 100 .

Veći koeficijent varijacije pokazuje veću raspršenost, odnosno manju

reprezentativnost aritmetiĉke sredine. Koeficijent varijacije moţe i prijeći vrijednost 100% u

sluĉajevima kad se radi o veoma heterogenom nizu.

Interkvartil (Q3 – Q1)

Interkvartil je razlika izmeĊu gornjeg i donjeg kvartila. To je mjera disperzije kojom

se utvrĊuje reprezentativnost medijana kao srednje vrijednosti.

Donji kvartil (Q1) je vrijednost numeriĉkog obiljeţja za koju vrijedi da 25% (N/4)

jedinica u nizu ima vrijednost numeriĉkog obljeţja jednaku ili manju od donjeg kvartila i 75%

(3N/4) jedinica vrijednosti numeriĉkog obiljeţja jednaku ili veću od donjeg kvartila.

Gornji kvartil (Q3) je vrijednost numeriĉkog obiljeţja za koju vrijedi da 75% (3N/4)

jedinica u nizu ima vrijednost numeriĉkog obljeţja jednaku ili manju od gornjeg kvartila i

25% (N/4) jedinica s obiljeţjem jednakim ili većim od gornjeg kvartila.

Iz prethodnog proizlazi da je raspon izmeĊu donjeg i gornjeg kvartila interval unutar

kojeg se kreće vrijednost numeriĉkog obiljeţja za 50% jedinica u nizu i da se izmeĊu Q1 i Q3

nalazi medijan. Što je raspon izmeĊu donjeg i gornjeg kvartila manji, medijan je

reprezentativniji jer je zgusnutost oko medijana veća, i obrnuto.

Page 28: Predavanja iz Statistike

28

Izraĉunavanje interkvartila je analogno izraĉunavanju medijana, samo što se za donji

kvartil Q1 polazi od N/4 jedinica, a za Q3 od 3N/4 jedinica.

Za treći tip numeriĉkog niza koriste se formule:

3 1

1

1 1

kvart

1

3 1

kvart

/ 4

3 / 4

QI Q Q

N fQ L i

f

N fQ L i

f

gdje je:

IQ – interkvartil

Q1 – donji kvartil

Q3 – gornji kvartil

N – ukupan broj jedinica

L1 – donja granica kvartilnog razreda

1f –zbroj frekvencija u kumulativnom nizu do kvartilnog razreda, ne ukljuĉujući

frekvenciju kvartilnog razreda ( fkvart)

i – veliĉina kvartilnog razreda.

Koeficijent kvartilne devijacije (VQ) je relativna mjera disperzije i zauzima

vrijednosti od 0 do 1

3 1

3 1

Q

Q QV

Q Q

gdje je :

VQ – koeficijent kvartilne devijacije

Q1 – donji kvartil

Q3 – gornji kvartil.

Što je VQ bliţe 0, disperzija je manja a medijan reprezentativniji, i obrnuto.

Momenti su odstupanja vrijednosti numeriĉkog obiljeţja od aritmetiĉke sredine

podignutih na neku potenciju. Budući da se momenti koriste pri izraĉunavanju mjera

asimetrije bit će objašnjeni u poglavlju 3.4.

Page 29: Predavanja iz Statistike

29

VJEŢBA 3.3. Mjere disperzije numeričkih nizova

Zadatak 3.3.1. Ĉemu sluţe mjere disperzije? Kada se izraĉunavaju i u kojim se sluĉajevima

primjenjuju? Koja je razlika izmeĊu apsolutnih i relativnih mjera disperzije?

Zadatak 3.3.2. Koliki je raspon varijacije za numeriĉka obiljeţja u tabelama 3., 4. i 5.? Je li

moguće usporeĊivati raspon varijacije zadanih numeriĉkih nizova? Što znaĉi

raspon varijacije od 10000 kuna?

Zadatak 3.3.3. Za numeriĉke nizove u tabelama 3., 4. i 5. izraĉunati prosjeĉno odstupanje od

aritmetiĉke sredine. O kojoj mjeri disperzije je rijeĉ? Što se moţe zakljuĉiti za

aritmetiĉke sredine promatranih nizova?

Zadatak 3.3.4. Na koje je naĉine moguće izraĉunati standardnu devijaciju za tabelu 5.? U

kojim je jedinicama izraţena standardna devijacija za zadani primjer?

Provjeriti da se moţe doći do istog rezultata na dva naĉina. Usporediti

prednosti i nedostatke pojedinog naĉina izraĉunavanja standardne devijacije.

Zadatak 3.3.5. Je li moguće usporediti veliĉinu disperzije za zadane nizove u tabelama 3., 4. i

5., a na temelju rezultata iz zadatka 3.3.3.? Kada se koristi koeficijent varijacije

i koliko on iznosi za zadane nizove? Protumaĉiti što znaĉi kada koeficijent

varijacije iznosi 100%. Moţe li koeficijent varijacije biti i veći od 100%?

Zadatak 3.3.6. Grafiĉki odrediti vrijednost interkvartila za numeriĉke nizove u tabelama 3., 4.

i 5. Zašto interkvartil moţe posluţiti kao mjera disperzije? Što znaĉi ako za

neki numeriĉki niz donji kvartil iznosi 25, a gornji 35 godina starosti?

Zadatak 3.3.7. Na temelju grafikona iz zadatka 3.3.6. oĉitati ove vrijednosti:

1) Koliki broj sati utroši 3/4 skupina zaposlenika? Prelazi li ta vrijednost

prosjeĉan iznos utrošenih sati po jednoj skupini i za koliko se % razlikuje?

2) U kojem se intervalu kreće broj telefonskih poziva koji je ostvarila polovica

od ukupnog broja dana?

3) Do koje udaljenosti u kilometrima prelazi 3/4 od ukupne koliĉine tereta?

Odgovara li taj iznos 3/4 intervala u kojem se kreće vrijednost numeriĉkog

obiljeţja, tj. udaljenost?

Zadatak 3.3.8. Koliki je koeficijent kvartilne devijacije za nizove iz tabela 3., 4. i 5.? Što se

moţe zakljuĉiti o reprezentativnosti medijana?

Page 30: Predavanja iz Statistike

30

RJEŠENJA.

3.3.1. Mjere disperzije ispituju reprezentativnost srednjih vrijednosti; apsolutne mjere

disperzije su: raspon varijacije, standardna devijacija i interkvartil, a relativne mjere:

koeficijent varijacije i koeficijent kvartilne devijacije. Apsolutne su izraţene u istim

jedinicama mjere kao i numeriĉko obiljeţje, dok su relativne mjere disperzije izraţene

relativnim brojevima.

3.3.2. Raspon varijacije iznosi:

Tab. 3. 700 sati Tab. 4. 12 poziva Tab. 5. 1500 km.

Raspon varijacije je apsolutna mjera disperzije, zbog toga nije moguće usporeĊivati

disperziju raznorodnih nizova.

Preporuka: ako je raspon varijacije 10000 kuna, u praksi je korisnije navesti donju i

gornju granicu, primjerice, raspon od 20000 do 30000 kuna.

3.3.3. Standardna devijacija ( ) je prosjeĉno odstupanje od aritmetiĉke sredine:

Tab. 3. = 221,74 sati Tab. 4. = 2,76 poziva Tab. 5. = 302,37 km.

3.3.4. Za numeriĉke nizove tipa III. Standardna devijacija se moţe izraĉunavati na dva

naĉina: pomoću produkata fx, fx2 ili metodom linearne transformacije obiljeţja (koja nije

obraĊena na predavanjima). Standardna devijacija je apsolutna mjera disperzije i izraţena je u

istim jedinicama mjere kao i numeriĉko obiljeţje.

3.3.5. Na temelju rezultata iz zadatka 3.3.3. nije moguće usporeĊivati veliĉinu disperzije,

zato se preporuĉa izraĉunavanje odgovarajuće relativne mjere disperzije, a to je koeficijent

varijacije V:

Tab. 3. V = 10,31 % Tab. 4. V = 70,80 % Tab. 5. V = 134,23 %.

Koeficijent varijacije V pokazuje veliĉinu disperzije, odnosno raspršenost ĉlanova niza

u odnosu na X . Što je V veći to je disperzija veća, a reprezentativnost X manja; za V< 50%

X je dovoljno reprezentativna, a za vrijednosti V>50% aritmetiĉka sredina nije dovoljno

reprezentativna. Budući da V = / X 100, vrijednost V moţe prelaziti iznos od 100% i u tom

sluĉaju pokazuje nedovoljnu reprezentativnost aritmetiĉke sredine.

3.3.6. Vrijednosti interkvartila mogu se oĉitati iz grafiĉkog prikaza kumulativnog niza:

N/4 jedinica ima vrijednost numeriĉkog obiljeţja jednaku i manju od donjeg kvartila Q1,

3N/4 jedinica ima vrijednost numeriĉkog obiljeţja jednaku i veću od gornjeg kvartila Q3,

Q3 – Q1 je interkvartil; on predstavlja širinu intervala u kojem se kreće vrijednost numeriĉkog

obiljeţja za 50% od ukupnog broja jedinica. Širi interval pokazuje veću disperziju ĉlanova

numeriĉkog niza u odnosu na medijan, odnosno manju reprezentativnost medijana i obrnuto.

3.3.7. Na temelju grafikona iz zadatka 3.3.6. i prethodnih rezultata slijedi:

Page 31: Predavanja iz Statistike

31

1) X = 2150 sati, Q3 = 2300 sati; Q3 je veći od aritmetiĉke sredine za 7%.

2) Q3 – Q1 = 5 – 3 = 2 poziva

3) Q3 = 292,123 km. Taj iznos ne odgovara ¾ intervala u kojem se kreće udaljenost u

km; razlog je u ĉinjenici da tone tereta nisu ravnomjerno rasporeĊene prema

udaljenosti od 0 do 1500 km.

3.3.8. Koeficijent kvartilne devijacije iznosi:

Tab. 3. VQ = 0,07 Tab. 4. VQ = 0,43 Tab. 5. VQ = 0,81.

Medijan je reprezentativna srednja vrijednost za podatke u tabelama 3. i 4. MeĊutim,

za tabelu 5. nije dovoljno reprezentativan, ali u usporedbi s koeficijentom varijacije slijedi da

je M ipak reprezentativniji od X .

Page 32: Predavanja iz Statistike

32

3.4. Mjere asimetrije i zaobljenosti

Pojam asimetrije – mjere asimetrije – momenti ( oko sredine, oko nule ) – α3 ( alfa tri )

– Pearsonova mjera asimetrije – Bowleyova mjera asimetrije – mjera zaobljenosti – α4

( alfa četiri )

Asimetrija je pojam suprotan simetriji i pokazuje da se lijevi krak krivulje ne

preklapa s desnim krakom krivulje preko osi simetrije ( okomice s vrha krivulje ).

Mjere asimetrije

Mjere asimetrije su veliĉine kojim se utvrĊuje da li postoji simetrija ili

asimetrija te, u sluĉaju asimetrije, smjer i njezina jaĉina (veliĉina).

Prema smjeru (obliku) asimetrija je ljevostrana (negativna) ili desnostrana

(pozitivna), a prema jaĉini jaka (velika) ili slaba (manja).

Za utvrĊivanje asimetrije koriste se momenti.

Momenti oko sredine ili centralni momenti (µk) predstavljaju aritmetiĉku

sredinu odstupanja vrijednosti numeriĉkog obiljeţja od aritmetiĉke sredine podignutih

na neku potenciju, tj.

µk = N

1

n

i

fi1

( xi– X )k .

Na temelju prvog svojstva aritmetiĉke sredine za pozitivno asimetriĉnu

krivulju µ je veći od 0, za negativno asimetriĉnu krivulju µ je manji od 0, a za

simetriĉnu krivulju µ je jednak 0.

Momenti imaju svoj redni broj, a za mjerenje asimetrije uzima se treći moment

oko sredine µ3. Izraĉunava se pomoću momenata oko nule, jednostavnih ili vaganih,

ovisno o tipu numeriĉkog niza.

Alfa tri (α3) je mjera asimetrije koja se najĉešće koristi, a izraĉunava se

3

3 3

.

Mjera asimetrije α3 zauzima vrijednosti u pravilu u intervalu [–2 +2 ] ovisno

o obliku i jaĉini asimetrije:

Page 33: Predavanja iz Statistike

33

Izraĉunavanje µ3 prema tipu numeriĉkog niza:

Tip I.

µ3 = N

Xx )( = m3 – 3 m1 m2 + 2 m1

3

2 3 4

1 1 1 1 1

1 2 3 4, , , ,

N N N N Nk

i i i i i

i i i i i

k

x x x x x

m m m m mN N N N N

Napomena: izbrisati formulu za mk i m4 !

gdje je:

X – aritmetiĉka sredina

xi – vrijednost numeriĉkog obiljeţja

N – ukupan broj jedinica

m1 … mn – pomoćni momenti koji se koriste radi lakšeg izraĉunavanja momenata oko sredine;

kod numeriĉkog niza tipa I. radi se o jednostavnim pomoćnim momentima.

Tip II.

µ3 = m3 – 3 m1 m2 + 2 m13

2 3 4

1 1 1 1 1

1 2 3 4

1 1 1 1 1

, , , ,

n n n n nk

i i i i i i i i i i

i i i i i

k k n n n n

i i i i i

i i i i i

f x f x f x f x f x

m m m m m

f f f f f

Napomena: izbrisati formulu za mk i m4 !

m1 … mn – pomoćni momenti; za numeriĉki niz tipa II. izraĉunavaju se vagani pomoćni

momenti

fi – frekvencija

xi – vrijednost numeriĉkog obiljeţja.

Page 34: Predavanja iz Statistike

34

Tip III. Ako je aritmetiĉka sredina za zadani niz izraĉunata prema formuli 1

1

n

i i

i

n

i

i

f x

X

f

,

standardna devijacija prema formuli

2

2

1 1

1 1

n n

i i i i

i i

n n

i i

i i

f x f x

f f

, treći moment oko

sredine izraĉunava se pomoću vaganih pomoćnih momenata oko nule (kao za tip II.)

tako da se pridruţi kolona fx3:

µ3 = m3 – 3 m1 m2 + 2 m13

2 3 4

1 1 1 1 1

1 2 3 4

1 1 1 1 1

, , , ,

n n n n nk

i i i i i i i i i i

i i i i i

k k n n n n

i i i i i

i i i i i

f x f x f x f x f x

m m m m m

f f f f f

Napomena: izbrisati formulu za mk i m4 !

fi – frekvencija

xi – razredna sredina.

Pearsonova mjera asimetrije (Sk) je mjera asimetrije koja se zasniva na razlici

aritmetiĉke sredine i moda ili na razlici aritmetiĉke sredine i medijana. Zauzima vrijednosti u

intervalu [–3 +3 ] ovisno o obliku krivulje i jaĉini asimetrije:

1

2

3 ( )

o

k

k

X MS

X MS

Taj koeficijent ima vrijednost nula kod simetriĉne razdiobe, veću od nule a pozitivno i

manju od nule za negativno asimetriĉnu razdiobu. Jaka simetrija utjeĉe da se vrijednost Sk

pribliţava vrijednosti +3, odnosno –3.

Bowleyova mjera asimetrije (SkQ) se koristi za mjerenje asimetrije i to odnosa

izmeĊu medijana i kvartila koji se kreće u intervalu [–1 +1 ]

3 1

3 1

2kQ

Q M QS

Q Q

.

Ako je niz simetriĉan, ovaj koeficijent ima vrijednost nula. Što je niz jaĉe pozitivno

asimetriĉan SkQ se pribliţava vrijednosti +1, a kod jako negativno asimetriĉnih nizova

pribliţava se vrijednosti –1.

Page 35: Predavanja iz Statistike

35

Mjera zaobljenosti (α4)

Mjera zaobljenosti je veliĉina kojom se utvrĊuje zaobljenost promatranog

numeriĉkog niza. Za usporeĊivanje uzima se zaobljenost normalne krivulje za koju vrijedi da

je α4 = 3.

Alfa četiri α4 je mjera zaobljenosti koja se, analogno mjeri asimetrije α3, dobiva po

formuli

4

4 4

;

µ4 je ĉetvrti moment oko sredine koji se izraĉunava pomoću momenta oko nule

µ4 = m4 – 4m1 m3 + 6 m12 m2 – 3 m1

4 .

Izraĉunavanje momenata oko nule ovisi o rednom broju momenta i tipu numeriĉkog

niza, što je objašnjeno kod mjera asimetrije.

Za mjeru zaobljenosti α4 potrebno je dodatno izraĉunati ĉetvrti pomoćni moment oko

nule m4 (uz pretpostavku da su prvi, drugi i treći pomoćni moment izraĉunati kod mjera

asimetrije). Ĉetvrti pomoćni moment se raĉuna kao jednostavni za numeriĉke nizove tipa I. a

vagani za numeriĉke nizove tipa II. i tipa III.:

Upisati formulu!

Page 36: Predavanja iz Statistike

36

VJEŢBA 3.4. Mjere asimetrije i zaobljenosti

Zadatak 3.4.1. Koja se krivulja naziva simetriĉnom? Kakav oblik poprima krivulja ako nije

simetriĉna? Kako asimetrija utjeĉe na zakljuĉivanje o ponašanju frekvencija s

obzirom na vrijednost numeriĉkog obiljeţja? Što su mjere asimetrije?

Zadatak 3.4.2. Zašto se momenti mogu koristiti za mjerenje asimetrije? Po ĉemu se razlikuju

momenti oko sredine od momenata oko nule? Koji momenti dolaze u obzir pri

izraĉunavanju mjere asimetrije 3? Izraĉunati prvi, drugi i treći moment oko

nule za nizove u tabelama 3., 4. i 5.

Zadatak 3.4.3. Na temelju rezultata iz prethodnog zadatka izraĉunati odgovarajući moment

oko sredine potreban za 3. Prema dobivenoj vrijednosti zakljuĉiti radi li se o

desnostranoj ili ljevostranoj asimetriji.

Zadatak 3.4.4. Koliko iznosi mjera asimetrije 3 za promatrane nizove? Kakav zakljuĉak

proizlazi iz dobivenog rezultata? Što znaĉi ako je 3=0?

Zadatak 3.4.5. Kada se upotrebljava Bowleyova mjera asimetrije? Koje vrijednosti moţe

zauzeti ova mjera? Koliko ona iznosi za niz u tabeli 4.?

Zadatak 3.4.6. Koje su veliĉine uzete u obzir pri mjerenju asimetrije Pearsonovom mjerom

asimetrije? Što znaĉi ako ta mjera za neki niz iznosi +2,0? Izraĉunati

Pearsonovu mjeru asimetrije za niz u tabeli 5. Zakljuĉak o smjeru i jaĉini

asimetrije provjeriti na grafikonu iz zadatka 3.1.6.

Zadatak 3.4.7. Kakav oblik moţe imati razdioba frekvencija s obzirom na zaobljenost? Na

koji se naĉin mjeri zaobljenost? Kako izgleda krivulja ako ima 4=1,8, a kako

ona kojoj je 4=8,35? Napraviti skicu.

Zadatak 3.4.8. Izraĉunati 4 za nizove u tabelama 3., 4. i 5. Po ĉemu se razlikuje

izraĉunavanje? Kako se mogu izraĉunati momenti oko nule za niz u tabeli 5.?

Koristiti oba naĉina radi provjere rezultata. Moţe li 4 biti s negativnim

predznakom (manji od 0)? Obrazloţiti odgovore.

Zadatak 3.4.9. Usporediti za nizove u tabelama 3., 4. i 5. dobivene rezultate srednjih

vrijednosti, mjera disperzije, mjera asimetrije i mjere zaobljenosti. Utvrditi

znaĉajke svake promatrane pojave zasebno. Objasniti specifiĉnosti primjera za

niz iz tabele 3. O kakvom je nizu rijeĉ? Da li rezultati o asimetriji i

zaobljenosti potvrĊuju zakljuĉke dobivene ranije na temelju srednjih

vrijednosti?

Page 37: Predavanja iz Statistike

37

RJEŠENJA.

3.4.1. Krivulja je simetriĉna ako srednje vrijednosti , M i Mo imaju jednaku vrijednost,

odnosno ako se na grafikonu lijevi krak krivulje poklopi s desnim krakom krivulje

preko osi simetrije. Mjere asimetrije utvrĊuju veliĉinu i jaĉinu asimetrije.

3.4.2. Momenti se koriste za mjerenje asimetrije, budući da je ( x – X ) > 0 za pozitivno i

( x – X ) < 0 za negativno asimetriĉnu krivulju. Momenti oko sredine μk su

odstupanja od X , a za α3 se koristi µ3 koji se moţe izraĉunati pomoću momenata oko

nule:

Tab. 3. m1 = 2150 m2 = 4 671 666,66666 m3 = 102555*105

Tab. 4. m1= 3,9 m2= 22,8333 m3 = 171,05

Tab. 5. m1 = 225,27 m2 = 142 171,75 m3 = 129 411 744,17

3.4.3. Tab. 3 µ3 = 0 simetriĉna

Tab. 4. µ3 = 22,538 desnostrano asimetriĉna

Tab. 5. µ3 = 56 194 495,96 desnostrano asimetriĉna

3.4.4. Tab. 3. α3 = 0

Tab. 4. α3 = 1,07

Tab. 5 . α3 = 2,03

3.4.5. Tab. 4. SkQ = 0,333

3.4.6. Tab. 5. Sk1 = 0,646

3.4.7. α4 = 1,8 manje zaobljena od normalne

α4 = 8,35 šiljastija od normalne

3.4.8. Tab. 3. α4 = 2,14

Tab. 4. α4 = 3,72

Tab. 5. α4 = 6,69

3.4.9. Tab. 3. Simetriĉna krivulja sa srednjim vrijednostima u istoj toĉki na osi x; i M su

reprezentativne a krivulja je plosnatija od normalne krivulje.

Tab. 4. Desnostrano asimetriĉna krivulja; > M > Mo.

Tab. 5. Desnostrano asimetriĉna krivulja, vrlo šiljasta. Srednje vrijednosti nisu

dovoljno reprezentativne, jer je velika disperzija. Najviše se tona tereta prevozi na vrlo

kratkim udaljenostima.

Page 38: Predavanja iz Statistike

38

4. ANALIZA VREMENSKIH NIZOVA

4.1. Grafičko prikazivanje formiranje vremenskih nizova

vrste vremenskih nizova

vrste grafiĉkih prikaza

- površinski grafikon (histogram)

- linijski grafikon

korigirane frekvencije

okomiti prekid grafikona

vodoravni prekid grafikona

kumulativni niz

grafiĉko usporeĊivanje dvaju ili više vremenskih nizova.

Vremenski niz se dobiva grupiranjem statistiĉkih jedinica prema vremenskom

obiljeţju, a vremensko obiljeţje je svojstvo statistiĉke jedinice kojim je izraţeno vrijeme na

koje se odnosi statistiĉka jedinica.

Kod vremenskog niza se statistiĉke jedinice oznaĉavaju sa Yi, i = 1,…, N. Vremenska

jedinica moţe biti: 1 godina, 1 dan, 1 sat, 1 petogodišnje razdoblje, … . Razdoblje je širi

pojam od vremenske jedinice i predstavlja skup vremenskih jedinica, razdoblje od 2000. do

2005. godine se odnosi na 2000.,2001., …, do ukljuĉivo 2005. godinu.

Postoje dvije vrste vremenskih nizova: intervalni i trenutaĉni vremenski niz.

Intervalni vremenski niz je vrsta vremenskog niza kod kojeg se frekvencije dobivaju

postepenim zbrajanjem unutar intervala odabrane vremenske jedinice (1 dan, 1 godina,…).

Trenutačni vremenski niz je vrsta vremenskog niza kod kojeg zbrajanje frekvencija

nema realnog smisla pa se frekvencije vremenskog niza, odnosno broj statistiĉkih jedinica

dobiva snimanjem pojave u nekom odreĊenom trenutku (01.sijeĉnja, krajem mjeseca,

sredinom godine,…).

Vrste grafičkih prikaza:

Intervalni vremenski niz: Trenutaĉni vremenski niz:

- površinski grafikon - linijski grafikon

- linijski grafikon

Grafiĉki prikaz putnika u gradskom prijevozu… (zadatak 4.1.):

Page 39: Predavanja iz Statistike

39

Površinski grafikon je vrsta grafiĉkog prikaza u kojem se stupac podiţe iznad baze

odreĊene vremenske jedinice do visine koja je odreĊena frekvencijom vremenskog niza.

Linijski grafikon je vrsta grafiĉkog prikaza koji predstavlja liniju dobivenu

spajanjem toĉaka kod kojeg je svaka toĉka na grafikonu podignuta nad sredinom vremenske

jedinice (ako je vremenski niz intervalni), odnosno iznad onog mjesta na apscisi koje se

odnosi na trenutak kada je pojava snimljena (ako je vremenski niz trenutaĉni) do visine koja

je odreĊena frekvencijom vremenskog niza.

Korigirane frekvencije su potrebne kada su vremenske jedinice nejednake. One se

izraĉunavaju pomoću sljedeće formule

YY i

ic 0

,

gdje je:

Yc – korigirana frekvencija

i0 – osnovna veliĉina vremenske jedinice na koju se svode sve ostale jedinice

i – veliĉina vremenske jedinice koja pripada frekvenciji Y koja se korigira.

Korigiranje frekvencija dolazi u obzir samo za intervalne vremenske nizove.

Kumulativni niz je niz koji se dobiva postepenim zbrajanjem frekvencija vremenskog

niza, ali on se moţe dobiti samo za intervalni niz jer za trenutaĉni niz to zbrajanje nema

realnog smisla.

Vodoravni prekid grafikona (samo za linijske grafikone): preporuĉa se kad se

frekvencije kreću u jednom intervalu (rasponu), tako da se vodoravnim prekidom na osi y

dobiva veća duljina na ordinati za uţi interval pa se zbog toga postiţe zorniji prikaz kretanja

promatrane pojave.

Okomiti prekid grafikona (za površinske i linijske grafikone): prekid je paralelan s

osi y, a koristi se kada je zadan diskontinuirani niz vremenskih jedinica (1998., 2000.-2002.)

ili kada su vremenske jedinice razliĉite (2002.-2007., a zatim mjeseci 2008.).

Ako je zadan intervalni vremenski niz sa čestim prekidima izmeĎu vremenskih

jedinica tada se preporuĉa površinski grafikon s razmakom izmeĊu stupaca (bez oznake

prekida):

Page 40: Predavanja iz Statistike

40

Kad god je to moguće u jedan grafikon treba ucrtati frekvencije više pojava (i to

linijskim grafikonom), bilo da su ti vremenski nizovi intervalni ili trenutaĉni, a ne u više

zasebnih grafikona.

Grafičko usporeĎivanje vremenskih nizova (dvaju ili više vremenskih nizova-

intervalnih i/ili trenutaĉnih) je moguće pomoću aritmetiĉkog ili logaritamskog mjerila na osi

y.

Postoje tri sluĉaja:

statistiĉke jedinice su izraţene u istim jedinicama mjere aritmetiĉko mjerilo na

osi y, što znaĉi isti razmak izmeĊu jedinica mjere (0-100, 500-600), …

statistiĉke jedinice su izraţene u istim jedinicama mjere, ali na različitoj razini

logaritamsko mjerilo na osi y,

statistiĉke jedinice su izraţene u različitim jedinicama mjere logaritamsko

mjerilo na osi y.

Pravila za konstruiranje logaritamskog mjerila:

1. ne moţe poĉeti od nule, jer je log , a najmanji broj s kojim se poĉinje je 1

2. logaritamsko mjerilo završava s 10 puta većim brojem

3. duljina logaritamskog mjerila je proizvoljna i ovisi o veliĉini grafikona, a za naše uvjete

preporuĉa se veliĉina od 10 cm

4. interval od najmanjeg do najvećeg broja popunjava se s brojevima koji se nalaze u tom

intervalu koristeći logaritme.

5. preporuĉa se formirati osnovni logaritamski ciklus od 1 do 10

log 1 = 0

log 2 = 0,30

log 3 = 0,48

log 4 = 0,60

log 5 = 0,70

log 6 = 0,78

log 7 = 0,85

log 8 = 0,90

log 9 = 0,95

log 10 = 1

6. osnovni logaritamski ciklus se koristi za preraĉunavanje ciklusa koji odgovara zadanim

frekvencijama (100-1000, 35-350, …). Ako su frekvencije u intervalu od 13-200 tada

treba formirati dva ciklusa: od 10-100 i od 100-1000.

Page 41: Predavanja iz Statistike

41

VJEŢBA 4.1. GRAFIČKO PRIKAZIVANJE VREMENSKIH NIZOVA

Zadatak 4.1.1. Navesti statistiĉke jedinice i vremensko obiljeţje za nizove prikazane u

tabelama 6. i 7. Odrediti vrstu vremenskog niza. Obrazloţiti odgovore.

Zadatak 4.1.2. Grafiĉki prikazati broj prevezenih putnika u gradskom prijevozu Republike

Hrvatske u razdoblju od 1991. do 2001. godine površinskim grafikonom. Kada

je poţeljno u linijskom grafikonu vodoravno prekinuti ordinatu? Usporediti

površinski s linijskim grafikonom te linijskim grafikonom koji je vodoravno

prekinut. Koji je od ta tri grafikona sada najpregledniji? Obrazloţiti odgovor.

Zadatak 4.1.3. Izraĉunati broj prevezenih putnika u gradskom prijevozu Republike Hrvatske u

razdoblju od 1991. do 1995. godine i od 1996. do 2001. godine. Koliko je

prevezeno putnika u gradskom prijevozu Republike Hrvatske u razdoblju od

1991. do 2001. godine? Kumulativne frekvencije prikazati odgovarajućim gra-

fikonom. Zašto je linija grafikona uzlazna?

Zadatak 4.1.4. Grafiĉki prikazati na jednom grafikonu broj prevezenih putnika u gradskom i

zraĉnom prijevozu u Republici Hrvatskoj u razdoblju od 1991. do 2001.

godine. Nacrtati grafikon s aritmetiĉkim i logaritamskim mjerilom na osi

ordinate. Obrazloţiti dobivenu sliku i odabrati odgovarajući grafikon na kojem

je moguće usporeĊivati relativne promjene broja putnika u gradskom i

zraĉnom prijevozu.

Zadatak 4.1.5. Prikazati na odgovarajućem grafikonu kretanje broja kontejnerskih brodova i

TEU u svijetu u razdoblju od 1992. do 2001. godine. Odgovoriti, na temelju

grafikona, je li u promatranom razdoblju brţe rastao broj brodova ili iznos

TEU. Koji zakljuĉak slijedi iz prethodnog odgovora?

Page 42: Predavanja iz Statistike

42

RJEŠENJA.

4.1.2. Preporuĉa se linijski grafikon sa vodoravnim prekidom na ordinati.

4.1.3. Kumulativni niz:

1991. – 1995. 20922 mil. putnika

1996. – 2001. 23424 mil. putnika

1991. – 2001. 44346 mil. putnika.

Kumulativni niz “manje od” prikazuje se linijskim grafikonom kod kojeg se frekvencija

kumulativnog niza ucrtava nad gornjom granicom promatrane vremenske jedinice.

4.1.4. Putnici u gradskom i zraĉnom prijevozu su dvije statistiĉke mase izraţene u istim

jedinicama mjere, ali na razliĉitoj razini, zato je potrebno koristiti logaritamsko mjerilo

na osi y.

Predlaţe se mjerilo:

- gradski prijevoz 50-500 putnika

- zraĉni prijevoz 130-1300 putnika.

4.1.5. Broj kontejnerskih brodova su statistiĉke mase izraţene u razliĉitim jedinicama mjere,

zbog toga je potrebno takoĊer koristiti logaritamsko mjerilo.

Predlaţe se mjerilo:

- brodovi 300 - 3000

- TEU 500 – 5000

Page 43: Predavanja iz Statistike

43

4.2. Indeksi

pojam indeksa

vrste indeksa

veriţni indeksi

baziĉni indeksi

preraĉunavanje indeksa

skupni indeksi

Indeks je relativan broj koji se dobije usporeĊivanjem dviju ili više frekvencija

vremenskog niza (frekvencije Yi, i = 1,2,…, N), tj.

IY

Y

1

2

100 ,

gdje su Y1 i Y2 frekvencije jedne te iste pojave, ali koje pripadaju razliĉitim

vremenskim jedinicama. Frekvencija koja je baza usporedbe nalazi se u nazivniku.

Y1 = Y1998

Y2 = Y1995 IY

Y

1998

1995

100

Y Y I

Y Y I

Y Y I

1 2

1 2

1 2

100

100

100

Indeks je neimenovan broj i on pokazuje koliko se frekvencija u brojniku razlikuje od

frekvencije u nazivniku, a ta je razlika izraţena u postocima.

Primjerice, I = 250 znaĉi da je Y1 > Y2 za 150% ili 2,5 puta

I = 100 znaĉi da je Y1 = Y2

I = 87 znaĉi da je Y1 < Y2 za 13 %.

Vrste indeksa:

Individualni – veriţni i baziĉni

Skupni.

Individualni indeks je indeks u kojem se jedna frekvenciju (u brojniku) usporeĊuje s

jednom frekvencijom (u nazivniku) za razliku od skupnog indeksa kod kojega se više

frekvencija jedne vremenske jedinice usporeĊuju s više jedinica druge vremenske jedinice

odabrane za bazu usporedbe.

Veriţni indeksi se nazivaju i indeksima s promjenljivom bazom, jer se frekvencija

neke vremenske jedinice usporeĊuje s frekvencijom prethodne vremenske jedinice:

NiY

YiI

i

,...,2,1001

Page 44: Predavanja iz Statistike

44

God. Yi Veriţni indeks Indeks 1998. = 100

1988. 100

1989. I

Y

Y

1989

1988

100 120 120

1990. 95 89

1991. 100 150

:

Grafički prikaz veriţnih indeksa:

Bazni indeksi su indeksi sa stalnom bazom. Proizvoljno se odabire ili je zadana

vremenska jedinica za bazu usporedbe; u brojniku je frekvencija i-te vremenske jedinice, a u

nazivniku frekvencija one vremenske jedinice koja je odabrana za bazu usporedbe:

IY

Y

i

B

100 , i = 1,…, N

Grafički prikaz baznih indeksa:

Preračunavanje indeksa je prevoĊenje baznih indeksa u veriţne i obrnuto ili

prevoĊenje baznih s jedne vremenske jedinice na drugu:

1. veriţni indeksi u bazne indekse na bazi prve vremenske jedinice:

100113

4

2

3

1

2 Y

Y

Y

Y

Y

Y

Y

Y

Y

Y i

i

i

2. bazni indeksi (na bazi prve vremenske jedinice) na bazu neke druge vremenske

jedinice

100100100: 1

111

B

i

B

iBi

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

3. bazni indeksi (na bazi prve vremenske jedinice) veriţne indekse

100100100:11

1

11

1

1

i

i

i

iii

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

Page 45: Predavanja iz Statistike

45

Kod skupnih indeksa se javlja mogućnost da se usporedi više frekvencija

jedne vremenske jedinice sa više frekvencija druge vremenske jedinice. Te se frekvencije

odnose na više pojava, ali samo onih ĉije usporeĊivanje ima smisla. Od skupnih indeksa

najĉešći je indeks vrijednosti proizvodnje:

IV – indeks vrijednosti proizvodnje

Vrijednost proizvodnje izvještajnog razdoblja p1·q1 , 1 = izvještajno razdoblje

Vrijednost proizvodnje baznog razdoblja p0·q0 , 0 =baziĉno razdoblje

Ip q

p qV

1 1

0 0

100

Primjerice, ako je IV = 110 to znaĉi da je vrijednost proizvodnje porasla za +10%, ali

na temelju tog rezultata nije moguće odgovoriti koliki je u tom porastu udio cijena (pi), a

koliki udio koliĉina (qi). Zbog toga je potrebno izraĉunati skupni indeks cijena i skupni indeks

koliĉina:

1. Ip q

p qK

0 1

0 0

100 1. Ip q

p qC

1 0

0 0

100

2. Ip q

p qK

1 1

1 0

100 2. Ip q

p qC

1 1

0 1

100

IK – indeks koliĉina pokazuje promjenu koliĉina izvještajnog u odnosu na bazno razdoblje

IC – indeks cijena pokazuje promjenu cijena izvještajnog u odnosu na bazno razdoblje

IV = IK · IC

p q

p q

p q

p q

p q

p q

0 1

0 0

1 1

0 1

1 1

0 0

Primjeri skupnih indeksa:

tone x kilometri = tkm

putnici x kilometri = pkm

Page 46: Predavanja iz Statistike

46

VJEŢBA 4.2. Indeksi vremenskih nizova

Zadatak 4.2.1. Izraĉunati promjene broja prevezenih putnika u gradskom i zraĉnom prijevozu

Republike Hrvatske pojedine godine u odnosu na 1991. Objasniti naĉin

odabiranja frekvencije koja je uzeta za bazu usporedbe. Što se dogaĊa, ako se

za bazu uzme frekvencija neke druge vremenske jedinice?

Zadatak 4.2.2. Rezultate iz prethodnog zadatka prikazati odgovarajućim grafikonom.

Usporediti gradski sa zraĉnim prijevozom.

Zadatak 4.2.3. Jesu li godišnje promjene broja putnika u gradskom i zraĉnom prijevozu

Republike Hrvatske u razdoblju od 1991. do 2001. bile ravnomjerne? Koje je

godine zabiljeţen najveći porast odnosno pad broja prevezenih putnika u

odnosu na prethodnu godinu? Pokušati naći razloge zbog kojih je došlo do

takvih promjena.

Zadatak 4.2.4. Na temelju podataka iz tabele 7. usporediti godišnje promjene broja

kontejnerskih brodova i TEU u svijetu u odnosu prema prethodnoj godini.

Rezultate prikazati odgovarajućim grafikonom.

Zadatak 4.2.5. Rezultate iz zadatka 4.2.4. preraĉunati na 1992. godinu kao bazu. Da li je u

razdoblju od 1992. do 2001. godine brţe rastao broj brodova ili iznos TEU?

Zakljuĉak povezati sa zakljuĉkom iz zadatka 4.1.5.

Zadatak 4.2.6. Izraĉunati relativne promjene cijena, koliĉina i vrijednosti proizvodnje

izvještajnog razdoblja (1996.) u odnosu na bazno razdoblje (1990.), ako je

zadano:

Proizvod 1990. 1996.

Koliĉina Vrijednost Koliĉina Vrijednost

A 28 5 800 34 7 400

B 39 8 000 47 10 200

C 21 4 400 23 5 000

Ukupno 88 18 200 104 22 600

Obrazloţiti dobivene rezultate.

Page 47: Predavanja iz Statistike

47

RJEŠENJA. 4.2.1.

Godina 1991. 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.

Gradski 100 98 97 98 96 92 93 89 90 91 93

Zraĉni 100 171 365 476 488 593 623 662 666 771 896

4.2.2. Bazni indeksi se prikazuju linijskim grafikonom, a budući da su indeksi

neimenovani brojevi, preporuĉa se ucrtati indekse za gradski i zraĉni prijevoz u jedan

grafikon. Usporedbom linija dobit će se odgovarajući zakljuĉak o promjenama broja putnika u

gradskom i zraĉnom prijevozu u odnosu na 1991. godinu.

4.2.3.

Godina 1991. 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.

Gradski – 98 99 98 96 92 93 89 102 101 102

Zraĉni – 171 213 130 103 121 105 106 101 116 116

Najveći je porast zabiljeţen u zraĉnom prijevozu 1993. u odnosu na 1992. godinu

(+113%), a najveći pad u gradskom prijevozu 1998. u odnosu na 1997. godinu (–11%).

4.2.4.

Godina 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.

Brodovi – 103 110 110 111 112 109 103 105 106

TEU – 108 112 114 114 117 113 106 110 113

Veriţni se indeksi takoĊer prikazuju linijskim grafikonom, ali za razliku od baznih

indeksa koji imaju stalnu bazu, veriţni indeksi su s promjenljivom bazom pa se indeksi

prikazuju izlomljenim linijama. I u ovom sluĉaju indeksi za obje pojave se prikazuju na

jednom grafikonu što omogućuje usporedbu promjena u odnosu na prethodnu godinu za jednu

i drugu pojavu.

4.2.5.

Godina 1992. 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.

Brodovi 100 103 113 125 138 155 168 174 183 195

TEU 100 108 121 137 157 183 207 219 241 271

U promatranom razdoblju brţe je rastao iznos TEU nego broj kontejnerskih brodova

na temelju ĉega se zakljuĉuje da je tijekom promatranog razdoblja rastao iznos TEU/1 brodu.

4.2.6.

p1· q1= 22600 IV = 124,176 IK 1 = 105,929 IC 1 = 105,072

p0·q0 = 18200 IK 2 = 118,181 IC 1 = 117,225

p0·q1 = 19279,120 Iv = 118,181 x 105,072 /

100 = 124,175

p1·q0 = 19123,146 Iv = 105,929 x 117,225 / 100 = 124,175

Page 48: Predavanja iz Statistike

48

4.3. Srednje vrijednosti vremenskih nizova

pojam srednje vrijednosti

vrste srednjih vrijednosti

prosjeĉna ordinata

kronološka sredina

geometrijska sredina

Niz A je oscilirajući, a nizovi B i C su nizovi koji pokazuju tendenciju rasta, odnosno

pada.

Srednja vrijednost je frekvencija vremenskog niza koja reprezentira sve

pojedinaĉne vrijednosti vremenskog niza i izraţena je u onim jedinicama mjere u kojima su

zadane frekvencije.

Vrste srednjih vrijednosti: prosjeĉna ordinata, kronološka sredina i

geometrijska sredina. Uporaba pojedine srednje vrijednosti ovisi o tendenciji kretanja

frekvencija i vrsti vremenskog niza:

vrsta v. niza oscilirajući (A) tendencija rasta ili pada (B i C)

intervalni v.niz prosjeĉna ordinata Y

geometrijska sredina G

trenutaĉni v.niz kronološka sredina Y

Prosječna ordinata se izraĉunava po formuli za jednostavnu aritmetiĉku

sredinu. To je prosjeĉna vrijednost frekvencije po jednoj zadanoj vremenskoj jedinici

(godina,…), a koristi se za oscilirajuće intervalne vremenske nizove:

Y

Y

N

ii

N

1

Y = prosjeĉan broj jedinica/ 1 vremenskoj jedinici

Y = prosjeĉan broj putnika/godišnje prevezen u gradskom i zraĉnom prijevozu…

Kronološka sredina je takoĊer prosjeĉna vrijednost frekvencija vremenskog

niza, ali koja se izraĉunava za oscilirajuće trenutaĉne vremenske nizove

Y

p Y

p

i i

i

N

i

i

N

1

1

, p Yi ii

N

1

- suma ponderiranih stanja

Y = prosjeĉan broj jedinica/1 vremenskoj jedinici

Y = prosjeĉan broj brodova ili TEU/godišnje …

Page 49: Predavanja iz Statistike

49

Ponder (p) je broj koji treba odrediti ovisno o trenutku kada je pojava snimana. Ako

je dano stanje poĉetkom ili krajem vremenske jedinice (godine), tada prva i posljednja

jedinica imaju ponder 0,5 a sve ostale imaju ponder 1.

Ako je zadano stanje 30.06. onda svaka vremenska jedinica ima ponder 1 i u tom se

sluĉaju trenutaĉni niz svodi na intervalni vremenski niz.

Ponder je potrebno odrediti iz razloga što se svako stanje trenutaĉnog niza odnosi na

jedan odreĊeni trenutak, a s ponderom se “pokrije” interval izmeĊu dva snimanja pojave. Pri

odreĊivanju pondera uzima se pretpostavka da je razina pojave u trenutku snimanja t ista do

polovine intervala t+1 odnosno do polovine intervala t-1 s tim da ti intervali mogu biti

meĊusobno jednaki ili nejednaki.

Stanje 30.06. Stanje 01.01.

Stanje 31.12. Stanje 30.6.

Nejednaki intervali

Geometrijska sredina (G) je srednja vrijednost koja se izraĉunava za bilo

intervalne ili trenutaĉne nizove koji pokazuju tendenciju rasta ili pada. Geometrijska sredina

je broj kojim se odreĊuje veliĉina rasta ili pada za promatranu vremensku jedinicu. To je

srednja vrijednost koja predstavlja prosjeĉnu stopu kretanja promatranog vremenskog niza i

koja se odnosi na promatranu vremensku jedinicu.

God. Yi Veriţni indeks

1. 2. Y2 / Y1

3. Y3 / Y2

4. Y4 / Y3

:

:

N YN / YN–1

Geometrijska sredina je prosjek veriţnih indeksa

Y

Y

Y

Y

Y

Y

Y

Y

N

N

N2

1

3

2

4

3 1

1

iz ĉega slijedi konaĉna formula za izraĉunavanje geometrijske sredine

Page 50: Predavanja iz Statistike

50

GY

Y

NN

1

1

GY

Y 4

1

3

G > 1 – pokazuje tendenciju rasta 1,05 +5 %

G < 1 – pokazuje tendenciju pada 0,94 -6 %

G – prosjeĉna godišnja stopa rasta ili pada; ona se izraĉunava prema X % = G ·100–

100.

Primjer: X % = 1,05 ·100–100 = + 5 % godišnja stopa rasta za promatranu pojavu.

God. Yi

1988. Y1

1989.

1990.

1991. Y4

Page 51: Predavanja iz Statistike

51

VJEŢBA 4.3. Srednje vrijednosti vremenskih nizova

Zadatak 4.3.1. Koje se srednje vrijednosti mogu izraĉunati za vremenske nizove prikazane u

tabelama 6. i 7.? Objasniti odabiranje srednjih vrijednosti za intervalne i

trenutaĉne nizove.

Zadatak 4.3.2. Izraĉunati prosjeĉni godišnji broj prevezenih putnika u zraĉnom prijevozu

Republike Hrvatske na temelju podataka za razdoblje od 1991. do 2001.

Koliko broj prevezenih putnika 2001. godine odstupa od izraĉunatog prosjeka?

Zadatak 4.3.3. Izraĉunati prosjeĉni godišnji broj brodova svjetske kontejnerske flote na

temelju podataka za razdoblje od 1992. do 2001. godine. To isto uĉiniti i za

iznos TEU. Objasniti razliku izraĉunavanja godišnjeg prosjeka u odnosu na

prethodni zadatak. Koliko je odstupanje broja brodova i iznosa TEU u 2001.

godini od izraĉunatog prosjeka?

Zadatak 4.3.4. Izraĉunati prosjeĉnu godišnju stopu kretanja broja prevezenih putnika u

gradskom i zraĉnom prijevozu u razdoblju od 1991. do 2001. godine.

Usporediti gradski sa zraĉnim prijevozom.

Zadatak 4.3.5. U razdoblju od 1991. do 2001. godine mogu se za prevezene putnike u

gradskom i zraĉnom prijevozu uoĉiti razliĉite tendencije. Usporediti prosjeĉnu

stopu kretanja za razdoblje od 1991. do 1995. godine sa stopom kretanja iz

prethodnog zadatka za razdoblje od 1991. do 2001. godine. Obrazloţiti

dobivene rezultate.

Zadatak 4.3.6. Izraĉunati prosjeĉnu godišnju stopu kretanja za brodove i iznos TEU u svijetu

za razdoblje od 1992. do 2001. godine. Je li brţe rastao broj brodova ili iznos

TEU? Zakljuĉak usporediti s grafikonom iz zadatka 4.1.5.

Zadatak 4.3.7. Pomoću prosjeĉne godišnje stope iz prethodnog zadatka procijeniti broj

brodova i iznos TEU koji se mogu oĉekivati u 2005. godini. Pod kojim

uvjetima vrijedi ta procjena?

Page 52: Predavanja iz Statistike

52

RJEŠENJA.

4.3.2. Y = 734,27 tisuća putnika godišnje; prosjeĉan godišnji broj prevezenih putnika veći je

9,5 % od godišnjeg prosjeka za razdoblje od 1991. - 2001. godine.

4.3.3.Y = 2053 broda godišnje

Y = 33900 TEU godišnje

4.3.4. Gradski prijevoz, G = 0,9993; godišnja stopa pada 0,7 %

Zraĉni prijevoz, G = 1,245; godišnja stopa rasta 24,5 %

4.3.5. Razdoblje od 1991.- 1995.

Gradski prijevoz, G = 0,991; godišnja stopa pada 0,9 %

Zraĉni prijevoz, G = 1,487; godišnja stopa rasta 48,7 %

4.3.6. Brodovi, G = 1,077; godišnja stopa rasta 7,7 %

TEU, G = 1,1173; godišnja stopa rasta 11,74 %

4.3.7. Procjena za 2005. godinu

Brodovi Y2005 = 3708 brodova

TEU Y2005 = 8288 TEU

Page 53: Predavanja iz Statistike

53

4.4. TREND pojam trenda

vrste trendova

metoda najmanjih kvadrata

vrijednost trenda

grafiĉko prikazivanje trenda

Trend je linija (pravac ili krivulja) koja oznaĉava tendenciju kretanja pojave u

promatranom razdoblju.

Vrste trendova :

linearni (linijski) trend koji ima oblik pravca i

krivolinijski trend koji ima oblik krive linije.

Metoda najmanjih kvadrata je metoda pomoću koje se izraĉunavaju parametri

linearnog ili krivolinijskog trenda. Polazna je pretpostavka da je trend linija koja se najbolje

moguće prilagoĊava zadanim frekvencijama vremenskog niza, tj. da je suma kvadrata

odstupanja (Y – YC) minimalna.

Vrijednost trenda YC se odreĊuje tako da se u jednadţbu trenda za X uvrsti ona

vrijednost koja pripada vremenskoj jedinici za koju se izraĉunava vrijednost trenda. Za

kontrolu iY = CY .

4.4.1. Linearni trend

jednadţba linearnog trenda

odreĊivanje vrijednosti X

tumaĉenje jednadţbe trenda

grafiĉko prikazivanje linearnog trenda

analiza varijance

procjena pomoću jednadţbe trenda

Linearni trend je pravac kojim se odreĊuje tendencija kretanja pojave u promatranom

razdoblju.

Jednadţba linearnog trenda

Y a bXC

bXY Y X

X X X

2

a Y bX

Za jednadţbu linearnog trenda potrebno je imati sljedeće podatke:

Page 54: Predavanja iz Statistike

54

Godina iY iX 2

iX iiYX

Vrijednost

trenda YC

1991.

Ukupno iY iX 2

iX

iiYX

iC YY

N

YY

i ( za intervalne) Y =

i

ii

p

yp( za trenutaĉne nizove ) X =

N

X i

OdreĎivanje vrijednosti X

Vrijednost X se odreĊuje zavisno od ishodišta koje je zadano ili se proizvoljno

odabire. Ako je ishodište u sredini razdoblja onda ona vremenska jedinica koja je u sredini

razdoblja ima vrijednost X=0, a sve one kasnije imaju pozitivne vrijednosti X, dok one ranije

od ishodišta poprimaju negativne predznake.

INTERVALNI NIZOVI; vrijednosti X se odreĊuju u odnosu na 30.06. pojedine

godine, odnosno na sredinu zadane vremenske jedinice.

1. Ishodište u sredini

neparan broj vremenskih jedinica

God. Yi X

1990. -1

1991. 0

1992. +1

X = 0

paran broj vremenskih jedinica

God. Yi X

1990. -1,5

1991. -0,5

1992. +0,5

1993. +1,5

X = 0

diskontinuirani niz vremenskih jedinica

God. Yi X

1990. -2,5

1991. -1,5

1993. +0,5

1994. +1,5

1995. +2,5

X 0

Page 55: Predavanja iz Statistike

55

Vaţno:

dulji oblik formula za YC i treba uzeti u obzir i one godine koje nisu zadane u tabeli.

2. ishodište nije u sredini

God. Yi Ishodište

30.06.’90.

ishodište

30.06.’92.

Ishodište

01.01.’90.

1990. 0 -2 +0,5

1991. +1 -1 +1,5

1992. +2 0 +2,5

1995. +5 +3 +5,5

Zaključak o mogućim slučajevima:

- paran broj vremenskih jedinica

- neparan broj vremenskih jedinica

- ishodište na poĉetku razdoblja

- ishodište neka druga vrijednost

- kontinuiran niz vremenskih jedinica

- diskontinuiran niz vremenskih jedinica

- ishodište 30.06. neke godine

- ishodište bilo koji datum

TRENUTAČNI NIZOVI ; vrijednost X-a se uvijek preraĉunava na stanje kada je

pojava snimana (01.01., 31.03., krajem godine, sredinom godine,…)

ishodište u sredini razdoblja

ishodište izvan sredine razdoblja

paran ili neparan broj jedinica

prva vremenska jedinica ili neka druga

diskontinuirani ili kontinuirani niz vremenskih jedinica

stanje

01.01.

Yi ishodište u

sredini

1990. -2,5

1991. -1,5

1993. +0,5

1995. +2,5

X 0

VAŢNO:

Ako je X = 0, tada se jednadţba linearnog trenda izraĉunava pomoću ovih

formula:

CY = a + bX

Page 56: Predavanja iz Statistike

56

bXY

X 2

, a Y .

Tumačenje jednadţbe trenda a - prosjeĉna razina pojave, odnosno prosjeĉan broj jedinica / 1 vremenskoj jedinici (godi-

šnje, …)

b - prosjeĉan pad ili rast izraţen u apsolutnim jedinicama / po 1 vremenskoj jedinici (godi-

šnje, …).

Ako ishodište nije u sredini razdoblja onda parametar a nije prosjeĉan broj jedinica.

Primjer:

Na temelju podataka o broju prevezenih putnika u gradskom prijevozu RH u razdoblju

od 1991. – 2001. godine dobivena je jednadţba linearnog trenda koja glasi:

XYC 05,415,403

ishodište: 30.06.1996.

jedinica X- 1 godina

jedinica Y- 1 milijun putnika.

U promatranom razdoblju od 1991. – 2001. godine prosjeĉan godišnji broj prevezenih

putnika u gradskom prijevozu RH je iznosio 403,15 milijuna putnika, a prosjeĉan godišnji pad

prevezenih putnika bio je 4,05 milijuna putnika.

Grafičko prikazivanje linearnog trenda

Parametar b je koeficijent smjera linearnog trenda:

ako b > 0 trend je uzlazni, ako b < 0 trend je silazni.

Linearni trend je pravac za koji su dovoljne dvije vrijednosti trenda.

Analiza varijance je metoda kojom se ispituje reprezentativnost trenda.

Page 57: Predavanja iz Statistike

57

2 2 ( )Y Y / N - ukupna varijanca

p CY Y2 2 ( ) / N- protumaĉena varijanca

np CY Y2 2 ( ) / N- neprotumaĉena varijanca

2 2 2 p np

Trend će biti reprezentativniji što je protumaĉena varijanca ( p

2 ) veća odnosno

neprotumaĉena varijanca (np

2 ) manja.

X % - stupanj protumaĉenosti trenda izraĉunava se prema formulama

(1) Xp

%

2

2 100 ili (2) Xnp

%

2

2 100 , 0 < X % < 100.

Reprezentativnost trenda je bolja (veća) kad je X% veći broj po (1), odnosno manji

broj po (2).

Ukupna, protumaĉena i neprotumaĉena varijanca se izraĉunavaju po formulama:

2

2 2

( )Y Y

N

Y Y Y

N

p

CY Y

N

a Y b XY Y Y

N

2

2

( )

np

CY Y

N

Y a Y b XY

N

2

2 2

( )

.

Procjena pomoću trenda; ako je linearni trend reprezentativan onda se

jednadţba trenda moţe koristiti za procjenu, tj. za izraĉunavanje oĉekivane frekvencije za

vremensku jedinicu koja je zadana ili odabrana. Ta procjena, doduše, vrijedi za pojavu za koju

se moţe prihvatiti da će se u budućnosti kretati istim tempom kao i dosad.

Page 58: Predavanja iz Statistike

58

putnikamilY

Y

XY

bXaY

C

C

.7,366

905,415,403

05,415,403

2005

2005

Page 59: Predavanja iz Statistike

59

4.4.2. Krivolinijski trend

Krivolinijski trend je kriva linija koja pokazuje tendenciju kretanja pojave u

promatranom razdoblju.

Vrste krivolinijskih trendova ovise o izboru matematiĉke krivulje koja se

dobro prilagoĊava empirijskim frekvencijama. Uzeti su u obzir samo ovi sluĉajevi:

krivolinijski trend pomoću pomiĉnih prosjeka,

paraboliĉni trend II. stupnja,

eksponencijalni trend.

Krivolinijski trend pomoću pomičnih prosjeka dolazi u obzir ako frekvencije

vremenskog niza ne pokazuju kretanje po nekoj poznatoj krivulji. Pomiĉni prosjeci se

izraĉunavaju da se zbrajaju frekvencije za tri ili više vremenskih jedinica (najĉešće tri),

dobivaju se tzv. trogodišnji totali (ili višegodišnji), te se na kraju dobiveni totali podijele s

brojem frekvencija koje su ušle u zbroj.

God. Yi Trogodišnji totali Pomiĉni prosjeci

1990. Y1 = 20

1991. Y2 = 15 Yii

1

3

41 Yii

1

3

3 13: ,7

1992. Y3 = 6 Yii

2

4

29 Yi

i

2

4

3 9: ,7

1993. Y4 = 8 Yii

3

5

24 Yi

i

3

5

3 8:

1994. Y5 = 10

Prednosti:

neparametarska metoda koja je jednostavna jer ne zahtijeva nikakvu jednadţbu,

metoda za nepravilna kretanja, tj. kod kojih se ne mogu koristiti matematiĉke krivulje.

Nedostatak:

ne moţe se koristiti za ekstrapolaciju (za procjenu frekvencije neke vremenske

jedinice).

Grafički prikaz pomičnih prosjeka

Page 60: Predavanja iz Statistike

60

Parabolični trend (parabola II. stupnja)

Ova vrsta trenda se dobro prilagoĊava vremenskom nizu koji u svom kretanju

pokazuje jednu izrazitu izboĉinu ili udubljenje, odnosno koji ne pokazuje linearno

kretanje(rast ili pad) po pravcu.

Jednadţba parabole II. stupnja

Y a bX cXC 2

a, b, c, - parametri

Ishodište na poĉetku razdoblja

Y N a b X c X

XY a X b X c X

X Y a X b X c X

2

2 3

2 2 3 4

Ishodište u sredini razdoblja ( X X 0 03, )

Y N a c X

XY b X

X Y a X c X

2

2

2 2 4

Na temelju prethodnog izraza izvedene su formule pomoću kojih se mogu izraĉunati

parametri a, b, c:

aY X X YX

N X X X

4 2 2

4 2 3 b

XY

X 2

cN YX X Y

N X X X

2 2

4 2 2

Radna tabela za izraĉunavanje parabole II. stupnja ima ove stupce:

Godina Yi Xi Xi2

Xi4 Xi Yi Xi

2Yi

Vrijednosti

trenda YC

1991. 108 107,43

1992. 106 104,57

1993. 104 107,00

1994. 111 114,71

1995. 134 127,71

1996. 146 146,00

1997. 168 169,57

Ukupno 877 0 28 196 290 3730 876,99

Jednadţba parabole II. stupnja za navedeni primjer glasi:

Yc= 114,71428 + 10,357 X + 2,642857 X2.

Page 61: Predavanja iz Statistike

61

Analiza varijance je metoda kojom se ispituje reprezentativnost dobivenog trenda:

2

2

( )Y Y

N , p

CY Y

N

2

2

( )

, np

CY Y

N

2

2

( )

, Xp

%

2

2 100 .

Grafički prikaz parabole II. stupnja

Eksponencijalni trend je jedna vrsta krivolinijskog trenda koja se koristi za pojave

koje se ponašaju prema eksponencijalnoj krivulji.

Jednadţba eksponencijalnog trenda

Y A BC

X log

log log log

log

Y A X B

Y a bX

C

C

Ishodište na poĉetku razdoblja

bX Y X Y

X X X

aY

NbX

log log

log

2

Ishodište u sredini razdoblja

bX Y

X

aY

N

log

log

2

Radna tabela za izraĉunavanje eksponencijalnog trenda ima ove stupce:

Page 62: Predavanja iz Statistike

62

Godina Yi Xi Xi2

log Yi Xi log Yi Vrijednosti

trenda YC

1991. 108 97,29

1992. 106 105,74

1993. 104 114,20

1994. 111 123,34

1995. 134 133,21

1996. 146 143,86

1997. 168 155,37

Ukupno 877 0 28 14,63784 0,96382 873,01

Jednadţba eksponencijalnog trenda za prethodni primjer glasi:

Yc= 123,34 * 1,08X

Analiza varijance je metoda kojom se ispituje reprezentativnost dobivenog trenda:

2

2

( )Y Y

N , p

CY Y

N

2

2

( )

, np

CY Y

N

2

2

( )

, Xp

%

2

2 100 .

VAŢNO:

Izbor oblika trenda (bilo linearnog ili krivolinijskog) ovisi o stupnju reprezentativnosti

trenda; optimalan je onaj trend za koji je odnos protumaĉene i ukupne varijance najpovoljniji.

Ako se usporede rezultati zadanog primjera

Vrsta trenda Stupanj

reprezentativnosti trenda

Linearni 82,1 %

Parabola II. stupnja 97,2 %

Eksponencijalni 79,8 %

izlazi da se u zadanom primjeru parabola II. stupnja najbolje prilagoĊava zadanim

frekvencijama, što se moţe provjeriti na grafikonu.

Page 63: Predavanja iz Statistike

63

VJEŢBA 4.4. Trend

Zadatak 4.4.1. Za broj kontejnerskih brodova u svijetu, a na temelju podataka za razdoblje od

1992. do 2001., odrediti tendenciju kretanja. Za ishodište uzeti:

1) sredinu razdoblja.

2) 31.12.1992.

3) 30.06.1992.

Ispisati jednadţbe trenda pod 1), 2) i 3) i objasniti parametre a i b.

Usporediti dobivene rezultate.

Zadatak 4.4.2. Na grafikonu iz zadatka 4.1.4. ucrtati jednadţbu trenda iz prethodnog zadatka.

Što se moţe zakljuĉiti o prilagoĊavanju trenda empirijskim podacima?

Zadatak 4.4.3. Odgovarajućom metodom ispitati reprezentativnost trenda izraĉunatog u

zadatku 4.4.1. Koji je zakljuĉak? Je li se zakljuĉak o reprezentativnosti trenda,

dobiven raĉunski, poklapa sa zakljuĉkom na temelju grafikona iz zadatka

4.4.2.?

Zadatak 4.4.4. Koristeći rezultate iz prethodnog zadatka, grafiĉki i raĉunski procijeniti broj

brodova koji se moţe oĉekivati u 2005. godini. Do koje se mjere moţe koristiti

trend kao metoda za prognozu? Koja se pretpostavka mora ostvariti da bi

prognoza bila ostvarena?

Zadatak 4.4.5. Oĉekivani broj brodova u 2005. godini iz prethodnog zadatka usporediti s

rezultatom dobivenim u zadatku 4.3.7. Obrazloţiti moguće naĉine procjene.

Zadatak 4.4.6. Zadan je intervalni vremenski niz za razdoblje od 1991. do 1997. godine s

ovim frekvencijama: 108, 106, 104, 111, 134, 146, 168. Odrediti jednadţbu

linearnog trenda s ishodištem u sredini razdoblja, zatim s ishodištima

30.6.1991., 30.6.1990. i 1.1.1993.

Usporediti parametre dobivenih jednadţbi i obrazloţiti kako promjena

ishodišta utjeĉe na vrijednosti parametara jednadţbe te na vrijednosti trenda za

pojedine vremenske jedinice.

Zadatak 4.4.7. Odgovarajućom metodom ispitati reprezentativnost prethodno izraĉunatog

trenda. Kako se donosi odluka o optimalnoj krivulji koja se najbolje

prilagoĊava originalnim frekvencijama?

Zadatak 4.4.8. Za podatke iz zadatka 4.4.6. izraĉunati parabolu drugog stupnja i

eksponencijalni trend te ispitati njihovu reprezentativnost.

Na kraju odrediti optimalnu liniju trenda i zakljuĉak provjeriti na grafikonu s

ucrtanim empirijskim frekvencijama i frekvencijama koje pripadaju pojedinoj

vrsti trenda.

Page 64: Predavanja iz Statistike

64

5. TEORIJSKE RAZDIOBE

5.1. Slučajna varijabla

pojam sluĉajne varijable

oznake sluĉajne varijable

vrste sluĉajnih varijabli

primjeri sluĉajne varijable

funkcija vjerojatnosti

funkcija razdiobe

numeriĉke znaĉajke (parametri) razdiobe vjerojatnosti

Primjer

Pokus (eksperiment) se sastoji u bacanju dviju kocki i biljeţe se dobiveni zbrojevi.

Mogući ishodi tog pokusa su: 2 (1,1); 3 (1,2) ili (2,1); 4 (1,3), (2,2), (3,1); … ; 12 (6,6).

Rezultati su prikazani u tabeli 1.

Tabela 1. Razdioba vjerojatnosti ishoda bacanja dviju kocki

Mogući

ishodi (xi)

Apsolutna

frekvencija

(fi)

Vjerojatnost

(pi)

Funkcija

razdiobe F(xi)

2 1 1/36 (0,028) 1/36

3 2 2/36 (0,056) 3/36

4 3 3/36 (0,083) 6/36

5 4 4/36 (0,111) 10/36

6 5 5/36 (0,139) 15/36

7 6 6/36 (0,167) 21/36

8 5 5/36 (0,139) 26/36

9 4 4/36 (0,111) 30/36

10 3 3/36 (0,083) 33/36

11 2 2/36 (0,056) 35/36

12 1 1/36 (0,028) 36/36

Ukupno 36 36/36 = 1

Izvor: I. Šošić, Uvod u statistiku, Zagreb, 2002., str.238

xi – vrijednost mogućeg ishoda (vrijednost sluĉajne varijable)

fi – broj pojavljivanja mogućeg ishoda (frekvencija mogućeg ishoda)

pi – vjerojatnost svakog ishoda (vjerojatnost a priori)

pm A

ni ( )

Page 65: Predavanja iz Statistike

65

Slučajna varijabla je numeriĉka vrijednost obiljeţja ĉije pojavljivanje ovisi o

sluĉaju. To je varijabla koja poprima niz vrijednosti; svaku s odreĊenom vjerojatnosti.

U jednom pokusu (promatranju, mjerenju, brojanju, …) sluĉajna varijabla moţe

poprimiti samo jednu vrijednost koja se unaprijed ne moţe predvidjeti, ali u razliĉitim

pokusima moţe poprimiti razliĉite vrijednosti.

Oznake slučajne varijable

X : x1, x2, …, xn vjerojatnost P (X = xi) = pi , i = 1, 2, …, n

Y : y1, y2, …, yn vjerojatnost P (Y = yi) = pi , i = 1, 2, …, n

Sluĉajna varijabla X poprima niz vrijednosti x1, x2, …, xn svaku s odreĊenom

vjerojatnosti p1, p2, …, pn , pri ĉemu je 11

n

i

ip .

Vrste slučajnih varijabli: prekidna (diskretna) sluĉajna varijabla i neprekidna

(kontinuirana) sluĉajna varijabla.

Varijabla je diskretna ako je niz vrijednosti xi diskontinuiran, tj. predstavlja prebrojiv

skup vrijednosti, primjerice: ishod bacanja dviju kocki, ocjena, broj telefonskih poziva,…. U

obrnutom sluĉaju, ako sluĉajna varijabla X poprima bilo koju vrijednost iz nekog intervala

(neprebrojiv skup vrijednosti) onda se radi o kontinuiranoj sluĉajnoj varijabli, primjerice:

visina, teţina, udaljenost u kilometrima, brzina vozila,….

Primjeri slučajne varijable: broj dolazaka vozila u servisnu postaju, broj prometnih

nezgoda, broj kvarova vozila, brzina vozila, vremenski razmak izmeĊu vozila, broj prevezenih

putnika, broj tona tereta, broj brodova koji pristiţu u luku, vrijeme opsluţivanja, broj putnika

tijekom jednog dana, broj kupaca koji ulaze u robnu kuću, broj prodanih artikala, broj

klijenata u banci, broj studenata na ispitu, broj telefonskih poziva, visina i teţina ţivih bića,

ocjena na ispitu, …

Svakoj sluĉajnoj varijabli pridruţena je funkcija vjerojatnosti odnosno funkcija

razdiobe.

Funkcija vjerojatnosti se oznaĉava sa f(x) i kod kontinuirane sluĉajne varijable

naziva se gustoća vjerojatnosti.

Pravilo prema kojem je svakom X = xi pridruţena vjerojatnost P(X = xi) = pi zove se

zakon vjerojatnosti ili zakon razdiobe vjerojatnosti koji predstavlja odnos izmeĊu mogućih

vrijednosti sluĉajne varijable x1, x2, …, xn i pripadajućih vjerojatnosti p1, p2, …, pn.

Zakon vjerojatnosti predstavljen je funkcijom vjerojatnosti f(x); to nije vjerojatnost

već funkcija kojom se odreĊuje vjerojatnost za neku vrijednost sluĉajne varijable.

Page 66: Predavanja iz Statistike

66

Prekidna (diskretna) slučajna varijabla

Zakon vjerojatnosti prekidne sluĉajne varijable X je skup parova vrijednosti xi i

pripadajućih vjerojatnosti pi pri ĉemu je zbroj vjerojatnosti jednak 1.

n

i

iii ppxX1

1,,

Zakon vjerojatnosti moţe se prikazati tabelarno i grafiĉki.

Tabela

xi pi

x1 p1

x2 p2

. .

xn pn

ili

xi x1 x2 … xn

pi p1 p2 … pn

Grafiĉki se prikazuje tako da se na apscisu nanose vrijednosti sluĉajne varijable x1, x2,

…, xn , a na ordinatu vjerojatnosti p1, p2, …, pn i to pomoću stupaca ili okomitim crtama

(primjer bacanja dviju kocki):

Page 67: Predavanja iz Statistike

67

Neprekidna (kontinuirana) slučajna varijabla

f xP x X x x

xx( ) lim

( )

0

P x X x x f x dxx

x x

( ) ( )

Vjerojatnost da će se kontinuirana sluĉajna varijabla X nalaziti u intervalu (x, x+x)

jednaka je površini izmeĊu krivulje f(x) i osi x, te ordinata podignutih iz toĉaka x i x+x.

Razlika izmeĎu prekidne i kontinuirane slučajne varijable:

Za prekidnu sluĉajnu varijablu vrijedi da svakoj njenoj vrijednosti xi pripada odgovarajuća

vjerojatnost pi .

Kod kontinuirane sluĉajne varijable vjerojatnosti pripadaju intervalima; za pojedinaĉne

vrijednosti xi vjerojatnost je nula, jer se nad toĉkom ne moţe ucrtati površina. Budući da

je skup vrijednosti koje se nalaze u promatranom intervalu neprebrojiv, nije moguće

elementarno prikazati zakon vjerojatnosti kontinuirane sluĉajne varijable X te se iz tog

razloga na grafikonu dobiva neprekidna krivulja. Kod kontinuirane sluĉajne varijable

funkcija vjerojatnosti f(x) se još zove i gustoća vjerojatnosti ili gustoća razdiobe.

Funkcija razdiobe F(x) je funkcija pomoću koje se mogu izraĉunati vjerojatnosti da

će sluĉajna varijabla X poprimiti vrijednost jednaku ili manju od nekog realnog broja x :

F x P X x P xix xi

( ) ( )

.

Page 68: Predavanja iz Statistike

68

Iz ovog slijedi da je funkcija razdiobe kumulativni niz vjerojatnosti koji se dobiva

zbrajanjem vjerojatnosti za sve vrijednosti xi ; xi x .

Funkcija razdiobe ima svojstvo da je rastuća funkcija i da se kreće u intervalu od 0 do

1.

U tabeli na stranici 73. su upisane vrijednosti funkcije razdiobe za primjer bacanja

dviju kocki; 21/36 je vjerojatnost da će mogući ishod pri bacanju dviju kocki biti 7 i manje

od 7, odnosno od 2 do 7.

Funkcija razdiobe prekidne slučajne varijable:

1

1

1

, , 1

( ) ( )

( ) ( )

( ) ( ) ( )

i

n

i i i

i

i

x x

k

k k i

i

i i i

X x p p

F X P X x P x

F X P X x P X x

P X x F x F x

Grafiĉki prikaz funkcije razdiobe prekidne sluĉajne varijable

Funkcija razdiobe neprekidne slučajne varijable:

F x P X x f x dx

x

( ) ( ) ( )

,

f(x) – funkcija vjerojatnosti neprekidne sluĉajne varijable (gustoća razdiobe)

F x f x dx

x

( ) ( )

.

Ako je bXa tada P( bXa ) = b

a

dxxf )( .

Page 69: Predavanja iz Statistike

69

Grafiĉki prikaz funkcije razdiobe neprekidne sluĉajne varijable

Grafiĉki prikaz funkcije razdiobe za kontinuirane sluĉajne varijable definiran je

površinom ispod krivulje f(x) koja leţi lijevo od proizvoljno odabrane vrijednosti sluĉajne

varijable X.

Veza izmeĊu funkcije vjerojatnosti i funkcije razdiobe dana je relacijom:

f x F x( ) ( ) .

Statistiĉka analiza razdioba vjerojatnosti obuhvaća izraĉunavanje srednjih

vrijednosti, mjera disperzije,…To su numeriĉke znaĉajke, odnosno parametri razdiobe

vjerojatnosti.

Numeričke značajke (parametri) razdiobe vjerojatnosti su vrijednosti kojima je

odreĊena promatrana razdioba vjerojatnosti: srednje vrijednosti, mjere disperzije, mjere

asimetrije i mjera zaobljenosti.

U praksi se najĉešće izraĉunavaju sljedeći parametri:

- aritmetiĉka sredina koja se još naziva oĉekivana vrijednost ili matematiĉko oĉekivanje, a

oznaĉava se sa E(X).

- medijan (M),

- mod (M0),

- standardna devijacija odnosno varijanca (, 2 D(x)),

- koeficijent varijacije (V),

- koeficijent asimetrije (3),

- koeficijent zaobljenosti (4) .

Numeriĉke znaĉajke se mogu izraĉunavati na dva naĉina:

1. naĉin je da se koriste formule iz poglavlja o numeriĉkim nizovima s tim da se umjesto

apsolutnih frekvencija (fi) uvrste relativne frekvencije odnosno vjerojatnosti (pi):

Page 70: Predavanja iz Statistike

70

diskretna sluĉajna varijabla

1

1

( )n

i i

i

E X p x m

kontinuirana sluĉajna varijabla

( ) ( ) ;E X xf x dx x

diskretna sluĉajna varijabla

22 2

1

2 2

2 2 1

( )n

i i

i

p x E X

m m

kontinuirana sluĉajna varijabla

22 2 ( ) ( )x f x dx E X

1

1

2

2 2 1

3

3 3 1 2 1

2 4

4 4 1 3 1 2 1

( )

3 2

4 6 3

nk

k i i

i

nk

k i i

i

m p x

p x X

m m

m m m m

m m m m m m

2. naĉin je da se koriste formule za numeriĉke znaĉajke pojedine vrste razdiobe vjerojatnosti,

što će biti prikazano u sljedećim odjeljcima poglavlja 5.

Page 71: Predavanja iz Statistike

71

5.2. Vrste teorijskih razdioba

pojam empirijske i teorijske razdiobe

binomna razdioba

Poissonova razdioba

normalna razdioba

Statistiĉko promatranje, koje predstavlja prvu fazu statistiĉkog rada (brojenje,

mjerenje, snimanje, promatranje, …), je naĉin da se prikupe informacije o statistiĉkim

jedinicama promatrane pojave.

Empirijska razdioba je svaka ona razdioba koja je dobivena grupiranjem opaţanja ili

grupiranjem statistiĉkih jedinica prema jednom ili više obiljeţja. Zovu se još i originalne ili

opaţene razdiobe.

Primjer:

Ocjena (xi) Broj studenata (fi)

1 .

2 .

3 .

4 .

5 .

fi

Empirijska razdioba Oĉekivana razdioba

(teorijska razdioba)

Teorijska razdioba je takva razdioba koja se oĉekuje u skladu s iskustvom ili

na temelju nekih teorijskih postavki. Primjerice: u prirodi vlada zakon normalne razdiobe, a to

znaĉi da najveći broj jedinica ima prosjeĉnu vrijednost numeriĉkog obiljeţja odnosno sluĉajne

varijable, dok je preostali broj jedinica raspodijeljen na vrijednosti manje odnosno veće od

prosjeka.

Page 72: Predavanja iz Statistike

72

Teorijske razdiobe su razdiobe vjerojatnosti koje su zadane u analitiĉkom obliku pa su

zato i poznate njihove numeriĉke znaĉajke (matematiĉko oĉekivanje, mod, medijan, 3, 4 ,

…).

Sluĉajna varijabla ĉesto slijedi zakonitost neke teorijske razdiobe. Da bi se mogla

usporeĊivati razdioba sluĉajne varijable s nekom teorijskom razdiobom potrebno je upoznati

vrste teorijskih razdioba. Teorijske razdiobe se dijele na dvije skupine ovisno o vrsti sluĉajne

varijable, i to:

diskontinuirane teorijske razdiobe ili diskretne i

kontinuirane teorijske razdiobe.

U prvu skupinu ubrajaju se sljedeće razdiobe: binomna, Poissonova,

hipergeometrijska,…, a u drugu skupinu: normalna, Studentova, F-razdioba, 2-razdioba.

Teorijske razdiobe su zapravo razdiobe vjerojatnosti koje su oĉekivane odnosno

unaprijed poznate i koje sluţe kao baza usporedbe s empirijskim razdiobama dobivenim u fazi

statistiĉkog promatranja.

5.2.1. Binomna razdioba B (n,p)

oznaka

izraĉunavanje vjerojatnosti

numeriĉke znaĉajke

oblik razdiobe

grafiĉki prikaz

uvjeti

Binomna razdioba je diskontinuirana razdioba koja se odnosi na alternativna

obiljeţja, tj. na raspored dviju kategorija u koju se moţe klasificirati jedan dogaĊaj.

Primjeri: pismo ili glava, muško ili ţensko, za ili protiv, da ili ne, zdrav ili bolestan,

ispravan ili oštećen, pozitivan ili negativan, ….

DogaĊaj A:

p je vjerojatnost da će se ostvariti dogaĊaj A, a dogaĊaj koji je suprotan dogaĊaju A je

dogaĊaj non A (A , AC),

q je vjerojatnost da se dogaĊaj A neće ostvariti; p + q = 1.

Binomna razdioba se najĉešće koristi u pokusima ili promatranjima gdje se dogaĊaj A

ostvaruje uz konstantnu vjerojatnost p pa iz toga slijedi da je binomna razdioba definirana s

parametrima:

n – broj elemenata u uzorku ili broj pokusa i

p – vjerojatnost ostvarenja dogaĊaja A.

Oznaka za binomnu razdiobu je: B(n, p) ili B (n,p).

Izračunavanje vjerojatnosti

Ako se sluĉajna varijabla ponaša prema binomnoj razdiobi onda se vjerojatnost da

sluĉajna varijabla X ima neku vrijednost x, tj. P(X = xi) izraĉunava na sljedeći naĉin:

Page 73: Predavanja iz Statistike

73

1. P(x) je vjerojatnost da će u seriji od n pokusa dogaĊaj A nastupiti x puta ili vjerojatnost da

će sluĉajna varijabla X poprimiti vrijednost x.

P xn

xp qx n x( )

za x = 0 P(0) = qn ;

n

x

n

x n x

!

!( )! ;

n

01

;

n

n

1

n! = 1·2· ··· · n

x – broj nastupanja dogaĊaja A u n pokusa (promatranja)

2. Rekurzivna formula

P xn x

x

p

qP x( ) ( )

11 ;

za x = 0 P0 = qn, gdje je q = 1 – p.

3. Tablica vjerojatnosti pri binomnoj razdiobi

0,05 0,06 0,5

0

1

2

3

4. Raĉunalni program (STATISTICA)

Oblik binomne razdiobe

1) n , 3 0 , 4 3

B N ; N – oznaka za normalnu razdiobu uskladiti

2) p = q = 0,5 simetriĉna

3) p < q desnostrano asimetriĉna

4) p > q ljevostrano asimetriĉna

Grafički prikaz binomne razdiobe: na os x se nanose cjelobrojne

vrijednosti sluĉajne varijable, a na os y njihove pripadajuće vjerojatnosti.

histogram poligon

vjerojatnosti

Page 74: Predavanja iz Statistike

74

Numeričke značajke binomne razdiobe

1. Matematiĉko oĉekivanje E(X) = X = n·p p = n

X

2. Disperzija varijanca 2 npq

standardna devijacija npq

koeficijent varijacije Vq

np 100

3. Asimetrija npq

pq 3

4. Zaobljenost 4 31 6

pq

npq

5. Mod np q M np pO

Pri izraĉunavanju moda ako su granice intervala cijeli brojevi, tada mod predstavljaju

dvije vrijednosti sluĉajne varijable X kojima pripada najveća i jednaka vjerojatnost.

Ako su granice intervala decimalni brojevi, tada je mod ona cjelobrojna vrijednost

koja se nalazi unutar tog intervala.

Primjer:

Uvjeti za binomnu razdiobu

2

1. 0 1 ,

2. (1 )

Xp p

n

XX

n

Page 75: Predavanja iz Statistike

75

VJEŢBA 5.1. Binomna razdioba

U trgovinu je stigla velika pošiljka proizvoda za koju proizvoĊaĉ tvrdi da ne sadrţi

više od 6% oštećenih proizvoda. Pretpostavka o postotku oštećenih proizvoda ispitana je

pomoću sluĉajno odabranog uzorka od 5 proizvoda.

Zadatak 5.1.1. Na temelju prethodnih podataka sastaviti razdiobu vjerojatnosti pojavljivanja

odreĊenog broja oštećenih proizvoda u uzorku. Vjerojatnosti za vrijednosti

sluĉajne varijable X5 izraĉunati prema formulama za izraĉunavanje

vjerojatnosti, a zatim ih provjeriti pomoću Tablice vjerojatnosti pri binomnoj

razdiobi.

Zadatak 5.1.2. Izraĉunati parametre (numeriĉke znaĉajke) zadane razdiobe, i to:

1) pomoću formula za izraĉunavanje parametara numeriĉkog niza,

2) pomoću formula za izraĉunavanje parametara binomne razdiobe. Usporediti

dobivene rezultate.

Zadatak 5.1.3. Pokazati da razdioba iz zadatka 5.1.1. zadovoljava uvjete za binomnu

razdiobu.

Zadatak 5.1.4. Grafiĉki prikazati promatranu binomnu razdiobu. Iz grafikona oĉitati

vrijednost moda. Kako treba protumaĉiti taj rezultat?

Zadatak 5.1.5. Na temelju rezultata iz zadataka 5.1.1. do 5.1.4. donijeti odgovarajuće

zakljuĉke o zadanoj razdiobi.

Zadatak 5.1.6. Obavljeno je 100 mjerenja sluĉajne varijable X i dobivene su ove vrijednosti:

f(x=0)=1; f(x=1)=7; f(x=2)=27; f(x=3)=33; f(x=4)=23; f(x=5)=6; f(x=6)=3.

Ispitati da li empirijski podaci zadovoljavaju uvjete za binomnu razdiobu te u

sluĉaju potvrdnog odgovora izraĉunati ostale parametre zadane razdiobe.

Obrazloţiti rezultate i provjeriti ih na poligonu vjerojatnosti.

Zadatak 5.1.7. Ako se telefonira u vrijeme kada je svaki ĉetvrti telefonski broj zauzet, koliko

iznosi vjerojatnost da će se od 12 poziva uspostaviti veza 3 puta?

Zadatak 5.1.8. Promatra se neki dogaĊaj s konstantnom vjerojatnosti p=0,6. Koliko bi trebao

iznositi broj promatranja da se sa 99% vjerojatnosti moţe oĉekivati da će se

dogaĊaj A ostvariti barem jedanput?

Uputa: ako se sa p oznaĉi vjerojatnost realizacije dogaĊaja A, sa pn vjerojatnost

realizacije dogaĊaja A n puta, a sa qn vjerojatnost suprotnog dogaĊaja n puta,

onda vjerojatnost da će se ostvariti dogaĊaj A barem jedanput je suprotno od qn

(da se neće ostvariti nijedanput). Vrijednost za n dobije se iz relacije 1–(1–p)n

0,99.

Page 76: Predavanja iz Statistike

76

5.2.2. Poissonova razdioba P ()

oznaka

izraĉunavanje vjerojatnosti

numeriĉke znaĉajke

oblik razdiobe

grafiĉki prikaz

uvjeti

Poissonova razdioba je diskontinuirana razdioba (što znaĉi da se odnosi na

sluĉajnu varijablu koja ima cjelobrojne vrijednosti) i predstavlja graniĉni sluĉaj binomne

razdiobe kada n , a p 0.

U praksi, kada je n > 50 izraĉunavanje vjerojatnosti po binomnoj razdiobi je

dugotrajno te se, u sluĉajevima kada je p malen broj, preporuĉuje Poissonova razdioba.

Poissonova razdioba je definirana jednim parametrom koji predstavlja

matematiĉko oĉekivanje, odnosno aritmetiĉku sredinu i koji se oznaĉava na razliĉite naĉine

(m ili ).

Oznaka za binomnu razdiobu je: P() ili P ().

Izračunavanje vjerojatnosti

Vjerojatnosti sluĉajne varijable X koja se ponaša prema Poissonovoj razdiobi

izraĉunavaju se na sljedeće naĉine:

1. P xx

e

x

( )!

2. Rekurzivna formula

P xx

P x( ) ( )

1 P e( )0

3. Tablica vjerojatnosti

4. Korištenje odgovarajućih raĉunalnih programa

0,1 0,2 1,0

0

1

2

3

1,1

1,2

2,0

0

1

Page 77: Predavanja iz Statistike

77

Oblik Poissonove razdiobe ovisi o parametru i to tako da je razdioba unimodalna i

desnostrano asimetriĉna, a asimetrija je to manja što je veći.

Ako je decimalan broj, onda najveća vjerojatnost pripada jednom broju, tj. jednoj

vrijednosti varijable X (mod), a ako je parametar cijeli broj, onda najveću i jednaku

vrijednost imaju dvije vjerojatnosti sluĉajne varijable X (dvije vrijednosti moda), pa se kaţe

da Poissonova razdioba ima tupi vrh).

Kada tada 3 0 i 43 na temelju ĉega slijedi da Poissonova

razdioba

postaje simetriĉnom i normalno zaobljenom, što znaĉi da teţi normalnoj razdiobi.

Grafičko prikazivanje Poissonove razdiobe:

histogram poligon vjerojatnosti

Primjeri:

Uvjeti za Poissonovu razdiobu

X 2

Numeričke značajke Poissonove razdiobe

1. Matematiĉko oĉekivanje E(X) = X = = m (prvi moment oko nule)

2. Disperzija varijanca 2

2

standardna devijacija

koeficijent varijacije V 100

3. Asimetrija

3

1

4. Zaobljenost 4 31

5. Mod 01 M

Page 78: Predavanja iz Statistike

78

Ako se mod nalazi izmeĊu dviju decimalnih vrijednosti onda je pripadajuća vrijednost

moda jednaka cjelobrojnoj vrijednosti M0=0 ako je izraĉunati interval 0,34 M0 0,96;

ako je dobiveni interval 1 M0 2 tada postoje dvije vrijednosti moda M0 = 1 i 2.

Page 79: Predavanja iz Statistike

79

VJEŢBA 5.2. Poissonova razdioba

Zadane su tri vrijednosti parametra za razdiobe A, B i C te intervali vrijednosti sluĉajne

varijable X, i to:

A B C

0,5 2 6

X 0 – 6 0 – 11 0 – 13

Zadatak 5.2.1. Na temelju prethodnih podataka sastaviti razdiobe vjerojatnosti za zadane

vrijednosti sluĉajne varijable A(X6), B(X11) i C(X13).

Vjerojatnosti za tekuće vrijednosti sluĉajne varijable izraĉunati prema zadanim

formulama za izraĉunavanje vjerojatnosti, a zatim ih provjeriti pomoću Tablice

vjerojatnosti pri Poissonovoj razdiobi.

Zadatak 5.2.2. Izraĉunati parametre (numeriĉke znaĉajke) zadanih razdioba A, B i C, i to:

1) pomoću formula za izraĉunavanje parametara numeriĉkog niza,

2) pomoću formula za izraĉunavanje parametara Poissonove razdiobe.

Usporediti dobivene rezultate.

Zadatak 5.2.3. Pokazati da razdiobe A, B i C zadovoljavaju uvjet za Poissonovu razdiobu 2X .

Zadatak 5.2.4. Grafiĉki prikazati razdiobe vjerojatnosti A, B i C. Na temelju dobivenih

grafiĉkih prikaza objasniti kako parametar utjeĉe na oblik Poissonove

razdiobe ako je decimalan broj, odnosno cjelobrojna vrijednost ili, pak, ako

.

Zadatak 5.2.5. Na temelju rezultata iz zadataka 5.2.1. do 5.2.4. dati odgovarajuće zakljuĉke o

zadanim razdiobama.

Zadatak 5.2.6. Na nekom podruĉju evidentiran je tijekom 50 dana ovaj broj dnevnih

prometnih nesreća: 21 dan bez nesreća, 18 dana s 1 nesrećom, 7 dana s 2

prometne nesreće, 3 dana s 3 i 1 dan s 4 nesreće dnevno.

Ispitati da li empirijski podaci zadovoljavaju uvjet za Poissonovu razdiobu te u

sluĉaju potvrdnog odgovora izraĉunati ostale parametre zadane razdiobe.

Obrazloţiti dobivene rezultate.

Zadatak 5.2.7. Na autobusni kolodvor dolazi dnevno 75 autobusa. Praćenjem u duljem

razdoblju ustanovljeno je da od ukupnog broja u prosjeku 8% autobusa pristiţe

na kolodvor sa zakašnjenjem. Izraĉunati kolika je vjerojatnost da će tijekom

dana zakasniti više od 3 autobusa.

Page 80: Predavanja iz Statistike

80

5.2.3. Normalna razdioba

veza između binomne i normalne razdiobe

funkcija vjerojatnosti ( gustoća razdiobe)

oznake

oblik normalne razdiobe

numeričke značajke normalne razdiobe

jedinična (standardizirana) normalna razdioba

Tablica ordinata gustoće jedinične normalne razdiobe

sigma-pravilo

Tablica površina ispod normalne krivulje ( Laplaceova funkcija)

intervali normalne razdiobe.

Normalna razdioba je najznaĉajnija kontinuirana teorijska razdioba koja se primjenjuje

u raznim podruĉjima: brojni se skupovi (populacije) u statistiĉkim istraţivanjima ponašaju

prema zakonitostima normalne razdiobe (primjerice, biomedicinske znanosti), a kada osnovni

skup nije normalno rasporeĊen, procjene na temelju uzoraka teţe normalnoj razdiobi, pod

uvjetom da je uzorak dovoljno velik. Zbog toga se ĉesto “nenormalne” razdiobe

aproksimiraju s normalnom razdiobom.

Matematiĉku osnovu normalne razdiobe dao je engleski ?? matematiĉar De Moivre,

pronašao ju je Francuz Laplace, a detaljno prouĉio njemaĉki matematiĉar Gauss po kome se

ĉesto i naziva Gaussovom razdiobom, a grafiĉki prikaz te razdiobe Gaussovim zvonom.

Veza izmeĊu binomne i normalne razdiobe ogleda se u sljedećem: kada se pri

binomnoj razdiobi s vjerojatnostima p = q = 0,5 povećava broj elemenata u uzorku, odnosno

broj pokusa (promatranja, mjerenja, i sl.) n , tada binomna razdioba s diskontinuiranim

obiljeţjem prelazi u normalnu razdiobu s kontinuiranim vrijednostima sluĉajne varijable; B

N.

Prema tome, normalna razdioba je graniĉni sluĉaj binomne razdiobe. Ovaj se zakljuĉak

moţe provjeriti grafiĉkim putem (primjer 1.).

Primjer 1. Neka je n = 6, 25, 50, …, a p = q = 0,5:

Page 81: Predavanja iz Statistike

81

Prema priloţenim grafikonima izlazi da pri povećanju broja n histogram ima sve veći

broj stupaca s manjom bazom, tako da za velik broj n histogram prelazi u kontinuiranu

krivulju kojom se pribliţava grafiĉkom prikazu normalne razdiobe kao graniĉnoj vrijednosti.

Kao svakoj teorijskoj razdiobi tako su i normalnoj razdiobi pridruţene funkcija

vjerojatnosti i funkcija razdiobe.

Normalna sluĉajna varijabla X je rasporeĊena prema zakonu normalne razdiobe, tj. X ~

N (, σ2), ako je podruĉje njezinih vrijednosti od –∞ do +, a funkcija vjerojatnosti

f x e

x

( )( )

1

2

1

2

2

; xR (1)

gdje je:

x – tekuća vrijednost sluĉajne varijable

– oĉekivana vrijednost ili aritmetiĉka sredina

σ – standardna devijacija

e – baza prirodnog logaritma (2,71828)

π – konstanta (3,14159).

Funkcija vjerojatnosti se kod kontinuiranih razdioba naziva gustoćom razdiobe.

Iz (1) slijedi da je normalna razdioba jednoznaĉno odreĊena s dva parametra:

matematičkim očekivanjem () i varijancom (σ2). Oznaka za normalnu razdiobu je: N

( , σ2).

Funkcija f(x) je parna funkcija, pozitivna za sve vrijednosti sluĉajne varijable, pa je

normalna razdioba prema obliku simetriĉna krivulja kojoj je os simetrije pravac x = , iz

ĉega slijedi da je za svaku normalnu razdiobu koeficijent asimetrije α3 = 0 i da su

vrijednosti aritmetiĉke sredine (matematiĉkog oĉekivanja), medijana i moda meĊusobno

jednake.

Normalna razdioba ima zaobljenost “u obliku zvona”, unimodalna je s vrhom na pravcu x

= i s dva kraka koji se asimptotski pribliţavaju osi x; koeficijent zaobljenosti α4 = 3. Toĉke

infleksije imaju apscise + σ.

Grafiĉki prikaz normalne krivulje dan je na grafikonu :

Page 82: Predavanja iz Statistike

82

Egzaktan oblik normalne razdiobe ovisi o parametrima i σ2

:

krivulja je uţa i viša što je σ2, odnosno σ (standardna devijacija) manja i obrnuto, šira i

plosnatija s porastom standardne devijacije,

krivulja se porastom matematiĉkog oĉekivanja pomiĉe uzduţ apscise udesno, odnosno

ulijevo sa smanjenjem .

Utjecaj parametara i σ2

na oblik normalne krivulje

1. 1 2

2. 1

2

2

2

3. 1 2

1

2

2

2

4. 1 2

1

2

2

2

5. 1 2

1

2

2

2

6. 1 0

1

2 1

Page 83: Predavanja iz Statistike

83

Funkcija razdiobe F(x) za normalno distribuiranu varijablu je funkcija kojom je

izraţena vjerojatnost P X x F x( ) ( ) , tj. da će sluĉajna varijabla X poprimiti vrijednosti

jednake ili manje od x. Funkcija razdiobe predstavlja kumulativni niz vjerojatnosti za

vrijednosti sluĉajne varijable od x i manje od x, pa je prema tome:

F x f x dx

x

( ) ( )

F x e dx

xx

( )( )

1

2

1

2

2

U geometrijskom smislu vrijednosti funkcije razdiobe predstavljaju dio površine ispod

normalne krivulje.

Numeričke značajke normalne razdiobe su:

1. Matematiĉko oĉekivanje

xf x dx( )

2. Varijanca

2 2

x f x dx( )

3. Koeficijent asimetrije 3 = 0

4. Koeficijent zaobljenosti 4 = 3

Da bi se empirijske razdiobe mogle usporeĊivati potrebno je da normalna razdioba ima

jediniĉni oblik odnosno oblik koji ne zavisi od parametra i 2. Zato je uzeto da je =0, a

2=1 i ta normalna razdioba nazvana je standardizirana ili jedinična normalna razdioba, a

do nje se dolazi uvoĊenjem nove standardizirane varijable koja glasi:

zx

Gustoća standardizirane sluĉajne varijable je:

f z ez

( ) 1

2

1

2

2

,

odnosno umjesto f(z) moţe se koristiti oznaka (x) N (0, 1).

Page 84: Predavanja iz Statistike

84

Vrijednosti Y(z) za pojedine vrijednosti z dane su u Tablici ordinata gustoće jediniĉne

normalne razdiobe. Vrijednosti f(z) ili (x) predstavljaju ordinate normalne razdiobe.

Svakoj teorijskoj razdiobi f(x) pripada funkcija razdiobe koja se dobiva sumiranjem

vjerojatnosti od normalne razdiobe:

f x e

x

( )( )

1

2

1

2

2

Funkcija razdiobe za normalno distribuiranu varijablu predstavlja vjerojatnost

P X x F x( ) ( ) da će sluĉajna varijabla X poprimiti vrijednosti koje su jednake ili manje od

x. Funkcija razdiobe predstavlja kumulativni niz vjerojatnosti za vrijednosti sluĉajne varijable

od x i manje od x.

F x f x dx

x

( ) ( )

F x e dx

xx

( )( )

1

2

1

2

2

U geometrijskom smislu vrijednosti funkcije razdiobe predstavljaju površinu ispod

normalne krivulje. Radi primjene u praksi izraĊene su tablice koje sadrţe vrijednosti funkcije

razdiobe za jediniĉnu normalnu razdiobu. Ta funkcija razdiobe glasi:

F x e dtt

x

( ) /

1

2

2

Funkcija razdiobe za jediniĉnu normalnu razdiobu povezana je sa Laplaceovom

funkcijom koja glasi:

( ) /x e dtt

x

1

2

2

0 , (Gaussov integral)

s tim da treba uzeti u obzir da vrijedi identitet:

( ) ( ) .x F x 05 .

Vrijednosti Gaussovog integrala su tabelirane i nalaze se u odgovarajućoj statistiĉkoj

tablici koja u praksi ĉesto ima razliĉite nazive, npr.:

tablica površine ispod normalne krivulje,

površine ispod jediniĉne normalne krivulje,

vrijednosti funkcije razdiobe jediniĉne normalne krivulje,

Laplaceova funkcija.

Za korištenje Tablice površina ispod normalne krivulje koristi se tzv. sigma pravilo

koje glasi da se unutar odreĊenog intervala nalazi odgovarajući postotak svih vrijednosti

kontinuirane sluĉajne varijable X. Prema tablici, u intervalu od –1 do +1 standardne devijacije

nalazi se 68.26% svih vrijednosti neprekidne sluĉajne varijable, u intervalu od –2 do +2

Page 85: Predavanja iz Statistike

85

standardne devijacije 95.45% svih vrijednosti, a u intervalu od –3 do +3 standardne devijacije

99.73% svih vrijednosti neprekidne sluĉajne varijable:

P z( ) . 1 1 06826

P z( ) . 2 2 09545

P z( ) . 3 3 09973.

U praksi se Tablica površine ispod normalne krivulje koristi na dva naĉina:

1. zadan je interval pa treba naći vjerojatnost odnosno površinu,

P z( ) . .

.

1 1 034134 034134

0 68268

2. zadana je površina odnosno vjerojatnost, a treba naći interval.

P = 95% to znaĉi da je vjerojatnost od 0.95000

95%:2 475% 047500 . . za tu vrijednost se pronaĊe u tablici koji je to z

99%:2 495% 049500 . . ako nema te vrijednosti uzima se prva veća.

Izraĉunavanje vjerojatnosti da se sluĉajna varijabla X nalazi u intervalu od a do b

odreĊuje se pomoću formule:

P a X bb a

( )

.

Page 86: Predavanja iz Statistike

86

VJEŢBA 5.2.3. Normalna razdioba

Zadatak 5.2.3.1. Ispitati vezu izmeĊu binomne i normalne razdiobe grafiĉki, tako da se

uzme B (n; 0,5) gdje n varira: n=6, 24, 50,.... Pokazati da, kad je p=q i n ,

tada B N .

Zadatak 5.2.3.2. Ispitati vezu izmeĊu binomne i Poissonove razdiobe takoĊer gra-fiĉki

tako da se uzme B (60, p) gdje p varira: 0,5; 0,1; 0,01... .

Pokazati da, kad n i p0, tada B P ().

Zadatak 5.2.3.3. Ispitati utjecaj parametara i 2 na oblik normalne razdiobe tako da se

grafiĉki prikaţu ove razdiobe:

1) 1 = 2 = 10 i 2 2

1 2 2

2) 1 = 2 = 10 i 2 2

1 22, 5

3) 1 = 10, 2 = 3 i 2 2

1 2 2

4) 1 = 10, 2 = 3 i 2 2

1 22, 5

5) = 0, 2

1 1 .

Na temelju grafikona objasniti opravdanost uvoĊenja jediniĉne

(standardizirane) normalne krivulje.

Zadatak 5.2.3.4. Koristeći Tablicu ordinata gustoće jediniĉne normalne razdiobe nacrtati

razdiobu uzevši u obzir desetak vrijednosti z u intervalu od 0,00 do 3,90. Za

usporedbu koristiti raĉunalni program za crtanje normalne razdiobe. Objasniti

zbog ĉega su se pojavile razlike u kvaliteti grafiĉkog prikaza.

Zadatak 5.2.3.5. Na temelju Tablica površina ispod normalne krivulje, odnosno

Laplaceove funkcije:

1) izraĉunati vjerojatnost, ako z = –0,5 i ako –0,5 z 0,5;

2)izraĉunati u kojem se intervalu nalazi 95% površine ispod normalne krivulje,

odnosno 95% svih vrijednosti kontinuirane sluĉajne varijable.

Zadatak 5.2.3.6. Mjerenjem brzine vozila na odreĊenoj dionici prometnice dobiveni su

ovi podaci:

Brzina u km/h Broj vozila

50 – 60 13

60 – 70 16

70 – 80 25

80 – 90 31

90 – 100 22

100 – 110 14

110 – 120 12

120 – 130 11

Ukupno 144

Uz pretpostavku normalne razdiobe izraĉunati:

1) vjerojatnost da će brzina vozila biti izmeĊu 70 i 90 km/h,

Page 87: Predavanja iz Statistike

87

2) vjerojatnost da će brzina biti veća od 100 km/h,

3) vjerojatnost da će brzina biti manja od 70 km/h,

4) vjerojatnost da će brzina biti veća od 70 km/h.

Page 88: Predavanja iz Statistike

88

5.3. 2 – test (hi-kvadrat test)

pojam statistiĉkog testa

veza izmeĊu empirijske i teorijske razdiobe

pojam teorijske frekvencije

hipoteza (nulta i alternativna)

uvjet za 2 test

izraĉunavanje vrijednosti 2

tablica kritiĉne vrijednosti 2 razdiobe

odluka o prihvaćanju hipoteze

Statistički testovi su metode koje se koriste u usporedbi izmeĊu empirijskih i teorijskih

razdioba radi donošenja odluke ponaša li se empirijska razdioba prema nekoj teorijskoj

razdiobi.

Od svih testova 2- test se najviše koristi u praksi. Sluĉajna varijabla ĉesto slijedi

zakonitost neke teorijske razdiobe i ako je to sluĉaj onda se za analizu promatrane pojave

mogu koristiti numeriĉke karakteristike teorijske razdiobe prema kojoj se ponašaju empirijski

podaci. Na taj naĉin uštedi se vrijeme i novac radi prikupljanja podataka za promatranu

pojavu te se u tom sluĉaju odmah koristi odgovarajuća teorijska razdioba.

Primjerice: broj pristiglih brodova u luku je sluĉajna varijabla zato jer taj broj ne

ovisi o danu, satu i luci; kaţe se da ovisi o sluĉaju. Bez obzira što je broj pristiglih

brodova sluĉajna varijabla, analiziranjem podataka o broju pristiglih brodova ustanovljeno

je da slijedi zakonitosti Poissonove razdiobe. To znaĉi da se kod svakog daljnjeg dolaska

u luku moţe uzeti pretpostavka (iako to ne mora biti uvijek) da za broj brodova vrijede

znaĉajke Poissonove razdiobe. Prema tome, koristeći Poissonovu razdiobu mogu se

odrediti vjerojatnosti da će broj brodova poprimiti neku vrijednost x, P(X=x).

Empirijske frekvencije su frekvencije dobivene na temelju statistiĉkog promatranja, a

teorijske frekvencije su frekvencije koje pripadaju odreĊenoj teorijskoj razdiobi i koje se

izraĉunavaju na odgovarajući naĉin. Teorijske frekvencije su frekvencije ĉije se vrijednosti

ponašaju prema zakonitosti odgovarajuće teorijske razdiobe.

2– test je test kojim se usporeĊuju empirijske s teorijskim frekvencijama. Razlika

izmeĊu fi i fti moţe biti malena (sluĉajna), odnosno velika (znaĉajna). Ako je razlika malena

pripisuje se sluĉaju i kaţe se da, bez obzira što postoji razlika, moguće je prihvatiti da se

empirijska razdioba ponaša prema teorijskoj razdiobi. Ako je razlika izmeĊu fi i fti velika,

onda se kaţe da je razlika znaĉajna, odnosno da se empirijska razdioba ne ponaša prema

teorijskoj. Drugim rijeĉima, rezultat 2– testa je donošenje odgovarajuće odluke koja se

odnosi na prihvaćanje ili nul-hipoteze (H0) ili alternativne hipoteze (H1).

H0 : empirijska razdioba se ponaša (slijedi zakonitosti) prema odabranoj teorijskoj

razdiobi (Poissonova, binomna, …)

H1 : empirijska razdioba se ne ponaša prema odabranoj teorijskoj razdiobi.

Hipoteza H0 se prihvaća kada je razlika fi - fti malena (sluĉajna), a hipoteza H1 se

prihvaća kada je razlika fi - fti velika (statistiĉki znaĉajna) vrijednost hi kvadrata se izaĉunava

prema formuli:

Page 89: Predavanja iz Statistike

89

2

2

1

f f

f

i ti

tii

n

,

gdje su:

fi – empirijske frekvencije (zadane),

fti – teorijske frekvencije (treba izraĉunati).

Za Poissonovu i binomnu razdiobu teorijske frekvencije se raĉunaju po formuli:

f N P xti ( ) ,

a za normalnu razdiobu:

)(zYi

Nf ti

,

gdje je:

N – ukupan broj jedinica,

i – veliĉina razreda,

Y(z) – ordinata jediniĉne normalne razdiobe koja se oĉitava iz tablice gustoće jediniĉne

normalne razdiobe ovisno o vrijednosti standardizirane sluĉajne varijable.

Za donošenje odluke o prihvaćanju H0, odnosno H1 potrebno je izraĉunati vrijednost 2

sa tabliĉnom vrijednosti 0

2 koja predstavlja dozvoljeni iznos razlike izmeĊu fi i fti .

Uvjet za 2 test:

N > 100 , fti > 5.

Ako uvjet nije zadovoljen onda se ne preporuĉa primjena 2 testa.

Vrijednost 2 je maksimalno odstupanje koje je dozvoljeno s obzirom na broj stupnjeva

slobode i razinu signifikantnosti.

Oĉitavanje 0

2 obavlja se iz tablice kritične vrijednosti 2 razdiobe, uzevši u obzir broj

stupnjeva slobode i postotak signifikantnosti, odnosno znaĉajnosti. Broj stupnjeva slobode k

iznosi:

za binomnu i Poissonovu razdiobu k = n-2,

za normalnu razdiobu k = n-3 ,

gdje je n broj parova vrijednosti fi i fti , odnosno broj redaka u tabeli, a – razina

signifikantnosti, tj. postotak dozvoljenog rizika.U praksi se kreće od 5% prema 1%. Rizik ne

moţe biti 0%.

Ako nije ispunjen uvjet da je fti > 5 potrebno je zbrajati teorijske frekvencije dok se ne

ispuni taj uvjet.

Postotak signifikantnosti prihvaća odreĊeni rizik pri testiranju, npr.: testiranje na razini

5% signifikantnosti dozvoljava rizik od 5% sluĉajeva, a postotak signifikantnosti od 1%

dozvoljava rizik u prosjeku od 1% sluĉajeva.

Page 90: Predavanja iz Statistike

90

Odluka o prihvaćanju hipoteze:

2

0

2 2 je manji od dozvoljenog iznosa odstupanja ili razlike, što znaĉi da se

prihvaća nulta hipoteza (H0) da se empirijska razdioba ponaša prema zakonitostima odabrane

teorijske razdiobe,

2

0

2 graniĉni sluĉaj

2

0

2 2 prelazi dozvoljeni iznos odstupanja izmeĊu fi i fti te se prihvaća

alternativna hipoteza da se empirijska razdioba ne ponaša prema odabranoj teorijskoj

razdiobi.

Page 91: Predavanja iz Statistike

91

VJEŢBA 5.3. TESTIRANJE PODUDARNOSTI EMPIRIJSKE

S TEORIJSKOM RAZDIOBOM

Zadatak 5.3.1 Broj studenata koji dnevno dolazi u knjiţnicu tijekom promatranog tjedna

iznosio je: 50, 62, 39, 46 i 53 studenta. Na razini 5% znaĉajnosti ispitati

pretpostavku o uniformnoj razdiobi dnevnog broja studenata tijekom radnih

dana knjiţnice.

Da li se broj studenata statistiĉki znaĉajno razlikuje ovisno o danu u

tjednu? Ako ne postoji znaĉajna razlika koliki bi trebao biti oĉekivani broj

studenata i knjiţnici petkom?

Zadatak 5.3.2. Na temelju podataka iz zadatka 5.1.6. ispitati na razini 5% znaĉajnosti moţe li

se prihvatiti pretpostavka da se sluĉajna varijabla X ponaša prema binomnoj

razdiobi.

Rezultat provjeriti grafiĉki ucrtavanjem empirijskih i teorijskih

frekvencija.

Zadatak 5.3.3. Na temelju podataka iz zadatka 5.2.6. ispitati pretpostavku da se broj

prometnih nesreća dnevno ponaša prema Poissonovoj razdiobi. Testiranje

provesti na razini 5% i 1% znaĉajnosti.

Objasniti kako promjena razine znaĉajnosti utjeĉe na rezultat.

Zadatak 5.3.4. Ako je u prethodnom zadatku prihvaćena nul-hipoteza, odrediti koliki je

oĉekivani broj dana bez prometnih nesreća.

Zadatak 5.3.5. Testirati pretpostavku da uzorak iz zadatka 5.3.6. o broju vozila prema brzini

potjeĉe iz osnovnog skupa normalne razdiobe. Testiranje provesti na razini 5%

znaĉajnosti.

Zadatak 5.3.6. Ako je razdioba vozila prema brzini iz prethodnog zadatka normalno

distribuirana koliki je oĉekivani broj vozila s brzinom do 100 km/h, odnosno

iznad 100 km/h?

Zadatak 5.3.7. Moţe li se za empirijsku razdiobu broja dana prema broju telefonskih poziva

dnevno (prikazanoj u tabeli 4. ovog priruĉnika) ustanoviti zakonitost, odnosno

odrediti teorijska razdioba prema kojoj se ponaša navedena empirijska

razdioba. Testiranje provesti na razini 5% znaĉajnosti.