Statistika III Parcijala

1

SKRIPTA ZA III PARCIJALNI ISPIT IZ STATISTIKE

REGRESIONA ANALIZA

Utvrđivanje zakonitosti I pravilnosti koje vladaju između masovnih pojava, te trasiranje puta

za kreiranje odgovarajućeg modela, zadatak je regresione analize.

Regresija je zapravo skraćeni naziv od regresija prema aritmetičkoj sredini, koja dolazi od

opšte statističke zakonitosti da je rezultat jedne varij.bliži aritmetičkoj sredini nego što je

rezultatu varijable koja je služila za predviđanje.

U užem smislu, regresiona analiza podrazumijeva skup statističkih metoda koji omogućuju

utrvđivanje zavisnoti između pojava I procjenjivanje jedne varijable na osnovu vrijednosti

neke druge ili više drugih varijabli.

U širem smislu, ova analiza obuhvata, pored navedenih metoda I statističke metode koji

omogućavaju praćenje kovarijacije između pojava I utvrđivanje međuzavisnosti između dvije

ili više pojava.

KOVARIJANSA predstavlja kvantitativni izraz slaganja varijacija vrijednosti obilježja

posmatranih pojava.

Regresioni model omogućava da se s određenim stepenom pouzdanosti procjenjuju I

predviđaju vrijednosti zavisne varijable na osnovu vrijednosti nezavisne varijable.

Međuzavisnost pojava se utvrđuje primjenom korelacione analize. Korelacionim modelom

se utvrđuje da li su dvije pojave povezane , tj da li se mjenjaju zajedno, da li im je pravac

mjenjanja isti, koji je stepen povezanosti i sl.

Regresiona analiza može se odnosti na posmatranje osnovnog skupa ili na njegov uzorak.

Češći je slučaj da se analiza izvodi na osnovu uzorka.

Iz osnovnog skupa uzima se reprezentativan uzorak i na osnovu njega donosi se zaključak o

parametrima skupa.

Za ovu analizu mogu se koristiti 2 vrste podataka:

a)podaci koji izražavaju stanje određenog momenta

b)podaci koji se dobivaju na osnovu posmatranja neke pojave u vremenskim intervalima i

takvi podaci se obrazuju u vremenski niz.

Nužno je upozoriti na opasnost formalne interpretacije rezulatat, koji proizilaze iz primjene

regres.analize.

Validnost i pouzdanost rezultata reg.analize zavise od stvarnog poznavanja materije koju

ona treba interpretirati.

-KOVARIJACIJA- Za utvrđivanje kvantitativnog izraza slaganja varijacija vrijednosti obilježja posmatrane

pojave korsitimo kovarijaciju.Postoje slijedeći pokazatelji kovarijacije:

a) INDEKS DIFERENCIJALNE KOVARIJACIJE:

računa se na osnovu predznaka varijacija kao razlika među modalitetima obilježja u

utvrđenom nizu njihovih podataka. Nedostatak mu je u tome što uzima u obzir samo

predznak varijacija od jednog do drugog modaliteta, a zanemaruje intenzitet zabilježenih

varijacija.

2

b) PONDERISANI INDEKS DIFERENCIJALNE KOVARIJACIJE

je obuhvatniji od prethodnog indeksa jer uzima u obzir i predznake i intenzitet zabilježenih

varijacija. Računa se kao odnos razlike i zbira pozitivnih i negativnih proizvoda varijacija.

c) KOEFICIJENT DIFERENCIJALNE KOVARIJACIJE

Računa se kao odnos između razlike pozitivnih i negativnih proizvoda varijacija prema

geometriskoj sredini kvadrata uzastopnih varijacija.

3

d)KOEFICIJENT TENDENCIJE

je kompleksan izraz uzajamnosti varijacija obilježja posmatranih pojava. On obuhvata i

odstupanja oko aritmetičke sredine. Uzima vrijednost iz intervala [-1,+1], pri čemu

neg.vrijednosti označavaju suprotnosmjerno slaganje varijacija, a pozitivne, istosmjerno

slaganje. Što je njegova apsolutna vrije.bliža 1, između varijacija obilježja pojava postoji viši

stepen istosmjernog ili suprotnosmjernog kvantit.slaganja.

-KOVARIJANSA- predstavlja prosječan stepen varijacija obilježja posmatrane pojave i pomoću nje nije

moguće direktno mjerenje stepena kovarijacije, tj stepena jačine veze između posmatranih

pojava. Kovarijansom procjenjujemo postoji li kovarijacija između pojava, ali ne i stepen.

Ona je neka vrsta prosjeka, odnosno ukupnosti odstupanja svih podataka od aritmetičkih

sredina posmatranih serija. Izračunava se kao prosječno istovremeno odstupanje

vrijednosti obilježja od svojih aritmetičkih sredina. Jednaka je nuli ako je stand.devijacija

barem jedne varij.jednaka nuli. Ako postoji tendencija da iznadprosječna vrijednost jedne

varijable dolazi sa iznadprosječnom vrijednošću druge varijable, onda je kovarijansa

pozitivna i obrnuto. Kovarijansa je negativna ako iznadprosječne vrijenosti jedne varijable

prate ispodprosječne vrijednosti druge varijable.

Zadatak regresione analize je da utvrdi zakonitosti u varijacijama zavisne varijable Y, koje su

određene varijacijama nezavisne varijable X, s ciljem da se predvide nepoznate vrijednosti

varijable Y kada je poznata X.

Nezavisna varijabla je ona varijabla od koje na neki način zavisi ono što istražujemo. To je

ona varijabla koju istraživač namjerno mjenja da bi ustanovio kako će te promjene djelovati

na zavisnu varijablu koju on istražuje.

Zavisna varijabla je ona varijabla koju istražujemo i želimo rastumačiti zbog čega ona

poprima različite vrijednosti i koju možemo predvidjeti iz vrijednosti neke druge varijable. U

slučajevima kada istraživač ne može svojevoljno manipulisati X on prati promjene na Y u

vezi sa spontanim promjenama na X.

Regresija kvantificira vezu između pojava, neophodno je kvalitativnom analizom ispravno

identifikovati varijablu/e koja stvarno uzrokuje promjene u zavisnoj varijabli.

Veze kod kojih povećanju(smanjenju) vrijednosti nezavisne varijable X istovremeno

odgovara povećanje(smanjenje) zavisne varijable Y nazivamo pozitivnim(istosmjernim)

vezama. Ako povećanju jedne varijable odgvara smanjenje druge varijable radi se o

negativnom (suprotnosmjernim) vezama.

Prema jačini veze između pojava mogu biti FUNKCIONALNE I STATISTIČKE.

Funkcionalne veze se javljaju u slučaju kada jednom vrijednosti nezavisne promjenjive X

odgovara samo jedna, tačno određena vrijednost zavisne promjenjive Y. Karakteristično je

da im se pri zajedničkom mjenjanju veličina promjene uvijek podudaraju i da u svakoj

vrijednosti jedne pojave odgovara uvijek ista vrijednost druge pojave. Označava se sa

izrazom Y=f(x), pri čemu svakoj vrijednosti X odgovara tačno određena vrijednost Y.

4

Statističke( slučajne) veze se najčešće susreću u društvenim i privrednim pojavama. S

obzirom na to da zavisna varijabla Y svaku od različitih vrijednosti može uzeti s određenom

vjerovatnoćom i kako njene ishode u pojedinačnim situacijama ne možemo sa sigurnošću

predvidjeti, ona je slučajna varijabla. Iako po obliku podsjećaju na funkcionalne veze,

labavije su od njih, nisu tako određene i podložne su variranju.

Kada svakom jediničnom porastu vrijednosti jedne varijable odgovara približno jednaka

linearna promjena druge varijable, kažemo da je oblik veze između pojava LINEARAN. U

okviru regresione analize modeli se djele na linearne i nelinearne.

U regres.analizi se koriste podaci koji izražavaju stanje određenog momenta

(uzorak,osn.skup) i podaci koji se dobiju na osnovu posmatranja neke pojave u vremenskim

intervalima, koji obrazuju vremenski niz. U ekonomskim istraživanjima između različitih

varijabli razlikujemo vezu na osnovu jedne jednačine, na osnovu više jednačina i vezu na

simultanoj osnovi. Na osnovu jedne jednačine sagledava se zavisnost između zavisne

varijable i jedne ili više nezavisnih varijabli. Kod veza na bazi više jednačina radi se o

ispitivanju uticaja više varijabli na zavisnu varijablu, ali posebno za svaku nezavisnu

varijablu. Treću grupu čine dvije ili više zavisnih varijabli kada su u simultanoj vezi sa

određenim brojem bezavisnih varijabli.

Regresiona analiza obuhvata slijedeće etape:

-odrediti zavisnu i nezavisnu varijablu

-izabrati slučajan uzorak

-grafički predstaviti na dijagramu rasipanja

-na osnovu dijagrama rasipanja procjeniti oblik veze

-konsturisati odgovarajući model

-ocjeniti primjenom odgovarajucih metoda prarametre modela

-izračunati rezidualna odstupanja i analizirati ih

-testiranjem validnosti modela procjeniti kvalitet modela

-primjena modela za procjenu i predviđanje zavisne varijable.

DIJAGRAM RASIPANJA je grafiči prikaz kojim se uočava priroda odnosa dviju pojava

predstavljena vrijednostima numeričkog obilježja. Prije bilo kakve kvantitativne analize

obavezno treba prikazati podatke na ovom dijagramu, koji se crta u pravouglom

koordinatnom sistemu.

Numerička podloga za njegovu konstrukciju su vrijenosti varijabli x i y, pri čemu se na

apcisu nanose jedinične vrijednosti pojave koju smo označili kao nezavisna varijabla x, a na

ordinatu jedinice zavisne varijable y. Ucrtavanjem svih empiriskih parova podataka može se

na prvi pogled dobiti važna slika o eventualnom postojanju, obliku, smjeru, jačini veze

između posmatranih pojava.

slika LINEARNA VEZA /DIJAGRAM RASIPANJA/

5

Slika a) prikazuje funkcionalnu vezu između nezavisne i zavisne varijable. Zamišljena linija

koja povezuje sve tačke na slici je pravac, od koje nema odstupanja. Zbog toga se kaže da je

ova veza funkcionalna i pozitivna jer je pravac rastući.

U praksi gotovo nikad ne postoji ovakav primjer, nego je češći slučaj na slici b). Zamišljena

linija između tačaka na slici je takđe pravac, ali su prisutna određena odstupanja. Pozitiva i

negativna odstupanja od pravca se tumače uticajima drugih varijabli iz prakse. Zbog toga

kažemo da je veza statistička. I ova veza je pozitivna jer je zamišljeni pravac rastući.

Slika c) pokazuje funkcionalnu vezu između zavisne i nezavisne varijable a zamišljena linija

koja povezuje sve tačke na slici je opet prava. Pored toga što je veza funkcionalna porast

jedne varijable prati pad druge varijable, pa kažemo da je veza negativna.

U praksi je gotovo nemoguće sresti ovakav primjer, ali čest je primjer slika d). Zamišljena

linija između tačaka je pravac, a pozitivna i negativna odstupanja od pravca tumače se

uticajima drugih varijabli. Veza je statistička, a kako je zamišljeni pravac opadajući, veza je

negativna.

slika DIJAGRAM RASIPANJA / nelinearna veza i odsutnost veze/

6

Slika a) pokazuje funkcionalu krivolinijsku vezu između zavisne i nezavisne varijable.

Zamišljena linija koja povezuje sve tačke na slici je eksponencijalna kriva. Porast vrijednosti

jedne varijable prati porast vrijednosti druge varijable, pa je posmatrana veza pozitivna. U

praksi se češći je slučaj slike b) gdje je zamišljena linija kriva i prisutna su pozitivna i

negativna odstupanja zbog uticaja ostalih varijabli. Ovo je statistička veza, porast jedne

prati porast druge, pa je smijer pozitivan. Slika c) upućuje na zaključak da nema

povezanosti između posmatranih pojava. Zamišljena linija između tačaka ne postoji, jer se

za jednu vrijednost nezavisne varijable može dogoditi više različitih vrijednosti zavisne

varijable. Odsustvo kvantitativnih slaganja je prikazano na slici d) jer za razliku vrijednosti

nezavisne varijable dobijamo istu vrijednost zavisne varijable.

7

MODEL JEDNOSTAVNE LINEARNE REGRSIJE

Polazni model jedn,lin.regresije je

Yi=α+βxi+εi

gdje Y predstvalja zavisnu varijablu, X vrijednost nezavisne varijable, α odsječak na y osi,

β koeficijent nagiba i ε statistički član ( slučajna greška).

Zadatak regresione analize jeste pronaći najbolju liniju regresije uzorka i koristiti je umjesto

nepoznate linije regresije osnovnog skup, kako bismo na osnovu nje izvršili predviđanje.

Model jednostavne lin.regresije za n posmatnanih pojava varijabli x i y može se napisati kao

yi=a+bxi+ei

y- empirijska vrijednost te opservacije, a i b odjsečak na y osi i koeficijet nagiba,

ei- rezidualna odstupanja. (odnosi se na uzorak)

Liniju regresije u uzorku možemo predstaviti na slijedeći način:

y* = a+bx

gdje a+bx predstavlja funkcionalni dio modela gdje su ai b parametri koje treba procjeniti a

y* predstavlja procjenjenu vrijednost Y na osnovu posmatranih vrijednsoti od xi do X.

Procjene a i b se razlikuju od stvarnih vrijednosti α i β.

U statistici je predloženo više obj.metoda koje se korsite da si između empirijskih tačaka

povukli onu pravu liniju koja ih najbolje reprezentuje. Najčešće se koristi metoda najmanjih

kvadrata, koja obezbjeđuje minimum odstupanja prilagođenog modela od tačaka dijagrama

rasipanja.

Rezidualna odstupanja predstavljaju ocjenu slučajne greške u polaznom modelu

jednostavne lin.regrecije. Rezidual će biti pozitivan ako se empirijska vrijednost nalazi iznad

prave, negativna ispod prave. Regresiona prava će dobroi reprezentovati empirijski

raspored ako su vrijednosti reziduala male, i obrnuto. Cilj reg.analize jeste primjeniti metod

koji će minimizirati rezidualna odstupanja. ei= yi-y*

Relativna rezidualna odstupanja računaju se dijeljenjem tih odstupanja pripadajućom

stvarnom vrijednosti zavisne varijable puta 100.

Standardizovana rezidualna odstupanja se računaju dijeljenjem rezidualnih odstupanja

standardnom devijacijom regresije.

Model jednostavne lin.regresije ima slijedeće osobine:

-zbir odstupanja stvarnih vrijednosti zavisne varijable od regresijskih vrijednosti =0

-zbir kvadrata tih odstupanja je minimalan

-zbir proizvoda vrijednosti zavisne varijable i rezidualnih odstupanja =0

-zbir proizvoda nezavisne vrijable i rezidualnih odstupanja=0

-aritmetička sredina stvarnih vrijednosti zavisne varijable = aritm.sredini

regre.vrijednosti zavisne varijable

8

MJERE REPREZENTATIVNOSTI REGRESIONOG MODELA(str 315)

Regresiona analiza ne završava konstruisanjem regresione linije,već je potrebna I informacija o

stupnju varijabiliteta,koji utiče na reprezentativnost regresionog modela.Reprezentativnost

regresionog modela mjeri se stepenom varijacije,empirijskih vrednosti zaisne varijable u odnosu

na regresione vrednosti utvrđene modelom.

Prvi izvor varijabiliteta rezultat je varijacija u vrednostima nezavisne varijable X I može se

protumačiti regresionim modelom.Drugi izvor varijabiliteta je rezultat djelovanja slučajne

greške I ne može se protumačiti regresionim modelom.

Mjere za procjenu reprezentativnosti regr.temelji se na raščlanjivanju odstupanja

empirijskih vrijednosti zavisne varijable od njenog prosjeka. Formula 4.21 I 4.22 str 315 knjiga

gdje lijeva strana predstavlja zbir kvadrata odstupanja empirijskih vrijednosti zavisne

varijable od njene aritm.sredine( ukupni varijabilitet). Prvi član sa desne strane je zbir

kvadrata odstupanja regresionih vrijednosti od njene aritm.sredine ( protumačeni

varijabilitet). Odstupanja empirijskih vrijednosti zavisne varijable od regresijskih vrijednosti

predstavlja drugi član s desna( neprotupačeni varijabilitet)

Pokazateje varijacije podataka nazivamo mjerama disperzije koje omogućavaju posmatranje varijabiliteta

podataka u odnosu na regresionu liniju.Veća rasprašenost tačaka oko regresione linije uvijek znači manju

reprezentativnost regresionog modela I suprotno.

Odstupanja vrijednosti numeričkog obilježja od aritm.sredine zavisne varijable su različita po predznaku I

veličini a njihov zbir je jednak 0.

Budući da skoro nikad ne raspolažemo svim podacima osnovnog skupa,varijansu regresije ne možemo ni

izračunati.

Standardna devijacija regresije pokazuje prosječno odstupanje empirijske vrednosti zavisne varijable Y

od regresionih vrednosti utvrđenih modelom.(Formula 130)

9

Standardna devijacija regresije je apsolutna mjera disperzije jer je izražena u istim mjernim jedinicama

kao I zavisna varijabla.

Koeficijent varijacije regresije je relativna mjera disperzije I računa se kao omjer standardne devijacije

regresije I aritm.sredine zavisne varijable pomnožene sa 100. (Formula 132)

Koeficijent determinacije je pokazatelj reprezentativnosti regresije I računa se po formuli 126.

Koeficijent determinacije je pokazatelj reprezentativnosti, koji predstavlja omjer

protumačenog varijabiliteta i ukupnog varijabiliteta.

(formula 126)

To je relativna mjera i pokazuje kolko su varijacije zavisne varijable Y protumačene

nezavisnom varijablom X. Velika vrijednost koeficijenta ukazuje na malu disperziju oko

pravca, što povećava reprezentativnost modela.

Kao analitički pokazatelj koristi se i korigovani koeficijent determinacije, koji zavisi od

stepena slobode i može biti negativan. Ovaj koeficijent je manji ili jednak koeficijentu

determinacije.

Ako se varijabla x0 nalazi između drugih nezavisnih promjenjivih i ako se na osnovu nje

predviđa prosječna vrijednost zavisne promjenjive, onda se radi o INTERPOLACIJI. Kod

interpolacije nezavisna promjenjiva x0 se nalazi između najmanje i najveće vrijednosti

nezavisne varijable uzorka. Ako se vrijednost nezavinse varijable nalazi izvan intervala koji

je dat empirijskim podacima uzorka, onda je riječ o EKSTRAPOLACIJI.

INFERENCIJALNO STATISTIČKA ANALIZA U MODELU JEDNOSTAVNE LINEARNE

REGRESIJE

Teorijske pretpostavke za analizu modela metodama inferencijalne statistike odnose se na svojstva

zavisne varijable Y ili ekvivalentno na svosjstva slučajne varijable εi .

-Očekivana vrednost zavisne varijable Y za date vrednosti neovisne varijable X funkcija je vrijednosti

neovisne varijable I parametara α I β.Ta se funkcija zove regresiona funkcija osnovnog

skupa.Ekvivalentna pretpostavka εi=0 za svako i.

-Varijansa zavisne varijable za date vrednosti nezavisne varijable je konstantna I jednaka kvadratu

standardne devijacije za svako i.

-Vrednosti zavisne varijable međusobno su nekolinearne slučajne velićine odnosno njihova kovarijansa je

jednaka nuli.Ekvivalentno vrijednosti slučajne varijable εi međusobno su nekolinearne slučajne veličine.

-Zavisna varijabla je normalno distribuisana,odnosno slučajne varijale εi su indentično normalno

distribuirane.

Kvalitet modela jednostvane linearne regresije se mjeri testiranjem značajnosti parametra β

H0: β=0 H1: β≠0

Prema nultoj hipotezi regresiona varijabla X je suvišna u modelu dok H1 sadrži tvrdnju da regresiona

varijabla X objašnjava varijacije varijable Y.U praksi nisu poznate vrijednosti koeficijenata regresione

linije osnovnog skupa,njihove vrednosti procjenićemo na osnovu uzorka.U tom slučaju slijedi da je :

H0: b=0 H1:b≠0

Test statistika predstavlja omjer procjene regresionog koeficijenta sa standardnom greškom te

procjene.(formula 134)

Ako je apsolutna vrednost testovne veličine manja od kritične vrednosti onda se prihvata nulta hipoteza I

suprotno.

Pod brojem stepeni slobode nekog statističkog parametra podrazumjevamo broj neovisnih opažanja n

umanjen za broj parametara k potrebnih da bi se odredio dati parametar.

10

Broj događaja koji pri izračunavanju nekog statističkog parametra mogu slobodno varirati nazivamo broj

stepeni slobode.

Za testiranje hipoteza u modelu jednostavne linearne regresije koristi se I F-test.Uobičajeno je da se

empirijski F-omjer navodi u tabeli analize varijanse (ANOVA).Odluka se donosi poređenjem empirijskog

F-omjera sa kritičnim vrednostima F-distribucije uz odgovarajući nivo značajnosti α I br.stepeni slobode

(1;n-2).Ukoliko je empirijski F-omjer manji od teorijskog prihvata se H0 I obratno.

Ako su ispunjene pretpostavke u regresivnom modelu I ako uzorak potiće iz normalne distribucirane

populacije,tada sampling distribucija regresivnog koeficijenta normalnog oblika intervala procjene β se

računa kao (fomula 135 druga samo što umjesto y0 je b a umjesto t je z).

Kada je osnovni skup normalne distribucije s nepoznatom varijansom sampling distribucije sa (n-2)

stepena slobode.

Procjena je pouzdanija što je interval širi tj. Veća je vjerovatnoća da će se u njemu naći posmatrani

parametar..Jednačina regresie omogućava procenu vrednosti zavisne varijable za određenu vrijednost

neavisne varijable koja nije postojala kao jedinica.Kod interpolacije nezavisne promjenjive x0 nalazi se

između najmanje I najveće vrednosti nezavisne varijable uzorka.Procjena zavisne varijable provodi se

brojem I intervalom.Brojem pomoću regresione jednačine I jednak je regresionoj vrednosti a intervalom

(druga formula 135) a procjena standardne greške procjene regresije se računa (treća formula 135).

Da bi predviđanje pomoću regresionog modela bilo validno neophodno je da se parametar β statistički

značajno razlikuje od nule te je potreban visok nivo koeficijenta determinacije.

JEDNOSTAVNA KRIVOLINIJSKA REGRESIJA

Nelinearne dvodimenzionalne regresione modele moguće je odgovarajućom transformacijom svesti na

model jednostavne linearne regresije.Transformacija se provodi na vrijednostima zavisne I nezavisne

varijable,a zavisi od oblika funkcionalnog dijela modela,koji izvire iz teorijskih postavki područja u kome

se model primjenjuje.Model kojim se izražavaju nelinearni odnosi među pojavama naziva se modelom

jednostavne krivolinijske regresije.

Navedeni nelinearni regresioni modeli analiziraju se na isti način kao I model jednostavne

linearne regresije,s tim da pri interpretaciji rezultata vodimo račna da sa statističke veličine

izračunate za model sa transformisanim a ne sa originalnim vrijednostima varijabli.

KORELACIONA ANALIZA -se bavi istraživanjem uzajamnih odnosa među pojavama, ali ne i uzročno-posljedičnim

vezama među njima.

Ako postoji jaka veza između dvije posm.pojave nije uvijek moguće odrediti nezavisnu i

zavisnu varijablu, te ispitujemo međuzavisnost između posm.varijabli. Kada su dvije pojave

povezane stohasticki a ne zna se da li se mjenjaju istovremeno ili se razlikuju u pogledu momenata

mjenjanja gocori se o korelacionoj povezanosti.

11

Za korelaciju je najbitniji pravac promjena dvije korelaciono povezane pojave isti, govori se

o pozitivnoj korelaciji, a kada je pravac različit, riječ je o negativnoj korelaciji.

Zadatak korelacione analize je da utvrdi stepen slaganja varijacija posmatranih pojava i

objasni oblik, smjer i jačinu veze između varijabli.

KOEFICIJENT JEDNOSTAVNE LINEARNE KORELACIJE -je brojčani pokazatelj kojim se izražava pojava u statističkoj analizi. Izražava međusobni

odnos dvije pojave kada se on ispoljava u nekoj pravolinjskoj tendenciji.

Postoji više vrsta koeficijenata korelacije, ali se u praksi najčešće koristi Pearsonov

koeficijent korelacije, koji u obzir uzima kovarijansu i standardne devijacije obje

posmatrane pojave. Pearsnov koeficijent korelacije je broj koji pokazuje u kojoj su mjeri

dvije uporedive pojave povezane, odnosno u kojem se obimu mjenjaju kada jedna promjena

izaziva promjenu druge pojave.

Koeficijent linearne korelacije mjeri jačinu i smjer povezanosti posmatranih pojava, a varira

u zatvorenom intervalu od -1 do +1. Znak + ukazuje na direktnu vezu, a - na inverznu

linearnu vezu. Viša apsolutna vrijednost ukazuje na višu povezanost.

Interpretacija visine pojedinog koeficijenta korelacije zavisi u prvom redu o pojavam čija se

povezanost ispituje, o ustanovljenim korelacijama u sličnim situacijama, o praktičnim

zahtjevima o pojedinim konkretnim slučajevima, tako da vrijednost ovog koeficijenta ne

treba shvatati grubo.

Koeficijent korelacije r moguće je izračunati pomoću koeficijenta determinacije ili pomoću

proizvoda regresijskog koeficijenta b i omjera standardnih devijacija varijabli x i y. Koeficijent

korelacije jednak je geometrijskoj sredini koeficijenata smjera obje regresione linije, a

predznak se određuje prema predznaku regres.koeficijent

Visina korelacije nije samo odraz stepena povezanosti između dvije varijable, nego može

biti posljedica različitih uticaja, od kojih su najvažniji:

-nelinearna veza – ako veza izmedju dvije varijable nije linearna koef.korelacije moze biti

toliko iskrivljen da njegovo izracunavanje nema smisla

-simetrična i unimodalna dustribucija posmatranih varijabli – vazan uslov realnosti slike koju daje

koeficjent korelacije r je simetricnost kojom se postize homoscedasicnost odnosa posmatranih

varijabli.asimetricnost jedne ili obje varijable ima za posljedicu nepravilnost u linearnosti tacaka koje tvore podaco

u dijag.rasipanja

-grupisanje rezultata – ako grupisemo rezultate u razrede to nece znacajno mijenjati

koeficjent korelacije samo ako je br.razreda dovoljno velik

-kauzalna interpretacija korelacije – dvije pojave koje su u korelacionoj vezi mogu biti i u

uzrocnoj veui. Sama cinjenica da izmedju 2 pojave postoji korelacija jos nam daje za pravo da te

pojave podjelimo uzrocnom vezom

-uticaj raspona – ako je raspon varijacije ogranicen u jednoj varijali, on je zbog toga nuzno

ogranicen i u drugoj varijabli sto znacajno smanjuje visinu korelacije.

-eliminisanje vrijednosti oko aritmetičke sredine – kod analze odnosa izmedju 2 varijable

istrazivaci ponekad iskljucuju sredisnje podatke.

-podskupovi s različitim aritmetičkim sredinama – ako prilikom istrazivanja koristimo

podskupove u korelacionoj analizi moguci su razliciti slucajevi. A) da svaki od

podskupova u korelacionoj analizi ne pokazuje nikakvu korelaciju izmedju varijable x i y

ali sastavljeni zajedno daju poz.korelaciju. B) da svaki podskup ima pozitivnu i nisku

korelaciju ali da zajedno daju pozitivnu i visoku korelaciju C) da svi podskupovi daju

neg.korelaciju ali zajednicka korelacija im bude oko 0.

12

U praksi se ponekad javlja potreba za računanjem korelacije između dvije kontinuirane

varijable, po pretpostavci normalno distribuirane u osnovnom skupu, s tim da je jedna od

varijabli namjerno dihotomizirana.

Dihotomija varijabli ( podjela na 2 modaliteta) predstavlja najgrublje moguće mjerenje, jer

posmatranu pojavu razlikujemo samo u dvije kategorije. Svođenje na 2 modaliteta je obično

posljedica jedinog načina na koji se mogu dobiti podaci. Za računanje korelacije između

kontinuirane i dihotomizirane varijable koriste se slijedeći koeficijenti: biserijski koeficijent i

point biserijski koeficijent FORMULE

TESTIRANJE ZNAČAJNOSTI PROCJENE KOEFICIJENTA r

U koleracionoj analizi ima nekoliko postupaka koji se mogu koristiti za testiranje značajnosti koeficijenat

korelacije. Uglavno u praksi nije poznata vrijednost koeficijenta korelacije osnovnog skupa, njegovu

značajnost procjenjujemo na osnovu uzorka. Ako za neki koeficijent korelacije, izračunat na

reprezentativnom uzorku za osnovni skup, utvrdimo da je statistički značajan, onda se on značajno

razlikuje od nule. U suprotnom slučaju, ako utvrdimo da koeficijnet korelacije niije statistički značajan,

onda se on ne razlikuje značajano od nule(0). Test hipoteze3 o značajnosti parametra p može biti

dvosmijeran i jednosmijeran. Kod dvosmijernog testiranja hipoteze između pojava u osnovnom skupu ne

postoji linearna korelacija: H0: p=0 H1:p≠0. Alternativna hipoteza pokazuje da u osnovnom skupu postoji

linearna korelacija, ali ne govori ništa o jačini veze. Testiranje hipoteze o koeficijentu korelacije

zasnovano je na odgovarajućoj sampling distribuciji. Ako uzorak potiče iz osnovnog skupa onda test

stetistika predstavlja omjer procjene koeficijenta korelacije sa st.greškom te procjene:FOR.140 i slijedi

Studentov raspored sa(n-2) stepeni slobode. Stand.greška procjene koef korelacije se računa:FOR.140.I

pkazuje koliko u prosjeku koef korel uzorka odstupa od keof korel Osnovnog skupa. Odluka se donosi

poređenjem testovne veličine sa odgovarajućim kritičnim(tabličnim) vr sampling distribucije. Ako je

apsolutna vrijednost testovne vel manja od kritične vrijednopsti(uz određeni nivo značajnosti) onda se

prihvata nulta hipoteza, odnosno koef koerl nije statistički značajan i superotno.Upoređivanjem p-

vrijednosti sa unaprijed određenim nivoom značajnosti može se donijeti odluka o odbacivanju ili

prohvatanj H0. Ako je p<α , onda ćemo odbaciti H0 i prihvatiti H1, a ako je p> α zaključujemo da

nemamo dovoljno razloga da odbacimo H0.

BISERIJSKI KOEFICIJENT KORELACIJE Za primjenu ovog koeficijenta neophodno je da se ispune 2 uslova. Prvi se odnosi ba

pretpostavku da se prva varijabla normalno raspoređuje u osnovnom skupu i da njene

mjere potiču s intervalne mjerne skale.

Drugi uslov podrazumjeva namjernu podjelu druge varijable na 2 modaliteta.

Mjera povezanosti dvije kontinuirane varijable, od kojih ni jedna po svojoj prirodi nije

dihotomna, ali se podaci jedne varijable djele u 2 kategorije, iskazuje se koeficijentom

biserijske korelacije. Primjena koef je opravdana kada je varijabla Y kontinuirano mjerena,

ali postoje nepravilnosti koje onemogućavaju primjenu koeficijenta r.

Postupak za izračunavanje biserijskog koeficijenta:

a)prvo se računa aritm.sredina -)onih rezultata varijable x kod kojih se u varijabli y nalazi

prva dihotomna oznaka i --)onih rezultata varijable x kod kojih se u varijabli y nalazi druga

dihotomna oznaka.

b) proporcija p i q se dobija na osnovu mjera frekvencija svakog od dihotomnih modaliteta

varijable Y.

c) nakon toga se računa standardna devijacija varijable x

d)u tabeli se nađe vrijednost proporcije p ili q u koloni s tim nazivom,a zatim se u istom

redu potraži odgovarajuća vrijednost izraza pq/y

e) vrijednost biserijskog koeficijenta se dobija uvrštavanjem prethodnih izračunatih

vrijednosti u izraz 2.1

13

POINT BISERIJSKI KOEFICIJENT KORELACIJE U praksi se često javlja potreba za računanjem korelacije između 2 vari., pri čemu je jedna

od varijabli kontinuirana, a druga po svojoj prirodi atributivna ili dihotomna. Mjera

povezanosti dvije varijable od kojih je jedna kvantitativna i kontinuirana, a druga po svojoj

prirodi dihotomna utvrđuje se point biserijskim koeficijentom. Za primjenu ovog koef.

neophodno je ispuniti slijedeće uslove: prva varijabla se normalno raspoređuje u populaciji i

potiče sa intervalne skale, a druga varijabla je po svojoj prirodi dihotomna i nikako ne može

biti normalno raspoređena. Između ove dvije diskretne kategorije postoji prekid,

diskontinuitet, u jednoj tački, od koje potiče naziv metode. Ima širi primjenu nego biser.kof.

Preporučuje se računanje biserijskog koef kada je dihotomna varijabla van svake sumnje

nornalno distrubuirana. Ako postoji mala sumnja da dihotomna vari. nije normalno

distribuirana, primjenjuje se point biserijski koeficijent korelacije.

KOEFICIJENTI KORELACIJE RANGA

Korelacija ranga je metoda kojom se mjeri povezanost rangova dvije ili više varijabli ranga.

Ako su varijable numeričke, treba ih transformisati u varijable ranga. Raširena metoda

neparametarske statistike.Nije potrebno da posmatrane pojave budu u linearnom odnosu.

Koeficijent rang korelacije ima prednost nad r koeficijentom kada kod mjernih rez postoje

extremne vrijednosti.

Ispitivanje stepena povezanosti između pojava datih u obliku modaliteta rang varijable nie

moguće na isti način kao i za modalitete numeričkih nizova. Neophodan je drugačiji pristup,

jer varijable nemaju potrebna metrička svojstva. Izdvajamo Spearmanov koeficijent(2

varijable ranga) i Kendelov koeficijent(za grupu varijabli ) rang korelacije.

-Spearmanov koeficijent korelacije ranga- -koristimo za utvrđivanje stepena povezanosti između pojava kod kojih su podaci dati u

obliku modaliteta rang varijable. To je u stvari koeficijent r primjenjen na rangirane

podatke. Varira u zatvorenom intervalu od -1(perfektna inverzna veza) do +1(perfektna

direktna veza).0 ukazuje na odsustvo veze između posmatranih pojava.

Koeficijent je jednak -1 kada je redosljed modaliteta prve rang varijable suprotan od

redosljeda druge rang varijable u paru i tada govorimo o perfektnoj inverznoj vezi.

O perfektnoj direktvoj vezi govorimo kada je koeficijent jednak 1, odnosno kada su u

svakom paru rangovi jednaki. Tada je svako d=0. Koeficijent je jednak nuli za najveće

neslaganje rangova, odnosno kada je zbir kvadrata razlika rangova jednak.

Kendelov koeficijet W u praksi ponekad imamo slučajeva kada nas zanima slaganje između tri i više nizova ranga.

U tu svrhu koristi se Kendelov W koeficijent. U brojniku se nalazi aritmetička sredina

rangova za i-ti red i aritmetička sredina svih rangova.

Kendelov koeficijent ne može biti negativnog predznaka. pr.Ako se članovi komislije nikako

ne slažu, koeficijent W je jednak 0, a ako se slažu u potpunosti, jednak je 1. Ovaj koeficijent

testira odnos između stvarnog slaganja i maksimalnog mogućeg slaganja. Testiranje

značajnosti W vrši se poređenjem testovne veličine s tabličnom veličinom za odgovarajući

nivo značajnosti alfa, veličinu uzorka n i K varijabli ranga.Može se utvrditi i pomoću hi-

kvadrat testa. U koliko se utvrdi da je hi-kvadrat značajan, onda je i W koef značajan.

14

KOEFICIJENTI ASOCIJACIJE

-se korsite za mjerenje povezanosti dvije ili više nominalnih varijabli. Mjerenje stepena

povezanosti između modaliteta nominalne varijable nije moguće na isti način kao i za

modalitete numeričkih i ordinalnih nizova. Neophodan je drugačiji pristup, jer nominalne

varijable nemaju potrebna metrička svojstva modaliteta numeričke ili rang varijable.

Nominalna skla je najnepreciznija skala i služi samo za klasifikaciju.

Ovi koeficijenti daju samo približnu indikaciju asocijacije između posmatranih pojava, pa je

potrebno posebnu pažnju posvetiti kvantitativnom mjerenju stepena i smjera, te

tumačenje njihove veze.

Podaci se unose u kontigencijsku tabelu. Upotrebom izraza kontigencija, umjesto

korelacija, želi se naglasiti oblik povezanosti koji se javlja između diskontinuiranih

nominalnih varijabli.

Manje se radi o odnosu modaliteta posmatranih pojava, a više o međusobnom stanju

modaliteta posmatranih varijabli. U literaturi se navode slijedeći koeficijenti asocijacije:

Pearsonov koeficijent kontigencije C, Cramerov koeficijent K i koeficijent fi.

Pearsonov koeficijent kontigencije

Kontigencijom C se utvrđuje zavisnost dva obilježja u dvodimenzionalnoj tabeli

kontigencije. Koeficijent C ne zahtjeva simetričnu raspodjelu posmatranih varijabli.

Asocijcija između nominalnih varijabli je slabija kada su razlike između empirijskih i

očekivanih frekvencija manje. Koeficijent kontigencije C se zasniva na hi-kvadart testu.

C=

Hi kvadrat test se koristi kada trebamo utvrditi da li neke opažene frekencije zajedno

odstupaju od očekivanih vrijednosti. Kreće se u zatvorenom intervalu od 0 do 1. Min vrijed

je 0, a max zavisi od broja posmatranih modaliteta, ali nikad nie veća od 1. Vrijednost koef.

ukazuje na postojanje povezanosti, ali ne i na smijer, odnosno da li je veza pozitivna ili

negativna. Istraživač određuje smijer na osnovu kretanja podataka u tabeli kontigencije.

Ovaj koef se koristi za diskontinuirane podatke, njegovo poređenje sa koefi r obično nie

opravdano. Koef C nie pouzdana mjera onda kada se u tabeli kontigencije jave suviše male

očekivane vrijednosti. Može se poboljpati smanjenjem tabele.

Cramerov koeficijent asocijacije K

Zbog teškoća u interpretaciji koeficijenta kontigencije C u praksi se sve više koristi

koeficijent K. Polaznu osnovu za računanje C koeficijenta čine razlike između empirijskih i

očekivanih frekvencija, odnosno testova vrijednost hi kvadrata.

K=

Kreće se u zatvorenom intervalu od 0 do 1. Koef poprima vrijednost 0 u slučaju nezavisnih

nominalnih varijabli. Koeficijent uzima max vrijednost 1, u slučaju potpunog slaganja

posmatranih varijabli. Ovom koeficijentu se ne pridružuje predznak

Koeficijent fi

-mjeri se povezanost dvije varijable koje su obje po svojoj prirodi dihotomne ili je jedna

takva, a druga dihotomna samo po obliku( a po prirodi numerička i kontinuirana). Za

15

računanje ovog koef neophodno je da da bar jedna varijabla bude prirodno podjeljena na

dva modaliteta. Koeficijent fi se često upotrebljava i u slučajevima kada je jedna od varijabli

po prirodi kontunuirana, a samo se prikazuje dihotomno zbog razgraničenja na odeđenom

mjestu kontiniuma. Radi se o parametarskoj metodi, jer se ne može pretpostaviti normalna

distribucija kod dihotomnih varijabli. Računa se dir iz tabele kontigencije a i može se izvesti

iz hi-kvadrata.

Fi koeficijent varira od -1 do 1. Vrijednost 1 postiže samo ako je(a+b)=(a+c), odnosno -1

postiže ako je (a+b)=(b+d). [ a,b,c,d pojedine frekencije iz 4 ćelije tabele. a i d na jednoj

dijagonali a, b i c na drugoj dijagonali. ]

KORELACIJA IZMEĐU NOMINALNE I RANG VARIJABLE U praksi se ponekad javlja potreba za mjerenjem stepena povezanosti između pojava datih

u obliku nominalne varijable i rang varijable. Potreban je drugačiji pristup, jer nominalna i

rang varijabla nemaju poterbna metrička svojstva modaliteta numeričke varijable.

Tu korelaciju računamo najčešće Kendelovim tau koeficijentom i Freemanovim teta

koeficijentom.

Kendelov tau koeficijent

-koristimo kada želimo da utvrdimo povezanost varijabli od kojih je jedna rang varijabla a

druga dihotomna nominalna varijabla. U koliko nie svejedno da li jedinica pripada jednoj ili

drugoj grupi, onda to znači da postoji povezanost između posmatranih pojava.

(formula)

Freemanov teta koeficijent

-koristimo kada želimo da mjerimo povezanost pojava koje su predstavljene rang

varijablom i dihotomnom nominalnom varijablom. Koef tau i teta se značajno razlikuju, a

prednost ide Freemanovom teta koeficijentu, jer kod potpune povezanosti koeficijent teta

daje očekivani maximalnu rezultat 1, bez obzira na vel uzorka, dok se koef tau smanjuje što

je uzorak veći.

(formula)

Ris predstavlja zbir rangova ispod prilikom poređenja ranga svake jedinice prvog podskupa

sa rangovima svih jedinica drugog podskupa, a Riz , zbir rangova iznad.

Možemo ga koristiti i kada nema vezanih rangova.

PARCIJALNA KORELACIJA Zakon jedne varijable poretpostavlja eliminisanje djelovanja svih drugih varijabli da bi se

utvrdila povezanost varijabli koje su predmet posmatranja. U tom slučaju će se primjeniti

postupak kojim se uvtrđuje povezanost dvije varijable uz eliminisanje treće varijable. Ovim

postupkom se od ukupne korelacije oduzima onaj dio koji je nastao djelovanjem treće

varijable. Tako dobiveni dio ukupne korelacije naziva se parcijalna korelaija.

(formula 2.40)

Koeficijent parcijalne korelacije uzima vrijednosti od -1 do 1.

Parcijalna korelacija može biti linearna i nelinearna. U praksi se u glavnom koristi metom

linerane parcijalne korelacije.

ZAKLJUČNA RAZMATRANJA O MJERAMA KORELACIJE Koeficijent korelacije je indeksni broj i nije mjera na linearnoj skali jednakih jedinica. Razlike između

velikih vrijednosti r i su mnogo veće nego one između malih vrijednosti r. Ne možemo tvrditi da je kod

koeficijenta r= 0,6 dva puta veća povezanost nego kada je r= 0,3, ali možemo reći da je r= 0,75 ukazuje

na isto tako čvrstu povezanost kao što to pokazuje r= 0,7.

16

U vezi interpretacije koeficijenta korelacije prisutna su dva gledišta: teorijsko i praktično. S teorijskog

gledišta svaki koeficijent korelacije koji je statistički značajan može da ukazuje na neku povezanost

između pojava, pa je opravdano uzeti i male koeficijente korelacije kao pokazatelje povezanosti, ali na

pojave koje su predmet našeg posmatranja utiču različiti fktori i okolnosti, koji izmiču našoj kontroli. S

obzirom da vrlo rijetko dobijemo potpunu korelaciju, slijedi da prilikom interpretacije nekog koeficijenta

korelacije treba uvijek uzeti u obzir uslove pod kojima je izračunat.

S druge strane gledišta, koeficijent korelacije je indikativanza povezanost između posmatranih pojava

(možda i za neku zakonitost u teorijskom smislu), može biti bez praktičnih važnosi. Koeficijenti

korelacije služe, pored ostalog, i za statistička predviđanja. Ako je korelacija između pojava visoka, onda

je statističko predviđanje sigurnije i obratno.

Koeficijent korelacije ne predstavlja nikakvu apsolutnu prirodnu činjenicu i da ga možemo tumačiti

uvažavajući uslove u kojima je izračunat. Potrebno je da znamo koja varijabla se mjeri, kojim mjernim

instrumentima, pod kojim okolnostima i u kojoj populaciji. Prema tome, koeficijent korelacije je potpuno

relevantan okolnostima pod kojima je izračunat i treba da bude interpretiran u svijetlu tih okolnosti.

MULTIPLA LINEARNA KORELACIJA

Kod multiple linearne korelacije istražujemo povezaost dviju ili više nezavisnih varijabli sa

zavisnom varijablom.

Koeficijenti multiple korelacije su značajniji jedino u slučaju kada raspolažemo dovoljnim

brojem podataka i kada su svi pojedinačni koeficijenti korelacije r linearni. Jedno od

značajnih područija istraživanja koje se zasniva na utvrđivanju višestruke povezanosti je

prognoza budućeg uspjeha na osnovu rez prethodnih testova i sl.

Koeficijent multiple linearna korelacije možemo računati pomoću elemenata korelacione

matrice, kao drugi korjen iz koeficijenta multiple determinacije, pomoću regresionih

koeficijenata i omjera stand.devijacija varijabli i na druge načine. Varira u intervalu od 0 do

1. Ne pridružuje mu se predznak.

Postoje 2 gledišta tumačenja koefi multiple lin korelacije: teorijsko i praktično.

Sa teorijskog gledišta, svaki koef korelacije koji je stat značajan može da ukazuje na neku

povezanost između pojava. Međutim, na pojave koje su predmet našeg posmatranja utiču i

razl faktori i oklnosti, koji izmiču našoj kontroli.

Sa praktičnog gledišta, koef korelacije koji je indikativan za povezanost

između posmatranih pojava, može biti bez praktične važnosti. Koef korelacije služe, pored

ostalog, i za stat predviđanja. Ako je korelacija između pojava visoka, onda je stat

predviđanje sigurnije i obrnuto.

Parametarske metode se primjenjuju pod strogo određenim uslovima o normalnosti

rasporeda posmatranih varijabli. Neparametarske metode su nezavisne od oblika

distribucije varijabli, pa su i ti koeficijenti manje pouzdane mjere korelacije.

DINAMIČKA ANALIZA VREMENSKIH NOZOVA

U desktiptivnoj statistici za nedovosmisleno određivanje pripadnosti elem posmatranom

osnovnom skupu, neophodno je je pojmovno, prostorno i vremensko definisanje.

Pojmovno definisanje osn skupa podrazumjeva da se tačno i precizno odredi osobina koju

mora da ima svaka stat jedicnica da bi bila uključena u skup.

Prostorno odrediti skup znači tačno odrediti prostor na kojem pripadaju stat jedinice.

Vremensko definisanje skupa podrazumijeva da se precizno odredi vrijeme kada ce se

posmatranje realizirati.

17

Dinamička analiza obuhvata istraživanje zakonitosti kretanje masovnih pojava u vremenu,

odnosno omogućava praćenej promjena pojave u vremenu i predviđanje tendencije razvoja

pojava. Ova analiza podrazumjeva praćenje kvantitativnih promjena pojava, kako u obimu

tako i u strukturi tokom vremena. Zakonitosti kretanja masovnih pojava kroz vrijeme često

su predmet ekonom. i drusštvenih istraživanja, a u otkrivanju tih zakonitosti pomažu nam

metode stat analize vrem nizova( serija). Pomoću vrem serija koje predstavljuju nizove

podataka o niovu posmatranih pojava u sukcesivnim vremenskim intervalima, prelazi se sa

stat aspekta na dinamički aspekt posmatranja.

VREMENSKI NIZ KAO IZRAZ DINAMIKE -je skup hronološki uređenih vrijednosti posmatrane pojave. Vrijednosti čijim redanjem

nastaje vremenski niz zove se frekvencija.

Prema načinu nastanka, razlikujemo intervali i trenutni.

Ako je neku pojavu moguće posmatrati samo u nekom intervalu dobićemo frekvencije

pojedinih vremenskih jedinica, čijim uređivanjem nastaje intervalni vremenski niz. Sve one

pojave koje imaju jedan smjer kretanja, koji je određen početkom i krajem perioda, možemo

posmatrati samo u određenom periodu vremena.

Kod trenutnog vremenskog niza radi se o pojavama čija priroda nameće posmatranje samo

u jednom trenutku ili presjeku. Rez ovakvih posmatranja su frekvencije koje pokazuju nivo

pojave u određenom trenutku, a njihovim uređenjem nastaje trenutni vrem.niz.

Sabiranjem vrijednosti pojave po odabranim vremenskim intervalima nastaju frekvencije

intervalnog vrem niza. Ovaj niz ima svojstvo kumulativnosti, pa se zato frekv mogu sabirati.

Trenutni niz predstavlja skup hronološki uređenih vrijednosti, koje predstavljuju stanja

pojava u odabranim vrem tačkama.

Prema načinu iskazivanja posmatrane pojave razlikujemo izvorni i izvedeni vrem niz.

Izvorni vrem niz nastaje hronološkim uređenjem veličina koje su rezultat direktnog

mjerenja pojava po odabranim vremenskim intervalima.

Ukoliko su frekvencije rezultat brojčanih operacija nad jednim ili više vrem nizova onda se

radi o izvedenom vrem nizu.

Konzistentnost vremenskog niza

Ispravni zaključci o dinamici posmatrane pojave mogući su ako je vremenski niz

konzistentan, odnosno ako se radi o uporedivim podacima. Posebnu pažnju treba usmjeriti na:

definisanje i mjerenje varijable na isti način u cjelom posmatranom periodu, iste vremenske jedinice

posmatranja, administrativno teriotorijalne promjene, te na stabilnost cijena kod vrijednosnog

istraživanja.

Tokom vremena mjenja se definicija posmatranih pojava, mjenjaju se kriteriji razgraničenja,

metodi mjerenja i načina iskazivanja. Ovaj problem je posebno izražen kod dužeg

posmatranja neke pojave gdje kao neminovnost dolazi do promjene njenog sadržaja, a

samim tim i njenog definisanja, mjerenja i iskazivanja. Sve to značajno utiče na upoređivanje

podataka.

Drugi faktor na koji trebamo obratiti pažnju kada se radi o zahtjevu uporedivosti nizova je

vremenski interval posmatranja. Podatke ima smisla upoređivati samo ako se odnose na

iste vremenske jedinice. Vremenske jedinice dobijamo tako što stat skup raščlanimo prema

vremenskom obilježju. To znači da će svaka vremenska jedinica biti definisana jednim

vremenskim periodom, a frekvencije te jedinice predstavljat će onaj dio skupa koji pripada

tom periodu. Za vrem obilježje upotrebljavamo kalendarska razdoblja:godina, polugodište,

kvartal...

18

Kod rasporeda frekvencija u desktiptivnoj statistici uvijek se prije upoređivanja frekvencija

provjerava da li su razredi jednake veličine. Ako nisu, onda se koriguju, pa tek onda

uporešuju frekvencije. Radi uporedivosti podataka, sličan postupak ćemo koristiti i kod

analize konzistentnosti niza. Frekvencije se koriguju svođenjem na najmanji vremenski

interval.

Kod trenutnog vremenskog niza varijacije dužine istih kalendarskih jedinica ne utiču na

njihovu uporedivost. Poželjno je da su frekvencije vezane za jednako udaljene vremenske

tačke, jer to pojednostavljuje postupke.

Česte administrativno teriotorijalne promjene takođe otežavaju uporedivost podataka.

Kroz duži vremenski period je teško zadržati prostornu definiciju pojave, jer se u vremenu

mjenjaju i prostorne granice. U slučajevima gdje je to moguće, potrebno je pregrupisati

podatke u nizove uporedivih podataka.

Posebnu pažnju zaslužuju nizovi koji dinamiku pojava izražavaju vrijednosno. Kod ovih

nizova promjene cijena značajno determiniraju veličine pojave. Da bi se u ovakvim

slučajevima sagledala realna dinamika posmatrane pojave potrebno je eliminisati uticaj

promjena u tekućim cijenama na njeno ponašanje. To se radi na taj način što se vrijednost

prodaje za čitav posmatrani period obračunava po stalnim cjenama, odnosno cijenama iz

perioda koji se odabere kao bazni.

CILJEVI I PRISTUPI ANALIZE VREMENSKIH NIZOVA Analizom vrem nizova želimo postići slijedeće ciljeve:

Desktipcija pojave - u prvoj etapi izučavanja osnovnih karakteristika vrem niza koristimo graf

prikazivanje i deskriptivnu statistiku.

Objašnjenje varijacije pojave- kada raspolažemo sa više vremenskih nizova moguće je

koristiti varijacije jednog niza za objašnjenje varijacija drugog niza.

Predviđanje razvoja pojave- na osnovu prošlih opservacija identificiramo i procjenjujemo

model vremenskog niza i zatim ga korsitmo za predviđanje budućih nivoa pojave. Predviđanje

se bazira na pokazateljima dinamike ili modelima vremenskih pojava.

Kontrola procesa- ovaj zadatak analize posebno je interesantan u analizi vremenskih nizova

koji se javljaju u statističkoj kontroli kvaliteta. Potreba za regulacijom procesa javlja se kod

različitih neusklađenosti, koje su rezultat pojave premalih ili prevelikih vrijednosti niza.

Statističke metode možemo razvrstati u dvije grupe:

a) metode koje analizi vremenskih nizova pristupaju sa stanovišta vremena

Istraživanje razvojnih tendencija vremenskih nizova u funkciji vremena je predmet

ove metode. Postoje dva pristupa: 1) sastoji se u utvrđivanju analitičkih izraza kojima se

opisuje razvoj pojave i to pomoću f-je vremena. 2) izvire iz težnje da se statistički opiše

dinamička struktura pojave a ne njeno kretanje u vremenu. Ovaj pristup podrazumijeva

mjerenje stepena i smjera korelacije članova niza, razmaknutih jedan, dva ili više perioda

kao i analitičko izražavanje te međuzavisnosti.

b) metode koje joj prilaze sa stanovišta frekvencija

ova metoda spada u područije spektralne i harmonijske analize. Manje se koristi od

prethodne metode, jer je mnogo složenija.

19

GRAFIČKO PRIKAZIVANJE VREMENSKIH NIZOVA

Da bi frekvencije, odnosno podaci i rezultati koje izražavaju vremenski nizovi postali

razumljiviji, u statistici se za njihovo predstavljanje koristi grafičko prikazivanje. Danas se

konstrukcija grafikona i dijagrama vrši pomoću statističkih ili sličnih računarskih programa.

Vremenski nizovi se mogu grafički prikazati na više načina.

Tekstualni dio grafikona treba da sadrži: naslov, oznaku jedinice mjerenja, oznake perioda

na apsici, izvor podataka i po potrebi objašnjenje i napomene.

Na grafikonima, radi lakšeg prikazivanja, često se označava mreža. Ona se u pravouglom

koordinatnom sistemu sastoji od spleta horizontalnih i vertikalnih linija, koje uobičajno

prolaze kroz karakteristične tačke mjerila na koordinatnim osama.

U koliko intervali posmatranja nisu jednaki, neophodno je korigovati frekvencije. Vremenski

niz sa korigovanim frekvencijama prikazuje se linijskim ili površinskim grafikonima.

Intervalni niz prikazuje se linijskim i površinskim grafikonima.

Linijski grafikoni su jednodimenzionalni i koriste se za prikazivanje vremenskih nizova kod

pojava koje imaju svoj tok, dinamiku i razvoj. Naglašavaju brzinu, a ne veličinu promjena.

Preglednost linijskih grafikona doprinosi i prekid mjerila na ordinati. Postupak izostavljan ja

djela aritimetičkog mjerila na ordinati omogućava jasnie uočavanje malih varijacija pojave i

tada je riječ o horizontalnom prekidu grafikona.

Grafikon se konstruira tako što se na apsicu unosi aritmetičko mjerilo za vrijeme, a na

ordinatu aritimetičko mjerilo za frekvencije. Linijski grafikon nastaje spajanjem tačaka čije

su koordinate date sredinama posmatranih vremenskih perioda i frekvencijama. Apcise tih

tačaka određene su sredinama dužina koje predstavljaju periode a ordinate tačaka zavise

od frekvencija. Apsolutne razlike frekvencija pojedinačnih posmatranih pojava

predstavljene su razlikama ordinata dviju tačaka, dok je intenzitet promjena pojave

predstavljen srminama linija.

Površinski grafikoni imaju dvije dimenzije i kod njih su frekvencije niza predstavljene

površinama različitih geometrijskih oblika. Ova vrsta graf se koristi kada se želi istaknuti

veličina, a ne vrijeme i brzina promjene u vremenu.

Histogram stupaca se crta u pravouglom koordinatnom sistemu, pri čemu se frekvencije

prikazuju stupcima jednakih osnovica. Površina stupaca jednaka je proizvodu osnovice i

visine. Razlikujemo jednostruke, razdjeljene, dvostruke i višestruke stupce. Razdjeljeni

stupci se korsite za prikazivanje strukture pojave u apsolutnim ili relativnim vrijednostima.

Pomoću dvostrukih i višestrukih stupaca se vrši poređenje više vremenskih nizova po

obimu, strukturi i značaju. Horizontalni histogrami se koriste kada težište treba staviti na

poređenje a ne na vremensku komponentu, dva ili više vremenskih nizova.

Poređenje vrem nizova čije su frekcencije na izrazito različitim nivoima nie adekvatno na

grafikonu sa aritmetičkim mjerilom, jer varijacije pojava nisu uočljive. Sagledavanje

relativnih promjena omogućava nam logaritamsko mjerilo, odnosno primjena

polulogaritamskog grafikona. Logaritamsko mjerilo je takvo mjerilo kod kojeg su logaritmi

brojeva prikazani određenim dužinama na tom mjerilu. Omogućava nam dobro uočavanje

manjih varijacija pri nižim frekvencijama. Strmine linija na grafikonu govore o jačini

relativnih promjena. što je razumljivo jer razlika logaritma predstavlja omjer-relativan broj.

20

Polulogaritamski grafikon se koristi za grafičko prikazivanje dva ili više nizova različitih

brojčanih nivoa, pri čemu se na apcisi konstruiše aritmetičko mjerilo a na ordinati

logaritamsko mjerilo. Ovaj grafikon se konstruira u pravouglom koordinatnom sistemu, a

nastaje spajanjem tačaka čije su koordinate date vrijednostima varijable vrijeme u

aritmetičkom mjerilu na apcisi a frekvencijama prema logaritamskom mjerilu na ordinati.

Trenutni vremenski niz se grafički prikazuje linijskim grafikonom i predstavlja stanja u

odabranim vremenskim trenucima. Frekvencije niza s različitim udaljenostima nie potrebno

korigovati jer ovaj niz nema svojstvo kumulativnosti.

Za grafičko prikazivanje određenih vremenskih nizova koristi se polarni koordinatni sistem.

Polarni dijagram se koristi za prikazivanje vremenskih nizova kod kojih su naglašene

sezonske varijacije. On se zasniva na duži, koja polazi od jednog proizvoljnog početka, a

sama duž predstavlja polarnu osu. Iz tako slobodno izabrane tačke povuče se onoliko

poluosi ( radij-vektora) koliko ima intervala u posmatranom vremenskom nizu. Radij-vektori

djele ravninu na segmente jednake veličine. Na njih se nanose frekvencije vremenskog niza,

pri čemu udaljenost od ishodišta zavisi od veličine empirijskih frekvencija. Za mjesečne

podatke mreža polarnog dijagrama se konstruiše tako što se kroz ishodište položi 12

dužina, između kojih je ugao od 30 stepeni. Zatim se na jedan radij-vektor označi

aritimetičko mjerilo za frekvencije, te nacrtaju koncetrični krugovi koji prolaze markantnim

tačkama mjerila. Spajanjem tačaka dobija se kriva. Što je sezonski uticaj veći, kriva će biti

bliža kružnici s većim radijusom i obrnuto. Sezonska pojava često se posmatra kavartalno.

Ako vremenski niz čine kvartalni podaci, ugao između dvaju susjednih vektora iznosi 90

stepeni, a pripadajući sektor označava kvartal. Dalje se konstruira na isti način kao i kada

radimo sa mjesečnim podacima.

RELATIVNI POKAZATELJI DINAMIKE -mjere promjene jedne pojave ili grupe homogenih pojava u toku vremena u odnosu na neki

bazni period. Jednu od najjednostavnijih metoda analize dinamike predstavljaju indeksni

brojevi. Indeksi su relativni brojevi koji pokazuju odnose različitih stanja jedne pojave ili

jedne grupe pojava u različitim intervalima ili momentima vremena. Olakšavaju

sagledavanje dinamike posmatrane pojave jer nepregledne serije svode na procente.

Osobina indeksa da izražava odnose promjena pojava u toku vremena i relativna

jednostavnost njegovog izračunavanja, uticala je da se indeksi u praksi upotrebljavaju kao

najprikladnije sredstvo statističke analize dinamike masovnih pojava.

Razlikujemo indekse strukture i indekse dinamike.

Indeksi strukture pokazuju odnos djelova prema cjelini posmatrane pojave u jednom

trenutku ili intervalu vremena, dok indeksi dinamike pokazuju promjene u nivou pojave

tokom vremena.

Indeksi dinamike pokazuju za koliko se jedna pojava ili grupa homogenih pojava promjenila

u svom razvojnom toku.

Najpoznatija podjela indeksa dinamike je na individualne i grupne.

Individualni indeksi pokazuju odnos između dva stanja posmatrane pojave, a grupni

indeksi pokazuju odnos između dva stanja skupine pojava.

21

Individualni indeksi -pružaju sintetički pogled na evoluciju u odnosu na bazni period i omogućavaju praćenje

promjena analiziranih veličina između svih posmatranih perioda. Individualni indeksi se

djele na indekse po stalnoj bazi (bazni indeksi) i indekse sa promjenjivom bazom ( lančani

indeksi).

Bazni indeksi računamo kao omjer između veličine pojave u posmatranom i baznom periodu. Period prema

kojem se vrši poređenje, naziva se bazni period i označava se sa 100. Kako se sve

frekvencije niza dijele s nivoom pojave u baznom periodu, bazni indeksi su proporcionalni

veličinama iz kojih su izračunati. Prvi korak u konstrukciji ovog indeksa je izbor baznog

perioda. U praksi se često uzima prvi ili zadnji period u nizu kao bazni, i to ima određeni

smisio. U sličajevima kada je izbor baznog perioda otežan, ili onemogućen, preporučuje se

da se za bazu odabere neka druga veličina, npr aritmetička sredina freksvencija niza ili neka

druga vrijednost. Za bazni period treba odabrati period u kojem pojava pokazuje relativno

stabilan nivo, ili onaj period u kojem pojava nie bila izložena neubičajnim uticajima.

Bazni indeks pokazuje koliko jedinica pojave u vremenu t tolazi na svakih 100 jedinica

pojave u periodu b. Uvijek su pozitivni brojevi, mogu biti veći, manji ili jednaki 100. Razlika

između 2 bazna indeksa pokazuje indeksne bodove, koji pokazuju apsolutnu a ne relativnu

razliku opaženih podataka. Ako od baznog indeksa oduzmemo 100, dobit ćemo stopu

promjene novia pojave u odnosu na bazi period.

Lančani indeksi računamo ih tako što za bazu uzimamo svaki put podatke iz prethodnog perioda. Ovi

indeksi nazivaju se i koeficijenti dinamike, jer pokazuju dinamiku i tempo promjene

posmatrane pojave u odnosu na prethodni period.

Lančani indeksi pokazuju koliko jedinica pojave u periodu t dlazi na svakih 100 jedinica

pojave u periodu t-1. Kod lančanih indeksa broj 100 ne označava bazu, nego stagnaciju

razvoja neke pojave. Vrijednost iznad 100 pokazuje da je u tekućem periodu pojava

zabilježila rast, dok vrijednost ispod 100 pokazuje da je došlo do smanjenja novoa razvoja

pojave u odnosu na prethodni period.

OSOBINE INDEKSA:

Osibina identiteta- indeks ostaje nepromjenjen ako se posmatrana veličina ne

mjenja.

Osobina tranzitivnosti-ovu osobinu zadovoljavaju indeksi čiji je proizvod jednak

odnosu veličine pojave u posmatranom i baznom periodu.

Osibina recipročnosti- se može definisati u odnosu na vrijeme, a govori da je

recipročan indeks neutralan u odnosu na vrijeme.

Osobina cirkularnosti- kada je zadovoljena osobina tranzitivnostii recipročnosti,

može se reći i da je zadovoljena osobina cirkularnosti.

22

Prosječna stopa promjene Pored individualnih indeksa za iskazivanje relativnih varijacija posmatrane pojave koristi se i

prosječna stopa promjene. Ona nije najsretnije rješenje, jer stopa može biti pozitivnog i

negativnog predznaka, pa samo ona sa pozitivnim predznakom upućuje na nivo rasta

pojave. Može se izračunati na 3 načina: na osnovu geometrijske sredine lančanih indeksa,

na osnovu orginalnih podataka i na osnovu baznih indeksa. Geometrijska sredina lančanih

indeksa može se izračunati i onda ako su poznati samo prvi i zadnji član niza. Iz osobine

tranzitivnosti proističe drugi način za računanje prosječne stope promjene, odnosno

direknto iz podataka vremenskog niza. Osnovni nedostatak ovako izračunate prosječne

stope rasta proističe iz činjenice da se ona praktično računa samo na osnovu prve i zadnje

vrijednosti posmatrane pojave. Ona će biti dobar reprezentat samo ako su koeficijenti

dinamike u uzastopnim periodima približno jednaki.

Prosječna stopa promjene može da se računa i na osnovu baznih indeksa, jer su oni

direknto proporcionalni s empirijskim frekvencijama. Nedostatak ovako dobivene stope

jeste što ona uprosječuje rast pojave u svim periodima, bez obzira na različite varijanse

unutar niza.

Prosječna stopa može se koristiti za predviđanje razvoja pojave, uz pretpostavku da će se

pojava i u narednim periodima mjenjati prema izračunatoj stopi.

Pored predviđanja razvoja pojave, na osnovu ove stope može se izračunati u kojem će

periodu, uz nastavak ispoljene tendencije, pojava dostići određeni nivo.

Grupni indeksi Grupni indeksi omogućavaju sintezu varijacija više srodnih pojava, jer se zbog nekih

zajedničkih osobina mogu da posmatraju kao jedna cjelina.

Grupni indeksi nam omogućavaju praćenje kretanja kompleksnih pojava, kao što su:

proizvodnja, troškovi, cijene, produktivnost rada i sl. Toliko su važni da se kod spominjanja

samog pojma indeksa, bez daljeg raščlanivanja podrazumijeva grupni a ne individualni

indeksi.

Postupak analize grupe pojava pomoću indeksa provodi se u nekoliko koraka:

- definisanje grupe pojava i namjene grupnih indeksa

- izbor elemenata za grupni indeks i njihova identifikacija

- prikupljanje podataka o elementima

- izbor baze indeksa, određivanje pondera i izraza za izračunavanje grupnih indeksa

- ocjena reprezentativnosti indeksa kao prosječnih veličina i provođenje testova o

njihovim teorijskim svojstvima.

23

Grupni indeksi mogu biti bazni ili lančani. Za računanje grupnih indeksa koristimo metod

srednjih vrijednosti i metod agregata.

Prema metodu srednjih vrijednosti grupni indeksi se računaju tako što se odredi

aritmetička sredina, harmonijska ili geometrijska sredina individualnih indeksa vremenskih

nizova. Prema drugom metodu grupni indeksi se računaju tako što se zbir podataka

sastavljenih nizova u tekućem periodu stavi u odnos prema zbiru podataka tih nizova u

baznom periodu. Zajednička vrijednost na koju se svode različite pojave predstavlja složenu

veličinu ( agregat), pa otuda i sam naziv postupka.

Primjena metoda srednjh vrijednosti i metoda agregata u izračunavanju neponderisanih

grupnih indeksa opravdana je samo u slučaju kada sastavni nizovi imaju približno isti značaj.

U praksi je najčešće slučaj da sastavni nizovi agregata za koje računamo grupni indeks

nemaju isti značaj. Zato ove indekse ponderišemo u cilju obezbjeđivanja njihove veće

reprezentativnosti kao pokazatelja dinamike više srodnih vremenskih nizova. U stati praksi

najčešće korišteni metodi ponderisanja su Laspeyresov i Paascheov metod.

Grupni indeks cijena -je relativan pokazatelj dinamije kretanja cijena grupe pojava u tekućem peridu u odnosu na

bazni period. Za računanje koristimo metod srednjih vrijednosti i metod agregata.

Prema prvom metodu, grupni indeksi se računaju tako što se odredi sredina individualnih

indeksa vremenskih nizova. Prema metodu agregata grupni indeksi se računaju tako što se

zbir podataka sastavljenih nizova u tekućem periodu stavi u odnos prema zbiru podataka

sastavljenih nizova u tekućem periodu.

Metod srednjih vrijednosti ne polazi od orginalnih podataka, nego od njihovih individualnih

indeksa, izačunatih na isti bazni period.

U praksi se najčešće upotrebljavaju aritmetički i geometrijski indeksi, dok je harmonijski

indeks koristi za specifična istraživanja dinamike cijena. Nedostatak ovakvog računanja

grupnog indeksa cijena jeste taj što se daje svim nizovima jednak značaj. U praksi je rijedak

slučaj da svaka cijena ima jedan ponder. izračunata vrijednost neće biti adevatna ako se u

grupi pojavi neke ekstrem, koji na promjeniti indeks na zjanačno visok ili nizak nivo.

Ponderisanje ima cilj da istakne relativni značaj pojedinih sastavnih nizova u skupu. Na ovaj

način, povećava se reprezentativnost grupnih indeksa kao pokazatelja dinamike

vremenskih nizova.

Laspeyresov grupni indeks cijena pokazuje za koliko procenata su se promjenile cijene

grupe pojava zajedno u tekućem u odnosu na bazi period, računajući uz neizmjenjene

količine iz baznog perioda.( ponderise uzimaju iz baznog perioda)

Paascheov grupni indeks cijena pokazuje za koliko procenata su se promjenile cijene grupe

pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene količine iz

baznog perioda.( ponderi se uzimaju iz trekućeg perioda)

24

Laspeyresov i Paascheov indeks su jednaki samo u dva slučaja: prvi, kada količine u tekućem

periodu ostanu nepromjenjene, i drugi, kada promjena količina ne znači i pr omjenu

strukture u tekućem u odnosu na bazni period. Nemaju osobinu tranzitivnosti, ali se

pretpostavlja da imaju, jer je numerički skoro zadovoljena. Ponderi Laspeyresovog indeksa

su stalni, dok se ponderi Paascheova indeksa mjenjaju za svaki period za koji se računa taj

indeks. Nedostatak grupnih indeksa računatih ponderima iz tekućeg perioda je često

mjenjanje pondera, pri čemu rezultirajući indeksi nisu međusobno uporedivi. Jedan od

razloga zbog koji se ovaj indeks rjeđe koristi od Laspeyresovog je i to što u praksi često ne

raspolažemo adekvatnim tekićim/izvještajnim podacima za određivanje pondera.

Zbog navedenih problema moguća je kombinacija pondera iz baznog i tekićeg perioda.

Fisherov "idealni" grupni indeks cijena računa se kao geometrijska sredina Laspeyresovog i

Paascheovog indeksa cijena. Međutim, u praksi nalazi manju primjenu zbog komplikovanos.

Za izračunavanje grupnog indeksa cijena koristi je i Marschall-Edgeworthov indeks, kod

kojeg se za ponderisanje koristi zbir ponderacionih faktora iz baznog i tekučeg perioda. Ako

su svi proizvodi iskazani u istim mjernim jedinicama za ponderisanje aritimetičke sredine

individualnih indeksa cijena koristimo količine, a ako mjerne jedinice nisu iste za ponder,

koristimo vrijednost.

Grupni indeks količina -pokazuje relativne promjene fizičkog obima grupe pojava. Pri konstrukciji ovih indeksa

javljaju se isti problemi kao i kod indeksa cijena. Za svaki vremenski niz u grupi možemo

izračunati individualne indekse količina, kojima se upoređuju relativne promjene količina u

grupi. Nedostatak ovakvog računanja indeksa( srednji aritmetički gruoni indeks količina)

količina je različit značaj količina u praktičnim primjenama. Dobivena vrijednost neće biti

adekvatna, ako se pojave ekstremne vrijednosti. Računanje agregatnog neponderisanog

grunog indeksa količina je dato kao omjer zbira količina u tekućem i baznom periodu,

takođe nije dobar pokazatelj dinamike grupe, s obzirom na prisustvo različitih mjernih

jedinica članova zbira ili različite raspone varijacije. Rješenje se nalazi u ponderisanju

količina cijenama, odnosno u vrijednosnom izražavanju. Izborom stalnih cijena

onemogućava se uticaj promjena cijena na količine u obračunu indeksa. Za pondere

možemo uzeti količine iz baznog ili iz tekućeg perioda. Za pondere se u praksi mogu

koristiti i neke druge veličine ( najčešće prosječne ili neke druge cijene). I Laspeyresov i

Paascheov grupni indeks količina javljaju se u agregatnom obliku, gdje se mjere promjene

fizičkog obima, jer su cijene nepromjenjene.

Laspeyresov indeks količina pokazuje za koliko procenata su se promjenile količine grupe

pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene cijene iz

baznog perioda.

Paascheov indeks količina pokazuje za koliko procenata su se promjenile količine grupe

pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene cijene iz

tekućeg perioda.

Kada metod srednjih vrijednosti uzima za pondere vrijednosti iz baznog perioda, onda

dobijamo isti rezultat kao i primjenom metoda agregata sa ponderima iz baznog perioda.

25

Grupni indeks vrijednosti -računa se samo u agrehatnom obliku, i to tako da se vrijednosti tekućeg perioda podjele sa

vrijednostima baznog perioda i pomnože sa 100.

Ovaj indeks možemo dobiti i množenjem grupnih indeksa cijena i količina od kojih jedan

mora biti Laspeyresov a drugi Paascheov. Ovaj indeks se računa kao proizvod indeksa cijena

sa ponderom iz baznog perioda i indeksa količina sa ponderom iz tekućeg perioda, odnosno

kao proizvod indeksa cijena sa ponderom iz tekućeg perioda i indeksa količina sa

ponderima iz baznog pedioda.

Kako cijene nisu postojane u vremenu, procjena realnog razvoja pojave u vremenu nije

moguća na osnovu vrijednosti izraženih u tekućim cijenama. Realan uvid u razvoj

posmatranih pojava postiže se eliminisanjem uticaja promjena cijena. Postupak eliminisanja

uticaja cijena na vrijednosno izražene pojave naziva se deflacioniranje i provodi se

dijeljenjem vrijednosti izmaženih u tekućim cijenama sa odgovarajućim grupnim indeksom

cijena nemnoženim sa 100. Za ovaj grupni indeks koristi se naziv deflator ili deflacijski

indeks. U inflatornim uslovima, kada cijene zamagljuju realnu sliku o razvoju pojave,

potreba za deflacioniranjem dolazi do posebnog izražaja. Deflacionirane vrijednosti

predstavljaju procjenu realnih veličina i za njih se kaže da su izražene u stalnim cijenama.

Suprotan postupak od deflacioniranja naziva se revalorizacija i predstavlja usklađivanje

vrijednosti pojava s nastalim promjenama cijena. Često se vrijednosti za niz perioda daju u

cjenama jednog vremenskog perioda. Postupak revalorizacije se provodi množenjem

vrijednosti u stalnim cijenama odgovarajućim indeksima cijena nemnoženim sa 100.

TESTIRANJE OSOBINA INDEKSNIH BROJEVA

Za testiranje dosljednosti individualnih i grupnih indeksa najčešće se primjenjuju: test vremenske

reverzibilnosti, test faktorske reverzibilnosti i test cirkularnosti.

Test vremenske reverzibilnosti (osobina recipročnosti) podrazumjeva da se inverzijom bazne i tekuće

vrijednosti ostvaruje recipročnost indeksa, odnosno da upotrijebljeni izraz za računanje indeksa ispunjava

uslov: )1001(2)1002(1 tttt II =1

Ovaj test je važan u slučajevima kada se često mijenja baza indeksnih brojeva. Ako izrazi za računanje

indeksa ne zadovoljavaju vremensku reverzibilnost, onda kod preračunavanja indeksa s jedne na drugu

bazu dolazi do većih ili manjih odstupanja. Od indeksa računatih prema metodu srednjih vrijednosti ,

aritmetički i harmonijski indeksi ne zadovoljavaju ovaj zahtjev, dok da geometrijski indeksi, modus i

medijana, zadovoljavaju. Agregatni indeks je ponderisan količinom i geometrijski indeks zadovoljava test

reverzibilnosti.

Pored vremenske reverzibilnosti, indeksi treba da zadovolje i faktorsku reverzibilnost. Indeks cijena

pomnožen indeksom količina treba dati vrijednost.

1pI =10

11

p

p dok je indeks količina za istu godinu sa istom bazom 1qI =

10

11

q

q

Množenjem indeksa cijena sa indeksom količina dobijemo isti rezultat kao kada direktno računamo

indeks vrijednosti za neki proizvod :

pqI =00

11

qp

qp

Ovim primjerom smo pokazali da individualni indeksi zadovoljavaju faktorsku reverzibilnost.

Indeksi čiji je proizvod jednak odnosu nivoa posmatrane pojave u tekućem i baznom periodu

zadovoljavaju test cirkularnosti. Pored grupnih indeksa, ovaj test zadovoljava srednji grupni indeks, koji

se dobija kao medijan individualnih indeksa, aritmetički i geometrijski neponderisani indeksi i agregatni

26

indeksi sa baznim ponderima. U odnosu na testove reverzibilnosti ovaj test je od manjeg značaja, jer se

više koristi za poređenje specifičnih vremenskih intervala a manje za poređenje većeg broja intervala.

ODABRANE METODE ANALIZE VREMENSKIH NIZOVA

U statističkoj literaturi navodi se podjela metoda analize vremenskih pojava na

kvantitativne i kvalitativne. Kvalitativne metode koriste se kada se podaci o nekoj pojavi ne mogu kvantificirati ili kada

podaci nisu dostupni. Za ove metode je karakteristično da su procjene budućih stanja

rezultata rada eksperata.

Delphi metoda i metoda scenarija su najčešće korištene kvalitativne metode.

Delphi metoda zasniva se na procesu usklađivanja mišljenja eksperata, dok se kod

sastavljanja scenarija prvo utvrđuju uslovi u kojima se predviđa odvijanje događaja.

Menadžer bira onaj scenariji koji će se prema njegovom sudu ostvariti sa najvećom

vjerovatnoćom.

Za primjenu kvantitativnih metoda neophodno je da su podaci u prošlom i sadašnjem

periodu dostupni, da oslikavaju pravu prirodu posmatrane pojave i da se mogu

kvantificirati.

Ova metoda koristi statistički pristup, i one su usmjerene na analizu osnovnih karakteristika

pojedinačnog niza i na prognoziranje njenih budućih vrijednosti.

Druga grupa metoda koristi ekonometrijski pristu ( kauzalne metode). Ove metode

zasnivaju se na pretpostavci da je posmatrana pojava u uzročno-posljedičnoj vezi sa

jednom ili više drugih pojava. Koristimo ih kada varijacije jedne pojave objašnjavamo

varijacijama druge pojave. Kauzalne metode spadaju u regresionu analizu vremenskih

pojava i njima ocjenjujemo regresioni model zavisne varijable u funkciji drugih nezavisnih

varijabli.

Holt Wintersov metod izglađivanja osnovni nedostatak metoda jednostavnog eksponencijalnog izglađivanja je što neomogućava

tretman nizova sa trendom i sezonom, prevalizazi ovaj metod izglađivanja. Predstavlja

proširenje metoda jednostavnog eksponencijalnog izglađivanja dvjema jednačinama od kojih

prvom vršimo reviziju ocjene trenda, a drugom previziju ocjene sezone.

Strukturni modeli radio se o regresionim modelima kod kojih su regresori funkcije vremena sa koeficijentima

koji se mjenjaju tokom vremena. Prethodna dva modela( model jednostavnog

eksponencijalnog izglađivanja i holt wintersov model ) su preteća ovog modela. Sa računske

strane veoma su zahtejvni te zahtvejvaju velik oiskustvo za njihovu uspješnu primjenu.

Box-Jenkinsov metod Zasnovan je na klasi ARIMA modela. Na osnovu analize podataka vremenskog niza

identifikuje se odgovarajući model iz ove klase a zatim se vrši njegovo ocjenjivanje i

provjera adekvatnosti. Postupak se ponavlja ako se pokaže da je model neadekvatan. Ovaj

metod daje napreciznije prognoze. Metod je fleksibilan jer razmatra veoma široku klasu

mdoela među kojima se po definisanom postupku bira onaj koji najbolje reprezentuje

podatke. Osnovni nedostatak metoda dolazi do izražaja već kod etape identifikacije, a to je

da je za korištenje ovog metoda potreban dobro uvježban analitičar sa velikim iskustvom. U

svakoj etapi zahtjeva se intervencija od strane analitičara i donošenje odluke u kojem

27

pravcu nastaviti dalje. Uzimajući u obzir velike troškove koji se javljaju pri korištenju ovog

metoda, neki autori ga preporučuju samo ako se pokaže da je analitičar kompetentan da

koristi metod, da je kompleksnost opravdana ciljevima koji se žele postići i da varijacije u

nizu nisu pod dominantnim uticajem trenda i sezone.

Metod stepenaste autoregresije Model je predložen od strane Newbolda i Gangera i može se posmatrati kao varijanta Box-

Jenkinsovog metoda. Njime je pokušano prevazilaženje potrebe za intrevencijom

analitičara u svakoj etapi gradnje modela definisanjem potpuno automatskog postupka

izbora modela iz klase autoregresionih modela. Sam metod je zasnovan na postupku

uključivanja regresora u stepenastoj regresiji. Njihova prednost je u potpunoj

automatizaciji uz korištenje standardnih statističkih programskih paketa sa programima za

stepenastu regresiju. Nedostatak je što se ograničava samo na klasu autoregresionih

modela, iako modelirani vremenski niz može biti generisan procesom pokretnih sredina ili

mješovotim ARMA procesom.

Parzenovi ARARMA modeli Parzen je izvršio modifikaciju u početnoj etapi Box-Jenkinsovogg modela u tom smislu što

ne zahtjeva diferenciranje vremenskog niza u cilju postizanja njegove stacionarnosti. On

predlaže korištenje autoregresionih modela prvog ili drugog reda čiji koeficijenti mogu biti

veći od jedinice u cilju otklanjanja nestacionarnosti. Nakon toga se niz reziduala tih modela

tretira kao stacionarni niz i za nju se bira model iz klase ARMA modela, korištenjem jednog

od formanih kriterija. Time je subjektivnost postupka izbora modela, koja je karakteristika

Box-Jenkinsovg pristupa, u cjelini ili barem djelimično eliminisana. Ovaj iskorak predstavlja

glavni argument koji govori u prilog ovog modela.

Bayesov metod Bayesov pristup prognoziranju može se posmatrati kao stohatička verzija Holt-Wintersovog

metoda izglađivanja. Omogućava definisanje ne jednog, nego čitavog skupa modela sa

apriornim vjerovatnoćama koje analitičar pridružuje svakom modelu iz tog skupa, odnosno

koje pridružuje njegovim koeficijentima. Zatim se koeficijenati modela ponovo izračunavaju

čim nova opservacija postane dostupna, odnosno određuju se apriorne vjerovatnoće. U

praksi je ograničena prijmena ovog metoda zbog računske složenosti i poteškoća koje

korisnici imaju u razumijevanju dobivenih rezultata.

28

KLASIČNA DEKOMPOZICIJA VREMENSKOG NIZA Dekompozicija vremenskog niza podrazumijeva njegovo raščlanjivanje na sastavne

komponente. Cilj dekompozicije vremenskog niza je identifikovanje uticaja

svake komponente pojedinačno. Ova identifikacija je posebno značajna kod pojava sa

izraženim periodičnim varijacijama, koje mogu da zamagle pravu sliku o njenom osnovnom

kretanju. Na osnovu empirijskog niza i izračunatih nekih od komponenti možemo

utvrditi uticaj ostalih faktora sadržanih u nepoznatim komponentama. Brojni faktori

koji određuju kretanje vremenskih pojava, prema prirodi svog djelovanja, mogu podjeliti na

sistematske i nesistematske. Kod sisitematskih komponenti prisutne su određene

pravilnosti u djelovanju na posmatrane pojave. One su u stat literaturi detaljno razrađene i

pronađeni su adekvatni postupci za njihovo kvantificiranje. U ove komponente ubrajamo :

trend, cikličnu i sezonsku komponentu. Za razliku od njih, rezidualna( slučajna,

iregularna, stohastička) komponenta je nesistematska.

Vremenski niz može sadržavati nijednu, jednu ili sve tri sistematske komponente, međutim

u analizi je uvijek prisutna rezidualna komponenta.

Opšti model vremenske pojave javlja se u aditivnom ili multiplikativnom obliku, a rijetko je

kombinovanog( mješovitog) oblika. Međusobna veza datih komponenti može biti aditivna,

multiplikavitna ili kombinovana.

Kod aditivnog modela svako zapažanje vremenskog niza jednako je zbiru 4 komponente,

odnosno:

Y=T+C+S+R Y-vremenski niz; T-trend; C-cikličnu; S-sezonsku; R-slučajnu(rezidualnu) komponentu.

U aditivnom modelu sve komponente su izražene u istim mjernim jedinicama kao i orginalni

niz. Kod ovog modela pretpostavlja se da sezonska i rezidualna komponenta ne zavise od

trenda, da se amplituda sezonskih varjacija ne mijenja s vremenom, te da je tokom godine

prosjek sezonskih fluktuacija jednak nuli. Model se koristi kada sa smanjenjem(povećanjem)

nivoa pojave tokom vremena uticaj sezonske komponente ostaje nepromjenjen. Treba

napomenuti da se trend i ciklična komponenta često ne razdvajaju i zajednički označavaju

sa T.

Multiplikativni model predstavlja proizvod 4 komponente i dat je slijedećim izrazom:

Y= T * Ic * Is * Ir gdje je trend komponenta data u orginalnim mjernim jedinicama, a ostale 3 komponente

izražene su kao indeksi.

29

Model se logaritamskom transforamcijom svodi na aditivni oblik:

logY= logT+logIc+logIs+logIr Ovaj model se najčešće koristi u praksi, jer on pretpostavlja relativan uticaj komponenti na

vremenski niz. Multiplikavitni model nije pogodan ako vrijednosti nekih komponenti imaju

negativan predznak ili su bliske nuli,pa se za to koristi kombinaovani oblik. Aditivnim i

multiplikativnim modelom se predstavlja razvoj nivoa pojave, a ne njena dinamička

struktura.

Primjer kombinovanog modela dat je slijedećim izrazom:

Y=T*C+R Uslov za primjenu kombinovanog modela je da su sezonska i rezidualna komponenta

međusobno nezavisne, ali da obje zavise od trenda. U praksi su moguće sve kombinacije.

U svakoj kombinaciji pristuna je slučajna komponenta. To je zbog toga što se kretanje

pojava u vremenu ne može objasniti samo f-jom vremena.

TREND KOMPONENTA Trend predstavlja razvojnu tendenciju pojave u posmatranom vremenskom periodu. Ova

tendencija označava karakterističnu i zakonomjernu liniju kretanja posmatrane pojave u

vremenu kao niz prosječnih, teorijskih tačaka kroz koje bi pojava prolazila u svojoj prirodi,

da nije bilo uticaja sistematskih i nesistematskih faktora u njenom toku.

Trend izražava prosječno stanje u svakom od posmatranih perioda, pa zbog te osobine on

predstavlja dinamičku srednju vrijednost.

Kada te teorijske podatke unesemo između empirijskih podataka niza vršimo

interpolaciju trenda. Svako procjenjivanje nivoa posmatrane pojave izvan vremenskog

raspona u kojem je dat niz empirijskih podataka, bilo da je procjenjivanje za buduće ili

prošlo vrijeme, naziva se ekstrapolacija trenda. Procjenjivanje se zasniva na pretpostavci da će se svi faktori koji su djelovali na kretanje

pojave u prošlosti, djelovati i dalje u istom smjeru i približnim intenzitetom.

Cilj dinamičke analize vremenskih nizova metodom trenda je predviđanje budućeg razvoja

posmatrane pojave na temelju ispoljene i uočene zakonitosti njenog kretanja. Trend

komponenta se pripisuje djelovanju postojanih faktora, kao što su: razvoj nauke i tehnike,

rast populacije, ponašanje potrošača...

Ako se kod izdvajanja trend komponente svim korištenim podacima pridaje isti značaj bez

ozbira na njihovu udaljenost od sadašnjeg perioda, onda je riječ o globalnom trendu.

Razvijeni su i metodi ocjenjivanja lokalnog trenda kod kojih se novijim podacima pridaje

veći značaj u odnosu na podatke sa početka vremenskog niza. Trend koji pod uticajem

raznih rezidualnih faktora i kojeg ne možemo predvidjeti na osnovu prošlih i sadašnjih

podataka naziva se stohastički trend.

Teorijski posmatrano, za primjenu trenda potrebno je onoliko podataka koliko je dovoljno

da se sagledaju barem 2 zaokružena ciklusa karakterističnih varijacija, kako bi se moglo

govoriti o ponavljanju različitosti njihovih nastajanja. Mada ne postoji egzaktno pravilo

kojim se određuje dovoljna dužina vremenskog niza, u statističkoj literaturi se najčešće

uzima period od najmanje 10 godišnjih frekvencija.

30

Osnovna razlika između metode najmanjih kvadrata u regresionoj analizi i metode

najmanjih kvadrata kod trenda je slijedeća:

1. u regresionoj analizi elementi slučajnog uzorka su međusobno nezavisni, a u analizi

vremenskih nizova podaci nisu nezavisni, jer u obzir uzimamo njihov vremenski

poredak

2. za razliku od regresione analize, gdje je za svaku vrijednost nezavisne varijable

moguće putem uzorka uzeti veći br vrijednosti zavisne varijable, kod vremenskih

nizova nije moguće uzeti više od jednog podatka u jednom periodu vremena.

3. zbog prethodno navedenog, intervali procjene prosječne vrijednosti i intervali

predviđanja individualne vrijednosti zavisne varijable koje smo korsitili kod regrsije,

kod analize trenda su krajnje nepouzdani i nećemo ih koristiti.

4. kod izračunavanja standardne greške regresije zbir kvadrata odstupanja smo dijelili

sa brojem stepeni slobode. Kod trenda ćemo formulisati mjeru sa istim značenjem ali

zbir kvadrata odstupanja nećemo djeliti sa stepenima slobode.

IZBOR VRSTE TRENDA

Za izbor vrste trenda primjenjuju se odgovarajuće statističke metode apriornog(

prethodnog) i aposteriornog ( naknadnog ) opredjeljenja. U metode apriornog

opredjeljenja ubrajamo: grafički prikaz, metod diferencije, izračunavanje pomičnih

prosjeka.

Prvu sliku o dinamici pojave tokom vremena možemo uočiti na osnovu grafičkog prikaza

vremenskog niza. Ovaj metod je krajnje subjektivan.

Metod diferencije se bazira na izračunavanju razlika uzastopnih članova niza. Ako su

apsolutne razlike uzastopnih frekvencija približno jednake tokom cijelog obuhvaćenog

perioda, tada će linearna f-ja najbolje odražavati dugoročnu razvojnu tendenciju pojave.

Prva diferencija predstavlja razliku između vrijednosti podataka vremenskog niza u 2

sukcesivna perioda. Kvadratna f-ja (parabola drugog stenepa) će najbolje odražavati

dugoročnu tendenciju ako su druge diferencija približno jednake. F-je višeg stepena

odgovarale bi za one vremenske nizove čije su treće diferencije približno jednake. Kada su

razlike logaritamskih vrijednosti uzastopnih podataka približno jednake, pojava ispoljava

osobine geometrijske progresije, pa će tada najbolje odgovarati eksponencijalna f-ja.

Ima slučajeva kada je kretanje pojave takvo da se opšta dugoročna razvojna tendencija ne

može izraziti ni jednom do sad navedenom f-jom. Tada se primjenjuju složene f-je krive

kojima se najbolje aproksimira takvo kretanje, i tu spada: modifikovana eksponencijalna

kriva, Gompertzova kriva i logistička kriva. Pogodne su za izračunavanje dugoročne

razvojne tendencije kod pojava koje su u svom kretanju približavaju jednoj granici-

asimptoti.

Izračunavanjem pomičnih prosjeka povezuju se promjene manjih ili većih grupa podataka,

pa se u izvjesnoj mjeri elminiraju kratkoročne i srednjoročne oscilacije i ističe osnovni

dugoročni razvoj pojave u vidu prosječnog kretanja. Osnovna ideja metoda pomičnih

prosjeka je u zamjeni orginalnih podataka sa aritimetičkim sredinama, čijom promjenom

eliminiramo tekuća kolebanja. Ovi prosjeci mogu da se računaju u obliku proste ili vagane

aritmetičke sredine.

31

LINEARNI TREND Ako se analizirana pojava mjenja na približno isti apsolutni iznos tokom cijelog

obuhvaćenog perioda tada će linearni trend najbolje odražavati dugoročnu razvojnu

tendenciju. Odsječak kod linearnog trenda predstavlja prosjek vremenskog niza u

posmatranom periodu, dok nagib pokazuje prosječnu promjenu vremenskog niza u

sukcesivnim vremenskim intervalima odgovarajućeg perioda. Parametri su nepoznate

veličine i jedino možemo da ih procjenimo pomoću uzorka.

Model linearnog trenda predstavlja model trend-polinoma prvog stepena, jer je njegov

deterministički dio linearna f-ja vremena.

Konstantni član a predstavlja vrijednost trenda za vremenski period koji prethodi

prvom(x=0), dok b pokazuje prosječnu linearnu promjenu posmatrane pojave pri jediničnoj

promjeni varijable vrijeme.

Ekstrapolacija trenda predstavlja produživanje linije trenda izvan intervala obuhvaćenog

vremenskim nizom. Cilj ekstrapolacije je prognoziranje nivoa posmatrane pojave u

budućnosti. Na kvalitet prognoziranja utiče mnogo faktora: dužina posmatranog

vremenskog niza, relativna društveno-ekonomska stabilnost i sl. Model sa ocjenjenim

parametrima može se koristiti u prognostičke svrhe ako pretpostavimo da će trend biti

postojan u prognostičkom horizontu.

PARABOLIČKI TREND Kada su druge diferencije (razlike prvih diferencija) približno jednake umjesto linearnog

trenda koristi se parabolički trend. Druge diferencije vrijednosti polinima drugog stepena

su konstantne, pa je to razlog njegovog izbora kao f-je vremena u modelu trenda.

Radi se o onim pojavama čije se kretanje u posmatranom periodu odvija na disharmonično,

odnosno na početku brže, a zatim kasnie sporije i obratno. Ovaj model treba tretirati kao

analitički izraz dinamike pojave i posmatrati ga kao cjelovit izraz.

Parametar a kod paraboličkog trenda predstavlja vrijednost trenda u periodu označenom 0.

Kada je predznak parametra b2 negativan, onda je otvor parabole okrenut prema dole,

odnosno ako je parametar b2 pozitivan, otvor parabole je okrenut prema gore.

Pri ekstrapolaciji paraboličkog trenda treba biti veoma oprezan, jer pojava koja je u

posmatranom periodu imala rast i opadanje može ponovo obrnuto smjer svog kretanja. U

prognoziranje kretanja pojave za udaljenije periode ne treba se upuštati.

EKSPONENCIJALNI TREND -pripada grupi nelinearnih f-ja i koristimo ga kada vremenski niz pokazuje karakteristike

geometrijske progresije. Osnovna karakteristika ovakvih kretanja se može uočiti već na

grafičkom prikazu gdje empirijske vrijednosti na početku sporije rastu a kasnije sve brže i

brže. Ovaj trend se najbolje prilagođava empirijskim podacima vremenskog niza kada

pojava pokazuje približno jednaku ralativnu promjenu (rast ili pad), odnosno kada su

apsolutne razlike logaritmovanih podataka približno iste. Ovaj trend je najbolje prilagođen

vremenskom nizu ako se u polulogaritamskom grafikonu podaci grupišu približno oko prave

linije. Konstantni član a predstavlja vrijednost trenda za vremenski period u kojem je x=0,

dok na osnovu b možemo računati prosječnu stopu promjene. Eksponencijalna prosječna

stopa promjene pokazuje za koliko procenata pojava, u prosjeku, raste ili opada u

posmatranom periodu. Rješavanje eksponencijalne f-je se vrši pomoću logaritmovanja.

Logaritmiranjem eksponencijalni trend smo transformovali u model linearnog trenda. U

literaturi se za ovaj model koristi i ime log-lin model, jer je vremenski niz y logaritamovan a

na desnoj strani su orginalne vrijednosti var vrijeme x.Do procjene param.dolazimo

antilogaritmovanjem prethodno dobivenih vrijednosti.

32

CIKLIČNA KOMPONENTA Da bi se kod vremenskih pojava ustanovila prisutnost cikličnih kretanja neophodan je

vremenski niz sa dovoljno obuhvaćenim obnavljanjima. Međutim, u praksi se ne raspolaže

vremenskim nizovima sa dovoljno članova, pa se trend i ciklična komponenta posmatraju

zajedno.

Cikličnu komponentu predstavljaju faktori koji svojim djelovanjem na posmatrane pojave

dovode do njihovih oscilacija iznad ili ispod utvrđene prosječne razvojne tendencije u

trajanju od nekoliko godina. Kada se pojava obnavlja napribližno jednak način s periodom

od dvije ili više godina, kažemo da su prisutne ciklične varijacije. Početak ciklusa označava

relativno nizak nivo pojave, koja se u fazi rasta povećava do nekog maksimuma, nakon kojeg

slijedi pad pojave. Poslije minimuma, slijedi rast i obnavljanje puta na približno jednak način.

Kod prognoziranja javljaju se velike poteškoće, jer se kod posmatranih pojava mijenja i

trajanje i (dužina) ciklusa i indenzitet odstupanja (amplituda).

Testiranje značajnosti ciklične komponente bazirano je na rasporedu frekvencije dužine

pojedinih faza, tj razmaka između prevojnih tačaka. Ove tačke u stvari pokazuju momente

kada niz prestaje da raste i počinje da opada i obrnuto. Kada su ciklične varijacije značajne,

broj dugotrajnih faza biće veći.

METODE IZGLAĐIVANJA U svakom vremenskom nizu prisutna su određena kolebanja vrijednosti pojedinačnih

frekvencija, koja nekada mogu otežati oučavanje osnovne razvojne tendencije posmatrane

pojave. Da bismo riješili taj problem, potrebno je reducirati slučajne varijacije primjenom

postupaka izglađivanja vremenskog niza. Izglađivanje vremenskog niza podrazumijeva

izačunavanje aritimetičkih sredina za posmatranu pojavu. Na ovaj način se reducira uticaj

sezonske i rezidualne komponente, dok se trend i ciklična komponenta manifestuju u nešto

jasnijem obliku.

Metoda pomičnih prosjeka i metoda jednostavnog eksponencijalnog izglađivanja

predstavljaju najčešće korištene metode pomoću kojih se vrši izglađivanje vremenskih

nizova.

Metoda pomičnih prosjeka Pomični prosjeci predstavljaju transforamaciju orginalnog vremenskog niza gdje se svaka

frekvencija zamjenjuje prosjekom. Prosjek se računa na osnovu određenog broja narednih i

isto toliko prethodnih frekvencija. S obzirom na to da se primjenom ove metode

pomjeramo od početka niza sve do njenog kraja, ova metoda je dobila naziv pomični

prosjek. Izglađivanje se bazira na ideji da će svaka neregularna komponenta u svakom

vremenskom trenutku prouzrokovati manji efekat ako je u toj tački uprosječimo s njenim

susjednim veličinama. Što više članova niza uzmemo za računanje prosjeka, linija će biti

izglađenija, ali će nam nedostajati više prosjeka u odnosu na broj orginalnih podataka.

U praksi koristimo 2 oblika ove metode: jednostavni i ponderisani(vagani).

Jednostavni pomični prosjeci predstavljaju prosjeke m uzastopnih frekvencija posmatranog

vremenskog niza. Ako je broj članova pomičnog prosjeka M neparan, tada će ukupno M-1

orginalnih podataka ostati bez svog pomičnog prosjeka. Ovaj nedostatak metode je sve

više izražen što uzimamo grupe sa većim brojem članova. Ako je broj članova pomičnog

prosjeka M paran, onda ce ukupno M orginalnih podataka ostati bez svog pomičnog

prosjeka.

33

U slučaju kada je broj članova pomičnog prosjeka M paran, aritmetička sredina neće se

uklapati u neki tačno određen period, nego između 2 perioda za koja raspolažemo

empirijskim podacima. Kako su ovako dobiveni prosjeci nepodesni za korištenje, provodimo

postupak centriranja. Ovaj postupak se provodi na različite načine i omogućava da se

centrirani prosjeci računaju kao aritmetička sredina prethodno izračunatih pomičnih

prosjeka od 2 člana.

Prednost metode pomičnih prosjeka ogleda se u jednostavnom izračunavanju. Poteškoće u

primjeni ove metode javljaju se kod izbora dužine pomičnog prosjeka M i pondera

frekvencija. U praksi se obično za veće fluktuacije oko trenda koristi prosjek veće dužine i

obratno. Nedostatak je i manjak podataka o trendu u početnim i završnim vremenskim

periodima.

Oscilacije nisu pravilne i nemaju stalan period obnavljanja. Pomični prosjeci, ustvari,

sugerišu da postoji ciklično kretanje i ta se pojava naziva Slutcky-Yuleov efekat.

Metoda jednostavnog eksponencijalnog izglađivanja Cilj ove metode je ozglađivanje empirijskih podataka, kako bi se eliminisali ili reducirali

slučajni uticaji kod posmatrane pojave.

Ova metoda nudi kompromis, nudeći prognoze koje se baziraju na ponderisanom prosjeku

sadašnjih i ranijih vrijednosti. Metoda bazirana na ideji o kvalitetu raspoloživih podataka,

koji u najvećoj mjeri zavise od njihove starosti. Stariji podaci su manje korisni, pa im je

potrebno dati manju važnost. Noviji podaci zadržavaju najvjerovatnije informacije o onome

što je za realno očekivati da će se dogoditiu budućnosti. U izračunavanju tog prosjeka,

najveći ponder pridaje se najnovijem podatku, nešto manji podatku koji mu neposredno

prethodi, još manji njemu prethodnom podatku.

Jednostavno eksponencijalno izglađivanje podrazumijeva transforamaciju vremenskog niza

gdje su orginalni podaci zamjenjeni ponderisanim prosjekom svih prethodnih podataka, sa

ponderima koji se eksponencijalno smanjuju sa starošću podataka.

Ovaj metod je primjeren za izglađivanje vremenskih nizova bez sistematskih komponenti.

Koristi se za pojave koje karakterišu slučajne varijacije oko prosjeka, odnosno one koje

nemaju izražen trend. Sadrži li trend, koristit ćemo model dvostrukog, trostrukog odnosno

višestrukog eksponencijalnog izglađivanja. Prisutnost sezonske komponente takođe će

upućivati na korištenej odg modela izglađivanja.

Ulogu pondera ima konstanta izglađivanja α koja može uzeti vrijednost između 0 i 1.

Ponderi predstavljaju geometrijski red, a njihov zbir je jednak 1. Konstanta izglađivanja

određuje brzinu kojom protekle vrijednosti gube svoj uticaj na izglađenu vrijednost u

vremenu t. Veća vrijednost konstante izglađivanja znači brži gubitak uticaja i obrnuto. Što je

vrijednost konstante manja, vremenski niz će biti više izglađen. Ne postoji egzaktan način

određivanja konstante izglađivanja. U praksi se najčešće uzimaju vrijednosti između 0.2 i

0.3. Jedna od mogućnosti određivanja konstante jeste i lično iskustvo.

Uspješnost izglađivanja utvrđuje se na osnovu razlike između orginalnih podataka i

izglađenih vrijednosti. Bira se ona vrijednost konstante koja minimizira vrijednost srednje

kvadratne greške. Najvažnije prednosti ove metode su : uzima u obzir sve prošle podatke,

zahtjeva mali broj podataka, veći značaj daje novijim podacima, predstavlja osnovu nekim

razrađenijim metodama prognoziranja. Nedostaci metode: izbor konstante izglađivanje nije

jednostavan, ne može se koristiti u analizi pojava sa izraženim trendom i sezonalom,

najčešće nie dobar metod za srednjeročno i dugoročno prognoziranje, velike slučajne

fluktuacije mogu jako uticati na kvaltiet prognoziranja.

34

SEZONSKA KOMPONENTA utiče na kretanje pojave tako da ona odstupa od svoje osnovne tendencije utvrđene

trendom na više ili na niže. Prisustvo sezonskih varijacija zamagljuje uočavanje osnovne

razvojne tendencije pojave, pa se samo njihovim isključivanjem može sagledati osnovni

razvojni tok. Postupak isključivanja sezonskih varijacija iz vremenskog niza naziva se

desezoniranje ili sezonsko izglađivanje. Sezonski uticaj je izražen u turizmu, saobraćaju,

građevini..

Sezonske varijacije pokazuju promjene određene pojave, koje se ponavljaju tokom više

godina u isto doba, u istom smjeru i približno istim intenzitetom. Kod nekih ekonomskih i

društvenih pojava sezonske varijacije se izražavaju na isti način tokom vremena. Kada se

sezonal ispoljava na približno na isti način iz godine u godinu, kažemo da je djelovanje

sezonskih faktora stabilno. Tada za sezonsku komponentu kažemo da je determinističke

prirode, jer se njena priroda ne mjenja tokom više godina. Ako sezonske varijacije mjenjaju

intenzitet i periodičnost ponavljanja u svakom narednom periodu onda govorimo o

nestabilnom sezonskom ritmu. U tom slučaju sezonska komponenta je stohastičke prirode.

Smjer i intenzitet sezonskog varijabiliteta mjeri se sezonskim indeksima. Sezonski indeksi

su relativni brojevi koji mjere jačinu sezonskog uticaja u određenom mjesecu(kvartalu)

tokom više godina. Tipični indeksi predstavljaju uopšten intenzitet sezonskog varijabiliteta

za više godina. Preko specifičnih izračunavaju se tipični sezonski indeksi, koji treba da

reprezentuju sezonska odstupanja tokom cjeog posmatranog perioda. Indeksi čija je

vrijednost preko 100 pokazuju da posmatrana pojava zbog sezonskih uticaja raste. Indeksi

čija je vrijednost ispod 100 pokazuju da pojava opada pod uticajem sezone. S obzirom na to

da sezonski indeksi variraju oko 100 njihov zbir kod kvadratnog niza mora biti jednak 400,

tj. kod mjesečnog niza mora iznositi 1200. Kod oba niza prosjek je jednak 100.

Prve informacije u analizi sezonskog karaktera pojave najlakše je dobiti iz grafičkog prikaza.

Najjednostavniji je linijski grafikon sa ucrtanim podacima svih posmatranih perioda, jer on

omogućava oučavanje sezonskih kolebanja.

Osnov za numeričko izražavanje sezonskih uticaja je model. Iskustva pokazuju da u procesu

analize vremenskih nizova multiplikativni modeli daju bolje rezultate.

Za ciklične pojave je karakteristično da se obnavljaju u periodu od najmanje dvije godine, ali

se u praksi javlja problem vremenskih nizova odgovarajuće dužine. Jedno od mogućih

rješenja za prevazilaženje ovog problema je spajanje trenda i ciklične komponente u jednu

komponentu. ( Y= T * Is * Ir )

Postoje 2 pristupa mjerenju sezonskih varijacija: empirijski(tradiocionalni) i regresioni

(modelski) pristup. Mod modelskog pristupa sezonska priroda se mjeri uključivanjem

sezonskih nezavisnih varijabli u regresioni model vremenskog niza ili posebnom vrstom

modela tzv. ARIMA modelima.

Mjerenje sezonskih varijacija po metodu pomičnih prosjeka zasniva se na njihovom

izdvajanju od ostalih komponenti. Osnovna ideja je da ovi prosjeci obuhvate zajedno trend i

cikličnu komponentu, te da se djeljenjem orginalnih frekvencija s pripadajućim pomičnim

prosjecima isključi njihov uticaj. Na ovaj način ostaju još sezonska i rezidualna komponenta.

Specifični sezonski koeficijenti, osim sezonskih, u sebi sadrže i neregularne uticaje, koji se

isključuju tako što se izračunavaju prosjeci svih specifičnih sezonskih koeficijenata za

istoimene kvartale(mjesece). Množenjem tih prosjeka sa 100 dobijamo sezonske indekse.

Da bismo u analizi vremenskog niza dobili čist uticaj sezone, neophodne je podjeliti

orginalne frekvencije sa trend, ciklus i rezidualnom komponentom.

35

Analiza sezonske pojave za kvartalne podatke po metodu odnosa prema pomičnom

prosjeku obuhvata sljedeće korake:

• izračunati centrirane četveromjesečne pomične prosjeke za niz kvartalnih podataka

• izračunati omjere orginalnih frekvencija i pripadajućih vrijednosti pomičnih prosjeka

• izračunati prosjek ili medijan izračunatih omjera u preth koraku za istoimene kvartale

• ako je zbir tipičnih sezonskih koeficijenata jednak 4, onda te vrijednosti predstavljaju

sezonske faktore. Vrijednosti se koriguju ako zbir nije jednak 4. Sezonski faktori

istoimenih kvartala jednaki su za cjeli posmatrani period.

• djeljenjem orginalnih frekcencija niza tipičnim sezonskim koeficijentima dobijaju se

desezonirane vrijednosti, tj vrijednosti niza očišćene od uticaja sezone.

• djeljenjem desezoniranih vrijednosti odgovarajućim pomičnim prosjecima

izračunavaju se faktori rezidualnog uticaja.

Analiza sezonske pojave za mjesečne podatke po metodu odnosa prema pomičnim

prosjecima vrši se analogno kao i za kvartalne podatke. Prvo se izračunaju

dvanaestomjesečni pomični prosjeci, zatim se orginalne frekvencije podjele

pripadajućim pomičnim prosjecima, računaju se sezonski faktori(čiji zbir treba biti

jednak 12)-koji omogućavaju desezoniranje, i na kraju se izračunavaju faktori

rezidualnog uticaj

Documents

Statistika III Parcijala