Upload
adooooo17
View
100
Download
2
Embed Size (px)
DESCRIPTION
Statistika III Parcijala
Citation preview
1
SKRIPTA ZA III PARCIJALNI ISPIT IZ STATISTIKE
REGRESIONA ANALIZA
Utvrđivanje zakonitosti I pravilnosti koje vladaju između masovnih pojava, te trasiranje puta
za kreiranje odgovarajućeg modela, zadatak je regresione analize.
Regresija je zapravo skraćeni naziv od regresija prema aritmetičkoj sredini, koja dolazi od
opšte statističke zakonitosti da je rezultat jedne varij.bliži aritmetičkoj sredini nego što je
rezultatu varijable koja je služila za predviđanje.
U užem smislu, regresiona analiza podrazumijeva skup statističkih metoda koji omogućuju
utrvđivanje zavisnoti između pojava I procjenjivanje jedne varijable na osnovu vrijednosti
neke druge ili više drugih varijabli.
U širem smislu, ova analiza obuhvata, pored navedenih metoda I statističke metode koji
omogućavaju praćenje kovarijacije između pojava I utvrđivanje međuzavisnosti između dvije
ili više pojava.
KOVARIJANSA predstavlja kvantitativni izraz slaganja varijacija vrijednosti obilježja
posmatranih pojava.
Regresioni model omogućava da se s određenim stepenom pouzdanosti procjenjuju I
predviđaju vrijednosti zavisne varijable na osnovu vrijednosti nezavisne varijable.
Međuzavisnost pojava se utvrđuje primjenom korelacione analize. Korelacionim modelom
se utvrđuje da li su dvije pojave povezane , tj da li se mjenjaju zajedno, da li im je pravac
mjenjanja isti, koji je stepen povezanosti i sl.
Regresiona analiza može se odnosti na posmatranje osnovnog skupa ili na njegov uzorak.
Češći je slučaj da se analiza izvodi na osnovu uzorka.
Iz osnovnog skupa uzima se reprezentativan uzorak i na osnovu njega donosi se zaključak o
parametrima skupa.
Za ovu analizu mogu se koristiti 2 vrste podataka:
a)podaci koji izražavaju stanje određenog momenta
b)podaci koji se dobivaju na osnovu posmatranja neke pojave u vremenskim intervalima i
takvi podaci se obrazuju u vremenski niz.
Nužno je upozoriti na opasnost formalne interpretacije rezulatat, koji proizilaze iz primjene
regres.analize.
Validnost i pouzdanost rezultata reg.analize zavise od stvarnog poznavanja materije koju
ona treba interpretirati.
-KOVARIJACIJA- Za utvrđivanje kvantitativnog izraza slaganja varijacija vrijednosti obilježja posmatrane
pojave korsitimo kovarijaciju.Postoje slijedeći pokazatelji kovarijacije:
a) INDEKS DIFERENCIJALNE KOVARIJACIJE:
računa se na osnovu predznaka varijacija kao razlika među modalitetima obilježja u
utvrđenom nizu njihovih podataka. Nedostatak mu je u tome što uzima u obzir samo
predznak varijacija od jednog do drugog modaliteta, a zanemaruje intenzitet zabilježenih
varijacija.
2
b) PONDERISANI INDEKS DIFERENCIJALNE KOVARIJACIJE
je obuhvatniji od prethodnog indeksa jer uzima u obzir i predznake i intenzitet zabilježenih
varijacija. Računa se kao odnos razlike i zbira pozitivnih i negativnih proizvoda varijacija.
c) KOEFICIJENT DIFERENCIJALNE KOVARIJACIJE
Računa se kao odnos između razlike pozitivnih i negativnih proizvoda varijacija prema
geometriskoj sredini kvadrata uzastopnih varijacija.
3
d)KOEFICIJENT TENDENCIJE
je kompleksan izraz uzajamnosti varijacija obilježja posmatranih pojava. On obuhvata i
odstupanja oko aritmetičke sredine. Uzima vrijednost iz intervala [-1,+1], pri čemu
neg.vrijednosti označavaju suprotnosmjerno slaganje varijacija, a pozitivne, istosmjerno
slaganje. Što je njegova apsolutna vrije.bliža 1, između varijacija obilježja pojava postoji viši
stepen istosmjernog ili suprotnosmjernog kvantit.slaganja.
-KOVARIJANSA- predstavlja prosječan stepen varijacija obilježja posmatrane pojave i pomoću nje nije
moguće direktno mjerenje stepena kovarijacije, tj stepena jačine veze između posmatranih
pojava. Kovarijansom procjenjujemo postoji li kovarijacija između pojava, ali ne i stepen.
Ona je neka vrsta prosjeka, odnosno ukupnosti odstupanja svih podataka od aritmetičkih
sredina posmatranih serija. Izračunava se kao prosječno istovremeno odstupanje
vrijednosti obilježja od svojih aritmetičkih sredina. Jednaka je nuli ako je stand.devijacija
barem jedne varij.jednaka nuli. Ako postoji tendencija da iznadprosječna vrijednost jedne
varijable dolazi sa iznadprosječnom vrijednošću druge varijable, onda je kovarijansa
pozitivna i obrnuto. Kovarijansa je negativna ako iznadprosječne vrijenosti jedne varijable
prate ispodprosječne vrijednosti druge varijable.
Zadatak regresione analize je da utvrdi zakonitosti u varijacijama zavisne varijable Y, koje su
određene varijacijama nezavisne varijable X, s ciljem da se predvide nepoznate vrijednosti
varijable Y kada je poznata X.
Nezavisna varijabla je ona varijabla od koje na neki način zavisi ono što istražujemo. To je
ona varijabla koju istraživač namjerno mjenja da bi ustanovio kako će te promjene djelovati
na zavisnu varijablu koju on istražuje.
Zavisna varijabla je ona varijabla koju istražujemo i želimo rastumačiti zbog čega ona
poprima različite vrijednosti i koju možemo predvidjeti iz vrijednosti neke druge varijable. U
slučajevima kada istraživač ne može svojevoljno manipulisati X on prati promjene na Y u
vezi sa spontanim promjenama na X.
Regresija kvantificira vezu između pojava, neophodno je kvalitativnom analizom ispravno
identifikovati varijablu/e koja stvarno uzrokuje promjene u zavisnoj varijabli.
Veze kod kojih povećanju(smanjenju) vrijednosti nezavisne varijable X istovremeno
odgovara povećanje(smanjenje) zavisne varijable Y nazivamo pozitivnim(istosmjernim)
vezama. Ako povećanju jedne varijable odgvara smanjenje druge varijable radi se o
negativnom (suprotnosmjernim) vezama.
Prema jačini veze između pojava mogu biti FUNKCIONALNE I STATISTIČKE.
Funkcionalne veze se javljaju u slučaju kada jednom vrijednosti nezavisne promjenjive X
odgovara samo jedna, tačno određena vrijednost zavisne promjenjive Y. Karakteristično je
da im se pri zajedničkom mjenjanju veličina promjene uvijek podudaraju i da u svakoj
vrijednosti jedne pojave odgovara uvijek ista vrijednost druge pojave. Označava se sa
izrazom Y=f(x), pri čemu svakoj vrijednosti X odgovara tačno određena vrijednost Y.
4
Statističke( slučajne) veze se najčešće susreću u društvenim i privrednim pojavama. S
obzirom na to da zavisna varijabla Y svaku od različitih vrijednosti može uzeti s određenom
vjerovatnoćom i kako njene ishode u pojedinačnim situacijama ne možemo sa sigurnošću
predvidjeti, ona je slučajna varijabla. Iako po obliku podsjećaju na funkcionalne veze,
labavije su od njih, nisu tako određene i podložne su variranju.
Kada svakom jediničnom porastu vrijednosti jedne varijable odgovara približno jednaka
linearna promjena druge varijable, kažemo da je oblik veze između pojava LINEARAN. U
okviru regresione analize modeli se djele na linearne i nelinearne.
U regres.analizi se koriste podaci koji izražavaju stanje određenog momenta
(uzorak,osn.skup) i podaci koji se dobiju na osnovu posmatranja neke pojave u vremenskim
intervalima, koji obrazuju vremenski niz. U ekonomskim istraživanjima između različitih
varijabli razlikujemo vezu na osnovu jedne jednačine, na osnovu više jednačina i vezu na
simultanoj osnovi. Na osnovu jedne jednačine sagledava se zavisnost između zavisne
varijable i jedne ili više nezavisnih varijabli. Kod veza na bazi više jednačina radi se o
ispitivanju uticaja više varijabli na zavisnu varijablu, ali posebno za svaku nezavisnu
varijablu. Treću grupu čine dvije ili više zavisnih varijabli kada su u simultanoj vezi sa
određenim brojem bezavisnih varijabli.
Regresiona analiza obuhvata slijedeće etape:
-odrediti zavisnu i nezavisnu varijablu
-izabrati slučajan uzorak
-grafički predstaviti na dijagramu rasipanja
-na osnovu dijagrama rasipanja procjeniti oblik veze
-konsturisati odgovarajući model
-ocjeniti primjenom odgovarajucih metoda prarametre modela
-izračunati rezidualna odstupanja i analizirati ih
-testiranjem validnosti modela procjeniti kvalitet modela
-primjena modela za procjenu i predviđanje zavisne varijable.
DIJAGRAM RASIPANJA je grafiči prikaz kojim se uočava priroda odnosa dviju pojava
predstavljena vrijednostima numeričkog obilježja. Prije bilo kakve kvantitativne analize
obavezno treba prikazati podatke na ovom dijagramu, koji se crta u pravouglom
koordinatnom sistemu.
Numerička podloga za njegovu konstrukciju su vrijenosti varijabli x i y, pri čemu se na
apcisu nanose jedinične vrijednosti pojave koju smo označili kao nezavisna varijabla x, a na
ordinatu jedinice zavisne varijable y. Ucrtavanjem svih empiriskih parova podataka može se
na prvi pogled dobiti važna slika o eventualnom postojanju, obliku, smjeru, jačini veze
između posmatranih pojava.
slika LINEARNA VEZA /DIJAGRAM RASIPANJA/
5
Slika a) prikazuje funkcionalnu vezu između nezavisne i zavisne varijable. Zamišljena linija
koja povezuje sve tačke na slici je pravac, od koje nema odstupanja. Zbog toga se kaže da je
ova veza funkcionalna i pozitivna jer je pravac rastući.
U praksi gotovo nikad ne postoji ovakav primjer, nego je češći slučaj na slici b). Zamišljena
linija između tačaka na slici je takđe pravac, ali su prisutna određena odstupanja. Pozitiva i
negativna odstupanja od pravca se tumače uticajima drugih varijabli iz prakse. Zbog toga
kažemo da je veza statistička. I ova veza je pozitivna jer je zamišljeni pravac rastući.
Slika c) pokazuje funkcionalnu vezu između zavisne i nezavisne varijable a zamišljena linija
koja povezuje sve tačke na slici je opet prava. Pored toga što je veza funkcionalna porast
jedne varijable prati pad druge varijable, pa kažemo da je veza negativna.
U praksi je gotovo nemoguće sresti ovakav primjer, ali čest je primjer slika d). Zamišljena
linija između tačaka je pravac, a pozitivna i negativna odstupanja od pravca tumače se
uticajima drugih varijabli. Veza je statistička, a kako je zamišljeni pravac opadajući, veza je
negativna.
slika DIJAGRAM RASIPANJA / nelinearna veza i odsutnost veze/
6
Slika a) pokazuje funkcionalu krivolinijsku vezu između zavisne i nezavisne varijable.
Zamišljena linija koja povezuje sve tačke na slici je eksponencijalna kriva. Porast vrijednosti
jedne varijable prati porast vrijednosti druge varijable, pa je posmatrana veza pozitivna. U
praksi se češći je slučaj slike b) gdje je zamišljena linija kriva i prisutna su pozitivna i
negativna odstupanja zbog uticaja ostalih varijabli. Ovo je statistička veza, porast jedne
prati porast druge, pa je smijer pozitivan. Slika c) upućuje na zaključak da nema
povezanosti između posmatranih pojava. Zamišljena linija između tačaka ne postoji, jer se
za jednu vrijednost nezavisne varijable može dogoditi više različitih vrijednosti zavisne
varijable. Odsustvo kvantitativnih slaganja je prikazano na slici d) jer za razliku vrijednosti
nezavisne varijable dobijamo istu vrijednost zavisne varijable.
7
MODEL JEDNOSTAVNE LINEARNE REGRSIJE
Polazni model jedn,lin.regresije je
Yi=α+βxi+εi
gdje Y predstvalja zavisnu varijablu, X vrijednost nezavisne varijable, α odsječak na y osi,
β koeficijent nagiba i ε statistički član ( slučajna greška).
Zadatak regresione analize jeste pronaći najbolju liniju regresije uzorka i koristiti je umjesto
nepoznate linije regresije osnovnog skup, kako bismo na osnovu nje izvršili predviđanje.
Model jednostavne lin.regresije za n posmatnanih pojava varijabli x i y može se napisati kao
yi=a+bxi+ei
y- empirijska vrijednost te opservacije, a i b odjsečak na y osi i koeficijet nagiba,
ei- rezidualna odstupanja. (odnosi se na uzorak)
Liniju regresije u uzorku možemo predstaviti na slijedeći način:
y* = a+bx
gdje a+bx predstavlja funkcionalni dio modela gdje su ai b parametri koje treba procjeniti a
y* predstavlja procjenjenu vrijednost Y na osnovu posmatranih vrijednsoti od xi do X.
Procjene a i b se razlikuju od stvarnih vrijednosti α i β.
U statistici je predloženo više obj.metoda koje se korsite da si između empirijskih tačaka
povukli onu pravu liniju koja ih najbolje reprezentuje. Najčešće se koristi metoda najmanjih
kvadrata, koja obezbjeđuje minimum odstupanja prilagođenog modela od tačaka dijagrama
rasipanja.
Rezidualna odstupanja predstavljaju ocjenu slučajne greške u polaznom modelu
jednostavne lin.regrecije. Rezidual će biti pozitivan ako se empirijska vrijednost nalazi iznad
prave, negativna ispod prave. Regresiona prava će dobroi reprezentovati empirijski
raspored ako su vrijednosti reziduala male, i obrnuto. Cilj reg.analize jeste primjeniti metod
koji će minimizirati rezidualna odstupanja. ei= yi-y*
Relativna rezidualna odstupanja računaju se dijeljenjem tih odstupanja pripadajućom
stvarnom vrijednosti zavisne varijable puta 100.
Standardizovana rezidualna odstupanja se računaju dijeljenjem rezidualnih odstupanja
standardnom devijacijom regresije.
Model jednostavne lin.regresije ima slijedeće osobine:
-zbir odstupanja stvarnih vrijednosti zavisne varijable od regresijskih vrijednosti =0
-zbir kvadrata tih odstupanja je minimalan
-zbir proizvoda vrijednosti zavisne varijable i rezidualnih odstupanja =0
-zbir proizvoda nezavisne vrijable i rezidualnih odstupanja=0
-aritmetička sredina stvarnih vrijednosti zavisne varijable = aritm.sredini
regre.vrijednosti zavisne varijable
8
MJERE REPREZENTATIVNOSTI REGRESIONOG MODELA(str 315)
Regresiona analiza ne završava konstruisanjem regresione linije,već je potrebna I informacija o
stupnju varijabiliteta,koji utiče na reprezentativnost regresionog modela.Reprezentativnost
regresionog modela mjeri se stepenom varijacije,empirijskih vrednosti zaisne varijable u odnosu
na regresione vrednosti utvrđene modelom.
Prvi izvor varijabiliteta rezultat je varijacija u vrednostima nezavisne varijable X I može se
protumačiti regresionim modelom.Drugi izvor varijabiliteta je rezultat djelovanja slučajne
greške I ne može se protumačiti regresionim modelom.
Mjere za procjenu reprezentativnosti regr.temelji se na raščlanjivanju odstupanja
empirijskih vrijednosti zavisne varijable od njenog prosjeka. Formula 4.21 I 4.22 str 315 knjiga
gdje lijeva strana predstavlja zbir kvadrata odstupanja empirijskih vrijednosti zavisne
varijable od njene aritm.sredine( ukupni varijabilitet). Prvi član sa desne strane je zbir
kvadrata odstupanja regresionih vrijednosti od njene aritm.sredine ( protumačeni
varijabilitet). Odstupanja empirijskih vrijednosti zavisne varijable od regresijskih vrijednosti
predstavlja drugi član s desna( neprotupačeni varijabilitet)
Pokazateje varijacije podataka nazivamo mjerama disperzije koje omogućavaju posmatranje varijabiliteta
podataka u odnosu na regresionu liniju.Veća rasprašenost tačaka oko regresione linije uvijek znači manju
reprezentativnost regresionog modela I suprotno.
Odstupanja vrijednosti numeričkog obilježja od aritm.sredine zavisne varijable su različita po predznaku I
veličini a njihov zbir je jednak 0.
Budući da skoro nikad ne raspolažemo svim podacima osnovnog skupa,varijansu regresije ne možemo ni
izračunati.
Standardna devijacija regresije pokazuje prosječno odstupanje empirijske vrednosti zavisne varijable Y
od regresionih vrednosti utvrđenih modelom.(Formula 130)
9
Standardna devijacija regresije je apsolutna mjera disperzije jer je izražena u istim mjernim jedinicama
kao I zavisna varijabla.
Koeficijent varijacije regresije je relativna mjera disperzije I računa se kao omjer standardne devijacije
regresije I aritm.sredine zavisne varijable pomnožene sa 100. (Formula 132)
Koeficijent determinacije je pokazatelj reprezentativnosti regresije I računa se po formuli 126.
Koeficijent determinacije je pokazatelj reprezentativnosti, koji predstavlja omjer
protumačenog varijabiliteta i ukupnog varijabiliteta.
(formula 126)
To je relativna mjera i pokazuje kolko su varijacije zavisne varijable Y protumačene
nezavisnom varijablom X. Velika vrijednost koeficijenta ukazuje na malu disperziju oko
pravca, što povećava reprezentativnost modela.
Kao analitički pokazatelj koristi se i korigovani koeficijent determinacije, koji zavisi od
stepena slobode i može biti negativan. Ovaj koeficijent je manji ili jednak koeficijentu
determinacije.
Ako se varijabla x0 nalazi između drugih nezavisnih promjenjivih i ako se na osnovu nje
predviđa prosječna vrijednost zavisne promjenjive, onda se radi o INTERPOLACIJI. Kod
interpolacije nezavisna promjenjiva x0 se nalazi između najmanje i najveće vrijednosti
nezavisne varijable uzorka. Ako se vrijednost nezavinse varijable nalazi izvan intervala koji
je dat empirijskim podacima uzorka, onda je riječ o EKSTRAPOLACIJI.
INFERENCIJALNO STATISTIČKA ANALIZA U MODELU JEDNOSTAVNE LINEARNE
REGRESIJE
Teorijske pretpostavke za analizu modela metodama inferencijalne statistike odnose se na svojstva
zavisne varijable Y ili ekvivalentno na svosjstva slučajne varijable εi .
-Očekivana vrednost zavisne varijable Y za date vrednosti neovisne varijable X funkcija je vrijednosti
neovisne varijable I parametara α I β.Ta se funkcija zove regresiona funkcija osnovnog
skupa.Ekvivalentna pretpostavka εi=0 za svako i.
-Varijansa zavisne varijable za date vrednosti nezavisne varijable je konstantna I jednaka kvadratu
standardne devijacije za svako i.
-Vrednosti zavisne varijable međusobno su nekolinearne slučajne velićine odnosno njihova kovarijansa je
jednaka nuli.Ekvivalentno vrijednosti slučajne varijable εi međusobno su nekolinearne slučajne veličine.
-Zavisna varijabla je normalno distribuisana,odnosno slučajne varijale εi su indentično normalno
distribuirane.
Kvalitet modela jednostvane linearne regresije se mjeri testiranjem značajnosti parametra β
H0: β=0 H1: β≠0
Prema nultoj hipotezi regresiona varijabla X je suvišna u modelu dok H1 sadrži tvrdnju da regresiona
varijabla X objašnjava varijacije varijable Y.U praksi nisu poznate vrijednosti koeficijenata regresione
linije osnovnog skupa,njihove vrednosti procjenićemo na osnovu uzorka.U tom slučaju slijedi da je :
H0: b=0 H1:b≠0
Test statistika predstavlja omjer procjene regresionog koeficijenta sa standardnom greškom te
procjene.(formula 134)
Ako je apsolutna vrednost testovne veličine manja od kritične vrednosti onda se prihvata nulta hipoteza I
suprotno.
Pod brojem stepeni slobode nekog statističkog parametra podrazumjevamo broj neovisnih opažanja n
umanjen za broj parametara k potrebnih da bi se odredio dati parametar.
10
Broj događaja koji pri izračunavanju nekog statističkog parametra mogu slobodno varirati nazivamo broj
stepeni slobode.
Za testiranje hipoteza u modelu jednostavne linearne regresije koristi se I F-test.Uobičajeno je da se
empirijski F-omjer navodi u tabeli analize varijanse (ANOVA).Odluka se donosi poređenjem empirijskog
F-omjera sa kritičnim vrednostima F-distribucije uz odgovarajući nivo značajnosti α I br.stepeni slobode
(1;n-2).Ukoliko je empirijski F-omjer manji od teorijskog prihvata se H0 I obratno.
Ako su ispunjene pretpostavke u regresivnom modelu I ako uzorak potiće iz normalne distribucirane
populacije,tada sampling distribucija regresivnog koeficijenta normalnog oblika intervala procjene β se
računa kao (fomula 135 druga samo što umjesto y0 je b a umjesto t je z).
Kada je osnovni skup normalne distribucije s nepoznatom varijansom sampling distribucije sa (n-2)
stepena slobode.
Procjena je pouzdanija što je interval širi tj. Veća je vjerovatnoća da će se u njemu naći posmatrani
parametar..Jednačina regresie omogućava procenu vrednosti zavisne varijable za određenu vrijednost
neavisne varijable koja nije postojala kao jedinica.Kod interpolacije nezavisne promjenjive x0 nalazi se
između najmanje I najveće vrednosti nezavisne varijable uzorka.Procjena zavisne varijable provodi se
brojem I intervalom.Brojem pomoću regresione jednačine I jednak je regresionoj vrednosti a intervalom
(druga formula 135) a procjena standardne greške procjene regresije se računa (treća formula 135).
Da bi predviđanje pomoću regresionog modela bilo validno neophodno je da se parametar β statistički
značajno razlikuje od nule te je potreban visok nivo koeficijenta determinacije.
JEDNOSTAVNA KRIVOLINIJSKA REGRESIJA
Nelinearne dvodimenzionalne regresione modele moguće je odgovarajućom transformacijom svesti na
model jednostavne linearne regresije.Transformacija se provodi na vrijednostima zavisne I nezavisne
varijable,a zavisi od oblika funkcionalnog dijela modela,koji izvire iz teorijskih postavki područja u kome
se model primjenjuje.Model kojim se izražavaju nelinearni odnosi među pojavama naziva se modelom
jednostavne krivolinijske regresije.
Navedeni nelinearni regresioni modeli analiziraju se na isti način kao I model jednostavne
linearne regresije,s tim da pri interpretaciji rezultata vodimo račna da sa statističke veličine
izračunate za model sa transformisanim a ne sa originalnim vrijednostima varijabli.
KORELACIONA ANALIZA -se bavi istraživanjem uzajamnih odnosa među pojavama, ali ne i uzročno-posljedičnim
vezama među njima.
Ako postoji jaka veza između dvije posm.pojave nije uvijek moguće odrediti nezavisnu i
zavisnu varijablu, te ispitujemo međuzavisnost između posm.varijabli. Kada su dvije pojave
povezane stohasticki a ne zna se da li se mjenjaju istovremeno ili se razlikuju u pogledu momenata
mjenjanja gocori se o korelacionoj povezanosti.
11
Za korelaciju je najbitniji pravac promjena dvije korelaciono povezane pojave isti, govori se
o pozitivnoj korelaciji, a kada je pravac različit, riječ je o negativnoj korelaciji.
Zadatak korelacione analize je da utvrdi stepen slaganja varijacija posmatranih pojava i
objasni oblik, smjer i jačinu veze između varijabli.
KOEFICIJENT JEDNOSTAVNE LINEARNE KORELACIJE -je brojčani pokazatelj kojim se izražava pojava u statističkoj analizi. Izražava međusobni
odnos dvije pojave kada se on ispoljava u nekoj pravolinjskoj tendenciji.
Postoji više vrsta koeficijenata korelacije, ali se u praksi najčešće koristi Pearsonov
koeficijent korelacije, koji u obzir uzima kovarijansu i standardne devijacije obje
posmatrane pojave. Pearsnov koeficijent korelacije je broj koji pokazuje u kojoj su mjeri
dvije uporedive pojave povezane, odnosno u kojem se obimu mjenjaju kada jedna promjena
izaziva promjenu druge pojave.
Koeficijent linearne korelacije mjeri jačinu i smjer povezanosti posmatranih pojava, a varira
u zatvorenom intervalu od -1 do +1. Znak + ukazuje na direktnu vezu, a - na inverznu
linearnu vezu. Viša apsolutna vrijednost ukazuje na višu povezanost.
Interpretacija visine pojedinog koeficijenta korelacije zavisi u prvom redu o pojavam čija se
povezanost ispituje, o ustanovljenim korelacijama u sličnim situacijama, o praktičnim
zahtjevima o pojedinim konkretnim slučajevima, tako da vrijednost ovog koeficijenta ne
treba shvatati grubo.
Koeficijent korelacije r moguće je izračunati pomoću koeficijenta determinacije ili pomoću
proizvoda regresijskog koeficijenta b i omjera standardnih devijacija varijabli x i y. Koeficijent
korelacije jednak je geometrijskoj sredini koeficijenata smjera obje regresione linije, a
predznak se određuje prema predznaku regres.koeficijent
Visina korelacije nije samo odraz stepena povezanosti između dvije varijable, nego može
biti posljedica različitih uticaja, od kojih su najvažniji:
-nelinearna veza – ako veza izmedju dvije varijable nije linearna koef.korelacije moze biti
toliko iskrivljen da njegovo izracunavanje nema smisla
-simetrična i unimodalna dustribucija posmatranih varijabli – vazan uslov realnosti slike koju daje
koeficjent korelacije r je simetricnost kojom se postize homoscedasicnost odnosa posmatranih
varijabli.asimetricnost jedne ili obje varijable ima za posljedicu nepravilnost u linearnosti tacaka koje tvore podaco
u dijag.rasipanja
-grupisanje rezultata – ako grupisemo rezultate u razrede to nece znacajno mijenjati
koeficjent korelacije samo ako je br.razreda dovoljno velik
-kauzalna interpretacija korelacije – dvije pojave koje su u korelacionoj vezi mogu biti i u
uzrocnoj veui. Sama cinjenica da izmedju 2 pojave postoji korelacija jos nam daje za pravo da te
pojave podjelimo uzrocnom vezom
-uticaj raspona – ako je raspon varijacije ogranicen u jednoj varijali, on je zbog toga nuzno
ogranicen i u drugoj varijabli sto znacajno smanjuje visinu korelacije.
-eliminisanje vrijednosti oko aritmetičke sredine – kod analze odnosa izmedju 2 varijable
istrazivaci ponekad iskljucuju sredisnje podatke.
-podskupovi s različitim aritmetičkim sredinama – ako prilikom istrazivanja koristimo
podskupove u korelacionoj analizi moguci su razliciti slucajevi. A) da svaki od
podskupova u korelacionoj analizi ne pokazuje nikakvu korelaciju izmedju varijable x i y
ali sastavljeni zajedno daju poz.korelaciju. B) da svaki podskup ima pozitivnu i nisku
korelaciju ali da zajedno daju pozitivnu i visoku korelaciju C) da svi podskupovi daju
neg.korelaciju ali zajednicka korelacija im bude oko 0.
12
U praksi se ponekad javlja potreba za računanjem korelacije između dvije kontinuirane
varijable, po pretpostavci normalno distribuirane u osnovnom skupu, s tim da je jedna od
varijabli namjerno dihotomizirana.
Dihotomija varijabli ( podjela na 2 modaliteta) predstavlja najgrublje moguće mjerenje, jer
posmatranu pojavu razlikujemo samo u dvije kategorije. Svođenje na 2 modaliteta je obično
posljedica jedinog načina na koji se mogu dobiti podaci. Za računanje korelacije između
kontinuirane i dihotomizirane varijable koriste se slijedeći koeficijenti: biserijski koeficijent i
point biserijski koeficijent FORMULE
TESTIRANJE ZNAČAJNOSTI PROCJENE KOEFICIJENTA r
U koleracionoj analizi ima nekoliko postupaka koji se mogu koristiti za testiranje značajnosti koeficijenat
korelacije. Uglavno u praksi nije poznata vrijednost koeficijenta korelacije osnovnog skupa, njegovu
značajnost procjenjujemo na osnovu uzorka. Ako za neki koeficijent korelacije, izračunat na
reprezentativnom uzorku za osnovni skup, utvrdimo da je statistički značajan, onda se on značajno
razlikuje od nule. U suprotnom slučaju, ako utvrdimo da koeficijnet korelacije niije statistički značajan,
onda se on ne razlikuje značajano od nule(0). Test hipoteze3 o značajnosti parametra p može biti
dvosmijeran i jednosmijeran. Kod dvosmijernog testiranja hipoteze između pojava u osnovnom skupu ne
postoji linearna korelacija: H0: p=0 H1:p≠0. Alternativna hipoteza pokazuje da u osnovnom skupu postoji
linearna korelacija, ali ne govori ništa o jačini veze. Testiranje hipoteze o koeficijentu korelacije
zasnovano je na odgovarajućoj sampling distribuciji. Ako uzorak potiče iz osnovnog skupa onda test
stetistika predstavlja omjer procjene koeficijenta korelacije sa st.greškom te procjene:FOR.140 i slijedi
Studentov raspored sa(n-2) stepeni slobode. Stand.greška procjene koef korelacije se računa:FOR.140.I
pkazuje koliko u prosjeku koef korel uzorka odstupa od keof korel Osnovnog skupa. Odluka se donosi
poređenjem testovne veličine sa odgovarajućim kritičnim(tabličnim) vr sampling distribucije. Ako je
apsolutna vrijednost testovne vel manja od kritične vrijednopsti(uz određeni nivo značajnosti) onda se
prihvata nulta hipoteza, odnosno koef koerl nije statistički značajan i superotno.Upoređivanjem p-
vrijednosti sa unaprijed određenim nivoom značajnosti može se donijeti odluka o odbacivanju ili
prohvatanj H0. Ako je p<α , onda ćemo odbaciti H0 i prihvatiti H1, a ako je p> α zaključujemo da
nemamo dovoljno razloga da odbacimo H0.
BISERIJSKI KOEFICIJENT KORELACIJE Za primjenu ovog koeficijenta neophodno je da se ispune 2 uslova. Prvi se odnosi ba
pretpostavku da se prva varijabla normalno raspoređuje u osnovnom skupu i da njene
mjere potiču s intervalne mjerne skale.
Drugi uslov podrazumjeva namjernu podjelu druge varijable na 2 modaliteta.
Mjera povezanosti dvije kontinuirane varijable, od kojih ni jedna po svojoj prirodi nije
dihotomna, ali se podaci jedne varijable djele u 2 kategorije, iskazuje se koeficijentom
biserijske korelacije. Primjena koef je opravdana kada je varijabla Y kontinuirano mjerena,
ali postoje nepravilnosti koje onemogućavaju primjenu koeficijenta r.
Postupak za izračunavanje biserijskog koeficijenta:
a)prvo se računa aritm.sredina -)onih rezultata varijable x kod kojih se u varijabli y nalazi
prva dihotomna oznaka i --)onih rezultata varijable x kod kojih se u varijabli y nalazi druga
dihotomna oznaka.
b) proporcija p i q se dobija na osnovu mjera frekvencija svakog od dihotomnih modaliteta
varijable Y.
c) nakon toga se računa standardna devijacija varijable x
d)u tabeli se nađe vrijednost proporcije p ili q u koloni s tim nazivom,a zatim se u istom
redu potraži odgovarajuća vrijednost izraza pq/y
e) vrijednost biserijskog koeficijenta se dobija uvrštavanjem prethodnih izračunatih
vrijednosti u izraz 2.1
13
POINT BISERIJSKI KOEFICIJENT KORELACIJE U praksi se često javlja potreba za računanjem korelacije između 2 vari., pri čemu je jedna
od varijabli kontinuirana, a druga po svojoj prirodi atributivna ili dihotomna. Mjera
povezanosti dvije varijable od kojih je jedna kvantitativna i kontinuirana, a druga po svojoj
prirodi dihotomna utvrđuje se point biserijskim koeficijentom. Za primjenu ovog koef.
neophodno je ispuniti slijedeće uslove: prva varijabla se normalno raspoređuje u populaciji i
potiče sa intervalne skale, a druga varijabla je po svojoj prirodi dihotomna i nikako ne može
biti normalno raspoređena. Između ove dvije diskretne kategorije postoji prekid,
diskontinuitet, u jednoj tački, od koje potiče naziv metode. Ima širi primjenu nego biser.kof.
Preporučuje se računanje biserijskog koef kada je dihotomna varijabla van svake sumnje
nornalno distrubuirana. Ako postoji mala sumnja da dihotomna vari. nije normalno
distribuirana, primjenjuje se point biserijski koeficijent korelacije.
KOEFICIJENTI KORELACIJE RANGA
Korelacija ranga je metoda kojom se mjeri povezanost rangova dvije ili više varijabli ranga.
Ako su varijable numeričke, treba ih transformisati u varijable ranga. Raširena metoda
neparametarske statistike.Nije potrebno da posmatrane pojave budu u linearnom odnosu.
Koeficijent rang korelacije ima prednost nad r koeficijentom kada kod mjernih rez postoje
extremne vrijednosti.
Ispitivanje stepena povezanosti između pojava datih u obliku modaliteta rang varijable nie
moguće na isti način kao i za modalitete numeričkih nizova. Neophodan je drugačiji pristup,
jer varijable nemaju potrebna metrička svojstva. Izdvajamo Spearmanov koeficijent(2
varijable ranga) i Kendelov koeficijent(za grupu varijabli ) rang korelacije.
-Spearmanov koeficijent korelacije ranga- -koristimo za utvrđivanje stepena povezanosti između pojava kod kojih su podaci dati u
obliku modaliteta rang varijable. To je u stvari koeficijent r primjenjen na rangirane
podatke. Varira u zatvorenom intervalu od -1(perfektna inverzna veza) do +1(perfektna
direktna veza).0 ukazuje na odsustvo veze između posmatranih pojava.
Koeficijent je jednak -1 kada je redosljed modaliteta prve rang varijable suprotan od
redosljeda druge rang varijable u paru i tada govorimo o perfektnoj inverznoj vezi.
O perfektnoj direktvoj vezi govorimo kada je koeficijent jednak 1, odnosno kada su u
svakom paru rangovi jednaki. Tada je svako d=0. Koeficijent je jednak nuli za najveće
neslaganje rangova, odnosno kada je zbir kvadrata razlika rangova jednak.
Kendelov koeficijet W u praksi ponekad imamo slučajeva kada nas zanima slaganje između tri i više nizova ranga.
U tu svrhu koristi se Kendelov W koeficijent. U brojniku se nalazi aritmetička sredina
rangova za i-ti red i aritmetička sredina svih rangova.
Kendelov koeficijent ne može biti negativnog predznaka. pr.Ako se članovi komislije nikako
ne slažu, koeficijent W je jednak 0, a ako se slažu u potpunosti, jednak je 1. Ovaj koeficijent
testira odnos između stvarnog slaganja i maksimalnog mogućeg slaganja. Testiranje
značajnosti W vrši se poređenjem testovne veličine s tabličnom veličinom za odgovarajući
nivo značajnosti alfa, veličinu uzorka n i K varijabli ranga.Može se utvrditi i pomoću hi-
kvadrat testa. U koliko se utvrdi da je hi-kvadrat značajan, onda je i W koef značajan.
14
KOEFICIJENTI ASOCIJACIJE
-se korsite za mjerenje povezanosti dvije ili više nominalnih varijabli. Mjerenje stepena
povezanosti između modaliteta nominalne varijable nije moguće na isti način kao i za
modalitete numeričkih i ordinalnih nizova. Neophodan je drugačiji pristup, jer nominalne
varijable nemaju potrebna metrička svojstva modaliteta numeričke ili rang varijable.
Nominalna skla je najnepreciznija skala i služi samo za klasifikaciju.
Ovi koeficijenti daju samo približnu indikaciju asocijacije između posmatranih pojava, pa je
potrebno posebnu pažnju posvetiti kvantitativnom mjerenju stepena i smjera, te
tumačenje njihove veze.
Podaci se unose u kontigencijsku tabelu. Upotrebom izraza kontigencija, umjesto
korelacija, želi se naglasiti oblik povezanosti koji se javlja između diskontinuiranih
nominalnih varijabli.
Manje se radi o odnosu modaliteta posmatranih pojava, a više o međusobnom stanju
modaliteta posmatranih varijabli. U literaturi se navode slijedeći koeficijenti asocijacije:
Pearsonov koeficijent kontigencije C, Cramerov koeficijent K i koeficijent fi.
Pearsonov koeficijent kontigencije
Kontigencijom C se utvrđuje zavisnost dva obilježja u dvodimenzionalnoj tabeli
kontigencije. Koeficijent C ne zahtjeva simetričnu raspodjelu posmatranih varijabli.
Asocijcija između nominalnih varijabli je slabija kada su razlike između empirijskih i
očekivanih frekvencija manje. Koeficijent kontigencije C se zasniva na hi-kvadart testu.
C=
Hi kvadrat test se koristi kada trebamo utvrditi da li neke opažene frekencije zajedno
odstupaju od očekivanih vrijednosti. Kreće se u zatvorenom intervalu od 0 do 1. Min vrijed
je 0, a max zavisi od broja posmatranih modaliteta, ali nikad nie veća od 1. Vrijednost koef.
ukazuje na postojanje povezanosti, ali ne i na smijer, odnosno da li je veza pozitivna ili
negativna. Istraživač određuje smijer na osnovu kretanja podataka u tabeli kontigencije.
Ovaj koef se koristi za diskontinuirane podatke, njegovo poređenje sa koefi r obično nie
opravdano. Koef C nie pouzdana mjera onda kada se u tabeli kontigencije jave suviše male
očekivane vrijednosti. Može se poboljpati smanjenjem tabele.
Cramerov koeficijent asocijacije K
Zbog teškoća u interpretaciji koeficijenta kontigencije C u praksi se sve više koristi
koeficijent K. Polaznu osnovu za računanje C koeficijenta čine razlike između empirijskih i
očekivanih frekvencija, odnosno testova vrijednost hi kvadrata.
K=
Kreće se u zatvorenom intervalu od 0 do 1. Koef poprima vrijednost 0 u slučaju nezavisnih
nominalnih varijabli. Koeficijent uzima max vrijednost 1, u slučaju potpunog slaganja
posmatranih varijabli. Ovom koeficijentu se ne pridružuje predznak
Koeficijent fi
-mjeri se povezanost dvije varijable koje su obje po svojoj prirodi dihotomne ili je jedna
takva, a druga dihotomna samo po obliku( a po prirodi numerička i kontinuirana). Za
15
računanje ovog koef neophodno je da da bar jedna varijabla bude prirodno podjeljena na
dva modaliteta. Koeficijent fi se često upotrebljava i u slučajevima kada je jedna od varijabli
po prirodi kontunuirana, a samo se prikazuje dihotomno zbog razgraničenja na odeđenom
mjestu kontiniuma. Radi se o parametarskoj metodi, jer se ne može pretpostaviti normalna
distribucija kod dihotomnih varijabli. Računa se dir iz tabele kontigencije a i može se izvesti
iz hi-kvadrata.
Fi koeficijent varira od -1 do 1. Vrijednost 1 postiže samo ako je(a+b)=(a+c), odnosno -1
postiže ako je (a+b)=(b+d). [ a,b,c,d pojedine frekencije iz 4 ćelije tabele. a i d na jednoj
dijagonali a, b i c na drugoj dijagonali. ]
KORELACIJA IZMEĐU NOMINALNE I RANG VARIJABLE U praksi se ponekad javlja potreba za mjerenjem stepena povezanosti između pojava datih
u obliku nominalne varijable i rang varijable. Potreban je drugačiji pristup, jer nominalna i
rang varijabla nemaju poterbna metrička svojstva modaliteta numeričke varijable.
Tu korelaciju računamo najčešće Kendelovim tau koeficijentom i Freemanovim teta
koeficijentom.
Kendelov tau koeficijent
-koristimo kada želimo da utvrdimo povezanost varijabli od kojih je jedna rang varijabla a
druga dihotomna nominalna varijabla. U koliko nie svejedno da li jedinica pripada jednoj ili
drugoj grupi, onda to znači da postoji povezanost između posmatranih pojava.
(formula)
Freemanov teta koeficijent
-koristimo kada želimo da mjerimo povezanost pojava koje su predstavljene rang
varijablom i dihotomnom nominalnom varijablom. Koef tau i teta se značajno razlikuju, a
prednost ide Freemanovom teta koeficijentu, jer kod potpune povezanosti koeficijent teta
daje očekivani maximalnu rezultat 1, bez obzira na vel uzorka, dok se koef tau smanjuje što
je uzorak veći.
(formula)
Ris predstavlja zbir rangova ispod prilikom poređenja ranga svake jedinice prvog podskupa
sa rangovima svih jedinica drugog podskupa, a Riz , zbir rangova iznad.
Možemo ga koristiti i kada nema vezanih rangova.
PARCIJALNA KORELACIJA Zakon jedne varijable poretpostavlja eliminisanje djelovanja svih drugih varijabli da bi se
utvrdila povezanost varijabli koje su predmet posmatranja. U tom slučaju će se primjeniti
postupak kojim se uvtrđuje povezanost dvije varijable uz eliminisanje treće varijable. Ovim
postupkom se od ukupne korelacije oduzima onaj dio koji je nastao djelovanjem treće
varijable. Tako dobiveni dio ukupne korelacije naziva se parcijalna korelaija.
(formula 2.40)
Koeficijent parcijalne korelacije uzima vrijednosti od -1 do 1.
Parcijalna korelacija može biti linearna i nelinearna. U praksi se u glavnom koristi metom
linerane parcijalne korelacije.
ZAKLJUČNA RAZMATRANJA O MJERAMA KORELACIJE Koeficijent korelacije je indeksni broj i nije mjera na linearnoj skali jednakih jedinica. Razlike između
velikih vrijednosti r i su mnogo veće nego one između malih vrijednosti r. Ne možemo tvrditi da je kod
koeficijenta r= 0,6 dva puta veća povezanost nego kada je r= 0,3, ali možemo reći da je r= 0,75 ukazuje
na isto tako čvrstu povezanost kao što to pokazuje r= 0,7.
16
U vezi interpretacije koeficijenta korelacije prisutna su dva gledišta: teorijsko i praktično. S teorijskog
gledišta svaki koeficijent korelacije koji je statistički značajan može da ukazuje na neku povezanost
između pojava, pa je opravdano uzeti i male koeficijente korelacije kao pokazatelje povezanosti, ali na
pojave koje su predmet našeg posmatranja utiču različiti fktori i okolnosti, koji izmiču našoj kontroli. S
obzirom da vrlo rijetko dobijemo potpunu korelaciju, slijedi da prilikom interpretacije nekog koeficijenta
korelacije treba uvijek uzeti u obzir uslove pod kojima je izračunat.
S druge strane gledišta, koeficijent korelacije je indikativanza povezanost između posmatranih pojava
(možda i za neku zakonitost u teorijskom smislu), može biti bez praktičnih važnosi. Koeficijenti
korelacije služe, pored ostalog, i za statistička predviđanja. Ako je korelacija između pojava visoka, onda
je statističko predviđanje sigurnije i obratno.
Koeficijent korelacije ne predstavlja nikakvu apsolutnu prirodnu činjenicu i da ga možemo tumačiti
uvažavajući uslove u kojima je izračunat. Potrebno je da znamo koja varijabla se mjeri, kojim mjernim
instrumentima, pod kojim okolnostima i u kojoj populaciji. Prema tome, koeficijent korelacije je potpuno
relevantan okolnostima pod kojima je izračunat i treba da bude interpretiran u svijetlu tih okolnosti.
MULTIPLA LINEARNA KORELACIJA
Kod multiple linearne korelacije istražujemo povezaost dviju ili više nezavisnih varijabli sa
zavisnom varijablom.
Koeficijenti multiple korelacije su značajniji jedino u slučaju kada raspolažemo dovoljnim
brojem podataka i kada su svi pojedinačni koeficijenti korelacije r linearni. Jedno od
značajnih područija istraživanja koje se zasniva na utvrđivanju višestruke povezanosti je
prognoza budućeg uspjeha na osnovu rez prethodnih testova i sl.
Koeficijent multiple linearna korelacije možemo računati pomoću elemenata korelacione
matrice, kao drugi korjen iz koeficijenta multiple determinacije, pomoću regresionih
koeficijenata i omjera stand.devijacija varijabli i na druge načine. Varira u intervalu od 0 do
1. Ne pridružuje mu se predznak.
Postoje 2 gledišta tumačenja koefi multiple lin korelacije: teorijsko i praktično.
Sa teorijskog gledišta, svaki koef korelacije koji je stat značajan može da ukazuje na neku
povezanost između pojava. Međutim, na pojave koje su predmet našeg posmatranja utiču i
razl faktori i oklnosti, koji izmiču našoj kontroli.
Sa praktičnog gledišta, koef korelacije koji je indikativan za povezanost
između posmatranih pojava, može biti bez praktične važnosti. Koef korelacije služe, pored
ostalog, i za stat predviđanja. Ako je korelacija između pojava visoka, onda je stat
predviđanje sigurnije i obrnuto.
Parametarske metode se primjenjuju pod strogo određenim uslovima o normalnosti
rasporeda posmatranih varijabli. Neparametarske metode su nezavisne od oblika
distribucije varijabli, pa su i ti koeficijenti manje pouzdane mjere korelacije.
DINAMIČKA ANALIZA VREMENSKIH NOZOVA
U desktiptivnoj statistici za nedovosmisleno određivanje pripadnosti elem posmatranom
osnovnom skupu, neophodno je je pojmovno, prostorno i vremensko definisanje.
Pojmovno definisanje osn skupa podrazumjeva da se tačno i precizno odredi osobina koju
mora da ima svaka stat jedicnica da bi bila uključena u skup.
Prostorno odrediti skup znači tačno odrediti prostor na kojem pripadaju stat jedinice.
Vremensko definisanje skupa podrazumijeva da se precizno odredi vrijeme kada ce se
posmatranje realizirati.
17
Dinamička analiza obuhvata istraživanje zakonitosti kretanje masovnih pojava u vremenu,
odnosno omogućava praćenej promjena pojave u vremenu i predviđanje tendencije razvoja
pojava. Ova analiza podrazumjeva praćenje kvantitativnih promjena pojava, kako u obimu
tako i u strukturi tokom vremena. Zakonitosti kretanja masovnih pojava kroz vrijeme često
su predmet ekonom. i drusštvenih istraživanja, a u otkrivanju tih zakonitosti pomažu nam
metode stat analize vrem nizova( serija). Pomoću vrem serija koje predstavljuju nizove
podataka o niovu posmatranih pojava u sukcesivnim vremenskim intervalima, prelazi se sa
stat aspekta na dinamički aspekt posmatranja.
VREMENSKI NIZ KAO IZRAZ DINAMIKE -je skup hronološki uređenih vrijednosti posmatrane pojave. Vrijednosti čijim redanjem
nastaje vremenski niz zove se frekvencija.
Prema načinu nastanka, razlikujemo intervali i trenutni.
Ako je neku pojavu moguće posmatrati samo u nekom intervalu dobićemo frekvencije
pojedinih vremenskih jedinica, čijim uređivanjem nastaje intervalni vremenski niz. Sve one
pojave koje imaju jedan smjer kretanja, koji je određen početkom i krajem perioda, možemo
posmatrati samo u određenom periodu vremena.
Kod trenutnog vremenskog niza radi se o pojavama čija priroda nameće posmatranje samo
u jednom trenutku ili presjeku. Rez ovakvih posmatranja su frekvencije koje pokazuju nivo
pojave u određenom trenutku, a njihovim uređenjem nastaje trenutni vrem.niz.
Sabiranjem vrijednosti pojave po odabranim vremenskim intervalima nastaju frekvencije
intervalnog vrem niza. Ovaj niz ima svojstvo kumulativnosti, pa se zato frekv mogu sabirati.
Trenutni niz predstavlja skup hronološki uređenih vrijednosti, koje predstavljuju stanja
pojava u odabranim vrem tačkama.
Prema načinu iskazivanja posmatrane pojave razlikujemo izvorni i izvedeni vrem niz.
Izvorni vrem niz nastaje hronološkim uređenjem veličina koje su rezultat direktnog
mjerenja pojava po odabranim vremenskim intervalima.
Ukoliko su frekvencije rezultat brojčanih operacija nad jednim ili više vrem nizova onda se
radi o izvedenom vrem nizu.
Konzistentnost vremenskog niza
Ispravni zaključci o dinamici posmatrane pojave mogući su ako je vremenski niz
konzistentan, odnosno ako se radi o uporedivim podacima. Posebnu pažnju treba usmjeriti na:
definisanje i mjerenje varijable na isti način u cjelom posmatranom periodu, iste vremenske jedinice
posmatranja, administrativno teriotorijalne promjene, te na stabilnost cijena kod vrijednosnog
istraživanja.
Tokom vremena mjenja se definicija posmatranih pojava, mjenjaju se kriteriji razgraničenja,
metodi mjerenja i načina iskazivanja. Ovaj problem je posebno izražen kod dužeg
posmatranja neke pojave gdje kao neminovnost dolazi do promjene njenog sadržaja, a
samim tim i njenog definisanja, mjerenja i iskazivanja. Sve to značajno utiče na upoređivanje
podataka.
Drugi faktor na koji trebamo obratiti pažnju kada se radi o zahtjevu uporedivosti nizova je
vremenski interval posmatranja. Podatke ima smisla upoređivati samo ako se odnose na
iste vremenske jedinice. Vremenske jedinice dobijamo tako što stat skup raščlanimo prema
vremenskom obilježju. To znači da će svaka vremenska jedinica biti definisana jednim
vremenskim periodom, a frekvencije te jedinice predstavljat će onaj dio skupa koji pripada
tom periodu. Za vrem obilježje upotrebljavamo kalendarska razdoblja:godina, polugodište,
kvartal...
18
Kod rasporeda frekvencija u desktiptivnoj statistici uvijek se prije upoređivanja frekvencija
provjerava da li su razredi jednake veličine. Ako nisu, onda se koriguju, pa tek onda
uporešuju frekvencije. Radi uporedivosti podataka, sličan postupak ćemo koristiti i kod
analize konzistentnosti niza. Frekvencije se koriguju svođenjem na najmanji vremenski
interval.
Kod trenutnog vremenskog niza varijacije dužine istih kalendarskih jedinica ne utiču na
njihovu uporedivost. Poželjno je da su frekvencije vezane za jednako udaljene vremenske
tačke, jer to pojednostavljuje postupke.
Česte administrativno teriotorijalne promjene takođe otežavaju uporedivost podataka.
Kroz duži vremenski period je teško zadržati prostornu definiciju pojave, jer se u vremenu
mjenjaju i prostorne granice. U slučajevima gdje je to moguće, potrebno je pregrupisati
podatke u nizove uporedivih podataka.
Posebnu pažnju zaslužuju nizovi koji dinamiku pojava izražavaju vrijednosno. Kod ovih
nizova promjene cijena značajno determiniraju veličine pojave. Da bi se u ovakvim
slučajevima sagledala realna dinamika posmatrane pojave potrebno je eliminisati uticaj
promjena u tekućim cijenama na njeno ponašanje. To se radi na taj način što se vrijednost
prodaje za čitav posmatrani period obračunava po stalnim cjenama, odnosno cijenama iz
perioda koji se odabere kao bazni.
CILJEVI I PRISTUPI ANALIZE VREMENSKIH NIZOVA Analizom vrem nizova želimo postići slijedeće ciljeve:
Desktipcija pojave - u prvoj etapi izučavanja osnovnih karakteristika vrem niza koristimo graf
prikazivanje i deskriptivnu statistiku.
Objašnjenje varijacije pojave- kada raspolažemo sa više vremenskih nizova moguće je
koristiti varijacije jednog niza za objašnjenje varijacija drugog niza.
Predviđanje razvoja pojave- na osnovu prošlih opservacija identificiramo i procjenjujemo
model vremenskog niza i zatim ga korsitmo za predviđanje budućih nivoa pojave. Predviđanje
se bazira na pokazateljima dinamike ili modelima vremenskih pojava.
Kontrola procesa- ovaj zadatak analize posebno je interesantan u analizi vremenskih nizova
koji se javljaju u statističkoj kontroli kvaliteta. Potreba za regulacijom procesa javlja se kod
različitih neusklađenosti, koje su rezultat pojave premalih ili prevelikih vrijednosti niza.
Statističke metode možemo razvrstati u dvije grupe:
a) metode koje analizi vremenskih nizova pristupaju sa stanovišta vremena
Istraživanje razvojnih tendencija vremenskih nizova u funkciji vremena je predmet
ove metode. Postoje dva pristupa: 1) sastoji se u utvrđivanju analitičkih izraza kojima se
opisuje razvoj pojave i to pomoću f-je vremena. 2) izvire iz težnje da se statistički opiše
dinamička struktura pojave a ne njeno kretanje u vremenu. Ovaj pristup podrazumijeva
mjerenje stepena i smjera korelacije članova niza, razmaknutih jedan, dva ili više perioda
kao i analitičko izražavanje te međuzavisnosti.
b) metode koje joj prilaze sa stanovišta frekvencija
ova metoda spada u područije spektralne i harmonijske analize. Manje se koristi od
prethodne metode, jer je mnogo složenija.
19
GRAFIČKO PRIKAZIVANJE VREMENSKIH NIZOVA
Da bi frekvencije, odnosno podaci i rezultati koje izražavaju vremenski nizovi postali
razumljiviji, u statistici se za njihovo predstavljanje koristi grafičko prikazivanje. Danas se
konstrukcija grafikona i dijagrama vrši pomoću statističkih ili sličnih računarskih programa.
Vremenski nizovi se mogu grafički prikazati na više načina.
Tekstualni dio grafikona treba da sadrži: naslov, oznaku jedinice mjerenja, oznake perioda
na apsici, izvor podataka i po potrebi objašnjenje i napomene.
Na grafikonima, radi lakšeg prikazivanja, često se označava mreža. Ona se u pravouglom
koordinatnom sistemu sastoji od spleta horizontalnih i vertikalnih linija, koje uobičajno
prolaze kroz karakteristične tačke mjerila na koordinatnim osama.
U koliko intervali posmatranja nisu jednaki, neophodno je korigovati frekvencije. Vremenski
niz sa korigovanim frekvencijama prikazuje se linijskim ili površinskim grafikonima.
Intervalni niz prikazuje se linijskim i površinskim grafikonima.
Linijski grafikoni su jednodimenzionalni i koriste se za prikazivanje vremenskih nizova kod
pojava koje imaju svoj tok, dinamiku i razvoj. Naglašavaju brzinu, a ne veličinu promjena.
Preglednost linijskih grafikona doprinosi i prekid mjerila na ordinati. Postupak izostavljan ja
djela aritimetičkog mjerila na ordinati omogućava jasnie uočavanje malih varijacija pojave i
tada je riječ o horizontalnom prekidu grafikona.
Grafikon se konstruira tako što se na apsicu unosi aritmetičko mjerilo za vrijeme, a na
ordinatu aritimetičko mjerilo za frekvencije. Linijski grafikon nastaje spajanjem tačaka čije
su koordinate date sredinama posmatranih vremenskih perioda i frekvencijama. Apcise tih
tačaka određene su sredinama dužina koje predstavljaju periode a ordinate tačaka zavise
od frekvencija. Apsolutne razlike frekvencija pojedinačnih posmatranih pojava
predstavljene su razlikama ordinata dviju tačaka, dok je intenzitet promjena pojave
predstavljen srminama linija.
Površinski grafikoni imaju dvije dimenzije i kod njih su frekvencije niza predstavljene
površinama različitih geometrijskih oblika. Ova vrsta graf se koristi kada se želi istaknuti
veličina, a ne vrijeme i brzina promjene u vremenu.
Histogram stupaca se crta u pravouglom koordinatnom sistemu, pri čemu se frekvencije
prikazuju stupcima jednakih osnovica. Površina stupaca jednaka je proizvodu osnovice i
visine. Razlikujemo jednostruke, razdjeljene, dvostruke i višestruke stupce. Razdjeljeni
stupci se korsite za prikazivanje strukture pojave u apsolutnim ili relativnim vrijednostima.
Pomoću dvostrukih i višestrukih stupaca se vrši poređenje više vremenskih nizova po
obimu, strukturi i značaju. Horizontalni histogrami se koriste kada težište treba staviti na
poređenje a ne na vremensku komponentu, dva ili više vremenskih nizova.
Poređenje vrem nizova čije su frekcencije na izrazito različitim nivoima nie adekvatno na
grafikonu sa aritmetičkim mjerilom, jer varijacije pojava nisu uočljive. Sagledavanje
relativnih promjena omogućava nam logaritamsko mjerilo, odnosno primjena
polulogaritamskog grafikona. Logaritamsko mjerilo je takvo mjerilo kod kojeg su logaritmi
brojeva prikazani određenim dužinama na tom mjerilu. Omogućava nam dobro uočavanje
manjih varijacija pri nižim frekvencijama. Strmine linija na grafikonu govore o jačini
relativnih promjena. što je razumljivo jer razlika logaritma predstavlja omjer-relativan broj.
20
Polulogaritamski grafikon se koristi za grafičko prikazivanje dva ili više nizova različitih
brojčanih nivoa, pri čemu se na apcisi konstruiše aritmetičko mjerilo a na ordinati
logaritamsko mjerilo. Ovaj grafikon se konstruira u pravouglom koordinatnom sistemu, a
nastaje spajanjem tačaka čije su koordinate date vrijednostima varijable vrijeme u
aritmetičkom mjerilu na apcisi a frekvencijama prema logaritamskom mjerilu na ordinati.
Trenutni vremenski niz se grafički prikazuje linijskim grafikonom i predstavlja stanja u
odabranim vremenskim trenucima. Frekvencije niza s različitim udaljenostima nie potrebno
korigovati jer ovaj niz nema svojstvo kumulativnosti.
Za grafičko prikazivanje određenih vremenskih nizova koristi se polarni koordinatni sistem.
Polarni dijagram se koristi za prikazivanje vremenskih nizova kod kojih su naglašene
sezonske varijacije. On se zasniva na duži, koja polazi od jednog proizvoljnog početka, a
sama duž predstavlja polarnu osu. Iz tako slobodno izabrane tačke povuče se onoliko
poluosi ( radij-vektora) koliko ima intervala u posmatranom vremenskom nizu. Radij-vektori
djele ravninu na segmente jednake veličine. Na njih se nanose frekvencije vremenskog niza,
pri čemu udaljenost od ishodišta zavisi od veličine empirijskih frekvencija. Za mjesečne
podatke mreža polarnog dijagrama se konstruiše tako što se kroz ishodište položi 12
dužina, između kojih je ugao od 30 stepeni. Zatim se na jedan radij-vektor označi
aritimetičko mjerilo za frekvencije, te nacrtaju koncetrični krugovi koji prolaze markantnim
tačkama mjerila. Spajanjem tačaka dobija se kriva. Što je sezonski uticaj veći, kriva će biti
bliža kružnici s većim radijusom i obrnuto. Sezonska pojava često se posmatra kavartalno.
Ako vremenski niz čine kvartalni podaci, ugao između dvaju susjednih vektora iznosi 90
stepeni, a pripadajući sektor označava kvartal. Dalje se konstruira na isti način kao i kada
radimo sa mjesečnim podacima.
RELATIVNI POKAZATELJI DINAMIKE -mjere promjene jedne pojave ili grupe homogenih pojava u toku vremena u odnosu na neki
bazni period. Jednu od najjednostavnijih metoda analize dinamike predstavljaju indeksni
brojevi. Indeksi su relativni brojevi koji pokazuju odnose različitih stanja jedne pojave ili
jedne grupe pojava u različitim intervalima ili momentima vremena. Olakšavaju
sagledavanje dinamike posmatrane pojave jer nepregledne serije svode na procente.
Osobina indeksa da izražava odnose promjena pojava u toku vremena i relativna
jednostavnost njegovog izračunavanja, uticala je da se indeksi u praksi upotrebljavaju kao
najprikladnije sredstvo statističke analize dinamike masovnih pojava.
Razlikujemo indekse strukture i indekse dinamike.
Indeksi strukture pokazuju odnos djelova prema cjelini posmatrane pojave u jednom
trenutku ili intervalu vremena, dok indeksi dinamike pokazuju promjene u nivou pojave
tokom vremena.
Indeksi dinamike pokazuju za koliko se jedna pojava ili grupa homogenih pojava promjenila
u svom razvojnom toku.
Najpoznatija podjela indeksa dinamike je na individualne i grupne.
Individualni indeksi pokazuju odnos između dva stanja posmatrane pojave, a grupni
indeksi pokazuju odnos između dva stanja skupine pojava.
21
Individualni indeksi -pružaju sintetički pogled na evoluciju u odnosu na bazni period i omogućavaju praćenje
promjena analiziranih veličina između svih posmatranih perioda. Individualni indeksi se
djele na indekse po stalnoj bazi (bazni indeksi) i indekse sa promjenjivom bazom ( lančani
indeksi).
Bazni indeksi računamo kao omjer između veličine pojave u posmatranom i baznom periodu. Period prema
kojem se vrši poređenje, naziva se bazni period i označava se sa 100. Kako se sve
frekvencije niza dijele s nivoom pojave u baznom periodu, bazni indeksi su proporcionalni
veličinama iz kojih su izračunati. Prvi korak u konstrukciji ovog indeksa je izbor baznog
perioda. U praksi se često uzima prvi ili zadnji period u nizu kao bazni, i to ima određeni
smisio. U sličajevima kada je izbor baznog perioda otežan, ili onemogućen, preporučuje se
da se za bazu odabere neka druga veličina, npr aritmetička sredina freksvencija niza ili neka
druga vrijednost. Za bazni period treba odabrati period u kojem pojava pokazuje relativno
stabilan nivo, ili onaj period u kojem pojava nie bila izložena neubičajnim uticajima.
Bazni indeks pokazuje koliko jedinica pojave u vremenu t tolazi na svakih 100 jedinica
pojave u periodu b. Uvijek su pozitivni brojevi, mogu biti veći, manji ili jednaki 100. Razlika
između 2 bazna indeksa pokazuje indeksne bodove, koji pokazuju apsolutnu a ne relativnu
razliku opaženih podataka. Ako od baznog indeksa oduzmemo 100, dobit ćemo stopu
promjene novia pojave u odnosu na bazi period.
Lančani indeksi računamo ih tako što za bazu uzimamo svaki put podatke iz prethodnog perioda. Ovi
indeksi nazivaju se i koeficijenti dinamike, jer pokazuju dinamiku i tempo promjene
posmatrane pojave u odnosu na prethodni period.
Lančani indeksi pokazuju koliko jedinica pojave u periodu t dlazi na svakih 100 jedinica
pojave u periodu t-1. Kod lančanih indeksa broj 100 ne označava bazu, nego stagnaciju
razvoja neke pojave. Vrijednost iznad 100 pokazuje da je u tekućem periodu pojava
zabilježila rast, dok vrijednost ispod 100 pokazuje da je došlo do smanjenja novoa razvoja
pojave u odnosu na prethodni period.
OSOBINE INDEKSA:
Osibina identiteta- indeks ostaje nepromjenjen ako se posmatrana veličina ne
mjenja.
Osobina tranzitivnosti-ovu osobinu zadovoljavaju indeksi čiji je proizvod jednak
odnosu veličine pojave u posmatranom i baznom periodu.
Osibina recipročnosti- se može definisati u odnosu na vrijeme, a govori da je
recipročan indeks neutralan u odnosu na vrijeme.
Osobina cirkularnosti- kada je zadovoljena osobina tranzitivnostii recipročnosti,
može se reći i da je zadovoljena osobina cirkularnosti.
22
Prosječna stopa promjene Pored individualnih indeksa za iskazivanje relativnih varijacija posmatrane pojave koristi se i
prosječna stopa promjene. Ona nije najsretnije rješenje, jer stopa može biti pozitivnog i
negativnog predznaka, pa samo ona sa pozitivnim predznakom upućuje na nivo rasta
pojave. Može se izračunati na 3 načina: na osnovu geometrijske sredine lančanih indeksa,
na osnovu orginalnih podataka i na osnovu baznih indeksa. Geometrijska sredina lančanih
indeksa može se izračunati i onda ako su poznati samo prvi i zadnji član niza. Iz osobine
tranzitivnosti proističe drugi način za računanje prosječne stope promjene, odnosno
direknto iz podataka vremenskog niza. Osnovni nedostatak ovako izračunate prosječne
stope rasta proističe iz činjenice da se ona praktično računa samo na osnovu prve i zadnje
vrijednosti posmatrane pojave. Ona će biti dobar reprezentat samo ako su koeficijenti
dinamike u uzastopnim periodima približno jednaki.
Prosječna stopa promjene može da se računa i na osnovu baznih indeksa, jer su oni
direknto proporcionalni s empirijskim frekvencijama. Nedostatak ovako dobivene stope
jeste što ona uprosječuje rast pojave u svim periodima, bez obzira na različite varijanse
unutar niza.
Prosječna stopa može se koristiti za predviđanje razvoja pojave, uz pretpostavku da će se
pojava i u narednim periodima mjenjati prema izračunatoj stopi.
Pored predviđanja razvoja pojave, na osnovu ove stope može se izračunati u kojem će
periodu, uz nastavak ispoljene tendencije, pojava dostići određeni nivo.
Grupni indeksi Grupni indeksi omogućavaju sintezu varijacija više srodnih pojava, jer se zbog nekih
zajedničkih osobina mogu da posmatraju kao jedna cjelina.
Grupni indeksi nam omogućavaju praćenje kretanja kompleksnih pojava, kao što su:
proizvodnja, troškovi, cijene, produktivnost rada i sl. Toliko su važni da se kod spominjanja
samog pojma indeksa, bez daljeg raščlanivanja podrazumijeva grupni a ne individualni
indeksi.
Postupak analize grupe pojava pomoću indeksa provodi se u nekoliko koraka:
- definisanje grupe pojava i namjene grupnih indeksa
- izbor elemenata za grupni indeks i njihova identifikacija
- prikupljanje podataka o elementima
- izbor baze indeksa, određivanje pondera i izraza za izračunavanje grupnih indeksa
- ocjena reprezentativnosti indeksa kao prosječnih veličina i provođenje testova o
njihovim teorijskim svojstvima.
23
Grupni indeksi mogu biti bazni ili lančani. Za računanje grupnih indeksa koristimo metod
srednjih vrijednosti i metod agregata.
Prema metodu srednjih vrijednosti grupni indeksi se računaju tako što se odredi
aritmetička sredina, harmonijska ili geometrijska sredina individualnih indeksa vremenskih
nizova. Prema drugom metodu grupni indeksi se računaju tako što se zbir podataka
sastavljenih nizova u tekućem periodu stavi u odnos prema zbiru podataka tih nizova u
baznom periodu. Zajednička vrijednost na koju se svode različite pojave predstavlja složenu
veličinu ( agregat), pa otuda i sam naziv postupka.
Primjena metoda srednjh vrijednosti i metoda agregata u izračunavanju neponderisanih
grupnih indeksa opravdana je samo u slučaju kada sastavni nizovi imaju približno isti značaj.
U praksi je najčešće slučaj da sastavni nizovi agregata za koje računamo grupni indeks
nemaju isti značaj. Zato ove indekse ponderišemo u cilju obezbjeđivanja njihove veće
reprezentativnosti kao pokazatelja dinamike više srodnih vremenskih nizova. U stati praksi
najčešće korišteni metodi ponderisanja su Laspeyresov i Paascheov metod.
Grupni indeks cijena -je relativan pokazatelj dinamije kretanja cijena grupe pojava u tekućem peridu u odnosu na
bazni period. Za računanje koristimo metod srednjih vrijednosti i metod agregata.
Prema prvom metodu, grupni indeksi se računaju tako što se odredi sredina individualnih
indeksa vremenskih nizova. Prema metodu agregata grupni indeksi se računaju tako što se
zbir podataka sastavljenih nizova u tekućem periodu stavi u odnos prema zbiru podataka
sastavljenih nizova u tekućem periodu.
Metod srednjih vrijednosti ne polazi od orginalnih podataka, nego od njihovih individualnih
indeksa, izačunatih na isti bazni period.
U praksi se najčešće upotrebljavaju aritmetički i geometrijski indeksi, dok je harmonijski
indeks koristi za specifična istraživanja dinamike cijena. Nedostatak ovakvog računanja
grupnog indeksa cijena jeste taj što se daje svim nizovima jednak značaj. U praksi je rijedak
slučaj da svaka cijena ima jedan ponder. izračunata vrijednost neće biti adevatna ako se u
grupi pojavi neke ekstrem, koji na promjeniti indeks na zjanačno visok ili nizak nivo.
Ponderisanje ima cilj da istakne relativni značaj pojedinih sastavnih nizova u skupu. Na ovaj
način, povećava se reprezentativnost grupnih indeksa kao pokazatelja dinamike
vremenskih nizova.
Laspeyresov grupni indeks cijena pokazuje za koliko procenata su se promjenile cijene
grupe pojava zajedno u tekućem u odnosu na bazi period, računajući uz neizmjenjene
količine iz baznog perioda.( ponderise uzimaju iz baznog perioda)
Paascheov grupni indeks cijena pokazuje za koliko procenata su se promjenile cijene grupe
pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene količine iz
baznog perioda.( ponderi se uzimaju iz trekućeg perioda)
24
Laspeyresov i Paascheov indeks su jednaki samo u dva slučaja: prvi, kada količine u tekućem
periodu ostanu nepromjenjene, i drugi, kada promjena količina ne znači i pr omjenu
strukture u tekućem u odnosu na bazni period. Nemaju osobinu tranzitivnosti, ali se
pretpostavlja da imaju, jer je numerički skoro zadovoljena. Ponderi Laspeyresovog indeksa
su stalni, dok se ponderi Paascheova indeksa mjenjaju za svaki period za koji se računa taj
indeks. Nedostatak grupnih indeksa računatih ponderima iz tekućeg perioda je često
mjenjanje pondera, pri čemu rezultirajući indeksi nisu međusobno uporedivi. Jedan od
razloga zbog koji se ovaj indeks rjeđe koristi od Laspeyresovog je i to što u praksi često ne
raspolažemo adekvatnim tekićim/izvještajnim podacima za određivanje pondera.
Zbog navedenih problema moguća je kombinacija pondera iz baznog i tekićeg perioda.
Fisherov "idealni" grupni indeks cijena računa se kao geometrijska sredina Laspeyresovog i
Paascheovog indeksa cijena. Međutim, u praksi nalazi manju primjenu zbog komplikovanos.
Za izračunavanje grupnog indeksa cijena koristi je i Marschall-Edgeworthov indeks, kod
kojeg se za ponderisanje koristi zbir ponderacionih faktora iz baznog i tekučeg perioda. Ako
su svi proizvodi iskazani u istim mjernim jedinicama za ponderisanje aritimetičke sredine
individualnih indeksa cijena koristimo količine, a ako mjerne jedinice nisu iste za ponder,
koristimo vrijednost.
Grupni indeks količina -pokazuje relativne promjene fizičkog obima grupe pojava. Pri konstrukciji ovih indeksa
javljaju se isti problemi kao i kod indeksa cijena. Za svaki vremenski niz u grupi možemo
izračunati individualne indekse količina, kojima se upoređuju relativne promjene količina u
grupi. Nedostatak ovakvog računanja indeksa( srednji aritmetički gruoni indeks količina)
količina je različit značaj količina u praktičnim primjenama. Dobivena vrijednost neće biti
adekvatna, ako se pojave ekstremne vrijednosti. Računanje agregatnog neponderisanog
grunog indeksa količina je dato kao omjer zbira količina u tekućem i baznom periodu,
takođe nije dobar pokazatelj dinamike grupe, s obzirom na prisustvo različitih mjernih
jedinica članova zbira ili različite raspone varijacije. Rješenje se nalazi u ponderisanju
količina cijenama, odnosno u vrijednosnom izražavanju. Izborom stalnih cijena
onemogućava se uticaj promjena cijena na količine u obračunu indeksa. Za pondere
možemo uzeti količine iz baznog ili iz tekućeg perioda. Za pondere se u praksi mogu
koristiti i neke druge veličine ( najčešće prosječne ili neke druge cijene). I Laspeyresov i
Paascheov grupni indeks količina javljaju se u agregatnom obliku, gdje se mjere promjene
fizičkog obima, jer su cijene nepromjenjene.
Laspeyresov indeks količina pokazuje za koliko procenata su se promjenile količine grupe
pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene cijene iz
baznog perioda.
Paascheov indeks količina pokazuje za koliko procenata su se promjenile količine grupe
pojava zajedno u tekućem u odnosu na bazni period, računajući uz neizmjenjene cijene iz
tekućeg perioda.
Kada metod srednjih vrijednosti uzima za pondere vrijednosti iz baznog perioda, onda
dobijamo isti rezultat kao i primjenom metoda agregata sa ponderima iz baznog perioda.
25
Grupni indeks vrijednosti -računa se samo u agrehatnom obliku, i to tako da se vrijednosti tekućeg perioda podjele sa
vrijednostima baznog perioda i pomnože sa 100.
Ovaj indeks možemo dobiti i množenjem grupnih indeksa cijena i količina od kojih jedan
mora biti Laspeyresov a drugi Paascheov. Ovaj indeks se računa kao proizvod indeksa cijena
sa ponderom iz baznog perioda i indeksa količina sa ponderom iz tekućeg perioda, odnosno
kao proizvod indeksa cijena sa ponderom iz tekućeg perioda i indeksa količina sa
ponderima iz baznog pedioda.
Kako cijene nisu postojane u vremenu, procjena realnog razvoja pojave u vremenu nije
moguća na osnovu vrijednosti izraženih u tekućim cijenama. Realan uvid u razvoj
posmatranih pojava postiže se eliminisanjem uticaja promjena cijena. Postupak eliminisanja
uticaja cijena na vrijednosno izražene pojave naziva se deflacioniranje i provodi se
dijeljenjem vrijednosti izmaženih u tekućim cijenama sa odgovarajućim grupnim indeksom
cijena nemnoženim sa 100. Za ovaj grupni indeks koristi se naziv deflator ili deflacijski
indeks. U inflatornim uslovima, kada cijene zamagljuju realnu sliku o razvoju pojave,
potreba za deflacioniranjem dolazi do posebnog izražaja. Deflacionirane vrijednosti
predstavljaju procjenu realnih veličina i za njih se kaže da su izražene u stalnim cijenama.
Suprotan postupak od deflacioniranja naziva se revalorizacija i predstavlja usklađivanje
vrijednosti pojava s nastalim promjenama cijena. Često se vrijednosti za niz perioda daju u
cjenama jednog vremenskog perioda. Postupak revalorizacije se provodi množenjem
vrijednosti u stalnim cijenama odgovarajućim indeksima cijena nemnoženim sa 100.
TESTIRANJE OSOBINA INDEKSNIH BROJEVA
Za testiranje dosljednosti individualnih i grupnih indeksa najčešće se primjenjuju: test vremenske
reverzibilnosti, test faktorske reverzibilnosti i test cirkularnosti.
Test vremenske reverzibilnosti (osobina recipročnosti) podrazumjeva da se inverzijom bazne i tekuće
vrijednosti ostvaruje recipročnost indeksa, odnosno da upotrijebljeni izraz za računanje indeksa ispunjava
uslov: )1001(2)1002(1 tttt II =1
Ovaj test je važan u slučajevima kada se često mijenja baza indeksnih brojeva. Ako izrazi za računanje
indeksa ne zadovoljavaju vremensku reverzibilnost, onda kod preračunavanja indeksa s jedne na drugu
bazu dolazi do većih ili manjih odstupanja. Od indeksa računatih prema metodu srednjih vrijednosti ,
aritmetički i harmonijski indeksi ne zadovoljavaju ovaj zahtjev, dok da geometrijski indeksi, modus i
medijana, zadovoljavaju. Agregatni indeks je ponderisan količinom i geometrijski indeks zadovoljava test
reverzibilnosti.
Pored vremenske reverzibilnosti, indeksi treba da zadovolje i faktorsku reverzibilnost. Indeks cijena
pomnožen indeksom količina treba dati vrijednost.
1pI =10
11
p
p dok je indeks količina za istu godinu sa istom bazom 1qI =
10
11
q
q
Množenjem indeksa cijena sa indeksom količina dobijemo isti rezultat kao kada direktno računamo
indeks vrijednosti za neki proizvod :
pqI =00
11
qp
qp
Ovim primjerom smo pokazali da individualni indeksi zadovoljavaju faktorsku reverzibilnost.
Indeksi čiji je proizvod jednak odnosu nivoa posmatrane pojave u tekućem i baznom periodu
zadovoljavaju test cirkularnosti. Pored grupnih indeksa, ovaj test zadovoljava srednji grupni indeks, koji
se dobija kao medijan individualnih indeksa, aritmetički i geometrijski neponderisani indeksi i agregatni
26
indeksi sa baznim ponderima. U odnosu na testove reverzibilnosti ovaj test je od manjeg značaja, jer se
više koristi za poređenje specifičnih vremenskih intervala a manje za poređenje većeg broja intervala.
ODABRANE METODE ANALIZE VREMENSKIH NIZOVA
U statističkoj literaturi navodi se podjela metoda analize vremenskih pojava na
kvantitativne i kvalitativne. Kvalitativne metode koriste se kada se podaci o nekoj pojavi ne mogu kvantificirati ili kada
podaci nisu dostupni. Za ove metode je karakteristično da su procjene budućih stanja
rezultata rada eksperata.
Delphi metoda i metoda scenarija su najčešće korištene kvalitativne metode.
Delphi metoda zasniva se na procesu usklađivanja mišljenja eksperata, dok se kod
sastavljanja scenarija prvo utvrđuju uslovi u kojima se predviđa odvijanje događaja.
Menadžer bira onaj scenariji koji će se prema njegovom sudu ostvariti sa najvećom
vjerovatnoćom.
Za primjenu kvantitativnih metoda neophodno je da su podaci u prošlom i sadašnjem
periodu dostupni, da oslikavaju pravu prirodu posmatrane pojave i da se mogu
kvantificirati.
Ova metoda koristi statistički pristup, i one su usmjerene na analizu osnovnih karakteristika
pojedinačnog niza i na prognoziranje njenih budućih vrijednosti.
Druga grupa metoda koristi ekonometrijski pristu ( kauzalne metode). Ove metode
zasnivaju se na pretpostavci da je posmatrana pojava u uzročno-posljedičnoj vezi sa
jednom ili više drugih pojava. Koristimo ih kada varijacije jedne pojave objašnjavamo
varijacijama druge pojave. Kauzalne metode spadaju u regresionu analizu vremenskih
pojava i njima ocjenjujemo regresioni model zavisne varijable u funkciji drugih nezavisnih
varijabli.
Holt Wintersov metod izglađivanja osnovni nedostatak metoda jednostavnog eksponencijalnog izglađivanja je što neomogućava
tretman nizova sa trendom i sezonom, prevalizazi ovaj metod izglađivanja. Predstavlja
proširenje metoda jednostavnog eksponencijalnog izglađivanja dvjema jednačinama od kojih
prvom vršimo reviziju ocjene trenda, a drugom previziju ocjene sezone.
Strukturni modeli radio se o regresionim modelima kod kojih su regresori funkcije vremena sa koeficijentima
koji se mjenjaju tokom vremena. Prethodna dva modela( model jednostavnog
eksponencijalnog izglađivanja i holt wintersov model ) su preteća ovog modela. Sa računske
strane veoma su zahtejvni te zahtvejvaju velik oiskustvo za njihovu uspješnu primjenu.
Box-Jenkinsov metod Zasnovan je na klasi ARIMA modela. Na osnovu analize podataka vremenskog niza
identifikuje se odgovarajući model iz ove klase a zatim se vrši njegovo ocjenjivanje i
provjera adekvatnosti. Postupak se ponavlja ako se pokaže da je model neadekvatan. Ovaj
metod daje napreciznije prognoze. Metod je fleksibilan jer razmatra veoma široku klasu
mdoela među kojima se po definisanom postupku bira onaj koji najbolje reprezentuje
podatke. Osnovni nedostatak metoda dolazi do izražaja već kod etape identifikacije, a to je
da je za korištenje ovog metoda potreban dobro uvježban analitičar sa velikim iskustvom. U
svakoj etapi zahtjeva se intervencija od strane analitičara i donošenje odluke u kojem
27
pravcu nastaviti dalje. Uzimajući u obzir velike troškove koji se javljaju pri korištenju ovog
metoda, neki autori ga preporučuju samo ako se pokaže da je analitičar kompetentan da
koristi metod, da je kompleksnost opravdana ciljevima koji se žele postići i da varijacije u
nizu nisu pod dominantnim uticajem trenda i sezone.
Metod stepenaste autoregresije Model je predložen od strane Newbolda i Gangera i može se posmatrati kao varijanta Box-
Jenkinsovog metoda. Njime je pokušano prevazilaženje potrebe za intrevencijom
analitičara u svakoj etapi gradnje modela definisanjem potpuno automatskog postupka
izbora modela iz klase autoregresionih modela. Sam metod je zasnovan na postupku
uključivanja regresora u stepenastoj regresiji. Njihova prednost je u potpunoj
automatizaciji uz korištenje standardnih statističkih programskih paketa sa programima za
stepenastu regresiju. Nedostatak je što se ograničava samo na klasu autoregresionih
modela, iako modelirani vremenski niz može biti generisan procesom pokretnih sredina ili
mješovotim ARMA procesom.
Parzenovi ARARMA modeli Parzen je izvršio modifikaciju u početnoj etapi Box-Jenkinsovogg modela u tom smislu što
ne zahtjeva diferenciranje vremenskog niza u cilju postizanja njegove stacionarnosti. On
predlaže korištenje autoregresionih modela prvog ili drugog reda čiji koeficijenti mogu biti
veći od jedinice u cilju otklanjanja nestacionarnosti. Nakon toga se niz reziduala tih modela
tretira kao stacionarni niz i za nju se bira model iz klase ARMA modela, korištenjem jednog
od formanih kriterija. Time je subjektivnost postupka izbora modela, koja je karakteristika
Box-Jenkinsovg pristupa, u cjelini ili barem djelimično eliminisana. Ovaj iskorak predstavlja
glavni argument koji govori u prilog ovog modela.
Bayesov metod Bayesov pristup prognoziranju može se posmatrati kao stohatička verzija Holt-Wintersovog
metoda izglađivanja. Omogućava definisanje ne jednog, nego čitavog skupa modela sa
apriornim vjerovatnoćama koje analitičar pridružuje svakom modelu iz tog skupa, odnosno
koje pridružuje njegovim koeficijentima. Zatim se koeficijenati modela ponovo izračunavaju
čim nova opservacija postane dostupna, odnosno određuju se apriorne vjerovatnoće. U
praksi je ograničena prijmena ovog metoda zbog računske složenosti i poteškoća koje
korisnici imaju u razumijevanju dobivenih rezultata.
28
KLASIČNA DEKOMPOZICIJA VREMENSKOG NIZA Dekompozicija vremenskog niza podrazumijeva njegovo raščlanjivanje na sastavne
komponente. Cilj dekompozicije vremenskog niza je identifikovanje uticaja
svake komponente pojedinačno. Ova identifikacija je posebno značajna kod pojava sa
izraženim periodičnim varijacijama, koje mogu da zamagle pravu sliku o njenom osnovnom
kretanju. Na osnovu empirijskog niza i izračunatih nekih od komponenti možemo
utvrditi uticaj ostalih faktora sadržanih u nepoznatim komponentama. Brojni faktori
koji određuju kretanje vremenskih pojava, prema prirodi svog djelovanja, mogu podjeliti na
sistematske i nesistematske. Kod sisitematskih komponenti prisutne su određene
pravilnosti u djelovanju na posmatrane pojave. One su u stat literaturi detaljno razrađene i
pronađeni su adekvatni postupci za njihovo kvantificiranje. U ove komponente ubrajamo :
trend, cikličnu i sezonsku komponentu. Za razliku od njih, rezidualna( slučajna,
iregularna, stohastička) komponenta je nesistematska.
Vremenski niz može sadržavati nijednu, jednu ili sve tri sistematske komponente, međutim
u analizi je uvijek prisutna rezidualna komponenta.
Opšti model vremenske pojave javlja se u aditivnom ili multiplikativnom obliku, a rijetko je
kombinovanog( mješovitog) oblika. Međusobna veza datih komponenti može biti aditivna,
multiplikavitna ili kombinovana.
Kod aditivnog modela svako zapažanje vremenskog niza jednako je zbiru 4 komponente,
odnosno:
Y=T+C+S+R Y-vremenski niz; T-trend; C-cikličnu; S-sezonsku; R-slučajnu(rezidualnu) komponentu.
U aditivnom modelu sve komponente su izražene u istim mjernim jedinicama kao i orginalni
niz. Kod ovog modela pretpostavlja se da sezonska i rezidualna komponenta ne zavise od
trenda, da se amplituda sezonskih varjacija ne mijenja s vremenom, te da je tokom godine
prosjek sezonskih fluktuacija jednak nuli. Model se koristi kada sa smanjenjem(povećanjem)
nivoa pojave tokom vremena uticaj sezonske komponente ostaje nepromjenjen. Treba
napomenuti da se trend i ciklična komponenta često ne razdvajaju i zajednički označavaju
sa T.
Multiplikativni model predstavlja proizvod 4 komponente i dat je slijedećim izrazom:
Y= T * Ic * Is * Ir gdje je trend komponenta data u orginalnim mjernim jedinicama, a ostale 3 komponente
izražene su kao indeksi.
29
Model se logaritamskom transforamcijom svodi na aditivni oblik:
logY= logT+logIc+logIs+logIr Ovaj model se najčešće koristi u praksi, jer on pretpostavlja relativan uticaj komponenti na
vremenski niz. Multiplikavitni model nije pogodan ako vrijednosti nekih komponenti imaju
negativan predznak ili su bliske nuli,pa se za to koristi kombinaovani oblik. Aditivnim i
multiplikativnim modelom se predstavlja razvoj nivoa pojave, a ne njena dinamička
struktura.
Primjer kombinovanog modela dat je slijedećim izrazom:
Y=T*C+R Uslov za primjenu kombinovanog modela je da su sezonska i rezidualna komponenta
međusobno nezavisne, ali da obje zavise od trenda. U praksi su moguće sve kombinacije.
U svakoj kombinaciji pristuna je slučajna komponenta. To je zbog toga što se kretanje
pojava u vremenu ne može objasniti samo f-jom vremena.
TREND KOMPONENTA Trend predstavlja razvojnu tendenciju pojave u posmatranom vremenskom periodu. Ova
tendencija označava karakterističnu i zakonomjernu liniju kretanja posmatrane pojave u
vremenu kao niz prosječnih, teorijskih tačaka kroz koje bi pojava prolazila u svojoj prirodi,
da nije bilo uticaja sistematskih i nesistematskih faktora u njenom toku.
Trend izražava prosječno stanje u svakom od posmatranih perioda, pa zbog te osobine on
predstavlja dinamičku srednju vrijednost.
Kada te teorijske podatke unesemo između empirijskih podataka niza vršimo
interpolaciju trenda. Svako procjenjivanje nivoa posmatrane pojave izvan vremenskog
raspona u kojem je dat niz empirijskih podataka, bilo da je procjenjivanje za buduće ili
prošlo vrijeme, naziva se ekstrapolacija trenda. Procjenjivanje se zasniva na pretpostavci da će se svi faktori koji su djelovali na kretanje
pojave u prošlosti, djelovati i dalje u istom smjeru i približnim intenzitetom.
Cilj dinamičke analize vremenskih nizova metodom trenda je predviđanje budućeg razvoja
posmatrane pojave na temelju ispoljene i uočene zakonitosti njenog kretanja. Trend
komponenta se pripisuje djelovanju postojanih faktora, kao što su: razvoj nauke i tehnike,
rast populacije, ponašanje potrošača...
Ako se kod izdvajanja trend komponente svim korištenim podacima pridaje isti značaj bez
ozbira na njihovu udaljenost od sadašnjeg perioda, onda je riječ o globalnom trendu.
Razvijeni su i metodi ocjenjivanja lokalnog trenda kod kojih se novijim podacima pridaje
veći značaj u odnosu na podatke sa početka vremenskog niza. Trend koji pod uticajem
raznih rezidualnih faktora i kojeg ne možemo predvidjeti na osnovu prošlih i sadašnjih
podataka naziva se stohastički trend.
Teorijski posmatrano, za primjenu trenda potrebno je onoliko podataka koliko je dovoljno
da se sagledaju barem 2 zaokružena ciklusa karakterističnih varijacija, kako bi se moglo
govoriti o ponavljanju različitosti njihovih nastajanja. Mada ne postoji egzaktno pravilo
kojim se određuje dovoljna dužina vremenskog niza, u statističkoj literaturi se najčešće
uzima period od najmanje 10 godišnjih frekvencija.
30
Osnovna razlika između metode najmanjih kvadrata u regresionoj analizi i metode
najmanjih kvadrata kod trenda je slijedeća:
1. u regresionoj analizi elementi slučajnog uzorka su međusobno nezavisni, a u analizi
vremenskih nizova podaci nisu nezavisni, jer u obzir uzimamo njihov vremenski
poredak
2. za razliku od regresione analize, gdje je za svaku vrijednost nezavisne varijable
moguće putem uzorka uzeti veći br vrijednosti zavisne varijable, kod vremenskih
nizova nije moguće uzeti više od jednog podatka u jednom periodu vremena.
3. zbog prethodno navedenog, intervali procjene prosječne vrijednosti i intervali
predviđanja individualne vrijednosti zavisne varijable koje smo korsitili kod regrsije,
kod analize trenda su krajnje nepouzdani i nećemo ih koristiti.
4. kod izračunavanja standardne greške regresije zbir kvadrata odstupanja smo dijelili
sa brojem stepeni slobode. Kod trenda ćemo formulisati mjeru sa istim značenjem ali
zbir kvadrata odstupanja nećemo djeliti sa stepenima slobode.
IZBOR VRSTE TRENDA
Za izbor vrste trenda primjenjuju se odgovarajuće statističke metode apriornog(
prethodnog) i aposteriornog ( naknadnog ) opredjeljenja. U metode apriornog
opredjeljenja ubrajamo: grafički prikaz, metod diferencije, izračunavanje pomičnih
prosjeka.
Prvu sliku o dinamici pojave tokom vremena možemo uočiti na osnovu grafičkog prikaza
vremenskog niza. Ovaj metod je krajnje subjektivan.
Metod diferencije se bazira na izračunavanju razlika uzastopnih članova niza. Ako su
apsolutne razlike uzastopnih frekvencija približno jednake tokom cijelog obuhvaćenog
perioda, tada će linearna f-ja najbolje odražavati dugoročnu razvojnu tendenciju pojave.
Prva diferencija predstavlja razliku između vrijednosti podataka vremenskog niza u 2
sukcesivna perioda. Kvadratna f-ja (parabola drugog stenepa) će najbolje odražavati
dugoročnu tendenciju ako su druge diferencija približno jednake. F-je višeg stepena
odgovarale bi za one vremenske nizove čije su treće diferencije približno jednake. Kada su
razlike logaritamskih vrijednosti uzastopnih podataka približno jednake, pojava ispoljava
osobine geometrijske progresije, pa će tada najbolje odgovarati eksponencijalna f-ja.
Ima slučajeva kada je kretanje pojave takvo da se opšta dugoročna razvojna tendencija ne
može izraziti ni jednom do sad navedenom f-jom. Tada se primjenjuju složene f-je krive
kojima se najbolje aproksimira takvo kretanje, i tu spada: modifikovana eksponencijalna
kriva, Gompertzova kriva i logistička kriva. Pogodne su za izračunavanje dugoročne
razvojne tendencije kod pojava koje su u svom kretanju približavaju jednoj granici-
asimptoti.
Izračunavanjem pomičnih prosjeka povezuju se promjene manjih ili većih grupa podataka,
pa se u izvjesnoj mjeri elminiraju kratkoročne i srednjoročne oscilacije i ističe osnovni
dugoročni razvoj pojave u vidu prosječnog kretanja. Osnovna ideja metoda pomičnih
prosjeka je u zamjeni orginalnih podataka sa aritimetičkim sredinama, čijom promjenom
eliminiramo tekuća kolebanja. Ovi prosjeci mogu da se računaju u obliku proste ili vagane
aritmetičke sredine.
31
LINEARNI TREND Ako se analizirana pojava mjenja na približno isti apsolutni iznos tokom cijelog
obuhvaćenog perioda tada će linearni trend najbolje odražavati dugoročnu razvojnu
tendenciju. Odsječak kod linearnog trenda predstavlja prosjek vremenskog niza u
posmatranom periodu, dok nagib pokazuje prosječnu promjenu vremenskog niza u
sukcesivnim vremenskim intervalima odgovarajućeg perioda. Parametri su nepoznate
veličine i jedino možemo da ih procjenimo pomoću uzorka.
Model linearnog trenda predstavlja model trend-polinoma prvog stepena, jer je njegov
deterministički dio linearna f-ja vremena.
Konstantni član a predstavlja vrijednost trenda za vremenski period koji prethodi
prvom(x=0), dok b pokazuje prosječnu linearnu promjenu posmatrane pojave pri jediničnoj
promjeni varijable vrijeme.
Ekstrapolacija trenda predstavlja produživanje linije trenda izvan intervala obuhvaćenog
vremenskim nizom. Cilj ekstrapolacije je prognoziranje nivoa posmatrane pojave u
budućnosti. Na kvalitet prognoziranja utiče mnogo faktora: dužina posmatranog
vremenskog niza, relativna društveno-ekonomska stabilnost i sl. Model sa ocjenjenim
parametrima može se koristiti u prognostičke svrhe ako pretpostavimo da će trend biti
postojan u prognostičkom horizontu.
PARABOLIČKI TREND Kada su druge diferencije (razlike prvih diferencija) približno jednake umjesto linearnog
trenda koristi se parabolički trend. Druge diferencije vrijednosti polinima drugog stepena
su konstantne, pa je to razlog njegovog izbora kao f-je vremena u modelu trenda.
Radi se o onim pojavama čije se kretanje u posmatranom periodu odvija na disharmonično,
odnosno na početku brže, a zatim kasnie sporije i obratno. Ovaj model treba tretirati kao
analitički izraz dinamike pojave i posmatrati ga kao cjelovit izraz.
Parametar a kod paraboličkog trenda predstavlja vrijednost trenda u periodu označenom 0.
Kada je predznak parametra b2 negativan, onda je otvor parabole okrenut prema dole,
odnosno ako je parametar b2 pozitivan, otvor parabole je okrenut prema gore.
Pri ekstrapolaciji paraboličkog trenda treba biti veoma oprezan, jer pojava koja je u
posmatranom periodu imala rast i opadanje može ponovo obrnuto smjer svog kretanja. U
prognoziranje kretanja pojave za udaljenije periode ne treba se upuštati.
EKSPONENCIJALNI TREND -pripada grupi nelinearnih f-ja i koristimo ga kada vremenski niz pokazuje karakteristike
geometrijske progresije. Osnovna karakteristika ovakvih kretanja se može uočiti već na
grafičkom prikazu gdje empirijske vrijednosti na početku sporije rastu a kasnije sve brže i
brže. Ovaj trend se najbolje prilagođava empirijskim podacima vremenskog niza kada
pojava pokazuje približno jednaku ralativnu promjenu (rast ili pad), odnosno kada su
apsolutne razlike logaritmovanih podataka približno iste. Ovaj trend je najbolje prilagođen
vremenskom nizu ako se u polulogaritamskom grafikonu podaci grupišu približno oko prave
linije. Konstantni član a predstavlja vrijednost trenda za vremenski period u kojem je x=0,
dok na osnovu b možemo računati prosječnu stopu promjene. Eksponencijalna prosječna
stopa promjene pokazuje za koliko procenata pojava, u prosjeku, raste ili opada u
posmatranom periodu. Rješavanje eksponencijalne f-je se vrši pomoću logaritmovanja.
Logaritmiranjem eksponencijalni trend smo transformovali u model linearnog trenda. U
literaturi se za ovaj model koristi i ime log-lin model, jer je vremenski niz y logaritamovan a
na desnoj strani su orginalne vrijednosti var vrijeme x.Do procjene param.dolazimo
antilogaritmovanjem prethodno dobivenih vrijednosti.
32
CIKLIČNA KOMPONENTA Da bi se kod vremenskih pojava ustanovila prisutnost cikličnih kretanja neophodan je
vremenski niz sa dovoljno obuhvaćenim obnavljanjima. Međutim, u praksi se ne raspolaže
vremenskim nizovima sa dovoljno članova, pa se trend i ciklična komponenta posmatraju
zajedno.
Cikličnu komponentu predstavljaju faktori koji svojim djelovanjem na posmatrane pojave
dovode do njihovih oscilacija iznad ili ispod utvrđene prosječne razvojne tendencije u
trajanju od nekoliko godina. Kada se pojava obnavlja napribližno jednak način s periodom
od dvije ili više godina, kažemo da su prisutne ciklične varijacije. Početak ciklusa označava
relativno nizak nivo pojave, koja se u fazi rasta povećava do nekog maksimuma, nakon kojeg
slijedi pad pojave. Poslije minimuma, slijedi rast i obnavljanje puta na približno jednak način.
Kod prognoziranja javljaju se velike poteškoće, jer se kod posmatranih pojava mijenja i
trajanje i (dužina) ciklusa i indenzitet odstupanja (amplituda).
Testiranje značajnosti ciklične komponente bazirano je na rasporedu frekvencije dužine
pojedinih faza, tj razmaka između prevojnih tačaka. Ove tačke u stvari pokazuju momente
kada niz prestaje da raste i počinje da opada i obrnuto. Kada su ciklične varijacije značajne,
broj dugotrajnih faza biće veći.
METODE IZGLAĐIVANJA U svakom vremenskom nizu prisutna su određena kolebanja vrijednosti pojedinačnih
frekvencija, koja nekada mogu otežati oučavanje osnovne razvojne tendencije posmatrane
pojave. Da bismo riješili taj problem, potrebno je reducirati slučajne varijacije primjenom
postupaka izglađivanja vremenskog niza. Izglađivanje vremenskog niza podrazumijeva
izačunavanje aritimetičkih sredina za posmatranu pojavu. Na ovaj način se reducira uticaj
sezonske i rezidualne komponente, dok se trend i ciklična komponenta manifestuju u nešto
jasnijem obliku.
Metoda pomičnih prosjeka i metoda jednostavnog eksponencijalnog izglađivanja
predstavljaju najčešće korištene metode pomoću kojih se vrši izglađivanje vremenskih
nizova.
Metoda pomičnih prosjeka Pomični prosjeci predstavljaju transforamaciju orginalnog vremenskog niza gdje se svaka
frekvencija zamjenjuje prosjekom. Prosjek se računa na osnovu određenog broja narednih i
isto toliko prethodnih frekvencija. S obzirom na to da se primjenom ove metode
pomjeramo od početka niza sve do njenog kraja, ova metoda je dobila naziv pomični
prosjek. Izglađivanje se bazira na ideji da će svaka neregularna komponenta u svakom
vremenskom trenutku prouzrokovati manji efekat ako je u toj tački uprosječimo s njenim
susjednim veličinama. Što više članova niza uzmemo za računanje prosjeka, linija će biti
izglađenija, ali će nam nedostajati više prosjeka u odnosu na broj orginalnih podataka.
U praksi koristimo 2 oblika ove metode: jednostavni i ponderisani(vagani).
Jednostavni pomični prosjeci predstavljaju prosjeke m uzastopnih frekvencija posmatranog
vremenskog niza. Ako je broj članova pomičnog prosjeka M neparan, tada će ukupno M-1
orginalnih podataka ostati bez svog pomičnog prosjeka. Ovaj nedostatak metode je sve
više izražen što uzimamo grupe sa većim brojem članova. Ako je broj članova pomičnog
prosjeka M paran, onda ce ukupno M orginalnih podataka ostati bez svog pomičnog
prosjeka.
33
U slučaju kada je broj članova pomičnog prosjeka M paran, aritmetička sredina neće se
uklapati u neki tačno određen period, nego između 2 perioda za koja raspolažemo
empirijskim podacima. Kako su ovako dobiveni prosjeci nepodesni za korištenje, provodimo
postupak centriranja. Ovaj postupak se provodi na različite načine i omogućava da se
centrirani prosjeci računaju kao aritmetička sredina prethodno izračunatih pomičnih
prosjeka od 2 člana.
Prednost metode pomičnih prosjeka ogleda se u jednostavnom izračunavanju. Poteškoće u
primjeni ove metode javljaju se kod izbora dužine pomičnog prosjeka M i pondera
frekvencija. U praksi se obično za veće fluktuacije oko trenda koristi prosjek veće dužine i
obratno. Nedostatak je i manjak podataka o trendu u početnim i završnim vremenskim
periodima.
Oscilacije nisu pravilne i nemaju stalan period obnavljanja. Pomični prosjeci, ustvari,
sugerišu da postoji ciklično kretanje i ta se pojava naziva Slutcky-Yuleov efekat.
Metoda jednostavnog eksponencijalnog izglađivanja Cilj ove metode je ozglađivanje empirijskih podataka, kako bi se eliminisali ili reducirali
slučajni uticaji kod posmatrane pojave.
Ova metoda nudi kompromis, nudeći prognoze koje se baziraju na ponderisanom prosjeku
sadašnjih i ranijih vrijednosti. Metoda bazirana na ideji o kvalitetu raspoloživih podataka,
koji u najvećoj mjeri zavise od njihove starosti. Stariji podaci su manje korisni, pa im je
potrebno dati manju važnost. Noviji podaci zadržavaju najvjerovatnije informacije o onome
što je za realno očekivati da će se dogoditiu budućnosti. U izračunavanju tog prosjeka,
najveći ponder pridaje se najnovijem podatku, nešto manji podatku koji mu neposredno
prethodi, još manji njemu prethodnom podatku.
Jednostavno eksponencijalno izglađivanje podrazumijeva transforamaciju vremenskog niza
gdje su orginalni podaci zamjenjeni ponderisanim prosjekom svih prethodnih podataka, sa
ponderima koji se eksponencijalno smanjuju sa starošću podataka.
Ovaj metod je primjeren za izglađivanje vremenskih nizova bez sistematskih komponenti.
Koristi se za pojave koje karakterišu slučajne varijacije oko prosjeka, odnosno one koje
nemaju izražen trend. Sadrži li trend, koristit ćemo model dvostrukog, trostrukog odnosno
višestrukog eksponencijalnog izglađivanja. Prisutnost sezonske komponente takođe će
upućivati na korištenej odg modela izglađivanja.
Ulogu pondera ima konstanta izglađivanja α koja može uzeti vrijednost između 0 i 1.
Ponderi predstavljaju geometrijski red, a njihov zbir je jednak 1. Konstanta izglađivanja
određuje brzinu kojom protekle vrijednosti gube svoj uticaj na izglađenu vrijednost u
vremenu t. Veća vrijednost konstante izglađivanja znači brži gubitak uticaja i obrnuto. Što je
vrijednost konstante manja, vremenski niz će biti više izglađen. Ne postoji egzaktan način
određivanja konstante izglađivanja. U praksi se najčešće uzimaju vrijednosti između 0.2 i
0.3. Jedna od mogućnosti određivanja konstante jeste i lično iskustvo.
Uspješnost izglađivanja utvrđuje se na osnovu razlike između orginalnih podataka i
izglađenih vrijednosti. Bira se ona vrijednost konstante koja minimizira vrijednost srednje
kvadratne greške. Najvažnije prednosti ove metode su : uzima u obzir sve prošle podatke,
zahtjeva mali broj podataka, veći značaj daje novijim podacima, predstavlja osnovu nekim
razrađenijim metodama prognoziranja. Nedostaci metode: izbor konstante izglađivanje nije
jednostavan, ne može se koristiti u analizi pojava sa izraženim trendom i sezonalom,
najčešće nie dobar metod za srednjeročno i dugoročno prognoziranje, velike slučajne
fluktuacije mogu jako uticati na kvaltiet prognoziranja.
34
SEZONSKA KOMPONENTA utiče na kretanje pojave tako da ona odstupa od svoje osnovne tendencije utvrđene
trendom na više ili na niže. Prisustvo sezonskih varijacija zamagljuje uočavanje osnovne
razvojne tendencije pojave, pa se samo njihovim isključivanjem može sagledati osnovni
razvojni tok. Postupak isključivanja sezonskih varijacija iz vremenskog niza naziva se
desezoniranje ili sezonsko izglađivanje. Sezonski uticaj je izražen u turizmu, saobraćaju,
građevini..
Sezonske varijacije pokazuju promjene određene pojave, koje se ponavljaju tokom više
godina u isto doba, u istom smjeru i približno istim intenzitetom. Kod nekih ekonomskih i
društvenih pojava sezonske varijacije se izražavaju na isti način tokom vremena. Kada se
sezonal ispoljava na približno na isti način iz godine u godinu, kažemo da je djelovanje
sezonskih faktora stabilno. Tada za sezonsku komponentu kažemo da je determinističke
prirode, jer se njena priroda ne mjenja tokom više godina. Ako sezonske varijacije mjenjaju
intenzitet i periodičnost ponavljanja u svakom narednom periodu onda govorimo o
nestabilnom sezonskom ritmu. U tom slučaju sezonska komponenta je stohastičke prirode.
Smjer i intenzitet sezonskog varijabiliteta mjeri se sezonskim indeksima. Sezonski indeksi
su relativni brojevi koji mjere jačinu sezonskog uticaja u određenom mjesecu(kvartalu)
tokom više godina. Tipični indeksi predstavljaju uopšten intenzitet sezonskog varijabiliteta
za više godina. Preko specifičnih izračunavaju se tipični sezonski indeksi, koji treba da
reprezentuju sezonska odstupanja tokom cjeog posmatranog perioda. Indeksi čija je
vrijednost preko 100 pokazuju da posmatrana pojava zbog sezonskih uticaja raste. Indeksi
čija je vrijednost ispod 100 pokazuju da pojava opada pod uticajem sezone. S obzirom na to
da sezonski indeksi variraju oko 100 njihov zbir kod kvadratnog niza mora biti jednak 400,
tj. kod mjesečnog niza mora iznositi 1200. Kod oba niza prosjek je jednak 100.
Prve informacije u analizi sezonskog karaktera pojave najlakše je dobiti iz grafičkog prikaza.
Najjednostavniji je linijski grafikon sa ucrtanim podacima svih posmatranih perioda, jer on
omogućava oučavanje sezonskih kolebanja.
Osnov za numeričko izražavanje sezonskih uticaja je model. Iskustva pokazuju da u procesu
analize vremenskih nizova multiplikativni modeli daju bolje rezultate.
Za ciklične pojave je karakteristično da se obnavljaju u periodu od najmanje dvije godine, ali
se u praksi javlja problem vremenskih nizova odgovarajuće dužine. Jedno od mogućih
rješenja za prevazilaženje ovog problema je spajanje trenda i ciklične komponente u jednu
komponentu. ( Y= T * Is * Ir )
Postoje 2 pristupa mjerenju sezonskih varijacija: empirijski(tradiocionalni) i regresioni
(modelski) pristup. Mod modelskog pristupa sezonska priroda se mjeri uključivanjem
sezonskih nezavisnih varijabli u regresioni model vremenskog niza ili posebnom vrstom
modela tzv. ARIMA modelima.
Mjerenje sezonskih varijacija po metodu pomičnih prosjeka zasniva se na njihovom
izdvajanju od ostalih komponenti. Osnovna ideja je da ovi prosjeci obuhvate zajedno trend i
cikličnu komponentu, te da se djeljenjem orginalnih frekvencija s pripadajućim pomičnim
prosjecima isključi njihov uticaj. Na ovaj način ostaju još sezonska i rezidualna komponenta.
Specifični sezonski koeficijenti, osim sezonskih, u sebi sadrže i neregularne uticaje, koji se
isključuju tako što se izračunavaju prosjeci svih specifičnih sezonskih koeficijenata za
istoimene kvartale(mjesece). Množenjem tih prosjeka sa 100 dobijamo sezonske indekse.
Da bismo u analizi vremenskog niza dobili čist uticaj sezone, neophodne je podjeliti
orginalne frekvencije sa trend, ciklus i rezidualnom komponentom.
35
Analiza sezonske pojave za kvartalne podatke po metodu odnosa prema pomičnom
prosjeku obuhvata sljedeće korake:
• izračunati centrirane četveromjesečne pomične prosjeke za niz kvartalnih podataka
• izračunati omjere orginalnih frekvencija i pripadajućih vrijednosti pomičnih prosjeka
• izračunati prosjek ili medijan izračunatih omjera u preth koraku za istoimene kvartale
• ako je zbir tipičnih sezonskih koeficijenata jednak 4, onda te vrijednosti predstavljaju
sezonske faktore. Vrijednosti se koriguju ako zbir nije jednak 4. Sezonski faktori
istoimenih kvartala jednaki su za cjeli posmatrani period.
• djeljenjem orginalnih frekcencija niza tipičnim sezonskim koeficijentima dobijaju se
desezonirane vrijednosti, tj vrijednosti niza očišćene od uticaja sezone.
• djeljenjem desezoniranih vrijednosti odgovarajućim pomičnim prosjecima
izračunavaju se faktori rezidualnog uticaja.
Analiza sezonske pojave za mjesečne podatke po metodu odnosa prema pomičnim
prosjecima vrši se analogno kao i za kvartalne podatke. Prvo se izračunaju
dvanaestomjesečni pomični prosjeci, zatim se orginalne frekvencije podjele
pripadajućim pomičnim prosjecima, računaju se sezonski faktori(čiji zbir treba biti
jednak 12)-koji omogućavaju desezoniranje, i na kraju se izračunavaju faktori
rezidualnog uticaj