12
1. MJERENJE POUZDANOSTI ODNOSNO PRILAGOĐENOSTI REGRESIJSKOG MODELA Dva najčešća statistička testa u ekonometriji: koeficijent determinacije koji mjeri moć linearne regresije u objašnjavanju varijacija zavisno promjenjive varijable test statističke značajnosti ocjenjenih vrijednosti parametara, zasnovan na statističkim pogreškama dobivenih ocjena parametara koji mjeri pouzdanost ocjena Odstupanja empirijskih podataka Yi od njihove sredine Y zovu se ukupna odstupanja. Suma kvadrata odstupanja zove se varijacija. TSS: ukupna suma kvadrata ili ukupna varijacija (Total Sum of Squares): mjera ukupne varijacije varijable Y oko njezine srednje vrijednosti ESS: objašnjena suma kvadrata ili objašnjena varijacija (Estimated Sum of Squares): dio ukupne varijacije varijable Y oko njezine sredine koji je objašnjen varijacijama varijable X RSS: rezidualna suma kvadrata ili rezidualna ili neobjašnjena varijacija – dio ukupne varijacija varijable Y koji se može pripisati slučajnim utjecajima Metoda koja minimizira u danim ukupnim varijacijama rezidualne varijacije, donosno maksimizira objašnjene varijacije, je metoda najmanjih kvadrata Potrebno je spomenuti dva osnovna svojstva koeficijenta determinacije: Radi se o ne negativnoj vrijednosti. Kreće se u intervalu 0 R2 1, jer ESS dio ne može biti veći od TSS dijela. R2 = 1 označava savršenu prilagodbu (cjelokupna varijacija Y objašnjena je ocijenjenim regresijskim modelom). R2=0 označava nepostojanje veze između varijabli Y i X.

ekonometrija

Embed Size (px)

Citation preview

Page 1: ekonometrija

1. MJERENJE POUZDANOSTI ODNOSNO PRILAGOĐENOSTI REGRESIJSKOG MODELA

Dva najčešća statistička testa u ekonometriji:

koeficijent determinacije koji mjeri moć linearne regresije u objašnjavanju varijacija zavisno promjenjive varijable

test statističke značajnosti ocjenjenih vrijednosti parametara, zasnovan na statističkim pogreškama dobivenih ocjena parametara koji mjeri pouzdanost ocjena

Odstupanja empirijskih podataka Yi od njihove sredine Y zovu se ukupna odstupanja.

Suma kvadrata odstupanja zove se varijacija.

TSS: ukupna suma kvadrata ili ukupna varijacija (Total Sum of Squares): mjera ukupne varijacije varijable Y oko njezine srednje vrijednosti

ESS: objašnjena suma kvadrata ili objašnjena varijacija (Estimated Sum of Squares): dio ukupne varijacije varijable Y oko njezine sredine koji je objašnjen varijacijama varijable X

RSS: rezidualna suma kvadrata ili rezidualna ili neobjašnjena varijacija – dio ukupne varijacija varijable Y koji se  može pripisati slučajnim utjecajima

Metoda koja minimizira u danim ukupnim varijacijama rezidualne varijacije, donosno maksimizira objašnjene varijacije, je metoda najmanjih kvadrata

Potrebno je spomenuti dva osnovna svojstva koeficijenta determinacije:

Radi se o ne negativnoj vrijednosti.

Kreće se u intervalu 0 R2 1, jer ESS dio ne može biti veći od TSS dijela. R2 = 1 označava savršenu prilagodbu (cjelokupna varijacija Y objašnjena je ocijenjenim regresijskim modelom). R2=0 označava nepostojanje veze između varijabli Y i X.

Korelacijska analiza sastoji se u primjeni postupaka kojima se utvrđuju pokazatelji jakosti statističke veze među pojavama.(+ - 1)

SER- standardna greška regresije - omjer rezidualne varijacije i stupnjeva slobode koji su joj pridruženi

Statistička značajnost prilagođenosti modela testira se F-testom

Postupak dekomponiranja varijacija zove se analiza varijance u regresiji ili ANOVA (Analysis of Variance)

Kvaliteta ocijenjenog regresijskog modela prosuđuje se testiranjem značajnosti prisutnosti svih regresorskih varijabli u modelu.

Page 2: ekonometrija

Najčešće upotrebljavani statistički paketi su: SAS, SPSS, STATISTICA, a od ekonometrijskih RATS; TSP; EVIEWS, SHAZAM, SORITEC.

 

 

 

 

 

 

 

 

2. VIŠESTRUKI LINEARNI REGRESIJSKI MODEL:

OCJENJIVANJE PARAMETARA I TESTIRANJE HIPOTEZA

 

Regresijski model s više od jedne nezavisne varijable poznat je kao višestruki regresijski model.

Značenje parcijalnih regresijskih koeficijenata : Regresijski koeficijenti B2 i B3 poznati su kao parcijalni regresijski koeficijenti ili parcijalni koeficijenti smjera.

B2 mjeri promjenu u srednjoj vrijednosti Y, E(Y), za jedinicu promjene u varijabli X2, kada je vrijednost varijable X3 konstantna. 

B3 mjeri promjenu u srednjoj vrijednosti Y za jedinicu promjene u X3, kada je vrijednost X2 konstantna

 

P1

Regresijski model je linearan u parametrima te je korektno specificiran.

P2

Objasnidbene varijable X2 i X3 nisu korelirane sa slučajnim odstupanjima u, tj. kovarijanca između svake objasnidbene varijable i slučajne varijable u jednaka je nuli. Ukoliko su X2 i X3 nestohastične ova je pretpostavka automatski ispunjena.

P3

Page 3: ekonometrija

Očekivana vrijednost odstupanja jednaka je nuli: E(ui)=0.

P4

Homoskedastičnost: varijanca slučajne varijable u konstanta je i jednaka Q2.

P5

Odsutnost autokorelacije: vrijednosti slučajne varijable u međusobno su nekorelirane slučajne veličine, tj. njihova je kovarijanca jednaka nuli: cov(ui,uj)=0, i≠j.

P6

Odsutnost multikolinearnosti: ne postoji egzaktna linearna kombinacija nezavisnih varijabli, tj. ne postoji ovisnost oblika

P7

Slučajna odstupanja su normalno distribuirana s matematičkim očekivanjem jednakim nula i homoskedastičnom varijancom Q2: uiN(0, Q2)

Navedene pretpostavke, osim pretpostavke P6, iste su kao za model s dvije varijable.

Za definiranje OLS ocjenjivača potrebno je napisati regresijsku funkciju uzorka koja odgovara regresijskoj funkciji populacije

Varijance i standardne pogreške daju uvid o varijabilnosti OLS ocjenjivača od uzorka do uzorka. Kao i u slučaju linearnog regresijskog modela s dvije varijable standardne pogreške potrebne su za:

određivanje intervala povjerenja za stvarne vrijednosti parametara

testiranje hipoteza.

Korigirani koeficijent determinacije jednak je koeficijentu multiple determinacije ili je manji od njega.

 

 

 

 

 

 

Na postupak procjene parametara nadovezuje se postupak testiranja hipoteza, testovi:

Page 4: ekonometrija

 

 

skupni test - test značajnosti regresije, odnosno svih parametara u modelu, ili što je isto test značajnosti prisutnosti svih regresorskih varijabli u modelu

pojedinačni test - test o značajnosti jednog parametra (jedne regresorske varijable u modelu)

parcijalni test - test značajnosti podskupa parametara (test značajnosti prisutnosti podskupa regresorskih varijabli u modelu)

 

 

OCJENJIVANJE U UVJETIMA NEISPUNJENIH PRETPOSTAVKI KLASIČNOG MODELA

 

odsustvo savršene mulitkolinearnosti – odsutnost egzaktne linearne kombinacije nezavisnih varijabli u višestrukoj regresiji

Savršena multikolinearnost, kao pojava kada se varijacije jedne nezavisne varijable mogu u potpunosti objasniti varijacijama druge nezavisne varijable

Posljedice multikolinearnosti:

Velike varijance i standardne pogreške parametara. Velika standardna greška znači i širi interval pouzdanosti pa je teže procijeniti pravu vrijednost parametara, tj. pada preciznost ocjene parametara.

Nesignifikantne t-vrijednosti koje su posljedica velikih standardnih pogrešaka, zbog kojih će se kod testiranja hipoteze o značajnosti pojedine regresorske varijable prihvatiti H0 hipoteza (da je važna varijabla nesignifikantna).

Visok R2 i niske t-vrijednosti jasan su pokazatelj multikolinearnosti.

Ocjene parametara i njihove standardne greške postaju vrlo nestabilne i vrlo osjetljive na male promjene u podacima.

Pogrešan predznak parametara jest čest slučaj upravo zbog neefikasne i neprecizne ocjene parametra.

Nije moguće utvrditi zasebne utjecaje svake nezavisne varijable u objašnjenoj varijaciji, odnosno u R2. Ako postoji multikolinearnost prilagođenost se ne mijenja značajno, ali se ne može utvrditi uloga pojedine nezavisne varijable.

Page 5: ekonometrija

 

Indikatori različitih stupnjeva multikolinearnosti:

Visok R2, a niske t-vrijednosti

Visoki koeficijent korelacije između eksplanatornih varijabli

Pomoćne regresije

Inflacijski faktor varijance

 

 

Jedan od načina rješavanja problema multikolinearnosti jest izbaciti varijablu ili varijable koje su korelirane.

Drugi način je povećavanje broja podataka u uzorku, s obzirom da je multikolinearnosti problem uzorka, a ne populacije.

Postoji i mogućnost transformacije podataka

Autokorelacija postoji kada su vrijednosti slučajne varijable u međusobno korelirane veličine

Autokorelacija je češće prisutna kod ocjenjivanja modela na osnovi podataka vremenski nizova nego u slučaju ocijenjenog modela na osnovi podataka vremenskog presjeka.

Postoje dvije vrste autokorelacije: pozitivna i negativna. Kod pozitivne odstupanja ui obično imaju isti predznak. Kod negativne autokorelacije pozitivna odstupanja slijede negativna, pa opet pozitivna, itd.

Kada je autokorelaija prisutna, vizualno odstupanja kroz vrijeme pokazuju određeno pravilo ponašanja, sistematičnost

prava autokorelacija – kad je uzrok pojavljivanja autokorelacije sadržan u samim podacima na osnovu kojih se model ocjenjuje

neprava autokorelacija - specifikacijska pogreška, a to je izostavljena signifikantna varijabla ili odabir pogrešne funkcijske veze

BLUE - najbolje linearne nepristrane ocjene, imaju minimalnu varijancu (efikasne su) i nepristrane su

Postoji više načina za otkrivanje autokorelacije, među kojima se spominju grafička metoda i Durbin-Watsonov test

Page 6: ekonometrija

Grafička metoda sastoji se u prikazivanju raspršenosti reziduala kroz vrijeme iz kojeg je moguće vidjeti postoji li neka pravilnost ili su odstupanja stvarno slučajno distribuirana.

Durbin-Watsonov d test najpoznatiji je test za otkrivanje autokorelacije. Njegova prednost je što je jednostavan za primjenu i uključen u sve ekonometrijske pakete.

DW test se može upotrijebiti ako su zadovoljene sljedeće pretpostavke:

Koristi se za otkrivanje autokorelacije 1. reda.

Regresijski model uključuje konstantu (odsječak na ordinati). Ne može se primijeniti na regresiju kroz ishodiše.

Nezavisne varijable su nestohastične, znači imaju fiksne vrijednosti kod ponovljenih uzoraka.

Regresijski model ne uključuje vrijednosti zavisne varijable s pomakom u vremenu kao eksplanatorne varijable, tj. test nije primjenjiv na modele kao poznate pod nazivom autoregresijski modeli.

 

Vrijedi:

p=0, d=2, nema autokorelacije

p=1, d=0 postoji savršena pozitivna autokorelacija 1

p= -1, d=4 postoji savršena negativna autokorelacija 1

 

Autokorelacija se otklanja generaliziranom metodom najmanjih kvadrata (GLS-Generalized Least Squares). Generalizirana metoda najmanjih kvadrata koristi tehniku kvazidiferenciranja kako bi se autokorelirana odstupanja ut zamijenila odstupanjima vt koja su neautokorelirana.

 

 

GLS metodu nije uputno upotrebljavati:

Kada se radi o nepravoj autokorelaciji

Kada se radi o malim uzorcima

 

Page 7: ekonometrija

Procjenjivanje autoregresijskog parametra   p   nije problem, budući da ekonometrijski programski paketi to rade automatski

Pristup procjenjivanju vrijednosti:

Cochran-Orcutt procedura:Radi se o iterativnoj proceduri kojom računalo izračunava niz vrijednosti ˆ sve dok razlike među njima nisu zadovoljavajuće male.

Hildret-Lu procedura: Zasniva se na definiranju mogućih vrijednosti za ˆ i ocjenjivanju nekoliko regresija pomoću GLS kak bi se našlo transformaciju koja minimizira RSS.

 

Heteroskedastičnost je problem koji je uglavnom povezan s podacima vremenskog presjeka.

Heteroskedastičnost ostavlja ozbiljne i slične posljedice na ocijenjeni model kao i autokorelacija:

Nisu više efikasne, tj. nemaju minimalnu varijancu (nisu više BLUE).

Ocjena varijance parametara je pristrana, što proizlazi iz pristranosti varijance odstupanja; no ne znamo je li podcijenjena ili precijenjena; zbog toga t i F test nisu valjani.

 

Ne postoji opći efikasan i siguran test za otkrivanje heteroskedastičnosti.

GRAFIČKA METODA - Ova je metoda jednostavan početni način za utvrđivanje heteroskedastičnosti.

Testovi koji se uobičajeno koriste za otkrivanje heteroskedastičnosti su:

Prak test

Goldfeld-Quandt test

Glejser test

Breusch-Pagan test

CUSUMSQ test

Peak test

 

Uklanjanje heteroskedastičnosti kada je varijanca poznata = Vagana metoda najmanjih kvadrata 

Page 8: ekonometrija

Uklanjanje heteroskedastičnosti kada varijanca nije poznata = transformacije stabiliziranja varijance

 

 

 

 

 

 

 

 

 

 

 

 

SPECIFIKACIJA MODELA I PREDVIĐANJE EKONOMETRIJSKIM MODELOM

 

 

Pod specifikacijom ekonometrijskog modela podrazumijeva se odabir prave funkcijske veze te odabir važnih objasnidbenih varijabli u modelu.

funkcijskog oblika regresijskog modela:

Linearni – nagib konst. elastičnost nije

recipročni - model prikazuje Y kao funkciju inverzne vrijednosti jedne ili više nezavisnih varijabli

eksponencijalni – najpoznatiju model Cobb-Douglasova, konstantna elastičnost

polu-log – kad su zavisna i nezavisna varijabla u logaritamskom obliku

Pogrešna funkcijska veza može imati za posljedicu da se, inače važna objasnidbena varijabla, može pokazati nesignifikantnom ili imati neočekivani predznak.

Page 9: ekonometrija

Karakteristika specificiranog modela:

Sažetost

identificiranost

prilagođenost

teorijska dosljednost

prediktorna sposobnost – predviđanje

 

Drugim riječima, ako je ispuštena važna varijabla iz modela i postoji korelacija između varijabli uključenih u modeli spuštenih iz modela, ocjena parametra biti će pristrana.

Ako je u model uključena nevažna varijable, ocjene parametara su nepristrane i konzistentne, ali i neefikasne jer su varijance parametara veće nego što bi bile da je model korektno specificiran.

Za utvrđivanje specifikacijskih pogrešaka postoje različiti testovi:

otkrivanje nevažne varijable:

Teorija – treba li teorijski varijabla biti u modelu?

t-test – je li ocijenjeni parametar signifikantno različit od nule?

Korigirani koeficijent determinacije – povećava li se kada se varijabla uključi u model?

Pristranost – mijenjaju li se koeficijenti ostalih varijabli značajno kada se varijabla doda u jednadžbu?

Otkrivanje ispuštene varijable i netočne funkcijske veze:

Durbin-Watsonov test

RESET test

Wald test

Hausman test

 

 

Page 10: ekonometrija

Ako se radi o vremenskom regresijskom modelu, prognostička će vrijednost biti procijenjena vrijednost zavisne varijable za buduću (opaženu ili pretpostavljenu) vrijednost nezavisne varijable. U slučaju prostornog modela „prognostička vrijednost“ znači procjenu zavisne varijable za pretpostavljenu ili stvarnu vrijednost nezavisne varijable u istom trenutku, ali u novoj točki prostora.