Upload
ivona-naopacke-mladenovic
View
208
Download
0
Embed Size (px)
Citation preview
1. MJERENJE POUZDANOSTI ODNOSNO PRILAGOĐENOSTI REGRESIJSKOG MODELA
Dva najčešća statistička testa u ekonometriji:
koeficijent determinacije koji mjeri moć linearne regresije u objašnjavanju varijacija zavisno promjenjive varijable
test statističke značajnosti ocjenjenih vrijednosti parametara, zasnovan na statističkim pogreškama dobivenih ocjena parametara koji mjeri pouzdanost ocjena
Odstupanja empirijskih podataka Yi od njihove sredine Y zovu se ukupna odstupanja.
Suma kvadrata odstupanja zove se varijacija.
TSS: ukupna suma kvadrata ili ukupna varijacija (Total Sum of Squares): mjera ukupne varijacije varijable Y oko njezine srednje vrijednosti
ESS: objašnjena suma kvadrata ili objašnjena varijacija (Estimated Sum of Squares): dio ukupne varijacije varijable Y oko njezine sredine koji je objašnjen varijacijama varijable X
RSS: rezidualna suma kvadrata ili rezidualna ili neobjašnjena varijacija – dio ukupne varijacija varijable Y koji se može pripisati slučajnim utjecajima
Metoda koja minimizira u danim ukupnim varijacijama rezidualne varijacije, donosno maksimizira objašnjene varijacije, je metoda najmanjih kvadrata
Potrebno je spomenuti dva osnovna svojstva koeficijenta determinacije:
Radi se o ne negativnoj vrijednosti.
Kreće se u intervalu 0 R2 1, jer ESS dio ne može biti veći od TSS dijela. R2 = 1 označava savršenu prilagodbu (cjelokupna varijacija Y objašnjena je ocijenjenim regresijskim modelom). R2=0 označava nepostojanje veze između varijabli Y i X.
Korelacijska analiza sastoji se u primjeni postupaka kojima se utvrđuju pokazatelji jakosti statističke veze među pojavama.(+ - 1)
SER- standardna greška regresije - omjer rezidualne varijacije i stupnjeva slobode koji su joj pridruženi
Statistička značajnost prilagođenosti modela testira se F-testom
Postupak dekomponiranja varijacija zove se analiza varijance u regresiji ili ANOVA (Analysis of Variance)
Kvaliteta ocijenjenog regresijskog modela prosuđuje se testiranjem značajnosti prisutnosti svih regresorskih varijabli u modelu.
Najčešće upotrebljavani statistički paketi su: SAS, SPSS, STATISTICA, a od ekonometrijskih RATS; TSP; EVIEWS, SHAZAM, SORITEC.
2. VIŠESTRUKI LINEARNI REGRESIJSKI MODEL:
OCJENJIVANJE PARAMETARA I TESTIRANJE HIPOTEZA
Regresijski model s više od jedne nezavisne varijable poznat je kao višestruki regresijski model.
Značenje parcijalnih regresijskih koeficijenata : Regresijski koeficijenti B2 i B3 poznati su kao parcijalni regresijski koeficijenti ili parcijalni koeficijenti smjera.
B2 mjeri promjenu u srednjoj vrijednosti Y, E(Y), za jedinicu promjene u varijabli X2, kada je vrijednost varijable X3 konstantna.
B3 mjeri promjenu u srednjoj vrijednosti Y za jedinicu promjene u X3, kada je vrijednost X2 konstantna
P1
Regresijski model je linearan u parametrima te je korektno specificiran.
P2
Objasnidbene varijable X2 i X3 nisu korelirane sa slučajnim odstupanjima u, tj. kovarijanca između svake objasnidbene varijable i slučajne varijable u jednaka je nuli. Ukoliko su X2 i X3 nestohastične ova je pretpostavka automatski ispunjena.
P3
Očekivana vrijednost odstupanja jednaka je nuli: E(ui)=0.
P4
Homoskedastičnost: varijanca slučajne varijable u konstanta je i jednaka Q2.
P5
Odsutnost autokorelacije: vrijednosti slučajne varijable u međusobno su nekorelirane slučajne veličine, tj. njihova je kovarijanca jednaka nuli: cov(ui,uj)=0, i≠j.
P6
Odsutnost multikolinearnosti: ne postoji egzaktna linearna kombinacija nezavisnih varijabli, tj. ne postoji ovisnost oblika
P7
Slučajna odstupanja su normalno distribuirana s matematičkim očekivanjem jednakim nula i homoskedastičnom varijancom Q2: uiN(0, Q2)
Navedene pretpostavke, osim pretpostavke P6, iste su kao za model s dvije varijable.
Za definiranje OLS ocjenjivača potrebno je napisati regresijsku funkciju uzorka koja odgovara regresijskoj funkciji populacije
Varijance i standardne pogreške daju uvid o varijabilnosti OLS ocjenjivača od uzorka do uzorka. Kao i u slučaju linearnog regresijskog modela s dvije varijable standardne pogreške potrebne su za:
određivanje intervala povjerenja za stvarne vrijednosti parametara
testiranje hipoteza.
Korigirani koeficijent determinacije jednak je koeficijentu multiple determinacije ili je manji od njega.
Na postupak procjene parametara nadovezuje se postupak testiranja hipoteza, testovi:
skupni test - test značajnosti regresije, odnosno svih parametara u modelu, ili što je isto test značajnosti prisutnosti svih regresorskih varijabli u modelu
pojedinačni test - test o značajnosti jednog parametra (jedne regresorske varijable u modelu)
parcijalni test - test značajnosti podskupa parametara (test značajnosti prisutnosti podskupa regresorskih varijabli u modelu)
OCJENJIVANJE U UVJETIMA NEISPUNJENIH PRETPOSTAVKI KLASIČNOG MODELA
odsustvo savršene mulitkolinearnosti – odsutnost egzaktne linearne kombinacije nezavisnih varijabli u višestrukoj regresiji
Savršena multikolinearnost, kao pojava kada se varijacije jedne nezavisne varijable mogu u potpunosti objasniti varijacijama druge nezavisne varijable
Posljedice multikolinearnosti:
Velike varijance i standardne pogreške parametara. Velika standardna greška znači i širi interval pouzdanosti pa je teže procijeniti pravu vrijednost parametara, tj. pada preciznost ocjene parametara.
Nesignifikantne t-vrijednosti koje su posljedica velikih standardnih pogrešaka, zbog kojih će se kod testiranja hipoteze o značajnosti pojedine regresorske varijable prihvatiti H0 hipoteza (da je važna varijabla nesignifikantna).
Visok R2 i niske t-vrijednosti jasan su pokazatelj multikolinearnosti.
Ocjene parametara i njihove standardne greške postaju vrlo nestabilne i vrlo osjetljive na male promjene u podacima.
Pogrešan predznak parametara jest čest slučaj upravo zbog neefikasne i neprecizne ocjene parametra.
Nije moguće utvrditi zasebne utjecaje svake nezavisne varijable u objašnjenoj varijaciji, odnosno u R2. Ako postoji multikolinearnost prilagođenost se ne mijenja značajno, ali se ne može utvrditi uloga pojedine nezavisne varijable.
Indikatori različitih stupnjeva multikolinearnosti:
Visok R2, a niske t-vrijednosti
Visoki koeficijent korelacije između eksplanatornih varijabli
Pomoćne regresije
Inflacijski faktor varijance
Jedan od načina rješavanja problema multikolinearnosti jest izbaciti varijablu ili varijable koje su korelirane.
Drugi način je povećavanje broja podataka u uzorku, s obzirom da je multikolinearnosti problem uzorka, a ne populacije.
Postoji i mogućnost transformacije podataka
Autokorelacija postoji kada su vrijednosti slučajne varijable u međusobno korelirane veličine
Autokorelacija je češće prisutna kod ocjenjivanja modela na osnovi podataka vremenski nizova nego u slučaju ocijenjenog modela na osnovi podataka vremenskog presjeka.
Postoje dvije vrste autokorelacije: pozitivna i negativna. Kod pozitivne odstupanja ui obično imaju isti predznak. Kod negativne autokorelacije pozitivna odstupanja slijede negativna, pa opet pozitivna, itd.
Kada je autokorelaija prisutna, vizualno odstupanja kroz vrijeme pokazuju određeno pravilo ponašanja, sistematičnost
prava autokorelacija – kad je uzrok pojavljivanja autokorelacije sadržan u samim podacima na osnovu kojih se model ocjenjuje
neprava autokorelacija - specifikacijska pogreška, a to je izostavljena signifikantna varijabla ili odabir pogrešne funkcijske veze
BLUE - najbolje linearne nepristrane ocjene, imaju minimalnu varijancu (efikasne su) i nepristrane su
Postoji više načina za otkrivanje autokorelacije, među kojima se spominju grafička metoda i Durbin-Watsonov test
Grafička metoda sastoji se u prikazivanju raspršenosti reziduala kroz vrijeme iz kojeg je moguće vidjeti postoji li neka pravilnost ili su odstupanja stvarno slučajno distribuirana.
Durbin-Watsonov d test najpoznatiji je test za otkrivanje autokorelacije. Njegova prednost je što je jednostavan za primjenu i uključen u sve ekonometrijske pakete.
DW test se može upotrijebiti ako su zadovoljene sljedeće pretpostavke:
Koristi se za otkrivanje autokorelacije 1. reda.
Regresijski model uključuje konstantu (odsječak na ordinati). Ne može se primijeniti na regresiju kroz ishodiše.
Nezavisne varijable su nestohastične, znači imaju fiksne vrijednosti kod ponovljenih uzoraka.
Regresijski model ne uključuje vrijednosti zavisne varijable s pomakom u vremenu kao eksplanatorne varijable, tj. test nije primjenjiv na modele kao poznate pod nazivom autoregresijski modeli.
Vrijedi:
p=0, d=2, nema autokorelacije
p=1, d=0 postoji savršena pozitivna autokorelacija 1
p= -1, d=4 postoji savršena negativna autokorelacija 1
Autokorelacija se otklanja generaliziranom metodom najmanjih kvadrata (GLS-Generalized Least Squares). Generalizirana metoda najmanjih kvadrata koristi tehniku kvazidiferenciranja kako bi se autokorelirana odstupanja ut zamijenila odstupanjima vt koja su neautokorelirana.
GLS metodu nije uputno upotrebljavati:
Kada se radi o nepravoj autokorelaciji
Kada se radi o malim uzorcima
Procjenjivanje autoregresijskog parametra p nije problem, budući da ekonometrijski programski paketi to rade automatski
Pristup procjenjivanju vrijednosti:
Cochran-Orcutt procedura:Radi se o iterativnoj proceduri kojom računalo izračunava niz vrijednosti ˆ sve dok razlike među njima nisu zadovoljavajuće male.
Hildret-Lu procedura: Zasniva se na definiranju mogućih vrijednosti za ˆ i ocjenjivanju nekoliko regresija pomoću GLS kak bi se našlo transformaciju koja minimizira RSS.
Heteroskedastičnost je problem koji je uglavnom povezan s podacima vremenskog presjeka.
Heteroskedastičnost ostavlja ozbiljne i slične posljedice na ocijenjeni model kao i autokorelacija:
Nisu više efikasne, tj. nemaju minimalnu varijancu (nisu više BLUE).
Ocjena varijance parametara je pristrana, što proizlazi iz pristranosti varijance odstupanja; no ne znamo je li podcijenjena ili precijenjena; zbog toga t i F test nisu valjani.
Ne postoji opći efikasan i siguran test za otkrivanje heteroskedastičnosti.
GRAFIČKA METODA - Ova je metoda jednostavan početni način za utvrđivanje heteroskedastičnosti.
Testovi koji se uobičajeno koriste za otkrivanje heteroskedastičnosti su:
Prak test
Goldfeld-Quandt test
Glejser test
Breusch-Pagan test
CUSUMSQ test
Peak test
Uklanjanje heteroskedastičnosti kada je varijanca poznata = Vagana metoda najmanjih kvadrata
Uklanjanje heteroskedastičnosti kada varijanca nije poznata = transformacije stabiliziranja varijance
SPECIFIKACIJA MODELA I PREDVIĐANJE EKONOMETRIJSKIM MODELOM
Pod specifikacijom ekonometrijskog modela podrazumijeva se odabir prave funkcijske veze te odabir važnih objasnidbenih varijabli u modelu.
funkcijskog oblika regresijskog modela:
Linearni – nagib konst. elastičnost nije
recipročni - model prikazuje Y kao funkciju inverzne vrijednosti jedne ili više nezavisnih varijabli
eksponencijalni – najpoznatiju model Cobb-Douglasova, konstantna elastičnost
polu-log – kad su zavisna i nezavisna varijabla u logaritamskom obliku
Pogrešna funkcijska veza može imati za posljedicu da se, inače važna objasnidbena varijabla, može pokazati nesignifikantnom ili imati neočekivani predznak.
Karakteristika specificiranog modela:
Sažetost
identificiranost
prilagođenost
teorijska dosljednost
prediktorna sposobnost – predviđanje
Drugim riječima, ako je ispuštena važna varijabla iz modela i postoji korelacija između varijabli uključenih u modeli spuštenih iz modela, ocjena parametra biti će pristrana.
Ako je u model uključena nevažna varijable, ocjene parametara su nepristrane i konzistentne, ali i neefikasne jer su varijance parametara veće nego što bi bile da je model korektno specificiran.
Za utvrđivanje specifikacijskih pogrešaka postoje različiti testovi:
otkrivanje nevažne varijable:
Teorija – treba li teorijski varijabla biti u modelu?
t-test – je li ocijenjeni parametar signifikantno različit od nule?
Korigirani koeficijent determinacije – povećava li se kada se varijabla uključi u model?
Pristranost – mijenjaju li se koeficijenti ostalih varijabli značajno kada se varijabla doda u jednadžbu?
Otkrivanje ispuštene varijable i netočne funkcijske veze:
Durbin-Watsonov test
RESET test
Wald test
Hausman test
Ako se radi o vremenskom regresijskom modelu, prognostička će vrijednost biti procijenjena vrijednost zavisne varijable za buduću (opaženu ili pretpostavljenu) vrijednost nezavisne varijable. U slučaju prostornog modela „prognostička vrijednost“ znači procjenu zavisne varijable za pretpostavljenu ili stvarnu vrijednost nezavisne varijable u istom trenutku, ali u novoj točki prostora.