30
Ekonomski fakultet, Univerzitet u Beogradu, Doktorske studije Milena Jovičić EKONOMETRIJA 1 D - UVODNI DEO BELEŠKE S PREDAVANJA Beograd, maj 2010.

Ekonometrija 1D - Uvodni deo

  • Upload
    -

  • View
    580

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet, Univerzitet u Beogradu, Doktorske studije Milena Jovičić

EKONOMETRIJA 1 D - UVODNI DEO

BELEŠKE S PREDAVANJA

Beograd, maj 2010.

Page 2: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

1

LITERATURA

Jovičić, M. (2002), Ekonometrijski metodi, Ekonomski fakultet, Beograd. Mladenović, Z. i P. Petrović (2007), Uvod u ekonometriju, EF, Beograd Greene, W.H. (2007), Econometric Analysis (6th International Edition), Prentice Hall Gujarati, D. (2009), Basic Econometrics (5th edition), McGraw Hill Kennedy, P. (2008), A Guide to Econometrics (6th Edition), Wiley-Blackwell UVOD • Da li u tranzicionim privredama važi Filipsova kriva? (TESTIRANJE TEORIJE) • Kolika će biti inflacija u Srbiji do kraja godine? (PREDVIĐANJE) • Da li povećati cenu da bi porastao prihod? (DONOŠENJE ODLUKA)

Odgovor na ta pitanja može se dobiti jedino kvantifikovanjem odnosa u kompleksu ekonomskih međuzavisnosti. Nema dokaza u ekonomiji bez kvantifikacije (merenja). "Da bi ekonomija bila nauka, mora da koristi matematiku" (Šumpeter, 1933.)

Da bi neka oblast bila nauka, mora da sadrži zakonitosti. Da bi neka tvrdnja postala zakonitost, mora se koristiti naučni metod dokazivanja. Pod zakonitošću se smatra naučna istina koja važi uvek, pod istim uslovima - uz eventualne male izuzetke (tu nam je potrebna Statistika). Npr. u ekonomiji u opštem slučaju važi "zakon ponude i tražnje": kad raste ponuđena cena nekog proizvoda, pada tražnja za njim. Ali postoje i mali izuzeci (i promenjeni uslovi). U društvenim naukama nema čvrstih pravila od kojih se ne odstupa, postoji uvek stohastički element ponašanja.

Ekonometrija je oblast ekonomske nauke koja putem modeliranja omogućava merenje ekonomskih relacija i empirijsko testiranje hipoteza.

Ekonometrijski model je formalizovana prezentacija znanja i pretpostavki o nekom ekonomskom fenomenu, sa ciljem da obuhvati suštinu i način operisanja kompleksa realnosti u lakše razumljiv sistem.

Ciljevi modela (načini njegove upotrebe): ♦ testiranje hipoteza odn. ekonomske teorije ♦ pomoć u donošenju odluka ♦ prognoziranje i predviđanje (bezuslovno i uslovno)

Ciljevi modela se međusobno ne isključuju, već uspešan model omogućuje ostvarenje kombinacije ciljeva. Model se može sastojati od jedne ili više jednačina modela, pri čemu svaka jednačina predstavlja jedan uzročni tok, naime zavisnost neke pojave od relevantnih faktora.

Poželjne osobine ekonometrijskog modela: • relevantnost (zasnovanost cilja) - jasna ideja od koje se polazi • teorijska uverljivost - potrebno je dobro poznavati teoriju ispitivanog fenomena • sposobnost razjašnjenja - model mora da objasni pojave u realnosti • tačnost ocene parametara - korišćeni metod mora dati tačne i precizne ocene • mogućnost predviđanja - model treba da važi i izvan korišćenog uzorka • jednostavnost - treba da je lako koristiti ga

Page 3: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

2

Podaci (promenljive veličine) u ekonomiji mogu biti različiti, kvantitativni ili kvalitativni: • vremenske serije - jedna pojava beležena tokom vremena • uporedni podaci - podaci za više posmatranih jedinica (opservacija) • panel podaci - serija uporednih podataka kroz vreme (kombinacija prethodnih) • tehnički, institucionalni, zakonski (opisni podaci) • konstruisani podaci (veštačke varijable), da bi se predstavili opisni podaci Sve ove vrste podataka koriste se u ekonometrijskim modelima, sa ciljem da se ispita njihov uticaj na pojavu čije se formiranje modelom objašnjava.

METODOLOGIJA EKONOMETRIJSKOG ISTRAŽIVANJA Svako uspešno ekonometrijsko istraživanje sastoji se od četiri faze (stadijuma):

1. Specifikacija: matematičko formulasanje teorije, odn. polazne hipoteze.

2. Ocena modela, sadrži faze: sakupljanje, agregiranje i obrada podataka, izbor metoda ocenjivanja i njegovu primenu.

3. Vrednovanje ocena, prema tri grupe kriterijuma: a) ekonomski (a priori, logički) - provera veličine i znaka parametara; b) statistički (testovi prvog reda) - testovi značajnosti parametara i modela; c) ekonometrijski (testovi drugog reda) - analiza reziduala

4. Vrednovanje moći predviđanja: ispitivanje stabilnosti ocena (osetljivosti parametara), da bi se ustanovilo da li model važi i izvan uzorka korišćenog za ocenjivanje.

Šematski prikaz postupka u ekonometrijskom istraživanju slikovito prikazuje ODNOS EKONOMETRIJE SA SRODNIM NAUKAMA EKONOMSKA TEORIJA MATEMATIČKA EKONOMIJA EKONOMSKA STATISTIKA MATEMATIČKA STATISTIKA TESTIRANJE ODLUČIVANJE PREDVIĐANJE

TEORIJA

MODEL

PODACI

OCENA

Page 4: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

3

KLASIČNI LINEARNI REGRESIONI MODEL (KLRM) Pojava koja se izučava (Yi) za opservacije i=1,2,...n, predstavlja se sistematskim delom (zavisnošću od relevantnih faktora, Xij, j=1,...k) i stohastičkim delom modela ui koji ima tri izvora:

slučajne greške merenja Yi = a + b1X1i +... + bkXki + ui greške specifikacije modela greške usled uzorka (odstup. od proseka) sistematski stohastički deo

Jednostavni model: zavisna promenljiva Y je funkcija jedne nezavisne, a višestruki: Y je funkcija više nezavisnih ekslplanatornih promenljivih (objašnjavajućih faktora).

Linearnost modela se javlja kao poželjna osobina modela iz sledećih razloga: a) praktični razlozi, lako razumevanje koeficijenata i donošenje odluka b) tradicionalna statistička metodologija bazirana na linearnosti c) minimiziraju se greške, zbog neadekvatnih podataka.

U ekonometrijskom smislu linearnost (aditivnost) je po parametrima, ali ne i po varijablama (X), odn. ne mora biti i matematička linearnost.

Linearni model za ocenjivanje numeričke zavisnosti jedne varijable od drugih naziva se i regresija. Zavisna promenljiva se naziva regresand a nezavisne promenljive regresori.

Klasični jednostavni linearni regresioni model (KJLRM) - grafički prikaz pretpostavki o stohastičnosti u jednostavnom modelu

y i

x i

b xa +

y i

u i

a+b x i

Kad greška modela zadovoljava pretpostavke o stohastičnosti, to je KLRM: 1. E(ui) = 0, ∀ i - raspodela (za svako i) centrirana na pravu y=a+bx, 2. E(ui)2 = σ2, ∀ i - sa podjednakom disperzijom (homoskedastičnost), 3. E(ui uj) = 0, ∀ i≠j - greške pojedinih opservacija međusobno nezavisne, 4. ui ~ N(0, σ2), ∀ i - distribucija greške je normalna (simetrična), 5. E(ui Xj) = 0, ∀ i,j - greška i regresori su međusobno nezavisni.

Page 5: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

4

Ako u modelu postoji više regresora uvode se i dopunske pretpostavke:

• n > k, uzorak veći od broja regresora - mogućnost ocenjivanja • odsustvo perfektne multikolinearnosti (međusobne zavisnosti X-ova)

Opravdanost pretpostavki KLRM o stohastičnosti

U ekonometrijskom modelu stohastička greška ui obuhvata dejstvo velikog broja individualno nevažnih uticaja, pa je sasvim slučajnog (stohastičkog) karaktera. • Suma izostavljenih faktora ima distribuciju koja teži normalnoj kad im broj raste

(Centralna granična teorema). • Aritmetička sredina je nula jer se potiru pozitivni i negativni uticaji ako je tačna

specifikacija modela, pa greška obuhvata samo pojedinačno nevažne faktore. • Variranje oko proseka za sve opservacije je isto (konačna konstantna varijansa). • Visina odstupanja od prosečne zavisnosti ne zavisi od prethodne visine; • Visina greške ne zavisi od veličine Xi (jer uzima sasvim nezavisne vrednosti).

OCENJIVANJE LINEARNOG REGRESIONOG MODELA Da bi se model mogao koristiti, treba oceniti nepoznate parametre (a i b).

Ocenjena vrednost zavisne promenljive je: ii XbaY += , a greške je rezidual ei .

Ocenjivanje se obavlja metodom najmanjih kvadrata ili maks. verodostojnosti.

METOD NAJMANJIH KVADRATA: minimiziranjem sume kvadrata reziduala (odstupanja stvarnih od ocenjenih vrednosti iii YYe −= ).

Reziduali )Xba(YYYe ijj

jiiii ∑+−=−= se kvadriraju pri minimiziranju, jer se u

sumi potiru (neki pozitivni, neki negativni, suma im je nula).

Višestruki model: i1ik1k2i21i10i uXb...XbXbbY ++++= −− može se pisati

matričnom notacijom kao: Y = Xb+u, a ocenjeni: ebXY += ; gde je e vektor reziduala: bXYYYe −=−= , a Y su modelom ocenjene vrednosti Y. Postupak minimiziranja sume rezidualnih kvadrata: Σe2 = bX'X'bY'X'b2Y'Y)bXY()'bXY(e'e +−=−−= zahteva da se prvi izvod po vektoru ocena parametara b izjednači sa nulom: 0b)X'X(2)Y'X(2

b)e'e(

=+−=∂

∂ , a drugi izvod je pozitivan. Odatle slede

NORMALNE JEDNAČINE: Y'Xb)X'X( = , odakle je rešenje

vektor ocena regresionih parametara b metodom NK: Y'X)X'X(b 1−= .

Uslov za postojanje rešenja vektora b : matrica X'X ne sme biti singularna. Drugim rečima, da bi se mogli oceniti regresioni parametri, nezavisne varijable ne smeju biti međusobno perfektno korelisane.

])X'X(X'uu'X)X'X[(E)]bb()'bb[(E)b(Var 11 −−=−−= . Matrica varijansi i kovarijansi ocena parametara:

Page 6: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

5

=

)b(Var...)bb(Cov)bb(Cov....

)bb(Cov...)b(Var)bb(Cov)bb(Cov...)bb(Cov)b(Var

)b(Var

kk2k1

k2221

k1211

uz uslov sferičnih grešaka: E(uu')=σ2I (skalarna kovarijantna matrica grešaka, zamenjuje dve pretpostavke KLRM: nema autokorelacije i heteroskedastičnosti), postaje: 12 )X'X()b(Var −σ= .

POŽELJNE OSOBINE OCENA PARAMETARA Dok su regresioni parametri (bi) nepoznate vrednosti u populaciji (reč parametar podrazumeva konstantnu vrednost), njihove ocene su slučajne promenljive veličine, čija vrednost varira od uzorka do uzorka, dakle imaju svoju distribuciju.

Kriterijum valjanosti ocene je koncentrisana raspodela, odnosno zahtev da je ocena: ♦ u proseku što bliža pravoj vrednosti parametra (što tačnija) ♦ varira minimalno oko te vrednosti (što preciznija)

Poželjne osobine parametara se razlikuju u malim i velikim uzorcima.

U MALIM UZORCIMA

1. Nepristrasnost - Ocena b je nepristrasna ako je E( b )=b 2. Najmanja varijansa - Ocena b je najbolja ako Var( b )<Var(b*) 3. Efikasnost - Podrazumeva: a) nepristrasnost i b) min. var. 4. Linearanost - Linearna kombinacija opservacija u uzorku 5. Egzostivnost - Iscrpljuje sve opservacije (sve informacije)

Obično se ističe kombinacija ovih osobina (npr. NLNO = najbolja linearna nepristrasna ocena, ili MSKG = minimalna srednja kvadratn greška: za pristrasne ocene minimalna suma pristrasnosti i varijanse)

U VELIKIM UZORCIMA - ASIMPTOTSKE OSOBINE 1. Asimptotska nepristrasnost bbE nn

=∞→

)ˆ(lim

Pristrasnost iščezava sa povećanjem uzorka (n = broj opservacija).

2. Konzistentnost pplliimm b == bb U limesu verovatnoće, b postaje prava vrednost. Podrazumevaju se dva uslova: a) asimptotsku nepristrasnost i b) da varijansa teži nuli (Sa povećanjem uzorka nestaju i pristrasnost i varijansa)

3. Asimptotska efikasnost Podrazumeva takođe dve osobine: a) konzistentnost i b) najmanju asimptotsku varijansu (koja brže teži nuli sa povećanjem uzorka nego varijansa bilo koje druge konzistentne ocene).

Nepristrasna ocena varijanse grešaka u uzorku Kako se greške ne opažaju, nepoznata je i njihova varijansa, σ2. Da bi se dobila nepristrasna ocena iz reziduala, potrebno je sumu kvadrata odstupanja reziduala od njihove srednje vrednosti (nula) podeliti brojem stepeni slobode, a kako je:

22 )kn()e(E σ−=∑ , to je nepristrasna ocena za σ2: kn

eˆ2

2−

∑=σ jer

Page 7: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

6

22

2kn)kn(

kn)e'e(E)ˆ(E σ=

−σ−

=−

=σ . Tada su ocenjene varijanse i kovarijanse ocena:

122 )X'X(ˆ)b(S −σ=

OCENJIVANJE METODOM MAKSIMALNE VERODOSTOJNOSTI Za primenu metoda MV potrebno da greška modela (i zavisna varijabla kao njena linerarna funkcija) ima normalnu distribuciju. Metod MV koristi logiku suprotnu metodu NK: na osnovu datog uzorka, koji je mogao biti generisan iz niza skupova, naći onaj skup parametara koji sa najvećom verovatnoćom generiše takav uzorak.

Postupak: iz definisane funkcije verovatnoće opservacija uzorka, naći maksimum po nepoznatim parametrima (izjednačavanjem prvog izvoda s nulom, a drugi neg.)

);bXa(NY 2ii σ+≈ Funkcija verodostojnosti: Λ =f(Y1) f(Y2)... f(Yn)

odn. log: )Y(flnLn

1ii∑=

=

, gde je: 2

ii2i ~

Xb~a~Y21)2ln(

21)Y(fln

σ−−

−πσ−=

max. 2ii2

2 )Xb~a~Y(~21~ln

2n2ln

2nL ∑ −−

σ−σ−π−= , jer max L=max Λ

Za tri nepoznata parametra ( a~ , b~ i 2~σ ) treba naći vrednosti za koje je L u svom maksimumu. (Naći prve izvode, izjednačiti sa nulom i rešiti; uz uslov II izvod<0.)

EViews daje vrednost ove funkcije (Log Likelihood), pod pretpostavkom normalne distribucije, za ocenjene vrednosti koeficijenata. Test MV može se sprovesti preko razlike između vrednosti MV za verziju jednačine pod ograničenjem i bez ograničenja (funkcija sadrži i konstantu).

TESTIRANJE ZNAČAJNOSTI U testu značajnosti pojedinačnih regresionih parametara (H0: bi=0), koristi se odnos ocenjene vrednosti parametra i njegove standardne greške (kvadratni koren izračunate varijanse), koji sledi (Studentovu) t-distribuciju:

bSb*t = : t (n−k), n= veličina uzorka, k=broj parametara u modelu

U testu značajnosti cele regresije polazi se od podele ukupnih varijacija zavisne promenljive Y: 2

i2i )YY(y −∑=∑ na dva nezavisna sabirka:

Ukupna suma varijacija = suma objašnjenih + suma neobjašnjenih ∑∑∑∑∑∑ +=+=−+−=−= 2

i2i

2ii

2iii

2i

2i ey)ye()YYYY()YY(y

Deljenjem sa yi dobijaju se udeli objašnjenih i neobjašnjenih varijacija u ukupnim:

1ye

yy

2

2

2

2=

∑∑+

∑∑ , što se može iskazati u procentima (množeno sa 100).

Mera valjanosti regresije naziva se KOEFICIJENT DETERMINACIJE i računa kao procenat varijacija zavisne varijable Y objašnjenih modelom:

∑∑−=

∑∑= 2

2

2

22

ye1

yyR meri udeo objašnjenih u ukupnim varijacijama

Page 8: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

7

Kako je koef. determinacije uvek 0 ≤ R2 ≤ 1 , često se navodi i u procentima.

U testu značajnosti cele regresije (H0: b1=b2=...bk=0) osnova testa je koeficijent determinacije R2:

1kkn2

2

2

2F

)1k)(R1()kn(R

)1k(e)kn(y

)kn(e'e)1k(y'x'bF −

−∑

∑≈

−−−

=−−

=−

−=

Kad je izračunata F-vrednost veća od tablične (uz zadati nivo značajnosti testa), zaključuje se da je regresija značajna. Treba naglasiti da je uvek cilj maksimirati procenat objašnjenih varijacija ispitivane pojave korišćenim modelom, ali uz uslov što većeg broja stpeni slobode (podrazumeva se i zadovoljenje svih drugih kriterija). Zato se modeli sa različitim brojem n-k upoređuju koristeći: KORIGOVANI KOEFICIJENT DETERMINACIJE - korigovan za broj stepeni slobode:

)R1(kn1kR)R1(

kn1n1

)1n(y)kn(e1R 222

2

22 −

−−

−=−−−

−=−∑

−∑−=

Korigovani koeficijent je uvek niži od pravog koeficijenta determinacije, utoliko više što je više regresora za isti uzorak (osim za za maksimalnu vrednost 1R2 = , kada je

22 RR = ). .. I DRUGI INFORMACIONI KRITERIJUMI U EVIEWS Poređenje dva modela sa različitim regresorima (dakle u slučaju drugačijeg broja stepeni slobode), koji objašnjavaju varijacije iste zavisne varijable, može se obaviti koristeći, pored koeficijenta determinacije, i informacione kriterijume AIC i SIC (rezultati su predstavljeni u u tabeli regresionih rezultata u EViews).

• Akaike-ov informacioni kriterijum (AIC) baziran na ideji da treba strožije kazniti gubitak stepeni slobode usled uvođenja novih regresora nego što to čini korigovani koef. determinacije. Bolji je model sa nižim AIC, jer:

+

=

neln

nk2AICln

2

gde je k broj regresora, a n veličina uzorka. Ovaj kriterijum se koristi i izvan uzorka, dakle za ocenu performansi prognoza modelom, a pogodan je za obuhvatne i neobuhvatne modele. (U modelima VAR koristi se i u izboru docnji)

• Schwarz-ov informacioni kriterijum (SIC) je sličan AIC, ali on još strožije kažnjava uvođenje novih regresora (porast k prema n) (:

+

=

neln)nln(

nkSICln

2

Kao i za AIC, niža vrednost SIC označava bolji model, a koristi se i izvan uzorka. Nijedan od ovih kriterija nije superioran u odnosu na druge. Stoga ih treba koristiti kao dopunske uobičajenim testovima specifikacije.

Page 9: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

8

PRIMER - OCENJIVANJE MODELA I STATISTIČKI TESTOVI Za 25 okruga u Srbiji (podaci za 2004. godinu), ocenjen je model kojim se ispituju glavni faktori koji određuju visinu prosečne zarade (platu). To su: stopa nepismenosti (% nepismenih u ukupnom stanovništvu), kao mera razvijenosti regiona i narodni dohodak po stanovniku (u dinarima), kao mera ekonomske aktivnosti u toj godini. Za podatke po okruzima, u fajlu programa EViews prvo se odrede korišćene serije (Ctrl i levi taster) Show, pa sa Proc/Make Equation (LS) dobiju rezultati koji zadovoljavaju apriorne (ekonomske) kriterijume:

Dependent Variable: PLATA Method: Least Squares Sample: 1 25 Included observations: 25

Variable Coefficient Std. Error t-Statistic Prob.

NEPIS stopa nepismenosti -501.3062 150.9819 -3.320307 0.0031NDPC narodni dohodak pc 0.040495 0.012346 3.279932 0.0034

C konstanta 11484.94 1447.404 7.934858 0.0000

R-squared 0.718562 Mean dependent var 12308.92Adjusted R-squared 0.692977 S.D. dependent var 2282.009S.E. of regression 1264.454 Akaike info criterion 17.23484Sum squared resid 35174568 Schwarz criterion 17.38110Log likelihood -212.4354 F-statistic 28.08498Durbin-Watson stat 2.143984 Prob(F-statistic) 0.000001

Značenje koeficijenata: U odnosu na prosečnu platu (12 309), konstanta (odsečak) je ocenjena plata pri nultim vrednostima nezavisnih varijabli. Nagibi su parcijalni izvodi, individualni uticaji (parcijalni uticaji pojedinih faktora - ceteris paribus).

Značajnost: Broj stepeni slobode je: n−k=25−3=22. Nivo značajnosti pojedinačnih regresionih parametara visok, rizih greške 3,4% (sa tom verovatnoćom se greši pri odbacivanju nulte hipoteze da je parametar = 0). Nivo značajnosti cele regresije još viši, gotovo 0%. Regresija je visoko značajna, dva korišćena faktora objašnjavaju blizu 72% varijacija prosečne zarade po okruzima. Dakle, na nivou od 5% testirana hipoteza da ovi faktori nemaju značajnog uticaja na varijablu plata odbacuje se.

Prognoziranje: Za vrednosti X-ova od 3% i 100.000, očekuje se plata od:

PLATA=11.484,94-501,3062*3+0,040495*100000=14030,52 ( ±2,074*1264,45)

Zamenom očekivanih vrednosti nezavisnih varijabli u model sa ocenjenim regresionim koeficijentima, izračunava se vrednost prognoze (u tački). Za interval prognoze, uz datu verovatnoću i broj stepeni slobode, prema t-distribuciji, predviđenoj vrednosti se dodaje ± t*St.greška (jer je Y/ σ ≈ t)

Page 10: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

9

TESTOVI LINEARNIH OGRANIČENJA NA PARAMETRE 1. Jedno ograničenje. Oceniti funkciju ne vodeći računa o ograničenju; pa testirati značajnost razlike ocenjene i pretpostavljene vrednosti (više parametara)- t- test: rb'c:H0 = ; c je vektor konstanti, r je skalar

kn1t

c)X'X('cˆ

rb'c*t −−≈

σ

−=

Npr. b2 =1- b3 preko H0: b2+b3=1, def. c'=[0 1 1 . . . 0]; r =1 u hipotezi H0: c'b =r

2. Više linearnih ograničenja na parametre. Oceniti model sa ograničenjem i model bez ograničenja, pa testirati značajnost razlike rezidualnih kvadrata, F-test:

H0: Rb =r , gde je: R (gxk) matrica, r vektor od g<k elemenata, g broj ograničenja

Na primer: b2 = - b3 i b4 = 0 daju:

=

0...10000...0110

R i

=

00

r

Ocene modela pod ograničenjem dobijaju se minimiziranjem sume rezidualnih kvadrata pod ograničenjem zadatim nultom hipotezom (Lagrange-ova funkcija, pa prvi izvod izjednačiti s nulom):

λ−−+−=λ−−−−= )'rb~R(b~X'X'b~Y'X'b~2Y'Y)'rb~R()b~XY()'b~XY(L

0'Rb~)X'X(2Y'X2b~L

=λ−+−=∂∂ /2 daje:

2')'(ˆ)2''()'(~ 11 λλ RXXbRYXXXb −− +=+=

a naravno 0~ =−=∂∂ rbRL

λ, odn. Rb~ =r kako i glasi H0.

Ako b~ u gornjem izrazu pomnožimo sa R: 2')'(ˆ~ 1 λRXXRbRbR −+= pomn. sa

2 i rešimo po λ: )~(]')'([2 11 bRrRXXR −= −−λ zamenimo u b~ :

)bRr(]'R)X'X(R['R)X'X(bb~ 111 −+= −−− ;

a kako je: u'X)X'X(b)uXb('X)X'X(b 11 −− +=+=

odakle bbE =)~( ako važi 0)~( =− bRrE , pa je: uXXXAbb ')'(~ 1−=− , gde je: A=I-(X'X)-1R'[R(X'X) -1R']-1R idempotentna matrica, tako da je AA'=A; dijagonalni elementi matrice umanjioca aii≥0, pa je: )b(Var)X'X(A])'bb~)(bb~[(E)b~(Var 12 ≤σ=−−= −

* Uvođenje ograničenja smanjuje varijanse ocena

Kad je ocenjen model pod ograničenjem, sa sumom rezidualnih kvadrata ∑ 2oe i

brojem stepeni slobode n-(k-g), i model bez ograničenja sa sumom rezidualnih kvadrata ∑ 2

Be i stepenima slobode n-k, može se formirati statistika testa zasnovana na razlici rezidualnih suma kvadrata:

gkn2

B

2B

2O F

)kn(eg)ee(F −

∑ ∑≈

−−

= broj stepeni slobode u brojiocu : [n-(k-g)]-(n-k)=g

Page 11: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

10

u matričnoj notaciji: )kn(e'eg)e'ee~'e~(F

−−

= , gde je )b~b(X'X)'b~b(e'ee~'e~ −−=−

Deljenjem brojioca i imenioca sa ukupnom sumom varijacija y dobija se:

gkn2

B

2O

2B

2B

2B

2O F

)kn/()R1(g/)RR(

)kn(eg)ee(F −≈

−−

−=

−∑

∑ ∑−= , jer je 2

2

2R1

ye

−=∑∑

Ako je vrednost statistike testa veća od tablične, uz zadati rizik α, odbacuje se H0. TEST DODATNIH REGRESORA Da uvođenje regresora povećavao R2 toliko da kompenzira smanjenje broja st. sl.? (1) uXb...XbbY kk221 ++++= Koji je model od ova dva superiorniji? (2) vXb....Xb...XbbY mmkk221 ++++++=

Testom hipoteze: 0b...b:H m1k0 ===+ ; odbacivanje vodi uključivanju regresora.

Ukupna suma varijacija Y deli se na različite proporcije u dva modela:

(1) ∑∑ ∑ += 2k

2k

2 eyy ;

(2) ∑+∑=∑ 2m

2m

2 eyy , pri čemu je: ∑≤∑ 2k

2m ee

kmmn2

m

2k

2m

2m

2k

2m F

kmmn

R1

RR

)mn(e

)km()yy(F −

−≈−

−⋅

−=

−∑

−∑ ∑−=

St. sl. u brojiocu: (m-1)-(k-1)

Kako odabrati kojih k regresora uzeti kao prve regresore, a kojih m-k kao dodatne?

Pri izboru regresionih faktora treba voditi računa o više stvari (uključujući teorijska znanja i osobine podataka): • Polazeći od teorijske specifikacije, upoznati i prirodu podataka (ucrtati!) • Treba prvo obaviti ekonomske (logičke testove) - model ima svoju namenu! • Pri statističkim testovima, kriterijum je maksimiranje R2 i broja stepeni slobode,

sa uvođenjem novih regresora treba pratiti: t, F, 2R ( 2σ ) • Obaviti ekonometrijske testove - oni ukazuju na ispravnost specifikacije! • Testirati stabilnost ocena (posebno ako je cilj predvidjanje)

Testovi koeficijenata u EViews: • Intervali i elipse poverenja (uz datu verovatnoću) • Testovi ograničenja (Wald): da li važe pretpostavke o parametrima • Test izostavljenih regresora (koristeći odnos verodostojnosti) • Test suvišnih regresora (odnos verodostojnosti)

Po obavljenoj regresiji, u testovima koeficijenata, komandom View/Coefficient Tests otvaraju se četiri navedene opcije.

Page 12: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

11

Elipse poverenja daju intervale za svaka dva ocenjena regresiona koeficijenta (npr. za 4 parametra, u prvom redu 2 sa 1, u drugom 3 sa 1 i 3 sa 2, u trećem 4 sa 1, sa 2, sa 3, itd. Ako je nula unutar označene oblasti, ocenjeni koeficijent nije značajan.

Za Waldov test ograničenja treba uneti ograničenja (za više ograničenja, razdvojiti ih zapetama), recimo: c(1)=c(2), c(3)=1.5, itd. Test statistika je F (razlika koeficijenata determinacije bez i sa ograničenjem), ili hi-kvadrat statistika. Vrednost verovatnoće manja od određenog nivoa značajnosti vodi odbacivanju postavljene hipoteze. Recimo, u našem primeru hipoteza da je zbir C(1)+C(2)=0 odbacuje se.

U testu izostavljenih regresora, treba navesti imena izostavljenih regresora. U ranijem primeru, testirajući hipotezu da u model treba uključiti i dva nova faktora (stopu nezaposlenosti i udeo stanovništva ispod 18 godina), u testu izostavljenih varijabli: View/Coefficient Tests/Omitted Variables (NEZAP MLADJI) dobija se značajna F-statistika na nivou 3%, usled povećanja koeficijenta determinacije na 0,8015, a u novoj regresiji svi regresioni koeficijenti su značajni na nivou od 5%.

U testu suvišnih regresora, koji je relevantan kad se istovremeno testira izostavljenje više od jednog regresora (jer se značajnost svakog pojedinačno testira t-testom), takođe se navode F-statistika bazirana na sumama rezidualnih kvadrata i LR (likelihood ratio) za model sa i bez ograničenja. Nulta hipoteza se odbacuje za verovatnoću nižu od zadatog nivoa značajnosti.

PRIMER: Determinisanje stepena razvijenosti (GDP per capita) u tranziciji Za 17 zemalja u tranziciji (imena su navedena u EViews fajlu) modelira se nivo razvijenosti meren bruto domaćim proizvodom per capita (GDPpc). Postoji više faktora koji se mogu koristiti kao eksplanatorni, a jednačina od koje polazimo je:

Dependent Variable: GDPPC Method: Least Squares Sample: 1 17 Included observations: 17 (zemlje u tranziciji)

Variable Coefficient Std. Error t-Statistic Prob.

WAGE pros. zarada 9.983851 1.816158 5.497236 0.0002UNEMP stopa nezap. -156.4360 41.85188 -3.737849 0.0033DEBT % duga u GDP -27.17340 23.07263 -1.177733 0.2638OPEN (izv+uvoz)/GDP 40.25560 15.67921 2.567450 0.0262EUSIGN paraf. SSP 1141.189 1192.761 0.956762 0.3592C konstanta 4461.098 1812.057 2.461897 0.0316

R-squared 0.891941 Mean dependent var 10484.12Adjusted R-squared 0.842823 S.D. dependent var 4195.495S.E. of regression 1663.325 Akaike info criterion 17.94159Sum squared resid 30433146 Schwarz criterion 18.23566Log likelihood -146.5035 F-statistic 18.15927Durbin-Watson stat 2.005850 Prob(F-statistic) 0.000055

Page 13: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

12

Prikazaćemo kako se rezultat o nedovoljnoj značajnosti ocenjenih koeficijenata (označenih crveno) može potvrditi i drugim statističkim testovima. Pre svega, test ograničenja, odn. združene test hipoteze da su koeficijenti uz varijable DEBT i EUSIGN jednaki nuli, posle komande View/ Coefficient test/ Wald - Coefficient Restrictions: C(3)=C(5)=0 , daje rezultat:

Wald Test:

Test Statistic Value df Probability

F-statistic 0.949444 (2, 11) 0.4165Chi-square 1.898888 2 0.3870

Ovakav rezultat ne dozvoljava odbacivanje nulte hipoteze, dakle prihvata se da ti faktori nisu značajni za objašnjavanje GDPpc. Testom suvišnih varijabli: posle komande View/ Coefficient test/ Redundant Variables: DEBT, EUSIGN, dobijamo isti rezultat za F-odnos, a hi-kvadrat statistiku zamenjuje odnos verodostojnosti: Redundant Variables: DEBT EUSIGN

F-statistic 0.949444 Probability 0.416507Log likelihood ratio 2.707179 Probability 0.258311

Dakle, koristeći oba testa može se zaključiti da se nulta hipoteza o ograničenju na parametre (H0=b3=b5=0) ne može odbaciti, odn. da je sa uključivanjem ova dva regresora nedovoljno povećanje R2 , pa je superiorniji model bez njih: Dependent Variable: GDPPC Included observations: 17

Variable Coefficient Std. Error t-Statistic Prob.

WAGE 10.16657 1.672031 6.080372 0.0000UNEMP -146.7280 37.55758 -3.906748 0.0018OPEN 40.39158 13.52224 2.987049 0.0105

C 3512.586 1636.286 2.146682 0.0513

R-squared 0.873287 Mean dependent var 10484.12Adjusted R-squared 0.844046 S.D. dependent var 4195.495S.E. of regression 1656.844 Akaike info criterion 17.86554Sum squared resid 35686702 Schwarz criterion 18.06159Log likelihood -147.8571 F-statistic 29.86477Durbin-Watson stat 1.967065 Prob(F-statistic) 0.000004

Page 14: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

13

U novom modelu, sa isključenjem varijabli, manje su standardne greške za preostale ocenjene regresione parametre (uvođenje ograničenja dovodi do smanjenja varijansi ocena) i veći su t-odnosi. Koeficijent determinacije je vrlo malo smanjen sa isjključenjem dve varijable, ali broj stepeni slobode je povećan (sa 11 na 13), tako da je sada veći korigovani koeficijent determinacije, a niži su i koeficijenti informacionih kriterijuma AIC i SIC, što sve potvrđuje da je drugi model (po izostavljanju suvišnih regresora) bolji od prvog.

Test dodatnih regresora samo je suprotan testu ograničenja isključivanjem: View/ Coefficients Test/ Omitted variables: DEBT, EUSIGN daje rezultat: Omitted Variables: DEBT EUSIGN F-statistic 0.949444 Probability 0.416507Log likelihood ratio 2.707179 Probability 0.258311

Dakle, kad se krene od uže specifikacije (sa samo tri eksplanatorna faktora i konstantom), pa testira značajnosti uvođenja dva pomenuta regresora, zaključuje se da proširenje modela sa dodatne dve variajble nije statistički opravdano (nulta hipoteza o njihovim koeficijentima jednakim nuli ne može se odbaciti, jer doprinos koeficijentu determinacije nije značajan). Slično i kod pojedinačnog uvođenja.

EKONOMETRIJSKI PROBLEMI

Prema samoj definiciji, ocene ONK su linearne i egzostivne, jer su linearnih funkcije svih opservacija u uzorku, a lako se dokazuje i njihova nepristrasnost ako važe pretpostavke KLRM, kao i minimalna varijansa ocena. Otuda važi:

Teorema Gaussa i Markova: Pod pretpostavkama KLRM, ocene dobijene metodom najmanjih kvadrata su najbolje linearne nepristrasne ocene (NLNO) .

NEISPUNJENJE PRETPOSTAVKI O SLUČAJNOJ KOMPONENTI MODELA

1. Greška ui je slučajna promenljiva veličina: pretpostavka proističe iz same definicije ekonometrijske relacije. Ako su svi sistematski faktori specifikovani, dodaje se i slučajna komponenta, koja uključuje stohastičku sumu nevažnih varijabli i slučajnih grešaka merenja i odstupanja od zajedničke zavisnosti. Reziduali tada ne pokazuju sistematski raspored i mogu se tretirati uobičajenim statističkim tehnikama. Ali ako ova pretpostavka nije zadovoljena, testovi ne važe. BEZ TESTA

2. Nulta aritmetička sredina: za svaku opservaciju u proseku se potiru pozitivni i negativni uticaji (nema veće verovatnoće pojavljivanja pozitivnih ili negativnih). Ova pretpostavka je opravdana ako greška ne obuhvata i važne izostavljene uticaje. Ali ako je izostavljen važan regresor, naročito kad je korelisan sa uključenim - ocene će biti pristrasne. Za reziduale nulta srednja vrednost je ograničenje nametnuto prvom normalnom jednačinom. BEZ TESTA

3. Normalnost: pretpostavka potrebna kod ocenjenjivanja metodom maksimalne verodostojnosti i kod sprovođenja testova. Opravdana je kad je specifikacija tačna. U suštini znači da su zadovoljene dve pretpostavke: (1) male vrednosti greške (vrednosti bliske nuli, odn. srednjoj vrednosti) imaju veliku verovatnoću pojavljivanja, a velika odstupanja Y od ustaljene zavisnosti imaju malu verovatnoću javljanja; (2) simetrično

Page 15: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

14

su distribuirana odstupanja naviše i naniže od prosečne zavisnosti (oko nulte sredine). Kad je narušena ova pretpostavka, parametarski testovi neće biti tačni. POSTOJI TEST

4. Homoskedastičnost: konstantna konačna varijansa greške. Za sve opservacije podrazumeva se podjednako variranje grešaka oko (nulte) aritmetičke sredine. Ako za razne vrednosti nezavisnih varijabli greška varira različito (obično u heterogenim podacima uporednog preseka) - heteroskedastičnost. Ocene dobijene metodom ONK tada su nepristrasne, ali neefikasne. POSTOJE TESTOVI

5. Odsustvo autokorelacije: greške u raznim opservacijama su međusobno nezavisne (tekuća vrednost greške ne zavisi od svoje ranije vrednosti). Ako su zavisne, tada su ocene netačne (mada nepristrasne) i neefikasne. POSTOJE TESTOVI

6. Nezavisnost greške od regresora: pretpostavka je ispunjena ako su regresori fiksni, te stoga nezavisni od slučajne greške modela, ili kad su i regresori stohastički ali generisani drugačijim i nezavisnim slučajnim procesima. Neispunjenje ove pretpostavke daje pristrasne i nekonzistentne ocene dobijene metodom ONK. Međutim, reziduali su uvek nekorelisani sa regresorima (ograničenje normalnih jednačina), otuda: BEZ TESTA

DOPUNSKE PRETPOSTAVKE (ČIJE NEISPUNJENJE ZAHTEVA KOREKCIJE)

7. Specifikacija modela je tačna; u suprotnom, ocene regresionih parametara biće pristrasne (osim kod uključivanja nepotrebnih regresora - tada: multikolinearnost).

8. Regresori nisu međusobno perfektno linearno zavisni; u protivnom je nemoguće ocenjivanje. Visoka multikolinearnost daje neprecizne i nestabilne ocene i može voditi nedovoljnoj specifikaciji, kada je posledica pristrasno ocenjivanje

9. Regresori nisu stohastičke varijable i ne sadrže slučajne greške merenja; inače, mogu biti korelisani s greškom, što dovodi do pristrasnih ocena

10. Broj opservacija veći je od broja parametara modela (n > k), inače je nemoguće oceniti model metodom NK. Tada se pristupa svodjenju velikog broja regresora na manji broj linearnih kombinacija i primenjuje metod glavnih komponenata. EKONOMETRIJSKI TESTOVI - ANALIZA REZIDUALA

Ako model Yi = b1X1i+...+bkXki+ui, sa i=1,2...n opservacija i j=1,2,...k regresora

verno predstavlja relacije sistema, njegova stohastička komponenta ispunjava sve pretpostavke KLRM, a metodi ocenjivanja imaju svoja poželjna svojstva. Ali ako ne ispunjava - gube. Šta više, statistički testovi više nisu validni! Zato je obavezno uvek sprovesti i testove II reda, ekonometrijske. Ekonometrijski testovi podrazumevaju analizu reziduala, kao ocenjenih vrednosti pravih grešaka, da bi se ispitale pretpostavke KLRM. Pitanja na koja uvek treba odgovoriti:

Pod kojim uslovima dolazi do narušavanja pretpostavki KLRM? izvor

Koje su posledice neispunjenja pretpostavki? posledice

Kako se ispituje da li su narušene? test

Koji metodi tada daju ocene sa boljim svojstvima od ONK? korekcija

Page 16: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

15

Kako su u sam postupak ocenjivanja metodom ONK ugrađene osobine reziduala da im je u uzorku srednja vrednost nula i da su nezavisni od regresora, prva i peta pretpostavka KLRM o stohastičkom članu modela ne mogu se testirati. TEST NORMALNOSTI REZIDUALA Statistika testa je Jarque-Bera (nazvana prema autorima: Žark-Bera). Zasniva se na odstupanju koeficijenata asimetrije i spoljoštenosti od normalne distribucije (gde ovi koeficijenti iznose 0 i 3). Ako važi nulta hipoteza da je testirana distribucija normalna, ova statistika teži χ2 distribuciji sa 2 stepena slobode. U programu EViews izračunava se komandom: View/Residual Tests/Histogram-Normality. Visoka vrednost JB i verovatnoća rizika manja od zadate (npr: Probability ≤ 0.05) vodi odbacivanju nulte hipoteze o normalnosti. Recimo, uz dobijenu vrednost Prob=0,0411 nultu hipotezu o normalnoj distribuciji reziduala odbacujemo na nivou od 5% (ali je ne možemo odbaciti na nivou od 1%).

Treba voditi računa da je test nesiguran za male uzorke. Osim toga, reziduali ne odražavaju nužno distribuciju pravih grešaka, a i nisu svi međusobno nezavisni. Odstupanje reziduala od normalnosti upućuje na pogrešnu specifikaciju, pa je tada neophodno otkloniti greške specifikacije na način na koji su nastale. AUTOKORELACIJA - sreće se u radu sa vremenskim serijama

"Prava" autokorelacija je rezultat izostavljanja nepoznatih ili nevažnih autokorelisanih regresora, a "veštačka" je ona nastala pogrešnom specifikacijom modela - npr. pogrešnom funkcionalnom formom ili izostavljanjem važnog regresora koji je autokorelisan, pa i greška to postaje. Tada dolazi do međusobne zavisnosti grešaka raznih opservacija:

0)u(E)u(E)]u(Eu)][u(Eu[E)uu(Cov jijjiiji ≠=−−= pa je: tptp1t1t vu...uu +ρ+ρ= −−

Postoji dva glavna tipa autokorelacije: pozitivna, kad se znaci reziduala smenjuju u serijama, serija pozitivnih praćena serijom negativnih, (+,+,+,−,−,−, ...), i negativna kad dolazi do naizmeničnog smenjivanje znaka: ( +,−,+,−, +, −, + ...)

POZITIVNA AUTOKORELACIJA NEGATIVNA AUTOKORELACIJA

-20

-15

-10

-5

0

5

10

15

-25

-20

-15

-10

-5

0

5

10

15

20

Ako su reziduali raspoređeni bez sistematskog rasporeda - nema autokorelacije.

Page 17: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

16

Posledice autokorelacije: Pozitivna autokorelacija ima posledice: potcenjena varijansa greške i standardne

greške ocena; stoga pristrasnost naviše t-testova i R2; međutim, tada je neodgovarajuća t-distribucija i zato nekorektni statistički testovi.

I pored nepristrasnih ocena, ocene su neprecizne i neefikasne, a i pouzdanost im je prenaglašena, pa se veruje da je ocena značajna i kad nije.

Efikasnost ONK metoda zavisi od visine autokorelacije grešaka i od prirode nezavisnih varijabli. Na preciznosti ocena se često dobija sa uvećanjem broja opservacija. Ali obratiti pažnju kod vremenskih serija!

Visoka (naročito pozitivna) autokorelacija označava pogrešnu specifikaciju modela, bez obzira na visinu koeficijenta determinacije. Ocenama, a i statističkim testovima, ne može se verovati, jer su ocene neprecizne a testovi nepouzdani.

Kod uporednih podataka, test autokorelacije daje različite rezultate uz različite rasporede opservacija. Zato u cilju oktrivanja pogrešne specifikacije, pre testa autokorelacije opservacije treba poređati po redosledu nezavisne varijable.

TEST autokorelacije prvog reda: uobičajeni test je DW (Durbin - Watson) test

za test međusobne zavisnosti tekuće i prethodne vrednosti greške t1tt vuu +ρ= − , u testu hipoteze da nema autokorelacije H0: ρ=0 , koristi se

statistika testa, koja se obeležava sa d ili DW (koeficijent):

=

=−−

= T

1t

2t

T

2t

21tt

e

)ee(d

Distribucija i parametri distribucije za d zavise od konkretnih nezavisinih varijabli u uzorku, tako da ne postoje univerzalne tablice, ali svaka distribucija uvek leži u datim granicama (Durbin i Watson su tabelisali gornju i donju granicu); 0 ≤ d ≤ 4 .

d d d g

d

d d d g

2α α

4 -d d4 -d g0 4

Ako je d<2, test za pozitivnu autokorelaciju; H0 : ρ = 0 vs. H1 : ρ > 0. 1. Za d < dd, odbacujemo H0 o nepostojanju autokorelacije, postoji pozitivna A 2. Za d > dg, prihvatamo H0 o nezavisnosti grešaka. 3. Za dd ≤ d ≤ dg, test ostaje bez odluke (potrebno nam je više informacija).

Page 18: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

17

Ako je d>2, test za negativnu autokorelaciju; H0 : ρ = 0 vs. H1 : ρ < 0. 1. Za d > 4-dd, odbacujemo H0 o nepostojanju autokorelacije, postoji pozitivna 2. Za d <4- dg, prihvatamo H0 o nezavisnosti grešaka. 3. Za 4-dg ≤ d ≤ 4-dd , test ostaje bez odluke.

Ako je autokorelacija tipa: t1tt vuu +ρ= − , postoji asimptotska veza (za velike uzorke): )ˆ1(2d ρ−≈ , gde je ρ autokorelacioni koeficijent greške modela.

Ograničenja primeni DW testa: 1. Test važi samo uz pretpostavku da su regresori nestohastički (ne i za Yt−1!) 2. Samo za autokorelaciju PRVOG reda; za viši red - drugi testovi. 3. Model mora da sadrži konstantu (bar privremeno, dok se testira). 4. Interval bez odluke; može kao kritična oblast (ali onda povećava rizik α). Ali

bolje je odbaciti H0 češće nego α, nego prihvatiti ako je neistinito. 5. Osetljiv na susedne ekstreme (potire tendenciju poz. autkorel.) Vizuelni pregled! 6. Kad je indikator pogrešne funkcionalne forme, reziduale treba poređati po

rastućem redosledu X (umesto po vremenu).

Test autokorelacije višeg reda (EVIEWS): Breusch-Godfrey (LM) važi asimptotski, u velikim uzorcima: Pretpostavimo: tktk2t21t1t vu...uuu +ρ++ρ+ρ= −−− , dok greška vt ispunjava sve pretpostavke o stohastičnosti. Prednosti testa: viši red k, u modelu može biti i Yt-1, greške mogu biti distribuirane i po procesu pokretnih sredina. Mana: ne znamo k, red autokorelacije; ali npr. za kvartalne podatke pretpostavljamo k=4, mesečne 12.

Postupak: 1. Iz regresije modela formiramo seriju reziduala: et-1, et-2, ... et-k . Da se izbegne gubitak informacija (kod viših redova), prve et-k stavimo jednake nuli. 2. Regresujemo et na sve regresore modela, i et-1, et-2, ... et-k , dobijemo nR2. 3. 0...:H k210 =ρ=ρ=ρ (nema autokorelacije) preko 2

k2nR χ≈ [Ali k=?]

Otklanjanje posledica autkorelacije: kako je i nastala (specifikacijom) Po pravilu, pojava autokorelacije u radu s vremenskim serijama upućuje na grešku specifikacije izostavljanjem relevantnih regresora. To se nekad može korigovati uvođenjem autoregresivnog člana prvog reda Yt-1, dakle AR(1), ili višeg reda. Otklanjanje je moguće ocenjivanjem ρ i transformacijom svih varijabli: Yt − ρ Yt−1 .

HETEROSKEDASTIČNOST - sreće se u radu sa uporednim podacima

Pretpostavka: [ ] 22i

2iii )E(u)E(uuE)Var(u σ==−= , const. homoskedastičnost

Ali ako za razne opservacije (i) greška ima različite varijanse: 2ii )Var(u σ= , ta

pojava se zove heteroskedastičnost. Najčešće se javlja kod podataka strukture, kad varijansa greške raste uporedo sa vrednošću nezavisne varijable.

Page 19: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

18

potrošnja

dohodak

Uobičajeno je u ekonomiji da se javlja veće variranje u odnosu na prosečnu zavisnost za grupe ispitanika višeg dohotka nego nižeg. Na primer: ako se za sve domaćinstva oceni potrošnja kao linearna funkcija dohotka, uobičajeno je da domaćinstva sa nižim nivoom dohotka obeležava sličnije ponašanje u potrošnji (jer nemaju mogućnosti za štednju), tako da su reziduali manji, dok domaćinstva sa višim nivoom dohotka karakteriše veći varijabilitet u ponašanju, pa su reziduali sve većeg varijabiliteta (neki više štede, neki više troše - čak na račun ušteđevine, pa su veće razlike u ponašanju ).

Posledice heteroskedastičnosti: ocene parametara su nepristrasne, ali neefikasne; testovi nepouzdani. Prava varijansa se potcenjuje, interval poverenja je uži nego što treba. Takođe, t-testovi su pristrasni: izračunati t-odnosi su precenjeni, rizik α precenjen (skloni smo češćem odbacivanju H0 nego što treba). Ocenjeni model izgleda statistički značajniji nego što bi trebalo.

Testiranje heteroskedasičnosti

White-ov test: ei2 se regresuje na sve regresore u modelu, uključujući konstantu,

njihove kvadrate i međuproizvode. Iz te regresije 2m

2nR χ≈ , gde je m=broj regresora u toj regresiji (ili se značajnost R2 testira F-testom). U programu EViews postoji verzija sa i bez međuproizvoda regresora.

Otklanjanje posledica heteroskedastičnosti: u slučaju izostavljenih regresora koji oktlanjaju heteroskedastičnost, ispravljanje specifikacije. U protivnom, moguća je i transformacija celog modela, pri čemu način transformacije zavisi od tipa heteroskedastičnosti. Da bi se otklonila, potrebno je pri postojanju: )(22

ii Xfk=σ

transformaciju izvršiti deljenjem modela sa )X(f i (ponderisani NK = UNK).

UNK (METOD UOPŠTENIH NAJMANJIH KVADRATA) Kad kovarijantna matrica grešaka nije skalarna, već: Ω=′ 2)( σuuE ,

Ocena po metodu UNK YXXXb 111 ')'(~ −−− ΩΩ=

Page 20: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

19

svodi se na odgovarajuće transformacije u slučaju pojave autokorelacije ili heteroskedastičnosti, a zatim primenu metoda ONK na transformisani model. • U slučaju autokorelacije (ut = ρ ut-1 vt) sve varijable transformisati isto: tekuća

minus ρ puta prethodna vrednost, tako greška postaje neautokorelisana: ut − ρ ut-1 = vt, pa se može primeniti ONK na transformisani model.

• U slučaju heteroskedastičnosti ceo model se deli korenom varijanse, tako da nova greška postaje homoskedastična, a zatim se primenjuje ONK.

Ocene dobijene metodom UNK u praksi (sa ocenjenom kovarijantnom matricom Ω, odnosno primenjujući odgovarajuću transformaciju) po pravilu su efikasnije od ocena po metodu ONK, ali koliko povećanje efikasnosti će se postići zavisi od uspešnog ocenjivanja tipa i visine autokorelacionih koeficijenata (u slučaju autokorelacije), odnosno varijansi grešaka (u slučaju heteroskedastičnosti).

Ocenjivanje u programu EViews prilagođeno teorijskom metodu UNK

1. Ako nam je poznat tip heteroskedastičnosti − recimo da je varijansa greške funkcija od X2, tako da heteroskedastičnost nestaje deljenjem modela sa X, jer ponderi treba da budu recipročne vrednosti standardnih devijacija − odabraćemo kao seriju pondera: 1/X. Ocenjivanje metodom ponderisanih najmanjih kvadrata obavlja se na sledeći način. EViews prvo obavlja skaliranje (normalizaciju) serije pondera, što daje rezultate uporedivim sa ocenama po metodu ONK. Tada se obavlja regresija transformisanih varijabli i minimizira suma rezidualnih kvadrata s obzirom na vektor parametara. Treba koristiti komandu: Proc/Make Equation...Options/ pa odabrati Weighted LS/TLS, a u prazan prozor upisati koja serija služi za pondere (1/X) i kliknuti na OK da se oceni jednačina. Dobijaju se rezultati ocenjivanja za obe verzije, ponderisane i neponderisane NK. Ukoliko su ponderi dobro izabrani, u novim rezidualima ne bi trebalo više da postoji heteroskedastičnost.

2. Ako tip heteroskedastičnosti nije poznat, možda neće biti moguće da se dobiju efikasne ocene parametara korišćenjem ponderisanih najmanjih kvadrata. Kako su ocene metodom ONK konzistentne u prisustvu heteroskedastičnosti, ali su im standardne greške nekorektne, potrebno je korigovati ih da bi se mogli tačnije sprovoditi testovi značajnosti. To se postiže korišćenjem tehnike HAC (Heteroskedasticity and Autocorrelation Consistent Covariances), po otkrivanju da postoji autokorelacija ili heteroskedastičnost nepoznatog tipa. Korišćenjem opcije Heteroscedasticity consistent coefficient covariance ne dobijaju se ocene parametara različite od ONK, nego samo njihove ocenjene standardne greške.

Izborom dijaloga za regresiju, pa izborom Options, treba označiti polje označeno sa Heteroscedasticity Consistent Covariance i odabrati opciju White ili Newey-West. Ocene u slučaju opcije White dobijene su pod pretpostavkom da reziduali nisu autokorelisani, dok ocene metodom Newey-West daju konzistentne ocene kovarijansi u prisustvu i autokorelacije i heteroskedastičnosti.

Mogu se kombinovati metodi ocenjivanja za otklanjanje autokorelacije i heteroskedastičnsoti (npr. ponderisani kvadrati sa ocenama kovarijansi metodom White ili Newey-West).

Page 21: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

20

MULTIKOLINEARNOST

Multikolinearnost se javlja kad postoji više nezavisnih varijabli u modelu, kao linearna zavisnost među regresorima. Dovodi do nedostatka nezavisnih varijacija za precizno razdvajanje uticaja nezavisnih faktora na zavisnu varijablu.

Važne su dve napomene:

1) Multikolinearnost uvek postoji, testira se njena štetnost (ne postojanje kao A i H)

2) Ispituje se visina M u uzorku, a ne testira postojanje u populaciji

Postoje dve krajnosti :

1) Perfektna multikolinearnost, kad je R2=1 iz regresije jednog regresora na druge; tada je rang matrice X'X manji od reda k, odn.X'X=0 i matrica je singularna, pa se ne može dobiti inverzna ni YXXXb ')'(ˆ 1−= : oc. koeficijenti su nedeterminisani.

2) Odsustvo multikolinearnosti, svi regresori su međusobno nezavisni, i tada se ocene regresionih koeficijenata svode na ocene iz jednostavnih regresija.

U praksi, naravno, multikolinearnost je između ova dva ekstrema. Pitanje je samo: ne da li postoji (jer uvek postoji izvestan nivo), već da li je visoka - odn. štetna.

Posledice visoke multikolinearnosti ♦ Uz visoku multikolinearnost u modelu (međusobnu visoku korelaciju nezavisnih

varijabli) ocene dobijene metodom ONK ne postaju pristrasne, ali dobijaju visoke standardne greške, pa su velika variranja ocena. Visoke standardne greške ocena znači da su ocene neprecizne i nestabilne. Teško je razdvojiti individualne uticaje regresionih faktora i moguće je da se potpuno potceni uticaj nekog faktora (jer je t-odnos nizak), ili da regresioni koeficijent dobije suprotan znak.

♦ Ocene su visoko međusobno korelisane - kovarijanse su još više od varijansi. Potcenjivanje jednog uticaja vodi precenjivanju drugog.

♦ Ocene su podložne visokim promenama sa promenom uzorka (vrlo nestabilne i daju utisak promene strukture i kad to nije tačno).

♦ Zbog pristrasnosti u t-testovima, multikolinearnost može voditi nedovoljnoj specifikaciji izostavljanjem značajnih regresora, a posledica su pristrasne ocene.

Dva opažanja su važna:

* Isti nivo multikolinernoasti može imati različite posledice, u zavisnosti od toga da li je visok ili ne koeficijent determinacije regresije. Štetnija je pri niskom R2. * Perfektna korelacija između dve nezavisne varijable znači perfektnu multikolinearnost, ali obrnuto ne mora biti tačno. Zato je testiranje teško.

Testiranje multikolinearnosti otežano je činjenicom da kad ima više nezavisnih varijabli, među njima korelacioni koeficijenti mogu biti relativno niski, čak i kada je multikolinearnost visoka (čak perfektna). Treba meriti višestruku korelaciju.

VIF (Variance Inflation Factors) - Otkrivanje faktora "naduvavanja" varijansi. Koristi se inverz korelacione matrice R, čiji su dijagonalni elementi (1-Ri

2)-1, gde je Ri

2 koeficijent determinacije iz regresije Xi na ostale regresore. Visoki VIF

Page 22: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

21

(dijagonalni element) znači da je Ri2≈1 (kolinearnost). Za Ri

2>0,9 (VIF>10) zaključujemo da je multikolinearnost štetna. U EViews: centrirani VIF je 1/(1-R2).

Klajn (Klein): ocena štetne multikolinearnosti prema jednostavnom pravilu: Ona nezavisna varijabla koja pokaže veći nivo linearne zavisnosti sa ostalima nego što pokazuje zavisna (ako je Ri

2> R2) uzrok je štetne multikolinearnosti.

Pažnja: Efekti M su drukčiji pri visokim i niskim vrednostima R2 za celu regresiju. Iz

∑∑−= 2

22 1

yeR , kao i iz

kne

−= ∑ 2

2σ , vidi se da visoki R2 znači nisku 2σ , što može

neutralisati visoku multikolinearnost, odn. rast varijansi 12 )X'X()b(Var −σ= .

Metod glavnih komponenata - specijalni slučaj faktorske analize. Koristi se za otkrivanje i otklanjanje multikolinearnosti, ili u slučajevima kad postoji veći broj regresora u modelu nego jedinica opažanja. Sastoji se u formiranju linearnih kombinacija postojećih nezavisnih varijabli tako da obuhvate maksimum njihovih varijacija, ali pod uslovom međusobne nezavisnosti. Testovi reziduala u EViews:

• Korelogram (i korelogram kvadrata), za vremenske serije • Histogram - test normalnosti (Jarque-Bera) • Test autokorelacije (Breusch-Godfrey) • ARCH (autoregressive conditional heteroscedasticity) za vrem. serije • Heteroskedastičnost (White), sa i bez međuproizvoda

PRIMER: Otkrivanje pogrešne specifikacije analizom reziduala Za podatke 25 okruga u Srbiji, prosečna plata je iskazana kao (negativna) funkcija nezaposlenosti. Statistički kriterijumi su zadovoljeni, ali ekonometrijski nisu:

Dependent Variable: PLATA Method: Least Squares Sample: 1 25 Included observations: 25

Variable Coefficient Std. Error t-Statistic Prob.

NEZAP -140.7827 67.44589 -2.087343 0.0481C 17219.42 2391.037 7.201654 0.0000

R-squared 0.159265 Mean dependent var 12308.92Adjusted R-squared 0.122711 S.D. dependent var 2282.009S.E. of regression 2137.414 Akaike info criterion 18.24920Sum squared resid 1.05E+08 Schwarz criterion 18.34671Log likelihood -226.1150 F-statistic 4.356999Durbin-Watson stat 0.642495 Prob(F-statistic) 0.048129

Page 23: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

22

Statistički testovi značajnosti su zadovoljeni na nivou značajnosti od 5%. Testom normalnosti reziduala, dobija se niska JB statistika i ne može se odbaciti hipoteza o normalnoj distribuciji grešaka prema rasporedu reziduala:

0

1

2

3

4

5

6

-4000 -2000 0 2000 4000

Series: ResidualsSample 1 25Observations 25

Mean -2.26e-12Median 200.6298Maximum 3595.330Minimum -3713.376Std. Dev. 2092.411Skewness 0.065137Kurtosis 2.025655

Jarque-Bera 1.006584Probability 0.604537

Međutim, testom autokorelacije BG(2) odbacuje se hipoteza da nema autokorelacije

Breusch-Godfrey Serial Correlation LM Test:

F-statistic 9.507823 Prob. F(2,21) 0.001148

Obs*R-squared 11.88013 Prob. Chi-Square(2) 0.002632

Pozitivna autokorelacija se može uočiti i iz slike reziduala za opservacije (okruge) koji su poređani geografski, sa većim odstupanjima plate (od ustanovljene prosečne zavisnosti od stope nezaposlenosti, zelena linija) naviše za prvu, a naniže za drugu polovinu uzorka ("što južnije, to tužnije"):

-4000

-2000

0

2000

4000

8000

10000

12000

14000

16000

18000

2 4 6 8 10 12 14 16 18 20 22 24

Residual Actual Fitted

Međutim, da bi se u uporednim podacima sproveo test autokorelacije kao indikator pogrešne specifikacije, podaci se moraju poređati po rastućem redosledu nezavisne

Page 24: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

23

varijable (NEZAP=X). Tada se, uz sve statističke indikatore potpuno iste i u novoj regresiji, dobija samo drukčiji redosled (istih po visini) reziduala, ali sad uz sliku negativne autokorelacije:

-4000

-2000

0

2000

40008000

10000

12000

14000

16000

18000

2 4 6 8 10 12 14 16 18 20 22 24

Residual Actual Fitted

U testu autokorelacije Breusch-Godfrey (sa 2 docnje) F=3,89 (Prob.=0,036), odbacuje se H0 da nema autokorelacije, dakle zaključujemo da je specifikacija nedovoljna, a nizak je i R2, iako se u testu heteroskedastičnosti (White, sa i bez cross terms), zaključuje da nema heteroskedastičnosti. Očigledno je potrebno uvesti i druge faktore.

TEST MOĆI PREDVIĐANJA / STABILNOSTI OCENA

Iz: bXXYE ppp ')/( = , za zadate opservacije u periodu p: X'p=[1 Xp2 Xp3 ... Xpk ],

najbolje linearno nepristrasno predvidjanje za Yp je: b'XY pp =

kako je b'X)Y(E pp = , p1

p2

p X)X'X('X)Y(Var −σ= , jer

]'X)'bb)(bb('X[E pp −− , to je ]X)X'X('X,b'X[NY p1

p2

pp−σ≈ , pa je

INTERVAL POVERENJA za pY : ( ) p1

p2p XX'X'Xˆtb'X −α σ±

GREŠKA PROGNOZE pp YYd −= = pp u)bb(X +− ima varijansu

)u(Var)Y(VaruX)'bb)(bb('X)d(Var ppppp +=+−−= , jer im je

kovarijansa nula.

1. Test da Yp potiče iz iste populacije, preko H0: d = 0 , odn. pp YY = preko

statistike: ( ) kn

p1

p

pp tX)X'X'X1ˆ

YY*t −−

≈+σ

−= . Testira se statistička značajnost

Page 25: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

24

razlike između predviđene i ostvarene vrednosti Y. Za t* > tT (tablično) odbacuje se H0.

2. MOĆ PREDVIĐANJA - TEST STABILNOSTI ocena pri promeni (povećanju uzorka)

[slično dodatnim regresorima - ovde dodatne opservacije; pri postojanju više parova y i ŷ] model Y= Xb + u ocenimo prvo sa n1 opservacija, dobijemo ∑ 2

1e , a zatim sa

dodatnih n2 odn. n1+ n2=n opservacija i dobijemo ∑ 2e .

Rezidualne sume kvadrata iz ova dva ocenjivanja imaju nezavisne 22χσ distribucije, sa stepenima slobode: n1-k za prvi, a n1+n2-k za uvećani uzorak [njihova razlika je: n1+n2-k-(n1-k)= n2]

U testu hipoteze H0: b=b1 prema H1: b≠b1 ( )( )

2nk1n

121

221

2F

knenee*F −≈

−∑

∑ ∑−=

Ako je F*>FT, moć predviđanja modela je slaba.

Odbacivanje nulte hipoteze znak je promenjene strukture; strukturni parametri su dakle nestabilni i osetljivi na promene uzorka. Model može biti dobar unutar ocenjenog uzorka (za analize), ali ne i za predviđanje. Kad model nema stabilne parametre, ne može se uopštavati na osnovu modela.

(Chow-ov) TEST STRUKTURNIH PROMENA (PRELOMA FUNKCIJE) u prošlosti - ispitivanje postojanja prelomne tačke. Pretpostavka u kojoj tački dolazi do preloma funkcije (izbijanje rata, naftne krize, donošenje nekog zakona, promena režima, i sl.), utiče na podelu celog uzorka na dva poduzorka, veličine n1 i n2. Potrebno je obaviti

regresiju: prvo na celom uzorku, sa sumom rezidualnih kvadrata ∑ 2e i brojem stepeni slobode n1+n2–k, a zatim i na dva poduzorka, sa ukupnom sumom rezidualnih

kvadrata ∑ 21e + ∑ 2

2e i brojem stepeni slobode: n1+n2–2k. Pod pretpostavkom normalne distribucije grešaka i homoskedastičnosti, odnos dve sume rezidualnih kvadrata deljene brojem stepeni slobode ima F-distribuciju:

( )( )

kk2n2

221

22

21

2F

k2n)ee(keee*F −

∑ ∑

∑ ∑ ∑≈

−+−−

= u testu hipoteze da nema preloma, H0: b1= b2

TESTOVI SPECIFIKACIJE I STABILNOSTI U EVIEWS U ispitivanju da li je specifikacija modela odgovarajuća i da li su parametri modela stabilni kroz sve podskupove koršćenih podataka, u programu EViews se koriste sledeći testovi:

♦ Chow-ov test prognoze ♦ Chow-ov test prelomne tačke ♦ Ramsey-ev Reset Test ♦ Rekurzivne ocene

Page 26: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

25

Kako se konačni test valjanosti modela odnosi na njegovu moć predviđanja, preporučuje se obezbeđivanje skupa podataka za proveru valjanosti prognoze modelom, izvan uzorka za ocenjivanje. U prvom podskupu se bira specifikacija koja najbolje odgovara podacima, a zatim se model podrvrgava testiranju moći predviđanja, odnosno konstantnosti parametara, dakle stabilnosti i robusnosti modela i izvan uzorka. Kada se radi sa vremenskim serijama, poslednji podaci u nizu se koriste za testiranje, a kad se radi sa uporednim podacima, podaci se poređaju po rastućem redosledu neke nezavisne varijable (recimo po visini dohotka domaćinstva, ukupnog prihoda firme i sl.), pa se drugi (manji) podskup koristi za testiranje valjanosti modelom ocenjenih prognoza.

Chow (Čou-ov) test prognoze Ovaj test zahteva ocenjivanje dva modela - jednog na osnovu celog skupa od n podataka (n=n1+n2), a drugog na bazi dužeg potperioda n1. Statistički značajna razlika između dva modela dovodi u sumnju stabilnost ocenjene relacije u celom periodu. Statistika testa je zasnovana na sumama kvadratnih reziduala:

( ))kn/(e'e

n/e'ee'eF111

211−

−=

U malim uzorcima F-statistika ima F-distribuciju ako su greške normalne IID, tj. nezavisne i jednako distribuirane (IID: independent and identically distributed).

Da bi se primenio ovaj test, treba odabrati: View/Stability Tests/ Chow Forecast Test... i odrediti datum ili broj opservacije za početak perioda prognoziranja (drugog potperioda) koji je unutar ukupnog skupa opservacija. Rezultat će prikazati izračunati F-odnos i odnos verodostojnosti sa odgovarajućim verovatnoćama. Ako su te verovatnoće ispod izabranog rizika (α), odbacuje se nulta hipoteza da nema strukturne promene, odnosno da se modelom na osnovu prvog poduzorka dobro predviđa u celom periodu.

Čou-ov test prelomne tačke Unutar uzorka na koji se model odnosi, često se zna ili bar pretpostavlja u kojoj tački dolazi do preloma funkcije (izbijanje rata, naftne krize, donošenje nekog zakona, promena režima nekog instrumenta i sl.). Ako se unapred ne poznaje tačka verovatnog preloma funkcije, za test stabilnosti parametera modela koristi se obično na nekom zadatom nivou - posle 85% ili 90% opservacija za ocenjivanje prvobitnog uzorka, a ostatak uzorka se koristi za test. Ideja ovog testa je da se jednačina oceni odvojeno do i posle tačke preloma, da bi se videlo da li postoje značajne razlike u ocenjenim jednačinama. Ako razlika postoji, to znači da je došlo do strukturne promene u testiranoj tački preloma.

Test se sprovodi tako što se dakle ceo uzorak podeli na dva poduzorka (n1+n2=n). U svakom od njih treba da postoji više opservacija nego što je parametara za ocenjivanje u jednačini. Osnova testa je F-statistika, zasnovana na razlici sume kvadrata reziduala sa ograničenjem (ceo uzorak) i bez ograničenja (poduzorci):

[ ])k2n/()e'ee'e(k/)e'ee'e(e'eF

2211

2211−+

+−=

Page 27: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

26

Formula se može generalizovati i za više prelomnih tačaka. Ova statistika ima tačnu F-distribuciju u konačnim uzorcima ako su greške modela normalne, nezavisne i podjednako rapoređene (IID). U EViews treba izabrati na liniji jednačina (equation toolbar): View/Stability Tests/Chow Breakpoint Test... U prozoru dijaloga koja se pojavi treba ukucati datum ili brojeve opservacija za tačku preloma. Ramsey (Remsijev) RESET Test

RESET (REgression Specification Error Test) ovde znači: test greške specifikacije u regresiji. Greška specifikacije može podrazumevati odstupanje od pretpostavki ocenjivanog modela eXy +β= , uključujući sledeće greške:

• Izostavljene relevantne varijable • Nekorektna funkcionalna forma modela • Korelacija između regresora i greške (uzrokovana greškom merenja

regresora, simultanošću, ili istovremenim prisustvom zavisne varijable s docnjom i autokorelacije grešaka).

U bilo kom od ovih slučajeva, ocene metodom ONK će biti pristrasne i nekonzistentne, a uobičajene procedure zaključivanja biće nekorektne. Remsi1 je pokazao da se u svakom od tih slučajeva dobija nenulti vektor očekivane vrednosti grešaka. Stoga se u ovom testu postavljaju hipoteze:

Nulta: )I,0(Ne:H 20 σ≈ i alternativna )I,(Ne:H 2

1 σµ≈ . Test se zasniva na proširenoj regresiji: eZXy +γ+β= i testu ograničenja γ=0.

Naravno, osnovno je pitanje koje varijable treba da uđu u matricu dodatnih regresora Z. Ako se ta matrica sastoji od varijabli koje nisu u originalnoj specifikaciji, test se svodi na test izostavljenih varijabli. U testu neispravne funkcionalne forme, izostavljeni nelinearni deo regresionog modela može biti neka funkcija regresora. A mogu biti i stepeni ocenjene vrednosti same zavisne varijable ( sY , s=2, 3...), čime se testira multiplikativna forma modela. Tejlorov niz kojim se aproksimira takva relacija sadržao bi stepene i međuproizvode eksplanatornih varijabli. Remsi je zato sugerisao da se koriste stepeni ocenjene zavisne varijable koji su linearne kombinacije stepena i međuproizvoda eskplanatornih varijabli. Ocenjena vrednost zavisne varijable dignuta na prvi stepen ne koristi se, naravno, jer je kolinearna sa matricom X. Rezultat testa prikazuje F-statistiku i logaritam odnosa verodostojnosti u testu hipoteze da su koeficijenti svih tih dodatih varijabli jednaki nuli. Pokazano je da RESET test može da ustanovi pogrešnu specifikaciju čak i kad je ocenjena jednačina uprkos grešci specifikacije dala zadovoljavajuće rezultate u tradicionalnim testovima (visoke R2 i t-vrednosti, DW blisko dvojci).

Da bi se test primenio, treba izabrati: View/Stability Tests/Ramsey RESET Test... i odrediti broj novih članova koji se uključuju u regresiju. To su u stvari stepeni ocenjenih vrednosti zavisne varijable iz originalne regresije, počevši od kvadrata.

1 J.B. Ramsey, "Tests for Specification Errors in Classical Linear Least Squares Regression Analysis", Journal of the Royal Statistical Society, Series B, Vol. 31, 1969, pp. 350-371.

Page 28: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

27

Dakle, ako se odredi "1" (član), biće uključeno samo 2Y , a za "2" i 2Y i 3Y , itd. Ne treba uključiti mnogo članova, jer se može pojaviti singularitet matrice X'X, pošto su članovi visoko međusobno zavisni. Ovaj test se primenjuje samo za jednačine ocenjene metodom najmanjih kvadrata. REKURZIVNI NAJMANJI KVADRATI (TESTOVI STABILNOSTI I PRELOMA) Pri ocenjivanju rekurzivnim najmanjim kvadratima postavljena jednačina se ocenjuje počinjući sa prvih k opservacija, uz korišćenje sve većeg uzorka iz raspoloživog skupa podataka, svaki put dodajući po jednu (narednu) opservaciju. Taj postupak se ponavlja dok sve opservacije nisu iskorišćene. Na svakom koraku ocenjivanja, ocenjuje se očekivana vrednost zavisne varijable. Prognoza "jedan korak unapred" određuje rekurzivni rezidual kao razliku stvarne i predviđene vrednosti. Da se odrede rekurzivni reziduali, treba iz ocenjene jednačine u EViews odabrati: View/StabilityTests/Recursive Estimates (OLS only)... Postoji šest opcija za rekurzivne ocene: Rekurzivni reziduali Ovom opcijom se dobija slika reziduala oko nulte linije (njihove srednje vrednosti), uz prikazane granice plus i minus dve standardne greške za svaku tačku. Reziduali izvan ovih granica sugerišu nestabilnost parametara jednačine u datoj opservaciji. Za te tačke treba prelom funkcije proveriti Čou-ovim testom. Kusum (CUSUM) Test Ovaj test se zasniva na kumulativnoj sumi rekurzivnih reziduala (deljenih standardnom greškom svih reziduala), za koju se daje slika, zajedno sa graničnim linijama na nivou od 5% značajnosti. Ako vektor parametara ne ostaje konstantan tokom celog perioda, onda će i ucrtana linija težiti da odstupa od nulte linije srednje vrednosti, pa se odbacuje hipoteza o stabilnosti parametara ako je izračunata kumulativna suma izvan dve kritične granice. Kusum test kvadrata (CUSUMSQ) Slično, ovaj test je baziran na statistici koja stavlja u odnos sumu kvadriranih reziduala do date tačke (t) u uzorku (veličine T) sa ukupnom sumom kvadrata reziduala (za ceo uzorak, T). Očekivana vrednost te statistike raste od nule za t=k do jedinice za t=T (ukupan uzorak). Odstupanje izvan granica od 5% značajnosti sugeriše nestabilnost, bilo parametara bilo varijanse reziduala. Test prognoze korak unapred (One-Step Forecast Test)

U stvari, svaki rekurzivni rezidual je greška prognoze "korak unapred". Da bi se testiralo da li je vrednost zavisne varijable u narednoj opservaciji dobijena izvan strukture korišćene za ocenjivanje modela do te opservacije, svaka greška treba da se poredi sa varijacijom unutar uzorka, tj. sa standardnom devijacijom regresije (standardnom greškom). Stoga test prognoza korak unapred daje sliku rekurzivnih reziduala, uz odgovarajuće granice na 5% prema izračunatoj standardnoj grešci, a takođe (u donjem delu) i tačke u uzorku za koje bi hipoteza o konstantosti parametara bila odbačena sa verovatnoćom greške od 15% ili manje (leva osa).

Page 29: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

28

Test prognoze N koraka unapred (N-Step Forecast Test) Ovim testom se koristi rekurzivno ocenjivanje da se sprovede niz Čouovih testova prognoze. Dakle, bez definisanja perioda prognoze unapred, automatski se ocenjuje valjanost prognoze za sve moguće dužine tog perioda, polazeći od najmanje veličine uzorka koja je dopustiva i vršeći prognoze, redom dodajući po jednu novu opservaciju. Crtež koji sledi iz testa daje rekurzivne reziduale u gornjem delu, a značajne verovatnoće (bazirane na F-statistici) u donjem delu crteža. Ocene rekurzivnih koeficijenata Da bi se dobili rekurzivni koeficijenti, treba izabrati opciju Recursive Coefficients. Kretanje ocena regresionih koeficijenata se predstavlja sa sve više opservacija uključenih u uzorak za ocenjivanje. Crtežom se posebno predstavljaju pojedinačni koeficijenti u jednačini za sve rekurzivne jednačine, uz granični pojas od dve standardne greške. Ako ocenjeni koeficijenti pokažu značajne varijacije pri dodavanju novih opservacija, to je indikacija njihove nestabilnosti. U slučaju strukturnog preloma, ovi crteži pokazuju dramatična odstupanja koeficijenata od prethodnog nivoa i promenu smera njihovog kretanja pri dodavanju opservacija. PRIMER - Model determinisanja prosečne plate po okruzima u Srbiji Ako koristimo ocenjeni model za okruge sa najboljim performansama (statistički i ekonometrijski kriterijumi, značajnost na nivou 5%, nema A ni H, mada JB vodi odbacivanju normalnosti na 10%):

Plata = 8740,6 + 0,036 NDpc − 86,454 Nezap − 570,324 Nepis + 324, 629 Mladji t: (3,32) (3.28) (-2,21) (-4,08) (2,49) n−k = 20, R2= 0,802 JB=4,77 DW=2,14 BGF=0,85 WF=0,99

Dopunskim testom rekurzivnih reziduala primetićemo da postoji izraziti ekstrem: okrug br. 18 (inspekcijom spiska vidimo da je to Moravički, gl. grad Čačak). Tu je prosečna plata značajno niža nego što bi se prema načinu formiranja uobičajenom za sve okruge moglo predvideti:

-3000

-2000

-1000

0

1000

2000

3000

6 8 10 12 14 16 18 20 22 24

Recursive Residuals ± 2 S.E.

Page 30: Ekonometrija 1D - Uvodni deo

Ekonomski fakultet - Ekonometrija 1 D - Beleške s predavanja - prof. Milena Jovičić

29

To je evidentno i već iz same slike reziduala modela, odn. iz tabele vrednosti: Actual, Fitted, Rezidual (table and plot). Trebalo bi ispitati razloge, a u nedostatku drugih numeričkih faktora eventualno uvesti veštačku varijablu (VV) za ovu jedinicu posmatranja (VV=1 za Moravički okrug, VV=0 za ostale). Tretiranje ovog okruga posebnom veštačkom varijablom kojom se predstavlja specifičnost ovog okruga neobuhvaćena drugim varijablama popravlja rezultate. Koeficijent uz veštačku varijablu je značajan, koeficijent determinacije raste na 0,875, značajnost ocena je povećana, a statistika JB=0,57 pokazuje normalnu distribuciju grešaka. Kad se ustanovi da je u posmatranom uzorku došlo do strukturne promene, dakle da je pogrešna početna specifikacija modela koja pretpostavlja konstantnost parametara, korekcija u formulaciji modela zahtevala bi da se ta nestabilnost otkloni. To se može učiniti bilo uvođenjem odgovarajućih veštačkih (ili drugih egzogenih) varijabli, bilo uvođenjem novih jednačina - dakle prelaskom na model simultanih jednačina.