Upload
clea
View
29
Download
2
Embed Size (px)
DESCRIPTION
Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober 2004. Dagens program. Mere om funktionel form (kap 6.2) Log transformation Kvadratisk form Interaktionseffekter Goodness of fit (kap. 6.3) Prediktioner (kap 6.4) Kvalitative variable (kap 7.1). Funktionel form. - PowerPoint PPT Presentation
Citation preview
Økonometri 1: Inferens i den lineære regressionsmodel
1
Økonometri 1
FunktioneI form i den lineære regressionsmodel
19. oktober 2004
Økonometri 1: Inferens i den lineære regressionsmodel
2
Dagens program
Mere om funktionel form (kap 6.2) Log transformation Kvadratisk form Interaktionseffekter
Goodness of fit (kap. 6.3) Prediktioner (kap 6.4) Kvalitative variable (kap 7.1)
Økonometri 1: Inferens i den lineære regressionsmodel
3
Funktionel form
MLR forudsætter, at modellen er lineær i parametrene. Men ikke i variablerne. Funktionel form: Fortolkningsmæssige konsekvenser! Tre vigtige tilfælde:
Log-transformation Kvadratiske led Interaktionsled
Brugen af log-transformation: Absolutte ændringer i log-transformeret variabel svarer til relative ændringer i den originale variabel.
Økonometri 1: Inferens i den lineære regressionsmodel
4
Funktionel form: Log-transformation
Økonomisk teori ofte udtrykt i afkast-størrelser (% pr. år): BNP vækstrate: Relativ tilvækst i realt BNP fluktuerer
nogenlunde konstant omkring et niveau på ca. 2 % pr. år over længere perioder: Tidsrækkemodeller
Egenkapitalforrentning (”return on equity”, Ex. 2.3, 2.6, 2.8): Store virksomheder har (gennemgående) store overskud (målt i kr.),
små virksomheder har (gennemgående) små overskud. Mere relevant: Overskud i forhold til størrelsen af den indskudte
kapital, en relativ størrelse.
Variansen på en størrelse kan afhænge af niveauet: Relativ varians er mere stabil (RoE ex).
Økonometri 1: Inferens i den lineære regressionsmodel
5
Funktionel form: Log-transformation (fortsat)
Model Afhængig variabel
Forklarende
variabel
Hæld-
ning
Elasti-
citet
Lineær y x 1 1x/y
Log-lin Log(y) x 1y 1x
Lin-log y Log(x) 1/x 1/y
Log-lineær Log(y) Log(x) 1y/x 1
/
/
y x
y x
y
x
Økonometri 1: Inferens i den lineære regressionsmodel
6
Funktionel form: Kvadratiske led
Aftagende eller stigende marginaludbytte/-effekt: Fx kvadratisk Engelkurve: Andelen til mad aftagende, men ”flader ud”.
Multipel regressionsmodel: Men ”alt andet lige” betragtning med omtanke.
Effekt af ændring af afhænger af udgangsværdien af Evalueres ved ”relevant” værdi, fx . Extrapolation…!
20 1 1 2 1i i i iy x x u
21 1 2 1
1 2 11 1
ˆ ˆ( ) ˆ ˆ2x xy
xx x
1x 1x
1x
Økonometri 1: Inferens i den lineære regressionsmodel
7
Funktionel form: Interaktionsled
Marginal effekt af at ændre værdien af en forklarende variabel, , afhænger af værdien af fx : Fx kan afkastet af erfaring variere med uddannelse:
Igen: Multipel regressionsmodel: Men ”alt andet lige” betragtning med omtanke.
Evalueringspunktet vælges med omhu.
1x 2x
0 1 1 2 2 3 1 2i i i i i iy x x x x u
1 1 2 2 3 1 2
2 3 12 2
ˆ ˆ ˆ( ) ˆ ˆx x x xyx
x x
Økonometri 1: Inferens i den lineære regressionsmodel
8
Goodness-of-fit
er et mål for modellens forklaringsgrad. Øges når der tilføjes variabler til modellen (med mindre
de er perfekt kollineære med eksisterende regressorer). Uegnet til modelvalg. Høj er ikke nødvendig for en
brugbar model. Korrigeret , betegnet , ”straffer” for at selvom
større modeller tilpasser data bedre, sker dette ved hjælp af flere forklarende variabler.
Tæller og nævner korrigeres for frihedsgrader ><
2R
2R
2R 2R
2 /( 1)1
/( 1)
SSR n kR
SST n
2R
Økonometri 1: Inferens i den lineære regressionsmodel
9
Goodness-of-fit (fortsat)
Hvis en variabel tilføjes til modellen vil øges hvis og kun hvis variablen har en t-værdi, der (numerisk) overstiger 1.
Svarer til at lave et to-sidet signifikanstest med et signifikansniveau over 30 %!
bruges i nogle tilfælde til at sammenligne ”ikke-nestede” modeller, hvor den ene model er ikke et specialtilfælde af den anden.
Men begrænsninger: Samme venstre-side variabel (samme funktionel form).
2R
2R
Økonometri 1: Inferens i den lineære regressionsmodel
10
Goodness-of-fit (fortsat)
Hvor mange variabler skal med i modellen? Overvej hvilke variabler der fortolkningsmæssigt giver mening. Ofte flere praktiske mål for samme teoretiske størrelse:
Problematisk at inkludere flere mål og så lave ”alt-andet-lige” betragtning.
Høj korrelation mellem forklarende variabler giver multikollinearitetsproblem: Svært at skelne effekterne af de enkelte variabler fra hinanden.
Har man mulighed for at tilføje variabler, der er ukorrelerede med de allerede inkluderede, vil det entydigt nedbringe residualvariansen og give mere præcise estimater.
Økonometri 1: Inferens i den lineære regressionsmodel
11
Prediktioner (forudsigelser)
Punktprediktion fra MLR: Tilpassede værdi:
MLR.3: For givne værdier af et estimat af:
er en estimator af den sande (men ukendte) middelværdi. For givne værdier af har prediktionen en standardfejl, der er afledt af standardfejlene på OLS estimaterne .
0 1 1 2 2ˆ ˆ ˆ ˆ( | ) ... k kE y x x x x
0 1 1 2 2ˆ ˆ ˆ ˆˆ ... k ky x x x
1 2, ,..., kx x x
y
1 2, ,..., kx x x
0 1ˆ ˆ ˆ, ,..., k
Økonometri 1: Inferens i den lineære regressionsmodel
12
Prediktioner (forudsigelser)
Udregning af standardfejl på prediktionen: Metoden beskrevet i Wooldrigde (side 203) Vha. covariansmatricen (prediktionen er en lineære
kombination af parametreestimaterne Kan vises at standardfejlen på prediktionen er mindst når
sættes lig deres gennemsnit.1 2, ,..., kx x x
Økonometri 1: Inferens i den lineære regressionsmodel
13
Prediktioner (forudsigelser) (fortsat)
Ofte af interesse at konstruere et konfidensinterval for en tænkt enhed (husholdning, virksomhed, …) med nogle givne karakteristika:
Må også tage højde for variansen af fejlleddet, Prediktionsfejlen er:
OLS er middelret og så
y
0u
0 0 01 2, ,..., kx x x
0 0 0 0 00 0 0 1 1 2 2 0
0 0 00 0 1 1 1
ˆ ˆ ˆ...
ˆ ˆ ˆ ( ) ( ) ... ( )
k k
k k k
e y y x x x u y
x x u
0( | ) 0E u X 0ˆ( | ) 0E e X
Økonometri 1: Inferens i den lineære regressionsmodel
14
Prediktioner (forudsigelser) (fortsat)
Prediktionsfejlsvariansen: ukorreleret med så variansen splitter op i to komponenter:
Vil ofte være domineret af leddet (især for store n) Prediktion af afledte variabler: Fx Y når vi modellerer
y=log(Y). Husk at generelt med mindre f( ) er lineær.
For log-transformation:
0u 0y
0 0 20 0
ˆ ˆ ˆ( ) ( ) ( ) ( )Var e Var y Var u Var y
2
( ( )) ( ( ))E f y f E y
2ˆ exp( ˆ / 2)exp(log )y y
Økonometri 1: Inferens i den lineære regressionsmodel
15
Kvalitative variabler som forklarende variabler i en lineær regressionsmodel
Wooldridge afsnit 7.1-7.4 Kvalitative variabler generelt Dummy variable for kvalitative variable med to
kategorier Dummy variable for kvalitative variable med flere
end to kategorier Interaktionsled med dummy variable
Økonometri 1: Inferens i den lineære regressionsmodel
16
Kvalitative variabler
Indtil nu har vi (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst)
.. Men hvad med kvalitative variabler? Kvalitative variabler:
Diskrete variabler Eksempler:
Køn Kommune Sektor Arbejdstid (ikke arbejde, halvtid, fuld tid) Helbred (dårligt, middel, godt)
Økonometri 1: Inferens i den lineære regressionsmodel
17
Kvalitative variabler
I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal
Eksempler: arbejdstid og helbred
Økonometri 1: Inferens i den lineære regressionsmodel
18
Kvalitative variabler med to kategorier For kvalitative variabler med to kategorier laves ofte
en dummy variabel Dummy variabler
Diskret variabel Antager kun værdien 0 og 1. Normalt antages værdien 1,
når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0
Dummy variable benyttes meget i regressionsmodeller Kategorien hvor Dummy = 0 kaldes reference-kategorien Dummy variable kaldes også for indikator variable og
binære variable
Økonometri 1: Inferens i den lineære regressionsmodel
19
Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple
regressionsmodel som alm. forklarende variable Eks: lønrelationen
hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med samme
uddannelse og erfaring) og når antagelse MLR. 3 er opfyldt
0 1 2 3log i i i i itimelon udd erfaring kvinde
3(log( ) | , , 1) (log( ) | , , 0)i iE timelon udd erfaring kvinde E timelon udd erfaring kvinde
Økonometri 1: Inferens i den lineære regressionsmodel
20
Kvalitative variabler med to kategorier Fortolkning af parameteren til dummy variablen:
Parameteren til dummy variablen måler forskellen mellem de to kategorier
Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet
..men afkast af de øvrige forklarende variabler er de sammen for de to grupper
Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)
Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)
Vil man have den eksakte procentuelle forskel skal følgende formel anvendes
100*[exp( ) 1]
Økonometri 1: Inferens i den lineære regressionsmodel
21
Kvalitative variabler med to kategorier
Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy
for mand? Man kan blot omparametrisere så får man den
samme model (Husk ) Begge variable kan ikke inkluderes (hvis der også
er et konstantled i modellen) -> Perfekt multikollinaritet
1i imand kvinde
Økonometri 1: Inferens i den lineære regressionsmodel
22
Evaluering af programmer
Et meget vigtigt eksempel på dummy variabler er ”program evaluation”
Eks: Effekten af jobtræningskurser Simpelt tilfælde: to grupper
”Treatment” (forsøgs-) gruppen: dem som deltager i programmet
”control” (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for ”treatment”
gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen
(pga. den måde økonomiske data fremkommer)
Økonometri 1: Inferens i den lineære regressionsmodel
23
Næste gang:
Husk næste forelæsning er TORSDAG d 21/10 kl. 8-10 i Ho10
Mere om kvalitative variable (kap 7) Husk eksamenstilmelding