23
Økonometri 1: Inferens i den lineære regressionsmodel 1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 2004

Økonometri 1

  • Upload
    clea

  • View
    29

  • Download
    2

Embed Size (px)

DESCRIPTION

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober 2004. Dagens program. Mere om funktionel form (kap 6.2) Log transformation Kvadratisk form Interaktionseffekter Goodness of fit (kap. 6.3) Prediktioner (kap 6.4) Kvalitative variable (kap 7.1). Funktionel form. - PowerPoint PPT Presentation

Citation preview

Page 1: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

1

Økonometri 1

FunktioneI form i den lineære regressionsmodel

19. oktober 2004

Page 2: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

2

Dagens program

Mere om funktionel form (kap 6.2) Log transformation Kvadratisk form Interaktionseffekter

Goodness of fit (kap. 6.3) Prediktioner (kap 6.4) Kvalitative variable (kap 7.1)

Page 3: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

3

Funktionel form

MLR forudsætter, at modellen er lineær i parametrene. Men ikke i variablerne. Funktionel form: Fortolkningsmæssige konsekvenser! Tre vigtige tilfælde:

Log-transformation Kvadratiske led Interaktionsled

Brugen af log-transformation: Absolutte ændringer i log-transformeret variabel svarer til relative ændringer i den originale variabel.

Page 4: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

4

Funktionel form: Log-transformation

Økonomisk teori ofte udtrykt i afkast-størrelser (% pr. år): BNP vækstrate: Relativ tilvækst i realt BNP fluktuerer

nogenlunde konstant omkring et niveau på ca. 2 % pr. år over længere perioder: Tidsrækkemodeller

Egenkapitalforrentning (”return on equity”, Ex. 2.3, 2.6, 2.8): Store virksomheder har (gennemgående) store overskud (målt i kr.),

små virksomheder har (gennemgående) små overskud. Mere relevant: Overskud i forhold til størrelsen af den indskudte

kapital, en relativ størrelse.

Variansen på en størrelse kan afhænge af niveauet: Relativ varians er mere stabil (RoE ex).

Page 5: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

5

Funktionel form: Log-transformation (fortsat)

Model Afhængig variabel

Forklarende

variabel

Hæld-

ning

Elasti-

citet

Lineær y x 1 1x/y

Log-lin Log(y) x 1y 1x

Lin-log y Log(x) 1/x 1/y

Log-lineær Log(y) Log(x) 1y/x 1

/

/

y x

y x

y

x

Page 6: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

6

Funktionel form: Kvadratiske led

Aftagende eller stigende marginaludbytte/-effekt: Fx kvadratisk Engelkurve: Andelen til mad aftagende, men ”flader ud”.

Multipel regressionsmodel: Men ”alt andet lige” betragtning med omtanke.

Effekt af ændring af afhænger af udgangsværdien af Evalueres ved ”relevant” værdi, fx . Extrapolation…!

20 1 1 2 1i i i iy x x u

21 1 2 1

1 2 11 1

ˆ ˆ( ) ˆ ˆ2x xy

xx x

1x 1x

1x

Page 7: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

7

Funktionel form: Interaktionsled

Marginal effekt af at ændre værdien af en forklarende variabel, , afhænger af værdien af fx : Fx kan afkastet af erfaring variere med uddannelse:

Igen: Multipel regressionsmodel: Men ”alt andet lige” betragtning med omtanke.

Evalueringspunktet vælges med omhu.

1x 2x

0 1 1 2 2 3 1 2i i i i i iy x x x x u

1 1 2 2 3 1 2

2 3 12 2

ˆ ˆ ˆ( ) ˆ ˆx x x xyx

x x

Page 8: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

8

Goodness-of-fit

er et mål for modellens forklaringsgrad. Øges når der tilføjes variabler til modellen (med mindre

de er perfekt kollineære med eksisterende regressorer). Uegnet til modelvalg. Høj er ikke nødvendig for en

brugbar model. Korrigeret , betegnet , ”straffer” for at selvom

større modeller tilpasser data bedre, sker dette ved hjælp af flere forklarende variabler.

Tæller og nævner korrigeres for frihedsgrader ><

2R

2R

2R 2R

2 /( 1)1

/( 1)

SSR n kR

SST n

2R

Page 9: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

9

Goodness-of-fit (fortsat)

Hvis en variabel tilføjes til modellen vil øges hvis og kun hvis variablen har en t-værdi, der (numerisk) overstiger 1.

Svarer til at lave et to-sidet signifikanstest med et signifikansniveau over 30 %!

bruges i nogle tilfælde til at sammenligne ”ikke-nestede” modeller, hvor den ene model er ikke et specialtilfælde af den anden.

Men begrænsninger: Samme venstre-side variabel (samme funktionel form).

2R

2R

Page 10: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

10

Goodness-of-fit (fortsat)

Hvor mange variabler skal med i modellen? Overvej hvilke variabler der fortolkningsmæssigt giver mening. Ofte flere praktiske mål for samme teoretiske størrelse:

Problematisk at inkludere flere mål og så lave ”alt-andet-lige” betragtning.

Høj korrelation mellem forklarende variabler giver multikollinearitetsproblem: Svært at skelne effekterne af de enkelte variabler fra hinanden.

Har man mulighed for at tilføje variabler, der er ukorrelerede med de allerede inkluderede, vil det entydigt nedbringe residualvariansen og give mere præcise estimater.

Page 11: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

11

Prediktioner (forudsigelser)

Punktprediktion fra MLR: Tilpassede værdi:

MLR.3: For givne værdier af et estimat af:

er en estimator af den sande (men ukendte) middelværdi. For givne værdier af har prediktionen en standardfejl, der er afledt af standardfejlene på OLS estimaterne .

0 1 1 2 2ˆ ˆ ˆ ˆ( | ) ... k kE y x x x x

0 1 1 2 2ˆ ˆ ˆ ˆˆ ... k ky x x x

1 2, ,..., kx x x

y

1 2, ,..., kx x x

0 1ˆ ˆ ˆ, ,..., k

Page 12: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

12

Prediktioner (forudsigelser)

Udregning af standardfejl på prediktionen: Metoden beskrevet i Wooldrigde (side 203) Vha. covariansmatricen (prediktionen er en lineære

kombination af parametreestimaterne Kan vises at standardfejlen på prediktionen er mindst når

sættes lig deres gennemsnit.1 2, ,..., kx x x

Page 13: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

13

Prediktioner (forudsigelser) (fortsat)

Ofte af interesse at konstruere et konfidensinterval for en tænkt enhed (husholdning, virksomhed, …) med nogle givne karakteristika:

Må også tage højde for variansen af fejlleddet, Prediktionsfejlen er:

OLS er middelret og så

y

0u

0 0 01 2, ,..., kx x x

0 0 0 0 00 0 0 1 1 2 2 0

0 0 00 0 1 1 1

ˆ ˆ ˆ...

ˆ ˆ ˆ ( ) ( ) ... ( )

k k

k k k

e y y x x x u y

x x u

0( | ) 0E u X 0ˆ( | ) 0E e X

Page 14: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

14

Prediktioner (forudsigelser) (fortsat)

Prediktionsfejlsvariansen: ukorreleret med så variansen splitter op i to komponenter:

Vil ofte være domineret af leddet (især for store n) Prediktion af afledte variabler: Fx Y når vi modellerer

y=log(Y). Husk at generelt med mindre f( ) er lineær.

For log-transformation:

0u 0y

0 0 20 0

ˆ ˆ ˆ( ) ( ) ( ) ( )Var e Var y Var u Var y

2

( ( )) ( ( ))E f y f E y

2ˆ exp( ˆ / 2)exp(log )y y

Page 15: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

15

Kvalitative variabler som forklarende variabler i en lineær regressionsmodel

Wooldridge afsnit 7.1-7.4 Kvalitative variabler generelt Dummy variable for kvalitative variable med to

kategorier Dummy variable for kvalitative variable med flere

end to kategorier Interaktionsled med dummy variable

Page 16: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

16

Kvalitative variabler

Indtil nu har vi (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst)

.. Men hvad med kvalitative variabler? Kvalitative variabler:

Diskrete variabler Eksempler:

Køn Kommune Sektor Arbejdstid (ikke arbejde, halvtid, fuld tid) Helbred (dårligt, middel, godt)

Page 17: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

17

Kvalitative variabler

I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal

Eksempler: arbejdstid og helbred

Page 18: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

18

Kvalitative variabler med to kategorier For kvalitative variabler med to kategorier laves ofte

en dummy variabel Dummy variabler

Diskret variabel Antager kun værdien 0 og 1. Normalt antages værdien 1,

når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0

Dummy variable benyttes meget i regressionsmodeller Kategorien hvor Dummy = 0 kaldes reference-kategorien Dummy variable kaldes også for indikator variable og

binære variable

Page 19: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

19

Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple

regressionsmodel som alm. forklarende variable Eks: lønrelationen

hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med samme

uddannelse og erfaring) og når antagelse MLR. 3 er opfyldt

0 1 2 3log i i i i itimelon udd erfaring kvinde

3(log( ) | , , 1) (log( ) | , , 0)i iE timelon udd erfaring kvinde E timelon udd erfaring kvinde

Page 20: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

20

Kvalitative variabler med to kategorier Fortolkning af parameteren til dummy variablen:

Parameteren til dummy variablen måler forskellen mellem de to kategorier

Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet

..men afkast af de øvrige forklarende variabler er de sammen for de to grupper

Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)

Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)

Vil man have den eksakte procentuelle forskel skal følgende formel anvendes

100*[exp( ) 1]

Page 21: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

21

Kvalitative variabler med to kategorier

Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy

for mand? Man kan blot omparametrisere så får man den

samme model (Husk ) Begge variable kan ikke inkluderes (hvis der også

er et konstantled i modellen) -> Perfekt multikollinaritet

1i imand kvinde

Page 22: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

22

Evaluering af programmer

Et meget vigtigt eksempel på dummy variabler er ”program evaluation”

Eks: Effekten af jobtræningskurser Simpelt tilfælde: to grupper

”Treatment” (forsøgs-) gruppen: dem som deltager i programmet

”control” (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for ”treatment”

gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen

(pga. den måde økonomiske data fremkommer)

Page 23: Økonometri 1

Økonometri 1: Inferens i den lineære regressionsmodel

23

Næste gang:

Husk næste forelæsning er TORSDAG d 21/10 kl. 8-10 i Ho10

Mere om kvalitative variable (kap 7) Husk eksamenstilmelding