60
1 Samlede eksamensnoter Indhold 10 Basic linear unobserved effects................................................................................................................. 5 10.1 Random effects ................................................................................................................................. 5 10.1.1 Test for unobserved effects .......................................................................................................... 6 10.2 Fixed effects ..................................................................................................................................... 6 10.2.1 Inferens ......................................................................................................................................... 7 10.3 FD metoder ....................................................................................................................................... 8 10.3.1 Inferens ......................................................................................................................................... 8 10.4 Sammenligning ................................................................................................................................. 9 10.4.1 FE vs. FD ...................................................................................................................................... 9 10.4.2 FE og RE quasi time-demeaning ............................................................................................... 9 10.4.3 Hausman: sammenligning af RE og FE ....................................................................................... 9 11 More topics in linear unobserved effects ................................................................................................ 10 11.1 Oversigt .......................................................................................................................................... 10 11.2 Sekventiel eksogenitet .................................................................................................................... 11 11.2.1 Instrumentering .......................................................................................................................... 11 11.2.2 Contemporaneous korrelation mellem en x og u ........................................................................ 12 11.3 Individual slopes ............................................................................................................................. 13 11.4 GMM tilgang .................................................................................................................................. 13 11.5 Chamberlain’s tilgang..................................................................................................................... 13 11.6 Specielle ......................................................................................................................................... 14 11.6.1 Hausman-Taylor ......................................................................................................................... 14 12 M-estimation ........................................................................................................................................... 15 12.1 Setup ............................................................................................................................................... 15 12.2 2-trins estimation ............................................................................................................................ 16 12.3 Konsistens og asymptotisk normalitet ............................................................................................ 16 12.4 Varians-estimation .......................................................................................................................... 16 12.4.1 Uden nuisance ............................................................................................................................ 16 12.4.2 Var-est med nuisance.................................................................................................................. 17

Samlede eksamensnoter

Embed Size (px)

Citation preview

Page 1: Samlede eksamensnoter

1

Samlede eksamensnoter

Indhold 10 Basic linear unobserved effects ................................................................................................................. 5

10.1 Random effects ................................................................................................................................. 5

10.1.1 Test for unobserved effects .......................................................................................................... 6

10.2 Fixed effects ..................................................................................................................................... 6

10.2.1 Inferens ......................................................................................................................................... 7

10.3 FD metoder ....................................................................................................................................... 8

10.3.1 Inferens ......................................................................................................................................... 8

10.4 Sammenligning ................................................................................................................................. 9

10.4.1 FE vs. FD ...................................................................................................................................... 9

10.4.2 FE og RE – quasi time-demeaning ............................................................................................... 9

10.4.3 Hausman: sammenligning af RE og FE ....................................................................................... 9

11 More topics in linear unobserved effects ................................................................................................ 10

11.1 Oversigt .......................................................................................................................................... 10

11.2 Sekventiel eksogenitet .................................................................................................................... 11

11.2.1 Instrumentering .......................................................................................................................... 11

11.2.2 Contemporaneous korrelation mellem en x og u ........................................................................ 12

11.3 Individual slopes ............................................................................................................................. 13

11.4 GMM tilgang .................................................................................................................................. 13

11.5 Chamberlain’s tilgang ..................................................................................................................... 13

11.6 Specielle ......................................................................................................................................... 14

11.6.1 Hausman-Taylor ......................................................................................................................... 14

12 M-estimation ........................................................................................................................................... 15

12.1 Setup ............................................................................................................................................... 15

12.2 2-trins estimation ............................................................................................................................ 16

12.3 Konsistens og asymptotisk normalitet ............................................................................................ 16

12.4 Varians-estimation .......................................................................................................................... 16

12.4.1 Uden nuisance ............................................................................................................................ 16

12.4.2 Var-est med nuisance .................................................................................................................. 17

Page 2: Samlede eksamensnoter

2

12.5 Testning (§12.6) .............................................................................................................................. 18

12.5.1 Wald ........................................................................................................................................... 18

12.5.2 LM .............................................................................................................................................. 18

12.5.3 Tests baseret på ændringer i objctive function (QLR) ................................................................ 19

12.6 Optimerinsgalgoritmer .................................................................................................................... 19

13 Maximum Likelihood estimation ............................................................................................................ 19

13.1 Avar estimation ............................................................................................................................... 19

13.2 Testning .......................................................................................................................................... 20

13.3 Panel ............................................................................................................................................... 20

13.3.1 Unobs.eff. and strict exo ............................................................................................................. 21

13.3.2 Lagget afh. var (y-var) ................................................................................................................ 21

13.4 Uncond. MLE (UMLE) vs. cond. MLE (CMLE) ........................................................................... 22

14 GMM ...................................................................................................................................................... 22

14.1 Efficiente instrumenter (§14.5.3, pp. 439-442)............................................................................... 22

14.2 Classical Minimum Distance (CMD) ............................................................................................. 22

15 Discrete Response Models ...................................................................................................................... 23

15.1 Linear Probability Model (LPM) – problematisk ........................................................................... 23

15.2 Latent variabel model – probit og logit .......................................................................................... 23

15.2.1 MLE (pp. 460-461) ..................................................................................................................... 24

15.3 Tests i binary response index modeller........................................................................................... 24

15.3.1 Hetsked ....................................................................................................................................... 24

15.4 Reporting results ............................................................................................................................. 25

15.5 Random Utility Model .................................................................................................................... 25

15.6 Specification issues ......................................................................................................................... 25

15.6.1 Neglected heterogeneity (c udeladt) ........................................................................................... 25

15.6.2 Endogen, kontinuert variabel ...................................................................................................... 26

15.6.3 Når den endogene variabel er binær ........................................................................................... 27

15.6.4 Hetsked & ikke-normalitet ......................................................................................................... 28

15.6.5 Manski’s maximum score estimator – estimation under svagere antagelser .............................. 28

15.7 Panel data / cluster samples ............................................................................................................ 29

15.7.1 Pooled estimation ....................................................................................................................... 29

15.7.2 Unobserved effects probit ........................................................................................................... 29

Page 3: Samlede eksamensnoter

3

15.7.3 Logit: unobs eff og streng exo (FE logit, skodnavn) .................................................................. 31

15.7.4 Dynamic unobs.eff (state dependence) ....................................................................................... 31

15.7.5 Andet .......................................................................................................................................... 32

15.8 Multinomial response ..................................................................................................................... 32

15.8.1 Multinomial logit ........................................................................................................................ 32

15.8.2 Probabilistic choice models: ....................................................................................................... 33

15.9 Ordered response – ordered logit/probit ......................................................................................... 34

16 Censored regressions and corner solution models .................................................................................. 35

16.1 Tobit ............................................................................................................................................... 35

16.1.1 Estimation ................................................................................................................................... 35

16.1.2 Quantities of interest................................................................................................................... 35

16.2 Neglected heterogeneity (§16.6.1) .................................................................................................. 36

16.3 Endogenous .................................................................................................................................... 37

16.4 Hetsked & ikke-normalitet ............................................................................................................. 37

16.5 Estimation under svagere antagelser............................................................................................... 37

16.5.1 Powel estimatoren ...................................................................................................................... 37

16.5.2 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff. .............................................. 38

16.6 Tobit for panel ................................................................................................................................ 38

16.6.1 Sml. med alm. tobit .................................................................................................................... 38

16.6.2 Tobit med unobserved effects..................................................................................................... 39

16.6.3 Dynamic unobserved effects tobit .............................................................................................. 40

17 Sample selection attrition and stratified sampling .................................................................................. 40

17.1 Sample selection ............................................................................................................................. 40

17.2 Simpel model .................................................................................................................................. 41

17.2.1 ML i sample selection – PMLE .................................................................................................. 42

17.2.2 Sammenligning: ML vs. Heckit.................................................................................................. 42

17.2.3 Ad 2SLS på selekteret data ......................................................................................................... 42

17.2.4 Ad 3: Truncation (selektion på y) ............................................................................................... 42

17.2.5 Probit selektion – exogene variable (Heckit) .............................................................................. 43

17.2.6 Probit selektion – endogene variable .......................................................................................... 44

17.2.7 Tobit med eksogene forklarende vars ......................................................................................... 45

17.2.8 Tobit med endogene forklarende vars ........................................................................................ 46

Page 4: Samlede eksamensnoter

4

17.3 Paneldata: Sample selection ........................................................................................................... 46

17.3.1 Fixed effects på ubalancerede paneler ........................................................................................ 46

17.3.2 Test / korrektion for sample selection bias ................................................................................. 47

17.3.3 Attrition – man vælger at udgå af sample ................................................................................... 48

17.3.4 Inverse probability weighting (IPW) .......................................................................................... 48

17.4 Non-parametric bounds .................................................................................................................. 49

18 Treatment effects .................................................................................................................................... 49

18.1 Noten .............................................................................................................................................. 50

18.1.1 Nonparam id – ignorability of treatment .................................................................................... 50

18.1.2 Regressions and switching models ............................................................................................. 50

18.1.3 Regression discontinuity ............................................................................................................ 51

18.1.4 Before-after ................................................................................................................................ 51

18.1.5 Selection and treatment effects ................................................................................................... 52

18.1.6 Estimation af ATE ved IV under antagelse af homogen treatment effect .................................. 52

18.1.7 Heterogene treatment effects (v0 ≠ v1) ...................................................................................... 53

18.1.8 LATE (local average treatment effects) ..................................................................................... 53

18.1.9 Essential heterogeneity and IV (sorting on the gain) .................................................................. 54

18.1.10 Sammenhæng med den simple sample selection model ......................................................... 54

18.2 Ikke-parametrisk tilgang ................................................................................................................. 55

18.3 Mere parametrisk tilgang ................................................................................................................ 55

18.3.1 Switching regression .................................................................................................................. 56

18.3.2 Svagere antagelser – to ukendte g-funktioner ............................................................................ 56

18.3.3 Regression disc. designs ............................................................................................................. 57

18.4 Propensity score .............................................................................................................................. 57

18.4.1 ATE skrevet som funktion af p, som estimeres med probit........................................................ 57

18.4.2 Regressér y på w og p-hat .......................................................................................................... 58

18.5 Matching ......................................................................................................................................... 58

18.6 IV-metoder...................................................................................................................................... 59

Page 5: Samlede eksamensnoter

5

10 Basic linear unobserved effects

CROSS-SECTION ∷ Løsninger på uobserveret heterogenitet,

- Proxy

- IV (2SLS)

- Indikator-IV

PANEL

Antager er tidskonstant

BEMÆRK ∷ ⇒ tidskonstante ’er kan ikke identificeres separat fra .

Antager balanceret panel – ubalancerede håndteres senere.

EKSOGENITET

Hvis vi kun betinger på ’er ∷ ,

⇒ dvs. ækvivalent med streng exo ⇔

BEMÆRK

- -lags ⇒ streng exo kan aldrig holde ∷ ⇒ .

- → desuden giver -lags ser.korr. i composite error term pr. konstruktion .

FREMGANG – 2 spørgsmål

1) Er korreleret med for noget ?

2) Holder streng eksogenitet (betinget på )?

NAVNGIVNING

Random Effects ∷

Fixed Effects ∷

10.1 Random effects

IDE ∷ udnytte ser.korr. i til at lave GLS

ANTAG

1) Ortogonalitet

a.

b.

i. Tilstrækkeligt for konsistens ∷

ii. er without loss of generality når der er intercept.

2) Rank ∷ , hvor

.

For efficiens ANTAG YDERLIGERE

3) Efficiens af RE

a.

b.

Da er

ESTIMATION

Alm. FGLS varians

Page 6: Samlede eksamensnoter

6

hvor

Første trin baseres på pooled OLS.

… brug dog robust varians, hvis muligt

F-TEST

Brug fra modellen til at udregne både og

(selvfølgelig).

10.1.1 Test for unobserved effects

IDE ∷ svarer til at teste

- (hvilket svarer til at teste ser.korr. i , dvs. AR(1)-test, men bedre at teste direkte på )

PROBLEM ∷ hvad er ?

LØSNING ∷ streng eksogenitet giver

FORDEL ∷ opdager mange typer ser.korr. i

ULEMPE ∷ streng exo ⇒ må ikke indeholde laggede ’er!

10.2 Fixed effects

ANTAG (FE.X)

1)

a. OBS! ⇒ streng eksogenitet, dvs.

b. Evt. tænk .

c. OBS! ⇒ ⇒ , specielt ⇒ .

2)

3)

(kun nødv. for efficiens af FE)

OBS! FE1 + FE2 ⇒ unbiasedness

ESTIMATION

Page 7: Samlede eksamensnoter

7

PRAKSIS

- Premultiply med eye(T) – T^-1 * ones(T,T).

NAVNE

- Within ⇔ within each cross-section ⇒ HER

- Between ⇔ between each cross section

LSDSV

- Viser sig ∷ FE = Least Squares Dummy Variable Estimator ∷ på dummies for personer,

- → svarer til at estimere for alle ⇒ incidental parameters problem.

- MEN ∷ stor ⇒ giver idé om fordelingen af heterogeniteten i populationen.

10.2.1 Inferens

INFERENS

- PAS PÅ! .

- fås ved først at beregne og så udnytte

. Da er

-

(unbiased).

PROBLEM ∷ FE-transformationen introducerer serielkorrelation i pr. konstruktion

- fordi . Men betydningen svinder som ∷

MEN ∷ det bliver et mindre problem (??)

Robust varians og seriel korr i idiosynkratiske fejl

Seriel korr i ?

Problem ∷ vi har ikke

⇒ vi kan udnytte, at

∷ reg på for alle og test

Problem ∷ serielkorrelation under

Løsning ∷ brug flg. robuste variansestimator

som er robust for heteroskedasticitet og seriel korrelation i

⇒ kan bruges til at lave Wald-tests.

Fixed Effects GLS

ANTAG

- dvs. FJERN FE.3.

⇒ muligt at lave en GLS analyse

Page 8: Samlede eksamensnoter

8

PROBLEM ∷ det viser sig, at

, som har rang på kun !! Dvs. ikk invertibel!

LØSNING ∷ Drop en tidsperiode og lav GLS

1) Estimér og drop så en tidsperiode (fx den ’te) fra datasættet.

2) Estimér .

3) Estimér

ALTERNATIV

- Man kan specificere en eller anden struktur på og udlede en stuktur på

- Fx BFN (1982) antager stabil, homoskedastisk, AR(1) ⇒ afh. kun af .

- MEN ∷ efficient hvis korrekt, inefficient ellers.

Generelt: policy implementation

Faktisk er ortogonalitetsbetingelsen jo ⇒

⇒ dvs. i nogle situationer, hvor deltagelse i et program er betinget af karakteristika før programmet

, kan FE godt være konsistent selvom POLS / RE ikke er det, hvis ortogonaliteten overholdes

- (dvs. hvis det var givet at man ville deltage, bare ikke hvornår??)

10.3 FD metoder

ANTAG

1)

a. Som FE.1

b. OBS! ⇒ streng eksogenitet, dvs.

c. Evt. tænk .

2)

3)

, hvor (kun nødv. for efficiens af FD)

a. MODSÆTNING til FE.3‼ FD.3 ⇒ random walk

b. (FE.3 ⇒ )

BEMÆRK

- Vi mister én periode!

- Alle ’er skal variere over .

- Egentlig skal bare være ukorr. med før vi får konsistens!

VIGTIGT

- Under FD.1-3 er alm. inferens valid under POLS på Δ’et data!

10.3.1 Inferens

OBS! Ikke nødvendigt at tænke så meget som i FE – alm. inferens @ POLS på Δ’et data er valid.

- (huskeregel: I FD har vi af 2 stok var ⇒ selv stok var ⇒ alle antagelser laves på den. I FE har vi stok

var minus noget, som bliver deterministisk når )

Page 9: Samlede eksamensnoter

9

SERIEL KORR i

- Kør reg

- → alm. -test af .

- OBS! ukorrelerede ⇒ autokorr med .

10.4 Sammenligning

10.4.1 FE vs. FD

⇒ FE = FD

valget afh. af antagelser om

OBS! Endogenitet (målefejl, tidsvar.udeladte, simultanitet) ⇒ både FE & FD inkons med hver sin plim!

TEST ∷ STRENG EXO

IDE ∷ hvis FD (el. FE) modellen er korrekt og , bør være insign (den er taget højde for).

- (evt. same men I FE framework)

GLS ∷ OBS! FE-GLS og FD-GLS er asymptotisk ækvivalente

10.4.2 FE og RE – quasi time-demeaning

Det viser sig, at RE estimation svarer til at estimerer

- ∷ POLS

- ∷ FE

- for ∷ for store er RE ≅ FE

- for

∷ dominerer ⇒ brug FE

RE ∷ Hjælp til en estimator i nød

- Inkludér dummies for grupper der er meget ens, dvs. som har ens ’er.

10.4.3 Hausman: sammenligning af RE og FE

ULEMPER

Page 10: Samlede eksamensnoter

10

1) Streng eksogenitet antages både under og

2) RE3 antages at holde under . Dvs. vi tester

a. (ellers får test.str. en skør asymptotisk fordeling)

IDE ∷ Det viser sig, at under RE.1-RE.3, er

Test-str. er:

- Sædvanlige estimetorer for bruges,

- MEN ∷ brug fra et framework, ikke fra hver sit – ellers risikeres, at den bliver ikke-pos.def.

1 VARIABEL

BEMÆRKNINGER

- kan klares @ aux regression af quasi time-demeaned (q.t.d.’ed) på q.t.d.’ed samt en alm. (FE-

style) time-demeaned (de tidsvarierende elementer i ).

- ⇒ kør så -test af koeff. på eller Wald

- … kan evt. gøres robust for RE3 i denne setting ∷ brug robust Wald.

11 More topics in linear unobserved effects

11.1 Oversigt

Antagelser Foretrukket model

RE ∷ udnytter både info within og between grupper

FE el. FD. ∷ udnytter kun within-group info.

Valg mellem FE/FD afh. af antagelser af tidsserieafh. i

(kun efficienshensyn)

predetermined ∷ brug IV/GMM

FD ligningen og brug laggede niveauer som instr.

Bruger within-group info

ÅRSAGER (alm.)

1) Udeladt tidsvarierende variabel

2) Simultanitet mellem og

3) Målefejl i

SKAL BRUGE ∷ instrument ukorr med og

→ nogle gange kan panel-aspektet bruges

- (transformer ⇒ fjerner ∷ brug så IV)

Page 11: Samlede eksamensnoter

11

11.2 Sekventiel eksogenitet

ÆKVIVALENT (når modellen tages i betragtning):

- Når og er kontrolleret for, hjælper det ikke yderligere at kontrollere for fortiden af

- OBS! MILDERE antagelse end !

BEMÆRKNING

- Hvis , vil seq.exo. ⇒ dyn.compl.

- Seq.exo. ⇒ , .

FE OG FD ER INKONSISTENTE!

- FE ∷ Bias introduceres fordi fremtid er i tidsgns.

- fordi , så ⇒

- MEN ∷ hvis yderligere det antages at er weakly dep., er inkons af odten

- FD ∷ Bias fordi to på hinanden følgende perioder sættes sammen

-

når vi kun har seq.exo.

- ⇒ OBS! Bias uaf. af (da på hinanden følgende perioder)

11.2.1 Instrumentering

FE ∷ kræver strengt eksogene instrumenter

FD ∷ kræver seq.exo. instrumenter.

MULIGE INSTR I FD

⇒ (alle) laggede niveauer (og funktioner heraf, fx Δ’er) (op til ) kan instrumentere

⇒ bl.a. instr for (husk, eneste problem er og .)

BEMÆRKNINGER

- lille ⇒ stor varians…

- Selvom instr. gyldige, er det ikke sikkert, at de er relevante.

AR(1) model ∷ indgår allerede som regressor

- Anderson & Hsiao (1982) ∷ foreslog eller som IV

- Arellano & Bond (1991) ∷ Bruge alle tilgængelige som IV @ GMM (ej muligt i 2SLS da #instr varierer

med )

- ≅ ⇒ er svage instrumenter.

- Blundell & Bond ⇒ antog trukket fra steady-state distr. ⇒ hjælper på efficiens, men realisme??

EFF.GMM @ alle instr’er

Page 12: Samlede eksamensnoter

12

Nogle x’er str.exo., nogle seq.exo.

Eksempelvis , hvor seq.exo. og str.exo.

- Model: ↷ skriv op en ligning for

- → klart at .

- FD + IV ∷ FD ⇒ fjerner , men inducerer muligvis endogenitet hvis (dvs. når ej str., men kun

seq. exo)

- kan være sit eget instrument – brug ( ) som instr for ( ).

11.2.2 Contemporaneous korrelation mellem en x og u

3 mulige ophav:

1) Udeladte tidsvariante forklarende variable

2) Målefejl

3) Simultanitet

a. (kan alternativt løses ved at medtage en ligning for den simultane var’s bestemmelse)

FREMGANG

1) Transformér data (FE eller FD)

2) Brug IV af en art – hvilke instr’er afh. af anvendelsen.

FD bedre end FE

- FD er robust for mere generelle overtrædelser af str.exo end FE

- Vi kan teste for ser.korr. på Δ’et data

- Arellano & Bond (1991) foreslår GMM-baseret test for ser.korr. i .

Simultanitet

MULIGHED 1 ∷ LAGGEDE ’ER SOM INSTR’ER

OBS! og er korrelerede for alle , så kan kun estimeres med fordi

BEMÆRK ∷

- simultaniteten kommer nu ikke fra det, at vi lagger, men er med ”dobbelt” (hver gang og er

sammen)

ALTERNATIVT ∷

- lagget kunne bruges, men det kræver, at der ikke er seriel korrelation i

- (siden (i niveau) ikke indgår i ligning kan den måske bruges som IV → men formentligt SVAGT!)

MULIGHED 2 ∷ EKSTERNE INSTRUMENTER

FIND nogle eksterne instrumenter og kør POOLED 2SLS på

Page 13: Samlede eksamensnoter

13

Udeladt tidsvariant variabel

FD (el. FE) ↷ efterfulgt af IV

Ikke altid oplagt smart bare at bruge laggede variable

⇒ find eksternt exo instrument

Målefejl

(I classical errors in variables under str.exo. ∷ FE forværrer målefejl)

Vi må finde et instrument udover de variable, vi har.

Hvis der er seriel korrelation i målefejlene, kan vi måske bruge som instr for .

11.3 Individual slopes

METODE ∷ FD for at slippe af med

HUSK ∷ FE var som at estimere model med individuelle intercepts

- hvis er ser.ukorr., homosked (betinet på ),

- ⇒ så er FE på Δ’et data konsistent & asym.normalfordelt (men ej asym efficient)

11.4 GMM tilgang

MOTIVATION ∷ hvad hvis (RE) eller ikke var konstant?

3SLS kan være bedre end alm. RE (mere fri )

Men bedste er fuld GMM / min- estimation med fuld frihed i vægtmatrix

11.5 Chamberlain’s tilgang

ANTAG

- Streng eksogenitet ∷ , (dvs. FE.1)

- indeholder kun tidsvarierende variable

MEN ∷ Tillad arbitrær korrelation mellem og .

IDE ∷ Erstatte med projektionen på ∷ Vi kan altid skrive

- Pr. konstruktion er , og ,

- MEN ∷ generelt!

INDSÆT

- FE.1 ⇒ og .

SYSTEM

Page 14: Samlede eksamensnoter

14

System-OLS er konsistent under FE.1.

MULIGE ANTAGELSER

-

∷ system skalar-varians

-

∷ system homoskedasticitet

- Denne failer hvis

1)

∷ ej homosked.

2) ej lineær i ∷ forkert fkt. form for

3) ej konstant ∷ ej homosked (??)

HVIS

- Begge opfyldt ⇒ SOLS efficient (??)

- Failer ⇒ FGLS kan bruges

- GMM er mest efficient med som instrument for hver tidsperiode og med den

optimale vægtmatrix.

- Test af over-ID ⇔ test af str.exo.

11.6 Specielle

11.6.1 Hausman-Taylor

FORMÅL ∷ identificere effekt af tidskonstante variable i tilstedeværelsen af

MODEL

ANTAG

1) ∷ str. exo

2)

BEMÆRK

- 1) giver, at FE kunne bruges ⇒ vi får så , men så ville -leddet gå ud.

IDE ∷ vi vil udnytte 2) samt at 1) medfører til at estimere . Omskriv

ANALOGIPRINCIPPET

Page 15: Samlede eksamensnoter

15

… han viser det for en mere generel model

GIV (generalized IN) TANKEGANG

Bruge som instrumenter

- instrumenterer

- instrumenterer sig selv (de tidskonstante, som er ukorr. med )

- instrumenterer (de tidskonstante, som er korrelerede med )

TILGANGE ∷ i rækkefølge med stigende robusthed.

- 3SLS med på RE struktur

- 3SLS med urestrikteret

- GMM med efficient vægtmatrix

12 M-estimation

12.1 Setup

SPECIFIKATION

Karakteristik af fx , hvor .

hvor .

IDENTIFIKATION

- minimerer RHS hvis modellen er identificérbar.

- minimerer LHS pr. valg

- Hvis konvergensen er uniform, vil .

Page 16: Samlede eksamensnoter

16

12.2 2-trins estimation

løser

Trin 1: Estimér ,

Trin 2: Estimér .

ØNSKE ∷ konsistent uanset, hvordan vi vælger .

12.3 Konsistens og asymptotisk normalitet

TEOREM 12.3:

Lad alt muligt gælde, da vil

hvor

Dermed er

12.4 Varians-estimation

12.4.1 Uden nuisance

estimeres altid på samme måde!

afh. af humør:

2 TILGANGE

1) Håndværkertilgangen ∷ udregn samt , indsæt og tag sample avg.

a. Altid mulig – men tung og måske ej pos.def.

2) Strukturel estimation ∷ givet (eller ),

a. Udnyt fx ∷ så

i. Udregn

ii. Udregn

iii. Udregn .

b. → smart hvis betingning på giver en simpel form (fx i probit bliver led = 0)

Page 17: Samlede eksamensnoter

17

Analogiprincippet

Brug Analogiprincippet til at estimere

med

DVS ∷

1) Udregn lukket-form udtryk for og som funktion af og

a. Dvs. differentier to gange mht. .

2) Evaluér sample avg. af disse udtryk.

OVERVEJELSER

- NEGATIVT ∷ tung at regne, ej sikkert pos.def – men den er det hvis unikt løser sample problem.

- POSITIVT ∷ altid tilgængelig

Strukturel tilgang – evaluér forventninger

Givet en fordeling for , kan vi blot udregne direkte:

- som og

som .

OVERVEJELSER

- NEGATIVT ∷ kræver streng antagelse om

- POSITIVT ∷ efficient!

Mellemting – antager kun fordeling for y givet x

Hvis vi ikke vil antage fordeling for hele , men måske kun for .

Definér

Så analogiprincippet motiverer

12.4.2 Var-est med nuisance

Vi kan altid bruge den generelle

Alternativt:

- hvor med .

Page 18: Samlede eksamensnoter

18

- hvor

,

- hvor (og

er en bøvlet, grim funktion, som formentlig skal tænkes på

som et slags generaliseret residual.

2-STEP M-ESTIMATOR VARIANSEN ER DA

BEMÆRKNINGER

- OBS! er lineært separable I den ”almindelige” effekt og ”nuisance” effekten ,

- MEN det er ikke! (den bliver interageret på kryds og tværs pga. ”^2”)

- MEN ∷ bemærk, at selvfølgelig indgår i .

12.5 Testning (§12.6)

12.5.1 Wald

Testes ved

hvor

- , kan vælges robust (når eller evt. højde for nuisance)

- Jacobi-matricen for ( )

(skal være invertibel)

ULEMPE

- Ikke skalainvariant ⇒ problem (primært/kun?) ved ikke-lineære hypoteser: man kan omformulere

indtil man får den ønskede konklusion.

FORDELE

- Estimerer kun den ”store” model

- Kan gøres vilkårligt robust

12.5.2 LM

IDE ∷ hvor langt er FOC fra at være opfyldt

OBS! Restrikterede model (” ”-modellen) skal være nested i en større model

SETUP

Imposer kontiniuert-differenntiable restriktioner på under

- Matematisk, restriktioner , så , hvor og

o Fx ∷ , hvor og sættes til konstanter fx

- Vi lader da og .

Page 19: Samlede eksamensnoter

19

Hvis GIME (generalized information matrix equality, og

)

1) (hvis opdeles i endo og exo ) ∷ Foretrukket hvor mulig (bedre small-sample)

2) Hesseform ∷ i) kan være neg hvis ’erne ej pos.def.; ii) tung at udregne; iii) ej invariant for

reparameteriseringer.

3) Outer product of the scores ∷ Simpel at udregne, men size distortions (typisk afvises for ofte)

FORDELE

- Estimerer kun den “lille” model.

- Med forventet hesse er den ofte invariant for reparameteriseringer.

ULEMPER

- …

12.5.3 Tests baseret på ændringer i objctive function (QLR)

ANTAG at GIME holder ∷ og

ULEMPER

- Forudsætter, at GIME holder og kan ikke gøres robust for dette.

12.6 Optimerinsgalgoritmer

MANGLER DETTE AFSNIIT‼

13 Maximum Likelihood estimation

13.1 Avar estimation

Definitioner:

(og hvor .)

Page 20: Samlede eksamensnoter

20

Under regularitetsantagelser (bl.a. antagelse om korrekt specificeret model) holder teorem 13.2 (p. 395)

(fordi i ML sammenhænge)

- Dvs. i stedet for

som i teorem 12.3.

Alle flg. 3 matricer konvergerer til den sande Avar (p. 396) ∷ baggrund: i ML

hvor , dvs. der betinges på (!).

1) Kræver beregning af de 2. afledte – ikke garanteret pos.def.

2) BHHH, måske dårlige egenskaber selv i relativt store sample sizes.

3) Lukket form! Kan evt. simuleres. Fordele:

a. Afhænger (typisk) kun af 1.-afledte af en eller funktion

b. Garanteret pos.def. når den findes (jf. CIME)

c. Bedre finite-sample props end BHHH

KOMMENTARER

- Bemærk, at i visse tilfælde er simpel selvom er bøvlet (fx probit, p. 396), idet der betinges på ,

så nogle led bliver nul i forventning.

13.2 Testning

OBS ∷ asymptotisk ækvivalente! Kun finite-sample overvejelser

Wald

LR

(Like-ratio – ala -test, mere kompleksitet skal dælme give mere forklaringskraft!)

Lad . Lad være estimatet når de restriktioner er pålagt og uden. Under er

LM

(hvor langt er hældning fra nul, dvs. hvor slemt overtrædes FOC?)

Lad være vektor af afledte af evalueret ved de restrikterede estimater.

Da vil

hvor avar-estimatoren kan vælges blandt de 3 nævnte

- … vælg ud fra small-sample eller beregninsgmæssige betænkeligheder.

13.3 Panel

Lad være den sande pdf. for givet .

BEMÆRK! Vi antager IKKE, at .

Page 21: Samlede eksamensnoter

21

- (dvs. antager ikke )

Men vi antager, at er en korrekt specificeret pdf for for hver periode, , ”isoleret set”.

Smart teoretisk figumdik

Definér det partielle likelihood bidrag som

SMART ∷ Da er korrekt for alle , vil (unikt) maksimere for ethvert .

⇒ specielt vil den maksimere summen.

13.3.1 Unobs.eff. and strict exo

(han tillader, at kan være en vektor ( ))

2 possibilities

- I begge tilfælde antager vi, at fordelingen af er givet ved (korrekt spec)

1) Integrate out

∷ antag og er uafh. betinget på .

Da er den simultane tæthed for givet ved

Og log-like er

2) PMLE-agtig tilgang

Antager intet om fordelingen af (givet )

I stedet siger vi, at vi for hver enkelt kan få tætheden af

Nu vælger vi

hvilket er et slags PMLE problem

13.3.2 Lagget afh. var (y-var)

Ingen problemer når blot vi har specificeret dynamikken korrekt.

DYNAMIC COMPLETENESS er når distr. af betinget på hele fortiden er lig med distr af

når vi kun betinger på .

Hvis denne korrekt specificerede tæthed er , da er

Page 22: Samlede eksamensnoter

22

Og vi kan igen integrere ud, dvs. vi skal lave

- INITIAL CONDITION PROBLEM ∷ skal håndteres

- LØSNING ∷ betinger på (/antager)

Her er betingningen på

KOMMENTARER

- Vi smider den første obs. væk.

- Alt. ku man ha fundet distr. for … meget svært!

- ASYM VAR ∷ justér for at tage højde for at begge params. estimeres.

13.4 Uncond. MLE (UMLE) vs. cond. MLE (CMLE)

Generelt er det muligt, at der i fordelingen af er information om , dvs. at .

I CMLE betiner man på og smider dermed al denne info væk

→ vi kalder det UMLE, når man ikke betinger på

HVORNÅR ER DE LIGE GODE?

Når , hvor ” ikke er en funktion af ”.

14 GMM

14.1 Efficiente instrumenter (§14.5.3, pp. 439-442)

Lad og . Da er det optimale valg

og med dette valg er det ikke nødvendigt at bruge en vægtmatrix i GMM.

Desuden opnår vi samme efficiens som CMLE.

PROBLEM

vil næsten aldrig være kendt ⇒ skal estimeres.

(desuden skal også estimeres)

- estimeres typisk ved at antage en art homosked.

- Til skal der typisk bruges ikke-param. metoder.

14.2 Classical Minimum Distance (CMD)

IDEA

SETUP

- Structural problem; estimate

- Reduced form;

-

- Function maps

Page 23: Samlede eksamensnoter

23

METHOD

- Estimate

- Choose .

15 Discrete Response Models

15.1 Linear Probability Model (LPM) – problematisk

PROBLEMER

- Siden variansen for en Ber(p) variabel er , er der automatisk heteroskedasticitet, da

afh. af .

- … kan evt. løses vha. WLS

- Predikterede værdier uden for .

- … men evt. godt initialt estimat af .

KOMMENTARER

- Hvis dummies udgør en klassedeling, giver de bare gns. inden

15.2 Latent variabel model – probit og logit

KOMMENTARER

- SKALA IRRELEVANT ∷ (eller ) kunne være skaleret arbitrært

- Hvis fx , er

- ⇒ Derfor: normalisér med , for et valg af .

- Retningen af effekten fra på og er den samme ( monotont voksende)

Indekse

Fortolkning af ’erne

Page 24: Samlede eksamensnoter

24

15.2.1 MLE (pp. 460-461)

Like bidrag

Log-like function

Det kan vises, at

og

Så .

KOMMENTARER

- Denne er invertibel så længe der ikke er perf.mult.kor.

- Muligt med Huber-White robuste s.e.’er ⇒ MEN ∷ hvis er misspec. så er også (ligger i

naturen af ML).

- (disse er , udregnet ved

og .)

15.3 Tests i binary response index modeller

Muligt med Wald, LR og LM.

WALD ∷ problematisk når den store model er for stor ( har høj dim).

LR ∷ Kræver begge estimeret.

LM ∷ Smart hvis den store er bøvlet. Kan gøres som auxillary regression.

- Lad , , ,

- Da er fra reg af

og

HVIS ER IKKE-LINEÆR

- Wald foretrækkes,

- MEN ∷ ej invariant for reparameteriseringer

15.3.1 Hetsked

Her er modellen meget besværlig (LM foretrækkes)

så vi omskriver

LM test

- Bøvlet augmented regression ala alm. LM.

Page 25: Samlede eksamensnoter

25

15.4 Reporting results

- Percent correctly predicted (#gange , hvor .))

- Pseudo , hvis log-like fra unrestricted, log-likelihood i model med kun intercept.

- Evaluere i gns. personen – dvs. hvor .

- Bemærk, så er ≅ , ≅ , ≅

- Smag og behag, hvordan dummies håndteres.

- Response probabilities ∷ in ved ≅ .

- std.fejl fås vha. Delta-metoden (2. ordens lokal Taylor) (se p. 467 for detaljer)

15.5 Random Utility Model

og så kan vi køre helt alm. probit på den med reglen: Vælg bil hvis .

15.6 Specification issues

15.6.1 Neglected heterogeneity (c udeladt)

Antag sande model er

Latent form ∷ , , .

- ( w/o loss of generality)

c og x uafh.

STÆRK antagelse

Antag , da er .

Attenuation bias:

PROBLEM

Ønsker ∷ Partial effect:

Men probit giver os

Probit kan ikke estimere partial effects evalueret ved konsistent

BONUS

Probit kan godt estimere de forventede (mht. ) partial effects (kaldet APE, avg. part.eff)

Page 26: Samlede eksamensnoter

26

og

c og x ikke uafh.

Så er probit generelt inkonsistent

15.6.2 Endogen, kontinuert variabel

Antag

Mistænker . Skriv

- ⇒ ingen endogenitet

2-trins test for endogenitet (Rivers & Vuong, 1988)

Antag og

- Under bivariat , kan vi skrive . Da vil

- ⇒

Nu kan man vise, at

… (lang tung snak) …

METODE

MÅL ∷ APE’s ∷ dvs. afledte eller differenser af flg. udtryk

IDE ∷ får ved at reg på … så probit af på

1) Reg på ↷ .

2) Estimér

3) Probit på ↷ , ,

4) Udregn

som vil

pga. samme argumenter som ved neglected heterogenitet

(mao. kan vi tænke på som vi gjorde med (? eller hvad?))

TEST

Hvis , er og spiller altså ikke ind i første ligning

⇒ dvs. ingen strenge antagelser på ’s fordeling kræves.

Page 27: Samlede eksamensnoter

27

kan testes vha. ”den sædvanlige” (?) -test på , asym

→ dog skal std.fejl korrigeres for 2-step

Alternativ til Rivers & Vuong

(smartere, da R&V er en limited information procedure)

- normalisering ⇒ identifikation af discrete response

- ⇒ endo.

FREMGANG

Udnyt

Ad ∷ Antager ⇒

Ad ∷

-

- ⇒

- udregninger ⇔ ⇔

Ad

således at likelihood bidragene er

og

testes @ asymptotisk -test.

15.6.3 Når den endogene variabel er binær

KORT FORTALT

- Både varians af og må normaliseres for at få identifikation

- Kan ikke løse for → den må integreres ud

- er grim!

LANGT FORTALT

- kan fx være deltagelse i fx jobtræningsprogram.

(proceduren er sindssygt svær at læse sig til!)

Idéen er (vist), at genbruge tankegangen bag hvordan vi fandt . Denne gang bliver

Page 28: Samlede eksamensnoter

28

Så skal vi tage forventningen og til det bruge tætheden af (inden i -integralet)

→ til det skal vi bruge, at er en trunkeret normalfordelt variabel, idet ⇔ :

Vi når frem til (bemærk, at spiller rollen af integrationsdummy)

Eksempel: College attendal and catholicism (Evans & Schwab, 1995)

- går man i college eller ej

- er man katolik eller ej

- Derved tillades at afhænge af uobserverbare faktorer.

15.6.4 Hetsked & ikke-normalitet

Hetsked

Antag i latent-variabel-formuleringen:

Non-normalitet

Så er inkonsistent

- Men hvis fx det er fordi logit er den sande model, kan godt være ret tæt på.

15.6.5 Manski’s maximum score estimator – estimation under svagere antagelser

Antag ,

(og bemærk, at )

- (fordi ⇒ (medianer kan ikke være kommatal)

Fordele:

- Robust: og må godt være afh. og er ikke restrikteret.

- Estimerer konsistent op til skala – god til fx

Ulemper:

- Konvergerer med rate (selvom Horowitz (1992) har en smoothed version med næsten .

- Vi kan ikke differentiere , så ingen partielle afledte.

- Nogle gange har modsat indflydelse på og .

Page 29: Samlede eksamensnoter

29

15.7 Panel data / cluster samples

Med LPM modeller kan man evt. bruge FE, FD eller RE.

→ men stadig ikke attraktiv for binær-respons data.

15.7.1 Pooled estimation

Model:

PMLE-estimation (partial MLE) ≅ pooled

- er konsistent uden videre antagelser.

- Brug robust var-est, , hvor .

-

, hvor er Jacobian af (§12.6.1)

-

DYNAMIC COMPLETENESS

⇒ alm. inferens

- OBS! Betyder ikke tidsuafhængighed – må fx godt indeholde laggede variable.

- Betyder blot, at , .

- ⇒ sample kan ses som en stort cross-section af str.

TEST for dyn.compl.

- Lag.dep.var ∷ Estimér den potentielt syge,

- Estimér ,

(OBS! man må droppe tidsperioder – ellers som ej findes.)

15.7.2 Unobserved effects probit

ANTAGELSE

- Dvs. er strengt eksogen betinget på (specielt indeholder nok lags osv, altsådyn.compl.)

- BERTEL’s noter ∷ ingen lagged dep.vars siden ville være perf. korr. med dem (?!?!?!)

MULIGE METODER

- Fixed effects ∷ fjern ved transformation

- SVÆRT pga. ikke-linearitet

- Proxy for (når interesse er i APE)

- Pooled analyse (når interesse er i APE)

- Estimér ∷ Fixed effects probit (dumt navn!)

- Åndssvagt! Ser som parameter ⇒ #params → ∞ for .

Page 30: Samlede eksamensnoter

30

- Diskussion: man betragter som ikke-tilfældig… modsat hvad vi vil gøre!

- Traditional random effects probit

- ANTAGELSER

1) Streng exo ∷

2) Uafh., (betinget på )

3)

⇒ &&

- METODE ∷ integrér ud af !

Max log-like mht. og ‼

- HURRA ∷ både (part.eff. ved ) og (APE) kan godt estimeres!

Men hvorfor kan de pludselig det her når de ikke kunne i alm. unobs.eff.??

INDSKUD ∷ integration

Numerisk @ quadrature

Simulation @ int ≅ tage forventning

1) Træk std.normaler ↷

2) Beregn

3) Beregn

for hver

4) Tag gns. og logs,

5)

SVAGERE ANTAGELSER

- Generalized estimating equations

- Response prob. specificeres kun betinget på , ikke .

- Kræver specifikation af ( ), men robust for fejlspec af denne.

- CMLE @ Fuld korrelation

- , hvor , hvor tillades fuld frihed i off-diagonal (og 1’er i

diagonalen)

- Slem curse of dim!

Men, Keane (1993, in press) har simulationsmetoder

- Chamberlain’s random effects probit

- MÅL ∷ tillade sammenhæng

- METODE ∷ specificere betinged for med konstant varians.

- Antag ,

.

Error form ∷ .

Restriktiv, men tillader dog noget samspil (modsat trad.REprobit)

- Indsæt i ligning:

Page 31: Samlede eksamensnoter

31

- INTUITION ∷ Tilføjer tids-gns som kontrolvariabel ∷ partial eff. af når tidsgennemsnittet

holdes fast! ⇒ måde at kontrollere for uobserverede personspecifikke effekter

- Udvidelse ∷ Tillade tidsafh. i

muligt at droppe antagelsen ⇒ så skal inferens dog gøres robust for

arbitrær seriel korrelation.

Så kan vi dog kun finde APE’s ved at integrere ud (hvilket i praksis kommer ud på at

”integrere” ud (dvs. average den ud, da den observeres)

BEMÆRKNINGER

Hidtidige udledninger ∷ afhænger kritisk af, at er strictly exogenous conditional on .

→ dvs. fx ingen lags af dep.var. !

- TEST for streng exo ∷ add bare nogle lags og se om de bliver sign.

15.7.3 Logit: unobs eff og streng exo (FE logit, skodnavn)

NEDERN ∷ ik muligt at specificere tæthed for så vi (nemt) kan integrere mht. den.

OPTUR ∷ muligt med FE/FD-agtig approach! → viser sig at falder ud når vi betinger på

- svedig feature ved logit-formen gør det muligt at få en funktionel form, der ik afhænger

Log-like i tilfældet:

- hvor hvis og hvis .

- OBS! Kun observationer, hvor bidrager, dvs. obs. hvor eller i begge år duer

ikke.

NAVN ∷ fixed effects logit ⇒ SKODNAVN, intet at gøre med FE probit, som ser som paramter.

FORDEL

- ∷ effekten på log-odd ratio, idet; .

ULEMPER

- Kan ikke estimere partial effects medmindre vi indsætter en værdi for

- Men hvilken værdi skal vi vælge? Ingen restriktioner, ikke engang !

- APE’s kan heller ik findes når vi ik har nogen antagelser om distr for

- Forudsætter

15.7.4 Dynamic unobs.eff (state dependence)

Grundlæggende model

BEMÆRK

- ∷ dvs. antager str.exo

- Tidl. outcome må godt påvirke response prob)

INTERESSE ∷ State-dependence efter der er kontrolleret for ∷ .

JOINT PROB

Page 32: Samlede eksamensnoter

32

INITIAL CONDITIONS PROBLEM ∷ hvad når vi når til ? modelleres ikke!

4 muligheder

1) Se som ikke-stokastisk

a. Streng antagelse ∷ medfører bl.a.

2) Specificere tæthed for , dernæst for

a. Svært at vælge tæthed. Førende eksempel .

3) Approksimere tæthed for , dernæst for (Heckman, 1981)

a. Fx lade følge probit med resp.prob.

4) Betinge på , dernæst specificere

a. kan fx vælges som Chamberlain, ,

b. I PRAKSIS

i. Alm. Chamberlain probit, hvor og tilføjes i alle tidsperioder

c. APE’s mv. ∷ tag MLE params og multiplicér med ( -subscript viser

dette). Std.fejl. fås vha. bootstrapping el.lign.

15.7.5 Andet

Semiparametriske metoder

- Fx Manski for brugt på differenser

Cluster samples

- Pooled probit/logit ∷ brug dog de robuste varians-estimatorer.

15.8 Multinomial response

15.8.1 Multinomial logit

Kategorier , dvs. styk.

Hvor og (samme ’er i hver kategori – bare med forskellig param)

Page 33: Samlede eksamensnoter

33

RESULTATER

Partielle effekter har en meget besværlig form, men odds bliver pæne:

LIKELIHOOD

15.8.2 Probabilistic choice models:

Primarily, we’ll look at conditional logit, but conditional probit is a nice extension (although it has some

computational issues)

Conditional logit

Derived from underlying utility-maximization model

ANTAG ∷ TypeI Extreme Value

REMARKS

- Elements of differ between alternatives

- can’t contain elements that don’t vary across alternatives!

- Dvs. ikke udd, erfaring, men ok med pris på o.lign. karakteristika for

- ⇒ håndterer en helt anden type data – valg af alternativ skal afhænge af karakteristika ved

netop .

RESULTATER

BEGRÆNSNINGER

Independence of Irrelevant Alternatives

- Dvs. relative odds mellem og afhænger kun af karakteristika for og

- → så hvis kun er . Hvis skal være

konstant, dvs. , hvilket er urealistisk.

LØSNINGER

Page 34: Samlede eksamensnoter

34

1) Multinomial probit (= conditional probit)

a. I tillades

, hvor kovarianser er urestrikterede.

b. MEN ∷ besværlig beregning (inkl. -dim integral)

c. Dog: simulationsmetoder

2) Hierakiske modeller ∷ fx nested logit model

a. Idé ∷ indfør 2 lag ∷ først vælger man mellem grupper, derefter vælger man inden for de enktelte

grupper (betinget på at vælge gruppe , er der conditional logit blandt alternativer i den gruppe.

15.9 Ordered response – ordered logit/probit

Valg har ordinal, men ikke kardinal nytte (2 er bedre end 1, men ikke nødv. halvt så meget som 4)

Del op

Response probs:

INTET INTERCEPT i ∷ ’erne spiller rolle af intercept (for er interceptet)

Loglike

(og vælg som sædvanligt med .

RESULTATER

Ellers ∷ Evaluér ved referenceperson / rapporter % korrekt predikteret

BEMÆRKNINGER

- Hverken eller har separat betydning.

- Vælg i stedet for ⇒ ordered logit

- Valg kan tillægges tal, fx ”hvor mange % sætter du i aktier, 25%, 50% eller 75%?”

- ⇒ ingen betydning for estimation, men giver mening til .

- UOBS.EFF ∷ (dvs. ) ∷ @ Chamberlain tilgang (antag+approx pdf for og integrér ud)

INTERVAL-KODET DATA

Samme idé, men teknisk bøvl

OBS! Nu giver faktisk mening, og har fortolkning som om det var OLS!

Page 35: Samlede eksamensnoter

35

16 Censored regressions and corner solution models

2 typer

1) Censored data

a. Observerer

2) Corner solutions

a.

16.1 Tobit

ANTAG ∷

- ⇒ .

16.1.1 Estimation

TÆTHED ∷ ens for

Cond.log.like

INFERENS

- Alm. MLE

- Wolle giver første/anden afledte

16.1.2 Quantities of interest

Afh. af model:

- Censoring ∷ den latente variable; , eller

- Corner solution ∷ den faktiske variable,

UDLEDNING

-

- fordi , , så

-

- Derfor

-

-

Page 36: Samlede eksamensnoter

36

PARTIAL EFFECTS

BEMÆRK‼

- De part.eff.’s er bare skaleringer af ’erne

- (specielt, skaleret med -variable ⇒ vi forventer

)

Fra NOTERNE:

RESULTATER

- CENSORING ∷ husk, er interessen ⇒ rapportér

- CORNER ∷ vis .

16.2 Neglected heterogeneity (§16.6.1)

KONKLUSION

CENSORING ∷ intet problem, tobit konsistent for (?? p530??)

CORNER ∷ måske, vil vi have eller ?

- LØSNING ⇒ integrér ud.

ANTAG ∷

PROBLEM ∷ skal håndteres eksplicit

LØSNING ∷ integrér ud, dvs.

ANTAG ∷ har pdf.

- Så er og

- EKS

- Diskret:

Page 37: Samlede eksamensnoter

37

- Kont: , ⇒ pga. .

⇒ &

16.3 Endogenous

Som for discrete choice

⇒ må antage mere struktur ∷ den endogene, , antages

⇒ antag så

⇒ vi kan erstatte , hvor

- Tobit ∷ 2-step (Smith-Blundell) ∷ estimér reduceret form for endogene ved OLS ↷ inkludér

residualer (dvs. tobit af på )

- Som for probit

- Std.fejl skal korrigeres

- MEN ∷ estimeres ikke (relevant for CORNER når man estimerer APEs)

- Fuld MLE ∷ specificér simultane fordeling af de endogene vha.

- Indsætter direkte og estimerer den samtidig @ ML

TEST ∷ i begge settings testes (eller efter parameterisering) via alm. -test.

- DOG ∷ ML en del tungere beregningsmæssigt ↷ estimér Smith-Blundell først og test endo i den.

16.4 Hetsked & ikke-normalitet

ALVORLIGE KONSEKVENSER

Inkonsistens (da ML afh. af fuld fordeling)

OBS! Modsat alm. OLS, hvor kun kræves for konsistens

TEST

Hetsked @ LM (score) tilgang → så estimerer vi den almindelige Tobit som nested i en mere generel model

- I generel model: specificér hetsked

Non-normalitet ∷ svær – noget med probit

16.5 Estimation under svagere antagelser

16.5.1 Powel estimatoren

POINTE ∷ slippe for at antage .

ANTAG ∷

- Dvs. ingen pdf / uafh. antagelser

ESTIMATION

LAD (least absolute deviations)

M-ESTIMATION

Page 38: Samlede eksamensnoter

38

- er kontinuert ⇒ konsistens følger af 12.2

- MEN ∷ ikke differentiabel ⇒ kan ikke bruge 12.3

- Powel viser dog -asymptotisk normalitet.

RESULTATER

Censored:

- , HVIS ’s fordeling er symmetrisk omkring 0

Corner solution:

- Ingen af de ønskede kræver antagelser om fordeling

- MEN ∷ specifikationstest for Tobit modellen

PROBLEMER

Criterion function er diskontinuert ved :

- Desuden ∷

.

- (generelt for LAD)

Alternativt – ILPA (iterative linear programming algorithm)

- Estimér median-reg på fuldt sample ⇒ fjern ⇒ estimér med-reg ⇒ fjern ⇒ …

- Hvis konvergens er der gevinst.

16.5.2 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff.

IDE ∷ I Tobit er ” ” og ” ” den samme

⇒ måske forskellig virkning på den intensive vs. den ekstensive margin.

⇒ Hurdle / two-tier models ∷ hurdle’n eller tier #1 er, om man skal vælge eller . Tier #2 er hvor

stor skal vælges.

MODEL

- , og .

16.6 Tobit for panel

16.6.1 Sml. med alm. tobit

ANTAG ∷

Tobit på cross-section med obs.

Page 39: Samlede eksamensnoter

39

Inferens @ robuste estimatorer; , med potentielt

- Fordi og

, så afhænger af corr.

mellem og .

-

, hvor vælges som enten

, (bedst hvis

tilgængelig) eller

-

er den simpleste for .

POSITIVT

- Kræver ikke streng exo af

- Antager , men ikke

- Laggede i er ok

- Seriel korr. i er ok

- Ingen antagelser om , kun

Laggede dep.vars. er bøvlede at inkludere ( observeres kun delvist)

YDERLIGERE ANTAGELSE

- Dynamic completeness ∷ .

- OBS! dyn.compl antagelse om uafh.!

- MEN ⇒ netop den antagelse, der giver, at alm. inferens duer

- TEST ∷ medtag flg. 2 vars i alm. Tobit ∷ og ↷ test samtidig

16.6.2 Tobit med unobserved effects

ANTAG ∷

- ⇒ streng exo, ,

MULIGHEDER

1) Estimér ⇒ incidental parameters

2) Antag ⇒ Random Effects tobit; Chamberlain-tilgang

3) Eliminér ved transformation @ Honoré (1992)

Random effects tobit – antag pdf for c

ANTAG

- ⇒ ⇒ , dvs. streng eksogenitet‼‼ (udelukker noget fra )

- Og (eller følger det af ovenstående?)

- ,

- og

- dvs.

- Bemærk, , så er for

Page 40: Samlede eksamensnoter

40

IDENTIFICEREDE params ∷

PRAKSIS

- Alm. tobit, hvor medtages i hver periode (evt. kan bruges for at blive mere generel,

men det er tungere beregning)

- ⇒ identifikation hvis der er tidsvariation i .

RESULTATER ∷ CENSORED

- Tilføjelsen af har løst alle problemer ( er nemlig identificeret)

RESULTATER ∷ CORNER

- Vi kan tage differenser / se på ∂ ved ( ) evalueret ved fx .

- APE’s kan estimeres jf. wolle

VIDERE

- Muligt at relaxe

- Muligt at udvide Powel til dette setting.

16.6.3 Dynamic unobserved effects tobit

DUER KUN (/bedst) FOR CORNER!

ANTAG ∷

- Dvs. streng exo af

BEMÆRK

- Corner ∷ afhænger af, om eller 1.

- Censored ∷ giver bedre mening at inkludere ⇒ bøvlet som bar fuck!

Problem: initial conditions

IDE ∷ antag fordeling for betinget på og (wow, hele !)

PRAKSIS

- Kør bare random effects tobit med regressorne: og inkluderet i hver periode.

MODEL

17 Sample selection attrition and stratified sampling

17.1 Sample selection

ÅRSAGER til ikke-tilfældig sampling:

Page 41: Samlede eksamensnoter

41

- Selektion på forklarende variabel ∷ fx kun 30-50-årige

- Truncation ∷ selektion på forklaret variabel ∷ fx ser kun om folk har job for folk, der har et job

- Adfærd ∷

a. Non-response

b. Attrition (dropper ud over tid – ikke problem i register-data)

c. Ser kun løn for dem, der vælger at tage arbejde

i. Anden variabel forklarer mangel – Heckman selection kan løse dette.

17.2 Simpel model

Del datasættet op

- ∷ kun observeres

- ∷ bade og observeres.

MÅL

VISE ∷ .

- Så snart denne betingelse holder er pooled OLS ok

- … hvis ikke må vi benytte andre krumspring (antage mere struktur)

- OBS! Konklusionen gælder også for NLS!

- CMLE ∷ hvis vil MLE på det selekterede sample være konsistent.

ANVENDELSER (eksempler)

MULIGHEDER for selektion

1. er en (deterministisk) function af alene ∷

a. ⇒ ingen problemer, da uanset

b. (vi betiner en gang for meget)

2. er uafh. af og

a. ⇒ ingen problemer! Så ”indeholder ingen yderligere info om nogen aspekter af fordelingen af

, specielt ikke den betingede forventning”. Dvs.

b. ⇒

3. (truncation)

a. Antag fordeling af og brug truncated Tobit

b. ⇒ så kan vi udlede og bruge CMLE.

4. (disrete response selection)

a. Tillader afh. mellem og ∷ påvirker selection, men kun påvirker .

b. Det viser sig, at ∷

c. HECKMAN 2-step ∷

i. 1) estimér probit af på ↷ (på fuldt sample),

ii. 2) OLS af på og (på det selekterede sample)

Page 42: Samlede eksamensnoter

42

5. and (Tobit selection – e.g. hours worked)

a. Implicerer mere struktur

b. 2-step

i. 1) Estimér censoreret Tobit af på ↷ residualer

ii. 2) OLS af på og for de selekterede (dvs. med )

17.2.1 ML i sample selection – PMLE

Strukturel model ∷

Selektionsmodel ∷

UDNYT (hvor )

17.2.2 Sammenligning: ML vs. Heckit

FORDELE ∷ PMLE > Heckit

- Robust var-estimator (

) er valid – ingen generated-regressor problem

a. (dvs. konsistente varians-estimater – altså spg. ved inferens i Heckit))

ULEMPER ∷ PMLE < Heckit

- Stærke antagelser ∷ (men de kan testes vha. moment-tests)

- Numerisk tung

17.2.3 Ad 2SLS på selekteret data

TEOREM 17.1

model , instrumenter

Random sampling ∷ nok at antage og estimere med 2SLS på med instr .

Selection @ ∷

- ANTAG ∷ ,

- ⇒ 2SLS af på med isntr , hvor kun det selekterede sample bruges vil give konsistente estimater.

17.2.4 Ad 3: Truncation (selektion på y)

Selektionsligning

ANTAG ∷ fordeling for er kendt, dvs. en pdf og cdf er givet.

IDE ∷ ⇒ så kan vi finde ssh. for

da ingen andre led afh. af .

Page 43: Samlede eksamensnoter

43

TRUNCATED TOBIT

Fås ved at vælge .

SAMMENLIGNING

- FORSKEL ∷ i censored observeres også når censoreres, i truncated censoreres både og .

- LIGHED ∷ Hetsked / non-normalitet ⇒ inkonsistens

17.2.5 Probit selektion – exogene variable (Heckit)

bestemmes af en probit model.

CENTRALT ∷ ”the coding rule” er ikke kendt – i modsætning til top coding (hvor når ).

IDE ∷ antager parametrisk form for .

ANTAG

1) observeres altid. observeres når .

2) med .

- Mildere end , som er et specialtilfælde.

3)

- ok da ikke observeres.

4)

- Ville følge hvis .

ESTIMATIONSLIGNING

Pga. selektion kan vi kun håbe på at estimere og , men se, at

Dvs. vi mangler som regressor

MEN ∷ observeres ikke

LØSNING ∷ udtrykke ∷ udnyt at

- da det er en truncated normal ↷ inversel Mill’s ratio

OBS! Inkons af OLS skyldes omitted variable ∷

PROCEDURE (Heckit)

a) Få ∷ Estimér probit af på .

b) Estimér OLS af på med det selekterede sample.

- ⇒ konsistens og -asymptotisk normalitet

TEST

- Testes @ std. -værdi da ⇒ alm. OLS asymptotik holder selvom en var. for meget tages med

BEMÆRKNINGER

- Bøvlet at finde varians når

Page 44: Samlede eksamensnoter

44

- Stadig konsistent når (samme regressorer for og

- → MEN ∷ noisy ∷ id’es kun pga. ikke-linearitet i .

UDVIDELSE

- Hvis antages kan PMLE bruges (lang, grim …)

- → udnytter igen Bayes til at opskrive betinget på ud fra ssh. for givet over ssh. for generelt:

17.2.6 Probit selektion – endogene variable

ANTAG

1) observeres altid, observeres kun når .

2)

3) (skala arbitrær da )

4)

5) og i ligning 2 er hvor .

BEMÆRKNINGER

- OBS! Vi skal have vars i som bestemmer selektion og den endo (relevans), men ikke (exo)

- Ala alm. endo problem, men vi må antage struktur på den endo, .

- Arbitrær korrelation tillades mellem .

UDLEDNING

TRICK:

Her er pr. konstruktion

⇒ teorem 17.1 ∷ konsistent at bruges 2SLS af på .

PROBLEM ∷ mangler

PROCEDURE

1) Estimér konsistent ved probit af på (fuldt sample). Udregn .

2) Estimér 2SLS af på med instr (for sig selv) (for ) og (for sig selv) på selekteret

sample).

TEST

BEMÆRKNINGER

- kan være diskret.

- Eks. ∷ . Idé til instr: hvis man blev indstillet tilfældigt (men stadig

forsk. ssh. for at deltage på bgg. af )

- exo men manglende somme tider (non-response) ⇒ modellen duer stadig, skal instrumenteres.

Page 45: Samlede eksamensnoter

45

- Mindst 2 vars i skal bruges – tænk: én til og én til at identificere selektion ( ).

- (hvis ingen ekstra til selektion, vil id af køre på ikke-lin. af alene.

- Hvis vi antager , kan vi bruge PMLE.

Hvis y1 i stedet var binær

ANTAG ∷ (en masse) +

PROCEDURE

1) Estimér ved probit af på (for hele sample)

2) Indsæt i

(jf. §probit)

17.2.7 Tobit med eksogene forklarende vars

MOTIVATION ∷ separat variation i ⇔ vi kan sige ”hvor langt” man er fra selektion ⇒ mere efficient

EKSEMPEL ∷ timeløn, #timer arbejdet p.a.

ANTAG

1) observeres altid, observeres kun når .

2)

3) (skala ej arbitrær da observeres!)

4)

BEMÆRKNINGER

- Som for probit

- Tænk selektion: .

UDLEDNING

IDÉ ∷ hvis observeres ⇒ kør OLS på selekteret sample

MEN ∷ kan estimeres konsistent for de med , som netop er de selekterede ⇒

for selekteret.

PROCEDURE

1) Estimér ved tobit af på for hele samplet. Udregn .

2) Estimér ved OLS af på .

BEMÆRKNINER

- Efficiency gain ∷ intuitivt klart, vi kan se, hvor langt folk er fra de-selektion.

- OK med MODSAT probit! → @ nu har vi separat variation i .

- PMLE mulig @ ANTAG ∷

-

Page 46: Samlede eksamensnoter

46

- hvor er og

er den sædvanlige

.

17.2.8 Tobit med endogene forklarende vars

ANTAG

1) observeres altid, observeres kun når .

2)

3) (skala arbitrær da )

4)

5) og i ligning 2 er hvor .

UDLEDNING (som for probit med endo)

- her er pr. konstruktion ⇒ 2SLS på selekteret sample er ok, hvis kan medtages ⇒ estimér

@ Tobit.

PROCEDURE

1) Estimér ved Tobit af på . Udregn for selekterede .

2) Estimér ved 2SLS af på og vha. instr (for sig selv), (for ), (for sig selv) på

selekterede sample

BEMÆRKNINGER

- kan være kont. eller diskret.

17.3 Paneldata: Sample selection

Overordnet set: Attrition / selection i paneldata kan ske for 3 grunde

1. Tilfældigt (”rotation”) ⇒ nemt at håndtere

2. Folk vælger at droppe ud (attrition)

3. Incidental truncation (fx arbejdsløshed

17.3.1 Fixed effects på ubalancerede paneler

RESULTAT

- hvis kan vi ”uden videre” bruge formlerne med OLS på transformeret data, hvis vi

bare også ganger på hver gang (fx

)

MODEL

ANTAG

1) (⇐ )

2)

er invertibel (alm. rank-condition)

Page 47: Samlede eksamensnoter

47

3)

(⇒ alm. FE inferens holder)

BEMÆRK

- RE analyse kræver

ESTIMATION

- Definér

BEMÆRKNINGER

- FE kan kun bruge .

- Almindelig robust FE-varians kan bruges

- Tilladt at danne et balanceret subsample og estimere på det, fx vælge med .

- VIGTIGT! Vi kunne lige så godt have brugt FD metoder.

17.3.2 Test / korrektion for sample selection bias

Procedure (Nijman & Verbeek, 1992)

1) Estimér FE af på og på det ubalancerede sample.

2) , testes @ alm. -teststørrelse

Incidental truncation under H0: ingen selektionsbias

BEMÆRK ∷ en enkelt var observeres ikke i nogle perioder

IDÉ

- Chamberlain-inspireret ∷ tillader .

- Antager lineær struktur

- (alternativt bare lade tidsgennemsnittet for afgøre ∷ , hvilket sparer på

parametrene)

MODEL

PROCEDURE

1) Probit på (eller ) – fuldt sample. Udregn (eller .

2) FE af på og – selekteret sample. @ alm. OLS.

Incidental truncation under HA: selektionsbias

ANTAG ∷

1)

Page 48: Samlede eksamensnoter

48

2)

PROCEDURE

1) Probit på for hvert og gem for alle .

2) Pooled OLS på det selekterde sample af på .

BRUG robuste var-estimatorer

Incidental truncation Tobit selektionsligning

Hvis selektion i stedet sker på baggrund af hvor kan vi mere

Samme procedure som oven for virker, men med erstattet med osv.

I Tobit frameworket kan vi også tillade, at indeholder .

- INTUITION ∷ følger af, at så vil for alle (og vi betinger jo hele tiden på ).

17.3.3 Attrition – man vælger at udgå af sample

ANTAG ∷ ingen ”re-entry” ∷ attrition er en absorbing state.

MODEL

IDE ∷ sekventiel natur, ⇒ ↷ brug FD

og skriv (reduceret form) ligningen for selektion betinget på selektion i forrige periode

- fx kan indeholde og (ikke da den står på LHS for forrige periode ⇒ corr med

).

ANTAG

- ⇒

- (hvor ⇒ så vi ikke behøver betinge på det yderligere)

PROCEDURE

1) Probit på ↷ ↷

2) Pooled OLS af på , . Tests er ikke længere oplagt simple (robusthed

kræves).

PROBLEMER

- Antagelsen udelukker at kan påvirke attrition (efter betingning på ) – tænk: ingen samtidig

påvirkning fra til når der er kontrolleret for .

- antages at være strengt eksogen.

LØSNING ∷ IV

- Instrument , hvor (dvs. redundant i selektionsligningen) og er eksogen i modelligningen

- Step 2 i procedure: Lav 2SLS i stedet og instrumentér med (som fx kan være ).

17.3.4 Inverse probability weighting (IPW)

MÅL ∷ Generelisere metoder til ikke-lineær estimation (M-estimation)

ANTAG

Page 49: Samlede eksamensnoter

49

- Kaldes selection on observables eller ignorability of selection.

PROCEDURE

1) Probit på ↷ gem de fittede sandsynligheder; .

2) M-estimation på selekteret sample (dvs. gang med ), hvor målfunktionen vægtes med , dvs.

INTUITION

- Regularitet giver, at kan erstattes med når vi udregner asymptotik (antages ).

UDVIDELSE

- hvis attrition probit’en ændrer sig over tid??

- ⇒ bølvet at håndtere…

17.4 Non-parametric bounds

LOWER BOUND

-

UPPER BOUND

-

REMARKS

- Bounds are tight when ≅ .

- Intuition ∷ the more observations that are censored, the bigger the problem!

- (knew this already;)

18 Treatment effects

OVERORDNET ∷ ønsker at estimere og .

TILGANGE

1) Ignorability of treatment (ATE.1 og ATE.1’) ∷ regression, matching, weighting estimatorer (og evt.

mixed, som vi ikke ser på)

2) Regression discontinuity design

3) Panel data: difference in differences (og before-after)

4) IV

Page 50: Samlede eksamensnoter

50

18.1 Noten

- Internal validity ∷ hvilken effekt havde jobtræninsprogrammet ⇒ ønsker vi

- External validity ∷ hvilken effekt vil et hypotetisk program have ⇒ kan vi ikke få

Average treatment effect

- On the ∷ treated ∷ untreated ∷ overall

RUBIN’S CAUSAL MODEL

- outcome w/ treatment, outcome without (cont. or discount.)

- if treated, else .

- iid.

MISSING DATA ∷ only or is observed:

MULIGE ANTAGELSER

- ⇒

og

- Så er .

- OBS! Uafh. ⇒ vi kan fjerne betingning ∷ generelt er , men vi kan bare

kun udregne fordi missing data gør, at vi kun har når .

- ⇒ .

18.1.1 Nonparam id – ignorability of treatment

ATE1: betinget på er

ATE1’: a) og b) .

(selection on observables)

- ⇒ når er partialled out, vil de tilbageværende faktorer, der påvirker være uafh. af de tilbageværende,

som påvirker .

ATE’ ⇒ .

COMMON SUPPORT

- dvs. vi skal se single-mødre i begge grupper (treatment og non-treatment)

18.1.2 Regressions and switching models

- Tænk ∷ person-specifik gevinst ved programmet, så betyder, at

dem i programmet har særlige gevinster.

SWITCHING

ANTAG ∷

KAN VISE ∷ , hvor . Desuden (evt ik-lineær)

Page 51: Samlede eksamensnoter

51

ANTAG ∷ OG samt

- ANTAG VIDERE ⇔ ”⇔”

PROCEDURE

- Reg på ∷ koeff. til er .

-

- (s.e.’s på denne via bootstraps eller Δ-metoden.

18.1.3 Regression discontinuity

Average treatment effect at ∷ .

Vi definerer

ANTAG

- ATE.1 (ignorability of treatment) ∷ betinget på er uafhængig af .

- og er kontinuerte i (dvs. gevinsten er kont. i – er ikke!)

Under kontinuitet er avg. treatment effect at .

ESTIMATION

- INTUITION ∷ gns. for dem, som lige akkurat blev treated MINUS gns. for dem som lige

akkurat ikke blev treated

BEMÆRK

- Vi får blot en lokal gns. treatment effekt lige ved cutoff niveauet

- Hvis treatment effekten er heterogen er den ikke lig med hverken eller !

18.1.4 Before-after

Diff estimator

IDE ∷ sammenligne individ med sig selv!

OBS! Kræver paneldata og kan kun estimere (avg.treat.of.treated)

ANTAG

-

ESTIMATION ∷

- FØRST ∷ diff-estimator

- dvs. vi estimerer på det treatede sample og tjekker forskellen på og givet at man på et tidspunkt

bliver treated.

Page 52: Samlede eksamensnoter

52

MEN ∷ hvad med generel tids-trend? ⇒ motiverer diff-in-diff

Diff-in-diff

ANTAG

-

(dvs. at den gns. udvikling over tid er den samme i de to grupper ⇔ samme tids-trend)

SÅ ER

ESTIMATION ∷ overraskende nemt i regressions-framework

ANTAG ∷ .

- Indfør controls

- FUCK! Hvis folk selekterer ind i programmet er … AHA! BRUG FD!

PROCEDURE

- Regressér på , hvor er koefficienten til .

BEMÆRKNINGER

- Bygger på antagelsen om, at randomisering holder i FD

- Antagelsen tillader selektion på unobservables, men kun hvis de er tidsinvariante

- Dvs. fx ikke Ashenfelter’s dip ∷ discouraged worker lige før treatment.

18.1.5 Selection and treatment effects

OPSPALTNING af det ”observerede” gain

- Selection bias = ability bias i labour econ

- Sorting bias = selection on the gain, “forhåbentlig” treates dem med størst potential gevinst.

- Når der er både selection og sorting bias: essential heterogeneity

TIDLIGERE ∷ Diff-in-diff eneste estimator, der tillod

18.1.6 Estimation af ATE ved IV under antagelse af homogen treatment effect

ANTAG

- ATE.2 ∷

a)

b)

c)

Page 53: Samlede eksamensnoter

53

FORKLARINGER

- a) ⇒ , idet vi kan skrive

- b) ≅ exclusion restriction, i.e. spiller ingen rolle i ligningen for . Desuden b) ⇒ .

Dermed kan vi skrive ligningen for som

MEN ∷ og kan godt være korrelerede‼ ⇒ endogenitetsproblem

Procedure 1: Alm. IV

Instrumentér med og med sig selv.

Procedure 2: IV med propensity score

Hvis vi er villige til at gøre yderligere antagelser, kan vi få en mere efficient procedure

Erstat c) med ∷ og og yderligere d)

1) estimér (tænk ), fx med probit (som funktion af og )

2) instrumenter med i stedet for

18.1.7 Heterogene treatment effects (v0 ≠ v1)

ANTAG

PROCEDURE

1) Estimér i med MLE og få (fx probit / logit)

2) Estimér ved 2SLS med instr

18.1.8 LATE (local average treatment effects)

CHANGE MINDSET ∷ nu to typer treatment!

- Vi trækker for alle individer ⇒ smider én af ’erne væk ⇒ smider én af ’erne væk.

- PRAKSIS ∷ TÆNK vi observerer kun , men ønsker at tænke det sådan, at der kunne have

været et andet udfald, hvis havde været på en anden måde.

- ∷ hvis , observerer vi , hvis observerer vi .

ANTAG

-

- (monotonicitet)

Page 54: Samlede eksamensnoter

54

(…)

ESTIMATION

- , hvor er sample avg. af over .

- IV reg på med som IV for ⇒ koeff. til .

FORTOLKNING

- gns. treatment effekt på dem, som ville participate hvis blev ændret fra 0 til 1.

BEMÆRK

- defineres ud fra variationen i

- Modsat og , som defineres ud fra forhold i populationen

- Vi kan ikke observere populationen med (dvs. hvor og missing) (lige så vel som

vi ikke observerer ’erne for de treatede)

- Modsat er forventning over den treatede del af populationen, som vi kan finde eksplicit.

- GENERELT ∷ .

- HVIS forudsiger perfekt hvem, der bliver treated, og hvis dem, der bliver treated også er dem,

der har størst gain, vil .

- HVIS , vil .

18.1.9 Essential heterogeneity and IV (sorting on the gain)

Essential heterogeneity ⇔ der er bade sorting og selection.

→ her: en model hvor der er sorting på gains!

MODEL

- Her (må)

- Definer

- (bemærk ligheden til . )

DET GIVER INGEN MENING‼

INGEN OVERHOVEDET‼

18.1.10 Sammenhæng med den simple sample selection model

ANTAG ATE.4

Page 55: Samlede eksamensnoter

55

a) for

b) for

c)

d) , hvor

e) og , hvor så

SÅ KAN VI SKRIVE

- fx

- … og endelig

PROCEDURE

1) Probit af på , dvs. . Få

2) Regresser @ POLS ∷ på

Sammenligning med IV tilgangen

IV ∷ 1) estimér 2) kør 2SLS med inkluderet som regressor.

- ANTAGER at

∷ restriktivt

DENNE ∷ 1) estimér 2) reg pooled OLS med de genererede regressorer

- Tillader comparative advantage structure samt hierarkisk struktur – sandsynligt.

18.2 Ikke-parametrisk tilgang

- ⇒ – begge estimeres som avg. effekt i sub-sample bestående af de treatede

Mindre struktur ∷ antage mean independence ∷ dvs. nok at tage hensyn til (⇐ fx )

- Faktisk, ⇒ (men )

MODELTANKEGANG

SÅ ER

- dvs. er lig den generelle plus den forventede individuelle gevinst ved at blive treated (

er lig den individspecifikke gevinst ved treatment)

- Bemærk ∷ kræver flere antagelser (typisk) end .

18.3 Mere parametrisk tilgang

ANTAG

- ATE.1 ∷ og er uafhængige når vi har betinget på

- ATE.1’ ∷ (a) (b)

RESULTAT

SMART ∷ Definér

Page 56: Samlede eksamensnoter

56

Så er

og samt er sådan set det, vi har i vores datasæt!

→ dermed er identificeret for .

→ vi kan estimere den ikke-parametrisk!

ESTIMATER

PROBLEM ∷ std.fejl skal fås fra de evt. non-param ’er ⇒ men muligt @ bootstrap / Δ-metoden.

18.3.1 Switching regression

Vi kan som nævnt altid tænke

så indsat i definitionen giver det

som vi tænker på som en reg model

ANTAG ∷

- ATE.1’ ∷ for .

-

⇒ så er (fik vi allerede tidligere) og endvidere er

- med og

- TÆNK ∷ er et fejlled, som vi har antaget betinget middelværdi nul for.

EKSEMPEL

- Vælg (eller for lidt mere generelitet)

18.3.2 Svagere antagelser – to ukendte g-funktioner

ANTAG

- ATE.1’

⇒ så er

- hvor , og .

KONKLUSION ∷ ATE.1’ alene giver os to ting:

Page 57: Samlede eksamensnoter

57

1) er en funktion af og og (en funktion af ), dvs.

2) er additiv i

PROBLEM – Saturated model

- Hvis ’erne vælges for komplekse får vi problemer (ikke datatæthed alle vegne)

For at komme videre: antag form for g0 og g1

ANTAG

- ATE.1’

- for .

⇒ så er

- hvor

ESTIMATION

- OLS af på

RESULTATER

- (husk nemlig at uden antagelser er )

18.3.3 Regression disc. designs

Hvis og hvis har en diskontinuitet, kan det udnyttes

- ofte vil fx , eksempelvis briller gives til børn med dårligere syn end ± 2

⇒ sammenligne personer med næsten samme ’er, men hvor én treates og én ikke gør.

18.4 Propensity score

Ved at fokusere på (i regression eller mere ”ikke-parametrisk”), kan man opnå konsistente estimater af

og

→ MEN ∷ der gemmer sig nogle ret tunge antagelser under.

18.4.1 ATE skrevet som funktion af p, som estimeres med probit

ANTAG

- ATE.1’

- (mao. antag og )

SÅ ER

IDE ∷ kan fås fra probit

Page 58: Samlede eksamensnoter

58

PROCEDURE

1) Estimér ∷ fx vha. logit/probit med en Sieve funktionaf inden i

2) Tag sample equivallent af og

- (hvor

.)

BEMÆRKNINGER

- Logit/probit sikrer, at , men måske maskerer det bare det mulige sample problem, at der findes

så …

- Det hele kommer til at hvile på, hvordan man estimerer .

18.4.2 Regressér y på w og p-hat

Simpel idé: tilføj som regressor, dvs. sæt ” ”

- regressér på

MOTIVATION

- Som før… hvis vi tillader , kan vi opskrive det som en regression

ANTAG

- ATE.1’

- er ukorreleret med

SÅ GIVER regressionen -asymptotisk normalt estimat af (koeff. til ).

PROCEDURE

- Estimér ∷ fx med probit.

- Tilføj som regressor, dvs. regressér på

BEMÆRKNINGER

- Man kan også køre regression en på , men så skal man i stedet antage, at

er lineær i for .

18.5 Matching

ANTAG

-

-

Så kan vi estimere

BEMÆRKNINGER

Page 59: Samlede eksamensnoter

59

- Matching estimatorer “balancerer” samplet så det ligner, at kovariaterne kommer fra mere “iid-agtige”

processer.

- Tillader heterogene responses – ikke-parametrisk tilgang ⇒ ingen restriktioner på respons.

- Bedre -estimator ∷ ikke bare bruge de nærmeste, men alle naboer vægtet efter deres “afstand” i .

18.6 IV-metoder

Skriv ligningen som

TILLADER

- tillades at være endogen

- (⇒ OBS! i alm. 2SLS er der ingen yderligere betænkninger ved at instrumentere en dummy!)

BEMÆRK

- Hvis , er generelt

- (dvs. hvis og har samme stokastiske led, så vil interaktionsleddet med gå ud, og

afhænger altså ikke af (svarende til, at essentielt set))

HVIS ∷ instrument ukorr. med sammensatte fejlled ⇒ potentielt muligt at instrumentere

ANTAG ATE.2 ∷ ortogonal eligibility

- og en mildere version af og mere

SÅ ⇒ direkte estimation kører og vi kan skrive

- og

- TÆNK ∷ eligibility uafh. af observables, fx Angrist’s lotteri for værnepligt: lotterinummer (højt

⇒ nok ind og springe, men nogen slap && tilfældigt)

ANTAG ATE.2’ ∷ IDÉ: er det optimale instrument for

- og (fx probit) og mere

PROCEDURE

1) Estimér ved MLE (fx probit).

2) Estimér , dvs. på og med instrumenter og .

BEMÆRK ∷ bygger vigtigt på antagelsen om, at er korrekt specificeret!

MERE STRUKTUR

- Skriv , hvor altså for

ANTAG ATE.3 ∷

- ATE.2 … og…

- for

- (evt. nok med . )

Da bliver og

PROBLEM ∷ og korrelerer måske… og måske gør en af regressorne

LØSNING ∷ IV

PROCEDURE

Page 60: Samlede eksamensnoter

60

1) Estimér ud fra (probit)

2) OLS af ovenstående ligning, på med instr .

BEMÆRK ∷

- er crucial!

ANTAG ATE.4 ∷

- … en masse plus

PROCEDURE

1) Estimér og .

2) OLS på med instr (dvs. for , alt andet for sig

selv).

ANTAG ATE.4’

- Som ovenstående, men OG

PROCEDURE

1) Estimér og .

2) OLS uden IV på .