39
Facultad de Ciencias Económicas y Empresariales ECONOMETRÍA 3 REGRESIÓN LINEAL MÚLTIPLE II José Alberto Mauricio Departamento de Análisis Económico y Economía Cuantitativa

3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

  • Upload
    others

  • View
    13

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

Facultad de CienciasEconómicas y Empresariales

ECONOMETRÍA

3

REGRESIÓN LINEAL MÚLTIPLE II

José Alberto Mauricio

Departamento de Análisis Económico y Economía Cuantitativa

Page 2: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

II

EctrGr-JAM-3.pdf

COPYRIGHT 2012-2019 José Alberto Mauricio E-mail: [email protected]

Versión 5.1 - Enero 2019

Page 3: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

III

3

REGRESIÓN LINEAL MÚLTIPLE II

BIBLIOGRAFÍA Wooldridge (2013), Capítulos 7, 8. Sección 9.5.

Heij, de Boer, Franses, Kloek, van Dijk (2004), Secciones 5.3, 5.4, 5.6.

El apartado indicado en estas transparencias con el símbolo no forma parte del programa actual de la asignatura.

Page 4: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

IV

CONTENIDO

3.1 Variables Explicativas Binarias ............................................................................... 1 Términos Constantes Distintos ................................................................................... 1 Pendientes Distintas .................................................................................................... 4 Extensiones ................................................................................................................. 6

3.2 Diagnosis de Residuos ............................................................................................. 9 Análisis Gráfico ......................................................................................................... 10 Observaciones Influyentes ........................................................................................ 14

3.3 Heteroscedasticidad ............................................................................................... 23 Consecuencias .......................................................................................................... 25 Detección ................................................................................................................... 26 Utilización Adecuada de MCO .................................................................................. 28 Mínimos Cuadrados Ponderados .............................................................................. 28

3.4 Recomendaciones Prácticas .................................................................................. 33

Page 5: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

ECONOMETRÍA PÁGINA 1

3.1 Variables Explicativas Binarias

Las variables explicativas binarias se utilizan para clasicar todas las observaciones de una muestra en dos o más categorías (grupos) exhaustivas y excluyentes en función de una característica determinada, como en los dos ejemplos siguientes:

Dividir una serie temporal en dos períodos para contrastar la estabilidad de los parámetros de un modelo entre dichos períodos (cambio estructural).

Dividir una sección cruzada en dos grupos (por ejemplo hombres y mujeres) para contrastar la homogeneidad de los parámetros de un modelo entre dichos grupos.

TÉRMINOS CONSTANTES DISTINTOS

[MR.1] 1 2Y X Ub b= + + .

[MNR.1.1] 1 1 2A A B BY D D X Vb b b= + + + , donde 1Ab , 1Bb son términos constantes posiblemente distintos entre sí (Figura 1), y AD , BD son dos variables binarias.

Page 6: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS

ECONOMETRÍA PÁGINA 2

1B

X : VARIABLE EXPLICATIVA

Y :

VARI

ABL

E D

EPEN

DIE

NTE

2Pendiente

1A

A 1A 2E [Y|X] X

B 1B 2E [Y|X] X

AB

0

FIGURA 1 MNR.1 - Términos Constantes Distintos - Pendientes Iguales

Page 7: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS

ECONOMETRÍA PÁGINA 3

1A BD D+ = en cada observación (clasicación exhaustiva y excluyente).

1B AD D= - (alternativamente, 1A BD D= - ), por lo que [MNR.1.1] queda:

1 1 1 2( ) ,B A B AY D X Vb b b b= + - + + o bien:

[MNR.1.2] 1 2 .B AB AY D X Vb a b= + + +

1 1E [ ] E [ ] .A B AB A BY X X Y X X a b b* *| = - | = = = -

El contraste de 0 1 1: ( 0)A B ABH b b a= = frente a 1 1 1: ( 0)A B ABH b b a=/ =/ es un simple contraste de signicación individual en [MNR.1.2].

También valdrían alternativas unilaterales, como 1 1 1: ( 0)A B ABH b b a> > , o bien como 1 1 1: ( 0)A B ABH b b a< < .

1 para observaciones del grupo .

0 para el resto.A

AD

ìïïº íïïî

1 para observaciones del grupo .

0 para el resto.B

BD

ìïïº íïïî

Page 8: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS

ECONOMETRÍA PÁGINA 4

La categoría (grupo) cuya variable binaria no aparece explícitamente en el modelo no restringido se denomina la categoría base o de referencia.

PENDIENTES DISTINTAS

[MR.1] 1 2Y X Ub b= + + .

[MNR.2.1] 1 2 2( ) ( )A A B BY D X D X Vb b b= + + + , donde 2Ab , 2Bb son dos pendientes posiblemente distintas entre sí (Figura 2).

Como 1B AD D= - (alternativamente, 1A BD D= - ), [MNR.2.1] queda:

1 2 2 2( )( )B A B AY X D X Vb b b b= + + - + o bien:

[MNR.2.2] 1 2 ( ) .B AB AY X D X Vb b d= + + +

2 2E [ ] E [ ] ( ) .A B AB A BY X X Y X X X Xd b b* * * *| = - | = = = -

El contraste de 0 2 2: ( 0)A B ABH b b d= = frente a 1 2 2: ( 0)A B ABH b b d=/ =/ es un simple contraste de signicación individual en [MNR.2.2].

Page 9: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS

ECONOMETRÍA PÁGINA 5

1

X : VARIABLE EXPLICATIVA

2BPendiente

A 1 2AE [Y|X] X

B 1 2BE [Y|X ] X

2APendiente

0

Y :

VARI

ABL

E D

EPEN

DIE

NTE

ABX

FIGURA 2 MNR.2 - Términos Constantes Iguales - Pendientes Distintas

Page 10: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS

ECONOMETRÍA PÁGINA 6

EXTENSIONES

Términos constantes y pendientes distintos

[MR.1] 1 2Y X Ub b= + + .

[MNR.3.1] 1 1 2 2( ) ( )A A B B A A B BY D D D X D X Vb b b b= + + + + (Figura 3).

Como 1B AD D= - (alternativamente, 1A BD D= - ), [MNR.3.1] queda:

1 1 1 2 2 2( ) ( )( )B A B A B A B AY D X D X Vb b b b b b= + - + + - + o bien:

[MNR.3.2] 1 2 ( ) .B AB A B AB AY D X D X Vb a b d= + + + +

E [ ] E [ ] .A B AB ABY X X Y X X Xa d* * *| = - | = = +

El modelo [MNR.3] es el modelo no restringido más general (el menos restringido), que puede compararse con cualquiera de los modelos [MR.1], [MNR.1], [MNR.2], para contrastar una gran variedad de hipótesis sobre la estabilidad (homogeneidad) de los parámetros entre las dos categorías consideradas.

Page 11: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS

ECONOMETRÍA PÁGINA 7

1A

X : VARIABLE EXPLICATIVA

2BPendiente

B 1B 2BE [Y|X ] X

A 1A 2AE [Y|X] X

2APendiente

0

1B

Y :

VARI

ABL

E D

EPEN

DIE

NTE

AB ABX

FIGURA 3 MNR.3 - Términos Constantes y Pendientes Distintos

Page 12: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS

ECONOMETRÍA PÁGINA 8

Por ejemplo, el contraste de 0 : ( , ) (0, 0)AB ABH a d ¢ ¢= frente a 1 : ( , ) (0, 0)AB ABH a d ¢ ¢=/en [MNR.3.2] (contraste de signicación conjunta de ABa y ABd ), es idéntico al Test de Chow de ausencia de cambio estructural en un modelo RLS (que puede llevarse a cabo comparando la SCR de [MR.1] con la de [MNR.3]).

Más de dos grupos por característica

Los modelos [MNR.1.2], [MNR.2.2], [MNR.3.2], indican que para clasicar las observaciones de una muestra en G grupos o categorías, es suciente incluir en un modelo 1G - variables binarias. El grupo cuya variable binaria no se incluye es el grupo base o de referencia.

Más de una característica

Para clasicar las observaciones de una muestra atendiendo a más de una característica, se emplea un conjunto de variables binarias especíco para cada característica.

Ejemplos con EViews

Aspectos básicos y extensiones: (i) ST04-Chow-1.wf1, (ii) SC04-Salarios4.wf1.

Page 13: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

ECONOMETRÍA PÁGINA 9

3.2 Diagnosis de Residuos

Complicated phenomena, in which several causes concurring, opposing, or quite independent of

each other, operate at once, so as to produce a compound effect, may be simplified by

subducting the effect of all the known causes, as well as the nature of the case permits, either by

deductive reasoning or by appeal to experience, and thus leaving, as it were, a residual

phenomenon to be explained. It is by this process, in fact, that science, in its present advanced

state, is chiefly promoted.

JOHN F.W. HERSCHEL

A Preliminary Discourse on the Study of Natural Philosophy 1830

Citado en Cook, R.D.; Weisberg, S. (1982), "Residuals and Influence in Regression", Chapman & Hall

Evaluar la abilidad de un modelo RLM estimado ( ˆ ˆ= +y X ub ) requiere comparar las propiedades muestrales de sus residuos con las pautas teóricas de las perturbaciones impuestas por las hipótesis del modelo especicado ( = +Y X Ub ). Cualquier discrepancia signicativa debe resolverse modicando el modelo en la dirección adecuada.

Page 14: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 10

ANÁLISIS GRÁFICO

Las hipótesis E[ ] 0iU =X (exogeneidad estricta) y 2 2E[ ]iU s=X (homoscedasticidad) sugieren que el nivel medio y la dispersión de los residuos deben ser constantes (en particular, deben ser independientes de los datos sobre todas las variable explicativas).

Ambas hipótesis pueden contrastarse (informalmente) examinando grácos de dispersión (nubes de puntos) de los residuos sobre las variables explicativas y/o los valores ajustados.

Si el orden de las observaciones es relevante (series temporales), las dos hipótesis anteriores y la hipótesis 1 2E[ ] 0i iU U =X (ausencia de autocorrelación) también pueden contrastarse examinando un simple gráco ordenado (temporal) de los residuos.

Con frecuencia, el incumplimiento de HC3-HC4 se debe a errores de especicación en el conjunto de variables explicativas o en la forma funcional del modelo (Secciones 2.1, 2.5).

La hipótesis de Normalidad (HC5) puede contrastarse con el histograma de los residuos.

El examen de los grácos mencionados también ayuda a detectar observaciones atípicas que pueden inuir notablemente en los resultados de la estimación de un modelo.

Page 15: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 11

-2

-1

0

1

2

-2 -1 0 1 2

VALORES AJUSTADOS

RES

IDU

OS

Sin síntomas de mala especificación

-2

-1

0

1

2

-2 -1 0 1 2

VALORES AJUSTADOSR

ESID

UO

S

Variables Omitidas - Forma Funcional

FIGURA 4 Análisis Gráfico de Residuos I

Page 16: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 12

-2

-1

0

1

2

-2 -1 0 1 2

VALORES AJUSTADOS

RES

IDU

OS

Heteroscedasticidad

Contrastes deHeteroscedasticidad -2

-1

0

1

2

0 4 8 12 16 20

Nº DE ORDEN (TIEMPO)R

ESID

UO

S

Autocorrelación

Contrastes deAutocorrelación

FIGURA 5 Análisis Gráfico de Residuos II

Page 17: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 13

0.0

0.1

0.2

0.3

0.4

-4 -2 0 2 4 6 8 10 12 14

RESIDUOSN(1.7,1.9)

Estadístico de Jarque-Bera:Chi-Cuadrado(2) = 190.256 (0.0000)

0.0

0.1

0.2

0.3

0.4

0.5

0.6

-3 -2 -1 0 1 2 3

RESIDUOSN(0.0,1.0)

Estadístico de Jarque-Bera:Chi-Cuadrado(2) = 1.674 (0.4330)

Residuos Normales Residuos No Normales

FIGURA 6 Análisis Gráfico de Residuos III

Page 18: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 14

OBSERVACIONES INFLUYENTES

Una observación (punto muestral) es inuyente si los resultados de la estimación de un modelo cambian notablemente al eliminar de la muestra dicha observación [Figuras 7-9]. En la práctica, la presencia de una observación inuyente en una muestra puede deberse a:

Un error en los datos que conforman dicha observación.

La existencia de un punto muestral (una entidad o un momento) que es muy diferente del resto en algún aspecto relevante.

Una observación inuyente del primer tipo debe corregirse (cuando es posible), o bien eliminarse del análisis (cuando no es posible corregirla). Una observación inuyente del segundo tipo no debe eliminarse de manera rutinaria:

Siempre debe ser examinada para intentar explicar su carácter especial.

Su presencia puede indicar algún error de especicación que debe ser corregido.

Sólo debe eliminarse en casos sucientemente justicados (cuando hace referencia a una entidad o a un momento que es especial por determinados motivos que carecen de interés en el análisis, o cuando distorsiona las conclusiones generales del mismo).

Page 19: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 15

Caracterización de observaciones influyentes

Una observación es atípica (outlier) cuando su dato de la variable dependiente destaca sobre los datos de dicha variable en otras observaciones que son, por el contrario, similares en cuanto a los datos de las variables explicativas. En general, una observación atípica es al mismo tiempo una observación inuyente, que se maniesta a través de un valor grande (atípico o anómalo) en el residuo correspondiente (Figura 7).

Una observación es extrema o potencialmente inuyente (high-leverage point) cuando sus datos de las variables explicativas destacan sobre los datos de dichas variables en el resto de la muestra. Una observación extrema es inuyente cuando su dato de la variable dependiente no destaca del resto de la muestra (Figura 8). A diferencia del caso anterior, una observación extrema inuyente no suele tener asociado un residuo atípico.

Una observación extrema cuyo dato de la variable dependiente sí destaca del resto de la muestra, puede ser (Figura 9A) o no (Figura 9B) una observación inuyente; cuando sí lo es, tampoco (como en el caso anterior) suele tener asociado un residuo atípico.

Page 20: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 16

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

2

ˆY1 = 5.812 + 0.096X1 + U(2.211) (0.232)

R = 0.021, N = 10.

RLS de Y1 sobre X1 con los datos de la Tabla 1Muestra completa

10u : residuo atípico

A

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

RLS de Y1 sobre X1 con los datos de la Tabla 1Sin la observación nº 10

2

ˆY1 = 4.094 + 0.357X1 + U(0.691) (0.075)

R = 0.762, N = 9.

B

FIGURA 7 Observaciones Atípicas

Page 21: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 17

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

RLS de Y2 sobre X2 con los datos de la Tabla 1Muestra Completa

2

ˆY2 = 5.791 + 0.219X2 + U(1.011) (0.129)

R = 0.264, N = 10.

A

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

RLS de Y2 sobre X2 con los datos de la Tabla 1Sin la observación nº 10

2

ˆY2 = 2.347 + 0.734X2 + U(2.701) (0.397)

R = 0.328, N = 9.

B

FIGURA 8 Observaciones Extremas I

Page 22: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 18

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

RLS de Y3 sobre X2 con los datos de la Tabla 1Muestra Completa

2

ˆY3 = 12.065 - 0.719X2 + U(1.587) (0.203)

R = 0.611, N = 10.

A

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14 16 18 20

RLS de Y4 sobre X2 con los datos de la Tabla 1Muestra Completa

2

ˆY4 = 2.362 + 0.731X2 + U(0.899) (0.115)

R = 0.835, N = 10.

B

FIGURA 9 Observaciones Extremas II

Page 23: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 19

TABLA 1 Datos utilizados en las Figuras 7 a 9 - Num03-ObsInf.wf1

Y1 Y2 Y3 Y4 X1 X2

1 8.3 6.6 6.6 6.6 10.8 6.0 2 6.0 5.7 5.7 5.7 6.6 6.6 3 6.7 7.3 7.3 7.3 9.0 7.6 4 7.7 8.5 8.5 8.5 9.6 6.5 5 8.1 8.8 8.8 8.8 11.3 7.8 6 8.5 7.0 7.0 7.0 13.5 7.0 7 5.9 8.0 8.0 8.0 5.8 7.5 8 5.4 7.5 7.5 7.5 4.0 6.5 9 8.3 6.4 6.4 6.4 8.0 5.4 10 2.0* 8.5 1.0* 12.6* 12.4 14.0*

Observación: Estimar un modelo [M] eliminando una observación [I] es (casi) equivalente a estimar con la muestra completa el modelo [M]¢ que resulta de añadir a [M] una variable binaria [B] denida para la observación [I]. El contraste de signicación de [B] en [M]¢ puede interpretarse como un contraste de inuencia de la observación [I].

Detección de observaciones influyentes

Observaciones atípicas - Grácos de residuos.

Page 24: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 20

Observaciones extremas - Grado de inuencia potencial (leverage):

11( ) ( 1, ..., ) 0 1 ( 1, ..., ), .N

ii i i ii iiih i N h i N h K-=¢ ¢= = £ £ = =åx X X x [1]

Observación I: iih es el elemento en la -ésimai posición de la diagonal principal de la matriz 1( )-¢ ¢ºH X X X X [llamada a veces "matriz sombrero" (hat matrix) porque convierte a y en y : ˆ =y Hy ]. En un modelo RLS:

2

21

( )1 ( 1, ..., ).( )

iii N

ii

x xh i N

N x x=

-= + =

En general, un valor destacado de iih (por ejemplo, 2Kii Nh > ) implica que los datos de las variables explicativas en la

-ésimai observación destacan al compararlos con la media de los datos de dichas variables en la muestra completa.

Observaciones inuyentes en general - Estadístico o Distancia de Cook:

2ˆ1 ( 1, ..., ).

1ˆ 1i ii

iiiii

u hD i NK hhs

é ù é ù= ´ ´ =ê ú ê ú--ê ú ë ûë û [2]

Observación II: En iD se combina información sobre el posible carácter atípico (a través del residuo iu ) y/o extremo (a través del grado de inuencia potencial iih ) de cada observación muestral. La distancia iD es una medida de la diferencia entre las estimaciones de los parámetros de un modelo obtenidas con la muestra completa y las obtenidas sin la -ésimai observación (o, equivalentemente, entre los valores ajustados asociados con ambas estimaciones). Por lo tanto, un valor destacado de iD [por ejemplo, mayor que el valor crítico del 5% de una ( , )F K N K- ] suele implicar que la -ésimai observación muestral es una observación inuyente.

Page 25: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 21

-3

-2

-1

0

1

2

3

-3 -2 -1 0 1 2 3

VALORES AJUSTADOS

RES

IDU

OS

45

7

19

0.0

0.2

0.4

0.6

0.8

1.0

5 10 15 20

Nº OBSERVACIÓN

LEVE

RAG

E

10

10

20

30

40

50

60

70

5 10 15 20

Nº OBSERVACIÓN

CO

OK

1

FIGURA 10 Ejemplo - Detección de Observaciones Influyentes I

Observación I: Los tres grácos de la Figura 10 se han elaborado a partir de la estimación de la RLM (con término constante) de Y sobre X2, X3, X4, X5, con los datos del archivo SC10-NYRivers.wf1 [ver Chatterjee, S.; Hadi, A.S. (2006), Regression Analysis by Example (4th Ed.), Wiley (p. 10)]. El cálculo de los grados de inuencia potencial (LEVERAGE) y de los estadísticos de Cook (COOK) se ha llevado a cabo con el programa del archivo PRG03-OBIN.prg para EViews.

Observación II: Para otras medidas de inuencia, ver la Figura 11 y el artículo de Peña, D. y Yohai, V.J. (1995), The Detection of Influential Subsets in Linear Regression by Using an Influence Matrix, J. R. Statist. Soc. B, 57, 145-156.

Page 26: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.2 DIAGNOSIS DE RESIDUOS

ECONOMETRÍA PÁGINA 22

0.8

1.2

1.6

2.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

4

573

8

6

X5

Y

.0

.1

.2

.3

.4

.5

.6

5 10 15 20

Nº OBSERVACIÓN

CO

OK

10.0

0.4

0.8

1.2

1.6

2.0

2.4

5 10 15 20

Nº OBSERVACIÓN

HAD

I

1

FIGURA 11 Ejemplo - Detección de Observaciones Influyentes II

Observación: Los tres grácos de la Figura 11 se han elaborado a partir de la estimación de la RLS de Y sobre X5 con los datos del archivo SC10-NYRivers.wf1. Los estadísticos de Cook (COOK) y las medidas de inuencia de Hadi (HADI) [Chatterjee y Hadi (2006), Sec. 4.8-4.10] se han calculado con el programa del archivo PRG03-OBIN.prg para EViews. La medida de inuencia de Hadi (que puede ayudar a detectar observaciones inuyentes enmascaradas) es

2

( 1, ..., ).1 1 ˆSCR

ii ii

ii ii i

uh KH i Nh h u

é ùé ù é ù ê ú= + ´ =ê ú ê ú ê ú- -ê ú -ë û ë û ë û

Page 27: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

ECONOMETRÍA PÁGINA 23

3.3 Heteroscedasticidad

Un modelo de regresión presenta heteroscedasticidad cuando sus perturbaciones no tienen varianza constante (Figura 12).

Modelo RLS para los datos de la Figura 12 con heteroscedasticidad proporcional:

1 2 , con E[ ] 0,i i i iY X U Ub b= + + =X [3]

2Var[ ] ( 1, ..., ).i iU X i Ns= =X [4]

21 2E[ ] , Var[ ] ( 1, ..., )i i i iY X Y X i Nb b s = + = =X X . [5]

Una causa frecuente de la heteroscedasticidad es la existencia de alguna relación entre la dispersión de la variable dependiente y los valores de alguna(s) variable(s) explicativa(s).

La presencia de perturbaciones heteroscedásticas siempre debe considerarse cuando se pretende elaborar un modelo con datos de sección cruzada.

Page 28: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 24

40

80

120

160

200

240

200 400 600 800 1000

VARIABLE EXPLICATIVA

VAR

IABL

E D

EPEN

DIE

NTE

-2

-1

0

1

2

-2 -1 0 1 2

VARIABLE EXPLICATIVA

RES

IDU

OS

FIGURA 12 Gráficos indicativos de Heteroscedasticidad en un modelo RLS

Modelo RLM con heteroscedasticidad general:

, con E[ ] 0,i i i iY U U¢= + =X Xb [6]

Page 29: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 25

2Var[ ] ( ) ( 1, ..., ),i iU i Ns= =X X [7]

donde ( ) 0i >X para todo 1, ...,i N= .

CONSECUENCIAS

El modelo RLM [6]-[7] puede escribirse como

, con E[ | ] ,= + =Y X U U X 0b [8]

2Var[ | ] ( E[ | ]) ,s¢= =U X UU X W [9]

donde si ( )i iº X , entonces W es la matriz diagonal no escalar siguiente:

1

2

0 0

0 0.

0 0 N

é ùê úê úê ú= =/ê úê úê úê úë û

IW [10]

Remplazando en el modelo RLM clásico HC4 por [9]-[10], puede comprobarse que

Page 30: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 26

s s- - -

=

¢ ¢ ¢ ¢= =/

b b

b W2 1 1 2 1

ˆE[ ] ,

ˆVar[ ] ( ) ( ) ( ) .

W

W X X X X X X X X [11]

Observación: En relación con las propiedades asintóticas de ˆWb (Sección 2.4), remplazar [i] en HA4 por la hipótesis de que 2 2Var[ | ] ( E[ | ]) ( )i i i iiU U s= =X X X ( 1, 2, ...,i N= ), implica que ˆWb sigue siendo un estimador CAN de b , pero ahora con

1 1 1ˆVarAs[ ] N- -=W Q SQb (donde E[ ]i i¢ºQ X X , 1 2 2lim Var[ ]} E[ ]i iiN U s¢ ¢º { = =/S X U X X Q).

Por lo tanto, ˆplim[ ] =Wb b , pero 2 1ˆVarAs[ ] Ns -=/W Qb .

Ningún resultado de la RLM basado en la expresión 2 1( )s -¢X X para bVar[ ]W es aplicable ahora (por ejemplo, el Teorema de Gauss-Markov). Además, cualquier cálculo basado en la estimación 2 1ˆ ( )s -¢X X de la matriz de covarianzas (exacta o asintótica) de ˆWb es incorrecto (por ejemplo, los errores estándar habituales de los estimadores MCO).

DETECCIÓN

Además de los grácos de residuos considerados en la Sección 3.2, el contraste que se menciona a continuación puede resultar útil para detectar heteroscedasticidad.

Page 31: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 27

Contraste de White

Wooldridge (2013), Sección 8.3.

Observación: El contraste de White se emplea para contrastar la hipótesis de que las perturbaciones de un modelo de regresión son homoscedásticas (tienen varianza constante) frente a la alternativa de que son heteroscedásticas:

1. Estimar el modelo de regresión considerado por MCO. Guardar sus residuos 1 2ˆ ˆ ˆ, , ..., Nu u u .

2. Estimar por MCO la regresión auxiliar de 2iu sobre todas las variables explicativas del modelo considerado, sus

cuadrados, y los productos cruzados entre ellas. Guardar el coeciente de determinación normal 2WHR de esta

regresión auxiliar.

3. Calcular 2WHWH N R= ´ y el p-value 2Pr[ ( ) ]M WH³ (donde M es el número de pendientes estimadas en la

regresión auxiliar). Si el p-value es sucientemente pequeño (menor que el nivel de signicación escogido), rechazar la hipótesis nula de homoscedasticidad.

Todos los cálculos anteriores se pueden llevar a cabo con EViews seleccionando en la ventana donde se encuentra el modelo original estimado por MCO View Residual Tests White Heteroskedasticity (cross terms).

Ejemplos: (1) Con los datos del archivo SC09-Alimentación.wf1, [i] estimar la RLS de GALIM sobre INGR, [ii] realizar el contraste de White, y [iii] explicar por qué es razonable la presencia de heteroscedasticidad en un modelo para estos datos (ver la segunda parte de [5]). (2) Con los datos del archivo SC01-Viviendas.wf1, [i] estimar la RLM de PRECIO sobre FINCAM2, SUPM2, NDORM, y [ii] realizar el contraste de White.

Page 32: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 28

UTILIZACIÓN ADECUADA DE MCO

El Estimador de White es un estimador robusto (consistente) de ˆVarAs[ ]Wb frente a cualquier tipo de heteroscedasticidad (con independencia de la forma de ( )iX en [7]):

1 11Wˆ ˆ ˆ ˆˆVarAs[ ] ,N

- -=W Q S Qb [12]

21 1 1W1 1

ˆ ˆ ˆ, .N Ni i i i ii iN N N K U= =-¢ ¢ ¢º å = º åQ X X X X S X X [13]

Ejemplos: En los ejemplos (1) y (2) anteriores, comparar los errores estándar calculados de la manera habitual con los calculados utilizando el Estimador de White.

Observación Importante: El logaritmo neperiano en la variable dependiente de un modelo suele reducir notablemente la heteroscedasticidad Por ejemplo, con los datos del archivo SC01-Viviendas.wf1, [i] estimar la RLM de LOG(PRECIO) sobre LOG(FINCAM2), LOG(SUPM2), LOG(NDORM), y [ii] realizar el contraste de White. No obstante, no siempre es posible o tiene sentido práctico transformar logarítmicamente la variable dependiente de un modelo.

MÍNIMOS CUADRADOS PONDERADOS

Modelo original con heteroscedasticidad:

1 2 2 ... , con E[ ] 0,i i K iK i iY X X U Ub b b= + + + + =X [14]

Page 33: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 29

2Var[ ] ( 1, ..., ).i iU i Ns= =X [15]

Modelo transformado sin heteroscedasticidad:

21 2

1 ... , con E 0,i i iK i iK

i i i i i i

Y X X U Ub b b é ù= + + + + =ê úê úë û

X [16]

[ ]

21Var Var ( 1, ..., ).ii

i i

U U i Nsé ù = ´ = =ê úë û

X X [17]

En el modelo transformado los parámetros son los mismos y se interpretan exactamente de la misma manera que en el modelo original.

El estimador MCO de 1 2[ , , ..., ]Kb b b ¢ºb en el modelo transformado [16]-[17] se denomina el estimador de Mínimos Cuadrados Ponderados (MCP) de b .

Observación I: El estimador MCP debe su nombre a que es el estimador asociado con la estimación de b que resulta de minimizar con respecto a 1 2[ , , ..., ]Kb b b ¢ºb la función

[ ] [ ]2 21 2 21 1SCRP( ) ( ... ) ( ) ,N N

i i i K iK i i ii ip y b b x b x p y= = ¢º - - - - º -å åb x b

donde 1/ ( 1, ..., )i ip i Nº = . En SCRP(b), cada residuo ordinario ( )i iy ¢- x b recibe una ponderación que es

Page 34: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 30

inversamente proporcional a la variabilidad (dispersión) de la distribución de probabilidad condicional de iY . De esta manera se aprovecha la heteroscedasticidad para obtener un estimador de b más preciso (informativo) que el estimador MCO (que pondera a todas las observaciones por igual).

Observación II: El modelo transformado [16]-[17] puede escribirse como

( ) ( ) ( ), con E[ | ] ,= + =PY PX PU PU X 0b

2Var[ | ] ( E[ | ]) ,s¢ ¢= =PU X PUU P X I

11 1 1

1 , ...,Diag[ , ..., ] DiagNNp p -é ù ¢º º =ê úë ûP PP W (ver [8]-[10]).

Si el modelo original satisface todas las hipótesis clásicas, excepto por la presencia de heteroscedasticidad, entonces el modelo transformado satisface HC1-HC5. Por lo tanto, la manera óptima de hacer inferencia sobre b consiste en aplicar toda la teoría MCO al modelo transformado. En particular, el estimador MCP de b es

1 1 1 1

2 1 1

( ) ( ) , con

E[ ] , Var[ ] ( ) .s

- - - -

- -

¢ ¢ ¢ ¢ ¢ ¢= =

¢= =

W

W W

X P PX X P PY X X X Y

X X

b W W

b b b W

El problema práctico de todo lo anterior reside en que, salvo en casos excepcionales, no es posible conocer exactamente la forma de ( )i iº X en todo i = 1, …, N, por lo que aplicar MCP en la práctica requiere utilizar estimaciones de 1 , ..., N .

Un estimador MCP de b denido a través de algún estimador de 1[ , ..., ]N ¢º en vez de a través del verdadero valor de (generalmente desconocido), se denomina un

Page 35: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 31

estimador de MCP Factibles (MCPF).

Un estimador MCPF no es, en general, insesgado (ni, por lo tanto, eciente) porque utiliza un estimador de en lugar de su verdadero valor. No obstante, si el estimador utilizado de es un estimador adecuado (consistente), entonces el estimador MCPF es consistente y asintóticamente relativamente más eciente que el estimador MCO.

Para estimar por MCP(F) con EViews: [i] seleccionar Options en la ventana Equation Specification del modelo que se quiera estimar, [ii] marcar la casilla a la izquierda de Weighted LS/TSLS, y [iii] escribir el nombre de la serie de ponderaciones en la celda a la derecha de Weight: [OMEGA^(–0.5) en este ejemplo].

Ejemplo: Con los datos del archivo SC09-Alimentación.wf1, estimar por MCPF la RLS de GALIM sobre INGR con la serie de ponderaciones INGR^(–0.5) (de manera que en este ejemplo se estima la serie 1[ , ..., ]N ¢º simplemente como ( 1, ..., )i ix i N= = ; ver [4] y [7]). Comparar con la estimación por MCO; ver Figura 13.

Estimación General por Mínimos Cuadrados Ponderados Factibles

Wooldridge (2013), Sección 8.4.

Page 36: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.3 HETEROSCEDASTICIDAD

ECONOMETRÍA PÁGINA 32

-2

-1

0

1

2

-2 -1 0 1 2

INGR

RE

SM

CO

-2

-1

0

1

2

-2 -1 0 1 2

INGR

RES

MC

P

-2

-1

0

1

2

-2 -1 0 1 2

INGR

RES

MC

PES

TAN

DA

RIZ

ADO

S

Observación: Si MCPF hace uso de un estimador inadecuado de 1[ , ..., ]N ¢º , entonces MCPF es CAN pero su varianza asintótica no es necesariamente menor que la de MCO. En la práctica, para decidir si 1ˆ ˆ ˆ[ , ..., ]N ¢º es una estimación adecuada, examinar los residuos "estandarizados" ˆ( )/ ( 1, ..., )i i iiu y i N* ¢º - =x b : si es una estimación adecuada de , entonces los residuos estandarizados no deben mostrar signos de heteroscedasticidad.

FIGURA 13 Residuos del Modelo RLS estimado con los Datos del Archivo SC09

Page 37: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

ECONOMETRÍA PÁGINA 33

3.4 Recomendaciones Prácticas

A la hora de elaborar un modelo RLM, prestar especial atención al contenido del conjunto de variables explicativas y a la forma funcional de la relación entre la variable dependiente y las variables explicativas.

Fundamentar ambos aspectos en (quizás) algún modelo teórico y (sobre todo) en el sentido común y en un análisis detallado de las características muestrales de los datos disponibles.

En general, comenzar con un modelo sencillo pero sensato para, en su caso, enriquecerlo paso a paso (bottom-up/specific-to-general approach). Aunque puede presentar ciertos inconvenientes, este enfoque suele ser preferible al opuesto (top-down/general-to-specific approach), que parte de una premisa esencialmente irrealizable (un modelo "correcto").

Recordar que la omisión de variables explicativas relevantes puede llevar a la estimación de relaciones espurias (MCO sesgado e inconsistente), mientras que la inclusión de variables irrelevantes "sólo" puede implicar pérdida de precisión (MCO ineciente).

Page 38: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.4 RECOMENDACIONES PRÁCTICAS

ECONOMETRÍA PÁGINA 34

Analizar la posible presencia de multicolinealidad y de observaciones inuyentes en los datos, cuyas consecuencias pueden distorsionar notablemente las conclusiones derivadas de cualquier modelo estimado.

En todo caso, recordar que la señal más evidente de una mala especicación o de alguna deciencia en los datos suele ser la obtención de estimaciones con valores y/o signos chocantes. [Más detalles en Kennedy, P. (2002), "Oh, No! I Got the Wrong Sign! What Should I Do?", Simon Fraser University, Dept. of Economics Discussion Papers, 02-3.]

Como ayuda para especicar un modelo, pueden ser de utilidad algunos procedimientos formales (contrastes de signicación, coecientes de determinación, criterios de información y de evaluación de previsiones), pero nunca como criterios únicos y fundamentales.

Recordar la diferencia entre signicación estadística y signicación teórica y/o práctica.

Evaluar la posible presencia de heteroscedasticidad (o, en su caso, de autocorrelación) sólo a partir de un modelo "razonablemente bien especicado", estimado con unos datos que no presenten deciencias notables.

Page 39: 3 REGRESIÓN LINEAL MÚLTIPLE II - ucm.randomshock.comucm.randomshock.com/ectrgr/EctrGr-JAM-3.pdf · 3 · REGRESIÓN LINEAL MÚLTIPLE II 3.1 VARIABLES EXPLICATIVAS BINARIAS ECONOMETRÍA

3 · REGRESIÓN LINEAL MÚLTIPLE II 3.4 RECOMENDACIONES PRÁCTICAS

ECONOMETRÍA PÁGINA 35

Observación I: En un contraste de heteroscedasticidad, interpretar el rechazo de 0H (homoscedasticidad) como evidencia de heteroscedasticidad es correcto siempre que las restantes hipótesis del modelo considerado (especialmente las hipótesis de regresores exógenos y ausencia de autocorrelación) sean válidas. En particular, si HA3 no es válida (de manera que E[ | ]i i iY ¢=/X X b debido a algún error de especicación), entonces puede rechazarse 0H aún cuando Var[ | ]i iU X sea constante (en este caso, además, tanto MCO como MCPF son inconsistentes). Por ejemplo, si se omite algún término cuadrático en el lado derecho del modelo, o si se omite el logaritmo en el lado izquierdo cuando debería haberse utilizado, entonces un contraste de heteroscedasticidad puede resultar signicativo. Por lo tanto, es recomendable contrastar primero la especicación del modelo (dado que la inconsistencia se considera más grave que la ineciencia), y después, una vez resuelto cualquier error de especicación (que provoca inconsistencia), considerar la posible heteroscedasticidad (que sólo provoca ineciencia).

Observación II: En presencia sólo de heteroscedasticidad, MCO y MCPF son ambos CAN. Por su parte, la eciencia asintótica relativa de MCPF se basa en que: [i] el tamaño muestral sea sucientemente grande, y [ii] la estimación de la heteroscedasticidad sea "adecuada". Si [ii] falla, MCPF aún es CAN, pero su varianza asintótica ya no es necesariamente menor que la de MCO. Además, con muestras cortas, incluso si [ii] es aceptable, la aproximación asintótica puede funcionar peor para MCPF que para MCO, dado que MCPF requiere estimar más parámetros que MCO. En todo caso, MCPF puede ser una alternativa "razonable" a MCO (con muestras "razonablemente" grandes) cuando la heteroscedasticidad puede estimarse "razonablemente" bien.