ECONOMETRÍA APLICADA I - Econometria aplicada · Máster en Economía Aplicada y Programa Modular Economía Aplicada. La parte que redacté de manual de Econometría y Econometría

FRANCISCO PARRA RODRÍGUEZ

(Doctor en Economía. Universidad Nacional de Educación a Distancia)

ECONOMETRÍA APLICADA I

Econometria Aplicada I by Francisco Parra Rodríguez is licensed under a Creative Commons

Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional License.

ÍNDICE

Parte I

PRESENTACIÓN ........................................................................................................................................ 4 1. LA ECONOMETRÍA: HISTORIA Y METODOLOGÍA .................................................................... 6

1.1. LOS ORÍGENES DE LA ECONOMETRIA ............................................................................... 6 1.2. LOS MODELOS ECONOMÉTRICOS...................................................................................... 12 1.3. LA METODOLOGÍA ECONOMÉTRICA ................................................................................ 14

2. EL MODELO LINEAL GENERAL .................................................................................................. 18 2.1. INTRODUCCIÓN ...................................................................................................................... 18 2.2. REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS MÍNIMOS CUADRADOS ORDINARIOS. ...................................................................................................................................... 18 2.3. REGRESIÓN LINEAL MÚLTIPLE .......................................................................................... 25 2.4. PROPIEDADES ESTADISTICAS DEl ESTIMADOR MÍNIMO CUADRADO. .................... 30 2.5. COEFICIENTES DE DETERMINACIÓN Y CORRELACIÓN PARCIAL ............................. 31

2.5.1. Coeficiente de determinación ............................................................................................. 31 2.5.2. Coeficiente de correlación parcial ...................................................................................... 35

2.6. INFERENCIA ACERCA DE LOS ESTIMADORES ................................................................ 35 2.6.1. Intervalos De Confianza ..................................................................................................... 36 2.6.2. Contrastes de Hipótesis ...................................................................................................... 39

2.7. TABLA DE ANALIS DE LA VARIANZA (ANOVA) ............................................................. 43 2.8. PREDICCIÓN EN EL MODELO DE REGRESIÓN ................................................................ 44 2.9. ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON EXCEL ........................ 46 2.10. ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON R ........................... 54 2.11. PROBLEMAS .................................................................................................................... 59

3. EXTENSIONES AL MODELO DE REGRESIÓN LINEAL ............................................................ 62 3.1. INTRODUCCIÓN ...................................................................................................................... 62 3.2. HETEROSCEDASTICIDAD ..................................................................................................... 65

3.2.1. Test de Bartlett ................................................................................................................... 65 3.2.2. Contraste de Goldfeld-Quant .............................................................................................. 66 3.2.3. Contraste de White ............................................................................................................. 69

3.3 AUTOCORRELACIÓN ................................................................................................................... 71 3.3.1. Contraste de Durbin-Watson .................................................................................................... 71 3.3.1. Contraste de Breush-Godfrey ................................................................................................... 75

3.4. DEFICIENCIAS MUESTRALES: MULTICOLINEALIDAD ................................................. 76 3.5. ERRORES DE ESPECIFICACIÓN ........................................................................................... 79

3.5.1. Omisión de una variable relevante...................................................................................... 80 3.5.2. Inclusión de una variable innecesaria ................................................................................. 81 3.5.3. Especificación funcional incorrecta .................................................................................... 82 3.5.4. Contraste de errores de especificación ................................................................................ 83

3.6. MINIMOS CUADRADOS GENERALIZADOS....................................................................... 84 3.7. PROBLEMAS ............................................................................................................................ 91

4. MODELOS CON ERRORES EN LAS VARIABLES ...................................................................... 95 4.1. INTRODUCCIÓN ...................................................................................................................... 95 4.2. TIPOS DE ERRORES DE MEDIDA ......................................................................................... 96

4.2.1. Errores de medida en la variable endógena ........................................................................ 96 4.2.2. Errores de medida en la variable exógena .......................................................................... 97

4.3. ESTIMACIÓN DE MODELOS CON ERRORES EN LAS VARIABLES ............................. 100 4.4. APLICACIÓN PRÁCTICA ..................................................................................................... 102 4.5. PROBLEMAS .......................................................................................................................... 104

5. MODELOS CON VARIABLES CUALITATIVAS ........................................................................ 107 5.1. MODELOS CON VARIABLES CUANTITATIVAS Y CUALITATIVAS COMO REGRESORES. ................................................................................................................................... 107

5.1.1. Modelos ANOVA ............................................................................................................. 108 5.1.2. Modelos ANCOVA .......................................................................................................... 113

5.2. EL EMPLEO DE VARIABLES CUALITATIVAS PARA EL TRATAMIENTO DE LA ESTACIONALIDAD ........................................................................................................................... 122 5.3. APLICACIONES DE LAS VARIABLES CUALITATIVAS A LA REGRESIÓN POR TRAMOS. ............................................................................................................................................ 129 5.4. EL MODELO PROBABILÍSTICO LINEAL .......................................................................... 130 5.5. EL MODELO LOGIT .............................................................................................................. 132 5.6. EL MODELO PROBIT ............................................................................................................ 137 5.7. PROBLEMAS .......................................................................................................................... 142

6. MODELOS CON DATOS DE PANEL ........................................................................................... 145 6.1. INTRODUCCIÓN .................................................................................................................... 145 6.2. ESPECIFICACIÓN GENERAL DE UN MODELO DE DATOS DE PANEL ....................... 146 6.3. VENTAJAS Y DESVENTAJAS DE LOS MODELOS DE DATOS DE PANEL .................. 149 6.4. MODELO DE EFECTOS FIJOS ............................................................................................. 151 6.5. MODELO DE EFECTOS ALEATORIOS ............................................................................... 154 6.6. ELECCIÓN DE MODELO DE EFECTOS O EFECTOS ALEATORIOS .............................. 156 6.7. PROBLEMAS .......................................................................................................................... 163

7. MODELOS DE ECUACIONES SIMULTÁNEAS ......................................................................... 165 7.1. INTRODUCCIÓN .................................................................................................................... 165 7.2. FORMA ESTRUCTURAL Y REDUCIDA ............................................................................. 167 7.3. DETECCIÓN DE LA SIMULTANEIDAD. PRUEBA DE HAUSMAN ................................ 172 7.4. IDENTIFICACIÓN DEL SISTEMA ....................................................................................... 177

7.4.1. Condiciones de Orden y Rango en la Identificación ........................................................ 179 7.5. PROBLEMAS .......................................................................................................................... 183

8. MÉTODOS DE ESTIMACIÓN DE MODELOS DE ECUACIONES SIMULTÁNEAS ............... 185 8.1. INTRODUCCIÓN .................................................................................................................... 185 8.2. MÍNIMOS CUADRADOS INDIRECTOS (MCI) ................................................................... 185

8.2.1. Estimación de curvas de oferta y demanda por MCI ........................................................ 188 8.2.2. Estimación de Haavelmo de la propensión marginal al consumo por MCI ...................... 191

8.3. VARIABLES INSTRUMENTALES (VI) ............................................................................... 194 8.3.1. Estimación una función keynesiana de consumo por VI .................................................. 198

8.4. MÍNIMOS CUADRADOS EN DOS ETAPAS (MC2E) ......................................................... 201 8.4.1. Estimación de un modelo de gastos e ingresos por MC2E ............................................... 204

8.5. MODELOS RECURSIVOS ..................................................................................................... 210 8.5.1. Estimación de un Modelo Recursivo de Determinación de Precios y Salarios................. 213

8.6. EJEMPLO PRÁCTICO: ESTIMACIÓN DE UN MODELO EXACTAMENTE IDENTIFICADO POR MCI, VI Y MC2E ........................................................................................... 216 8.7. PROBLEMAS .......................................................................................................................... 223

9. MÉTODOS DE ESTIMACIÓN NO LINEALES ............................................................................ 226 9.1. INTRODUCCIÓN .................................................................................................................... 226 9.2. ESTIMACIÓN DE UN MODELO DE MODELOS NO LINEALES POR MINIMOS CUADRADOS ORDINARIOS. ........................................................................................................... 227 9.3. MÍNIMOS CUADRADOS NO LINEALES ............................................................................ 229

9.3.1. Algoritmo de Newton-Raphson ........................................................................................ 231 9.4. EL ESTIMADOR DE MÁXIMA VEROSIMILITUD ............................................................. 234 9.5. APROXIMACIÓN LINEAL DE TAYLOR ............................................................................ 236 9.6. PROBLEMAS .......................................................................................................................... 240

10. MÉTODOS DE ESTIMACIÓN NO PARAMÉTRICOS ............................................................. 242 10.1. INTRODUCCIÓN ............................................................................................................ 242 10.2. FUNCIÓN NUCLEO ....................................................................................................... 244 10.3. ESTIMADORES DE FUNCIÓN NUCLEO Y POLINOMIOS LOCALES .................... 249 10.4. REGRESIÓN POR SPLINES .......................................................................................... 259 10.5. APROXIMACIÓN POR SERIES DE FOURIER ............................................................ 268 10.6. PROBLEMAS .................................................................................................................. 274

ANEXO I. NOCIONES DE ALGEBRA MATRICIAL .......................................................................... 277 ANEXO II. TABLAS ESTADÍSTICAS .................................................................................................. 293 BIBLIOGRAFÍA ...................................................................................................................................... 302

PRESENTACIÓN

En el año 2004 el Departamento de Economía Aplicada y Estadística de la Universidad Nacional

de Educación a Distancia (UNED) encargó a los entonces profesores de la asignatura econometría

I de Administración y Dirección de Empresas y Económicas, elaborar un texto de econometría

que sirviera de bibliografía básica para la misma, dicho texto que se publicó en Ediciones

Académicas bajo el título de econometría, fue revisado y actualizado en 2007 y editado de nuevo

por Ediciones Académicas pero con un nuevo título: Econometría Aplicada. En lo que sé, el

manual sigue utilizándose como bibliografía en la UNED, ya que en septiembre del 2006 deje de

ser profesor de dicha asignatura. No obstante, durante el tiempo de docencia en la UNED también

participe en otros cursos de posgrado para los cuales también elaboré diferente material docente:

Curso de Contabilidad Nacional y Tablas Input-Output y Curso de Eficiencia y Productividad,

dentro del Programa de Doctorado del Departamento de Economía Aplicada y Estadística, y

Máster en Economía Aplicada y Programa Modular Economía Aplicada.

La parte que redacté de manual de Econometría y Econometría Aplicada se había basado a su vez

en los apuntes de otro curso de estadística y econometría para empleados públicos que impartí

junto a Mauricio Beltrán Pascual dentro de los programas de formación de funcionarios de la

Junta de Castilla y León. El curso se denominaba: Estadística Aplicada a la Administración

Pública, y los materiales del curso acabaron editándose por la Junta de Castilla y León, sin ISBN,

en una serie de Metodologías Estadísticas, bajo el título: Apuntes de Análisis Estadístico

Aplicados a la Administración Pública. La serie tuvo corta vida, ta solo dos números, y con el

tiempo el curso pasó a denominarse Aplicaciones Estadísticas en las Hojas de Cálculo, y Curso

de Estadística Descriptiva y Análisis de Datos con la Hoja de Calculo Excel, cuando se incluyó

en el año 2007 en los programas de formación del Centro de Estudios de la Administración

Regional del Gobierno de Cantabria. En el 2011 se programó el último de aquellos cursos, ya que

en el 2012 pase a impartir la asignatura de Econometría dentro de la licenciatura y grado de

Administración y Dirección de Empresas de la Universidad de Cantabria y andaba escaso de

tiempo.

Dado que había reunido un amplio material de recursos docentes tanto de la asignatura de

econometría I UNED, los cursos de postgrado en los que participe, como en los cursos impartidos

para las administraciones públicas, en 2007 abrí un blog en wordpress:

Http://econometria.wordpress.com/ en el que reuní una parte de aquellos documentos, que

posteriormente fui ampliando bien con el material de otros cursos que me fueron encargados

(Curso de Contabilidad Trimestral) y análisis estadísticos propios basados en Series de Fourier.

Del blog, los recurso más descargados fueros un curso de econometría básica, y otro de

econometría avanzado, que ha sido sucesivamente actualizado con los análisis estadísticos

basados en series de Fourier.

Dado que ha sido ya suficiente el tiempo que ha pasado desde la aparición del primer manual de

econometría editado por ediciones académicas, me propuse actualizar este con los contenidos que

se difunden a través del blog, ampliando los capítulos ya publicados, redactando nuevos capítulos

sobre econometría no parámetrica, cointegración, regresión en dinámica de la frecuencia y el uso

de filtros desestacionalizadores, e incorporando junto a los ejemplos desarrollados en Excel otros

desarrollados en R, software que está ganando mucho terreno en la docencia de la econometría.

Entre dichos materiales se incluye la base teórica de librería en R “descomponer” que elaboré

para extraer tendencias y estacionalidades en series de tiempo en base al periodograma de la serie

temporal. Dado que uno de los contenidos de los cursos de formación para las Administraciones

Públicas era la elaboración de números índices de precios y cantidades, se ha incluido otro

capitulo con estos contenidos, a pesar de que los números indices no es materia de las enseñanzas

de econometría. Al haber aumentado de forma notable el indice de capítulos, se ha dividido este

en dos partes, en la primera se incluyen los capítulos más generales sobre la técnica econométrica

y en una segunda parte los más específicos relativos a las series temporales.

Desde que cree el blog de econometría aplicada, he comprobado que la mayor parte de las

descargas proceden de América Latina, supongo que estos materiales están facilitando de alguna

u otra manera que los jóvenes latinoamericanos puedan disponer de materiales de econometría en

Castellano para completar sus estudios. Este es en definitiva el objetivo último de este manual

facilitar el estudio y la aplicación de la econometría a la comunidad de hispana de la manera más

abierta posible.

1. LA ECONOMETRÍA: HISTORIA Y METODOLOGÍA

1.1. LOS ORÍGENES DE LA ECONOMETRIA

La Econometría es una disciplina independiente de la Estadística mediante la que se trata de

contrastar la validez empírica de la teoría económica mediante modelos matemáticos y

estadísticos. Para lograr este objetivo se utiliza como instrumento básico el modelo econométrico,

el cual trata de ser una representación simplificada del mundo real mediante la que es posible

reproducir el comportamiento y las interrelaciones que se dan entre diversas variables

económicas.

El término 'econometría' fue utilizado por primera vez por Pawel Ciompa en 1910, siendo

rescatado por Frisch en su artículo de 1936 titulado “Note on term ‘Econometrics’”; este autor,

socio fundador de la Econometric Society, le asigna el significado que atribuimos en la actualidad

a este término. Dicho significado queda recogido en el primer artículo de los estatutos de la

mencionada sociedad, y en el mismo se menciona la necesidad del progreso de la teoría

económica mediante la utilización del análisis estadístico y matemático.

En un sentido más formal, se han propuesto a lo largo de la historia diferentes definiciones que

apuntan en la misma dirección e integran los mismos elementos (matemáticas, estadística y datos

económicos). Samuelson, Koopmans y Stone (1954) definen la Econometría como “el análisis

cuantitativo de fenómenos económicos actuales, basado en el desarrollo congruente de teoría y

observaciones, y relacionado por métodos apropiados de inferencia”; Intriligator (1978) señala

que es “la rama de la economía relacionada con la estimación empírica de las relaciones

económicas”. Chow (1983) la define como el “arte y ciencia de usar métodos para la medida de

relaciones económicas”. Stewart y Wallis (1984) consideran que la Econometría es aquella

ciencia que “se ocupa de la medición de las relaciones entre las variables económicas y de la

confrontación de la teoría con la evidencia empírica” . Finalmente, Greene (1993) señala que “es

el campo de la Economía que se refiere a ésta como aplicación de la Estadística Matemática y

los instrumentos de la Estadística Inferencial a la medición empírica de las relaciones postuladas

por la Teoría Económica”.

Si bien el término ‘econometría’ fue reconocido en 1936, se considera a Henry Moore (1914,

1917) el primer autor en efectuar una estimación de relaciones económicas de demanda a partir

de estadísticas económicas. Las regresiones lineales de Moore crearon escuela y entre sus

seguidores cabe destacar a Henry Schultz, Holbrook Working y Paul Douglas, entre otros.

Working (1927) planteó la estimación de mercados en equilibrio, descubrió en sus trabajos los

problemas asociados a los errores en las variables y planteó inicialmente la importancia de las

expectativas. Schultz (1938) publicó un libro íntegramente dedicado a la teoría y análisis de la

demanda en Estados Unidos, demostrando una preocupación permanente por la unión entre teoría

y medida.

La otra área de estudio con interés para los pioneros del análisis estadístico económico, la

constituían los ciclos económicos. Si bien en los trabajos iniciales de Sir William Petty se dejaba

constancia de los ciclos, no será hasta el siglo XIX cuando renacerá la curiosidad por su estudio.

Así, el físico francés Clement Juglar (1819-1905) es el primero en utilizar las series históricas

para el estudio del ciclo en los negocios, descubriendo un ciclo para la inversión de 7 a 11 años

de duración. A este trabajo le siguen los de Kitchin, Kuznets y Kondratieff, identificando un ciclo

de los inventarios de 3 a 5 años, un ciclo de la construcción de 15 a 25 años y un ciclo de

actividades a largo de 45 a 60 años.

En general estos estudios de los ciclos y los emprendidos posteriormente por Mitchell (1927) y

Burns y Mitchell (1947) en el National Bureau of Economic Research, fueron de tipo morfológico

y descriptivo, por lo que las relaciones entre variables constituían un segundo plano de interés.

No servirán, por tanto, de ayuda para el empuje del análisis econométrico ya que sus objetivos y

metodología son diferentes.

Por el contrario, los trabajos de Wright (1915, 1928), Working (1927), Tinbergen (1930) y Frisch

(1933) sobre análisis de la demanda, planteando el problema de la identificación en las relaciones

estructurales entre variables económicas, sientan las bases para el desarrollo econométrico que

culminaría en la creación de la Econometric Society en 1930, de la mano de Fisher, Frisch y Roos.

Dicha sociedad, junto con los trabajos de la Cowles Commission, sentaran las bases de la

Econometría actual.

La importancia asignada a la creación de la Econometric Society se debe a la obtención de una

agrupación de economistas con preocupaciones de tipo cuantitativo, creando un instrumento de

expresión de los mismos mediante la revista Econométrica. En ese momento la Econometría deja

de ser una actividad dispersa, facilitándose el intercambio de información entre investigadores,

convirtiéndose así en un movimiento organizado con un medio para el intercambio de ideas y

resultados.

Una vez creada la Econometric Society era importante disponer de una institución donde localizar

y centralizar las investigaciones sobre la nueva disciplina; éste será el papel a desempeñar por la

Cowles Commission. La Cowles Commission for Research in Economics, era una institución sin

fines lucrativos fundada por Alfred Cowles III, presidente de una sociedad de inversores. Su

objetivo era la aplicación de las matemáticas a la economía con el fin de obtener buenas

predicciones de las cotizaciones en Bolsa.

Sin embargo, no tardarán en aparecer las primeras críticas a los métodos utilizados por los

primeros económetras, Así, podemos encontrar la del propio Keynes juzgando a la econometría

como próxima a la alquimia y sin resultados fiables al considerar el contexto económico

difícilmente modelizable por relaciones matemáticas, o la de Milton Friedman dudando del

método de Tinbergen para seleccionar una teoría económica entre varias estimadas

empíricamente. Asimismo, un alumno de Frisch, Trygve Haavelmo (1943,1944) demuestra la

inconsistencia de la estimación por Mínimos Cuadrados Ordinarios (MCO) y la simultaneidad en

los sistemas macroeconómicos, poniendo de manifiesto la necesidad de cuestionar los

procedimientos basados en MCO. Haavelmo propone la introducción del modelo probabilístico

para sustentar la base de la metodología econométrica, modelo que será adoptado inicialmente

por la Cowles Commission para realizar estimación e inferencia.

En 1950 la Cowles Commission publicó la obra "Statistical Inference in Dynamic Economic

Models", obra elaborada por un equipo de prestigiosos investigadores del que formaron parte

Marschak, Tjalling, Koopmans, Hurwicz, Rubin, Klein y Anderson, que recogía todos los trabajos

y avances realizados en años anteriores y establece las normas básicas de la investigación

econométrica.

Todo el conocimiento acumulado en los años treinta y cuarenta conduce un espectacular

desarrollo de la Econometría durante los años cincuenta; de entre los avances que se producen en

la época cabe destacar los siguientes:

− A mediados de los años cincuenta aparece el método de estimación por Mínimos

Cuadrados en 2 Etapas (MC2E), desarrollado por Theil (1954, 1958) y Bassmann (1957),

el cual debido a su sencillez y facilidad de cálculo gozará de una gran aceptación como

método de estimación de modelos de ecuaciones simultáneas frente a los métodos de

Máxima Verosimilitud con Información Completa (MVIC), propuesto por Koopmans

(1950), y con Información Limitada (MVIL), propuesto por Anderson y Rubin (1949);

posteriormente, a finales de esta década, aparecerá el método de las Variables

Instrumentales (VI) propuesto por Sargan (1958).

− Klein y Goldberger (1955) desarrollan y perfeccionan su trabajo anterior, dando lugar a

uno de los modelos más populares entre los económetras: el modelo Klein-Goldberger,

el cual incorpora novedades a las especificaciones de los modelos macroeconómicos

precedentes, determinando el consumo no solamente a través de la renta, sino también a

través de los efectos riqueza e impuestos, e incorporando por primera vez funciones de

producción.

− Otro acontecimiento de importancia capital en el desarrollo de la econometría y los

grandes modelos estructurales se produce en 1958, cuando los editores de Econometrica

promueven un Congreso bajo el título de “Estimación de ecuaciones simultáneas:

¿Alguna sentencia?” y con el que se pretendía establecer un debate sobre el método

propuesto por la Cowles Commission. Como era de esperar, en dicho Congreso hubo

diferentes posiciones, destacando las de Liu (1960), Hildreth (1960), Christ (1960) y

Klein (1960).

Sin embargo, el esplendor de que gozó la Econometría en los años cincuenta pronto se vería

eclipsado por la crisis que se produjo a comienzos de los años setenta a causa de la elevación de

los precios energéticos, hecho que no pudo ser previsto por ningún modelo econométrico. Ello

afectó directamente al pensamiento económico general y al desarrollo posterior de la

Econometría.

Una de las primeras críticas que se lanzó en contra de los modelos econométricos era que se

habían dejado de lado los planteamientos microeconómicos, por lo que los modelos

econométricos que sólo utilizaban agregados macroeconómicos no podían representar de forma

consistente la conducta racional y optimizadora de los agentes económicos. Esta crítica propició

la incorporación de datos y relaciones microeconómicas, dando lugar a la rama conocida como

Microeconometría. Entre los principales desarrollos alcanzados en esta área cabe destacar los

siguientes:

− Por un lado, los Modelos con Variable Dependiente Cualitativa, en los que se considera

que la variable dependiente admite un conjunto acotado de valores discretos,

generalmente 0 ó 1, mediante los que es posible representar cualidades de los individuos.

Entre los trabajos pioneros en este campo están los de McFadden (1974, 1976) y

Amemiya (1978), en los que se considera una aproximación logística en la estimación de

estos modelos (modelo Logit), mientras que en Albright, Lerman y Manski (1977) se

estudia la aproximación mediante una distribución Normal (modelo Probit).

− Por otro lado, los Modelos de Datos de Panel en los que se incluye información de una

muestra de agentes económicos (individuos, empresas, bancos, ciudades, países, etc.)

durante un determinado período de tiempo, combinando así la dimensión temporal y la

dimensión estructural de los datos. Entre los trabajos más notables de esta línea, cabe

mencionar a Kuh (1959), Balestra y Nerlove (1966), Rosenberg (1973) y Swamy y

Mentha (1977).

Mención aparte merece el espectacular desarrollo que se produce en esta década del análisis

econométrico de series temporales, tanto de tipo multivariante como, especialmente, univariante.

Los modelos univariantes de series temporales giran, de forma mayoritaria, en torno a la

metodología desarrollada por Box y Jenkins (1970). Dichos autores proponen la construcción de

modelos sobre una variable temporal, tratándola como un mecanismo autónomo, cuya gran

ventaja es la mejora de las predicciones a corto plazo. La metodología Box-Jenkins supone la

ruptura con la econometría clásica y con el pensamiento económico en general al no existir una

relación con la teoría económica, por lo que no pueden ser considerados como una alternativa a

los modelos estructurales multiecuacionales.

Sin embargo, la principal crítica realizada durante los años setenta de los métodos econométricos

se centra en la identificación y estimación de modelos multiecuacionales. Partiendo del trabajo

de Muth (1961), Lucas (1972, 1973), Sargent (1973) y Sargent y Wallace (1975), abanderados de

la escuela de las expectativas racionales, plantean la duda sobre la permanencia a lo largo del

tiempo de los parámetros estructurales incluidos en los modelos macroeconómicos, ante cambios

en la política económica del gobierno. Es decir, no existe nada que nos garantice que la estructura

de las reglas de decisión de los agentes económicos quedará inalterada al modificar las reglas de

política económica; y dado que esta estructura es la que representa el modelo, no hay razón para

pensar que los parámetros del mismo sean fijos. Por tanto, si no separamos los parámetros de las

decisiones políticas de los de las relaciones económicas, los modelos que estimemos no podrán

ser utilizados en la toma de decisiones.

La solución adoptada para resolver este problema ha sido la inclusión del proceso de formación

de las expectativas racionales en los modelos econométricos, asegurando la coexistencia entre

expectativas y simulaciones mediante la imposición de restricciones paramétricas entre

ecuaciones.

Finalmente, otra crítica importante a la econometría clásica es la planteada por Sims (1980, 1982)

a comienzos de los años ochenta. La idea central de Sims es que no es necesaria la existencia de

una teoría económica a priori para establecer las restricciones que hagan posible la identificación

de modelos estructurales, ya que no es necesario para la previsión y simulación. Sims propone

una nueva clase de modelos como alternativa a los modelos de ecuaciones simultáneas, los

Vectores Autorregresivos (VAR), en los que no es necesario clasificar las variables en endógenas

y exógenas.

Sin embargo, el desconocimiento que los modelos VAR conllevan sobre las relaciones de tipo

estructural (variables endógenas, exógenas, forma estructural) no permite realizar una

aproximación a los efectos producidos por cambios en la política económica, con lo que su campo

de aplicación se limita a la simple previsión.

A finales de la década pasada. Granger y Newbold (1974) advirtieron sobre el peligro que supone

especificar relaciones espúreas, es decir, relaciones no de causalidad sino de casualidad. Sus

estudios aumentaron el interés por la modelización dinámica y las propiedades a largo plazo de

los modelos econométricos. Su contribución ha dado lugar a los conceptos de cointegración

(Granger, 1981), el test de raiz unitaria (Dickey y Fuller, 1979) y los modelos de corrección de

error (Sargent, 1984).

En los últimos años, en paralelo al avance de las nuevas tecnologías de la información y al

desarrollo de las grandes bases de datos, asistimos a un nuevo cambio conceptual de la teoría

econométrica, poniendose en cuestión los supuestos sobre la normalidad de la distribución de

probabilidad de las variables sujetas al análisis. Otros problemas que enfrentan los investigadores

hoy día son la existencia de datos imperfectos con poca correspondencia con las variables

definidas en los modelos económicos y el poco entendimiento del verdadero significado de

algunas pruebas de hipótesis. En consecuencia, se estan produciendo desarrollos teóricos que

permiten un mayor acercamiento a los procesos económicos tal y como se presentan y que no

exigen el supuesto de normalidad de las variables bajo estudio (o del término de error). Entre los

avances teóricos más recientes que merecen ser mencionados se encuentran el desarrollo de la

econometría no paramétrica y la econometría de series de tiempo no lineales.

1.2. LOS MODELOS ECONOMÉTRICOS

El método científico en las Ciencias Sociales se basa tanto en la deducción como en el

conocimiento empírico. La deducción es el proceso de razonamiento lógico que conduce a unas

conclusiones partiendo de unas premisas o informaciones iniciales. El conocimiento empírico

objetiva el conocimiento a través de la experiencia, de los hechos y de la Historia.

El punto de partida del investigador es la realidad, los hechos económicos tal y como se producen

en la sociedad. La lectura de esos datos y el conocimiento general de la realidad sugerirán al

investigador alguna hipótesis explicativa de las razones por las que los datos ofrecen una

determinada magnitud o evolución. Esas hipótesis son las que permiten organizar los datos y dan

lugar a la formulación de leyes, teorías y modelos.

Las leyes expresan las regularidades encontradas en las series de datos. Las teorías son una forma

de organizar las hipotéticas leyes y facilitan la comprensión del funcionamiento de la economía.

Finalmente, los modelos son construcciones intelectuales basadas en las teorías que permiten

realizar estimaciones de los efectos que pueden derivarse de cambios en los datos reales. Los

modelos constituyen por tanto un puente entre la teoría pura y el mundo real, pudiendo

contrastarse si una determinada teoría es una buena representación de los hechos que trata de

explicar o no.

En el caso de la ciencia económica, los modelos están basados generalmente en supuestos

simplificadores de la realidad y están formados generalmente por ecuaciones matemáticas que

relacionan distintas variables. Dichas variables pueden dividirse en variables exógenas, que son

aquellas cuyos valores deben ser tomados de la realidad; y variables endógenas, que son aquellas

cuyo valor es deducido al operar con las ecuaciones del modelo. Ambos tipos de variables se

relacionan mediante un conjunto de parámetros, los cuales deben ser estimados.

Los modelos permiten realizar predicciones económicas susceptibles de ser contrastadas con la

realidad. Dichas predicciones son probabilísticas y no deterministas; es decir, que con los modelos

económicos no es posible predecir con precisión cuál será, por ejemplo, el consumo exacto que

realizará un determinado individuo, pero sí se puede prever el comportamiento de grandes

agregados de consumidores estableciendo unos márgenes de error entre los que estará

comprendido, o lo que es lo mismo, estimando la probabilidad de que esa predicción se cumpla.

Según el objeto de análisis, podemos distinguir diversos tipos de modelos económicos:

− Modelos Macroeconómicos, cuando los modelos representan la economía en su totalidad;

se trata de modelos en los que generalmente existe poco detalle sectorial con los que se

pretende cuantificar los resultados de las políticas macroeconómicas, como puede ser un

aumento del gasto público o de la imposición directa. La mayoría de los economistas que

realizan predicciones utilizan tales modelos.

− Modelos Microeconómicos, los cuales analizan la situación de una cierta industria,

mercado o institución.

Asimismo, atendiendo al tipo de relaciones que se establecen entre las variables del modelo

podemos distinguir entre:

− Modelos Deterministas, en los que las relaciones exactas entre las variables del modelo

son exactas. Se trata generalmente de modelos en los que se parte de una o varias

variables, denominadas inputs, a partir de las cuales se intenta conocer el comportamiento

de otras variables, denominadas output, mediante diversas transformaciones

matemáticas. Un ejemplo de este tipo de modelos son las tablas input-output de Leontief.

− Modelos Estocásticos, en los que las relaciones entre las variables no son exactas, ya que

existe un componente de carácter aleatorio, denominado término de error o perturbación

aleatoria, que forma parte de las ecuaciones del modelo. Dicho componente aleatorio

recoge todos aquellos aspectos que no quedan especificados en la relación causal

establecida en el modelo tales como determinadas circunstancias acontecidas de carácter

impredecible (shocks) que influyen en la relación estudiada y los errores en la medición,

documentación y computación de las variables observables que aproximan las variables

teóricas del modelo. En la literatura económica, la mayor parte de los modelos

econométricos son de este tipo estocástico.

Según el tipo de datos de las variables utilizadas en el modelo, podemos distinguir entre:

− Modelos de Series Temporales, en los que se utilizan datos recogidos a lo largo de un

determinado periodo de tiempo: días, semanas, meses, trimestres o años. Ejemplos de

este tipo de variables son las cotizaciones diarias de las acciones, el Índice de Precios al

Consumo, la Encuesta de Población Activa, los datos anuales y trimestrales del Producto

Interior Bruto, etc.

− Modelos de Series de Corte Transversal, en los que se utilizan datos referidos a diferentes

individuos en un mismo momento del tiempo. Ejemplos de datos transversales serían los

productos consumidos por diferentes familias en un determinado año, las ventas que

realizan diversas empresas que forman una determinada industria en un determinado

trimestre, el paro registrado en los municipios españoles en un determinado semestre, etc.

− Modelos de Datos de Panel, en los que se combinan datos de diversos individuos

recogidos a lo largo del tiempo.

Considerando la existencia o no de retardos de las variables incluidas en el modelo podemos

diferenciar entre:

− Modelos Estáticos, cuando las relaciones entre las variables del modelo tienen lugar en

el mismo instante del tiempo tanto para la variable endógena como para todas las

variables explicativas del modelo.

− Modelos Dinámicos, cuando las relaciones entre las variables del modelo están referidas

a diferentes momentos en el tiempo, de forma que un modelo dinámico se construye con

variables retardadas.

Finalmente, según el número de variables endógenas que deseemos explicar podemos distinguir

entre:

− Modelos Uniecuacionales, que constan de una única variable endógena.

− Modelos Multiecuacionales, que poseen varias variables endógenas, algunas de las cuales

pueden ser a su vez variables explicativas en otras ecuaciones.

1.3. LA METODOLOGÍA ECONOMÉTRICA

En términos generales, la metodología econométrica tradicional considera los siguientes pasos en

lo referente a la elaboración de modelos:

1. Planteamiento de la teoría o hipótesis: generalmente se utiliza una construcción teórica

de la Macroeconomía y/o Microeconomía, como por ejemplo la función keynesiana de

consumo, la curva de Phillips, la teoría de la demanda del consumidor, etc.

2. Especificación: el siguiente paso es establecer la relación formal entre las variables a que

da lugar la teoría. Dicha relación se establece en forma matemática funcional, mediante

una ecuación o un sistema de ecuaciones. Las variables que reciben los efectos son las

variables endógenas, las cuales figuraran a la izquierda de las igualdades, mientras que

las que producen los efectos, son las denominadas variables exógenas, las cuales aparecen

en el lado derecho de las ecuaciones. Los efectos de cada variable exógena se cuantifican

a través de una serie de parámetros que debemos estimar. Asimismo, en cada ecuación

del modelo existirá un término de error o perturbación que recoge los efectos aleatorios

y que tendrá unas propiedades probabilísticas definidas.

Una vez establecida la relación funcional matemática, deberemos seleccionar datos de los

que dispongamos nos servirán para representar los valores de las variables teóricas. Por

ejemplo, si incluimos en el modelo como variable teórica la renta tendremos que elegir

los datos que utilizaremos para representar dicha variable de entre las encuestas de que

dispongamos: la renta familiar disponible, la renta interior, la renta nacional, etc. En

algunas ocasiones, puede ocurrir que no exista una variable estadística que responda a los

requisitos que exijamos, por lo que deberemos considerar la existencia de un posible error

de observación.

En definitiva, para la especificación de un modelo completo habrá que especificar

claramente lo siguiente:

− variables endógenas teóricas (y sus respectivos valores observados)

− variables exógenas teóricas (y sus respectivos valores observados)

− perturbaciones aleatorias (no observables)

− errores de observación en las variables endógenas

− errores de observación en las variables exógenas.

3. Selección de datos: una vez hemos especificado el modelo procederemos a la obtención

de un número de suficiente de datos que tengan las siguientes características:

− Suficientes: como mínimo para poder realizar la estimación, el número de

observaciones debe ser igual al número de parámetros que queremos estimar;

de lo contrario, la estimación obtenida no resultará fiable.

− Homogéneos: los datos deben estar expresados de una forma homogénea;

esto quiere decir que todos deben estar expresados en las mismas magnitudes

o valores y tienen que haber sido obtenidos por procedimientos estadísticos

semejantes. Asimismo, si fuera necesario, todas las variables deberán estar

corregidas de la misma manera de determinados efectos que se dan en las

variables económicas como la tendencia o la estacionalidad.

− Actuales: la falta de actualidad en los datos es un problema grave, en

particular si el modelo que construimos tiene como finalidad predecir los

valores futuros o realizar simulaciones de política económica.

4. Estimación: se trata del procedimiento utilizado para obtener el valor de los parámetros

del modelo. Habitualmente la técnica utilizada es el análisis de regresión que incluye

diferentes técnicas: Mínimos Cuadrados Ordinarios (MCO), Mínimos Cuadrados

Indirectos (MCI), Variables Instrumentales (VI), Mínimos Cuadrados en 2 Etapas

(MC2E), Mínimos Cuadrados Generalizados (MCG), etc.

Las técnicas econométricas requieren realizar cálculos a veces muy complejos, por ello

es de gran utilidad el auxiliarnos de herramientas como hojas de cálculo (Excel, Lotus

123, etc.) y programas estadísticos y econométricos (EViews, SPSS, SAS, etc.)

5. Validación: una vez que se han estimado los parámetros del modelo, habrá que verificar

que los valores obtenidos concuerdan con los postulados de la teoría que se ha utilizado

para la construcción del modelo.

La validación del modelo se realiza mediante la técnica estadística de inferencia o

contraste de hipótesis, que consiste en analizar mediante pruebas estadísticas la bondad

del ajuste y la significatividad estadística de los valores estimados, de tal forma que si el

modelo no ha dado los resultados esperados deberá perfeccionarse mediante:

− Un cambio en la forma matemática funcional del modelo.

− Incluyendo en el modelo alguna variable explicativa que haya sido omitida.

− Reemplazando las observaciones utilizadas para representar las variables

endógenas y explicativas por otras que posean un menor error de observación.

6. Utilización: una vez validado, el modelo econométrico puede ser utilizado para diversas

tareas tales como:

− Análisis estructural: cuantificar las relaciones que entre las variables endógenas

y exógenas.

− Predicción: dados unos valores de las variables explicativas, podemos obtener

mediante el modelo estimado el valor futuro que tomará la variable endógena.

− Simulación o evaluación de políticas: efectos que tienen sobre la variable

endógena (variable objetivo) las diferentes estrategias que se planteen sobre las

variables explicativas (variables de control).

2. EL MODELO LINEAL GENERAL

2.1. INTRODUCCIÓN

La regresión lineal es la técnica básica del análisis econométrico. Mediante dicha técnica tratamos

de determinar relaciones de dependencia de tipo lineal entre una variable dependiente o endógena,

respecto de una o varias variables explicativas o exógenas. Gujarati (1975), define el análisis de

regresión como el estudio de la dependencia de la variable dependiente, sobre una o más variables

explicativas, con el objeto de estimar o predecir el valor promedio poblacional de la primera en

términos de los valores conocidos o fijos (en medias muestrales repetidas) de las últimas.

En este capitulo abordaremos el estudio del caso de una única ecuación de tipo lineal con una

variable dependiente y una independiente, y la generalización del modelo al caso de múltiples

variables exógenas. Las extensiones del modelo lineal general se analizaran en capítulos

siguientes.

2.2. REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS

MÍNIMOS CUADRADOS ORDINARIOS.

Partimos de la existencia de una relación lineal entre una variable endógena (Y) y k variables

exógenas (Xi):

ikikiii eXXXY +++++= ββββ ...22110

Nuestro objetivo consiste en estimar los parámetros βi de la ecuación anterior a partir de los datos

muestrales de los que disponemos. Para ello utilizaremos el método de los Mínimos Cuadrados

Ordinarios (MCO), pero antes de ver en que consiste este método debemos plantear ciertas

hipótesis sobre el comportamiento de las variables que integran el modelo.

La variable et la denominamos término de perturbación o error, y en ella recogemos todos aquellos

factores que pueden influir a la hora de explicar el comportamiento de la variable Y y que, sin

embargo, no están reflejados en las variables explicativas, Xi. Estos factores deberían ser poco

importantes, ya que no debería existir ninguna variable explicativa relevante omitida en el modelo

de regresión. En caso contrario estaríamos incurriendo en lo que se conoce como un error de

especificación del modelo. El término de perturbación también recogería los posibles errores de

medida de la variable dependiente, Y.

De lo anterior se desprende que, a la hora de estimar los parámetros del modelo, resultará de vital

importancia que dicho término de error no ejerza ninguna influencia determinante en la

explicación del comportamiento de la variable dependiente. Por ello, si el modelo esta bien

especificado, cuando se aplica el método de Mínimos Cuadrados Ordinarios, cabe realizar las

siguientes hipótesis de comportamiento sobre el término de error:

1. La esperanza matemática de et es cero, tal que E(ei) = 0. Es decir, el comportamiento del

término de error no presenta un sesgo sistemático en ninguna dirección determinada. Por

ejemplo, si estamos realizando un experimento en el cual tenemos que medir la longitud

de un determinado objeto, a veces al medir dicha longitud cometeremos un error de

medida por exceso y otras por defecto, pero en media los errores estarán compensados.

2. La covarianza entre ei y ej es nula para ji ≠ tal que E(ei·ej) = 0. Ello quiere decir que el

error cometido en un momento determinado, i, no debe estar correlacionado con el error

cometido en otro momento del tiempo, j, o dicho de otro modo, los errores no ejercen

influencia unos sobre otros. En caso de existir este tipo de influencia o correlación, nos

encontraríamos ante el problema de la autocorrelación en los residuos, el cual impide

realizar una estimación por Mínimos Cuadrados válida.

3. La matriz de varianzas y covarianzas del término de error debe ser escalar tal que Var(ei)

= σ2I, i=1,…,n, donde I es la matriz unidad. Dado que siempre que medimos una

variable, se produce un cierto error, resulta deseable que los errores que cometamos en

momentos diferentes del tiempo sean similares en cuantía. Esta condición es lo que se

conoce como supuesto de homocedasticidad que, en caso de no verificarse, impediría un

uso correcto de la estimación lineal por Mínimos Cuadrados.

Estas hipótesis implican que los errores siguen una distribución Normal de media cero y varianza

constante por lo que, dado su carácter aleatorio, hace que los errores sean por naturaleza

impredecibles.

Asimismo, las variables incluidas en el modelo deben verificar que:

1. El comportamiento de la variable independiente Y se ajusta al modelo lineal durante todo

el periodo muestral, es decir, no se produce un cambio importante en la estructura de

comportamiento de Y a lo largo de la muestra considerada.

2. Las variables explicativas, Xi, son no estocásticas, es decir, son consideradas fijas en

muestreos repetidos.

3. El número de variables explicativas, k, siempre debe ser menor que el tamaño muestral,

n. Es decir, siempre debemos disponer de más observaciones que parámetros haya en el

modelo (coeficientes β).

Partiendo de la relación lineal más sencilla:

iii eXY ++= 110 ββ

Si suponemos que se verifican los supuestos anteriores, la estimación mínimo cuadrática de los

parámetros β0 y β1, dará como resultado gráfico una recta que se ajuste lo máximo posible a la

nube de puntos definida por todos los pares de valores muestrales (Xi,Yi), tal y como se puede

apreciar en el Figura 2.1.

Fig. 2.1. Nube de puntos o gráfico de dispersión con variables relacionadas linealmente

El término de error, ei, puede ser entendido, a la vista del gráfico anterior, como la distancia que

existe entre el valor observado, Yi, y el correspondiente valor estimado, que sería la imagen de

Xi en el eje de ordenadas. El objetivo de la estimación por Mínimos Cuadrados Ordinarios es,

precisamente, minimizar el sumatorio de todas esas distancias al cuadrado; es decir1:

∑ ∑∑= ==

−−=−=n

i

n

iiii

n

iii XYYYeMin

1 1

210

2

1

2 )ˆˆ()ˆ( ββ

Derivando esta expresión respecto a los coeficientes 0β y 1β e igualando a cero obtenemos el

sistema de ecuaciones normales:

XYXnY o

n

ii

n

ii 1

110

1

ˆˆˆˆ ββββ +=⇒+= ∑∑==

∑∑∑===

+=n

ii

n

ii

n

iii XXXY

1

21

10

1

ˆˆ ββ

1

Los parámetros y variables que llevan encima un símbolo de acento circunflejo (^) indican que son estimadas por lo que no se corresponden con el valor real del parámetro sino con el calculado por nosotros.

donde n representa el tamaño muestral y X e Y representan las medias de dichas variables.

Resolviendo dicho sistema de ecuaciones obtenemos la solución para los parámetros a y b:

( )( )

( )XY

XX

YYXX

o

n

ii

n

iii

1

1

2

11

ˆˆ

ˆ

ββ

β

−=

−

−−=

∑

∑

=

=

Ejemplo 2.1.

Supongamos que el director de una empresa piensa que la demanda de un producto que él

comercializa depende únicamente del precio de venta al público. Para estudiar la demanda de

este producto pretende estimar el siguiente modelo:

ttt eXY ++= 10 ββ

donde Yt es la cantidad vendida anualmente del bien Y en el año t, y Xt es el precio medio al cual

se vendió el bien Y durante el año t. Se dispone de los siguientes datos muestrales:

Año Yt Xt

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

10

12

13

14

15

17

20

21

22

20

19

18

16

15

15

14

14

13

12

13

A partir de estos datos iniciales podemos calcular la siguiente tabla:

Yt Xt ( )tY Y− )( XX t − ( )·( )t tY Y X X− − 2)( XX t −

2)( YYt −

10 19 -6.4 4.1 -26.24 16.81 40.96

12 18 -4.4 3.1 -13.64 9.61 19.36

13 16 -3.4 1.1 -3.74 1.21 11.56

14 15 -2.4 0.1 -0.24 0.01 5.76

15 15 -1.4 0.1 -0.14 0.01 1.96

17 14 0.6 -0.9 -0.54 0.81 0.36

20 14 3.6 -0.9 -3.24 0.81 12.96

21 13 4.6 -1.9 -8.74 3.61 21.16

22 12 5.6 -2.9 -16.24 8.41 31.36

20 13 3.6 -1.9 -6.84 3.61 12.96

Total 164 149 0 0 -79.6 44.9 158.4

Media 16.4 14.9

Aplicando las formulas vistas anteriormente:

11

2

1

0 1

( )( )79.6ˆ 1.7728

44.9( )

ˆ ˆ 16.4 ( 1.7728·14.9) 42.82

n

t tt

n

ti

X X Y Y

X X

Y X

β

β β

=

=

− −−= = = −

−

= − = − − =

∑

∑

de donde la ecuación de la recta estimada será: ttt eXY +−= 7728.182.42

Finalmente, sustituyendo en la expresión anterior los valores de Xt podemos obtener los valores

de tY y el valor de los términos de error et:

tY ttt YYe ˆ−=

9.13140312 0.86859688

10.9042316 1.09576837

14.4498886 -1.44988864

16.2227171 -2.22271715

16.2227171 -1.22271715

17.9955457 -0.99554566

17.9955457 2.00445434

19.7683742 1.23162584

21.5412027 0.45879733

19.7683742 0.23162584

2.3. REGRESIÓN LINEAL MÚLTIPLE

Pasamos a continuación a generalizar el modelo anterior al caso de un modelo con varias variables

exógenas, de tal forma que se trata de determinar la relación que existe entre la variable endógena

Y y variables exógenas: X1, X2.…, Xk. Dicho modelo se puede formular matricialmente de la

siguiente manera:

ikikii eXXXeXY ++++=+= ββββ ...· 2211 , i=1,2,…, n

donde:

=

nY

Y

Y

Y...

2

1

es el vector de observaciones de la variable endógena

[ ]k21

21

22221

11211

X ...X X

...

............

...

...

=

=

nknn

k

k

XXX

XXX

XXX

X es la matriz de observaciones de las variables

exógenas

=

Kβ

ββ

β...

2

1

es el vector de coeficientes que pretendemos estimar

=

ne

e

e

e...

2

1

es el vector de términos de error

Si en la expresión anterior se considerara que existe término independiente, β0, la matriz X

quedaría como:

11 1

21 21 3 k

1

1 ...

1 ... X X ... X

... ... ... ...

1 ...

1

k

k

n nk

X X

X XX

X X

= =

Y el modelo quedaría así:

ikikiioi eXXXY +++++= ββββ ...2211 , i=1,2,…, n

Suponiendo que se verifican las hipótesis que veíamos antes, el problema a resolver nuevamente

es la minimización de la suma de los cuadrados de los términos de error tal que:

( ) ( )∑ ∑ ∑= = =

−=−=n

i

n

i

n

iiii XYYYeMin

1 1 1

222 ˆˆ β

Desarrollando dicho cuadrado y derivando respecto a cada βi obtenemos el siguiente sistema de

ecuaciones normales expresado en notación matricial:

ˆ' · 'X X X Yβ =

en donde basta con despejar β premultiplicando ambos miembros por la inversa de la matriz

)'( XX para obtener la estimación de los parámetros del modelo tal que:

YXXX ')'(ˆ 1−=β

donde:

=

∑∑∑

∑∑∑

∑∑∑

===

===

===

n

tki

n

tiki

ti

n

tkii

n

ti

n

tii

n

tkii

n

tii

n

ti

XXXX

XXXXX

XXXXX

XX

1

2

12

n

11ki

12

1

22

112

11

121

1

21

...X

..................

...

...

'

=

∑

∑

∑

=

=

=

n

tiki

n

tii

n

tii

YX

YX

YX

YX

1

12

11

....

`

Si en el modelo existiera término independiente, β0, las matrices anteriores serían:

=

∑∑∑

∑∑∑

∑∑

===

===

==

n

tki

n

tiki

t

n

tkii

n

ti

n

ti

n

tki

n

ti

XXX

XXXX

XXn

XX

1

2

11

n

1ki

11

1

21

11

111

...X

..................

...

...

'

=

∑

∑

∑

=

=

=

n

tiki

n

tii

n

ti

YX

YX

Y

YX

1

11

1

....

`

El resultado de multiplicar dichas matrices conduce a la obtención de la estimación de los

parámetros βi del modelo:

( )

=

==

∑

∑

∑

∑∑∑

∑∑∑

∑∑

=

=

=

−

===

===

==

−

k

o

n

iiki

n

iii

n

ii

n

tki

n

tiki

t

n

tkii

n

ti

n

ti

n

tki

n

ti

YX

YX

Y

XXX

XXXX

XXn

YXXX

β

ββ

β

ˆ...

ˆ

ˆ

....

...X

..................

...

...

''ˆ 1

1

11

1

1

1

2

11

n

1ki

11

1

21

11

111

1

Cada uno de los coeficientes estimados, iβ , son una estimación insesgada del verdadero

parámetro del modelo y representa la variación que experimenta la variable dependiente Y cuando

una variable independiente Xi varía en una unidad y todas las demás permanecen constantes

(supuesto ceteris paribus). Dichos coeficientes poseen propiedades estadísticas muy interesantes

ya que. si se verifican los supuestos antes comentados, son insesgados, eficientes y óptimos.

Ejemplo 2.2.

Un investigador estudia el empleo en el sector turístico en España. Para ello dispone de

información relativa al empleo en los hoteles (Y), número de turistas medido en miles (X1), y la

estancia media de los turistas (X2) medida en días. Los datos disponibles son de corte transversal

y pertenecen a cada una de las 17 Comunidades Autónomas.

Provincias Empleo (miles)

Número de viajeros (miles)

Estancia media

Andalucía 28.4 11902.5 3.1 Aragón 3.6 1848.0 2.1 Asturias 2.4 1088.2 2.3 Baleares 25.9 6716.0 7.2 Canarias 27.2 4875.7 7.8 Cantabria 2.0 933.8 2.4 Castilla y León 6.2 3647.6 1.7 Castilla-La Mancha 2.8 1805.1 1.7 Cataluña 23.5 10771.7 3.4 Comunidad Valenciana 13.4 5579.7 3.9 Extremadura 2.2 1000.7 1.7 Galicia 6.3 3040.5 2.1 Madrid 10.7 5748.9 2.1 Murcia 2.0 882.5 3.0 Navarra 1.1 557.7 2.0 País Vasco 3.2 1540.6 1.9 Rioja (La) 0.7 446.2 1.8

El modelo teórico a estimar con la información disponible es el siguiente:

Yi = β0+β1 X1i + β2 X2i + ei

Para proceder a estimar es modelo lo más conveniente es calcular la matriz de productos cruzados:

Y X1 X2

Y 3193 1101921 709 X1 426702792 227645 X2 203

en donde 17

2

1

3193ii

Y=

=∑ , 17

11

1101921i ii

Y X=

=∑ , 17

21

709i ii

Y X=

=∑ , 17

21

1

426702792ii

X=

=∑ ,

17

1 21

227645i ii

X X=

=∑ y 17

22

1

203ii

X=

=∑

Teniendo presente que:

17

1

17

11

17

21

17

161.8

62385.5

50.3

ii

ii

ii

N

Y

X

X

=

=

=

=

=

=

=

∑

∑

∑

del que se conocen los siguientes resultados:

( )17 62386 50

' 62386 426702792 227645

50 227645 203

X X

=

( )162

' 1101921

709

X Y

=

Vamos a estimar el modelo propuesto por Mínimos Cuadrados Ordinarios. Para ello, basta con

multiplicar las matrices tal que:

( ) 1

0.231 0.00001 0.048 162 5.702ˆ ' ' 0.00001 0.00000001 0.000005 1101921 0.006

0.048 0.000005 0.022 709 2.679

X X X Yβ −− − −

= = − − = − −

Por lo que el modelo queda como sigue:

iY = -5.702+0.006 X1i + 2.679 X2i

donde 1 0.006β = indica el efecto de las variaciones unitarias del número medio de turistas sobre

el empleo del sector, y 679.2ˆ2 =β mide la variación que se produciría en empleo si la estancia

media aumentara en una unidad.

2.4. PROPIEDADES ESTADISTICAS DEl ESTIMADOR MÍNIMO

CUADRADO.

El estimador YXXX ')'(ˆ 1−=β puede escribirse como:

eXXXeXXXX ')'()(')'(ˆ 11 −− +=+= βββ

Si se cumplen las hipótesis de comportamiento sobre el término error, la distribución de

probabilidad del estimador MCO β será uno distribución normal multivariante con vector de

mediasβ y matriz de varianzas y covarianzas 12 )'( −XXσ.

La esperanza matemática del estimador MCO se demuestra a partir de:

[ ] ββββ =+=+= −− )(')'(')'()ˆ( 11 eEXXXeXXXEE .

De la definición de matriz de varianzas y covarianzas, se tiene que:

( )( )

−−=

')ˆ(ˆ)ˆ(ˆ)ˆvar( βββββ EEE

Teniendo presente que

( ) eXXXeXXXE ')'(')'()ˆ(ˆ 11 −− =−+=− ββββ

Entonces

[ ] ( ) 121111 )'()'('')'()'('')'()ˆvar( −−−−− === XXXXXeeEXXXXXXeeXXXE σβ

El estimador jβdel parámetro jβ

es insesgado porque su esperanza matemática coincide con el

verdadero valor del parámetro jjE ββ =)ˆ(.

Se dice que un estimador insesgado jβ es mas eficiente que otro estimador insesgado jβ~

, si la

varianza muestral de jβ

es menor que la varianza muestral de jβ~. El teorema de Gauss-Markov

demuestra que el estimador MCO jβ

es el más eficiente de la clase de estimadores lineales e

insesgados de jβ.

Según el Teorema de Gauss-Markov, cualquier estimador lineal de puede expresarse como:

[ ] [ ]( ) DeeXXXDXeXDXXXYDXXX +++=++=+= −−− ')'(')'(')'( 111 βββ

donde D es una matriz (k×n) arbitraria, que establece la diferencia entre el estimador MCO y el

estimador alternativo.

La esperanza de dicho estimador es:

( ) DXE += ββ~

Si β~ es insesgado, entonces 0=DX . En otras palabras el estimador alternativo sólo será

insesgado si la matriz de distancia es ortogonal a las variables explicativas.

A continuación obtenemos la matriz de covarianzas de este estimador

( )( )[ ]')~

(~

)~

(~

)~

var( βββββ EEE −−=

Teniendo presente que :

( ) [ ]eDXXXDeeXXXDXE +=−+++=− −− ')'(')'()~

(~ 11 ββββ

entonces,

( ) ( )( ) [ ]DDXXXXXDeeEDXXX ')'()'(''')'()~

var( 1211 +=++= −−− σβ

y como DD' es una matriz semidefinida positiva, se demuestra que la )ˆvar()~

var( ββ > con

independencia de la normalidad o no de las distribución β~

.

2.5. COEFICIENTES DE DETERMINACIÓN Y CORRELACIÓN

PARCIAL

2.5.1. Coeficiente de determinación

Una vez estimada la ecuación de regresión lineal tiene interés determinar la exactitud del ajuste

realizado. Para ello hay que analizar la variación que experimenta esta variable dependiente y,

dentro de esta variación, se estudia qué parte está siendo explicada por el modelo de regresión y

qué parte es debida a los errores o residuos.

La forma de realizar dicho análisis es a partir de la siguiente expresión:

SCRSCESCT +=

donde:

− SCT: es la Suma de Cuadrados Totales y representa una medida de la variación de la

variable dependiente.

− SCE es la Suma de Cuadrados Explicados por el modelo de regresión.

− SCR es la Suma de Cuadrados de los Errores

Cuando el modelo tiene término independiente, cada una de estas sumas viene dada por:

2 2 2

1

'n

ii

SCT Y Y nY Y nY=

= − = −∑

2 2 2

1

ˆ ˆ ˆ' 'n

ii

SCE X Y nY Y nYβ β=

= − = −∑

2 2 2

1 1 1

ˆ ˆ' ' 'n n n

i i ii i i

SCR e Y Y X Y Y Y SCT SCEβ= = =

= = − = − = −∑ ∑ ∑

A partir de las expresiones anteriores es posible obtener una medida estadística acerca de la

bondad de ajuste del modelo mediante lo que se conoce como coeficiente de determinación (R2).

que se define como:

SCT

SCRR −= 12

, 10 2 ≤≤ R

y en el caso particular de modelo con término independiente. como:

SCT

SCER =2

, 10 2 ≤≤ R

Mediante este coeficiente es posible seleccionar el mejor modelo de entre varios que tengan el

mismo número de variables exógenas. ya que la capacidad explicativa de un modelo es mayor

cuanto más elevado sea el valor que tome este coeficiente. Sin embargo. hay que tener cierto

cuidado a la hora de trabajar con modelos que presenten un R2 muy cercano a 1 pues, aunque

podría parecer que estamos ante el modelo “perfecto”, en realidad podría encubrir ciertos

problemas de índole estadística como la multicolinealidad que veremos en el capítulo 3.

Por otra parte. el valor del coeficiente de determinación aumenta con el número de variables

exógenas del modelo por lo que. si los modelos que se comparan tienen distinto número de

variables exógenas, no puede establecerse comparación entre sus R2. En este caso debe emplearse

el coeficiente de determinación corregido 2R , el cual depura el incremento que experimenta el

coeficiente de determinación cuando el número de variables exógenas es mayor.

La expresión analítica de la versión corregida es:

( )22 11

11

1 Rkn

n

nSCT

knSCRR −

−−−=

−−−=

cuyo valor también oscila entre 0 y 1

Ejemplo 2.3.

En el modelo del empleo en el sector hotelero los errores ei se calculan a partir de:

ei=Yi – 5.702+0.002 X1i + 2.679 X2i

El error correspondiente a cada región es:

ei

Andalucía 2.193 Aragón -0.003 Asturias -0.146 Baleares -1.108 Canarias 2.195 Cantabria -0.508 Castilla y León 0.044 Castilla-La Mancha 0.424 Cataluña -1.325 Comunidad Valenciana -2.406 Extremadura 1.315 Galicia 0.290 Madrid -0.687 Murcia -2.034 Navarra 0.432 País Vasco 0.703 Rioja (La) 0.622

Las expresiones SCT, SCE y SCR son:

654,117' 217

1

22 =−=−= ∑=

YYYnYYSCTi

i

172 2 2

1

ˆ ˆ ˆ' ' 17 1,627ii

SCE X Y nY Y Yβ β=

= − = − =∑

2

1

ˆ' ' ' 1,654 1,627 27n

ii

SCR e Y Y X Y SCT SCEβ=

= = − = − = − =∑

Con ellas calculamos el coeficiente de determinación y el coeficiente de determinación corregido:

984.0654,1

627,12 ==R

982.0117654,1

3172712 =

−−−=R

El coeficiente de determinación y el coeficiente de determinación ajustado está cercano a uno lo

que constituye una prueba de que el ajuste realizado es aceptable. El modelo estaría explicando

el 98% de la variación del grado de ocupación que se da en las Comunidades Autónomas.

2.5.2. Coeficiente de correlación parcial

El coeficiente de correlación parcial entre dos variables del modelo, Xi y Xj (ó Xi e Y) describe la

relación lineal existente entre dos variables sin tener en cuenta los efectos o influencias de una o

más variables adicionales, con el objeto de identificar la existencia de posibles variables

interpuestas, o de detectar correlaciones neutralizadas por el efecto de estas variables.

Así, supongamos el caso de un modelo lineal que incluye dos variables independientes (X1 y X2)

y una variable dependiente (Y). Si deseamos obtener el coeficiente de correlación parcial entre Y

y X1, tomando como dados los efectos de X2 debemos seguir los siguientes pasos:

1. Realizamos una regresión de Y sobre X2 y obtenemos los residuos, que denominaremos

ei.

2. Del mismo modo, para suprimir el efecto de la variable X2 sobre X1, realizamos una

regresión de X1 sobre X2 y obtenemos los residuos de esta regresión, que denominaremos

ui.

3. Calculamos las varianzas residuales, Se2 y Su

2, y la covarianza entre ambos, Seu.

4. El coeficiente de correlación parcial entre Y y X1 es:

12,3 ·eu

e u

Sr

S S=

De forma análoga, podemos obtener mediante sucesivas regresiones los distintos coeficientes de

correlación parcial entre el resto de variables.

2.6. INFERENCIA ACERCA DE LOS ESTIMADORES

Hasta el momento hemos visto como la estimación por MCO permite obtener estimaciones

puntuales de los parámetros del modelo. La inferencia acerca de los mismos permite completar

dicha estimación puntual, mediante la estimación por intervalos y los contrastes de hipótesis. Los

primeros posibilitan la obtención de un intervalo dentro del cual, con un determinado nivel de

confianza, oscilará el verdadero valor de un parámetro, mientras que los segundos nos permitirán

extraer consecuencias del modelo, averiguando si existe o no, evidencia acerca de una serie de

conjeturas que pueden plantearse sobre sus parámetros.

La inferencia estadística consiste en la estimación de los parámetros poblacionales a partir de la

información extraída de una muestra de dicha población. El número de estimaciones que podemos

realizar de una población, a través de la extracción de diferentes muestras de un mismo tamaño, es

generalmente muy grande porque cada una de las muestras posibles que se pueden sacar de la

población arrojaría una estimación.

Por esta razón, a la estimación que obtenemos en una investigación por muestreo la acompañamos

con un intervalo de valores posibles. La amplitud de dicho intervalo dependerá del grado de confianza

que establezcamos.

El grado o nivel de confianza nos expresa el número de veces que la media verdadera de la población

está incluida en cien intervalos de cien muestras extraídas de una población dada. El nivel de

confianza más utilizado es el 95%, lo que quiere decir que 95 de cada 100 intervalos construidos

contendrán el verdadero valor de la media.

El intervalo de confianza para la media de una población normalmente distribuida se construye en

base a la probabilidad de que dicha media esté comprendida entre dos valores. Xa y Xb equidistantes

a ella:

[ ] 1a bXP X Xµ α≤ ≤ = −

siendo 1- α el nivel o grado de confianza asociado a dicho intervalo.

En términos generales, los intervalos de confianza para los estadísticos muestrales se expresan como:

Estimador ± (Factor de Fiabilidad)*(Error Típico del Estimador)

2.6.1. Intervalos De Confianza

Presentamos a continuación cómo se construyen los intervalos de confianza para los distintos

términos que hayamos estimado en el modelo:

a) Intervalo de confianza para el parámetro iβ

Para construir los intervalos de confianza de las estimaciones iβ , se parte de que la estimación

MCO proporciona el valor medio de los posibles valores que pudiera tener dicho parámetro, y

que la distribución de dichos valores sigue una distribución derivada de la Normal que se conoce

como t de Student. Dicha distribución es simétrica presentando mayor dispersión que la curva

Normal estándar para un tamaño muestral n pequeño. A medida que n aumenta (n > 100) es

prácticamente igual que la distribución Normal.

El cálculo del intervalo de confianza para iβ se realiza mediante la siguiente expresión:

ˆ: ( )i i

i n kIC S tβ ββ −±

donde iSβ es la desviación típica estimada para el coeficiente iβ , que se obtiene de la matriz de

varianzas y covarianzas de los estimadores expresada como:

1 1 2 1

2 1 2 2

1 2

2

2 2

ˆ ˆ

2

...

...

... ... ... ...

...

K

K

K K K

β β β β β

β β β β βββ

β β β β β

σ σ σσ σ σ

σ σ σ

Σ =

cuyos estimadores serán:

=

2ˆˆˆˆˆ

2ˆˆ

2ˆˆˆ

ˆˆˆˆ2ˆ

ˆˆ

...

............

...

...

21

2212

1211

KKK

K

K

SSS

SSS

SSS

S

βββββ

βββββ

βββββ

ββ

obtenidos a partir de la expresión ( ) 12ˆˆ ' −= XXSS eββ . donde

2eS es la estimación de la varianza del

término de error.

Destacar por último que tn-k es el valor teórico de la distribución t de Student que aparece tabulada

en el Anexo II, tabla II.2.

Ejemplo 2.4

Utilizando los resultados de la estimación del modelo del empleo en hoteles, tenemos que la

varianza de los errores al cuadrado es:

84.114

272 ==−

=kn

SCRSe .

Entonces, la matriz de varianzas y covarianzas de los estimadores será:

( )

−−−−

−−=

−−

−−== −

042.000001.0091.0

00001.000000001.000001.0

091.000001.0435.0

022.0000005.0048.0

000005.000000001.000001.0

048.000001.0231.0

84.1' 12ˆˆ XXSS eββ

Teniendo presente que el estadístico t-Student tiene un valor en las tablas de t17-3=2.145 para

α=0.025 para cada cola (el 95% de probabilidad) podemos afirmar que el valor de los parámetros

de la ecuación estarán entre:

)936.5702.5()145.2435.0702.5(: ±−=⋅±−o

ICβ

)0002.0002.0()145.200000001.0002.0(:1

±=⋅±βIC

)440.0679.2()145,2042.0679.2(: ±=⋅±o

ICβ

Los intervalos de confianza calculados nos dicen que lo más probable es que, por ejemplo, el

parámetro βo este entre los valores –4.287 y –7.117.

b) Intervalo de confianza para la varianza del término de error

La expresión del intervalo de confianza para la varianza del término de error es:

≡

−−

−−2

22

21

221

2

;)(

;)(

:2222 αααα χχχχσ

SCRSCRknSknSIC ee

e

donde α representa el nivel de significación del contraste y generalmente se utiliza un 5% de

significación, que corresponde a un intervalo de confianza del 95 %.

En este caso se asume que la Suma de Cuadrados de los Errores se distribuyen según una

distribución también derivada de la Normal que se conoce como 2χ de Pearson. La distribución

χ2 de Pearson es asimétrica. Su propiedad fundamental es que si sumamos dos χ2 independientes

de grados de libertad n1 y n2 , se obtiene una nueva variable χ2 con grados de libertad igual a la

suma de n1 y n2 . Los grados de libertad que hay que considerar en el cálculo de los intervalos

de confianza del término error son de n-k.

En el Anexo II, tabla II.3. también figuran los valores teóricos de la distribución 2χ de Pearson.

Ejemplo 2.5.

Utilizando los datos del modelo del grado de ocupación hotelera. calculamos el intervalo de

confianza para el error con un nivel de significación de α=0.05 y 14 grados de libertad, calculamos

el intervalo para el término de error:

)78,4;04,1(628,5

27;

119,26

27;

2025.0 975.0

22=

=

≡

χχσSCRSCR

IC

e

Es decir, se puede afirma con un 95% de probabilidad que el verdadero valor de la varianza estará

entre 1,04 y 4,78.

2.6.2. Contrastes de Hipótesis

Una buena parte de las investigaciones estadísticas están orientadas al desarrollo de procesos

encaminados a la contrastación de hipótesis que previamente se han establecido.

Una hipótesis es una afirmación que está sujeta a verificación o comprobación. Hay que tener

presente que una hipótesis no es un hecho establecido o firme, las hipótesis están basadas en la

experiencia, en la observación, en la experimentación o en la intuición del sujeto que las formula.

Cuando las hipótesis se plantean de tal modo que se pueden comprobar por medio de métodos

estadísticos reciben el nombre de hipótesis estadísticas. Estas hipótesis son afirmaciones que se

efectúan sobre uno o más parámetros de una o más poblaciones. Las hipótesis estadísticas son de dos

tipos: hipótesis nula e hipótesis alternativa. La hipótesis nula, o que no se verifique dicha afirmación,

simbolizada por H0, es la hipótesis que se debe comprobar.

Para contrastar una hipótesis nula examinamos los datos de la muestra tomados de la población y

determinamos si son o no compatibles con dicha hipótesis. Si son compatibles entonces H0 se acepta,

en caso contrario se rechaza. Si se acepta la hipótesis nula afirmamos que los datos de esa muestra

en concreto no dan suficiente evidencia para que concluyamos que la hipótesis nula sea falsa; si se

rechaza decimos que los datos particulares de la muestra ponen de manifiesto que la hipótesis nula

es falsa, entonces la hipótesis alternativa. H1, es verdadera.

El criterio que permite decidir si rechazamos o no la hipótesis nula es siempre el mismo. Definimos

un estadístico de prueba, y unos límites que dividen el espacio muestral en una región en donde se

rechaza la hipótesis establecida, y otra región en la que no se rechaza, llamada región de aceptación.

A la región donde se rechaza la hipótesis nula se le llama región crítica. Esta región es un subconjunto

del espacio muestral, y si el valor del estadístico de prueba pertenece a él se rechaza la hipótesis nula.

El límite entre la región crítica y la región de aceptación viene determinado por la información previa

relativa a la distribución del estadístico de prueba.

Señalar que un estadístico de prueba es una fórmula que nos dice como confrontar la hipótesis nula

con la información de la muestra y es, por tanto, una variable aleatoria cuyo valor cambia de muestra

a muestra.

Otra de las consideraciones a realizar en la contrastación de hipótesis es fijar la probabilidad del error

de rechazar la prueba siendo cierta, a este error se le denomina nivel de significación. Por ejemplo, si

se utiliza un nivel de significación de 0.05, equivale a decir que si para realizar un contraste

tomáramos infinitas muestras de la población, rechazaríamos la hipótesis nula de forma incorrecta

un 5 % de las veces.

En la formalización del procedimiento de contrastación podemos distinguir siete pasos principales:

1.- Planteamiento de las hipótesis.

2.- Selección del nivel de significación.

3.- Descripción de la población y tamaño de la muestra.

4.- Selección del estadístico de prueba y su distribución.

5.- Especificación de las regiones de aceptación y de rechazo.

6.- Recolección de datos y cálculo del estadístico.

7.- Decisión estadística.

Los contrastes de hipótesis que normalmente se realizan en la estimación MCO son los siguientes:

a) Contraste individual sobre un parámetro

Formulación de la hipótesis: *

0 : jjH ββ =

*1 : jjH ββ ≠

Estadístico experimental: j

St jj

β

ββ

ˆ

*

exp

ˆ −=

Estadístico teórico: )2/(αkntco tt −=

Regla de decisión: Si tcott >exp se rechaza la hipótesis H0

b) Contraste de significación individual

Formulación de la hipótesis: 0:0 =jH β

0:1 ≠jH β

Estadístico experimental: j

St j

β

β

êxp

ˆ=

Estadístico teórico: )2/(αkntco tt −=

Regla de decisión: Si tcott >exp se rechaza la hipótesis H0

c) Contraste de significación global

Formulación de la hipótesis: 0...: 210 ==== kH βββ

Estadístico experimental: ( )kn

Rk

R

knSCR

kSCE

F

−−

−=−

−=2

2

exp1

11

Estadístico teórico: ( )α, ,1 knkFFtco −−=

Regla de decisión: Si tcoFF >exp se rechaza la hipótesis H0

Ejemplo 2.6.

Utilizando los resultados del modelo del grado de ocupación hotelera vamos a plantear la hipótesis

de que el parámetro β2 sea cero, y en consecuencia que el efecto de la estancia media de cada

turista sobre el grado de ocupación hotelera no sea significativo.

1º.- Planteamiento de la hipótesis

Se contrasta la hipótesis de que 0: 20 =βH , frente a la alternativa de que dicho valor sea

diferente de cero 1 2: 0H β ≠ .

2º.- Nivel de significación o error de tipo I.

Sea α=0.05.

3º.- Descripción de la población y tamaño de la muestra.

La población son las Comunidades Autónomas españolas, lo que significa que n=17.

4º.- El estadístico pertinente.

El estadístico a calcular es:

jS

t j

β

β

êxp

ˆ=

5º.- Regiones de aceptación y de rechazo.

El valor crítico es 2.145, que es el valor correspondiente de la distribución t de Student

con 17-3=14 grados de libertad que deja el 2.5 % de la distribución en cada cola. De modo

que la región de rechazo de la hipótesis nula es la de todos los valores absolutos de t

superiores a 2.145.

6º.- Recolección de datos y cálculo del estadístico.

057.13205.0

679.2exp ==t

7º.- Decisión estadística.

Dado que 13.057 es mayor que 2.145 rechazamos la hipótesis nula y, por tanto, concluimos que

con un 95% de probabilidad se acepta la hipótesis alternativa 0: 21 ≠βH

2.7. TABLA DE ANALIS DE LA VARIANZA (ANOVA)

La hipótesis de no significación global 0...: 210 ==== kH βββ se rechaza al nivel de

significación α construyendo el estadístico experimental:

knSCR

kSCE

F

−

−= 1exp

y la regla de decisión que rechaza la hipótesis 0H ocurre cuando )..,1(exp αknkFF −−>

El contraste en la práctica se realiza elaborando una tabla ANOVA, que requiere:

1. estimar el modelo de regresión con todas las variables de interés

ikikiioi eXXXY +++++= ββββ ...2211 , i=1,2,…, n

que nos proporciona la suma de cuadrados de los residuos SCRee =ˆ'ˆ ;

2. estimar elmodelo de regresión bajo 0...: 210 ==== kH βββ

rioi uY += β , i = 1, . . . ,n,

que nos proporciona la suma de cuadrados de los residuos, SCTYYuu

n

i irr ∑ ==−=

1)(ˆ'ˆ

;

El contraste de significación global se resume en el cuadro siguiente, en donde la variación total

de la variable dependiente (SCT) se descompone en la explicada por la regresión (SCE) y en la

no explicada (SCR). Los grados de libertad de estas tres sumas de cuadrados son 1−n , 1−k y

kn − , respectivamente.

A partir de esta información muestral, podemos calcular el numerador y denominador del

estadístico F.

Fuente de

variación

Suma de cuadrados Grados de

libertad

Cuadrado

medio

Estadístico F

Regresión SCE=∑ =−n

i i YY1

2)ˆ( k-1 1−k

SCE

knSCR

kSCE

−

−1

Residual SCR=∑ =

−n

i ii YY1

2)ˆ(

n-k kn

SCR−

Total SCT=∑ =

−n

i i YY1

2)(

n-1

Ejemplo 2.7.

Utilizando los resultados del modelo de grados de ocupación hotelera vamos a realizar el contraste

de significación global construyendo la tabla ANOVA:

Fuente de

variación

Suma de

cuadrados

Grados de

libertad

Cuadrado medio Estadístico F

Regresión 1,627 2 813.5 421.81

Residual 27 14 1.93

Total 1,654 16

Dado que 74,3)05,0,14,2(exp ===> αFFF tco , la regla de decisión se rechaza la hipótesis

H0 .

2.8. PREDICCIÓN EN EL MODELO DE REGRESIÓN

Una vez estimado y validado el modelo, una de sus aplicaciones más importantes consiste en

poder realizar predicciones acerca del valor que tomaría la variable endógena en el futuro o para

una unidad extramuestral. Esta predicción se puede realizar tanto para un valor individual como

para un valor medio, o esperado, de la variable endógena, siendo posible efectuar una predicción

puntual o por intervalos. Su cálculo se realiza mediante las expresiones que figuran a

continuación:

α) Predicción individual: se trata de hallar el valor estimado para la variable Y un periodo

hacia delante. En este caso basta con sustituir el valor de las variables exógenas en el

modelo en el siguiente periodo y calcular el nuevo valor de Y.

β) Intervalo de predicción. Para hallar un intervalo de predicción debe utilizarse la siguiente

expresión:

( ) ( )

+++− +

−+−++

−+−+ 1

1'111

1'11 '1Y ; '1ˆ: tteknttteknt XXXXStXXXXStYIC

χ) Intervalos de predicción para un valor medio o esperado, jY, La expresión a utilizar en

este caso será:

( ) ( ) ( )

+− −

−−

− jjeknjjjeknjYE XXXXStXXXXStYICj

1'1' 'Y; 'ˆ:

Ejemplo 2.8

Utilizando los datos del modelo de estimación del empleo en hoteles, vamos a realizar una

predicción del grado de empleo que tendría Cataluña, si mediante una adecuada promoción se

elevara el número de días de estancia por turista de 3.4 días a 5 días de media por turista.

La predicción individual de Cataluña sería:

jY= -5.702+0.002⋅10771.7+ 2.679 ⋅5 = 29.1

Para calcular el intervalo de la predicción tenemos que calcular la expresión ( ) jj XXXX 1' ' −

( ) ( ) 319.0

5

722.10

1

022.0000005.0048.0

000005.000000001.000001.0

048.000001.0231.0

5722.101' 1' =

−−

−−=−

jj XXXX

Si deseamos un intervalo de confianza para la predicción del 95%, tenemos que utilizar un valor

t17-3=2.145

( ) ( ): 29.1 2.145 1.37 0.319; 29.1 2.145 1.37 0.31927.4; 30.8jE Y

IC − ⋅ + ⋅ =

2.9. ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CO N

EXCEL

A continuación. vamos a estimar los parámetros de un determinado modelo por Mínimos

Cuadrados Ordinarios utilizando Microsoft Excel, programa que simplifica notablemente los

cálculos a realizar cuando disponemos de muchas observaciones y/o variables exógenas.

Supongamos que la cantidad demandada de manzanas viene determinada en función de su precio

y queremos cuantificar dicha relación. Partimos de la siguiente tabla de datos:

Cantidad (Kg.)

Precio (u.m. / Kg.)

2.456 82 2.325 92 2.250 94 2.200 99 2.100 106 2.082 108 2.045 112 2.024 115

Si realizamos un diagrama de dispersión mediante la opción Gráfico dentro del menú Insertar de

Excel obtendremos la Figura 2.2, en el que puede comprobarse la relación que aparentemente

existe entre cantidades demandadas de manzanas y su precio.

Curva de Demanda

80

85

90

95

100

105

110

115

120

125

130

2.000 2.100 2.200 2.300 2.400 2.500

Fig. 2.2. Relación entre la demanda de manzanas y su precio

Pasamos a continuación a estimar la recta de regresión por Mínimos Cuadrados Ordinarios. Para

ello, el lector debe verificar que tiene instalada la opción Herramientas para el Análisis dentro la

opción Complementos del menú Herramientas, tal y como puede observarse en la siguiente figura

2.3:

Fig. 2.3.

En caso de no tener dicha opción instalada en nuestro ordenador, deberemos marcar las casillas

que se ven en la figura 2.3, insertando seguidamente el CD-Rom de Microsoft Office para

proceder a su instalación. Una vez instaladas estas opciones, dispondremos de una nueva opción

en el menú Herramientas llamada Análisis de Datos. Si pinchamos en ella, nos aparecerá una

ventana similar a la de la figura 2.4, en la que seleccionaremos la opción Regresión:

Fig. 2.4.

Al seleccionar dicha opción nos aparecerá un cuadro de diálogo como el siguiente:

Fig. 2.5

En este cuadro de diálogo podemos seleccionar el rango de nuestra hoja de cálculo que contiene

los datos referidos a la variable endógena (Rango Y de entrada) y a las variables exógenas (Rango

X). Asimismo, se incluyen otras opciones sumamente útiles tales como eliminar el término

independiente del modelo (Constante igual a cero), determinar el nivel de confianza al cual se

realizarán los tests de significación de los parámetros, la posibilidad de obtener una tabla con los

términos de error del modelo (Residuos) y su gráfico (Grafico de Residuales), etc.

Una vez introducidos los rangos de las variables y seleccionado las opciones que deseemos (no

debemos olvidar indicar en qué Hoja, Rango o Libro deseamos aparezcan los resultados),

pulsamos en Aceptar y nos aparecerá una ventana similar a ésta (Fig. 2.6.):

Fig. 2.6.

La estimación de los parámetros del modelo aparecen en la columna Coeficientes, junto con su

Desviación Típica o Error Típico y el estadístico t de significatividad individual (obsérvese que

al término independiente del modelo, Excel lo denomina Intercepción). A la vista de los

resultados, el modelo estimado tiene la siguiente forma:

Cantidad = 3,534.27 – 13.36· Precio

(48.1) (-18.46)

donde entre paréntesis se muestra el estadístico t experimental asociado a cada parámetro. siendo

ambas claramente superiores a 2.365 (valor en tablas de una t de Student con n – k = 7 grados de

libertad al 95% de confianza.

Para el análisis de la bondad de ajuste del modelo, Excel ofrece los siguientes resultados:

a) Por un lado, si marcamos la casilla Curva de Regresión Ajustada obtenemos un gráfico

con los valores originales y estimados de la variable endógena. lo que nos permitirá

realizar un primer acercamiento visual al grado de ajuste de la recta (véase figura 2.7)

Fig. 2.7. Recta de regresión entre la demanda de manzanas y su precio

b) Por otro lado, Excel muestra en la parte superior de los resultados el valor del coeficiente

de determinación que, en nuestro caso, es del 98% lo que nos indica un grado de ajuste

muy bueno.

1900,0

2000,0

2100,0

2200,0

2300,0

2400,0

2500,0

80 85 90 95 100 105 110 115 120

Can

tidad

Precio

Curva de regresión ajustada

Cantidad

Pronóstico Cantidad

Para evaluar la significatividad estadística de los parámetros estimados, además de los estadísticos

t asociados a cada parámetro estimado y los respectivos intervalos de confianza para cada uno de

ellos. Excel nos muestra también el estadístico F que aparece en la tabla Análisis de Varianza,

mediante el que se realiza un contraste de significación global de los parámetros estimados. En

los resultados obtenidos. el estadístico F tomo un valor 340.8 asociado a un p-value de 0.0000016,

valor que es claramente inferior a 0.05, por lo que se rechaza la hipótesis nula, lo que nos permite

afirmar que todos los parámetros del modelo son globalmente significativos, es decir, todos son

significativamente distintos de cero. En este punto, cabe señalar que si estimamos un modelo con

varias variables exógenas y nos encontramos con que alguno de los parámetros del modelo es

estadísticamente igual a cero, deberíamos eliminar dicha variable del modelo al no haberse

encontrado una relación de causalidad con la variable endógena.

Respecto al análisis de los errores o residuos del modelo, Excel ofrece el Cuadro de Valores

Ajustados (Pronóstico Cantidad), los Residuos del modelo y los Residuos Estándares (es decir,

tipificados). Según la teoría que hemos estudiado hasta ahora, los residuos estándares deben seguir

una distribución Normal de media 0 y desviación estándar 1; por tanto, aquellos residuos cuyo

valor absoluto supere 1.96 se corresponderán con valores atípicos, también denominados outliers

en la literatura estadística. En nuestro ejemplo, afortunadamente, no se observa ningún outlier

como puede apreciarse en la siguiente tabla de Análisis de Residuos:

Análisis de los residuos

Observación Pronóstico Cantidad Residuos Residuos estándares

1 2439,03 16,97 0,79 2 2305,46 19,54 0,91 3 2278,75 -28,75 -1,33 4 2211,96 -11,96 -0,56 5 2118,47 -18,47 -0,86 6 2091,75 -9,75 -0,45 7 2038,33 6,67 0,31 8 1998,26 25,74 1,20

El gráfico de los residuos (figura 2.8) también constituye una herramienta de análisis importante,

ya que nos permite evaluar la aleatoriedad de los mismos. En el ejemplo, se observa una ligera

falta de aleatoriedad, derivada de que los cuatro últimos residuos presentan una marcada racha

creciente.

Fig. 2.8. Gráfico de residuos del modelo de demanda de manzanas frente al precio

Si se prefiere estimar una ecuación por MCO utilizando funciones en Excel, hay que tener

presente que la notación utilizada por este paquete para la regresión lineal es la siguiente:

y = mx + b

O, si existen varios rangos de valores de X:

y = m1x1 + m2x2 + ... + b

donde mi son los coeficientes que corresponden a cada variable y b es una constante.

La función que permite realizar estimaciones por MCO tiene la siguiente sintaxis:

=ESTIMACION.LINEAL(conocido_y,conocido_x,constante,estadística)

-40

-30

-20

-10

0

10

20

30

40

80 85 90 95 100 105 110 115 120

Res

iduo

s

Precio

Gráfico de los residuales

La función admite los siguientes argumentos:

Conocido_y Valores de la variable independiente.

Conocido_x Valores de la variable dependiente.

Constante Si se va a estimar un modelo con constante b se omite o se pone VERDADERO;

si se desea estimar un modelo sin constante (b=0) se debe escribir 0 ó FALSO.

Estadística Si se omite o se pone FALSO, EXCEL no muestra las estadísticas de regresión;

si se pone VERDADERO, Excel muestra las estadísticas de la regresión.

Una vez se completa el asistente de funciones, obtendremos los resultados de la regresión en

forma de matriz de valores; para mostrar todos los valores de la regresión, debe seleccionarse el

rango de salida y presionar simultáneamente Ctrl + Shift + Enter.

El siguiente esquema muestra el orden en que se devuelven los parámetros y las estadísticas de regresión adicionales:

El significado de cada celda se presenta en el siguiente cuadro:

Estadística Descripción

se(m1),se(m2),...,se(mn) Desviación típica para los coeficientes m1,m2,...,mn.

se(b) Desviación típica para la constante b (se(b) = #N/A cuando constante es FALSO).

R2 Coeficiente de determinación.

se(y) Desviación típica de la estimación de y

F Estadístico F de la regresión

dF Grados de libertad del estadístico F

ss(reg) La suma de regresión de los cuadrados.

ss(res) La suma residual de los cuadrados.

Asimismo, conviene recordar que Excel también incluye otras funciones relacionadas con la

estimación por MCO:

=TENDENCIA(conocido_y;conocido_x;nueva_matriz_x;constante)

=PRONOSTICO(x;conocido_y;conocido_x)

=ESTIMACION.LOGARITMICA(conocido_y;conocido_x;const ante; estadística)

=COEFICIENTE.R2(conocido_y;conocido_x)

2.10. ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL C ON

R

R es un entorno especialmente diseñado para el tratamiento de datos, cálculo y desarrollo gráfico.

Permite trabajar con facilidad con vectores y matrices y ofrece diversas herramientas para el

análisis de datos.

R es una implementación open-sourcedel lenguaje S (Bell Labs -principios de los 90), que

también es la base del sistema S-Plus (entorno comercial). R y S-Plus aún comparten una gran

mayoría de código e instrucciones, si bien R es software libre, gratuito en donde los usuarios

disponen de libertad para ejecutar, copiar, distribuir, estudiar, cambiar y mejorar el software. De

hecho R dispone de una comunidad de desarrolladores/usuarios detrás que se dedican

constantemente a la mejora y a la ampliación de las funcionalidades y capacidades del programa.

En la web http://www.r-project.org/ se encuentra disponible toda la información acerca de R. La

instalación de R se realiza a través de la CRAN (ComprehensiveR Archive Network):

http://cran.r-project.org

Actualmente R se distribuye para los siguientes Sistemas Operativos:

•Windows: entorno gráfico.

•Linux (Debian/Mandrake/SuSe/RedHat/VineLinux)

•MacOSX

•Código fuente: ampliación a sistemas Unix

Las funciones de R se agrupan en paquetes (packages, libraries), los que contienen las funciones

más habituales se incluyen por defecto en la distribución de R, y el resto se encuentran disponibles

en la Comprehensive R Archive Network (CRAN) .

Las entidades que R crea y manipula se llaman objetos. Dichos objetos pueden ser

:•Escalares: números, caracteres, lógicos (booleanos), factores

•Vectores/matrices/listas de escalares

•Funciones

•Objetos ad-hoc

Dichos objetos se guardan en un workspace. Durante una sesión de R todos los objetos estarán en

memoria, y se pueden guardar en disco para próximas sesiones.

R trabaja sobre estructuras de datos. La estructura más simple es un vector numérico, que consiste

en un conjunto ordenado de números.

Un vector de reales se crea mediante la función c y se guarda con el nombre “Cantidad”.

> Cantidad <- c(2.456,2.325,2.250,2.200,2.100,2.082,2.045,2.024)

Se crea ahora el vector de nombre “Precio”.

> Precio <- c(82,92,94,99,106,108,112,115)

Para obtener los estadísticos básicos del vector (Cantidad): media, desviación estandar, varianza

y mediana, se utilizan las siguientes funciones R:

> mean(Cantidad)

> sd(Cantidad)

> var(Cantidad)

> median(Cantidad)

Si se quiere tener un resumen sumario de estadístico de una variable:

> summary(Cantidad)

En R los valores "desconocidos" o "no disponibles" (missings) se simbolizan con el valor especial

NA (NotAvailable). Cualquier operación que incluya un NA en general devolverá NA como

resultado.La función is.na nos permite saber si un elemento es missingo no.

Otros tipos de objectosen R.

•Arrays y matrices (matrix): generación multidimensional de los vectores. Todos los elementos

de la matriz han de ser del mismo tipo.

•Factores (factor): útiles para el uso de datos categóricos.

•Listas (list): generalización de los vectores donde los elementos pueden ser de diferentes tipos

(incluso vectores o nuevas listas).

•Data frames: matrices donde las diferentes columnas pueden tener valores de diferentes tipos.

•Funciones (function): conjunto de código de R ejecutable y parametrizable.

Una tabla debe estar en un objecto tipo matriz. Ejemplo:

Tabla<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T)

La función read.table permite leer datos desde ficheros en formato ASCII. Devuelve como

resultado un data.frame, por tanto, se supone que cada línea contiene los datos para un individuo.

El fichero EXCEL personas.xls tiene el siguiente aspecto:

Guardamos el fichero EXCEL como un fichero ASCII delimitado por tabulaciones

> manzanas <- read.table(file="manzanas.txt",header=T)

Tecleamos

> manzanas

La función de R que nos permite estimar un modelo de regresión lineal es la función lm. La forma

de invocar a la función para estimar un modelo de regresión lineal simple es lm(y~x).

Para consultar la ayuda de la función para ver todas las posibilidades que ofrece:

En nuestro ejemplo, obtenemos:

> lm(Cantidad~Precio)

Call: lm(formula = Cantidad ~ Precio) Coefficients: (Intercept) Precio 3.53427 -0.01336

En lugar de invocar simplemente la función podemos guardar su resultado en una variable y

veremos así que obtenemos más información.

> reg = lm(Cantidad~Precio)

Si queremos obtener el vector de residuos bastará solicitar:

> reg$residuals

Para realizar el análisis del modelo estimado utilizaremos la función summary. Así:

> summary(reg)

2.11. PROBLEMAS

2.1. Partiendo de las siguientes observaciones de dos variables:

Y 60 62 61 55 53 60 63 53 52 48 49 53 X 23 23 25 25 26 26 29 30 30 32 33 31

α) Estime por MCO la función de regresión Y=β0+β1X

β) ¿Satisfacen los términos de error la condición E(u)=0?

χ) Contrastar la hipótesis de β1=0 con un nivel de confianza del 95%.

2.2. Los datos de una muestra aleatoria de 22 familias dan la siguiente estimación de la función

de consumo:

tt YC 90,0120ˆ +=

(0,05)

donde Ct es el consumo e Yt es la renta en Euros, siendo 05,01ˆ =βS

a) Contrastar la hipótesis de que la propensión marginal a consumir es igual a 0.83. Utilizar

un nivel de confianza del 95%.

b) Calcular un intervalo de confianza al 90% para el coeficiente de regresión β1.

2.3. Utilizando los siguientes datos:

W 2 4 6 5 4 1 7

Z 8 28 60 52 32 7 75

α) Estimar los parámetros a y b de la siguiente relación bZ aW=

β) Realizar una predicción si W=3

χ) Establecer un intervalo de confianza para dicha predicción con un nivel de

significación del 5%.


Y 62 52 68 72 78 58 58 74

X1 51 44 52 57 62 48 53 61

X2 7 6 8 8 12 7 9 11

α) Obtener una estimación MCO para 21 XXY γβα ++=

β) Calcular los coeficientes R2 y R2 ajustado.

χ) Con un nivel de confianza del 95% contrastar que el coeficiente β es significativamente

distinto de cero.

δ) Con un nivel de confianza del 90% contrastar que el coeficiente β es significativamente

distinto de γ.

2.5 Suponga el siguiente modelo de regresión:

1 1 2 2t t tY X Xβ β= +

Siendo 5T = , 2ˆ 0.25σ = ,( ) 5 0'

0 1X X

=

y ( ) 5'

2X Y

=

. Se pide:

a) Obtener una estimación MCO para 1 1 2 2t t tY X Xβ β= +

b) Un intervalo de prediccioón para el nivel de confianza del 95%, para 1tY+

),

sabiendo que 1 1tX = y 2 10tX = .

SOLUCIONES

2.1 a) XY 1.129.86 +=

b) Si 27.0=u y 01.1=uσ

c) 0:0 =βH ; grados de libertad 12-2; 228.2=tcot ; 71.9exp =t ; se rechaza.

2.2 a) Se acepta la hipótesis nula

b) 1(0.612,1.286)ICβ =

2.3 a) 339.1086.5 WZ =

b) 14.22=Z

c) ( ) (7.556,64.901)jE ZIC =

2.4 a) 21 57.186.175.20 XXY −+−=

b) 893.02 =R , 850.02 =R

c) Se rechaza la hipótesis nula.

d) Se rechaza la hipótesis nula.

2.5 a) 1 22tt tY X X= +

b) 1( ) (4.99,37.01)tE YIC+

=

3. EXTENSIONES AL MODELO DE REGRESIÓN

LINEAL

3.1. INTRODUCCIÓN

Como veíamos en el capitulo anterior, el modelo de regresión lineal requiere que se cumplan las

siguientes hipótesis sobre los términos de error:

Media cero : E(ei) = 0 i=1,…,n

Varianza constante : Var(ei) = σ2I i=1,…,n

Residuos incorrelacionados : Cov(ei,ej) = 0

El incumplimiento de alguna de dichas hipótesis, implica la no aleatoriedad de los residuos y, por

tanto, la existencia de alguna estructura o relación de dependencia en los residuos que puede ser

estimada, debiendo ser considerada en la especificación inicial del modelo. Los principales

problemas asociados al incumplimiento de las hipótesis de normalidad de los residuos son, por

un lado, la heteroscedasticidad, cuando la varianza de los mismos no es constante, y la

autocorrelación o existencia de relación de dependencia o correlación entre los diferentes

residuos, lo que violaría el supuesto de términos de error incorrelacionados.

Si se construye una gráfica de los resultados de una estimación mínimo cuadrática (en ordenadas)

frente al valor absoluto de los residuos (en abscisas), cuando éstos últimos presentan una

distribución aleatoria, es decir una distribución Normal de media cero y varianza constante, N (0,

σ2), el resultado obtenido (véase Fig. 3.1.) muestra que el tamaño del error es independiente del

tamaño de la variable estimada, ya que errores con valor elevado se corresponden con valores

bajos y altos de la variable dependiente estimada; sin embargo, una distribución de residuos con

problemas de heteroscedasticidad da lugar a una figura como la que puede observarse en la figura

3.2., en donde se manifiesta una clara relación de dependencia entre la variable estimada y el

tamaño del error. En este caso los errores de mayor tamaño se corresponden con los valores más

altos de la variable estimada.

Fig. 3.1. Residuos Homocedásticos

Fig. 3.2. Residuos Heteroscedásticos

La representación gráfica de los errores en forma de serie temporal, es decir, poniendo en el eje

de ordenadas los errores y en abscisas el periodo temporal en que están datados, permite apreciar

la ausencia o presencia de correlación ya que a los residuos no correlacionados (figura 3.3.) les

corresponde una representación gráfica en la que no se aprecia pauta temporal alguna,

sucediéndose de forma impredecible o aleatoria, mientras que en los residuos con problemas de

autocorrelación la pauta temporal es evidente, evidenciándose que cada residuo podría ser

previsto en función de la sucesión de los errores correspondientes a periodos temporales pasados

(figura 3.4.)

Fig. 3.3. Residuos sin Autocorrelación

Fig. 3.4. Residuos con Autocorrelación

Estos problemas asociados a los errores pueden detectarse con tests estadísticos diseñados para

ello. A continuación se describen dichos tests y la forma en que debe procederse para estimar

modelos en donde la estimación mínimo-cuadrática presenta problemas de este tipo asociados a

los residuos.

3.2. HETEROSCEDASTICIDAD

Decimos que el término de error de una estimación mínimo-cuadrática presenta

heteroscedasticidad cuando la varianza del mismo es diferente para las distintas observaciones

que integran la muestra, lo que implica que la variabilidad de los errores mínimo-cuadráticos

obtenidos están relacionados de alguna manera con los datos utilizados en el modelo, ya sea por

estar relacionados con la escala temporal de los datos recogidos o por presentar alguna relación

de dependencia con alguna de las variables exógenas utilizadas. Las consecuencias para la

estimación mínimo-cuadrática son que los estimadores de los coeficientes seguirán siendo

insesgados y lineales pero ya no serán de mínima varianza o eficientes. Estos problemas se

resuelven utilizando una técnica de estimación lineal que recibe el nombre de Mínimos

Cuadrados Generalizados (MCG), método que se estudia más adelante.

La detección de la heteroscedasticidad se realiza a través de diversos contrastes paramétricos,

entre los que cabe destacar el contraste de Bartlett (Mood, 1950), el constraste de Goldfeld-

Quandt (1965) y el contraste de White (1980), los cuales describimos a continuación.

3.2.1. Test de Bartlett El test de Bartlett se basa en de que la suposición de que las n observaciones de los datos de la

variable a estimar por el modelo pueden agruparse en G grupos (g=1, 2, ..., G), cada uno de los

cuales se caracteriza por tener un distinto tipo de observaciones asociadas a la variable explicativa,

de tal manera que n1 sería el número de observaciones correspondientes al primer grupo, n2 el

número de observaciones asociadas al segundo grupo y, en general, nG es el número de

observaciones asociadas al grupo g-ésimo. A cada grupo le corresponde un valor medio de la

variable dependiente y una varianza para este valor medio.

El test contrasta si dicha varianza es igual o no entre los distintos grupos que se han construido

para la variable dependiente, admitiéndose la hipótesis de existencia de heteroscedasticidad si la

varianza es significativamente diferente entre los grupos formados.

Los pasos a seguir en la práctica para realizar el test de Bartlett son los siguientes:

1. Se estima la varianza (2gs ) de cada grupo de observaciones, g=1, 2, ..., G mediante la

siguiente expresión:

g

n

ggi

g n

yy

s

g

∑=

−= 1

2

2

)(

2. Se calcula el estadístico S:

−

−+

−

=

∑

∑∑

=

==

G

g g

G

gggg

G

g

g

nnG

snsn

nn

S

1

1

22

1

11)1(3

11

loglog

Bajo el supuesto de homocedasticidad, S se distribuye como una chi-cuadrado (χ2) con G–1 grados

de libertad. Por lo tanto, se rechazará la hipótesis de igual varianza en todos los grupos si S es

mayor que el valor crítico de la distribución chi-cuadrado al nivel de significación estadística

fijado.

3.2.2. Contraste de Goldfeld-Quant El contraste de Goldfeld-Quant se utiliza para contrastar la homocedasticidad cuando la forma de

la heteroscedasticidad no es conocida, aunque se intuye que la varianza guarda una relación

monótona –creciente o decreciente– respecto a alguna variable exógena (que denominaremos

variable z). La operativa de este test es la siguiente:

1. Ordenar todas las observaciones de las variables del modelo, de menor a mayor, en

función de la variable z.

2. Eliminar c observaciones centrales de la ordenación anterior, de tal forma que queden dos

submuestras de (n-c)/2 observaciones cada una. Al seleccionar c, debe hacerse de tal

forma que (n-c)/2 sea sustancialmente mayor que el número de parámetros del modelo.

3. Estimar dos veces el modelo original mediante Mínimos Cuadrados Ordinarios,

utilizando en cada estimación cada una de las submuestras.

4. Denominando SR1 y SR2 a las sumas de los cuadrados de los residuos de ambas

submuestras (de manera que el subíndice 1 corresponda a la submuestra con la menor

suma) se define el estadístico F:

2

1

SCR

SCRF =

La idea que subyace bajo este contraste es la siguiente: si existe heteroscedasticidad

entonces, con la ordenación de la muestra, la varianza del término de error será mayor

hacia el final de la muestra que al principio de la misma. Como el cuadrado de los residuos

está asociado con la varianza de los mismos, entonces SR2 debería ser sensiblemente

mayor que SR1. Por ello, se rechazara la hipótesis nula de homocedasticidad siempre que

el valor del estadístico F excede el valor en tablas de la distribución F(n-c-2k)/2, (n-c-2k)/2,

aceptándose la existencia de heteroscedasticidad en caso contrario.

Ejemplo 3.1. Utilizando datos provinciales hemos estimado el modelo explicativo del empleo en el sector de

hoteles descrito en el capitulo 2; los resultados obtenidos fueron los siguientes:

Estadísticas de la regresión Coeficiente de correlación múltiple 0.96940463 Coeficiente de determinación R2 0.93974534 R2 ajustado 0.93728597 Error típico 1.19099172 Observaciones 52

Coeficientes Error típico Estadístico t Término constante -2.94444031 0.33100533 -8.89544675 Número de viajeros (miles) 0.00216699 0.00013832 15.6668389 Estancia media 1.31881995 0.13180001 10.0062201

El investigador sospecha que los errores obtenidos tengan alguna relación con la variable exógena

que recoge el número de viajeros de cada provincia. Por ello, decide realizar un contraste de

Goldfeld-Quant, ordena los datos de la tabla en función del número de viajeros; después elimina

las 10 observaciones centrales, y deja dos submuestras con 21 provincias cada una.

A continuación estima el modelo para cada una de ellas; obteniendo los siguientes resultados:

a) Primera submuestra

Coeficientes Término constante -0.80368434 Número de viajeros (miles) 0.00231232 Estancia media 0.37488653

b) Segunda submuestra

Coeficientes Término constante -4.55233015 Número de viajeros (miles) 0.00234497 Estancia media 1.54803859

La Suma de Residuos al Cuadrado obtenido en la primera muestra es de 0,176 y en la segunda

muestra es de 45.217. Construimos por tanto el estadístico F:

004.0217.45

176,0

2

1 ===SCR

SCRF

A continuación obtenemos de las tablas de la distribución F el valor teórico para una distribución

con 18 grados de libertad en el numerado y denominador, el valor obtenido es 2.2. Como valor

del estadístico está por debajo del valor teórico no se rechaza la hipótesis de homocedasticidad al

nivel de significación del 5% (probabilidad del 95%).

3.2.3. Contraste de White El contraste de White se desarrolló también para evitar la necesidad de considerar una forma

específica para la heteroscedasticidad. El contraste se basa en que, bajo la hipótesis nula de

homocedasticidad, la matriz de varianzas y covarianzas de los estimadores MCO de β es:

( ) 12 ' −= XXσ

Por el contrario, si existe heteroscedasticidad, la matriz de varianzas y covarianzas viene dada

por:

),...,,(,)'(')'( 222

21

11ndiagXXXXXX σσσ=ΩΩ −−

Por tanto, si tomamos la diferencia entre ambas queda:

1211 )'()'(')'( −−− −Ω XXXXXXXX σ

Por ello, basta con contrastar la hipótesis nula de que todas estas diferencias son iguales a cero,

lo que equivale a contrastar que no hay heteroscedasticidad.

Los pasos a seguir para realizar el contraste de White son los siguientes:

1. Estimar el modelo original y obtener la serie de residuos estimados

2. Realizar una regresión del cuadrado de la serie de residuos obtenidos en el paso anterior

sobre una constante, las variables exógenas del modelo original, sus cuadrados y los

productos cruzados de segundo orden (los productos resultantes de multiplicar cada

variable exógena por cada una de las restantes). Es decir, se trata de estimar por MCO la

relación:

tkkkkkkkkkkkt XXXXXXXXXXXXXXe ερννϖϖηηϕϕα +++++++++++++++= −12322121122

11112 ...............ˆ

3. Al aumentar el tamaño muestral, el producto nR2 (donde n es el número de observaciones

y R2 es el coeficiente de determinación de la última regresión) sigue una distribución Chi-

cuadrado con p – 1 grados de libertad, donde p es el número de variables exógenas

utilizadas en la segunda regresión. Se aceptará la hipótesis de existencia de

heteroscedasticidad cuando el valor del estadístico supere el valor crítico de la

distribución Chi-cuadrado (c) al nivel de significación estadística fijado ( cnR >2 ).

Ejemplo 3.2. Para realizar en R el constraste de heterocedasticidad de White en el modelo estimado en el

ejemplo 2.2, primero hay que instalar en Packaged “tseries”:

> install.packages("tseries")

y después ejecutar el siguiente programa R:

> library(tseries) > datos <- read.table(file="libro1.txt",header=T,dec=",") > datos Años Empleo Viajeros Estancia_m 1 Andalucía 28.4 11.902,50 3.1 2 Aragón 3.6 1.848,00 2.1 3 Asturias 2.4 1.088,20 2.3 4 Balears 25.9 6.716,00 7.2 5 Canarias 27.2 4.875,70 7.8 6 Cantabria 2.0 933,8 2.4 7 Castilla_León 6.2 3.647,60 1.7 8 Castilla_Mancha 2.8 1.805,10 1.7 9 Cataluña 23.5 10.771,70 3.4 10 C_Valenciana 13.4 5.579,70 3.9 11 Extremadura 2.2 1.000,70 1.7 12 Galicia 6.3 3.040,50 2.1 13 Madrid 10.7 5.748,90 2.1 14 Murcia 2.0 882,5 3.0 15 Navarra 1.1 557,7 2.0 16 País_Vasco 3.2 1.540,60 1.9 17 Rioja 0.7 446,2 1.8 > x <- matrix(c(datos$Viajeros,datos$Estancia_m),ncol=2) > y <- matrix(datos$Empleo,ncol=1) > white.test(x,y) White Neural Network Test data: x and y X-squared = 11.2629, df = 2, p-value = 0.003583

En este ejemplo el valor del estadístico 2629,112 =nR , dado que el valor de la distribución

Chi-cuadrado teórica para el nivel de significación 05,0=α da un valor crítico 99,5=c

habría que aceptar la hipótesis de existencia de heterocedasticidad. El p-value es la probabilidad

asociada al estadístico calculado, al ser de 0,003583 y por tanto menor que 0,05, situaría al

estadístico en la zona de rechazo de la hipótesis 0H , la que de los valores del estadistico

superiores al valor crítico.

3.3 AUTOCORRELACIÓN

Decimos que existe autocorrelación cuando el término de error de un modelo econométrico está

correlacionado consigo mismo a través del tiempo tal que 0),( ≠ji eeE . Ello no significa que la

correlación entre los errores se dé en todos los periodos sino que puede darse tan sólo entre

algunos de ellos. En presencia de autocorrelación, los estimadores MCO siguen siendo insesgados

pero no poseen mínima varianza, debiéndose utilizar en su lugar el método de estimación de los

Mínimos Cuadrados Generalizados (MCG).

La existencia de autocorrelación en los residuos es fácilmente identificable obteniendo las

funciones2 de autocorrelación (acf) y autocorrelación parcial (acp) de los errores mínimo-

cuadráticos obtenidos en la estimación. Si dichas funciones corresponden a un ruido blanco, se

constatará la ausencia de correlación entre los residuos. Sin embargo, el mero examen visual de

las funciones anteriores puede resultar confuso y poco objetivo, por lo que en la práctica

econométrica se utilizan diversos contrastes para la autocorrelación, siendo el más utilizado el de

Durbin-Watson (1950), que pasamos a ver seguidamente.

3.3.1. Contraste de Durbin-Watson Si se sospecha que el término de error del modelo econométrico tiene una estructura como la

siguiente:

ttt uee += −1ˆ·ˆ ρ

entonces el contraste de Durbin-Watson permite contrastar la hipótesis nula de ausencia de

autocorrelación. Dicho contraste se basa en el cálculo del estadístico d, utilizando para ello los

errores mínimo-cuadráticos resultantes de la estimación:

∑

∑

=

=−−

=n

tt

n

ttt

e

eed

1

2

2

21

ˆ

)ˆˆ(

El valor del estadístico d oscila entre 0 y 4, siendo los valores cercanos a 2 los índicativos de

ausencia de autocorrelación de primer orden. La interpretación exacta del test resulta compleja,

ya que los valores críticos apropiados para contrastar la hipótesis nula de no autocorrelación

requieren del conocimiento de la distribución de probabilidad bajo el supuesto de cumplimiento

de dicha hipótesis nula, y dicha distribución depende a su vez de los valores de las variables

explicativas, por lo que habría que calcularla en cada aplicación. Para facilitar la interpretación

del test Durbin y Watson derivaron dos distribuciones: dU y dD, que no dependen de las variables

2 Estas funciones se analizarán en detalle en el capítulo 3 de la II parte

explicativas y entre las cuales se encuentra la verdadera distribución de d, de forma que a partir

de un determinado nivel de significación, se adopta la siguiente regla de decisión:

1. Si d ≤ dD rechazamos la hipótesis nula de no autocorrelación frente a la hipótesis

alternativa de autocorrelación positiva.

2. Si d ≥ 4 – dD rechazamos la hipótesis nula de no autocorrelación frente a la hipótesis

alternativa de autocorrelación negativa.

3. Si dU ≤ d ≤ 4- dU aceptamos la hipótesis nula de no autocorrelación.

En el Anexo II, tabla II.5., presentamos la tabla con la distribución desarrollada por Durbin y

Watson para los valores de dU y dD.

El estadístico d de Durbin-Watson es aproximadamente igual a ( )1ˆ12 ρ− en donde 1ρ es el

coeficiente de autocorrelación simple muestral del retardo 1.

( )1

1

2

11

1

2

2

21

ˆ12ˆ

ˆˆ

22ˆ

)ˆˆ(ρ−=−=

−=

∑

∑

∑

∑

=

=−

=

=−

n

tt

n

ttt

n

tt

n

tti

e

ee

e

eed

Ejemplo 3.3.

En el siguiente ejercicio planteamos una regresión lineal entre el consumo de energía eléctrica

en España y el PIB a precios de mercado valorado en moneda constante (millones de euros).

Consumo de Energía Eléctrica (miles de TEP)

PIB (millones de euros)

1987 9427 355312 1988 9876 373412 1989 10410 391443 1990 10974 406252 1991 11372 416582 1992 11488 420462 1993 11569 416126 1994 11999 426041 1995 12462 437787 1996 12827 448457 1997 13331 466513 1998 14290 486785 1999 15364 507346 2000 16309 528714 2001 17282 543746 2002 17756 554852

Fuente: INE y OCDE

Con los datos de la tabla anterior la estimación MCO entre el consumo de energía eléctrica y el

PIB sería la siguiente:

Yt=-6234.4+0.043Xt+εt

Siendo Yt el consumo de energía eléctrica y Xt el PIB en moneda constante.

Los resultados de la estimación se presentan a continuación:


Coeficientes Error típico Estadístico t Probabilidad Término constante

-6234.453 451.562 -13.806 0.000

PIB-$ 0.043 0.001 42.780 0.000

Como vemos las estadísticas de la regresión realizada son buenas, se obtiene un R2 muy elevado,

y los parámetros son estadísticamente significativos, ya que el valor teórico de la t-Student es 2.51

al 95% de probabilidad.

No obstante, la representación gráfica de los errores apunta a la posibilidad de un problema de

autocorrelación entre los residuos:

Grafico de los residuos

-400,0-300,0

-200,0

-100,0

0,0

100,0

200,0

300,0

400,0

500,0

600,0

1986 1988 1990 1992 1994 1996 1998 2000 2002 2004

Para verificarlo calculamos el estadístico t de Durbin-Watson:

Y* et et2 et-et-1 (et-et-1)2

1987 8933 494.2 244192.5 1988 9705 170.5 29076.7 -323.6 104742.4 1989 10475 -65.2 4247.8 -235.7 55551.6 1990 11107 -133.3 17777.0 -68.2 4645.2 1991 11548 -176.3 31078.1 -43.0 1845.5 1992 11714 -225.9 51038.2 -49.6 2462.8 1993 11529 40.2 1614.1 266.1 70804.9 1994 11952 46.9 2202.6 6.8 45.6 1995 12453 8.5 72.7 -38.4 1474.9 1996 12909 -81.9 6715.2 -90.5 8185.4 1997 13680 -348.7 121596.8 -266.8 71161.5 1998 14545 -255.1 65057.3 93.6 8769.2 1999 15423 -58.8 3452.3 196.3 38536.6 2000 16335 -25.9 670.7 32.9 1079.7 2001 16977 305.4 93286.1 331.3 109776.4 2002 17451 305.3 93234.4 -0.1 0.0 Total 0.0 765312.5 -188.8 479081.7

21

2

2

1

ˆ ˆ( )479,081.7

0.62599765,312.5ˆ

n

i ii

n

ii

e ed

e

−=

=

−= = =∑

∑

Los valores teóricos del estadístico para n=16 observaciones y k=1 variables explicativas, son

dD=0.98 y dU=1.24. Dado 0.62599 < 0.98 no podemos rechazar la hipótesis de la existencia de

autocorrelación positiva.

En R, el test de Durbin-Watson se encuentra en el Package (lmtest), y su sintaxis es: > dwtest(formula) Relaizar el ejercicio anterior requiere del siguiente programa R: > install.package(“bgtest”) > library(bgtest) > datos <- read.table(file="libro1.txt",header=T)

> datos Años CEnEl PIB 1 1987 9427 355312 2 1988 9876 373412 3 1989 10410 391443 4 1990 10974 406252 5 1991 11372 416582 6 1992 11488 420462 7 1993 11569 416126 8 1994 11999 426041 9 1995 12462 437787 10 1996 12827 448457 11 1997 13331 466513 12 1998 14290 486785 13 1999 15364 507346 14 2000 16309 528714 15 2001 17282 543746 16 2002 17756 554852 > dwtest(datos$PIB ~ datos$CEnEl) Durbin-Watson test data: datos$PIB ~ datos$CEnEl DW = 0.628, p-value = 0.0001192 alternative hypothesis: true autocorrelation is greater than 0

3.3.1. Contraste de Breush-Godfrey El test de correlación serial de Breusch–Godfrey es un test de autocorrelación en los errores y

residuos estadísticos en un modelo de regresión. Hace uso de los errores generados en el modelo

de regresión y un test de hipótesis derivado de éste. La hipótesis nula es que no exista correlación

serial de cualquier orden de ρ .

El test es más general que el de Durbin–Watson, que solo es válido para regresores no-estocásticos

y para testear la posibilidad de un modelo autoregresivo de primer orden para los errrores de

regresión. El test Breusch–Godfrey no tiene estas restricciones, y es estadísticamente más

poderoso que el estadístico d .

Los pasos para realizar el contraste son los siguientes:

1. Estimar el modelo original y obtener la serie de residuos estimados

2. Estimar la ecuación de regresión auxiliar:

tptptkkt eeXXe εδδϕϕα +++++++= −− ˆ...ˆ...ˆ 1111

3. Al aumentar el tamaño muestral, el producto ( ) 2Rpn − (donde n es el número de

observaciones,p , el número de retardos del error utilizados en la regresión auxiliar

y R2 es el coeficiente de determinación de dicha regresión) sigue una distribución

Chi-cuadrado con p grados de libertad, donde p es el número de variables

exógenas utilizadas en la segunda regresión. Se aceptará la hipótesis de existencia

de autocorrelación cuando el valor del estadístico supere el valor crítico de la

distribución Chi-cuadrado (c) al nivel de significación estadística fijado(

( ) cRpn >− 2).

Ejemplo 3.4.

El test de Breusch–Godfrey tambien se realiza con la librería R (lmtest), y se programa para

3=p del siguiente modo:

> install.package(“bgtest”) > library(gbtest) > bgtest(datos$PIB ~ datos$CEnEl,order=3) Breusch-Godfrey test for serial correlation of order up to 3 data: datos$PIB ~ datos$CEnEl LM test = 5.3733, df = 3, p-value = 0.1464

En este ejemplo el valor del estadístico ( ) 37,52 =− Rpn , dado que el valor de la

distribución Chi-cuadrado teórica para el nivel de significación 05,0=α da un valor crítico

81,7=c habría que rechazar la hipótesis de existencia de autocorrelación. El p-value es la

probabilidad asociada al estadístico calculado, al ser de 0,1454 y por tanto mayor que 0,05,

situaría al estadístico en la zona de aceptación de la 0H , la que constituyen los valores del

estadistico inferiores al valor crítico.

3.3. DEFICIENCIAS MUESTRALES: MULTICOLINEALIDAD

El fenómeno de la multicolinealidad aparece cuando las variables exógenas de un modelo

econométrico están correlacionadas entre sí, lo que tiene consecuencias negativas para la

estimación por MCO, ya que la existencia de una relación lineal entre las variables exógena,

implica que la matriz )'( XX va a tener determinante cero, es decir será una matriz singular y por

tanto no será invertible. Dado que YXXX ')'(ˆ 1−=β , no será posible calcular la estimación

mínimo cuadrática de los parámetros del modelo ni, lógicamente, la varianza de los mismos. Esto

es lo que se conoce por el nombre de multicolinealidad exacta.

Consideremos por ejemplo la relación lineal:

iiii uXXY +++= 22110 βββ

Supongamos que las variables independientes presentan relación lineal exacta:

ii cXX 12 =

La matriz (X’X) quedaría:

( )

=

∑∑∑∑∑∑∑∑

22212

21211

21

'

XXXX

XXXX

XXn

XX

sustituyendo iX2 por icX1 tenemos:

( )

=

∑∑∑∑∑∑∑∑

21

2211

21

211

11

'

XcXcXc

XcXX

XcXn

XX

Como el valor de un determinante no se altera si se resta de una fila o columna un múltiplo

constante de cualquier otra fila o columna. Si multiplicamos la segunda fila de (X’X) por c y

restamos el resultado de la tercera fila tenemos:

= ∑∑∑∑∑

000

21

211

11

XcXX

XcXn

A

puesto que 0' == AXX , la matriz (X’X) es singular y por tanto no invertible.

Sin embargo, en la práctica no nos encontraremos con un caso tan extremo como el que acabamos

de exponer, sino que generalmente nos encontraremos ante lo que se conoce como

multicolinealidad aproximada, siendo una de las columnas de la matriz )'( XX ,

aproximadamente, una combinación lineal del resto por lo que será una matriz aproximadamente

singular. Al no ser el determinante de )'( XX igual a cero, existirá inversa y podrán estimarse los

parámetros pero con las siguientes consecuencias:

1. Por un lado, pequeñas variaciones muestrales producidas al incorporar o sustraer un

número reducido de observaciones muestrales podrían generar importantes cambios

en los parámetros estimados.

2. Por otro lado, la matriz de covarianzas del estimador MCO, ( ) 12ˆˆ ' −= XXSS eββ , al ser

un múltiplo de 1)'( −XX , será muy grande por ser el determinante de )'( XX muy

pequeño por lo que la estimación realizada será muy poco precisa al ser la desviación

típica de cada parámetro muy elevada.

Las soluciones propuestas para resolver el problema de la multicolinealidad son variadas, si bien

en general resultan poco satisfactorias:

1. Una posibilidad, sugerida por Johnston (1984), consiste en excluir aquella variable

exógena que puede estar muy correlacionada con el resto y posteriormente estimar el

coeficiente asociado a dicha variable mediante otro procedimiento para incluirlo en el

modelo.

2. Otra posibilidad es la que se conoce como regresión cresta, introduciendo una constante

c en la matriz )'( XX de tal forma que el estimador de MCO quedaría como

YXcIXX k ')'(ˆ 1−+=β , evitando así la singularidad de la matriz. Evidentemente, los

coeficientes estimados estarán sesgados pero la matriz de covarianzas de los mismos será,

seguramente, menor que la que obtendríamos sin introducir la constante por lo que

probablemente la menor varianza compense en parte el sesgo introducido. Otra cuestión

no menos trivial es la selección del valor de c, para lo que no existe un método definido;

una posibilidad, sugerida por Hoerl y Kennard (1970) es comenzar con un valor muy

pequeño de c e ir aumentándolo hasta que observemos que las estimaciones comienzan a

estabilizarse.

3. También se ha sugerido la posibilidad de reformular el modelo, convirtiéndolo en un

modelo de varias ecuaciones (estimación por tramos).

4. Finalmente, cuando la multicolinealidad se debe a la presencia como variables

explicativas de varios retardos de una misma variable, puede especificarse una relación

entre sus coeficientes para eliminar alguno de los retardos del modelo.

3.4. ERRORES DE ESPECIFICACIÓN

Los errores de especificación hacen referencia a un conjunto de errores asociados a la

especificación de un modelo econométrico. En concreto cabe referirse a:

− Omisión de variables relevantes

− Inclusión de variables innecesarias

− Adopción de formas funcionales equivocadas

En Economía la teoría no suele concretar la forma funcional de las relaciones que estudia. Así,

por ejemplo, cuando se analiza la demanda se señala que la cantidad demandada es inversamente

proporcional al precio; cuando se estudia el consumo agregado se apunta que la propensión

marginal a consumir (relación entre renta y/o consumo) es mayor que cero y menor que uno. Por

otro lado es frecuente utilizar la condición “ceteris paribus” para aislar la información de otras

variables relevantes que influyen y/o modifican la relación estudiada. Por esta razón, la existencia

de errores de especificación en la relación estimada es un factor a considerar y a resolver en el

proceso de la estimación econométrica.

Con independencia de la naturaleza de los errores de especificación, dado que el proceso de

estimación MCO deben de cumplirse determinadas hipótesis básicas, que los estimadores MCO

deben de ser insesgados, eficientes y consistentes, y que el estimador de la varianza del término

de error ha de ser insesgado, debemos preguntarnos: ¿qué ocurriría con estas propiedades ante

errores de especificación?.

Para responder a esta cuestión, partimos del modelo de regresión lineal cuya especificación

general es:

Yi = βo+ β1 X1i +…+ ßk Xki + ei

Con las propiedades habituales:




No existencia de relación lineal exacta entre dos o más variables independientes

3.4.1. Omisión de una variable relevante Para analizar las consecuencias de la omisión de una variable relevante, vamos a partir del

siguiente modelo verdadero:

Yi = β0 + β1 X1i + β2 X2i + ei (3.1)

Sin embargo, por algún motivo, se ha procedido estimar el siguiente modelo:

Yi = α0 + α1 X1i + vi (3.2)

Dado que la variable excluida X2i está relacionada con la variable dependiente Yi, entonces se

deduce que:

vi= ß2 X2i + ei.

Estimando la pendiente α2 por MCO en el modelo (3.2), se obtiene:

( )( )2

11

111ˆ∑∑

−

−=

XX

yXX

i

iiα

siendo YYy ii −= , de forma que al sustituir yi por su expresión en el modelo verdadero (3.1)

quedaría:

( )( )( )

( ) ( )( ) ( )( )2

11

11222111

2

11

2

11

2211111ˆ

∑∑∑∑

∑∑

−

−+−−+−=

−

++−=

XX

eXXXXXXXX

XX

exxXX

i

iiiii

i

iiii ββββα

Al tomar esperanzas condicionales con respecto a los valores de las variables independientes y

dado que E(e| x1, x2, …, xk) = 0, se obtiene que:

( ) ( )( )( )2

11

2211211ˆ

∑∑

−

−−+=

XX

XXXXE

i

iiββα

lo que implica que )ˆ( 1αE no será igual a β1, por lo que estará sesgado siendo su sesgo:

( )( )( )2

11

22112

∑∑

−

−−

XX

XXXX

i

iiβ

Expresión cuyo signo viene determinado por el signo del coeficiente β2 y por el sentido de la

correlación entre las variables X1 y X2.

Con respecto a la varianza, dado que de la estimación MCO resulta que:

( ) ( ) ( )22,1

2

11

2

11

ˆrXX

Vari

e

−−=∑

σβ

donde r21,2 es el R2 resultante de regresar X1 sobre X2.

Y además:

( ) ( )2

11

2

1ˆ∑ −

=XX

Vari

vσα

entonces )ˆ( 1αVar será diferente de )ˆ( 1βVar , y por lo general será mas pequeña ya que

0<r21,2<1; pero aún en el caso en que r2

1,2=0, que implicaría que X1 y X2 no están correlacionadas,

y aunque el estimador MCO de α1 no fuera insesgado (ya que el sesgo de las variables omitidas

se anularía porque el termino ( )( )

( )2

11

2211

∑∑

−

−−

XX

XXXX

i

ii

sería cero), las varianzas serían ya de por

sí diferentes debido en la estimación de la ecuación (3.1) y en la de la ecuación (3.2).

3.4.2. Inclusión de una variable innecesaria Supóngase ahora que el modelo verdadero es:

Yi = β0 + β1 X1i + ei (3.3)

Pero se especifica el siguiente modelo:

Yi = αo + α1 X1i + α2 X2i + vi (3.4)

Los estimadores MCO de (3.4) son ahora sesgados y consistentes, ya que 00 )ˆ( βα =E ,

11)ˆ( βα =E y 0)ˆ( 2 =αE ; a este respecto hay que tener presente que al ser X2 una variable

innecesaria el parámetro estimado no será significativamente distinto de cero.

Pero como desde el punto de vista de las varianzas ahora resulta que:

( ) ( )2

11

2

1ˆ

∑ −=

XXVar

i

eσβ

( ) ( ) ( )22,1

2

11

2

11

ˆrXX

Vari

v

−−=∑

σα

Puesto que 0< r21,2<1, se cumpliría que )ˆ()ˆ( 11 βα VarVar ≥ , es decir, la varianza de la

estimación MCO de α1 sería mayor que la estimación MCO de β1.

3.4.3. Especificación funcional incorrecta Si especificamos la forma funcional de una relación (ya sea lineal, cuadrática, cúbica,

exponencial, logarítmica, etc.) y la verdadera relación presenta una forma diferente a la

especificada tiene, en algunos casos, las mismas consecuencias que la omisión de variables

relevantes, es decir, proporciona estimadores sesgados e inconsistentes. En general, una

especificación funcional incorrecta lleva a obtener perturbaciones heteroscedásticas y/o

autocorrelacionadas, o alejadas de los parámetros de la distribución del término de error del

modelo correctamente especificado.

3.4.4. Contraste de errores de especificación

Para constatar la presencia de errores de especificación en los modelos se utiliza la prueba general

de errores de especificación de Ramsey. Dicha prueba, en su versión más sencilla, se realiza

mediante los siguientes pasos:

1. A partir del modelo especificado, obtenemos iY estimada, es decir iY .

2. Se efectúa una nueva regresión incluyendo iY en alguna forma, con uno o varios

regresores adicionales, por ejemplo:

iiiii eYYXY ++++= 33

2210

ˆˆ ββββ (3.5)

3. Considerando el R2 obtenido en el modelo inicialmente especificado, 2AR , y el R2

obtenido en la segunda regresión, 2BR , se construye el siguiente estadístico:

( )

( )

2 2

21

( )

B A

B

R R

lFR

n k

−

=−−

El cual se distribuye según una F de Snedecor con l, n–k grados de libertad, siendo l

el número de regresores nuevos incluidos en el segundo modelo y n – k el número de

observaciones menos el numero de parámetros del segundo modelo.

4. Si el valor F calculado es significativo al nivel deseado, tcoFF >exp se puede aceptar

la hipótesis de que el modelo está mal especificado.

Ejemplo 3.5.

Utilizando los datos del modelo del grado de ocupación hotelera estimado en el capitulo anterior,

vamos a plantear la hipótesis de la existencia de algún error de especificación en el modelo.

Utilizando los datos del modelo, efectuamos la regresión siguiente:

iiiiii eYYXXY +++++= 34

2322110

ˆˆ βββββ

Para el que obtenemos el siguiente resultado:


Dado que el modelo estimado obtenía un R2 ajustado de 0,794; construimos el estadístico de

prueba:

( )

( )

( )2 2

2

0.812 0.794

2 0.57(1 0.812)1

12( )

B A

B

R R

lFR

n k

− −

= = =−−−

Con un nivel de significación de α=0.05, obtenemos el valor teórico correspondiente a una

distribución F con 2 grados de libertad en el numerador y 12 en el denominador, que es de 3.49.

Dado que tcoFF <exp no se rechaza la hipótesis de que el modelo esté mal especificado.

3.5. MINIMOS CUADRADOS GENERALIZADOS. En el modelo lineal general estableciamos como hipótesis de trabajo para el termino de error tener

una media cero, una varianza constante y no estar autocorrelacionado; es decir:




Ahora vamos a mantener la hipótesis de media nula, es decir,

E(ei) = 0 , i=1,…,n

Pero se va a admitir la posibilidad de que las varizanzas y covarianzas del termino de error estén

multiplicads por un factor escalar tal que:

E(ei ,ej) = σ2Ω , i=1,…,n

Donde σ2 es desconocida y Ω es una matriz conocida de orden n simétrica y definida positiva.

Recordemos que los errores son heteroscedásticos cuando su varianza varía a lo largo del tiempo.

Entonces, suponiendo que no existe autocorrelación en los residuos, la matriz de varianza y

covarianzas de los errores tendría la forma:

=

=Ω=

2

22

21

2

1

22

...00

............

0...0

0...0

...00

............

0...0

0...0

),(

nn

ji eeE

σ

σσ

λ

λλ

σσ

Si en lugar de heteroscedasticidad, existiera alguna forma de autocorrelación en el término de

error tal que 0),( ≠ji eeE , la matriz de varianzas-covarianzas de los errores autocorrelacionados

tendrá la siguiente forma:

=Ω=

−−

−

−

1...

............

...1

...1

),(

21

21

11

22

nn

n

n

ji eeE

ρρ

ρρρρ

σσ

En resumen, la existencia de heteroscedasticidad y autocorrelación violan las hipótesis de trabajo

sobre el término de error que requiere MCO; en ese caso, los estimadores obtenidos por este

procedimiento no serán los más eficientes, es decir, no serán los que garanticen la mínima

varianza entre todos los estimadores lineales.

El método de Mínimos Cuadrados Generalizados (MCG) permite obtener estimadores eficientes

cuando MCO proporciona estimaciones cuyo termino de error no tiene la forma de ruido blanco,

es decir, no tiene media cero, varianza constante y no está autocorrelacionado.

Supóngase que las varianzas heteroscedásticas 2iσ son ahora conocidas. El uso de Mínimos

Cuadrados Generalizados equivale a redefinir las variables utilizadas en el modelo original de

regresión tal que todas ellas quedan divididas por iσ :

i

ii

i

jiji

i

ii

eekj

XX

YY

σσσ==== *** ,,...,2,,

El término de error transformado tiene ahora una varianza homocedástica:

Var(*ie ) = E(

*ie )2 = E

2

i

ie

σ= 2

1

iσ E(ei)2 = 2

1

iσ (2iσ ) = 1

Posteriormente se realiza la regresión mínimo cuadrática con el modelo transformado:

ikikiii eXXXY **...** 22110* +++++= ββββ

El estimador βMCG será:

( ) ( ) YPPXXPPXYXXXMCG11111**1** ''''''ˆ −−−−−−

==β

Siendo:

=−

n

P

σ

σ

σ

1...00

............

0...10

0...01

2

1

1

Si llamamos entonces 111 ' −−− =Ω PP , el estimador βMCG quedaría como:

( ) YXXXMCG111 ''ˆ −−− ΩΩ=β

Por tanto, el método de MCG consiste en aplicar MCO sobre las variables transformadas, las

cuales sí satisfacen las hipótesis teóricas establecidas para MCO.

Así, por ejemplo, si detectamos la presencia de autocorrelación, y se cree que las perturbaciones

se generan de la manera siguiente:

1t t te eρ ε−= +

Donde ρ se conoce como coeficiente de autocorrelación, siendo 11 <<− ρ y tε satisface los

supuestos MCO clásicos (esto es, media cero, varianza constante y ausencia de autocorrelación)

El estimador MCG se obtendría realizando la siguiente transformación:

( ) ( ) ttotttttt XYXXYY εββερβρβρ ++==+−+−=− −−**

1**

1101 )1(

De forma que el estimador MCG1β viene dado por la siguiente expresión:

( )( )

( )C

xx

yyxx

N

ttt

N

ttttt

MCG +−

−−=

∑

∑

=−

=−−

2

21

211

1ˆ

ρ

ρρβ

siendo ( )XXx tt −= e ( )YYy tt −= , y C un factor de corrección que suele despreciarse en la

práctica.

La varianza del estimador obtenido mediante MCG será:

( )

2

1 2

12

ˆ( )MCG

N

t tt

Var D

x x

σβρ −

=

= +−∑

donde D es otro factor de corrección que también es despreciable.

Dado que ρ es un parámetro desconocido, es habitual obtener un estimador de ρ a partir del

estadístico d de Durbin-Watson:

21ˆ

d−=ρ

O por el procedimiento iterativo de Cochrane-Orcutt, que consiste en realizar una segunda

regresión con los errores de la regresión MCO de las variables originales; es decir:

y a partir de la estimación ρ de esta segunda regresión se realizan sucesivas regresiones a partir

del modelo transformado siguiente:

( ) ( ) ***1

***1101 ˆ)ˆ1(ˆ ttotttttt eXYeXXYY ++==+−+−=− −− ββρβρβρ

* * *0 1

ˆ ˆt t te Y Xβ β= − −

* *´ 1

ˆˆ ˆt t te e wρ −= +

hasta alcanzar un determinado grado de convergencia, en el sentido de que las diferencias entre

las sucesivas estimaciones de ρ tengan un valor inferior a un número previamente elegido.

En la práctica, para obtener los estimadores MCG una vez determinado el parámetro ρ

deberíamos seguir los siguientes pasos:

1. Transformar las observaciones originales utilizando el parámetro ρ

2. Aplicar MCO a los datos transformados.

Ejemplo 3.6.

Utilizando los datos y resultados obtenidos en el ejemplo 3.2, vamos a calcular un estimador para

ρ a partir de:

0.62599ˆ 1 1 0.687

2 2

dρ = − = − =

Para obtener los estimadores MCG, primero transformamos las variables originales:

ttt vee += −1ˆˆˆ ρ

*1

ˆt t tY Y Yρ −= − )ˆ1( ρ− *

1ˆ

t t tX X Xρ −= − 1987 1988 3399.63 0.312997435 129311.74 1989 3625.16 0.312997435 134908.00 1990 3822.30 0.312997435 137329.65 1991 3832.83 0.312997435 137485.83 1992 3675.41 0.312997435 134269.10 1993 3676.71 0.312997435 127267.53 1994 4051.07 0.312997435 140161.37 1995 4218.66 0.312997435 145095.74 1996 4265.57 0.312997435 147696.21 1997 4518.82 0.312997435 158421.89 1998 5131.57 0.312997435 166289.37 1999 5546.73 0.312997435 172923.46 2000 5753.89 0.312997435 180166.00 2001 6077.68 0.312997435 180518.13 2002 5883.22 0.312997435 181297.10

En segundo lugar aplicamos MCO a los datos transformados3, lo que da lugar a la siguiente

solución:

** 046.0)ˆ1(87.003,8 tt XY +−−= ρ

que equivale a estimar:

tt XY 046.087.003,8ˆ +−=

Para obtener una estimación de ρ por el procedimiento iterativo de Cochrane-Orcutt, iniciamos

el procedimiento a partir de la función estimada por MCO:

10.531t t te e v−= +

A continuación transformamos las variables originales:

3 Notese que en vez del vector de n valores 1 que se asocia al término constante en el MCO

ordinario, se estima ahora utilizando un vector con n valores )ˆ1( ρ− .

ttt vee += −1ˆˆˆ ρ

*1

ˆt t tY Y Yρ −= − )ˆ1( ρ− *

1ˆ

t t tX X Xρ −= − 1987 1988 4867.671917 0.468725142 184643.6678 1989 5163.129506 0.468725142 193058.5929 1990 5443.428732 0.468725142 198288.1759 1991 5541.789713 0.468725142 200750.5265 1992 5446.342319 0.468725142 199142.4573 1993 5465.714436 0.468725142 192745.1108 1994 5852.681172 0.468725142 204963.7186 1995 6087.232984 0.468725142 211442.1284 1996 6206.252725 0.468725142 215871.7739 1997 6516.337402 0.468725142 228259.0712 1998 7207.574873 0.468725142 238938.3724 1999 7772.082285 0.468725142 248729.3684 2000 8146.493088 0.468725142 259173.8261 2001 8617.438347 0.468725142 262853.5449 2002 8574.507911 0.468725142 265973.4213

Aplicamos MCO a los datos transformados, lo que da lugar a la siguiente ecuación:

** 045.0)ˆ1(97.518,7 tt XY +−−= ρ

Obtenemos los errores de predicción a partir de:

ttt XYe 045.097.518,7ˆ* +−=

tYˆ

*te

1987 8583.804131 843.1958686 1988 9404.058542 471.9414578 1989 10221.18602 188.8139837 1990 10892.29914 81.7008583 1991 11360.43329 11.56671113 1992 11536.26683 -48.26683108 1993 11339.76832 229.2316841 1994 11789.09552 209.9044751 1995 12321.39985 140.6001486 1996 12804.94209 22.05790756 1997 13623.20251 -292.2025146 1998 14541.88745 -251.8874547 1999 15473.66927 -109.6692747 2000 16442.02266 -133.0226587 2001 17123.24168 158.7583191 2002 17626.54254 129.4574635

Por tanto, en segunda iteración obtenemos el siguiente valor ˆρ a partir de la regresión:

ttt wee += −*

1* ˆ52446.0ˆ

Y a partir de este nuevo valor ˆρ repetiremos el proceso hasta obtener parámetros que difieran en

un pequeño valor, como ocurre entre los parámetros obtenidos en la iteración 9 y 10:

Iteración ρ Diferencias 1 0.5244578

2 0.52217007 -0.00228772

3 0.52141952 -0.00075055

4 0.52117513 -0.00024439

Con el parámetro correspondiente a la cuarta iteración se obtiene la siguiente estimación MCG:

ˆ 7495.29 0.045t tY X= − +

3.6. PROBLEMAS


Y X 2 25 3 28 4 30 5 33 6 35 7 35 8 39 4 28 5 29 6 31 7 33 3 26 4 29 5 28 8 34 2 23 4 28

a) Estime por MCO la relación Y=β0+β1X

b) Obtenga los residuos y representarlos gráficamente. Comentar los resultados.

c) Calcule el estadístico d de Durbin-Watson e interprete el resultado

3.2. Utilizando los siguientes datos de corte transversal de 20 individuos:

i Y X 1 5 4.3 2 11.1 4.6 3 3.2 2.4 4 7.9 2.4 5 25.5 26.4 6 3.8 4.2 7 11.1 5.5 8 9.9 4.7 9 13.3 2.2

10 1.5 4 11 6.4 4 12 8.9 8.4 13 8.1 3.3 14 13.5 4.7 15 4.7 5.2 16 7.5 3.6 17 4.7 3.6 18 8 4 19 7.5 3.9 20 9 2.1 a) Efectúe la regresión MCO de Y sobre X y realice un gráfico de los residuos de la

regresión. b) En base al gráfico de los residuos si concluye que hay heteroscedasticidad en la

varianza del error, realice un contraste estadístico para verificarlo.

3.3. Con los siguientes datos de X e Y

Y X 217 6.5 136 4.6 67 2.4 66 2.4 93 3.4 36 1.1

173 5.5 139 4.7 61 2.2 58 2.1 55 2

212 6.4 92 3.3

138 4.7 37 1.2

152 5 243 7

Se ha obtenido la siguiente estimación:

Y=8.25+3.68 X R2=0.9846. Comprobar si el modelo está bien especificado.

3.4. Comente los resultados con el siguiente programa R4 realizado con datos del PIB en indices de volumen y horas trabajadas de la Contabilidad Regional de España en Cantabria :

> library(lmtest) > datos <- read.table(file="libro1.txt",header=T,dec=",") > datos Año PIB HORAS 1 2000 81.36789 358353.0 2 2001 84.70348 376717.6 3 2002 87.13748 389675.5 4 2003 88.44620 393953.2 5 2004 90.48026 402303.7 6 2005 93.35919 415740.0 7 2006 96.36604 418940.8 8 2007 99.17407 428054.0 9 2008 100.00000 426718.0 10 2009 96.05368 401495.1 11 2010 95.64394 379246.9 12 2011 94.83684 371818.5 13 2012 93.99655 354724.5 dwtest(datos$PIB ~ datos$HORAS) Durbin-Watson test data: datos$PIB ~ datos$HORAS DW = 0.0942, p-value = 6.069e-10 alternative hypothesis: true autocorrelation is greater than 0

3.5 Utilizando los datos del ejercicio 1 realice una estimación de ρ siguiendo el procedimiento

de Cochrane-Orcutt.

Soluciones

3.1 a) XY 42.079.7 +−=

b) A realizar por el lector

c) 797.0777.9

795.7 ==d , con 40.1=Ud y 90.0=Ld . Se rechaza la hipótesis nula de

no autocorrelación.

4

3.2 a) XY 757.061.4 ++=

b) 28.171.55

43.71exp ==F ; 39.64,4 =F ; no se rechaza la hipótesis nula de

homocedasticidad5.

3.3 9998.02 =BR y 9846.02 =AR ; 1064

14

)9998.01(1

)9846.09998.0(

exp =−

−

=F ; 60.414,1 =F . Se

acepta la hipótesis de que el modelo está mal especificado6.

3.4 A realizar por el lector

3.5 57721.0ˆ =ρ ; 61176.0ˆ =ρ ; 61416.0ˆˆ =ρ ; 61432.0

ˆˆ =ρ

5 Resultados del contraste de Goldfeld-Quant eliminando las cuatro observaciones centrales. 6 Para calcular

2BR se utiliza la regresión iiii eYXY +++= 2

210ˆβββ

4. MODELOS CON ERRORES EN LAS VARIABLES

4.1. INTRODUCCIÓN

En el capítulo 2 hemos mantenido dos supuestos de forma implícita: por un lado, que los modelos

habían sido correctamente especificados; y por otro, que no se cometían errores en la medición

de las variables que componen los modelos. Sin embargo, en la práctica puede que alguno de los

supuestos anteriores no se satisfaga plenamente.

El incumplimiento del primero de ellos conlleva lo que se conoce en Econometría como errores

de especificación, los cuales ya han sido examinados en el capítulo anterior. Sin embargo, no son

éstos los errores objeto de análisis en este capítulo sino los segundos, aquellos derivados de la no

coincidencia de los datos disponibles con los valores teóricos de las variables incluidas. Ello

puede deberse básicamente a dos motivos: por un lado, puede darse la circunstancia de que no

podamos obtener datos para la variable teórica deseada (denominada variable latente), por lo que

deberemos usar una variable que esté muy correlacionada con la anterior (variable proxy) de la

que sí se disponga de datos. Por otro lado, también puede darse el caso en el que el investigador

se encuentre con problemas de la muestra tales como errores en el tratamiento de los datos,

respuestas no válidas, etc.

En estos casos, los estimadores obtenidos en las regresiones se verán afectados, introduciendo

sesgos en la estimación por Mínimos Cuadrados Ordinarios. El sesgo de los estimadores será

menor cuanto más se aproxime la variable que realmente aparece en el modelo, y cuanto más

independiente sea el error de medida de las restantes variables del modelo. Asimismo, también se

verán afectadas las propiedades de consistencia y eficiencia de los estimadores, siendo más

negativas las consecuencias de los errores de medida cuanto menor sea el tamaño muestral.

Entre ambos tipos de errores (especificación y medida) existe cierta relación. De hecho, un error

de medida puede ser considerado un error de especificación en cierta medida, ya que puede que

se esté dejando información relevante fuera del modelo, o que se esté incluyendo información

irrelevante en el mismo.

Si bien en el presente capítulo se muestran algunos métodos para atenuar las consecuencias de

estos errores, resulta fundamental que, desde el principio, el investigador conozca la fuente y el

origen de los datos, así como sus características básicas (error de muestreo, nivel de confianza,

tipo de muestreo, tamaños muestrales, universo de referencia, influencia de la no respuesta, etc.)

4.2. TIPOS DE ERRORES DE MEDIDA

A continuación pasamos a analizar los efectos que tienen los errores de medida sobre las distintas

variables del modelo; primero, consideraremos los efectos sobre las variables endógenas y

después, sobre las variables exógenas.

4.2.1. Errores de medida en la variable endógena Supongamos que deseamos estudiar el comportamiento de una determinada variable endógena

teórica o latente, que denominaremos Yt, a lo largo del tiempo en función de una sola variable, Xt,

la cual es observada sin error. El modelo especificado será por tanto:

Yt = β0 + β1Xt + εt (4.1.)

Donde εt es una variable aleatoria independiente con distribución N(0, 2εσ ).

Supongamos que la variable Yt presenta algún error de medida, de tal forma que en realidad

observamos:

Yt* = Yt + ut

Donde ut, al igual que εt, es una variable i.i.d. con función de distribución N(0, 2uσ ), siendo además

independiente de εt y de Xt.

Reemplazando el valor teórico de Yt por su valor observado en (4.1) tenemos que:

Yt = Yt* – ut = β0 + β1Xt + εt + ut

Y agrupando los dos términos de error en uno, vt = εt+ut, se obtiene que:

Yt* = β0 + β1Xt + vt (4.2.)

Donde el término de error vt continúa siendo i.i.d. si bien ahora su varianza pasa a ser:

Var(vt) = Var(εt)+ Var(ut) = 2εσ + 2

uσ

Al ser Cov(εt ut) = 0, por ser ambas variables ruidos blancos.

El modelo obtenido en (4.2) puede ser estimado por MCO sin ninguna dificultad y los estimadores

que se calculen serán insesgados; sin embargo, la varianza estimada para los coeficientes del

modelo sí se verá afectada ya que:

Var(β) = 2vσ (X’X)-1 = ( 2

εσ + 2uσ )(X’X)-1

Cuyo valor es mayor que el de la varianza de los estimadores del modelo (4.1) si Yt no estuviera

medida con error.

4.2.2. Errores de medida en la variable exógena Si bien la existencia de errores de medida en la variable endógena no tiene consecuencias

excesivamente graves para la estimación mínimo-cuadrática, no podemos decir lo mismo cuando

existen errores de medida en las variables exógenas. En efecto, supongamos que en el mismo

modelo planteado en (4.1) es ahora la variable exógena, Xt, la que presenta el error de medida tal

que:

Xt* = X t + ut (4.3.)

Donde de nuevo suponemos que ut es una variable iid con función de distribución N(0, 2uσ ),

siendo además independiente de εt y de Xt y de Yt.

Así, el modelo resultante de sustituir (4.3) en (4.1) es:

Yt = β0 + β1(Xt* – ut )+ εt = β0 + β1Xt* + ( εt – β1 ut )

Y, de nuevo, llamando vt = εt – β1 ut queda que:

Yt = β0 + β1Xt* + v t (4.4.)

Donde ahora el término de error compuesto vt está correlacionado con la variable explicativa Xt

tal que:

Cov(Xt*, vt) = Cov (Xt + ut, εt – β1 ut)

= Cov (Xt, εt) – β1Cov(Xt, ut)+Cov(ut, εt) – β1 Cov(ut, ut)

= 0 – β1·0 + 0 – β12uσ = – β1

2uσ

Siendo Cov(Xt, εt) nulo por los supuestos habituales del modelo de regresión lineal, mientras que

el resto de términos son nulos debido a los supuestos que hemos establecido a lo largo del

desarrollo sobre el error de medida.

La correlación existente entre Xt y vt va a provocar que los estimadores MCO en este caso sean

sesgados. En efecto, si expresamos el modelo (4.4) en desviaciones respecto a la media, dividimos

numerador y denominador por el tamaño muestral, T, y calculamos el límite en probabilidad de

la expresión del estimador MCO para β1 tenemos que:

[ ][ ]

[ ]

( )( )

+=

+=

−+−+

−−+−+−+=

−+

−+−+==

∑∑∑

∑ ∑∑∑

∑

∑

∑

∑

22122

21

22

12

1

2

1

2*

*

1

/1

1·

)()(21

lim

)()()()(1

lim

)(1

lim

)()(1

lim

1lim

1lim

ˆlim

xuux

x

tttt

ttttttt

tt

tttt

t

tt

uuuuxxT

p

uuxuuxxT

p

uuxT

p

xuuxT

p

xT

p

yxT

pp

σσβ

σσσβεεεεββ

εεββ

El resultado obtenido muestra que, en presencia de errores de medida, el estimador MCO de β1

será sesgado e inconsistente. La magnitud del sesgo será mayor cuanto mayor sea la varianza del

error de medida 2uσ , lo que implica que un error de medida en Xt que fuese constante no produciría

sesgo alguno en la estimación de β1.

El resultado obtenido puede generalizarse a modelos con k variables explicativas, todas ellas

medidas con error. Así, sea la matriz X* de dimensión T k× ; dicha matriz puede descomponerse

como la suma de la matriz de variables latentes, X, y la matriz de errores de medida, u, tal que:

+

=

kTTT

k

k

kTTT

k

k

kTTT

k

k

uuu

uuu

uuu

XXX

XXX

XXX

XXX

XXX

XXX

L

MOMM

L

L

L

MOMM

L

L

L

MOMM

L

L

21

22212

12111

21

22212

12111

**2

*1

*1

*22

*12

*1

*21

*11

El investigador desea estimar el modelo:

Y = Xβ + ε

Sin embargo, los datos de que dispone para las variables explicativas presentan errores de medida

por lo que en la práctica el modelo que estimará será:

Y = (X*–u)β + ε = X*β + (ε–βu)= X*β + v (4.5.)

Suponiendo que u cumple las propiedades enunciadas anteriormente para los errores de medida,

la estimación MCO de los parámetros del modelo anterior vendrá dada por:

YXXXMCO *'*)*'(ˆ 1−=β

Descomponiendo el producto y tomando límites de probabilidad en la expresión anterior tenemos

que:

[ ] [ ]

uuXXT

Xup

T

uXp

T

uup

T

XXp

T

XuuXuuXXp

T

uXuXp

T

XXp

Σ+Σ=+++=

+++=

++=

)'(lim

)'(lim

)'(lim

)'(lim

)''''(lim

))()'(lim

*)'*(lim

[ ] [ ]

ββεβεβ

εβεβεβ

XXT

XXp

T

up

T

Xup

T

Xp

T

XXp

T

uXuXXXp

T

XuXp

T

YXp

Σ==+++=

+++=

++=

)'(lim

)'(lim

)'(lim

)'(lim

)'(lim

)''''(lim

)()'(lim

)*'(lim

Por tanto, si calculamos el límite en probabilidad de MCOβ queda que:

ββββ uuuuXXXXuuXXMCOp ΣΣ+Σ−=ΣΣ+Σ= −− 11 )(·)(ˆlim

Resultado que muestra que incluso aunque sólo una de las variables explicativas tuviera un error

de medida, los estimadores MCO obtenidos serían sesgados e inconsistentes.

4.3. ESTIMACIÓN DE MODELOS CON ERRORES EN LAS

VARIABLES

En la práctica, ante un problema como el planteado poco se puede hacer. Ya hemos visto las

implicaciones que ello tiene para la estimación, siendo éstas más importantes cuando se presentan

en las variables explicativas. Aunque en ocasiones lo que se hace es obviar dichos errores por

considerar que no son significativos, el investigador deberá tener en mente que puede utilizar dos

métodos que permiten atenuar las consecuencias de la existencia de errores de medida en las

variables. Dichos métodos son la estimación mediante variables instrumentales y la estimación

por variables aproximadas.

a) Estimación por Variables Instrumentales Si bien este método de estimación se verá con más detalle en el capítulo 8, pasamos a comentar

en este apartado la aplicación práctica de este método de estimación al problema de los errores de

medida. La filosofía de este procedimiento en este caso consiste en sustituir las variables medidas

con error por otras, denominadas instrumentos, que no presenten este problema y que no hayan

sido incluidas en el modelo. Para ello, cada una de las variables seleccionadas deben verificar

que:

α) Esté incorrelacionada, al menos asintóticamente, con el término de error tal que, si Z

es la matriz de variables instrumentales para el modelo, deberá verificarse que:

0'

lim·'

lim)('

lim'

lim =−=−=T

uZp

T

Zp

T

uZp

T

vZp βεβε

β) Esté correlacionada con la variable explicativa para la que actúa como instrumento

tal que:

0'

lim ≠Σ= ZXT

XZp

Si estas propiedades se cumplen, el estimador de Variables Instrumentales del modelo (4.5)

vendrá dado por la expresión:

YZXZVI ')'(ˆ 1−=β

El cual ahora sí es insesgado ya que:

( ) ( ) βββ

ββ

=Σ+ΣΣ=

+

=

+

=

=

−−−

−−

0·)'

lim'

lim'

lim

)('lim

'lim

'lim

'limˆ

111

11

ZXZXZX

VI

T

vZp

T

XZp

T

XZp

T

vXZp

T

XZp

T

YZp

T

XZp

Siendo la matriz de varianzas y covarianzas del estimador VIβ :

112 )')('()'()ˆ( −−= ZXZZXZVar vVI σβ

b) Estimación por Variables Aproximadas En algunas ocasiones lo que sucederá no es que existan errores de medida en la variable

considerada sino que sencillamente no existe ninguna variable observable que se corresponda

exactamente con la variable incluida en el modelo. Tal es el caso del nivel educativo o la

inteligencia de un individuo, variables que pueden ser aproximadas por los años de escolarización

o los resultados de un test de inteligencia respectivamente. Sin embargo, estas variables

aproximadas deben tratarse como variables con errores de medida, ya que no podemos

aproximarnos a la verdadera variable realizando mediciones más precisas de la variable proxy.

4.4. APLICACIÓN PRÁCTICA

Veamos cómo afectan los errores de medida a los valores de las estimaciones. Supongamos que

un investigador desea estimar un modelo simple que relaciona renta y consumo. Para lo cual

realiza una encuesta a 10 familias, y obtiene los datos que figuran en la tabla siguiente:

Observación Gasto observado (C) Ingreso observado (I)

1 67.60 80.09

2 75.44 91.57

3 109.70 112.14

4 129.42 145.60

5 104.24 168.56

6 125.83 171.47

7 153.99 203.54

8 152.92 222.85

9 176.33 232.98

10 174.52 261.18

Sin embargo, supongamos que en realidad el gasto efectivo en consumo, y el ingresos efectivos

de dichas familias han sido los siguientes:

Observación Gasto efectivo en consumo (C*) Ingreso efectivo (I*)

1 75.47 80

2 74.98 100

3 102.82 120

4 125.77 140

5 106.50 160

6 131.43 180

7 149.37 200

8 143.86 220

9 177.52 240

10 182.28 260

En consecuencia, el modelo de consumo para las cifras reales sería:

* *0 1i i iC I uβ β= + +

donde 2 2( ) 0, ( )i i uE u E u σ= = .

La función de Consumo estimada con datos reales sería :

Variable dependiente: C*

Número de observaciones: 10

Variable Coeficiente Desv. Típica Estadístico t p-value

0β

25.00 10.48 2.386 0.044

1β

0.60 0.06 10.276 0.000

R2 R2 corregido

0.929 0.921

Media variable dependiente Desv. típica variable dependiente

127.000 37.683

Desv. Típica regresión 10.606 Estadístico F 105.599

Estadístico Durbin-Watson 2.816 p-value Estadístico F 0.0000

Para comprobar como variaría la estimación, vamos a suponer que las variables observadas

contienen errores de medida tal que Ci = Ci* + εi, I i = I i* + v i, con εi y vi, errores de medición que

satisfacen que:

2 2( ) 0, ( )i iE E εε ε σ= = 2 2( ) 0, ( )i i vE v E v σ= =

( ) ( ) 0i i i iE v E vε ε= = * * *( ) ( ) ( ) 0i i i i i iE I E I v E I uε = = =

Supongamos que el investigador dispone de los datos de ingresos efectivos, I* , pero sólo cuenta

con el gasto en consumo observado, C. Con dicha información estimamos ahora la función de

consumo *

0 1i i iC I uβ β= + + .

Variable dependiente: C



0β

25.00 12.22 2.046 0.075

1β

0.60 0.07 8.811 0.000

R2 R2 corregido

0.907 0.895


127.000 38.158



Como puede apreciarse, los estimadores continúan siendo insesgados y consistentes, coincidiendo

prácticamente los coeficientes de ambas estimaciones. Sin embargo, los errores de medición en

la variable endógena provocan el aumento de las desviaciones típicas de los parámetros.

Supongamos que disponemos de la serie de gasto en consumo efectivo, C*, pero tan sólo

disponemos de los ingresos observados, I. Con dicha información estimamos ahora la función de

consumo *

0 1i i iC I uβ β= + + .

Variable dependiente: C*



0β

28.46 11.28 2.522 0.036

1β

0.58 0.06 9.246 0.000

R2 R2 corregido

0.914 0.904


127.000 37.683



En este caso, observamos que los estimadores obtenidos están claramente sesgados, sobre todo

en el caso del término constante.

4.5. PROBLEMAS

4.1. Considere el siguiente modelo:

yt = βxt + εt

En el que las variables están expresadas en desviaciones respecto a la media.

La variable xt presenta errores de medida tal que:

xt* = x t + ut

La variable xt en realidad es una variable aleatoria que evoluciona en el tiempo de acuerdo

a un proceso autorregresivo de orden 1 tal que:

xt* = φxt-1* + εt

Demuestre que, al contrario de los resultados obtenidos a lo largo del capítulo, es posible

estimar consistentemente β mediante la expresión:

∑

∑

=−

=−

=T

itt

T

itt

xx

yx

2

**1

2

*1

β

4.2. Un investigador especifica el siguiente modelo:

Yt =α+ βXt + εt

donde yt es el consumo que realizan las familias y Xt es la renta permanente. Dado que no

es posible observar directamente la variable Xt, el investigador decide utilizar como variable

proxy de Xt la media de la renta familiar de los últimos cinco años y que denotaremos por

Xt*.

La relación entre las dos variables puede expresarse como:

Xt* = X t + wt

Donde wt es un ruido blanco gaussiano.

Calcule el sesgo asintótico del estimador MCO del modelo cuando se tienen en

consideración los errores de medida comentados. ¿Es posible saber si el valor del estimador

MCO sobrestimará o subestimará el valor de β?

SOLUCIONES

4.1. A realizar por el lector.

4.2. El sesgo del estimador es 2 2

1

1 /w xσ σ+ . El estimador siempre subestima el

verdadero valor de β.

5. MODELOS CON VARIABLES CUALITATIVAS

5.1. MODELOS CON VARIABLES CUANTITATIVAS Y

CUALITATIVAS COMO REGRESORES.

En un modelo econométrico, las variables representan a los conceptos u operaciones económicas

que queremos analizar. Normalmente utilizamos variables cuantitativas, es decir, aquellas cuyos

valores vienen expresados de forma numérica; sin embargo, también existe la posibilidad de

incluir en el modelo econométrico información cualitativa, siempre que esta pueda expresarse de

esa forma.

Las variables cualitativas expresan cualidades o atributos de los agentes o individuos (sexo,

religión, nacionalidad, nivel de estudios, etc.) y también recogen acontecimientos extraordinarios

como guerras, terremotos, climatologías adversas, huelgas, cambios políticos etc.

No cabe duda de que una forma de recoger factores de este tipo sería la utilización de variables

proxy o aproximadas a las variables utilizadas. Por ejemplo, si quiero utilizar una variable que

mida el nivel cultural de un país (variable cualitativa) puedo utilizar como variable proxy el

número de bibliotecas existentes en un país, o representa una climatología adversa a partir de las

temperaturas medias o precipitaciones. Sin embargo, no siempre es posible encontrar este tipo de

variables y, en cualquier caso, debemos de ser conscientes de la posible existencia de errores en

la definición de la variable.

Puesto que las variables cualitativas normalmente recogen aspectos de la presencia o no de

determinado atributo (ser hombre o mujer, tener estudios universitarios o no tenerlos, etc.…) se

utilizan variables construidas artificialmente, llamadas también ficticias o dummy, que

generalmente toman dos valores, 1 ó 0, según se dé o no cierta cualidad o atributo. Habitualmente

a la variable ficticia se le asigna el valor 1 en presencia de la cualidad y 0 en caso contrario. Las

variables que toman valores 1 y 0, también reciben el nombre de variables dicotómicas o binarias.

Las variables dicotómicas pueden combinarse para caracterizar variables definidas por su

pertenencia o no a un grupo. Si incluyo una variable cualitativa que me define la pertenencia o

no de un país a un grupo, por ejemplo renta alta, media y baja, introduciré tres variables

cualitativas en el modelo asociadas al la pertenencia o no a cada grupo; la primera caracterizaría

a los individuos con renta alta, la segunda a los individuos con renta media, y la tercera a los

individuos con renta baja.

Los modelos que utilizan variables cualitativas como regresores se diferencian en dos grupos, los

modelos de Análisis de la Varianza o modelos ANOVA, que únicamente incluyen variables

cualitativas como regresores; y los modelos de Análisis de la Covarianza o modelos ANCOVA

que incluyen tanto variables cualitativas como cuantitativas. Los modelos ANOVA son muy

utilizados en Sociología, Psicología, Educación, etc.; en Economía son más comunes los modelos

ANCOVA.

5.1.1. Modelos ANOVA Un problema estadístico clásico es la comparación de medias de dos distribuciones normales.

Supongamos que las observaciones de la variable iY , provienen de dos distribuciones normales

con medias 1µ y 2µ y varianza común 2σ . El tamaño de la primera distribución se circunscribe a

las 1n primeras observaciones, y el de la segunda las 1nn − restantes observaciones. Queremos

constrastar la hipótesis 21: µµ =oH frente a la alternativa 21: µµ ≠oH al nivel de

significación de α .

Este contraste de igualdad de medias cabe formularlo en el marco del modelo lineal general. Así,

bajo oH tenemos el siguiente modelo de regresión múltiple utilizando variables Dummy:

iiii eDDY ++= 21 21 µµ

Siendo :

+∈∈

=nnisi

nisiD i ,...,10

,...,111

1

1

+∈∈

=nnisi

nisiD i ,...,11

,...,102

1

1

El estimador mínimo cuadrático del modelo planteado sería:

=

∑

∑

∑∑

∑∑

=

=

−

==

==n

iii

n

iii

n

ii

n

iii

n

iii

n

ii

YD

YD

DDD

DDD

1

1

1

1

2

1

11

2

1

1

2

1

221

211

ˆ

ˆ

µµ

Teniendo presente que ∑

=

=n

ii nD

11

21, ∑

=

=−=n

ii nnnD

121

22, ∑

=

=n

iii DD

1

021,

∑ ∑= =

=n

i

n

iiii YYD

1 1

1

1y∑ ∑

= +==

n

i

n

niiii YYD

1 11

2, el estimador mínimo cuadrático quedaría:

=

=

∑

∑

+=

=

−

2

1

1

1

1

2

1

1

1

1

1

0

0

ˆ

ˆ

Y

Y

Y

Y

n

nn

nii

n

ii

µµ

Para contrastar la hipótesis 0: 21 =− µµoH frente a la alternativa 0: 21 ≠− µµoH ,

construiríamos el estadístico experimental 2

2

1

2

21

ˆˆ

21

ˆˆ

ˆˆ

21

nn

YY

St

σσµµµµ +

−=

−=

−

, en donde

2ˆ 1

2

2

−=∑

=

n

en

ii

σ.

La hipótesis 0: 21 =− µµoH ser rechaza con el estadístico teórico )2/(2 α−= ntco tt si

tcott >exp .

El análisis anterior se extiende a la comparación de medias con tres o más distribuciones

normales. Suponemos ahora que las n observaciones proceden de tres distribuciones normales

con medias 1µ , 2µ y 3µ y varianza común 2σ , correspondientes a tres muestras que contienen

las 1n primeras observaciones,2n siguientes y 213 nnn −−=µ ultimas observaciones.

El modelo lineal utilizando variables Dummy quedaría:

iiiii edddY +++= 32211 µµ

Donde las variables binarias se definen:

∉∈

=Jgrupoelenisi

JgrupoelenisiDJ i 0

1

El estimador mínimo cuadrático del vector de parámetros es:

=

=

∑

∑

∑

+=

+=

=−

3

2

1

1

1

11

3

2

1

3

2

1

2

2

1

1

00

00

00

ˆ

ˆ

ˆ

Y

Y

Y

Y

Y

Y

n

n

n

n

nii

n

nii

n

ii

µµµ

Para contrastar la hipótesis 321: µµµ ==oH , se utiliza el contraste de significación global,

para el que construimos es estadístico experimental 3

)1(2

2

2

exp

−−

=

n

R

R

F

, siendo el estadístico

teórico )3,2( −= nFFtco , la hipótesis se rechazaría con la regla de decisión tcoFF >exp .

Ejemplo 5.1.

Desde R obteneos el conjunto de datos (data.frame) mtcars, que es una base de datos relativa a

diferentes tipos de automóviles.

> data(mtcars) El contenido de la base de datos puede analizarse con la function str > str(mtcars) 'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num 6 6 4 6 8 6 8 4 4 6 ... $ disp: num 160 160 108 258 360 ... $ hp : num 110 110 93 110 175 105 245 62 95 123 ... $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ... $ wt : num 2.62 2.88 2.32 3.21 3.44 ... $ qsec: num 16.5 17 18.6 19.4 17 ... $ vs : num 0 0 1 1 0 1 0 1 1 1 ... $ am : num 1 1 1 0 0 0 0 0 0 0 ... $ gear: num 4 4 4 3 3 3 3 4 4 4 ... $ carb: num 4 4 1 1 2 1 4 2 2 4 ...

Teniendo presente que mpg es el consumo en Miles/ (US) gallon, y que am es una variable

cualitativa que relativa al tipo de transmisión (marchas) , que toma valor 0 en caso de transmisión

es automática y 1 cuando lo es manual, construimos la tabla anova con la función “aov”:

> mod1 <- aov(mtcars$mpg ~ mtcars$am) > summary(mod1) Df Sum Sq Mean Sq F value Pr(>F) mtcars$am 1 405.2 405.2 16.86 0.000285 *** Residuals 30 720.9 24.0 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

El estadístico F al ser mayor que el valor teórico permite rechazar la hipótesis oH por lo que cabe

admitir que transmisión autómatica ó manual tiene relación con el consumo de gasolina de este

conjunto de automóviles. De hecho el codigo “***” nos muestra que la variable es significativa a

un α muy bajo.

La variable gear, hace referencia al numero de marchas delanteras, variable que toma valores:

3,4 y 5.

> mtcars$gear [1] 4 4 4 3 3 3 3 4 4 4 4 3 3 3 3 3 3 4 4 4 3 3 3 3 3 4 5 5 5 [30] 5 5 4 Otra posibilidad de obtener la tabla anova es definir el modelo lineal y utilizar la función

“anova”.

> reg <- lm(mtcars$mpg ~ mtcars$gear) > anova(reg) Analysis of Variance Table Response: mtcars$mpg Df Sum Sq Mean Sq F value Pr(>F) mtcars$gear 1 259.75 259.749 8.9951 0.005401 ** Residuals 30 866.30 28.877 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Al igual que en laso anterior la variable tambien tiene relación con el consumo de gasolina, sería

significativa a un 001.0=α .

Realizamos ahora un modelo anova con el descrito en la teoría con la función siguiente:

> model.tables (mod1, type = "mean") Tables of means Grand mean 20.09062 mtcars$am mtcars$am 0 1 17.147 24.392 Warning message: In replications(paste("~", xx), data = mf) : non-factors ignored: mtcars$am

Incorporamos ahora la variable que nos informa del número de marchas y estudiamos sus efectos

sobre la explicativa:

mod2 <- aov(mtcars$mpg ~ mtcars$am+mtcars$gear) > anova(mod2) Analysis of Variance Table Response: mtcars$mpg Df Sum Sq Mean Sq F value Pr(>F) mtcars$am 1 405.15 405.15 16.2994 0.0003615 *** mtcars$gear 1 0.05 0.05 0.0019 0.9651278 Residuals 29 720.85 24.86 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> model.tables (mod2) Tables of effects mtcars$am mtcars$am 0 1 -2.943 4.302 mtcars$gear mtcars$gear 3 4 5 -0.01854 0.00059 0.05419 Warning messages: 1: In replications(paste("~", xx), data = mf) : non-factors ignored: mtcars$am 2: In replications(paste("~", xx), data = mf) : non-factors ignored: mtcars$gear

Obtenemos ahora que los vehiculos con marchas automáticas reducen el consumo medio en 2,943

millas/(US) gallon, los de marchas manuales, lo aumentan en 4,302; los de 3 marchas lo reducen

en -0.01854, etc…

Incluimos ahora las dos variables y sus iteracciones:

> mod3 <- aov(mtcars$mpg ~ tcars$am+mtcars$gear+mtcars$am*mtcars$gear) > anova(mod3) Analysis of Variance Table Response: mtcars$mpg Df Sum Sq Mean Sq F value Pr(>F) mtcars$am 1 405.15 405.15 19.9021 0.0001208 *** mtcars$gear 1 0.05 0.05 0.0024 0.9614808 mtcars$am:mtcars$gear 1 150.85 150.85 7.4099 0.0110327 * Residuals 28 570.00 20.36 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > model.tables (mod3) Tables of effects mtcars$am mtcars$am 0 1 -2.943 4.302 mtcars$gear mtcars$gear 3 4 5 -0.01854 0.00059 0.05419 mtcars$am:mtcars$gear mtcars$gear mtcars$am 3 4 5 0 -1.022 3.833 1 1.917 -3.066

Las iteraciones entre tipo de marchas y numero de marchas son significativas estadísticamente, y

la función nos informa que un coche automático con 3 marchas reduce en 1.002 adicional el

consumo de carburante en relación con el consumo medio del automático, un coche con marchas

manuales y 5 marchas reduce en 3.006 Milles/(US) gallon el consumo de gasolina sobre el

consumo medio de un conche con transmisión manual.

> model.tables (mod3,type="mean") Tables of means Grand mean 20.09062 mtcars$am mtcars$am 0 1 17.147 24.392 mtcars$gear mtcars$gear 3 4 5 20.072 20.091 20.145 mtcars$am:mtcars$gear mtcars$gear mtcars$am 3 4 5 0 16.107 21.050 1 26.275 21.380

5.1.2. Modelos ANCOVA

Para ilustrar la utilización de un modelo ANCOVA vamos a suponer que estamos modelizando

la relación que existe entre el dinero que ahorra un grupo “n” de individuos, Yi, y la renta que

declara cada uno de ellos, Xi:

Yi=β0+β1Xi+et , siendo i=1…..n

De este grupo de individuos conocemos algunas otras características que pueden ser

transcendentes a la hora de nuestro análisis, por ejemplo si están o no están casados. Utilizando

dicha información creamos las siguientes variables dummy:

=−=

=casadoestáisi

casadoestánoisiDD

casadoestánoisi

casadoestáisiD iii

,0

,1)11(2

,0

,11

Si por ejemplo la muestra de individuos que tenemos es de n=10, de los cuales cuatro de ellos

están casados, las variables dummy tendrían la siguiente estructura:

=

=

0

0

1

111

01

10

2

1

1

0

000

10

01

1 DD

De cara a estudiar los efectos del estado civil sobre el ahorro podemos estar interesados en saber

si los casados parten de un nivel de ahorro diferente de los solteros, o bien si las diferencias entre

solteros y casados derivan en que unos y otros tienen una diferente propensión marginal a ahorrar.

En el primer caso se trata de conocer si β0 es diferente entre los dos grupos de individuos, y en el

segundo, si lo es β1.

El planteamiento del problema para observar las diferencias de cada grupo respecto a β0 se puede

realizar a través de las siguientes especificaciones del modelo ANCOVA:

Yi=β0+α1D1i+β1Xi+ei (5.1)

Yi=β0+α2D2i+β1Xi+ei (5.2)

Yi=α1D1i+α2D2i +β1Xi+ei (5.3)

En este caso:

− Si se utiliza la especificación del modelo (5.1), el término independiente de los casados vendrá

dado por la suma (β0+α1), y para los solteros por β0. Si queremos analizar la igualdad en el

nivel de ahorro de ambos grupos, habría que contrastar la hipótesis nula H0: α1=0

− Si se utiliza la especificación del modelo (5.2), el término independiente de los solteros vendrá

dado por la suma (β0+α2), y para los casados por β0. Si queremos analizar la igualdad en el

nivel de ahorro de ambos grupos, habría que contrastar la hipótesis nula H0: α2=0

− Si se utiliza la especificación del modelo (5.3) el término independiente de los casados vendrá

dado por el coeficiente α1, y para los solteros por α2. Si queremos analizar la igualdad en el

nivel de ahorro de ambos grupos, habría que contrastar la hipótesis nula H0: α1=α2

Las tres especificaciones son equivalentes, y hay que tener presente que en la especificación del

modelo (5.3) se prescinde del término constante ya que de no hacerlo así tendríamos un problema

de multicolinealidad exacta entre el término constante y las dos variables dummy.

Si planteamos el modelo (5.3) de la siguiente forma:

Yi = β0+α1D1i+α2D2i +β1Xi+ei

La matriz X quedaría:

=

10

9

8

7

6

5

4

3

2

1

011

011

101

101

101

101

011

101

101

011

X

X

X

X

X

X

X

X

X

X

X

En la que se aprecia que la suma de las columnas 2 y 3 da como resultado la primera columna, lo

que provoca que la matriz (X’X) sea no singular.

Para el análisis del comportamiento de cada grupo respecto a la pendiente, aquí propensión

marginal a ahorrar, podemos plantear las siguientes especificaciones del modelo ANCOVA:

Yi=β0+β1Xi+δ1(D1i Xi)+ei (5.4)

Yi=β0+β1Xi+δ2(D2i Xi)+ei (5.5)

Yi=β0+δ1(D1i Xi)+ + δ2(D2i Xi)+ei (5.6)

En este caso:

− Si se utiliza la especificación del modelo (5.4), la propensión marginal de los individuos

casados vendrá dado por la suma (β1+δ1), y la de los solteros por β1. Si queremos analizar la

igualdad en la propensión marginal del ahorro en ambos grupos, habría que contrastar la

hipótesis nula H0: δ1=0


solteros vendrá dado por la suma (β1+δ2), y la de los casados por β1. Si queremos analizar la

igualdad en la propensión marginal del ahorro en ambos grupos, habría que contrastar la

hipótesis nula H0: δ2=0.


casados vendrá dado por δ1, y la de los solteros por δ2. Si queremos analizar la igualdad en la

propensión marginal del ahorro en ambos grupos, habría que contrastar la hipótesis nula H0:

δ1=δ2

Si queremos incluir en modelo otra característica de los individuos como sería por ejemplo la

profesión y distinguimos entre tres profesiones: agricultores, asalariados y empresarios, habría

que crear tres nueva variables dummy:

=

=

=

empresarioesnoisi

empresarioesisiE

asalariadoesnoisi

asalariadoesisiE

agricultoresnoisi

agricultoresisiE

i

i

i

,0

,13

,0

,12

,0

,11

Si bien a la hora de especificar el modelo hay que evitar los problemas de multicolinealidad entre

todas las variables dummy incluidas y el término constante. Una forma de evitar los problemas es

no incluir alguna de las categorías en forma de variable dummy, y dejar que la constante recoja

el efecto de la categoría no incluida. Una especificación posible de un modelo ANCOVA sería

entonces:

Yi = β0+α1D1i+η1E1i+η2E2i +β1Xi+ei

Las variables cualitativas también pueden corresponder a hechos que concurren en un periodo de

tiempo y tener la forma de serie temporal. Este tipo de variables se utilizan para observar los

efectos que sobre el modelo provocan sucesos extraordinarios como son las huelgas, una

climatología adversa, cambios políticos e incluso cambios en la metodología estadística de

elaboración de los datos.

Supongamos que tenemos el siguiente modelo:

Yt=β0+β1Xt+et siendo t=1,….,T1, T1+1…T

En el periodo T1 sabemos de la existencia de un suceso extraordinario que afecta a la evolución

de la variable dependiente durante un periodo determinado de tiempo, y queremos lógicamente

saber el efecto que causa dicho suceso extraordinario sobre la ecuación a estimar.

Para ello definimos las siguientes variables dummy:

>≤

=−=

>≤

=1

1

1

1

1

0)11(2

0

11

Ttsi

TtsiDD

Ttsi

TtsiD ttt

La estructura de ambas variables sería la siguiente:

=

=

1

.

.1

0.

.0

2

0

.

.0

1.

.1

1 DD

D1 tienen tantos unos como observaciones hay hasta T1 y D2 tiene tantos unos como

observaciones hay entre T1 y T.

El análisis del efecto del suceso extraordinario sobre la regresión puede realizarse de forma

separada para cada periodo de 1 a T1 y T1 a T, o conjuntamente para todo el periodo, bien sobre

el termino constante β0 o sobre la pendiente β1.

Para el análisis de los efectos sobre el término constante tendremos que plantear los siguientes

modelos de regresión:

Yt=β0+α1D1t+β1Xt+et (5.7)

Yt=β0+α2D2t+β1Xt+et (5.8)

Yt=α1D1t+α2D2t +β1Xt+et (5.9)

En este caso:

− Si se utiliza la especificación del modelo (5.7) el análisis de la invariabilidad de β0

exige contrastar la hipótesis nula H0: α1=0


exige contrastar la hipótesis nula H0: α2=0


exige contrastar la hipótesis nula H0: α1=α2

Si queremos analizar el efecto del acontecimiento extraordinario sobre la pendiente del modelo,

plantearemos las siguientes ecuaciones de regresión:

Yt=β0+β1Xt+δ1(D1t Xt)+et (5.10)

Yt=β0+β1Xt+δ2(D2t Xt)+et (5.11)

Yt=β0+δ1(D1t Xt)+ + δ2(D2t Xt)+et (5.12)

En cuyo caso:

− Si se utiliza la especificación del modelo (5.10), el análisis de la invariabilidad de β1 exige

contrastar la hipótesis nula H0: δ1=0


contrastar la hipótesis nula H0: δ2=0


contrastar la hipótesis nula H0: δ1=δ2

Para tomar una decisión acerca de que modelo ANCOVA seleccionar entre las varias

especificaciones que utilizan variables cualitativas, hay utilizar el contraste de errores de

especificación descrito en el apartado 3.5.4.

Ejemplo 5.2.

En el siguiente ejemplo planteamos una regresión lineal entre el crecimiento del consumo de

energía eléctrica en España y el crecimiento real del PIB, para verificar si los años en donde las

temperaturas medias fueron mayores han tenido alguna incidencia en la evolución del consumo

de energía eléctrica. Para ello nos auxiliamos de variables cualitativas que califican los años como

calurosos o no. En concreto calificamos los ejercicios de 1998, 1993, 1996, 1997 y 2002 como

los más calurosos del periodo estudiado.

Los datos utilizados son los siguientes:

Crecimiento Consumo Energía Crecimiento PIB

1988 4.76% 4.83%

1989 5.41% 3.78%

1990 5.42% 2.54%

1991 3.63% 0.93%

1992 1.02% -1.03%

1993 0.71% 2.38%

1994 3.72% 2.76%

1995 3.86% 2.44%

1996 2.93% 4.03%

1997 3.93% 4.35%

1998 7.19% 4.22%

1999 7.52% 4.21%

2000 6.15% 2.84%

2001 5.97% 2.04%

2002 2.74% 2.43%

Fuente: INE.

Con los datos de la tabla, la estimación MCO entre el crecimiento del consumo de energía

eléctrica, tY , y el crecimiento del PIB en moneda constante, tX , sería la siguiente:

Yt=0.023+0.715Xt+et


Coeficientes Error típico Estadístico t Probabilidad Término constante 0.02291824 0.00993316 2.3072447 0.03814247 PIB 0.71496488 0.30995158 2.30669861 0.03818117

Como se puede apreciar en el cuadro anterior, los estadísticos de la regresión realizada no son

buenos: se obtiene un R2 muy bajo, aunque los parámetros son estadísticamente significativos con

un nivel de significación del 2.5%, ya que el valor teórico del estadístico t15-2 es 2.16.

La variable dummy que construimos para evaluar el efecto de un mayor calentamiento

atmosférico sería la siguiente:

≠=

=−=

≠=

=2002,1997,1996,1993,19881

2002,1997,1996,1993,19880)11(2

2002,1997,1996,1993,19880

2002,1997,1996,1993,198811

tsi

tsiDD

tsi

tsiD ttt

Las ecuaciones que vamos a estimar son las (5.2), (5.3), (5.4), (5.5), (5.6) y (5.7), y los resultados

que hemos obtenido figuran en la siguiente tabla; entre paréntesis se incluye el estadístico t

asociado a cada parámetro:

Ecuación β0 β1 α1 α2 δ1 δ2 F R2 Yt=β0+β1Xt+εt 0.0229 0.7150 5.3209 0.2358 (2.3072) (2.3067)

Yt=β0+α1D1t+β1Xt+εt 0.0229 1.0884 -0.0320 26.1668 0.7824 (4.3285) (6.1322) (-5.8008)

Yt=β0+α2D2t+β1Xt+εt -0.0091 1.0884 0.0320 26.1668 0.7824 (-1.1851) (6.1322) (5.8008)

Yt=α1D1t+α2D2t +β1Xt+εt 0.1775 -0.0091 0.0229 17.4445 0.6991 (6.1322) (-1.1851) (4.3285)

Yt=β0+β1Xt+δ1(D1t Xt)+εt 0.0192 1.1942 -0.8281 0.0056 0.7020 (3.0700) (5.4383) (-4.6197)

Yt=β0+β1Xt+δ2(D2t Xt)+εt 0.0192 0.3661 0.8281 17.4938 0.7020 (3.0700) (1.7624) (4.6197)

Yt=β0+δ1(D1tXt)+δ2(D2t Xt)+εt 0.0192 0.3661 1.1942 17.4938 0.7020 (3.0700) (1.7624) (5.4383)

Podemos apreciar que tanto el crecimiento del PIB, como las variables cualitativas resultaron

significativas al 95% en los modelos (5.7), (5.8), (5.10) y (5.11), por lo que se debe rechazar la

hipótesis de invariabilidad de β1, es decir, se rechaza que el aumento de la temperatura media

afecta a la relación entre tasas de crecimiento del consumo de electricidad y del PIB.

En el modelo (5.10), no es significativamente distinto de cero el parámetro α1

(texp=1.181<ttco=2.56), pero se puede contrastar la hipótesis de que H0: α1=α2. A la vista de los

resultados obtenidos, se debe rechazar dicha hipótesis, con un nivel de significación del 5%,

debiéndose admitir la variabilidad del coeficiente β1.

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% PIB 1.08840409 0.17749128 6.13215522 5.0818E-05 0.70168381 1.47512436 D1 -0.00906395 0.00764828 -1.18509733 0.25891813 -0.02572812 0.00760021 D2 0.0229447 0.00530081 4.32852867 0.00098125 0.01139523 0.03449416

Los modelos (5.10), (5.11) también ofrecen parámetros estadísticamente significativos, pero con

un R2 inferior, lo que apunta a que la variable cualitativa es mejor incluirla en la forma de la

variable dummy que recoge el modelo (5.8) y (5.9). No obstante, se puede rechazar la hipótesis

de la invariabilidad de β1 tanto contrastando la hipótesis nula H0: α1=0 en (5.11) ó H0: α2=0 en

(5.12), como H0: α1=α2 en (5.13).

En definitiva, a la hora de modelizar la relación entre el crecimiento de consumo de la electricidad

y el PIB en España, habría que elegir la modelización 5.2 o su alternativa 5.4. por ser las que

mejor ajuste proporcionan; esto implica que hay que asumir un consumo autónomo diferente en

los años climatológicamente buenos y otro en los malos. Asimismo, al ser la relación consumo

de energía/PIB superior a la unidad, consideraríamos la existencia de una elasticidad del consumo

de energía sobre el PIB cercana a la unidad, en el sentido de que aumentos porcentuales del PIB

originan aumentos porcentuales del consumo de energía en una proporción similar. De hecho se

puede construir un intervalo de confianza del 95% para dicha elasticidad comprendida entre los

valores 1.47 y 0.70.

5.2. EL EMPLEO DE VARIABLES CUALITATIVAS PARA EL

TRATAMIENTO DE LA ESTACIONALIDAD

En Economía se suele trabajar con datos anuales pero en muchos casos, y derivado del carácter

predictivo del modelo y de los objetivos que persigue su elaboración, se hace necesario trabajar

con series de datos diarias, mensuales o trimestrales; este tipo de series tienen oscilaciones que se

deben al carácter estacional de las mismas (consumos bajos en los meses de verano, consumos

turísticos altos en este periodo, disminución de las ventas en domingos y lunes, etc.)

La estacionalidad en las series de tiempo es un patrón de comportamiento regular de una serie a

lo largo de cada año que puede obedecer a factores tales como costumbres, días festivos

decretados, vacaciones de verano, Navidad y otros hechos similares que ocasionan incrementos

o disminuciones en las magnitudes de ciertas variables, como por ejemplo la producción, las

ventas, etc.

Las variables dummy cualitativas pueden utilizarse también para recoger el efecto de la

estacionalidad en el modelo econométrico que estimamos.

La variable dummy cualitativa para ajuste estacional es una variable artificial que asumen valores

discretos, generalmente de 0 y 1, que se asigna a cada periodo de generación o referencia de las

series del modelo. Si se trabaja con datos trimestrales, hay que utilizar, en principio, una variable

dummy para cada trimestre; su representación sería:

=

=

=

=

trimestrecuartoelesnotsi

trimestrecuartoelestsiQ

trimestretercerelesnotsi

trimestretercerelestsiQ

trimestresegundoelesnotsi

trimestresegundoelestsiQ

trimestreprimerelesnotsi

trimestreprimerelestsiQ

t

t

t

t

,0

,14

,0

,13

,0

,12

,0

,11

La inclusión de los coeficientes de estas variables y de la constante en un modelo de regresión

simple produciría una matriz bianual X de la siguiente forma:

=

.1....

11000

10100

10010

10001

11000

10100

10010

10001

8

7

6

5

4

3

2

1

x

x

x

x

x

x

x

x

X

Que lleva asociada una matriz (X’X) singular (no invertible) por la existencia una combinación

lineal entre las dummy trimestrales y el parámetro constante, lo que impide estimar los

coeficientes del modelo de regresión.

Para evitar este inconveniente se utilizan únicamente tres de las cuatro variables dummy y la

constante. Así, si se excluye la variable Q4 en la matriz X; el efecto estadístico de la variable

omitida estaría implícitamente recogido con la columna de la constante. En definitiva, la matriz

de variables exógenas estaría determinada por las tres dummy: Q1, Q2, Q3 y la constante, y las

variables exógenas cuantitativas con lo cual la matriz (X’X) quedaría:

=

.1...

1000

1100

1010

1001

1000

1100

1010

1001

8

7

6

5

4

3

2

1

x

x

x

x

x

x

x

x

X

La forma funcional del modelo sería entonces:

Yt = β0+α1Q1t+α2Q2t +α3Q3t +β1Xt+et (5.13)

Otra forma muy utilizada para tratar la estacionalidad con variables cualitativas, consiste en

expresar las variables artificiales estacionales como desviaciones con respecto a la que

corresponde al cuarto trimestre. Estas nuevas variables, que podrían denominarse S1, S2 y S3,

corresponderían a las siguientes diferencias vectoriales:

S1 = Q1 – Q4

S2 = Q2 – Q4

S3 = Q3 – Q4

Una vez efectuadas las operaciones anteriores e incorporado el vector de la constante, la nueva

matriz X queda definida de la siguiente manera:

−−−

−−−=

.1...

1111

1100

1010

1001

1111

1100

1010

1001

8

7

6

5

4

3

2

1

x

x

x

x

x

x

x

x

X

Como se observa en la matriz anterior, los vectores de las variables dummy estacionales han sido

definidos de forma tal que su suma sea cero en cada año, por lo que este sistema permite que el

efecto estacional se anule en el año y que se obvie el problema de singularidad de la matriz.

En la estimación realizada con las tres variables dummy trimestrales S1, S2 y S3, los coeficientes

de las tres variables dummy identifican las diferencias con respecto al cuarto trimestre.

Yt = β0+α1S1t+α2S2t +α3S3t +β1Xt+et (5.14)

Es importante mencionar que en el caso de variables con periodicidad mensual, se utilizarían

únicamente once variables estacionales, en forma equivalente a lo explicado en esta sección para

las series de periodicidad trimestral. Sin embargo, hay que tener presente a la hora de incluir

variables dummy estacionales mensuales, la perdida de grados de libertad que conlleva el tener

que estimar tantos coeficientes, por lo que se requiere gran cantidad de observaciones para que

los test estadísticos ofrezcan resultados válidos.

También hay que tener en cuenta que el uso de las variables estacionales presenta problemas

cuando la estacionalidad de la serie Yt es móvil, es decir, cuando varía de año en año. En este

caso, es difícil que modelos de este tipo capturen de una forma adecuada la estacionalidad de la

variable dependiente.

Ejemplo 5.2.

Se disponen de datos trimestrales correspondientes a los ejercicios 1996-2003, relativos al

consumo de electricidad en GWh en España (Yt) y al PIB a precios de mercado en millones de

euros constantes de 1995.

Año Q Demanda de Electricidad (GWh) PIB (millones de euros) 1996 1 40919 109275

2 37275 111875 3 38070 111211 4 39981 116096

1997 1 40246 113396 2 39070 115566 3 40464 115744 4 42602 121807

1998 1 43263 118399 2 41535 120735 3 43273 121472 4 45010 126179

1999 1 46551 122424 2 43735 126471 3 45908 126474 4 48160 131977

2000 1 49922 129443 2 46861 133021 3 48208 130743 4 50020 135507

2001 1 52029 134079 2 49314 135900 3 50887 134475 4 53405 139292

2002 1 53928 136892 2 51523 138746 3 51950 137060 4 53762 142154

2003 1 57156 140080 2 53231 141861 3 56516 140207 4 56990 146163

Fuente: Ministerio de Economía

En la figura 5.1 se aprecia el carácter estacional de la demanda de energía eléctrica:

Figura. 5.1. Consumo Trimestral de Electricidad

Los trimestres de mayor consumo son los terceros y cuartos (otoño e invierno) y los de menor, el

segundo y tercero (primavera y verano).

Para estimar la relación entre demanda de electricidad y PIB en España vamos a plantear tanto la

especificación del modelo (5.13) y la del modelo (5.14).

La ecuación estimada con la especificación (5.13) es:

Yt = -24,705.2+3,087.2Q1t-996.1Q2t +1,066.2Q3t +0.55Xt+et

con los siguientes resultados:

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.99084217 Coeficiente de determinación R2 0.98176821 R2 ajustado 0.97906721 Error típico 854.455831 Observaciones 32

Coeficientes Error típico Estadístico t

Término constante -24705.2227 1999.20037 -12.3575521 PIB 0.55474441 0.01492667 37.1646554 Q1 3087.18799 439.461556 7.024933 Q2 -996.097068 432.19015 -2.30476578 Q3 1066.19716 434.284718 2.45506488

Para considerar la hipótesis H0: βi=0, hay que tener presente que el valor teórico de la t-Student

correspondiente a una distribución con (32-5) grados de libertad es 1.69 para α=0.05/2 (95% de

confianza). Se comprueba, por tanto, que todos los coeficientes son significativamente distintos

de cero.

La ecuación estimada con la especificación (5.14) es:

Yt = -23,915.9+2,297.9S1t – 1,785.4S2t +276.9 S3t +0.55Xt+et

con los siguientes resultados:


Coeficientes Error típico Estadístico t Término constante -23915.9007 1920.63147 -12.4521029 PIB 0.55474441 0.01492667 37.1646554 S1 2297.86597 264.879299 8.67514365 S2 -1785.41909 261.649371 -6.82370869 S3 276.875139 262.136744 1.05622407

En este modelo hay que considerar la posibilidad de que la variable dummy S3 tenga un

coeficiente significativamente igual a cero, en cuyo caso cabría plantear el modelo con la siguiente

especificación:

Yt = β0+α1S1t+α2S2t +β1Xt+et

5.3. APLICACIONES DE LAS VARIABLES CUALITATIVAS A L A

REGRESIÓN POR TRAMOS. La regresión por tramos se utiliza para estimar funciones en donde la representación gráfica de

las variables observadas manifiesta un cambio de pendiente. La representación gráfica de la figura

5.2 es de dicho tipo. Se aprecia que la relación entre las variables sigue una determinada forma

lineal hasta un determinado valor de Xi (X*=15), y a partir de dicho valor la relación lineal cambia

de forma.

Figura. 5.2.

En la regresión lineal por tramos se tiene por tanto dos partes o segmentos a los que corresponde

una determinada forma lineal de la función a estimar, y un valor umbral (X*) que es para el que

la representación manifiesta el cambio de pendiente.

La forma de estimar este tipo de relaciones es utilizar una variable dummy cualitativa que toma

los siguientes valores:

D=1 si Xi>X*

D=0 si Xi<X*

Y plantear la siguiente regresión:

Yi = β0 + β1Xi + β2(Xi-Xi*)D i + εi

La pendiente del primer tramo o segmento de la relación sería β1, y β1 + β2 sería la pendiente del

segundo tramo o segmento. La significación estadística del coeficiente β2 (H0: β2=0 ) serviría

como contraste de la existencia de tramos en la relación lineal estudiada.

5.4. EL MODELO PROBABILÍSTICO LINEAL

El modelo de probabilidad lineal se caracteriza por tener la variable endógena Y dicotómica o

binaria, es decir toma el valor Y=1 si un determinado suceso ocurre y el valor Y=0 en caso

contrario. Estos modelos están muy extendidos en el análisis estadístico pero encuentran una

difícil aplicación en Economía debido a las dificultades de interpretación económica de los

resultados que ofrecen este tipo de investigaciones. A este respecto, hay que considerar que estos

modelos lo que realmente investigan es la probabilidad de que se dé una opción (valores Y=1) o

no se dé (Y=0).

A pesar del carácter dicotómico de la variable endógena, el modelo de probabilidad lineal se

especifica de la forma habitual, teniendo presente que las variables exógenas no son dicotómicas

sino continuas:

Yi=β0+β1Xi+ei siendo i=1,……N (5.15)

De acuerdo con la expresión (5.15), el hecho de que la variable endógena tome valores discretos

(1 ó 0), el término de perturbación ei, puede tomar también dos valores únicamente:

− Si Yi=0 ⇒ ei = -β0- β1Xi con probabilidad p.

− Si Yi=1 ⇒ ei = 1-β0- β1Xi con probabilidad (1-p).

Dado que la esperanza del término de error ha de ser nula E(ei)=0, entonces se demuestra que p=

1-β0-β1Xi y (1-p) = β0+β1Xi, lo que permite evaluar la probabilidad de que la variable endógena

tome el valor correspondiente:

− Prob (Yi=0) = Prob (ei = -β0 - β1Xi ) = p = 1-β0- β1Xi.

− Prob (Yi=1) = Prob (ei = 1-β0 - β1Xi ) = (1-p) = β0+ β1Xi .

A su vez la varianza del término de perturbación, se calcularía a partir de p:

)1())(1()( 1010 ppXXeVar iii −=+−−= ⋅ββββ

Una problemática inherente a los estimadores MCO de estos modelos, son los siguientes:

− La perturbación aleatoria (ei) no sigue una distribución Normal. Es sencillo observar este

hecho ya que el carácter binario (1 ó 0) de la variable endógena afecta a la distribución

de la perturbación, teniendo ésta una distribución Binomial7. Este problema se atenúa

cuando se utilizan tamaños de muestra (N) grandes en donde la distribución Binomial es

susceptible de aproximarse a una Normal.

− La perturbación aleatoria no tiene una varianza constante (es heteroscedástica), lo cual

supone una falta de eficiencia. Para solucionarlo habría que realizar transformaciones

que nos diesen una perturbación homocedástica; esta transformación consiste en

multiplicar todas las variables por una cierta cantidad que elimine el problema de la

heteroscedasticidad. Dicha cantidad es:

)1)((

1

1010 ii XX ββββ))))

−−+

siendo oβ y 1β los estimaciones MCO del modelo.

− No obstante, el mayor problema que plantean estos modelos es que las predicciones

realizadas sobre la variable endógena no siempre se encuentran en el intervalo [0,1], ya

que pueden ser mayores que cero y menores que uno. Este problema tiene dos soluciones,

una es tomar como valor cero todas las estimaciones de la variable endógena con valores

negativos, y uno cuando estas resulten mayores que uno; la segunda, solución es utilizar

funciones de distribución que estén acotadas entre cero y uno como son la Logística y la

Normal; de éstas se derivan los modelos Logit y Probit que pasamos a ver a continuación.

7

La distribución binomial se basa en una prueba conocida como experimento de Bernouilli o problema de las pruebas repetidas, que consiste en averiguar la probabilidad de que en “n” extracciones o pruebas se hayan conseguido X valores de 1 y/o (n-X) valores de 0.

5.5. EL MODELO LOGIT

El problema que presentan los modelos probabilísticos lineales en cuanto a la existencia de

predicciones establecidas fuera rango (negativas o mayores que uno), es debido a que utilizan una

función de probabilidad que depende linealmente de las variables explicativas (X), que se

resolverían acotando dicha distribución de probabilidad. El modelo Logit en concreto utiliza, para

ello, la función de distribución logística:

Figura 5.3. Curva Logística

Debido a que la función de distribución logística no tiene forma lineal, el modelo Logit se estima

de forma diferente, así en vez de minimizar las sumas de las diferencias al cuadrado entre los

valores observados y los estimados por el modelo, el carácter no lineal de los modelos Logit

requiere la utilización del método de Máxima Verosimilitud para ser estimado, maximizando la

verosimilitud de que un suceso tenga lugar, aunque se podría estimar por MCO mediante una

transformación logarítmica de los datos (Gujarati, 1997).

La probabilidad de que Yi=0 (p) se define ahora mediante la siguiente expresión:

)1(

1ze

p −+=

donde Z = β0 + β1X1 + β2X2 +… + βkXk, siendo β i son los coeficientes a estimar y Xi es el vector

de variables independientes

La probabilidad de que Yi=1 (1-p) sería:

)1(

1)1(

zep

+=−

En consecuencia, la razón entre ambas será igual a:

zz

z

ee

e

p

p =++=

− − )1(

)1(

)1(

Tomando el logaritmo natural de la expresión anterior se obtiene

iz

i

ii Xe

p

pL 10)ln(

)1(ln ββ +==

−=

(5.16)

Donde Li es el denominado Logit.

Los coeficientes β indican el cambio en el Logit causado por el cambio en una unidad en el valor

de Xi, mientras que los eβ definen el cambio en la razón de probabilidades

− )1( pp

causado

por el cambio en una unidad en el valor de Xi. Si β es positivo, eβ será mayor que 1, es decir,

− )1( pp

se incrementará; si β es negativo, eβ será menor que 1, es decir,

− )1( pp

disminuirá. Adicionalmente, puede demostrarse que el cambio en la probabilidad (p) causado por

el cambio en una unidad en el valor de Xi es β

− )1( pp

, es decir, depende no sólo del

coeficienteβ, sino también del nivel de probabilidad a partir del cual se mide el cambio.

A la hora de estimar un modelo Logit, hay que tener presente que para estimar el modelo además

de los valores Xi, se necesitan los valores del Logit (Li). Por otro lado, hay que tener presente que

la estimación de los coeficientes de modelo (5.16) se realiza utilizando el método de Máxima

Verosimilitud, es decir, eligiendo como estimadores de los coeficientes β a aquellos que

maximizan la función de verosimilitud, construida sobre la base de )1(

1ze

p −+= . Pero si

tenemos la posibilidad de agrupar los datos individuales, entonces podría estimarse el modelo por

MCO.

Ejemplo 5.3.

Supongamos, que estamos investigando la posibilidad de la relación que se da a nivel individual

entre disponer vivienda propia (p=1) o no poseer vivienda propia (p=0). Si disponemos de la

información agrupada que aparece en la siguiente tabla sobre la población que investigamos:

Ingreso (miles de $) Numero de familias Número de familias con vivienda propia 6 40 8 8 50 12 10 60 18 13 80 28 15 100 45 20 70 36 25 65 39 30 50 33 35 40 30 40 25 20

Fuente: Gujarati (1997)

Si se conoce la probabilidad de tener o no tener casa a partir de:

i

ii N

np =ˆ

donde ni es el número de sujetos que para cada nivel i de la variable X (en el ejemplo, cada nivel

de ingreso) que cumplen la condición (tener vivienda), y Ni es el número total de sujetos en cada

categoría.

Se puede estimar

− )ˆ1(

ˆln

i

i

p

p y resolver la estimación del Logit (5.16) por MCO. Una vez

estimados los parámetros iβ , tendremos una estimación del logaritmo de la razón de

probabilidades; es decir:

iz

i

ii Xe

p

pL 10

ˆˆ)ln()ˆ1(

ˆlnˆ ββ +==

−=

Y aplicando antilogaritmos, tenemos que:

)ˆ1(

ˆ

i

iz

p

pe

−=

lo que permite dar una solución a la posibilidad de determinar la probabilidad de disponer de

vivienda para un individuo dado su nivel de ingresos.

Sin embargo, dado que en la estimación MCO del modelo Logit se pueden presentar problemas

de heteroscedasticidad, Gujarati (1997) propone realizar los siguientes pasos para resolver el

Logit:

1. Para cada nivel de ingreso (Xi), se calcula la probabilidad pi de disponer casa.

2. Para cada Xi se obtiene el Logit mediante:

−=

)ˆ1(

ˆlnˆ

i

ii p

pL

3. Realizar la siguiente transformación:

iiiiioii wXwBwBLw ε++= 1

que se escribe como:

iiioi vXBwBL ++= *1

* (5.17)

donde las ponderaciones )ˆ1(ˆ iiii ppNw −=

4. Estimar (5.17) mediante MCO.

5. Establecer intervalos de confianza y/o pruebas de hipótesis en el marco usual de

MCO, teniendo presente que las conclusiones serán válidas únicamente si se dispone

de una muestra grande de datos.

Utilizando las cifras de la tabla anterior, realizamos las siguientes transformaciones:

Ni ni

i

ii N

np =ˆ

)ˆ1(

ˆ

i

i

p

p

−

− )ˆ1(

ˆln

i

i

p

p

wi iw

L* X*

40 8 0.20 0.25 -1.39 6.40 2.53 -3.51 15.18 50 12 0.24 0.32 -1.15 9.12 3.02 -3.48 24.16 60 18 0.30 0.43 -0.85 12.60 3.55 -3.01 35.50 80 28 0.35 0.54 -0.62 18.20 4.27 -2.64 55.46 100 45 0.45 0.82 -0.20 24.75 4.97 -1.00 74.62 70 36 0.51 1.06 0.06 17.49 4.18 0.24 83.63 65 39 0.60 1.50 0.41 15.60 3.95 1.60 98.74 50 33 0.66 1.94 0.66 11.22 3.35 2.22 100.49 40 30 0.75 3.00 1.10 7.50 2.74 3.01 95.85 25 20 0.80 4.00 1.39 4.00 2.00 2.77 80.00

Los resultados de la estimación son:


Coeficientes Error típico Estadístico t *iX 0.07866857 0.0054475 14.4412221

iw -1.59323779 0.11149444 -14.2898405

Con ello se puede calcular la probabilidad de poseer una casa dado una determinada cifra de

ingreso. Supóngase que dicha cifra de ingreso es de veinte mil dólares (X=20); entonces:

L*i / (X=20)= –1.59+0.078⋅ 20=-0.0199

Por tanto,

−=−

)ˆ1(

ˆln019.0

i

i

p

p, lo que implica que 9803.0

)ˆ1(

ˆ=

− i

i

p

p, de donde se obtiene

que pi=0.495, es decir que la probabilidad de que un individuo con ingreso de veinte mil dólares

es del 49.5%.

En R se ejecutaría el siguiente programa:

> datos <- read.table(file="libro1.txt",header=T) > datos Ingreso Familias Viv_propia 1 6 40 8 2 8 50 12 3 10 60 18 4 13 80 28 5 15 100 45 6 20 70 36 7 25 65 39 8 30 50 33 9 35 40 30 10 40 25 20 > prob <- datos$Viv_propia/datos$Familias > logit <- glm(prob ~ datos$Ingreso, family = "binomial") Warning message: In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! > summary(logit) Call: glm(formula = prob ~ datos$Ingreso, family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -0.090397 -0.047938 -0.007619 0.025761 0.125358 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.63921 1.47043 -1.115 0.265 datos$Ingreso 0.07901 0.06592 1.199 0.231 (Dispersion parameter for binomial family taken to be 1) Null deviance: 1.720664 on 9 degrees of freedom Residual deviance: 0.036394 on 8 degrees of freedom AIC: 11.995 Number of Fisher Scoring iterations: 4 Para obtener los valores estimados: > fitted.prob <- plogis(predict(logit, type = "link")) > fitted.prob 1 2 3 4 5 6 0.2377336 0.2675433 0.2996216 0.3515880 0.3883997 0.4852574 7 8 9 10 0.5832354 0.6750522 0.7551336 0.8207208

5.6. EL MODELO PROBIT

Mientras que el modelo Logit utiliza la función de distribución logística para acotar la distribución

de probabilidad en el modelo de probabilidad lineal, el modelo Probit utiliza la función de

distribución Normal.

Figura 5.4. Función de densidad (izq.) y de distribución (dcha.) de una Normal (0,1)

Las funciones de distribución normal y logística son muy semejantes: la diferencia principal es

que la función de distribución normal se acerca más rápidamente a los ejes que la logística (figura

5.5).

Figura. 5.5.

Para entender la filosofía del modelo Probit, vamos a suponer que existe una variable desconocida

s que cumple lo siguiente:

Si I i=β0+β1Xi ≥ s entonces Yi=1

Si I i=β0+β1Xi <s entonces Yi=0 (5.18)

Dado el supuesto de normalidad en un suceso, la probabilidad de que este sea menor o igual al

valor (s), se calcula a partir de la función de distribución acumulada de una distribución Normal

estandarizada, esto es, con esperanza cero y desviación típica uno.

∫+

∞−

−=≤+=== io X dtt

ii esXprYprp1 2

102

1)()1(

ββ

πββ (5.19)

Lo anterior equivale a que la relación entre la endógena y las explicativas venga dada por la

siguiente expresión:

∫+

∞−

+−=++Ψ= io i

X udtt

iii euXy1 2

102

1)(

ββ

πββ (5.20)

Donde:

− Ψ(β0+β1Xi) es la función de distribución normal

− ui es el término de perturbación que se distribuye como una normal N(0,σ2).

Dado que (5.20) es una relación no lineal en los parámetros no puede estimarse por MCO. No

obstante, hay una forma sencilla de asignar valores a las probabilidades que aparecen en la

expresión (5.19). Esta forma consiste en obtener información acerca de I i y de los parámetros β a

partir de la inversa de (5.19):

I i=F -1(I i)=F -1(pi)= β0+β1Xi

donde F-1 es la inversa de la función de distribución Normal.

Utilizando los datos agrupados del ejemplo anterior, los valores I i son obtenidos utilizando las

tablas de la función de distribución Normal estándar que aparecen en el Anexo II, tabla II.1. Por

ejemplo, tomando los datos del Ejemplo 5.3. tendríamos que:

i

ii N

np =ˆ

I i

0.20 -0.84 0.24 -0.71 0.30 -0.52 0.35 -0.39 0.45 -0.13 0.51 0.04 0.60 0.25 0.66 0.41 0.75 0.67 0.80 0.84

Donde I i es negativa siempre que pi<0.5; en la práctica se agrega el número 5 a I i y a su resultado

se le denomina Probit. Es decir, Probit=5+I i

Ahora, para estimar los parámetros β se regresa:

I i= β0+β1Xi + ui

El término de la perturbación es no obstante heteroscedástico. Gujarati (1999) sugiere que se

realice la transformación comentada en el caso del modelo Logit, para que el modelo

transformado sea homocedástico.

Ejemplo 5.3 (cont.)

Los resultados de la regresión anterior, realizados sin considerar la transformación que propone

Gujarati y utilizando como regresor los I i que acabamos de calcular, son los siguientes:


Coeficientes Error típico Término constante

-1.01557838 0.05805496

Xi 0.0484664 0.00251134

Según dichos resultados, una familia con un ingreso medio de 20000$, obtendría el siguiente valor

probit:

I i / (X=20)= –1.018+0.048*20= –-0.0556

Por tanto, la probabilidad que corresponde a dicho valor en la función de distribución Normal

sería de un 47.78% de disponer de vivienda propia.

La estimación en R del modelo probit, se programa:

> probit <- glm(prob ~ datos$Ingreso, family = binomial(link="probit")) Warning message: In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! > summary(probit) Call: glm(formula = prob ~ datos$Ingreso, family = binomial(link = "probit")) Deviance Residuals: Min 1Q Median 3Q Max -0.087368 -0.051317 -0.006763 0.030342 0.124273 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.00836 0.87615 -1.151 0.250 datos$Ingreso 0.04842 0.03876 1.249 0.212 (Dispersion parameter for binomial family taken to be 1) Null deviance: 1.7207 on 9 degrees of freedom Residual deviance: 0.0366 on 8 degrees of freedom AIC: 12.02 Number of Fisher Scoring iterations:

5.7. PROBLEMAS

5.1. Disponemos de una base de datos con los siguientes datos de un grupo de personas: Sexo,

Estado Civil, Años de Experiencia Laboral, Salario por hora, Edad, Sector en el que trabaja

(agricultura, industria, construcción y servicios) y Categoría Profesional (directivo,

comercial, administrativo, técnico, oficial, auxiliar). Elabore un modelo uniecuacional

explicativo del salario que obtiene cada persona.

5.2. .

Disponemos de un conjunto de datos sobre las ventas de diferentes empresas ( )iY , sus gastos de

publicidad( )iX y un indicativo de su tamaño( )iT , que consiste en una variable binaria que toma

valor 1 para las pequeñas y medianas empresas y 0 para las grandes.

a) Se quiere contrastar si el efecto de la publicidad sobre las pequeñas y medianas empresas

es igual al de las grandes. Establezca una esfecificación del modelo y el contraste de

hipótesis que considere más adecuado.

b) Utilizando dicha especificación, como se determinaría el efecto de la publicidad sobre las

ventas de las pequeñas empresas y como se determinaría el efecto sobre las grandes.


Y X 26 1 41 1.5 63 2 78 2.5 100 3 184 6 208 8 242 10 273 11 291 14

a) Realice la representación gráfica de los datos.

b) ¿Considera que el modelo se ajusta a un modelo de regresión por tramos?

c) En caso afirmativo, estime el modelo.

5.4. Utilizando datos de una encuesta realizada entre en 1974/1975 en donde se pregunta sobre estar de acuerdo ó en desacuerdo con la afirmación de que las mujeres tienen que

dedicarse al cuidado del hogar y dejar el país en manos de los hombres, se ha realizado una regresión logistica entre el porcentaje de personas que se muestran de acuerdo con dicha información, el numero de años que han estudiado y su sexo. El conjunto de datos se obtiene en:

> install.packages("HSAUR") > data("womensrole", package="HSAUR") Se ha realizado el siguiente programa R:

> fm1 <- cbind(agree,disagree) ~ sex+education > glm_1 <- glm(fm1, data=womensrole, family = binomial()) > summary(glm_1) Call: glm(formula = fm1, family = binomial(), data = womensrole) Deviance Residuals: Min 1Q Median 3Q Max -2.72544 -0.86302 -0.06525 0.84340 3.13315 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.50937 0.18389 13.646 <2e-16 *** sexFemale -0.01145 0.08415 -0.136 0.892 education -0.27062 0.01541 -17.560 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 451.722 on 40 degrees of freedom Residual deviance: 64.007 on 38 degrees of freedom AIC: 208.07 Number of Fisher Scoring iterations: 4

a) Comente los resultados obtenidos.

b) Realice una regresión probit con estos datos

5.5. Considere el siguiente modelo probit estimado:

Pr( , ) ( 1.1 0.2 0.09 )i i i i iy S W S W= Ψ − + +

donde iy es una variable que toma valor 1 si el individuo i dispone de vehículo propio ,iS es

una variable que toma valor 1 si el individuo i es varon y 0 si es muje, yiW es el salario mensual

del individuo i en miles de euros.

a) Considere un hombre y una mujer que cobran 1500 euros al mes, calcular que

probabilidad tienen de disponer de vehículo propio.

b) Que diferencia de probabilidad tienen de disponer de vehículo propio un

hombre que cobra 1500 euros al mes y una mujer que cobra 2500.

SOLUCIONES

5.1. A realizar por el lector

5.2 a) Se estima el siguiente modelo ( )0 1 1i i i i iY X X T eβ β δ= + + + , y se contrasta la

hipótesis nula 0 1: 0H δ = b) El efecto de la publicidad sobre las ventas de las PYMES

vendría dado por 1 1( )β δ+ y la de las grandes por 1( )β

5.3 a) A realizar por el lector. b) Se estima el siguiente modelo de variables cualitativas para

la regresión por tramos DXXXY )(71,1791.1396.103 *−++= donde 6* =X ;

995.02 =R

5.4. A realizar por el lector

5.5. a) Hombre ( 0.765) 0.222Ψ − = , mujer ( 0.965) 0.167Ψ − =

b) ( 0.765) ( 0.875) 0.03Ψ − − Ψ − =

6. MODELOS CON DATOS DE PANEL

6.1. INTRODUCCIÓN

Un modelo de datos de panel es, según la definición más extendida, un modelo que utiliza

muestras recogidas a individuos a lo largo de instantes de tiempo. Los modelos de datos de panel

incluyen así información de una muestra de agentes económicos (individuos, empresas, bancos,

ciudades, países, etc.) durante un período determinado de tiempo, combinando, por tanto, la

dimensión temporal y estructural de los datos.

Los modelos de datos de panel se aplican a conjuntos o bases de datos de series de tiempo

agregadas para los mismos individuos; éstos conjuntos de datos suelen tener un número

relativamente grande de individuos y pocas observaciones en el tiempo, o por el contrario

podemos tener datos para un número grande de periodos pero para un número pequeño de

individuos. Un ejemplo de este tipo de bases de datos es el panel de hogares de la Unión Europea

(70.000 hogares en la UE), las encuestas de opiniones empresariales del Ministerio de Industria

(3.000 empresas), los índices Nielsen (5.000 hogares en España) para medir la audiencia

televisiva, etc. Estos conjuntos de datos que son conocidos como datos de panel o datos

longitudinales hay que diferenciarlos de las encuestas transversales que son repetidas en el tiempo

pero no a los mismos individuos (por ejemplo, la Encuesta de Población Activa)8.

El principal objetivo que se persigue al agrupar y estudiar los datos en panel es capturar la

heterogeneidad no observable entre los agentes económicos como entre periodos temporales.

Dado que esta heterogeneidad no se puede detectar exclusivamente con estudios de series

temporales, ni tampoco con estudios de corte transversal, hay que realizar un análisis más

dinámico incorporando a los estudios de corte transversal la dimensión temporal de los datos.

Esta modalidad de analizar la información es muy usual en estudios de naturaleza empresarial, ya

que los efectos individuales específicos de cada empresa y los efectos temporales del medio son

determinantes cuando se trabaja con este tipo de información.

8

En los paneles de datos a veces también hay que sustituir individuos por falta de respuesta, pero no es el caso de las encuestas transversales en donde la muestra se renueva de forma sistemática, de manera que a un periodo de tiempo determinado, por ejemplo un año, los hogares de la muestra sean diferentes a los del periodo anterior. La falta de respuesta en los datos de panel como en otro tipo de encuesta a la hora de los análisis estadísticos deben de depurarse, bien eliminando todos los datos del individuo con falta de respuesta o eliminando únicamente los individuos con falta de respuesta en cada variable analizada.

Los efectos individuales específicos se definen como aquellos que afectan de manera desigual a

cada uno de los agentes de estudio contenidos en la muestra (individuos, empresas, bancos). Estos

efectos son invariables en el tiempo y se supone que afectan de manera directa a las decisiones

que toman dichas unidades. Usualmente, se identifica este tipo de efectos con cuestiones de

capacidad empresarial, eficiencia operativa, el “saber-hacer” (Know-how), acceso a la tecnología,

etc.

Por su parte, los efectos temporales son aquellos que afectan por igual a todas las unidades

individuales del estudio y que, además, varían en el tiempo. Este tipo de efectos suele asociarse,

por ejemplo, a shocks macroeconómicos que afectan por igual a todas las empresas o unidades de

estudio (una subida de los tipos de interés, un incremento de los precios de la energía, un aumento

de la inflación, etc.), o a cambios en la regulación de mercados (ampliación de la Unión Europea,

reducción de tarifas arancelarias, aumento de la imposición indirecta, etc.).

6.2. ESPECIFICACIÓN GENERAL DE UN MODELO DE DATOS D E

PANEL

La especificación general de un modelo de regresión con datos de panel es la siguiente:

∑=

++=K

jit

jjititit eXY

1

βα

donde i = 1,......N se refiere al individuo o a la unidad de estudio (corte transversal), t = 1,...T a la

dimensión en el tiempo, Yit sería la variable a explicar correspondiente a cada unidad de estudio,

α es un escalar con N×T parámetros que recoge los efectos específicos del i-ésimo individuo en

cada momento del tiempo, β es un vector de K parámetros que se asocian a las j=1,….K variables

explicativas j

itX .

A partir del modelo general, y con base en ciertos supuestos y restricciones acerca del valor de

algunos de los parámetros, se derivan las diferentes variantes de modelos de datos de panel que

resumimos a continuación en la siguiente tabla.

MODELOS ALTERNATIVOS PARA COMBINAR DATOS DE SERIES DE TIEMPO Y DE CORTE TRANSVERSAL

TIPO DE MODELO EXPRESIÓN CARACTERÍSTICAS Modelo Lineal

∑=

++=K

jit

ji

jititit eXY

1

βα

Modelo Estático de Datos de Panel. ∑

=

++=K

jit

jjititit eXY

1

βα

Modelo Estático de Datos de Panel de una Vía (one-way) (A) ∑

=

++=K

jit

jjititit eXY

1

βα iit αα =

Modelo Estático de Efectos Fijos con variable dummy (los coeficientes constantes se estiman a partir de variables cualitativas) (B)

∑=

++=K

jit

jjitiit eXiY

1

βα i es un vector de variables

cualitativas y αi es un vector de coeficientes constantes.

Modelo Estático de Datos de Panel de Doble Vía (two-ways) (C)

∑=

++=K

jit

jjititit eXY

1

βα tiit λµαα ++=

Modelo de Regresiones Aparentemente No Relacionadas (SUR)9

∑=

++=K

jit

ji

jititit eXY

1

βα iit αα =

Modelo Dinámico de Datos de Panel ∑

=− +++=

K

jit

jjittiitit eXYY

11, βϑα tiit λµαα ++=

En un modelo de datos de panel, las variables explicativas pueden ser de tres tipos:

− Una variable por cada individuo, sin que exista referencia temporal en dicha variable:

las variables son las mismas para cada unidad de corte transversal y se refieren a

atributos del individuo o agente, por ejemplo, el tipo de empresa, su tamaño, la forma

gerencial; el sexo de un trabajador, el nivel de formación, la profesión y otras

características sociales de los individuos.

− Una variable por periodo, pero sin que existan diferencias en el valor que toma la

variable en cada individuo: las variables toman distintos valores en cada periodo

temporal pero no varían entre los individuos. Como ejemplo de este tipo de variables

cabe citar a la tasa de inflación, los tipos de interés, etc.

− Una variable que cambia en el tiempo y por individuo: se trata de variables que

cambian entre individuos en un momento del tiempo, y que además cambian a lo

largo del tiempo. Como ejemplo de estas variables se pueden mencionar los ingresos

9 Siglas de Seemingly Unrelated Regression

totales, el nivel de beneficios, el stock de capital o el nivel de endeudamiento, entre

otras.

Los modelos de datos de panel se interpretan a través de sus componentes de error. Considerando

la notación matricial abreviada de un modelo general de datos de panel:

ititit uXY += β' (6.1)

El término de error uit incluido en la ecuación (6.1), puede descomponerse de la siguiente manera:

ittiit eu ++= λµ (6.2)

donde µi representa los efectos no observables que difieren entre las unidades de estudio pero no

en el tiempo (capacidad empresarial, eficiencia de cada unidad, etc.…); λt identifica los efectos

no cuantificables que varían en el tiempo pero no entre las unidades de estudio; y eit se refiere al

término de error puramente aleatorio.

La mayoría de los análisis realizados con datos de panel utilizan el modelo de componente de

error conocido como one way para el cual λt =0 (modelo A). Las diferentes variantes para el modelo

one way de componentes de errores surgen de los distintos supuestos que se hacen acerca del

término µi, pudiéndose presentar tres posibilidades:

− El caso más sencillo es el que considera 0=iµ ; es decir, la no existencia de

heterogeneidad no observable entre los individuos o empresas.

− La segunda posibilidad consiste en suponer a iµ un efecto fijo y distinto para

cada individuo o empresa. En este caso, la heterogeneidad no observable se

incorpora a la constante del modelo (iα ).

− Finalmente, la tercera alternativa es tratar a iµ como una variable aleatoria no

observable que varía entre individuos/empresas pero no en el tiempo.

Bajo la primera especificación, los µit satisfacen todos los supuestos del modelo lineal general y,

por tanto, se emplea como método de estimación MCO, obteniendo estimadores lineales e

insesgados y con la ventaja de ganar grados de libertad.

Ahora bien, en los casos en que se rechaza el supuesto de homogeneidad en un sistema de datos

de panel, es decir, que existe heterogeneidad no observable ya sea a través del tiempo, entre

unidades de estudio (individuos) o en ambos sentidos, debe buscarse una especificación que la

capture de forma apropiada con el fin de evitar que los estimadores de los parámetros de las

variables explicativas estén sesgados.

6.3. VENTAJAS Y DESVENTAJAS DE LOS MODELOS DE DATOS

DE PANEL

Los modelos de datos de panel presentan una serie de ventajas y desventajas en comparación con

los modelos de series temporales y de corte transversal. Las más relevantes son las siguientes:

Ventajas

− La técnica permite al investigador económico disponer de un mayor número de

observaciones, incrementando los grados de libertad, reduciendo la multicolinealidad

entre las variables explicativas y, en última instancia, mejorando la eficiencia de las

estimaciones econométricas.

− Tal y como se mencionó anteriormente, la técnica permite capturar la heterogeneidad no

observable ya sea entre unidades individuales de estudio como en el tiempo. Con base en

lo anterior, la técnica de datos de panel permite aplicar una serie de contrastes para

confirmar o rechazar dicha heterogeneidad y determinar cómo capturarla.

− Los datos de panel suponen, e incorporan al análisis, el hecho de que los individuos o

agentes económicos (consumidores, empresas, regiones, países, etc.…) son heterogéneos.

Los análisis de series de tiempo y de corte transversal no incorporan esta heterogeneidad

corriendo así el riesgo de obtener resultados sesgados.

− Permiten estudiar mejor la dinámica de los procesos de ajuste, ya que a través de ellos se

pueden analizar los cambios en el tiempo de las distribuciones transversales.

− Permiten elaborar y probar modelos relativamente complejos de comportamiento en

comparación con los análisis de series temporales y de corte transversal. Un ejemplo claro

de este tipo de modelos es aquel que trata de medir niveles de eficiencia técnica por parte

de unidades económicas individuales.

− Finalmente, puesto que las unidades transversales de un panel de datos normalmente se

refieren a individuos, familias o empresas, se evitan los sesgos que aparecen cuando se

trabaja con variables agregadas.

Desventajas

− En términos generales, las desventajas asociadas a la técnica de datos de panel se

relacionan con los procesos para la obtención y el procesamiento de la información

estadística sobre las unidades individuales de estudio; es decir cuando ésta se obtiene por

medio de encuestas, entrevistas o utilizando algún otro medio de inferencia estadística de

los datos. Ejemplos de este tipo de limitaciones son los problemas de selección no

aleatoria de la muestra, de recogida de datos con inadecuadas tasas de cobertura de la

población, porcentajes de no respuesta, preguntas confusas, distorsión deliberada de las

respuestas, etc.

− Asimismo, una escasa dimensión temporal puede invalidar alguno de los elementos

teóricos de los modelos de datos de panel.

− Por ultimo, algunas investigaciones han demostrado que la utilización de modelos de

efectos fijos produce resultados significativamente diferentes al los modelos con efectos

aleatorios cuando se estima una ecuación usando una muestra de muchas unidades de

corte transversal con pocos periodos de tiempo (700 individuos con 5 periodos, por

ejemplo).

6.4. MODELO DE EFECTOS FIJOS

Como ya se mencionó, los modelos de datos de panel permiten contemplar la existencia de efectos

individuales específicos a cada unidad, invariables en el tiempo, que determinan la manera en que

cada unidad de corte transversal toma sus decisiones.

Estos modelos asumen que los efectos de las variables omitidas, ya sean específicas a cada

individuo y/o que cambian en el tiempo, no son importantes en forma individual, pero sí en

conjunto.

Por otro lado, dado que el efecto de las variables omitidas se supone constante en el tiempo para

cada individuo, o que no varía en todos los individuos en un determinado momento en el tiempo,

o una combinación de ambos, se pueden capturar en el término constante de un modelo de

regresión como un promedio que toma en cuenta explícitamente la heterogeneidad entre

individuos y/o en el tiempo contenida en los datos.

Según la forma de incorporar la heterogeneidad no observada, se pueden diferencian los modelos

de efectos fijos y modelos de efectos aleatorios. Los modelos de efectos fijos se conocen también

como modelos mínimos cuadráticos con variables ficticias.

Los modelos de datos de panel de efectos fijos tienen la siguiente expresión general:

∑=

++=K

jit

jjitiit eXY

1

βα

donde itY es la variable dependiente, ,itα es un escalar que recoge los efectos específicos del i–

ésimo individuo y se supone constante en el tiempo, y ,jitX es el vector de las k variables

explicativas y ,jβ de los K parámetros que recogen los efectos de las variables explicativas; eit

es el termino de error que se suponen aleatorios distribuidos con media cero y varianza constante

de valor 2eσ . El panel de datos corresponde a i = 1,2..., N unidades o individuos de corte

transversal, observados para los períodos t = 1,2..., T.

Por tanto, lo que se pretende resolver es un sistema de regresiones específicas con N ecuaciones

de corte transversal: itjj

itititii eXXXY +++++= βββα ...2211 y T observaciones.

Su notación matricial abreviada es:

ititiit eXY ++= βα '

Agrupando las observaciones temporales, para cada unidad transversal se llega al siguiente

modelo:

ititit eXiY ++= βα '

que en el supuesto de una única variable explicativa tendría la siguiente expresión:

+

+

=

NT

T

T

N

NT

T

T

N

N

NT

T

T

N

e

e

e

e

e

e

X

X

X

X

X

X

i

i

i

Y

Y

Y

Y

Y

Y

.

.

.

.

.

.

.

.

.

.

.

...00

......

0...0

0...0

.

.

.

.

.

2

1

1

21

11

2

1

1

21

11

2

1

2

1

1

21

11

β

α

αα

Con este modelo se considera que las variables explicativas afectan por igual a las unidades de

corte transversal y que éstas se diferencian por características propias de cada una de ellas,

medidas por medio de la intercepción en el origen. Es por ello que las N intercepciones se asocian

con variables dummy con coeficientes específicos para cada unidad, los cuales se deben estimar.

La estimación de iα y β se realiza por MCO, si bien hay que tener presente que este modelo

presenta una pérdida importante de grados de libertad. Un test útil en este tipo de modelos es

realizar la prueba F, para comprobar si αα =i para cualquier i. Por otro lado, cabe señalar que

cuando se quiera incluir un término constante hay que introducir únicamente N-1 variables

ficticias.

Otra manera de plantear este modelo es especificándolo en desviaciones respecto a la media, es

decir, restando a cada variable la media en el periodo para cada unidad i-esima. El estimador a

utilizar en este caso tiene la siguiente expresión:

( )( ) ( )( )

−−

−−= ∑∑∑∑= =

−

= =

''ˆ1 1

1

1 1iit

N

i

T

tiitiit

N

i

T

tiit YYXXXXXXβ (6.3)

donde ,i iY X son las medias muestrales del individuo i-ésimo.

El estimador de la varianza de β es:

( ) ( ) ( )1

2

1 1

ˆ ˆ 'N T

e it i it ii t

Var X X X Xβ σ−

= =

= − − ∑∑

donde 2ˆ eσ es la varianza residual, calculada como

2 'û

e e

NT N Kσ =

− − , donde e’e es la suma de

los residuos del modelo al cuadrado.

En general, el estimador de mínimos cuadrados ordinarios (MCO) es apropiado cuando los

residuos son incorrelados en el tiempo y homocedásticos en los cortes transversales.

Los efectos fijos se estiman en un segundo paso a través de la siguiente ecuación:

( )T

XYXY

T

titi

iii

∑=

−=−= 1

'

'

ˆˆˆ

ββα (6.4)

El modelo anterior puede extenderse al modelo de efectos fijos de doble vía, en el que aparecen

también los efectos no observables temporales, tal que:

itittiit eXY +++= βδα '

Expresión que equivale a introducir dos conjuntos de variables ficticias, unas individuales y otras

temporales; en este caso el estimador MCO tendría las mismas propiedades del modelo anterior.

El estimador a utilizar tendría la siguiente expresión:

( )( ) ( )( )

+−−+−−

+−−+−−= ∑∑∑∑= =

−

= =

''ˆ1 1

1

1 1

YYYYXXXXXXXXXXXX tiit

N

i

T

ttiittiit

N

i

T

ttiitβ

donde ,i iY X , son las medias muestrales del individuo i-ésimo, tt XY , las medias muestrales del

periodo t, y XY, las medias muestrales de las variables para todos los N individuos y T periodos.

Los efectos fijos se estiman en un segundo paso a través de las siguientes relaciones:

( ) ( ) βα ˆˆ 'XXYY iii −−−=

( ) ( ) βδ ˆˆ 'XXYY ttt −−−=

6.5. MODELO DE EFECTOS ALEATORIOS

A diferencia del modelo de efectos fijos, el modelo de efectos aleatorios considera que los efectos

individuales no son independientes entre sí, sino que están distribuidos aleatoriamente alrededor

de un valor dado. Una práctica común en el análisis de regresión es asumir que el gran número

de factores que afectan al valor de la variable dependiente pero que no han sido incluidas

explícitamente como variables independientes del modelo, puede resumirse apropiadamente en

la perturbación aleatoria.

Así, en este modelo se considera que tanto el impacto de las variables explicativas como las

características propias de cada unidad son diferentes.

El modelo de efectos aleatorios o modelo de componentes de la varianza asume que el término

itα es la suma de una constante común α , una variable aleatoria específica de corte transversal

e invariante en el tiempo iµ asociada a cada individuo e incorrelada con el residuo ite , y otro

asociado al tiempo λt, también incorrelacionado con el residuo ite .

En lugar de tratar iµ como una constante fija, esta especificación asume que ),0( 2µσµ Ni ≈

independiente e igualmente distribuida, e incorrelada con ite y itX .

A su vez el modelo también requiere que tλ está incorrelado en el tiempo tal que 0),( =stE λλ

, y además está incorrelada coniµ , ite y itX .

Si suponemos que 0=tλ , la especificación del modelo entonces se convierte en:

itiitj

j

i

jitit eXY +=+=∑

=

µεεβ it1

,

La estimación de este modelo exige de la utilización de Mínimos Cuadrados Generalizados pues

los residuos del modelo están correlacionados entre sí al estar iµ incluido tanto en itε como en

isε , para .st ≠

El estimador apropiado de este modelo expresado en desviaciones a la media es, por tanto:

( ) ( ) ( )( )

−−

−−+= ∑ ∑∑ ∑= =

−

= =

'1

'1ˆ

1 1

'

1

1 1

'iit

N

i

N

iiitiiiit

N

i

N

iiitiiMCG YXXXQYX

TXXXXQXX

Tψβ

donde:

22

2

µε

ε

σσσψ

T+=

'1

eeT

IQ T ⋅−=

Generalmente las varianzas2µσ (varianza entre grupos) y

2εσ no son conocidas y, por tanto, habrá

que estimar un valor para ψ . Para estimar dicho valor un camino sería utilizar las estimaciones

de las varianzas de los residuos obtenidas en la solución MCO del modelo.

6.6. ELECCIÓN DE MODELO DE EFECTOS O EFECTOS

ALEATORIOS

La decisión acerca de la estructura apropiada para el análisis, es decir, efectos fijos vs efectos

aleatorios, dependerá de los objetivos que se persigan.

Así, Hausman (1978) aconseja utiliza el modelo de efectos fijos para realizar inferencias sobre la

muestra utilizada, mientras que el de efectos aleatorios resulta más útil para realizar inferencias

sobre la población.

Adicionalmente, si el interés del estudio particular está puesto en los coeficientes de las pendientes

de los parámetros, y no tanto en las diferencias individuales, se deberá elegir un método que

relegue estas diferencias y trate la heterogeneidad no observable como aleatoria.

El contexto de los datos, es decir, cómo fueron obtenidos y el entorno de donde provienen,

determinan también la elección del modelo. Con el modelo de efectos fijos la heterogeneidad no

observable se incorpora en la ordenada al origen del modelo y con el de efectos aleatorios, como

ya se mencionó, se incorpora en el término de error, modificándose la varianza del modelo.

Asimismo, emplear un modelo de efectos fijos o aleatorios genera diferencias en las estimaciones

de los parámetros en los casos en que se cuenta con T pequeño y N grande. En estos casos debe

hacerse el uso más eficiente de la información para estimar esa parte de la relación de

comportamiento contenida en las variables que difieren sustancialmente de un individuo a otro.

En principio, el enfoque de efectos fijos es más atractivo, ya que no requiere realizar supuestos

paramétricos sobre la distribución condicional de la heterogeneidad inobservable. Sin embargo,

su desventaja es que solo puede utilizarse en ciertas distribuciones y requiere hacer supuestos

muy restrictivos sobre la distribución del término de error como lo son las hipótesis que exige el

método MCO.

A este respecto hay que tener presente que el modelo de efectos fijos asume la existencia de

diferencias entre unidades que se capturan en forma de movimientos de la curva de regresión.

(Fig. 6.1).

Figura 6.1.

El modelo de efectos fijos, si se estima utilizando variables dummy no identifica directamente la

causa de la variación en el tiempo y los individuos, e implica un alto coste informativo en términos

de grados de libertad. En cuyo caso deben realizarse algunas consideraciones con respecto a la

estructura de los datos, dado que si N es grande y T pequeño, podría darse el caso en que el

número de parámetros en el modelo de efectos fijos sea muy grande en relación con el número de

datos disponibles, lo que daría lugar a parámetros poco significativos y una estimación ineficiente.

Para elegir entre los estimadores del modelo fijo y aleatorio puede utilizarse el test de Hausman,

que compara directamente ambos estimadores. El contraste se basa en el hecho de que bajo la

hipótesis de que [ ] 0=iti XE α el estimador del modelo de efectos aleatorios ( )EAβ es

asintóticamente más eficiente que el estimador MCO del modelo de efectos fijos ( )EFβ ; sin

embargo, si [ ] 0≠iti XE α , el estimador MCO mantendrá la consistencia, mientras que el

estimador MCG será sesgado e inconsistente.

El estadístico propuesto por Hausman es:

[ ] qqVarqm ˆ)ˆ(ˆ 1' −=

donde EFEAq ββ ˆˆˆ −= , y la matriz diagonal )ˆ()ˆ()ˆ( EFEA VarVarqVar ββ −= . Bajo la hipótesis

nula [ ] 00 == iti XEH α el estadístico m se distribuye como una variable 2kχ .

Ejemplo 6.1.

A continuación vamos a realizar un ejemplo de estimación de un modelo de datos de panel, con

las series temporales de créditos y depósitos de las cajas de ahorro de Castilla y León por

provincias, el objetivo de la investigación es comprobar qué parte de los depósitos se queda en

Castilla y León en forma de créditos y verificar si hay diferencias en los comportamientos

provinciales. Los datos utilizados corresponden al periodo 1998-2003 y tienen periodicidad

trimestral.

En primer lugar, utilizamos un modelo de datos de panel fijo de la forma siguiente:

ititit uXiY ++= βα '

donde itY son los créditos que prestan las cajas de ahorro en las nueve provincias de la región

(N=9), y itX los depósitos de las cajas de ahorro en cada una de las nueve provincias de la región.

El número de observaciones temporales es T = 22.

Los datos de los créditos totales concedidos por las Cajas de Ahorro en las nueve provincias de

Castillla y León (millones de €) son:

Año Periodo Ávila Burgos León Palencia Salamanca Segovia Soria Valladolid Zamora 1998 I 587 1739 1844 488 1058 534 207 1459 392 1998 II 607 1846 1956 516 1130 562 212 1552 411 1998 III 623 1872 1953 531 1151 588 212 1593 423 1998 IV 642 1992 2037 545 1189 610 218 1685 439 1999 I 643 1991 2146 571 1097 627 225 1718 436 1999 II 710 2147 2301 620 1254 656 232 1818 476 1999 III 694 2171 2271 644 1182 660 235 1895 481 1999 IV 694 2360 2350 652 1247 682 242 1981 496 2000 I 685 2380 2514 670 1285 668 252 2061 507 2000 II 731 2524 2682 719 1468 688 259 2208 561 2000 III 753 2665 2765 737 1471 692 260 2308 559 2000 IV 783 2840 3043 771 1493 708 280 2443 582 2001 I 787 2882 3018 764 1534 704 287 2523 581 2001 II 850 3066 3095 789 1628 739 301 2658 605 2001 III 835 3166 2994 812 1609 743 310 2685 612 2001 IV 894 3360 3081 837 1664 776 332 2869 636 2002 I 902 3463 3056 849 1707 794 336 2969 644 2002 II 976 3719 3153 908 1821 842 348 3195 676 2002 III 1039 3826 3161 933 1835 854 357 3241 676 2002 IV 1076 4020 3262 945 1913 899 387 3331 690 2003 I 1139 4140 3472 984 1968 942 400 3434 702 2003 II 1193 4417 3688 1022 2069 979 421 3575 734

Los datos de los depósitos del sector privado en las Cajas de Ahorro en las nueve provincias de

Castillla y León (millones de €) son:

Año Periodo Ávila Burgos León Palencia Salamanca Segovia Soria Valladolid Zamora 1998 I 1175 3686 3220 817 1600 1052 593 1626 866 1998 II 1170 3675 3275 802 1596 1060 594 1609 850 1998 III 1218 3731 3279 793 1614 1091 596 1635 838 1998 IV 1232 3862 3438 826 1619 1104 595 1697 871 1999 I 1238 3918 3374 822 1594 1112 581 1751 858 1999 II 1272 3959 3527 838 1627 1143 582 1814 870 1999 III 1295 4082 3426 861 1680 1173 594 2024 888 1999 IV 1329 4217 3459 894 1735 1183 652 1986 942 2000 I 1349 4322 3469 933 1822 1195 642 2048 948 2000 II 1388 4392 3470 961 1921 1227 655 2126 968 2000 III 1431 4497 3854 995 1984 1250 677 2229 989 2000 IV 1465 4692 3965 1059 2029 1293 701 2323 1048 2001 I 1488 4817 3957 1075 2081 1385 724 2378 1056 2001 II 1541 5271 4133 1121 3794 1462 746 2467 1099 2001 III 1587 5322 4251 1145 4137 1489 763 2518 1121 2001 IV 1773 5496 4476 1187 4334 1522 797 2650 1177 2002 I 1768 5528 4910 1173 4722 1597 794 2631 1150 2002 II 1806 5637 5095 1210 4970 1548 817 2776 1175 2002 III 1822 5658 5088 1208 5020 1577 832 2787 1170 2002 IV 1906 5898 4920 1242 5131 1722 849 2929 1210 2003 I 1949 5913 5239 1230 5118 1653 842 2915 1189 2003 II 2001 6316 5488 1247 5126 1676 846 2974 1220

A efectos de estimar el modelo MCO utilizando variables dummy habría que presentar los datos

conforme a la siguiente tabla:

Año Trimestre Créditos (Y) Dummies (iα) Depósitos (X) Ávila Burgos León Palencia Salamanca Segovia Soria Valladolid Zamora

1998 1 587 1 0 0 0 0 0 0 0 0 1175 1998 1 1739 0 1 0 0 0 0 0 0 0 3686 1998 1 1844 0 0 1 0 0 0 0 0 0 3220 1998 1 488 0 0 0 1 0 0 0 0 0 817 1998 1 1058 0 0 0 0 1 0 0 0 0 1600 1998 1 534 0 0 0 0 0 1 0 0 0 1052 1998 1 207 0 0 0 0 0 0 1 0 0 593 1998 1 1459 0 0 0 0 0 0 0 1 0 1626 1998 1 392 0 0 0 0 0 0 0 0 1 866 1998 2 607 1 0 0 0 0 0 0 0 0 1170 1998 2 1846 0 1 0 0 0 0 0 0 0 3675 1998 2 1956 0 0 1 0 0 0 0 0 0 3275 1998 2 516 0 0 0 1 0 0 0 0 0 802 1998 2 1130 0 0 0 0 1 0 0 0 0 1596 1998 2 562 0 0 0 0 0 1 0 0 0 1060 1998 2 212 0 0 0 0 0 0 1 0 0 594 1998 2 1552 0 0 0 0 0 0 0 1 0 1609 1998 2 411 0 0 0 0 0 0 0 0 1 850

Aplicando MCO al modelo descrito se obtienen los siguientes resultados:


ANÁLISIS DE VARIANZA

Grados de libertad

Suma de cuadrados

Media cuadrados

F Valor crítico de F

Regresión 10 196740739 19674073.9 260.613465 4.338E-104 Residuos 188 14192382.1 75491.3944 Total 198 210933121

Coeficientes Error típico Estadístico t AV 82.5909183 74.062306 1.11515456 BU 543.61444 154.683995 3.51435479 LE 760.615561 135.247529 5.62387768 PA 248.928645 66.1017603 3.76583988 SA 58.0469567 106.602347 0.54451856 SG 77.3436176 71.092936 1.08792268 SO -52.4921486 62.268669 -0.84299455 VA 1323.60383 89.8271126 14.7350148 ZA 66.2517949 66.1422793 1.00165576 Β 0.48266722 0.03002785 16.0739855

Se puede apreciar que tanto el estadístico F, como la distribución asociada a los estimadores de

los coeficientes iα descarta la hipótesis de igualdad de dichos coeficientes (el valor teórico del

estadístico F en las tablas es 1.88), lo que hace significativa con un nivel de confianza del 95% la

existencia de heterogeneidad en el comportamiento de cada provincia.

Si utilizamos el modelo (6.2) y el procedimiento descrito para obtener el estimador (6.3) y los

coeficientes (6.4), obtendríamos los siguientes resultados en la estimación MCO.

( )( )

( )( )48266722.0

18.832723809

5.404107385ˆ

1 1

1 1 ==

−−

−−=

∑∑

∑∑

= =

= =N

i

T

tiitiit

N

i

T

tiitiit

MCO

XXXX

YYXX

β

El coeficiente αi correspondiente a Ávila se obtiene como:

( ) ( )59.82

22

4827.0811.05ˆ

ˆ

22

11 =−

=−

=∑∑

== tit

T

titi

i

X

T

XY βα

Análogamente, el resto de términos constantes es:

Burgos 543.61444 León 760.615561 Palencia 248.928645 Salamanca 58.0469567 Segovia 77.3436176 Soria -52.4921486 Valladolid 1323.60383 Zamora 66.2517949

Ejemplo 6.2.

La librería “plm” ofrece recursos en R para estimar modelos data panel.

> install.packages("plm") En esta librería tenemos un conjunto de datos panel relativos a 10 empresas para las que

disponemos de los siguientes cifras: año, invesión bruta, valor de la empresa y capital. El

conjunto de datos es para el periodo de 1935 a 1954.

> data("Grunfeld", package="plm") > str(Grunfeld) 'data.frame': 200 obs. of 5 variables: $ firm : int 1 1 1 1 1 1 1 1 1 1 ... $ year : int 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 ... $ inv : num 318 392 411 258 331 ... $ value : num 3078 4662 5387 2792 4313 ... $ capital: num 2.8 52.6 156.9 209.2 203.4 ... En el conjunto de datos los campos identificativos de las empresas y años deben de ser índices.

Para estimar un modelo de data panel de efectos fijos que relacione la inversión realizada por la

empresa con su valor contable y su capital, se requiere la siguiente sentencia R:

> grun.fe <- plm(inv~value+capital,data=Grunfeld,model="within")

> summary(grun.fe) Oneway (individual) effect Within Model Call: plm(formula = inv ~ value + capital, data = Grunfeld, model = "within") Balanced Panel: n=10, T=20, N=200 Residuals : Min. 1st Qu. Median 3rd Qu. Max. -184.000 -17.600 0.563 19.200 251.000 Coefficients : Estimate Std. Error t-value Pr(>|t|) value 0.110124 0.011857 9.2879 < 2.2e-16 *** capital 0.310065 0.017355 17.8666 < 2.2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Total Sum of Squares: 2244400 Residual Sum of Squares: 523480 R-Squared : 0.76676 Adj. R-Squared : 0.72075 F-statistic: 309.014 on 2 and 188 DF, p-value: < 2.22e-16 Para estimar un modelo con efectos aleatorios:

> grun.re <- plm(inv~value+capital,data=Grunfeld,model="random") > summary(grun.re) Oneway (individual) effect Random Effect Model (Swamy-Arora's transformation) Call: plm(formula = inv ~ value + capital, data = Grunfeld, model = "random") Balanced Panel: n=10, T=20, N=200 Effects: var std.dev share idiosyncratic 2784.46 52.77 0.282 individual 7089.80 84.20 0.718 theta: 0.8612 Residuals : Min. 1st Qu. Median 3rd Qu. Max. -178.00 -19.70 4.69 19.50 253.00 Coefficients : Estimate Std. Error t-value Pr(>|t|) (Intercept) -57.834415 28.898935 -2.0013 0.04674 * value 0.109781 0.010493 10.4627 < 2e-16 *** capital 0.308113 0.017180 17.9339 < 2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Total Sum of Squares: 2381400 Residual Sum of Squares: 548900 R-Squared : 0.7695 Adj. R-Squared : 0.75796 F-statistic: 328.837 on 2 and 197 DF, p-value: < 2.22e-16

Los efectos fijos se extraen con la function “fixef”.

> summary(fixef(grun.fe, type = 'dmean')) Estimate Std. Error t-value Pr(>|t|) 1 -11.5528 49.7080 -0.2324 0.816217 2 160.6498 24.9383 6.4419 1.180e-10 *** 3 -176.8279 24.4316 -7.2377 4.565e-13 *** 4 30.9346 14.0778 2.1974 0.027991 * 5 -55.8729 14.1654 -3.9443 8.003e-05 *** 6 35.5826 12.6687 2.8087 0.004974 ** 7 -7.8095 12.8430 -0.6081 0.543136 8 1.1983 13.9931 0.0856 0.931758 9 -28.4783 12.8919 -2.2090 0.027174 * 10 52.1761 11.8269 4.4116 1.026e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

6.7. PROBLEMAS

6.1. Considere el siguiente panel de datos de inversión (Y) y beneficios (X) para 3 empresas y

10 periodos:

Empresa 1 Empresa 2 Empresa 3

t Y X Y X Y X

1 18.32 17.85 25.30 27.93 13.85 13.65

2 31.30 30.69 22.47 22.97 24.60 21.55

3 7.62 10.48 14.31 14.16 8.87 6.47

4 19.94 18.79 23.01 23.73 29.19 29.91

5 20.80 20.41 12.63 16.31 8.99 10.01

6 17.20 17.59 24.84 26.15 10.73 13.34

7 19.93 21.64 18.76 21.13 31.68 27.70

8 34.82 31.45 15.00 16.61 16.49 13.36

9 25.32 24.64 24.51 24.55 23.49 20.44

10 9.77 10.43 23.32 22.06 25.84 22.87

a) Calcule la matriz de productos cruzados a partir de los datos anteriores y estime por

MCO los coeficientes del modelo:

it it itY X uα β= + +

b) Con los datos anteriores, estime el modelo de efectos fijos y contraste la hipótesis de

que el término constante es el mismo para las tres empresas. ¿Qué interpretación

económica puede realizarse de dicho término constante?

c) Calcule un modelo de efectos fijos de doble vía.

6.2. Considere el siguiente el siguiente modelo de data panel estimado con efectos fijos y

aleatorios:

iititt

ititit

XY

XY

εµββαµββα

++++=+++=

221it1

221it1

X

X

Cuya estimación ha dado los siguientes resultados

Coeficientes Desviación típica

Efectos fijos Efectos aleatorios Efectos fijos Efectos aleatorios

1β 0.3461617 0.3457104 0.0266645 0.026541

2β 0.1079481 0.1076555 0.0175089 0.0168169

Decida si es conveniente o no utilizar efectos aleatorios

SOLUCIONES

6.1 a) t1,0589X-1.042+=tY

b) t1.1022X0.389D3-3.348D2--1.979D1 +=tY ; 320: αα =H ; se rechaza la hipótesis

nula.

c) t1.11106X10223.19735.08439.17560.06467.15084.1

4695.03828.02352.01771.01.534D31.457D2--0.078D1

++++−−−−++−+=

TTTTTT

TTTTYt

6.2. Resultado de la prueba de Haussman, no se rechaza Ho, es conveniente utilizar efectos

aleatorios.

7. MODELOS DE ECUACIONES SIMULTÁNEAS

7.1. INTRODUCCIÓN

Hasta el momento en todos los modelos que hemos visto, se ha supuesto que las variables

explicativas eran exógenas, de tal forma que su comportamiento podía explicarse de forma

completamente independiente del resto de las variables que componen el modelo. Esta

característica deja de tener sentido cuando se pretende recoger, mediante un modelo

econométrico, la existencia de un conjunto de variables endógenas que se determinan

mutuamente.

En ese caso, es preciso especificar un modelo de ecuaciones simultáneas, el cual se define como

un modelo compuesto por varias ecuaciones y en el que existe simultaneidad entre las variables

que lo componen. La simultaneidad en este tipo de modelos se produce porque, a la vez que una

variable dependiente Y está determinada por una variable explicativa X en una de las ecuaciones

del modelo, en otra ecuación la variable X queda determinada por la anterior endógena, Y. Es

decir, se da una relación en dos sentidos entre variables dependientes y explicativas, lo que hace

dudosa la diferenciación entre variables dependientes e independientes.

En particular, diremos que existe endogeneidad entre dos variables cuando hay una relación

bidireccional entre ellas, y calificaremos a una variable como exógena o predeterminada cuando

su valor no venga determinado por alguna de las ecuaciones del modelo.

La distinción entre variables endógenas y exógenas en un modelo de estas características es sutil

y resulta, a veces, controvertida. Por tanto corresponde al investigador, en función de argumentos

teóricos establecidos a priori, la difícil tarea de especificar qué variables son endógenas y cuáles

son predeterminadas. No obstante, éste puede ratificar sus conjeturas a través de pruebas

empíricas (prueba de Hausman) diseñadas para determinar si una variable debe ser considerada

endógena o no.

En definitiva, los modelos de ecuaciones simultáneas relacionan en cada ecuación a una variable

dependiente endógena, con variables exógenas que actúan como endógenas en otras ecuaciones

además de con otras variables exógenas o independientes.

La representación analítica de un modelo genérico con n ecuaciones simultáneas y m variables

exógenas es la siguiente:

α11Y1t+α12Y2t +…+α1nYnt + β11X1t+ β12X2t+…+β1mXmt =u1t

α21Y1t+α22Y2t +…+α2nYnt + β21X1t+ β22X2t+…+β2mXmt =u2t (7.1)

....................................................................................................................................................

αn1Y1t+αn2Y2t +…+αnnYnt + βn1X1t+ βn2X2t+…+βnmXmt =unt

En la expresión 7.1. puede observarse que la presencia de la simultaneidad se debe a dos

características: por un lado, que todas las variables endógenas (Yit) y exógenas (Xit) pueden

aparecer en todas las ecuaciones del modelo; y por otro, que las perturbaciones aleatorias uit están

correlacionadas contemporáneamente entre sí, lo que implica que un cambio en una cualquiera

de ellas afectará a todas las variables endógenas del modelo.

De esta forma, en los modelos de ecuaciones simultáneas la relación de causalidad entre las

variables deja de ser unidireccional, al contrario de lo que sucedía en los modelos uniecuacionales,

ya que una variable exógena puede influir en cualquier endógena, bien sea directamente por estar

especificada en la ecuación, o a través de otra endógena relacionada con la anterior, que también

figure especificada en la ecuación en cuestión.

7.2. FORMA ESTRUCTURAL Y REDUCIDA

Como veremos en detalle más adelante, el principal problema que plantea la presencia de

simultaneidad en el modelo es la estimación de los parámetros. No obstante, para poder abordarla

debemos definir previamente los conceptos de forma estructural y forma reducida de un modelo

de ecuaciones simultáneas.

Para ello, si expresamos en términos matriciales la expresión (7.1) tenemos que:

=

+

nt

t

t

mt

t

t

nmnn

m

m

nt

t

t

nnnn

n

n

u

u

u

X

X

X

Y

Y

Y

..

...

......

...

...

.

...

......

...

...

2

1

2

1

21

22221

11211

2

1

21

22221

11211

βββ

ββββββ

ααα

αααααα

(7.2)

O simplificando la expresión anterior:

Y BX UΓ + =

Donde:

11 12 1 1 11 12 1 1 1

21 22 2 2 21 22 2 2 2

1 2 1 2

... ...

... ...

. . ... . . . . ... . . .

... ...

n t m t t

n t m t t

n n nn nt n n nm mt nt

Y X u

Y X uY B X U

Y X u

α α α β β βα α α β β β

α α α β β β

Γ = = = = =

Esta forma de expresar el modelo es lo que se conoce como forma estructural, y en ella se

relacionan las variables de la forma que establece la teoría económica.

Si despejamos la parte endógena del modelo obtenemos que:

Y BX UΓ = − +

Suponiendo que la matriz Γ tiene inversa, operamos tal que:

1 1 1Y B X U− − −ΓΓ = − Γ + Γ

1 1Y BX U− −= −Γ + Γ

Llamando 1B−Π = −Γ y 1V U−= −Γ tenemos que:

VXY +Π=

Que desarrollado queda como:

1 11 12 1 1 1

2 21 22 2 2 2

1 2

...

...

. . . ... . . .

...

t m t t

t m t t

nt n n nm mt nt

Y X v

Y X v

Y X v

π π ππ π π

π π π

= +

La expresión resultante se conoce como forma reducida del modelo, y con ella se relaciona cada

una de las variables endógenas con todas las variables predeterminadas. Obsérvese que en la

forma reducida no existe simultaneidad en las variables por lo que su estimación por MCO no

presenta problema alguno.

Como veremos más adelante, en función del interés del investigador la utilización de una forma

u otra será más conveniente. Así, si nuestro objetivo es obtener predicciones en el modelo,

podremos realizarlas directamente con la forma reducida sin necesidad de estimar los parámetros

de la forma estructural; por el contrario, si necesitamos contrastar alguna hipótesis sobre los

coeficientes del modelo a fin de confirmar la validez de una teoría económica, lo apropiado será

utilizar la forma estructural del modelo.

Ejemplo 7.1.

El análisis clásico de la oferta y la demanda establece que las cantidades demandadas de un bien

(Qdt) depende del precio del bien (Pt), el precio de otros bienes sustitutivos o complementarios

(Prt) y la renta de los consumidores (Rt), así como por diversos factores psicológicos y/o

sociológicos que inciden en el comportamiento del consumidor: gustos, publicidad, etc. y que se

recogen en el término de error de la ecuación de demanda (u1t).

A su vez, la teoría económica establece que las cantidades ofertadas de un bien (Qot) depende del

precio del bien (Pt), el precio de otros bienes sustitutivos o complementarios (Prt), y de los precios

de los factores de producción (Ft), entre los que se incluyen los precios de las materias primas,

los salarios y los intereses que cobran los bancos por el dinero que prestan. Asimismo, otros

factores que afectan al proceso de producción quedan recogidos por el término de error de la

ecuación de oferta (u2t).

Ambas ecuaciones determinan un modelo de ecuaciones simultaneas, cuya solución permite

obtener la cantidad consumida y el precio del bien en equilibrio. La expresión convencional de

dicho modelo es la siguiente:

Ecuación de Demanda: Qdt=α11Pt+β11Prt+β12Rt + u1t, α11<0

Ecuación de Oferta: Qot=α21Pt+β21Prt+β23Ft + u2t, α21>0

Igualdad: Qdt= Qo

t

Lo que, sustituyendo la igualdad, equivale a:

Qt=α11Pt+β11Prt+β12Rt + u1t, α11<0 (7.3)

Qt=α21Pt+β21Prt+β23Ft + u2t, α21>0 (7.4)

Sus características son las siguientes:

− Posee dos variables endógenas: la cantidad consumida del bien (Qt) y el precio (Pt)

− Asimismo, tiene tres variables exógenas o explicativas: el precio de los factores de

producción (Ft), el precio de otros bienes complementarios o sustitutivos (Prt) y el nivel

de renta de los consumidores (Rt)

− La ecuación de demanda, tiene dos variables endógenas (Qt, Pt) y dos exógenas (Prt, Rt).

− La ecuación de oferta, tiene dos variables endógenas (Qt, Pt) y dos exógenas (Ft, Prt)

Para obtener el modelo reducido, debemos construir la expresión (7.2) tal que:

11 12 111

21 23 221

Pr01

01

tt t

tt t

t

Q uR

P uF

β βαβ βα

− −− + = − −−

(7.5)

O matricialmente:

Y BX UΓ + =

El determinante de Γ es entonces:

( ) ( )21 11 11 211 1α α α αΓ = × − − − × = −

Y su matriz inversa:

21 11

1 11 21 11 21

11 21 11 21

1 1

α αα α α α

α α α α

−

− − − Γ = − − −

A partir de la matriz 1−Γ , podemos obtener la relación existente entre los coeficientes de la forma

estructural (αij, βij) y los de la forma reducida (πij) tal que:

21 11

11 121 11 21 11 21

21 23

11 22 11 21

11 2311 21 21 11 21 12

11 21 11 21 11 2111 12 13

21 22 23 2321 11 12

11 21 11 21 11 21

0

01 1B

α αβ βα α α αβ β

α α α αα βα β α β α β

α α α α α απ π ππ π π ββ β β

α α α α α α

−

− − − − − Π = −Γ = − − −− − −

− − − − − = − − − − −

Otra forma alternativa de obtener el modelo en forma reducida sería igualar la ecuación de

demanda (7.3) con la ecuación de oferta (7.4):

11 11 12 21 21 23Pr Prt t t t t tP R P Fα β β α β β+ + = + +

Despejando Pt obtenemos:

21 11 12 23

11 21 11 21 11 21

Prt t t tP R Fβ β β βα α α α α α

−= − +− − − (7.6)

Ahora, si sustituimos (7.6) en (7.3) nos queda que:

21 11 12 2311 11 12

11 21 11 21 11 21

Pr Prt t t t tQ R F Rβ β β βα β βα α α α α α −= − + + + − − −

Y operando, tenemos que :

11 21 21 11 21 12 11 23

11 21 11 21 11 21

Prt t t tQ R Fα β α β α β α β

α α α α α α−= − +− − − (7.7)

Ahora simplemente basta con relacionar los coeficientes asociados a las variables en las

ecuaciones (7.6) y (7.7) con los coeficientes de la forma reducida tal que:

11 21 21 1111

11 21

21 1212

11 21

11 2313

11 21

α β α βπα α

α βπα αα βπ

α α

−=−

−=−

=−

21 1121

11 21

1222

11 21

2323

11 21

β βπα α

βπα α

βπα α

−=−

−=−

=−

7.3. DETECCIÓN DE LA SIMULTANEIDAD. PRUEBA DE

HAUSMAN

La consecuencia más inmediata de la presencia de simultaneidad en los modelos

multiecuacionales es que los estimadores que se obtienen al aplicar MCO a cada una de las

ecuaciones individuales no son consistentes, por lo que debemos recurrir a métodos de estimación

alternativos que permitan abordar el problema de la simultaneidad y que produzcan estimadores

consistentes y eficientes. Sin embargo, hay que tener en cuenta que, si dichos métodos se aplican

cuando no existe simultaneidad, los estimadores obtenidos son consistentes pero no eficientes,

siendo preferibles en estos casos los obtenidos por el método MCO (Gujarati, 1997). Por tanto,

parece razonable que, antes de descartar las estimaciones realizadas a través de MCO en favor de

otros métodos alternativos, se verifique la presencia de simultaneidad.

El método para verificar la presencia de simultaneidad o endogeneidad más utilizado es la prueba

de especificación de Hausman (1974). Esta prueba intenta, esencialmente, averiguar si un regresor

está correlacionado con el término de error. Si lo está, existirá simultaneidad, en cuyo caso deben

utilizarse métodos de estimación alternativos a MCO; si no lo está, se puede utilizar este método

con la seguridad de que proporcionará estimadores eficientes y consistentes.

Veamos cómo se utilizaría en la práctica la prueba de Hausman: supongamos que tenemos un

modelo de tres ecuaciones con dos variables endógenas, Y1 e Y2 y que hay tres variables exógenas,

X1, X2 e X3. Supóngase además que la primera ecuación del modelo es:

iiii uXYY 111211 ++= βα

La prueba de simultaneidad de Hausman comprende los siguientes pasos:

• Se obtienen las ecuaciones de la forma reducida y se estima la ecuación de aquella

variable supuestamente endógena por MCO. Por ejemplo, si en la ecuación anterior

sospecháramos que Y2i presenta simultaneidad, realizaríamos la siguiente regresión:

iiii XXXY 33221102 ππππ +++= , iii vYY 222ˆ +=

• A continuación, se estima por MCO la ecuación original del modelo en la que aparece la

variable analizada como exógena pero sustituyéndola por su valor estimado en la

regresión anterior. En nuestro ejemplo, reemplazamos Y2i por 2 2ˆ

i iY v+ como variable

explicativa en la ecuación original del modelo, tal que:

iiiii uvYXY 12121111ˆ +++= ααβ (7.8)

Bajo la hipótesis nula de no simultaneidad, el coeficiente asociado a v2i deberá ser

estadísticamente igual a cero.

Por otro lado, Pindyck y Rubinfeld (1980) sugieren una forma alternativa de realizar el contraste

de simultaneidad, incluyendo como regresor en el segundo paso de la prueba de Hausman los

residuos obtenidos en la estimación de la forma reducida, 2iv tal que:

1 1 2 1 1 2 1i i i i iY Y X v uα β λ= + + +

Nuevamente se contrasta la hipótesis nula λ=0; en caso de que se rechace la hipótesis nula, Y2i

no debe tratarse como una variable exógena.

Finalmente, también es posible contrastar la endogeneidad de varias variables tal y como propone

Gujarati (1997): supongamos por ejemplo que tenemos un modelo de tres ecuaciones con tres

variables endógenas, Y1, Y2 e Y3 y tres exógenas, X1, X2 e X3, en el que la primera ecuación es:

iiiiiii uXXXYYY 133221133221 +++++= βββαα

Vamos a verificar si Y2 e Y3 pueden ser utilizadas como exógenas; para ello, primero se estiman

las ecuaciones de ambas variables en forma reducida, obteniéndose los valores proyectados iY2

e iY3 .

Seguidamente estimamos por MCO la siguiente ecuación:

iiiiiiiii uYYXXXYYY 1332233221133221ˆˆ +++++++= λλβββαα

y se utiliza una prueba F para contrastar la hipótesis λ2=λ3=0. Si esta hipótesis es rechazada,

entonces Y2 e Y3 pueden ser consideradas como endógenas, en caso contrario deberán ser tratadas

como exógenas.

Ejemplo 7.2.

Utilizando el modelo multiecuacional de oferta y demanda del Ejemplo 7.1 vamos a comprobar

que la variable Pt puede tratarse como endógena en la ecuación (7.3), aplicando la prueba de

Hausman. Para ello utilizaremos los siguientes datos:

Año Tm sacrificadas de carne de

porcino (miles)

Precio carne de porcino

Precio relativo de la carne de aves

frente a la carne de porcino

Precio relativo de los piensos frente a la carne de porcino

Renta per

capita

1980 1182.31 1.09 1.09 0.91 0.77 1981 1224.50 1.10 1.07 0.93 0.77 1982 1336.37 1.18 1.00 0.81 0.78 1983 1342.03 1.19 0.99 0.90 0.79 1984 1428.66 1.11 1.18 1.02 0.80 1985 1387.75 1.20 1.04 0.90 0.82 1986 1398.64 1.21 0.90 0.86 0.84 1987 1489.27 1.07 1.03 1.02 0.88 1988 1722.33 0.97 1.12 1.09 0.93 1989 1703.49 1.09 0.93 0.91 0.97 1990 1788.85 0.98 0.99 0.99 1.00 1991 1885.56 1.03 0.93 0.95 1.03 1992 1912.92 1.17 0.89 0.89 1.03 1993 2069.40 0.94 1.14 1.08 1.02 1994 2193.37 0.91 1.09 1.01 1.04 1995 2258.65 0.96 0.85 0.88 1.06 1996 2361.85 1.04 0.93 0.85 1.09 1997 2448.77 1.16 0.82 0.80 1.12

La expresión para la ecuación (7.3) recordemos que es:

Qt=α11Pt+β11Prt+β12Rt + u1t

El primer paso consiste en realizar la regresión por MCO del precio de la carne de porcino (Pt)

sobre las tres variables exógenas del modelo: Precio relativo de la carne de aves frente a la carne

de porcino (Prt), Precio relativo de los piensos frente a la carne de porcino (Ft) y Renta "per

capita" (Rt), para lo que estimamos la relación:

Pt=π21Prt+π22Rt+π23Ft +e1t

Los resultados obtenidos son los siguientes:

Coeficientes Error típico Estadístico t Término constante 2.33947783 0.24298863 9.62793124 Precio relativo de la carne de aves frente a la carne de porcino

-0.34549619 0.28538168 -1.21064604

Precio relativo de los piensos frente a la carne de porcino

-0.43015941 0.30002065 -1.43376601

Renta per capita -0.55315522 0.16144429 -3.42629156

El valor obtenido para tP sería el siguiente:

t tP

1980 1.20910458 1981 1.19432981 1982 1.28461538 1983 1.20231821 1984 1.10554471 1985 1.18859183 1986 1.20641733 1987 1.06103444 1988 0.98035916 1989 1.09799849 1990 1.01801611 1991 1.03870013 1992 1.08101615 1993 0.94140969 1994 0.97946935 1995 1.06484696 1996 1.08198668 1997 1.09829545

El siguiente paso es plantear la ecuación (7.3) pero añadiendo la nueva variable estimada:

Qt=α12Pt+β11Prt+β12Rt +λ tP + u1t

Los resultados obtenidos en el segundo paso son los siguientes:

Coeficientes Error típico Estadístico t Término constante -9037.89318 2676.96924 -3.37616624 Precio carne de porcino -240.316755 429.828674 -0.55909894 Precio relativo de la carne de aves frente a la carne de porcino 2350.58492 794.500316 2.95857014 Renta per capita 5440.9149 789.283782 6.89348372

tP 3356.23732 1182.18626 2.83900891

Considerando que el valor de la t de Student en las tablas es de 2.67 para un nivel de confianza

del 95%, se descarta la posibilidad de que el coeficiente asociado a tP pueda ser considerado

igual a cero.

Por otro lado, si generamos el residuo vt tenemos que:

t vt 1980 -0.05564667 1981 -0.04316201 1982 -0.03408611 1983 0.01838146 1984 0.05894503 1985 0.06080601 1986 0.01847311 1987 0.01379649 1988 0.00132339 1989 0.00100086 1990 -0.03753504 1991 -0.00858133 1992 0.09163034 1993 0.02208662 1994 -0.04457266 1995 -0.11952179 1996 -0.01082423 1997 0.06748654

Aplicando el método de Pyndick y Rubinfeld ahora debemos estimar la siguiente ecuación:

Qt=α12Pt+β11Prt+β12Rt +λ vt + u1t

Obteniéndose los siguientes resultados:

Coeficientes Error típico Estadístico t Término constante -9037.89318 2676.96924 -3.37616624 Precio carne de porcino 3115.92057 1101.27729 2.82936968 Precio relativo de la carne de aves frente a la carne de porcino 2350.58492 794.500316 2.95857014 Renta per capita 5440.9149 789.283782 6.89348372 vt -3356.23732 1182.18626 -2.83900891

Nuevamente el parámetro λ es estadísticamente distinto de cero, por lo que podemos afirmar que

el precio de la carne de porcino pueda ser considerado como endógeno en la ecuación de demanda.

7.4. IDENTIFICACIÓN DEL SISTEMA

En la expresión 1B−Π = −Γ podemos observar que los parámetros de la forma reducida son una

combinación lineal de los parámetros de la forma estructural del modelo (Y BX UΓ + = );

asimismo, dado que no existe simultaneidad en la forma reducida, podemos estimar sus

parámetros sin problema por MCO. Sin embargo, ¿cómo podemos para saber si es posible

recuperar todos y cada uno de los parámetros de la forma estructural (elementos de las matrices

B y Γ A) a partir de las estimaciones de los parámetros de la forma reducida (elementos de la

matriz Π )? Para responder a esta pregunta antes de proceder a la estimación del modelo, debemos

realizar la identificación del sistema de ecuaciones simultáneas; una vez realizada podemos

encontrarnos en alguna de las siguientes situaciones:

− Una ecuación estará no identificada cuando no tengamos suficiente información para

estimar los parámetros de la forma estructural de la ecuación.

− Por su parte, una ecuación estará sobreidentificada cuando haya más de una

combinación posible de valores estimados para los parámetros de la forma estructural.

− Finalmente, diremos que una ecuación está exactamente identificada cuando sea posible

obtener una única estimación de los parámetros estructurales.

− En caso de que todas las ecuaciones de un modelo multiecuacional en su forma estructural

sean exactamente identificadas, diremos que el sistema está exactamente identificado,

pudiéndose recuperar de forma unívoca los elementos de las matrices B y A a partir de

las estimaciones de la matriz Π .

Ejemplo 7.3.

Consideremos el modelo clásico de oferta y demanda del Ejemplo 7.1, en el que se ha omitido la

variable Prt de la ecuación (7.4):


Qt=α21Pt+β23Ft + u2t, α21>0 (7.10)

Se trata de un modelo con las siguientes características:

− La ecuación de demanda (7.9) tiene dos variables endógenas (Pt y Qt) y dos exógenas (Prt

y Rt)

− La ecuación de oferta (7.10) tiene dos variables endógenas (Pt y Qt) y una exógena (Ft).

La forma reducida del modelo es:

Qt=π11Ft+π12Prt+π13Rt

Pt=π21Ft+π22Prt+π23Rt

Relacionando los parámetros de la forma estructural con los de la forma reducida se obtiene un

sistema de 6 ecuaciones y 5 incógnitas, que se corresponden a los coeficientes a estimar en el

modelo de oferta y demanda, tal que:

21 11

11 121 11 21 11 21

23

11 21 11 21

11 2321 11 21 12

11 21 11 21 11 2111 12 13

21 22 23 2311 12

11 21 11 21 11 21

0

0 01 1B

α αβ βα α α α

βα α α α

α βα β α βα α α α α απ π π

π π π ββ βα α α α α α

−

− − − − − Π = −Γ = − −− − −

− − − − − = − − − − −

A partir de los parámetros de la forma reducida podemos obtener los valores de los coeficientes

asociados al modelo; por ejemplo, si dividimos π13 por π23 obtenemos el valor de α11 que:

1311

23

παπ

=

Pero para algunos parámetros se pueden obtener dos soluciones:

1121

21

1221

22

παππαπ

=

=

De lo que se deduce que la ecuación (7.10) del modelo está sobreidentificada.

7.4.1. Condiciones de Orden y Rango en la Identificación Para comprobar si las ecuaciones de un sistema de ecuaciones están identificadas se utilizan dos

sencillas condiciones. Por un lado, tenemos la condición de orden, según la cual para que una

ecuación esté identificada debe verificarse que el número de variables exógenas excluidas en la

ecuación j debe ser, al menos, tan alto como el número de variables endógenas incluidas en dicha

ecuación.

En términos matemáticos deberá cumplirse que:

K – k ≥ m – 1 (7.11)

Donde:

K = número de variables exógenas en el modelo.

k = número de variables exógenas en una ecuación dada.

m = número de variables endógenas en una ecuación dada.

En particular, tomando en consideración el signo de la desigualdad tenemos que

• Si K – k < m – 1, diremos que la ecuación está subidentificada por lo que no será posible

estimar el sistema al no haber información suficiente para ello (en términos algebraicos,

diríamos que es un sistema incompatible).

• Si K – k = m – 1, la ecuación está exactamente identificada lo que implica que tenemos

información suficiente para poder estimar el modelo y recuperar los parámetros de la

forma estructural (en términos algebraicos, se trataría de un sistema compatible

determinado).

• Si K – k > m – 1, la ecuación está sobreidentificada existiendo varias soluciones posibles

para los parámetros de la forma estructural a causa de un exceso de información, si bien

en este caso la estimación de los parámetros de la forma estructural es viable utilizando

el método de Mínimos Cuadrados en 2 Etapas que veremos en el siguiente capítulo (en

términos algebraicos, tendríamos un sistema compatible indeterminado).

La condición de orden de identificación puede simplificarse sumando (M–m) a ambos lados de la

desigualdad (7.11), siendo M el número de ecuaciones del modelo, tal que:

(K – k) + (M – m) ≥ (m – 1) + (M – m)

Operando queda:

(K – k) + (M – m) ≥ M – 1

Con ello, para aplicar la condición de orden ahora sólo tenemos que contar el número de variables

endógenas y exógenas excluidas en la ecuación analizada y comparar dicho número con el total

de variables endógenas del sistema menos uno.

De esta forma, si el número de variables endógenas y exógenas excluidas supera al número de

ecuaciones menos uno, la ecuación analizada estará sobreidentificada; si es igual estará

exactamente identificada; y si es menor estará subidentificada.

Sin embargo, la condición de orden es una condición necesaria pero no suficiente para la

identificación, por lo que es necesario plantear otra condición que sí es necesaria y suficiente. Se

trata de la condición de rango, que pasamos a ver a continuación.

La condición de rango señala que en un modelo que contiene M variables endógenas en M

ecuaciones, una ecuación estará identificada si y sólo si puede construirse al menos un

determinante diferente de cero, de orden ( 1) ( 1)M M− × − a partir de los coeficientes de las

variables endógenas y predeterminadas excluidas de la ecuación que se analiza, pero incluidas en

el resto de ecuaciones del modelo.

En resumen, para llevar a cabo la identificación de un sistema de ecuaciones simultáneas deben

seguirse los siguientes pasos:

1. Aplicar la condición de orden para saber si una ecuación está subidentificada,

exactamente identificada o sobreidentificada.

2. Aplicar la condición de rango; en caso de verificarse confirmaremos el resultado

obtenido con la condición de orden.

Ejemplo 7.4.

Volviendo al modelo de ecuaciones simultáneas de oferta y demanda del Ejemplo 7.3, tenemos

que:

− Variables predeterminadas del modelo K=3.

− Variables predeterminadas en la ecuación de demanda k=2.

− Variables predeterminadas en la ecuación de oferta k=1.

− Número de ecuaciones en el modelo M=2.

− Variables endógenas en la ecuación de demanda m=2.

− Variables endógenas en la ecuación de oferta m=2.


Qt=α21Pt+β23Ft + u2t, α21>0 (7.10)

La condición de orden de identificación del modelo quedaría establecida como sigue:

1. La ecuación de demanda, tal y como se ha formulado, contiene dos variables endógenas y dos

exógenas, y excluye una variable (Ft), que sería igual al número de endógenas incluidas en la

ecuación menos una, estando por tanto la ecuación de demanda exactamente identificada.

K–k=m–1 ⇒ 3-2=2-1 ⇒ 1=1

2. Por su parte, la ecuación de oferta, posee dos variables endógenas y una exógena, excluyendo

por tanto 2 variables (Prt y Rt), lo que supera al número de endógenas incluidas en la ecuación

menos una, por lo que la ecuación de oferta está sobreidentificada, tal que:

K–k=m–1 ⇒ 3-1>2-1⇒ 2>1

Procedemos a confirmar los resultados obtenidos con la condición de orden aplicando la

condición de rango. Dicha condición establece que una ecuación está identificada, si y sólo si

puede construirse por lo menos un determinante diferente de cero, de orden ( 1) ( 1)M M− × − a

partir de los coeficientes de las variables (endógenas y predeterminadas) excluidas de esa

ecuación particular, pero incluidas en las otras ecuaciones del modelo; en nuestro caso, dicho

determinante debe ser de orden(2 1) (2 1)− × − = 1.

Para analizar la condición de rango lo más práctico es formar la siguiente tabla con los coeficientes

asociados a las variables endógenas y predeterminadas:

Qt Pt Prt Rt Ft Ecuación de demanda 1 α11 β11 β12 0 Ecuación de oferta 1 α21 0 0 β 23

A continuación debemos comprobar si existe algún determinante no nulo asociado a las matrices

que se pueden formar con los coeficientes asociados a las variables excluidas.

En la ecuación de demanda se verifica la condición de rango ya que existe un determinante no

nulo10 de orden 1 1 × , 23β tal y como puede apreciarse en la siguiente tabla:


10

A priori, se supone que ningún parámetro es igual a cero.

En la ecuación de oferta también se cumple la condición de rango ya que existen dos

determinantes no nulos de orden 1 1× : 11β y 12β :


En conclusión, la ecuación de demanda está exactamente identificada y que la ecuación de oferta

está sobreidentificada, resultado este que ya se intuía en el Ejemplo 7.3.

7.5. PROBLEMAS

7.1. Considere el siguiente modelo de oferta y demanda de dinero en desviaciones respecto a la

media:

1 2 3 1

1 2

Dt t t t t

Ot t t

D Ot t

M Y R P u

M Y u

M M

β β βα

= + + +

= +

=

Discuta la identificabilidad de las ecuaciones del modelo.

7.2. Estudie la identificabilidad del siguiente modelo de ecuaciones simultáneas:

1 13 3 11 1 13 3 1

21 1 2 21 1 22 2 2

32 2 3 32 2 33 3 3

t t t t t

t t t t t

t t t t t

y y x x u

y y x x u

y y x x u

α β βα β βα β β

+ + + =+ + + =+ + + =

7.3. Dado el siguiente modelo estructural:

1 12 2 11 1 1

2 21 1 22 2 2

t t t t

t t t t

y y x u

y y x u

α βα β

= + += + +

Se ha estimado la forma reducida, obteniendo los siguientes valores:

1 1 2

2 1 2

5 8

6 2t t t

t t t

y x x

y x x

= += −

A partir de las estimaciones obtenidas, recupere los valores de los parámetros estructurales.

7.4. En el modelo de gasto público de Pindyck y Rubinfeld:

i

i

vPSEXPAID

uPOPINCAIDEXP

+++=++++=

321

4321

δδδββββ

donde EXP es el gasto público de cada región, AID las ayudas que recibe del gobierno

central, INC los ingresos tributarios de las regiones, POP la población y PS la población en

edad escolar.

En principio INC, POP y PS se consideran exógenas. Debido a la posibilidad de que existiera

simultaneidad entre EXP y AID, se efectúa una regresión de AID sobre INC, POP y PS, siendo

iw los términos de error calculados en dicha regresión, obteniéndose los siguientes resultados

(entre paréntesis se presenta la desviación típica de cada parámetro estimado):

ˆ89.41 4.50 0.00013 0.518 1.39

( 1.44) (0.89) (0.50) ( 0.02) ( 0.93)iEXP AID INC POP w= − + + − −

− − −

Para una muestra de tamaño N=25 y al 95% de confianza, ¿sería válida la estimación de la

primera ecuación por MCO? ¿Y para un nivel de confianza del 90%?

SOLUCIONES

7.1. La ecuación de demanda está subidentificada y la ecuación de oferta está

sobreidentificada.

7.2. Las tres ecuaciones están exactamente identificadas.

7.3. 12 21 11 22

6 144; ; 29;

5 5α α β β= = − = − = −

7.4. La estimación es válida al 95% de confianza pero no al 90%, ya que en ese caso el

coeficiente asociado a iw sería significativo.

8. MÉTODOS DE ESTIMACIÓN DE MODELOS DE

ECUACIONES SIMULTÁNEAS

8.1. INTRODUCCIÓN

Como acabamos de ver en el capítulo anterior, la estimación de la forma estructural de modelos

de ecuaciones simultáneas utilizando el método de Mínimos Cuadrados Ordinarios presenta

importantes problemas ya que los estimadores son inconsistentes. Por ello, en este capítulo vamos

a ver diferentes métodos de estimación mediante los que sí es posible obtener estimaciones

consistentes de los parámetros del modelo.

8.2. MÍNIMOS CUADRADOS INDIRECTOS (MCI)

Este método resulta válido únicamente para la estimación de modelos de ecuaciones exactamente

identificados y permite estimar los coeficientes de la forma estructural a partir de las estimaciones

MCO de los parámetros de la forma reducida del modelo.

Sea el siguiente modelo de ecuaciones simultaneas:

α11Y1t+α12Y2t +…+α1nYnt + β11X1t+ β12X2t+…+β1mXmt =u1t

α21Y1t+α22Y2t +…+α2nYnt + β21X1t+ β22X2t+…+β2mXmt =u2t.

.

.

αn1Y1t+αn2Y2t +…+αnnYnt + βn1X1t+ βn2X2t+…+βnmXmt =unt.

O bien, expresándolo en términos matriciales:

UBXY =+Γ

Lo que equivale a:

UXBY =+Γ ''

La estimación por MCI se puede esquematizar en tres pasos:

1. Se obtienen las ecuaciones de la forma reducida en forma matricial:

VXUXBY +Π−=Γ+Γ−= −− ')'()'(' 11

2. Las ecuaciones en forma reducida se estiman individualmente por MCO, obteniéndose el

estimador MCO del vector de parámetros de la forma reducida, Π :

( ) YXXX '''ˆ 1−=Π

3. A partir de las estimaciones obtenidas de los coeficientes de las ecuaciones en forma

reducida se obtienen los parámetros estructurales, mediante la siguiente relación:

1)'(''ˆ −Γ−=Π B (8.1)

1)'( −Γ= UV

Si todas las ecuaciones de la forma estructural del modelo están exactamente identificadas,

aplicando este método se obtiene una única solución a la hora de recuperar los parámetros

estructurales a partir de los coeficientes estimados de la forma reducida del modelo; por el

contrario, si alguna de las ecuaciones del modelo estuviera sobreidentificada obtendríamos más

de una solución para uno o más parámetros.

Por ejemplo, supongamos el siguiente sistema de ecuaciones exactamente identificado:

α11Y1t+α12Y2t +β11X1t+ β13X3t=u1t

α21Y1t+α22Y2t +β22X2t+ β23X3t=u2t

En primer término debemos obtener la forma reducida del modelo:

Y1t= π11X1t+ π12X2t+ π13X3t +v1t

Y2t= π21X1t+ π22X2t+ π23X3t +v2t

Utilizando la matriz de productos cruzados se obtendrían las estimaciones MCO de la forma

reducida:

=

∑∑∑∑∑∑

∑∑∑∑∑∑∑∑∑

−

3231

2221

1211

1

232313

322212

312121

2313

2212

2111

ˆˆ

ˆˆ

ˆˆ

XYXY

XYXY

XYXY

XXXXX

XXXXX

XXXXX

ππππππ

Para recuperar los parámetros αij y βij partimos de la expresión (8.1) que puede rescribirse como

B−=ΠΓ ˆ .

−=

2322

1311

232221

131211

2221

1211

0

0

ˆˆˆ

ˆˆˆ

ββββ

ππππππ

αααα

obteniendo así seis ecuaciones a partir de las que se pueden calcular los parámetros αi y βj :

−=+−=+

=+−=+

=+−=+

2323221321

2222221221

21221121

1323121311

22121211

1121121111

ˆˆ

ˆˆ

0ˆˆ

ˆˆ

0ˆˆ

ˆˆ

βπαπαβπαπα

παπαβπαπα

παπαβπαπα

En todo caso, debe subrayarse que es necesario que todas las ecuaciones del modelo estén

exactamente identificadas para poder aplicar Mínimos Cuadrados Indirectos de forma legítima.

Asimismo debe considerarse que los estimadores obtenidos por MCI son, en general, sesgados a

pesar de que los estimadores de la forma reducida sean insesgados, debido a que los estimadores

MCI son funciones no lineales de las estimaciones de la forma reducida del modelo. Sin embargo,

los estimadores MCI sí son consistentes al ser una función continua del estimador MCO de la

forma reducida.

8.2.1. Estimación de curvas de oferta y demanda por MCI Partimos de un modelo de ecuaciones simultáneas compuesto por una ecuación de oferta y otra

de demanda, cuya solución permite obtener la cantidad consumida y el precio del bien en

equilibrio. La expresión funcional de dicho modelo es la siguiente:


Qt=α21Pt+β21Prt+β23Ft + u2t, α21>0 (8.3)

Tal y como ya se vio en el capítulo anterior, sus características son las siguientes:

− Posee dos variables endógenas o a explicar: la cantidad consumida del bien (Qt= Qot=

Qdt) y su precio (Pt)

− Presenta tres variables exógenas o explicativas: el precio de los factores de producción

(Ft), el precio de otros bienes complementarios o sustitutivos (Prt) y el nivel de renta y

riqueza del país o área económica (Rt)

− La ecuación de demanda tiene dos variables endógenas y dos exógenas (Prt y Rt).

− La ecuación de oferta tiene dos variables endógenas (Qt y Pt) y dos exógenas (Ft y Pt)

La ecuación de demanda excluye una variable (Ft), y dado que el número de variables excluidas

es igual al número de relaciones menos uno (2–1), está exactamente identificada según la

condición de orden. La ecuación de oferta también está exactamente identificada ya que también

excluye una sola variable (Rt). Asimismo, ambas cumplen la condición de rango al tener por lo

menos un determinante diferente de cero, de orden (2–1) x (2–1), formado a partir de los

coeficientes de las variables (endógenas y predeterminadas) excluidas de la ecuación particular,

pero incluidas en las otras ecuaciones del modelo.

En consecuencia este modelo de ecuaciones simultáneas es un sistema exactamente identificado

y las dos ecuaciones pueden estimarse por MCI.

La de forma reducida del modelo será:

Qt=π11Prt+π12Rt+π13Ft (8.4)

Pt=π21Prt+π22Rt+π23Ft (8.5)

Para estimar dicho modelo en forma reducida se utilizan los datos del Ejemplo 7.2. En la siguiente

tabla se presenta la matriz de productos cruzados que corresponde a dichos datos:

Tm sacrificadas de carne de

porcino (miles) (Qt)

Precio carne de

porcino (Pt)

Precio relativo de la carne de aves frente a la carne de porcino

(Prt)

Precio relativo de los piensos frente a la carne de

porcino (Ft)

Renta "per capita" (Rt)

Tm sacrificadas de carne de porcino (miles) (Qt)

56677706 33214 30800 29030 29781

Precio carne de porcino (Pt) 21.07 19.34 18.02 17.94 Precio relativo de la carne de aves frente a la carne de porcino (Prt)

18.16 16.90 16.62

Precio relativo de los piensos frente a la carne de porcino (Ft)

15.80 15.62

Renta "per capita" (Rt) 15.83

Dichos productos cruzados se han obtenido de la siguiente forma:

18 18 18 18 182

1 1 1 1 1

56677706, 33214, Pr 30800, 29030, 29781t t t t t t t t tt t t t t

Q QP Q QF QR= = = = =

= = = = =∑ ∑ ∑ ∑ ∑

18 18 18 182

1 1 1 1

21.07 Pr 19.34 18.02 17.94t t t t t t tt t t t

P P PF PR= = = =

= = = =∑ ∑ ∑ ∑

18 18 182

1 1 1

Pr 18.16, Pr 16.90, Pr 16.62t t t t tt t t

F R= = =

= = =∑ ∑ ∑

18 18 182 2

1 1 1

15.80, =15.62, 15.83t t t tt t t

F F R R= = =

= =∑ ∑ ∑

La estimación MCO de las ecuaciones de la forma reducida del modelo es:

1

11 21

12 22

13 23

ˆ ˆ 18.16 16.90 16.62 30800 19.34

ˆ ˆ 16.90 15.80 15.62 29030 18.02

ˆ ˆ 16.62 15.62 15.83 29781 17.95

15.70 20.29 3.54 30800 19.34

20.29 28.81 7.12 290

3.54 7.12 3.38

π ππ ππ π

− = =

− − −

−

33.96 1.56

30 18.02 618.42 1.06

29781 17.95 2998.18 0.83

− = − −

Para recuperar los parámetros de la forma estructural a partir de las estimaciones MCO de la

forma reducida, hay que resolver el siguiente sistema:

11 2311 21 21 11 21 12

11 21 11 21 11 2111 12 13

21 22 23 2321 11 12

11 21 11 21 11 21

α βα β α β α βα α α α α απ π π

π π π ββ β βα α α α α α

− − − − −

= − − − − −

21 11

11 121 11 21 11 21

21 23

11 22 11 21

0ˆ '01 1

B

α αβ βα α α αβ β

α α α α

−

− − − − − Π = −Γ = − − −− − −

Es decir:

11 2311 21 21 11 21 12

11 21 11 21 11 21

2321 11 12

11 21 11 21 11 21

33.96 618.42 2998.18

1.56 1.06 0.83

α βα β α β α βα α α α α α

ββ β βα α α α α α

− − − − −− − = − − − − − −

Los parámetros 11α y 21α se obtienen de forma inmediata:

11

2998.183612.27

0.83α = =

21

618.42583.42

1.06α −= =

−

siendo 11 21 3028.85α α− = .

La recuperación de los parámetros 12β y 23β resulta inmediata a partir de los resultados

anteriores:

12 ( 1.06 3028.85) 3210.58β = − − ⋅ =

23 0.83 3028.85 2513.95β = ⋅ =

Por su parte, la estimación de 11β y 21β se obtiene resolviendo el siguiente sistema de

ecuaciones:

11 21

11 21

33.96 3028.85 583.42 3612.27

1.56 3028.85

β ββ β

− ⋅ = − + ⋅ = − +

cuya solución es 11 5669.09β = − y 21 944.09β = −

8.2.2. Estimación de Haavelmo de la propensión marginal al

consumo por MCI

Veamos cómo se calcularía la propensión marginal al consumo en el contexto del modelo

macroeconómico keynesiano. Dicho modelo, en su versión más sencilla viene dado por el

siguiente sistema de ecuaciones:

Ct = β10+α11Yt+ut

Yt = Ct + I t

donde Ct es el consumo, I t es la inversión e Yt la renta nacional.

Expresando el modelo en términos matriciales queda que:

11 10 11 0

1 1 0 1 0t t

t t

C u

Y I

α β− − + = − −

Siendo su forma reducida:

Ct=π10+π11I t

Yt=π20+π21I t

Teniendo en cuenta que:

111

11 1111

11 11

1

1 11

1 1 1 1

1 1

αα αα

α α

− − −− = − − −

Entonces:

11

11 1110 11 10

20 21

11 11

1

1 1 0

1 1 0 1

1 1

αα απ π β

π πα α

− − − = − − − −

Lo que da lugar al siguiente sistema de ecuaciones:

Por lo que la propensión marginal al consumo puede calcularse a partir de la siguiente relación:

1121

11

1111

11

1020

11

1010

1

1

1

1

1

απ

ααπ

αβπ

αβπ

−=

−=

−=

−=

Utilizando este modelo, vamos a estimar la propensión marginal al consumo en España. Para ello

utilizaremos las series de la Contabilidad Nacional Trimestral Española relativas a Consumo

Nacional, Formación Bruta de Capital y Demanda Interna para el periodo 1970-1998, cuya matriz

de productos cruzados en miles de millones de euros se presenta en la siguiente tabla:

Demanda Interna

Consumo Nacional

Formación Bruta de Capital

Demanda Interna (Yt) 8480 6546 1934 Consumo Nacional(Ct) 5055 1490 Formación Bruta de Capital (I t) 444

Asimismo, las sumas totales en miles de millones de euros de cada variable son:

967

747

221

t

t

t

Y

C

I

=

=

=

∑∑∑

La estimación MCO del modelo en forma reducida es:

=

∑∑∑∑

∑∑∑

−

XYXY

YY

XX

Xn

21

21

1

22212

2111

ˆˆ

ˆˆ

ππππ

1

11 21

12 22

ˆ ˆ 116 221 967 747 0.7262 0.8930

ˆ ˆ 221 444 1934 1490 3.9944 2.9114

π ππ π

− = =

Que daría lugar a la siguiente estimación de la propensión marginal a consumir:

11

2.9114ˆ 0.7289

3.9944α = =

21

1111 ˆ

ˆˆ

ππα =

8.3. VARIABLES INSTRUMENTALES (VI)

Como ya sabemos, la utilización de MCO para estimar modelos de ecuaciones simultaneas

proporciona estimadores sesgados e inconsistentes, ya que en este tipo de ecuaciones existe

correlación entre los regresores o variables exógenas y las perturbaciones.

Así, por ejemplo, partiendo de la primera ecuación del modelo general de ecuaciones simultaneas:

α11Y1t+α12Y2t +…+α1nYnt + β11X1t+ β12X2t+…+β1mXmt =u1t t=1,…,T

Y dividiendo todos los términos de la ecuación por α11, obtenemos:

Y1t+γ12Y2t +…γ1nYnt + δ11X1t+ δ12X2t+…+δ1mXmt =v1t t=1,…,T (8.6)

Donde :

11

11 α

αγ ii = i=2,..,n ,

11

11 α

βδ ii = i=1,..,m , y

11

11 α

tt

uv = t=1,…,T

Podemos poner la ecuación (8.6) en forma matricial:

12

21 1 11 21 111 11

22 2 12 22 2 112 12

11

12

2 1 21 1

1

.. .. .

.. ..

. .. . . . .. .. .

. .. . . . .. .. .

.. .. .

n m

n m n

T nT T T mTT T

m

Y Y X X XY v

Y Y X X XY v

Y Y X X XY v

γ

γδδ

δ

= +

O también:

[ ] [ ] [ ]111 vXYy +

=

δγ

(8.7)

El estimador MCO de (8.7) será:

[ ] [ ]11

1

11

ˆˆ

yX

YXY

X

Y

=

−

δγ

Operando, tenemos que:

[ ] [ ] [ ]

+

=

−

ivXYX

YXY

X

Y

δγ

δγ

11

1

11

ˆˆ

[ ] [ ] [ ]1 1

1 11 1 11 1 1

1

Y vY Y Y

Y X Y X Y XXvX X X

γδ

− − = +

[ ]1

1 111

1

Y vY

Y XXvX

γδ

− = +

Dado que Y1 y v1 están correlacionados, al tomar esperanzas resulta que:

[ ]

≠

+

=

−

δγ

δγ

δγ

1

11

1

11

ˆˆ

Xv

vYXY

X

YEE

En definitiva, la correlación que existe entre las matrices Y1 y v1 es la que provoca que la

estimación MCO de la ecuación (8.6) proporcione estimadores que no satisfagan las propiedades

de consistencia e insesgadez.

Dado que los problemas de estimación vienen dados por la correlación existente entre las matrices

Y1 y v1, para eliminar dichos problemas es necesario disponer de otra matriz, Z*, denominada

matriz de variables instrumentales, que deberá incluir como mínimo tantas variables como

columnas tenga la matriz Y1 y cumplir dos condiciones:

− Las variables que contiene esta nueva matriz deben estar correlacionadas con las

variables incluidas en Y1.

− La correlación entre las variables que aparecen en Z* y v1 ha de ser nula.

Tal y como vimos en el capítulo 4, en los modelos uniecuacionales las variables instrumentales

son variables ajenas al modelo, altamente correlacionadas con la variable que sustituyen como

explicativa e independientes a su vez de la perturbación aleatoria. En el caso de los modelos de

ecuaciones simultaneas, cabe la posibilidad de seleccionar variables instrumentales de entre las

variables exógenas y predeterminadas que no han sido incluidas en la ecuación que se estima.

Asimismo, hay que tener presente que el número de variables instrumentales no debe ser menor

que el número de variables endógenas que aparecen como explicativas.

Veamos a continuación cómo estimar una ecuación por variables instrumentales. Sea una matriz

de variables instrumentales Z* de la forma:

* *21 1 11 21 1* *

22 2 12 22 2*

* *2 1 2

.. ..

.. ..

. .. . . . .. .

. .. . . . .. .

.. ..

n m

n m

T nT T T mT

Y Y X X X

Y Y X X X

Z

Y Y X X X

=

donde los instrumentos *

1Y están correlacionados con Y1 pero no con el término de error v1.

Expresando la matriz de variables instrumentales en términos matriciales:

[ ]XYZ *1

* =

y premultiplicando la expresión (8.7) por Z* ’ se obtiene:

[ ] [ ] [ ]* * *

1 1 11 1 1·

Y Y Yy Y X v

X X X

γδ

= +

De donde se obtiene el Estimador de Variables Instrumentales (VI):

[ ] [ ]1

*1

1

1

*1

ˆˆ

yX

YXY

X

Y

=

−

δγ

Si denominamos [ ]1Z Y X= , tenemos entonces que:

( ) 1* *1

ˆ' '

ˆB Z Z Z y

γ

δ− = =

La matriz Z* de instrumentos deberá cumplir las siguientes propiedades asintóticas:

• ZZT

ZZp *'

* 'lim ∑=

es una matriz no singular que indica la existencia de

correlación entre las endógenas y sus instrumentos.

• ***'

** 'lim

ZZT

ZZp ∑=

es una matriz simétrica definida positiva

• 0'

lim 1*

=

T

vZp que expresa la ausencia de correlación entre los

instrumentos y el término de perturbación.

Si se verifican estas condiciones, entonces el estimador VI es consistente (aunque no es

insesgado), siendo su matriz de varianzas y covarianzas:

( ) ( ) ( )1

1 12 * * * *'

ˆcov( ) ' ' 'vB Z Z Z Z Z Zσ− − =

Siendo 1

2 1 1( ) '( )ˆv

y ZB y ZB

T kσ − −=

−

No obstante hay que tener presente la indeterminación que la estimación VI provoca en modelos

simultáneos con ecuaciones sobreidentificadas. Por ejemplo, consideremos el siguiente modelo

en el que la primera ecuación está sobreidentificada:

Y1t+α21Y2t+β11X1t=u1t

α12Y1t+Y2t+β22X2t + β23X3t =u1t

Para estimar la primera ecuación por VI podemos utilizar como instrumento de Y2t las variables

exógenas X2t ó X3t , de tal forma que Z* puede ser:

31 1121 11

32 1222 12* *

3 12 1

a b

T TT T

X XX X

X XX XZ Z

X XX X

= =

M MM M

Por lo que las estimaciones VI obtenidas utilizando la matriz *aZ y

*bZ serán diferentes.

8.3.1. Estimación una función keynesiana de consumo por VI

Se parte de nuevo del modelo macroeconómico Keynesiano de la renta de equilibrio:

Ct = α+βYt

Yt = Ct + I t

donde Ct es el consumo, I t es la inversión e Yt la renta nacional.

Se utiliza I t como instrumento en la estimación de Ct, de forma que las matrices de variables

endógenas, exógenas e instrumentos serán:

1

21

1

2

1

2

.

1

1

..

1

1

1*

..

1

T

T

T

C

Cy

C

Y

YZ

Y

I

IZ

I

=

=

=

Con las que calculamos:

1*

1 1

1*1

1

1* *

2

1 1

'

'

'

T

tt

T T

t t tt t

T

tt

T

t tt

T

tt

T T

t tt t

T Y

Z Z

I I Y

C

Z y

I C

T I

Z Z

I I

=

= =

=

=

=

= =

=

=

=

∑

∑ ∑

∑

∑

∑

∑ ∑

Con los datos de las series de la Contabilidad Nacional Trimestral Española utilizados en el

ejemplo anterior, la estimación de los coeficientes por VI es:

1116 967 747 0.3636

221 1934 1490 0.7289B

− = =

De forma que la estimación VI de la función de consumo resulta ser:

Ct = 0.3636 + 0.7289Yt

Si la suma residual del modelo es 3.17, tenemos que la varianza del error de estimación es:

1

2 1 1( ) '·( ) 3.170.028

116 2v

y ZB y ZB

T kσ − −= = =

− −

Con lo que la matriz de varianzas y covarianzas de los estimadores es:

( ) ( ) ( )1

1 11 12 * * * *

' 116 967 116 221 116 967ˆ ' ' ' 0.028

221 1934 221 444 221 1934

0.1856 0.09290.028

0.0058 0.0030

v Z Z Z Z Z Zσ− −

− − = =

− = −

Para contrastar si la propensión marginal al consumo es significativamente distinta de cero,

necesitamos su desviación típica tal que:

ˆ( ) 0.028 0.0030 0.0092DesvTipβ = × =

Dado que la desviación típica es βσ = 0.0092, el estadístico t es:

ˆ 0.728979.23

0.0092t

β

βσ

= = =

Valor sensiblemente superior a 1.645, valor tabulado para una distribución t de Student con 114

grados de libertad al 95% de confianza.

Resultado que confirma que el parámetro β es significativamente distinto de cero, por ser mayor

que el valor de teórico de una t de Student (ttco=1.980) con 112 grados de libertad con un nivel de

confianza del 95%.

A su vez la varianza del parámetro α es:

ˆ( ) 0.028 0.1798 0.00503Var α = ⋅ =

Al ser la desviación típica 0.07ασ = ; el estadístico t es, por tanto:

ˆ 0.263.61

0.07t

α

ασ

= = =

por lo que α resulta también estadísticamente significativo.

8.4. MÍNIMOS CUADRADOS EN DOS ETAPAS (MC2E)

El método denominado Mínimos Cuadrados en 2 Etapas (MC2E), al igual que los métodos de

Mínimos Cuadrados Indirectos y Variables Instrumentales, intenta dar una solución al problema

de la inconsistencia de los estimadores MCO en los sistemas de ecuaciones simultáneas. Sin

embargo, este método presenta la ventaja adicional de que puede utilizarse tanto en ecuaciones

exactamente identificadas como sobreidentificadas.

En particular, en el caso de las ecuaciones sobreidentificadas, la aplicación del método MC2E

ofrece un único valor para cada parámetro, que puede considerarse una combinación lineal de los

diversos estimadores que se obtendrían aplicando MCI. Por su parte, si se utiliza MC2E en

ecuaciones exactamente identificadas se obtiene la misma estimación que con los métodos MCI

y VI.

El método MC2E, como su propio nombre indica, consta de dos etapas:

− En una primera etapa, para eliminar la correlación existente entre la(s) variable(s)

endógena(s) y el término de error, se realiza la regresión de la(s) variable(s)

endógena(s) sobre todas las variables predeterminadas del modelo.

− Posteriormente, en una segunda etapa las regresiones efectuadas en la primera etapa

se utilizan para sustituir las variables endógenas de la ecuación inicial por los valores

estimados en la primera etapa. Seguidamente se estima la relación original con los

nuevos valores.

Por ejemplo, si partimos de un modelo de ecuaciones simultáneas con dos variables endógenas

Y1, Y2, y cuatro variables exógenas X1 , X2, X3, X4, la estimación por MC2E de la siguiente ecuación

del modelo:

ttttt uXXYY 2424323201212 ++++= βββα

Requiere en la primera etapa estimar:

Y1t=π10+π11X1t+π12X2t+π13X3t+π13X3t+v1t

De tal forma que:

ttt vYY 111ˆ +=

En la segunda etapa se reemplaza Y1t por los valores estimados en la etapa anterior tY1 , quedando

ahora la ecuación original como:

tttttt uXXvYY 24243232011212 )ˆ( +++++= βββα

tttttt uvXXYY 2121424323201212ˆ +++++= αβββα

*2424323201212

ˆttttt uXXYY ++++= βββα

La estimación de esta ecuación nos asegura la consistencia de las estimaciones MCO, al no estar

correlacionada tY1 con Y2t y a la vez sí estar muy correlacionada con X3 y X4 .

El método MC2E puede también resolverse de forma matricial: supongamos que la relación i-

ésima del modelo es:

yi =Yjαj + Xjβj+uj

donde yi es el vector de la variable endógena, Yj es la matriz de las variables endógenas

predeterminadas y Xj es la matriz de las variables exógenas de la ecuación.

Entonces los estimadores MC2E del modelo se obtienen resolviendo:

$

$

$' $ $'

' $ '

$'

'

αβ

j

j

j j j j

j j j j

j i

j i

Y Y Y X

X Y X X

Y y

X y

=

−1

(8.8)

siendo:

$ ( ' ) 'Y X X X X Yj j= −1

' 1ˆ ˆ ' ( ' ) 'j j j jY Y Y X X X X Y−=

' 1ˆ ' ( ' ) 'j j j iY y Y X X X X y−=

ˆ ' 'j j j jY X Y X=

Donde X es la matriz de todas las variables exógenas del modelo.

Así, por ejemplo en la estimación MC2E del modelo:

y1=α11y2+β11x1+u1

y2=α11y1+β22x2+β23x3+u2

Hay que estimar la primera relación del modelo, teniendo presente que yi=y1 , Yj=y2 y Xj=x1

[ ]Y X y x y x y x

X X

x x x x x

x x x x x

x x x x x

X X x

X y x y

j

j j

j i

'

'

'

'

=

=

=

=

∑ ∑ ∑

∑ ∑ ∑∑ ∑ ∑∑ ∑ ∑∑∑

2 1 2 2 2 3

12

1 2 1 3

2 1 22

2 3

3 1 3 2 32

12

1 1

Para estimar la segunda ecuación del modelo hay que tener presente que yi=y2 , Yj=y1 y

[ ]32 xxX j =

1 1 1 2 1 3

22 2 3

22 3 3

2 2

3 2

'

'

'

j

j j

j i

Y X y x y x y x

x x xX X

x x x

x yX y

x y

=

=

=

∑ ∑ ∑∑ ∑∑ ∑∑∑

Los errores asociados a los coeficientes se calculan a través de la formulación asintótica de la

matriz de covarianzas para muestras finitas, es decir:

112

ˆ '( ' ) ' 'ˆˆ ' '

j j j j jj

j j j jj

Y X X X Y Y XVar

X Y X X

ασ

β

−− =

(8.9)

siendo:

( ) ( )2

'ˆ ˆˆ ˆˆ

i j j j j i j j j j

j

y Y X y Y X

T k

α β α βσ

− − − −=

−

es decir, la suma residual del modelo dividida por los grados de libertad de la ecuación que se

estima (número de observaciones menos número de parámetros que se estiman).

8.4.1. Estimación de un modelo de gastos e ingresos por MC2E Supongamos que una empresa pretende conocer la evolución de sus ingresos (ING), teniendo en

cuenta los gastos de explotación (GAS), el capital invertido (SK), el número de trabajadores (L) y

un índice de actividad económica (ACT). Para ello, plantea el siguiente modelo de ecuaciones

simultáneas expresado en desviaciones con respecto a la media:

INGt = a1GASt + a2SKt +a3Lt + ut

GASt = b1INGt + b2ACTt + vt

Para estimar el modelo la empresa dispone de la siguiente matriz de sumas de productos cruzados

de las variables del modelo:

ING GAS SK L ACT

ING 11.25 -5.63 -11.25 22.50 -5.63

GAS -5.63 90.00 -5.63 22.50 -4.50

SK -11.25 -5.63 11.25 5.00 7.00

L 22.50 22.50 5.00 22.50 2.00

ACT -5.63 -4.50 7.00 2.00 11.25

Aplicando las condiciones de orden y rango tenemos que:

Condición de Orden

1ª ecuación Variables excluidas = 1 = 2–1 Ecuación Exactamente Identificada

2ª ecuación Variables excluidas = 2 > 2–1 Ecuación Sobreidentificada

Condición de Rango

ING GAS SK L ACT 1ª Ecuación 1 a1 a2 a3 0 2ª Ecuación b1 1 0 0 b2

1ª ecuación Rang[b2] = 1 = 2–1 Ec. Identificada

2ª ecuación Rang[a2] = Rang[a3] = 1 = 2–1 Ec. Identificada

La presencia de una ecuación sobreidentificada provoca que los métodos MCI y VI no sean

válidos para estimar el modelo completo por lo que debemos recurrir al método de Mínimos

Cuadrados en 2 Etapas, obteniendo estimaciones consistentes y únicas para cada parámetro.

1ª Ecuación

En la primera etapa debemos eliminar la correlación existente entre la variable GASt y el término

de error regresando dicha variable sobre todas las variables predeterminadas del modelo. Es decir,

debemos estimar por MCO la relación:

1 2 3t t t t tGAS SK L ACT eπ π π= + + +

Cuya estimación resulta ser:

1

11

2

3

ˆ 11.25 5.00 7.00 5.63 2.17

ˆ ( ' ) ' 5.00 22.50 2.00 · 22.50 1.33

ˆ 7.00 2.00 11.25 4.50 1.74

X X X Y

πππ

−

−

− − = = = −

Por lo que la relación estimada es:

2.17 1.33 1.74t t t t tGAS SK L ACT e= − + + +

En la segunda etapa de la estimación por MC2E debemos trasladar el resultado de la estimación

en la primera etapa de GASt, sustituyéndola en la ecuación que deseamos estimar por el valor

original de dicha variable; es decir:

1 2 3tt t t tING a GAS a SK a L u= + + +

La estimación MCO de dicha ecuación es:

12

11 2

2

23

( ' ) '

t t tt t t t

tt t t t t t

t ttt t t t

GAS GAS SK GAS La GAS ING

a X X X Y SK GAS SK SK L SK ING

a L INGL GAS L SK L

−

−

= =

∑ ∑ ∑ ∑∑ ∑ ∑ ∑

∑∑ ∑ ∑

Antes de proceder a operar con las matrices anteriores, debemos obtener los productos cruzados

relacionados con la variable tGAS tal que:

( )2 2

2 2 2 2 2 2

2.17 1.33 1.74

( 2.17) (1.33) (1.74)

2·2.17·1.33 2·2.17·1.74 2·1.33·1.74 33.67

t t t t

t t t

t t t t t t

GAS SK L ACT

SK L ACT

SK L SK ACT L ACT

= − + +

= − + +

− − + =

∑ ∑∑ ∑ ∑∑ ∑ ∑

2

( 2.17 1.33 1.74)·

11.25

( 2.17 1.33 1.74)· 5.00 5.63

7.00

t

t tt t t t

t t

SK

GAS SK SK GAS L SK

ACT SK

= = −

= − = −

∑∑ ∑ ∑

∑

2( 2.17 1.33 1.74)·

5.00

( 2.17 1.33 1.74)· 22.50 22.5

2.00

t t

t tt t t

t t

SK L

GAS L L GAS L

ACT L

= = −

= − =

∑∑ ∑ ∑

∑

( 2.17 1.33 1.74)·

11.25

( 2.17 1.33 1.74)· 22.50 39.69

5.63

t t

t t t t

t t

SK ING

GAS ING L ING

ACT ING

= −

− = − = −

∑∑ ∑

∑

Sustituyendo los valores tenemos que:

1

1

2

3

33.67 5.63 22.5 39.69 6.09

5.63 11.25 5 11.25 4.78

22.5 5 22.50 22.50 6.15

a

a

a

−− = − − = −

Alternativamente podemos estimar la ecuación aplicando la forma matricial del estimador; así,

denominando yi=INGt, Yj=GASt y Xj=[SKt Lt] tenemos que:

2

2

'

'

'

j t t t t t t

t t tj j

t t t

t tj i

t t

Y X GAS SK GAS L GAS ACT

SK SK LX X

SK L L

SK INGX y

L ING

=

=

=

∑ ∑ ∑∑ ∑∑ ∑∑∑

Por tanto:

' 1

12

2

2

'

ˆ ˆ ' ( ' ) '

· · 33.67

j j j j

t t t t t t t t t

t t t t t t t t t

t t t t t t t t t

Y Y Y X X X X Y

SK GAS SK SK L SK ACT SK GAS

L GAS SK L L L ACT L GAS

ACT GAS SK ACT L ACT ACT ACTGAS

−

−

=

= =

∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑

' 5.63ˆ '22.50

t tj j j

t t

SK GASY X Y X

L GAS

− = = =

∑∑

2'

2

11.25 5.00

5.00 22.50t t t

j jt t t

SK SK LX X

SK L L

= =

∑ ∑∑ ∑

' 1

12

2

2

'

ˆ ' ( ' ) '

· · 39.69

j j j j

t t t t t t t t t

t t t t t t t t t

t t t t t t t t t

Y y Y X X X X y

SK GAS SK SK L SK ACT SK ING

LGAS SK L L L ACT L ING

ACTGAS SK ACT L ACT ACT ACT ING

−

−

=

= =

∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑

' 11.25

22.50t t

j jt t

SK INGX y

L ING

− = =

∑∑

Sustituyendo los valores en la expresión matricial del estimador tenemos que:

11

1

2

3

33.67 5.63 22.50 39.69 6.09ˆ ˆ ˆ ˆ' ' '5.63 11.25 5.00 11.25 4.78

ˆ '' '22.50 5.00 22.50 22.50 6.15

j j j j j i

j ij j j j

aY Y Y X Y y

aX yX Y X X

a

−− − = = − − = −

2ª Ecuación

En la primera etapa debemos eliminar la correlación existente entre INGt y el término de error

regresando dicha variable sobre todas las variables predeterminadas del modelo. Es decir,

debemos estimar por MCO la relación:

1 2 3t t t t tING SK L ACT eπ π π= + + +

Cuya estimación resulta ser:

1

11

2

3

ˆ 11.25 5.00 7.00 11.25 1.87

ˆ ( ' ) ' 5.00 22.50 2.00 · 22.50 1.38

ˆ 7.00 2.00 11.25 5.63 0.42

X X X Y

πππ

−

−

− − = = = −

Por lo que la relación estimada es:

1.87 1.38 0.42t t t t tING SK L ACT e= − + + +

En la segunda etapa de la estimación por MC2E debemos trasladar el resultado de la estimación

en la primera etapa de INGt, sustituyéndola en la ecuación que deseamos estimar por el valor

original de dicha variable; es decir:

1 2tt t tGAS b ING b ACT v= + +

La estimación MCO de dicha ecuación es:

12

1 1

22

( ' ) 't t tt t

t ttt t

ING ING ACTb ING GASX X X Y

b ACTGASACT ING ACT

−

− = =

∑ ∑ ∑∑∑ ∑

Antes de proceder a operar con las matrices anteriores, debemos obtener los productos cruzados

relacionados con la variable tING tal que:

( )2 2

2 2 2 2 2 2

1.87 1.38 0.42

( 1.87) (1.38) (0.42)

2·1.87·1.38 2·1.87·0.42 2·1.38·0.42 49.76

t t t t

t t t

t t t t t t

ING SK L ACT

SK L ACT

SK L SK ACT L ACT

= − + +

= − + +

− − + =

∑ ∑∑ ∑ ∑∑ ∑ ∑

2

( 1.87 1.38 0.42)·

7.00

( 1.87 1.38 0.42)· 2.00 5.63

11.25

t t

t tt t t t

t

SK ACT

ING ACT ACT ING L ACT

ACT

= = −

= − = −

∑∑ ∑ ∑

∑

( 1.87 1.38 0.42)·

5.63

( 1.87 1.38 0.42)· 22.50 39.69

4.50

t t

t t t t

t t

SK GAS

ING GAS L GAS

ACT GAS

= −

− = − = −

∑∑ ∑

∑

Sustituyendo los valores tenemos que:

1

1

2

49.76 5.63 39.69 0.7975

5.63 11.25 4.50 0.0001

b

b

−− = = − − −

También podemos estimar la ecuación aplicando la forma matricial del estimador; así,

denominando yi=GASt, Yj=INGt y Xj=[ACTt] tenemos que:

2

'

'

'

j t t t t t t

j j t

j i t t

Y X ING SK ING L ING ACT

X X ACT

X y ACT GAS

=

=

=

∑ ∑ ∑∑∑

Por tanto:

' 1

12

2

2

'

ˆ ˆ ' ( ' ) '

· · 49.76

j j j j

t t t t t t t t t

t t t t t t t t t

t t t t t t t t t

Y Y Y X X X X Y

SK ING SK SK L SK ACT SK ING

L ING SK L L L ACT L ING

ACT ING SK ACT L ACT ACT ACT ING

−

−

=

= =

∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑

( ) ( )'ˆ ' 5.63j j j t tY X Y X ACT ING= = = −∑

' 2 11.25j j tX X ACT= =∑

' 1

12

2

2

'

ˆ ' ( ' ) '

· · 39.69

j j j j

t t t t t t t t t

t t t t t t t t t

t t t t t t t t t

Y y Y X X X X y

SK ING SK SK L SK ACT SK GAS

L ING SK L L L ACT L GAS

ACT ING SK ACT L ACT ACT ACTGAS

−

−

=

= =

∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑∑ ∑ ∑ ∑ ∑

' 4.50j j t tX y ACT GAS= = −∑


1 1

1

2

ˆ ˆ ˆ ˆ' ' 49.76 5.63 39.69 0.7975'ˆ 5.63 11.25 4.50 0.0001'' '

j j j j j i

j ij j j j

Y Y Y Xb Y y

b X yX Y X X

− − − = = = − − −

8.5. MODELOS RECURSIVOS

En el epígrafe 8.2. se ha mostrado como los estimadores MCO producen estimadores sesgados e

inconsistentes en los modelos de ecuaciones simultaneas, debido a la relación entre la

perturbación aleatoria y las variables explicativas endógenas. En este apartado vamos a analizar

un caso especial de los modelos de ecuaciones simultáneas en el que MCO sí proporciona

estimadores insesgados y eficientes: se trata de los modelos recursivos.

Estos modelos deben satisfacer una serie de restricciones:

− La matriz de coeficientes de las variables endógenas del sistema, Γ, debe ser

triangular.

Así, en el siguiente modelo de ecuaciones simultaneas:

α11Y1t +β11X1t+ β12X2t+…+β1mXmt =u1t

α21Y1t+α22Y2t + β21X1t+ β22X2t+…+β2mXmt =u2t.

α31Y1t+α32Y2t+α33Y2t + β31X1t+ β32X2t+…+β3mXmt =u2t.

.

.

αn1Y1t+αn2Y2t +…+αnnYnt + βn1X1t+ βn2X2t+…+βnmXmt =unt.

Se observa que la triangularidad existe, ya que la matriz Γ tiene la siguiente forma:

=Γ

nnnnn αααα

ααααα

α

...

0......

0...

0...0

0...00

321

333231

2221

11

− Las perturbaciones o términos de error de cada una de las ecuaciones del sistema no

están correlacionadas con las variables endógenas que aparecen como explicativas en

dicha ecuación; tampoco lo están con las perturbaciones de otras ecuaciones ni en el

mismo periodo de tiempo (correlación contemporánea) ni en periodos de tiempo

distintos.

Esta propiedad implica que la matriz de covarianzas de las perturbaciones aleatorias

debe ser diagonal, tal que:

=∑

nσ

σσ

σ

...000

0......

0...00

0...00

0...00

3

2

1

Para identificar un modelo recursivo hay que realizar una ordenación previa de las ecuaciones, de

manera que la primera ecuación tenga sólo una variable endógena; la segunda ecuación deberá

tener dos variables endógenas, siendo una de ellas la endógena de la ecuación anterior; la tercera

ecuación tendrá sólo tres variables endógenas, pero dos de ellas deberán ser las de las ecuaciones

anteriores, y así sucesivamente hasta llegar a la última ecuación.

La estimación de los modelos recursivos no plantea especiales problemas, ya que la segunda

condición de recursividad garantiza que las variables explicativas de cada ecuación estarán

incorrelacionadas con el término de error de esa misma ecuación, lo que permite estimar el

modelo aplicando MCO a cada ecuación.

La reordenación de ecuaciones determina que la primera ecuación tenga una variable endógena

(y ninguna variable endógena actuando como predeterminada), el conjunto de variables exógenas

y la perturbación aleatoria. Como las variables exógenas no están correlacionadas con el término

de error se puede aplicar MCO, obteniéndose estimadores insesgados y consistentes.

En la segunda ecuación y posteriores las variables endógenas de las ecuaciones previas tienen la

consideración de variables predeterminadas, por lo que se da una completa independencia entre

los regresores y las perturbaciones, permitiendo la adecuada estimación de cada ecuación por

MCO sin problemas de inconsistencia e insesgadez.

La naturaleza de los modelos recursivos determina que en éstos no exista el problema de tener

que identificar cada una de sus ecuaciones, es decir, una vez identificado el modelo como

recursivo se procede a estimar ecuación por ecuación sin tener que realizar la identificación

individual de las ecuaciones del modelo.

8.5.1. Estimación de un Modelo Recursivo de Determinación de

Precios y Salarios Sea el siguiente modelo de determinación de precios y salarios:

Pt=b10+b11Wt-1+b12Lt+u1t

Wt= b20+b11Ut+b12Pt+u2t

Donde Pt es el incremento anual de precios, Wt la tasa de cambio de los salarios por ocupado, Lt

la tasa de variación de la productividad laboral y Ut la tasa de desempleo.

El modelo es recursivo, ya que la matriz

=Γ

1

01

12bes triangular. Asumiendo que

Cov(u1t,u2t)=0, puede estimarse el modelo aplicando MCO ecuación por ecuación. Para ello, se

utilizan los siguientes datos relativos a la economía española para el periodo 1981-2002:

Periodo % Var. Deflactor PIB (Pt)

% Var. Salarios

Medios por Ocupado

(Wt)

% Var. Anual

Productividad (Lt)

Tasa de Paro

(Ut)

Periodo % Var. Deflactor PIB (Pt)

% Var. Salarios

Medios por Ocupado

(Wt)

% Var. Anual

Productividad (Lt)

Tasa de Paro

(Ut)

198101 14.14% 18.21% 1.64% 13.38% 199103 7.09% 11.46% 2.93% 16.33% 198102 13.49% 15.25% 1.67% 13.64% 199104 5.05% 7.86% 3.51% 16.93% 198103 13.49% 12.56% 1.91% 14.11% 199201 4.47% 10.89% 1.05% 17.40% 198104 13.20% 10.62% 1.87% 14.99% 199202 4.35% 10.32% 2.25% 17.71% 198201 13.02% 12.87% 3.48% 15.51% 199203 4.38% 4.92% 2.39% 18.27% 198202 12.14% 16.35% 2.41% 15.33% 199204 4.90% 4.15% 1.54% 20.03% 198203 11.72% 13.99% 1.77% 15.93% 199301 3.98% 3.93% 4.27% 21.69% 198204 10.88% 12.68% 2.26% 16.61% 199302 4.03% 4.34% 3.88% 22.17% 198301 10.98% 15.09% 4.49% 17.28% 199303 3.90% 2.71% 2.22% 22.87% 198302 11.47% 12.05% 5.10% 16.88% 199304 3.64% 3.74% 0.71% 23.83% 198303 10.81% 9.78% 5.36% 17.18% 199401 5.01% 2.90% 0.76% 24.55% 198304 10.27% 6.55% 5.54% 17.97% 199402 5.31% 4.32% 0.03% 24.22% 198401 9.03% 8.32% 3.57% 19.6% 199403 4.82% 3.46% -0.33% 23.80% 198402 8.20% 9.15% 3.56% 19.67% 199404 4.63% 4.00% 1.02% 23.90% 198403 8.73% 10.05% 2.58% 19.97% 199601 3.77% 3.88% 1.44% 23.49% 198404 8.44% 8.70% 1.76% 21.08% 199602 3.46% 4.73% 2.45% 22.70% 198501 10.87% 11.42% 0.89% 21.50% 199603 3.52% 5.23% 1.40% 22.65% 198502 10.80% 10.49% 1.33% 21.53% 199604 3.35% 4.18% -0.19% 22.76% 198503 10.92% 8.14% -0.56% 21.30% 199701 2.98% 2.28% -1.00% 22.92% 198504 10.92% 8.18% -2.20% 21.48% 199702 1.88% 1.80% -0.72% 22.26% 198601 6.22% 8.27% -0.31% 21.65% 199703 2.19% 2.11% -0.03% 21.82% 198602 6.05% 6.77% -1.81% 21.02% 199704 2.24% 3.03% 1.55% 21.73% 198603 5.95% 7.10% 1.34% 20.59% 199801 1.78% 4.09% 0.55% 21.46% 198604 5.52% 6.37% 2.69% 20.64% 199802 2.84% 3.04% 0.06% 20.88% 198701 6.10% 8.61% 1.28% 21.01% 199803 2.72% 2.22% 0.60% 20.46% 198702 6.00% 9.64% 1.14% 20.2% 199804 2.24% 1.74% -1.05% 20.22% 198703 5.90% 6.45% 1.21% 19.93% 199901 2.62% 2.18% -0.96% 19.51% 198704 5.81% 5.88% -0.51% 19.75% 199902 2.53% 2.75% -0.26% 18.83% 198801 6.92% 6.92% -0.09% 19.99% 199903 2.90% 2.49% -0.25% 18.41% 198802 6.74% 6.56% -0.52% 19.61% 199904 2.88% 3.40% 0.50% 18.09% 198803 7.14% 7.63% -1.68% 19.04% 200001 3.15% 4.30% 2.15% 16.89% 198804 6.80% 8.08% -0.68% 18.31% 200002 3.30% 3.89% 0.53% 15.49% 198901 7.15% 10.16% -1.79% 18.26% 200003 3.61% 3.25% -1.07% 15.29% 198902 7.40% 11.00% -1.81% 17.26% 200004 3.85% 3.54% -1.21% 15.32% 198903 7.33% 10.47% -2.20% 16.56% 200101 3.89% 3.28% -0.35% 14.89% 198904 7.35% 9.15% 1.54% 16.88% 200102 4.62% 4.00% -0.41% 13.83% 199001 6.92% 9.73% 0.15% 16.76% 200103 4.08% 4.68% 0.18% 13.57% 199002 6.54% 10.13% 0.05% 16.25% 200104 4.06% 4.33% 0.25% 13.44% 199003 7.04% 10.23% 1.84% 15.85% 200201 3.96% 3.96% -0.11% 10.87% 199004 7.29% 10.42% -0.51% 16.09% 200202 4.21% 3.82% -0.17% 10.35% 199101 7.56% 13.34% 3.89% 16.11% 200203 4.63% 3.81% -0.09% 10.25% 199102 7.34% 13.53% 2.54% 15.88% 200204 4.74% 4.23% 0.46% 10.50% Fuente: Elaboración propia a partir de datos del INE.

La estimación de la ecuación de precios por MCO es:


Coeficientes Error típico Estadístico t Constante 0.01272847 0.00410008 3.104446 Crecimiento de los salarios medios por ocupado del trimestre anterior

0.68870367 0.0541869 12.7097812

Crecimiento anual de la productividad 0.18542501 0.11484988 1.61449891

En consecuencia, la función de precios de la economía española es la siguiente:

Pt=0.0127+0.6887Wt-1+0.1854Lt+u1t

Por su parte, la estimación de la ecuación de salarios ofrece los siguientes resultados:


Coeficientes Error típico Estadístico t Término constante 0.03663072 0.01505487 2.43314844 Crecimiento del deflactor PIB 1.00434242 0.07172996 14.0017142 Tasa de desempleo -0.0015008 0.00069398 -2.16258469

La función de salarios de la economía española quedaría como sigue:

Wt= 0.0366–0.0015Ut+1.004Pt+u2t

En la que se puede apreciar como el aumento de la tasa de paro desacelera el crecimiento de los

salarios en España.

8.6. EJEMPLO PRÁCTICO: ESTIMACIÓN DE UN MODELO

EXACTAMENTE IDENTIFICADO POR MCI, VI Y MC2E

A continuación se presenta un ejemplo en el que se aplican todos los métodos de estimación presentados a lo largo del capítulo. Para ello, retomamos el ya conocido modelo de oferta y demanda clásico, en el que se ha omitido la variable Ft por no ser significativa, tal que:

Qt=a1Pt+a2Rt+u1t

Pt=b1Qt+b2Prt+u2t

La matriz de sumas de productos cruzados de las variables del modelo es la siguiente:

Q P R Pr Q 3.5 3 1 1

P 3 11.5 1 3

R 1 1 1 0

Pr 1 3 0 1

A fin de saber qué método de estimación es el más apropiado, procedemos a la identificación del

modelo aplicando las condiciones de orden y rango:

Condición de Orden



Condición de Rango

Q P R Pr 1ª Ecuación 1 a1 a2 0 2ª Ecuación b1 1 0 b2

1ª ecuación Rang[b2] = 1 = 2–1 Ec. Identificada

2ª ecuación Rang[a2] = 1 = 2–1 Ec. Identificada

Al estar ambas ecuaciones exactamente identificados podemos aplicar indistintamente los tres

métodos descritos en el capítulo (MCI, VI, MC2E), ya que las estimaciones obtenidas por

cualquiera de ellos serán iguales.

Mínimos Cuadrados Indirectos

La forma reducida del modelo es:

Qt= π11Rt + π12Prt+e1t

Pt= π21Rt + π22Prt +e2t

La estimación de los parámetros de la forma reducida es:

1211 21

212 22

Pr 1 1ˆ 'Pr PrPr Pr 1 3

t t t tt t t

t t t tt t t

R Q R PR R

Q PR

π ππ π

− Π = = =

∑ ∑∑ ∑∑ ∑∑ ∑

A partir de los parámetros de la forma reducida, podemos recuperar los parámetros estructurales

mediante la siguiente expresión:

ˆ BΓΠ = −

Por tanto:

1 2

1 2

1 01 1

1 01 3

a a

b b

− = −

A partir de las matrices anteriores podemos construir el siguiente sistema de ecuaciones:

1 2

1

1

1 2

1

1 3 0

1 0

3

a a

a

b

b b

− =− =− =− =

Despejando los parámetros del sistema de ecuaciones anterior obtenemos que:

a1 = 0.33, a2 = 0.67 , b1 = 1, b2 = 2

Por lo que el modelo estimado es:

Qt = 0.33Pt + 0.67Rt+u1t

Qt = Pt + 2Prt+u2t

Variables Instrumentales

1ª Ecuación

Vamos a utilizar la variable Prt como instrumento de Pt para la estimación de la primera ecuación,

por lo que las matrices de variables endógenas, exógenas e instrumentos serán, respectivamente:

1 1 1 1 1

2 2 2 2 21

Pr

Pr *

PrT T T T T

Q P R R

Q P R Ry Z Z

Q P R R

= = =

M M M M M

A partir de dichas matrices podemos calcular:

* *12

Pr Pr Pr' '

Pt t t t t t

t t t t t

P R QZ Z Z y

R R R Q

= =

∑ ∑ ∑∑ ∑ ∑

Siendo la estimación de la primera ecuación:

( )1

11 * *1

2

3 0 1 0.33' '

1 1 1 0.67

aZ Z Z y

a

−− = = =

2ª Ecuación

En este caso, se utiliza Rt como instrumento de Qt, siendo las matrices de variables endógenas,

exógenas e instrumentos respectivamente:

1 1 1 1 1

2 2 2 2 21

Pr Pr

Pr Pr *

Pr PrT T T T T

P Q R

P Q Ry Z Z

P Q R

= = =

M M M M M

Con las que podemos obtener:

* *12

Pr' '

Pr Pr Prt t t t t t

t t t t t

R Q R R PZ Z Z y

Q P

= =

∑ ∑ ∑∑ ∑ ∑

La estimación de la segunda ecuación resulta ser:

( )1

11 * *1

2

1 0 1 1' '

1 1 3 2

bZ Z Z y

b

−− = = =

Mínimos Cuadrados en 2 Etapas

1ª Ecuación

Dado que ya hemos estimado la forma reducida del modelo al aplicar Mínimos Cuadrados

Indirectos, aprovecharemos el resultado obtenido en ese apartado ya que en la primera etapa es

necesario estimar:

Pt= π21Rt + π22Prt +e2t

La estimación dió el siguiente resultado:

Pt = Rt + 3Prt +e2t

En la segunda etapa debemos calcular:

12

1 1

22

ˆ ˆ ˆ( ' ) '

ˆt t t t t

t tt t t

P PRa Q PX X X Y

a Q RPR R

−

− = =

∑ ∑ ∑∑∑ ∑

Previamente debemos obtener los productos cruzados asociados a tP :

2 2 2 2 2 2ˆ ( 3Pr ) 1 +3 Pr 2·1·3 Pr 10t t t t t t tP R R R= + = + =∑ ∑ ∑ ∑

2

ˆ (1 3) 1Prt

t tt t

RP R

R

= =

∑∑ ∑

ˆ (1 3) 4Pr

t tt t

t

RQQ P

Q

= =

∑∑ ∑

La estimación de la primera ecuación resulta ser:

1

1

2

10 1 4 0.33

1 1 1 0.67

a

a

− = =

También podemos estimar la ecuación aplicando la forma matricial del estimador; así,

denominando yi=Qt, Yj=Pt y Xj=[Rt] tenemos que:

2

' Pr

'

'

j t t t t

j j t

j i t t

Y X R P P

X X R

X y R Q

=

=

=

∑ ∑∑∑

Por tanto:

' 1

12

2

'

ˆ ˆ ' ( ' ) '

Pr· · 10

Pr PrPr Pr

j j j j

t t t tt t t

t t t tt t t

Y Y Y X X X X Y

R P R PR R

P PR

−

−

=

= =

∑ ∑∑ ∑∑ ∑∑ ∑

( )'ˆ ' 1j j j j t tY X Y X PR= = =∑

' 2 1j j tX X R= =∑

' 1

12

2

'

ˆ ' ( ' ) '

Pr· · 4

Pr PrPr Pr

j j j j

t t t tt t t

t t t tt t t

Y y Y X X X X y

PR Q RR R

P QR

−

−

=

= =

∑ ∑∑ ∑∑ ∑∑ ∑

' 1j j t tX y R Q= =∑


1 1

1

2

ˆ ˆ ˆ ˆ' ' 10 1 4 0.33'ˆ 1 1 1 0.67'' '

j j j j j i

j ij j j j

Y Y Y Xa Y y

a X yX Y X X

− − = = =

2ª Ecuación

Nuevamente utilizamos los resultados obtenidos al estimar la forma reducida al aplicar MCI, dado

que ahora hay que estimar la siguiente relación:

Qt= π11Rt + π12Prt +e1t

Recordemos que el resultado que se obtuvo fue:

Qt = Rt + Prt +e1t

En la segunda etapa debemos calcular:

12

1 1

22

ˆ ˆ ˆPr( ' ) '

ˆ PrPr Pr

t t t t t

t tt t t

Q Qb Q PX X X Y

b PQ

−

− = =

∑ ∑ ∑∑∑ ∑

Previamente debemos obtener los productos cruzados asociados a tP :

2 2 2 2 2 2ˆ ( Pr ) 1 +1 Pr 2·1·1 Pr 2t t t t t t tQ R R R= + = + =∑ ∑ ∑ ∑

2

Prˆ Pr (1 1) 1Prt t

t tt

RQ

= =

∑∑ ∑

ˆ (1 1) 4Pr

t tt t

t t

R PQ P

P

= =

∑∑ ∑

La estimación de la segunda ecuación es:

1

1

2

2 1 4 1

1 1 3 2

b

b

− = =

Alternativamente podemos estimar la ecuación aplicando la forma matricial del estimador; así,

denominando yi=Pt, Yj=Qt y Xj=[Prt] tenemos que:

2

' Pr

' Pr

' Pr

j t t t t

j j t

j i t t

Y X R Q Q

X X

X y P

=

=

=

∑ ∑∑∑

Por tanto:

' 1

12

2

'

ˆ ˆ ' ( ' ) '

Pr· · 2

Pr PrPr Pr

j j j j

t t t tt t t

t t t tt t t

Y Y Y X X X X Y

RQ R QR R

Q QR

−

−

=

= =

∑ ∑∑ ∑∑ ∑∑ ∑

( )'ˆ ' Pr 1j j j j t tY X Y X Q= = =∑

' 2Pr 1j j tX X = =∑

' 1

12

2

'

ˆ ' ( ' ) '

Pr· · 4

Pr PrPr Pr

j j j j

t t t tt t t

t t t tt t t

Y y Y X X X X y

R Q R PR R

Q PR

−

−

=

= =

∑ ∑∑ ∑∑ ∑∑ ∑

' Pr 3j j t tX y P= =∑


1 1

1

2

ˆ ˆ ˆ ˆ' ' 2 1 4 1'ˆ 1 1 3 2'' '

j j j j j i

j ij j j j

Y Y Y Xb Y y

b X yX Y X X

− − = = =

Como puede comprobarse, las estimaciones obtenidas por los tres métodos coinciden al estar las

ecuaciones del modelo exactamente identificadas.

8.7. PROBLEMAS

8.1. Dado el siguiente modelo expresado en desviaciones con respecto a la media:

1 12 2 11 1 12 2

2 21 1 23 3

t t t t t

t t t t

Y b Y a X a X u

Y b Y a X v

= + + += + +

Siendo Yi, variables endógenas, y Xi variables exógenas, estime los parámetros de la forma

reducida del modelo y, a partir de ellos, obtenga las expresiones para los parámetros de la

forma estructural. Para ello, utilice las siguientes matrices producto:

10 0 0 5 10

( ' ) = 0 20 0 ; ( ' ) = 40 20

0 0 10 20 30

X X X Y

8.2. Partimos del siguiente sistema de ecuaciones simultáneas:

1 11 2 10 11 12 1

2 21 1 20 2

t t t t t

t t t

Y Y I G u

Y Y u

β α α αβ α

= + + + += + +

Donde Y1t es la renta nacional (PIB), Y2t es la oferta monetaria, I t el gasto en inversión y Gt el

gasto del gobierno. Estime consistentemente la segunda ecuación del modelo a partir de los

siguientes datos:

Y1 Y2 I G

Y1 38.05 29.73 7.07 5.31

Y2 23.29 5.55 4.15

I 1.33 9.90

G 0.74

1 20,64; 0,5; 1,19; 0,90; 9Y Y I G N= = = = =

8.3. Considere el siguiente sistema de ecuaciones simultáneas:

1 11 2 11 1 1

2 21 1 22 2 23 3 2

t t t t

t t t t t

y y z u

y y z z u

α βα β β

= + += + + +

Las variables y1 e y2 son endógenas y z1, z2 y z3 son exógenas. Todas las variables están en desviaciones respecto a la media y la suma de sus productos cruzados aparece en la siguiente matriz:

y1 y2 z1 z2 z3

y1 50

y2 15 10

z1 1 0 4

z2 3 0 0 5

z3 5 2 0 0 2

En base a esta información estime por Mínimos Cuadrados en dos Etapas la primera ecuación y estime por Mínimos Cuadrados Indirectos la segunda ecuación.

8.4. Considere el siguiente sistema de ecuaciones simultáneas:

1 11 1 12 2

2 21 1 22 2

t t t t

t t t t

Y a X a X u

Y b Y a X v

= + += + +

Siendo Yit variables endógenas y Xit variables exógenas, ambas expresadas en desviaciones respecto a sus medias. Para ello utilice la siguiente matriz de sumas de productos cruzados:

Y1 Y2 X1 x2

Y1 103 47 152 152

Y2 22 70 68

X1 300 100

X2 200

SOLUCIONES

8.1. 12 11 12 21 232 3 1 6 4 3 presenta dos soluciones, al igual queb / ; a / ; a / ; b a= = − =

8.2. 2 1 20.8627 0.0521t t tY Y u= − +

8.3. 1 2 1 1 2 3 22.5 0.25 ; t t t t t t ty y z u y z u= + + = +

8.4. 1 1 2 2 1 20.304 0.608 ; 0.3738 0.056t t t t t t t tY X X u Y Y X v= + + = + +

9. MÉTODOS DE ESTIMACIÓN NO LINEALES

9.1. INTRODUCCIÓN

La teoría económica propone modelos de relación entre variables económicas, pero generalmente

deja indeterminada la forma funcional de dichas relaciones, por lo que en ocasiones dichas

relaciones pueden ser de tipo no lineal. La cuantificación de dichas relaciones exige un

tratamiento distinto al del caso lineal, utilizando técnicas de estimación que generalmente

implican un mayor coste computacional pero que a cambio ofrecen un mejor ajuste.

Por ello, en el presente capítulo se abordan algunas soluciones de cálculo para cuantificar este

tipo de relaciones, las cuales generalmente exigen la utilización de algoritmos de optimización

numérica en los que, a partir de una expresión general que representa una función de pérdida o de

ganancia, de forma iterativa se evalúa una función objetivo, que variará dependiendo del

procedimiento de estimación elegido, para las distintas combinaciones de los valores numéricos

de los parámetros. El resultado de la estimación final será aquel conjunto de valores paramétricos

que hagan mínima o máxima (según se defina) dicha función objetivo.

Las relacionales no lineales que trataremos no hacen referencia a las variables explicativas sino a

los parámetros incluidos en las relaciones del modelo, ya que las primeras pueden eliminarse

mediante la transformación de datos apropiada. Por ejemplo, si la ecuación que tuviéramos que

estimar fuera:

tttx

t xxey t εβββ +++= 32210 )·ln(1

Bastaría con realizar los siguientes cambios de variable para poder estimar la ecuación mediante

métodos lineales:

ttt

xt

xxz

ez t

322

1

)·ln(

1

==

De tal forma que ahora deberíamos estimar:

tttt zzy εβββ +++= 22110

Ecuación que es completamente lineal tanto en las variables como en los parámetros.

Sin embargo, si el modelo fuera de la forma:

tx

tttexy εβββ ββ +++= 232

2110

No sería posible hacer un cambio de variable similar al que hemos propuesto anteriormente, por

lo que habrá que estimarlo mediante procedimientos de tipo no lineal.

9.2. ESTIMACIÓN DE UN MODELO DE MODELOS NO LINEALES

POR MINIMOS CUADRADOS ORDINARIOS.

Los modelos a estimar no tienen porque ser funciones lineales, pero dado que el método MCO se

aplica exclusivamente a modelos de dependencia lineal, este método podrá utilizarse en todos

aquellos modelos que pueden transformarse en funciones lineales.

Son ejemplos de funciones no lineales que pueden transformarse a lineales, las siguientes:

a) Función Polinómica

La función polinómica:

ktkttt XXXY ββββ ++++= ...2

210

se transforma en lineal:

ktkttt XXXY ββββ ++++= ...22110

Haciendo:

1

22

t t

t t

kkt t

X X

X X

X X

=

=

=M

b) Función Potencial

La función potencial btt aXY = se transforma en lineal tomando logaritmos tal que:

tt XbaY logloglog +=

y se estima:

*10

*

ttXY ββ +=

Haciendo:

tt

tt

XX

YY

log

log*

*

=

=

En consecuencia:

0βea = y 1β=b

c) Función Exponencial

La función exponencial tX

t abY = se transforma en lineal tomando logaritmos tal que:

bXaY tt logloglog +=

y se estima:

ttXY 10

* ββ +=

Haciendo:

* logt tY Y=

En consecuencia 0βea = y 1βeb =

d) Función Logarítmica

La función logarítmica tt XbaY log+= puede estimarse haciendo * logt tX X= , aplicando

MCO después a la expresión:

*10 ttXY ββ +=

En consecuencia 0β=a y 1β=b

9.3. MÍNIMOS CUADRADOS NO LINEALES

El primer método que pasamos a abordar para estimar relaciones de tipo no lineal es el de

Mínimos Cuadrados No Lineales, que no es más que una generalización del procedimiento del

método de Mínimos Cuadrados Ordinarios que venimos utilizando a lo largo del libro. En efecto,

la idea de partida del método mínimo-cuadrático no exige en ningún momento la linealidad del

modelo, si bien la resolución analítica del mismo se complica bastante cuando el modelo no es

lineal.

Consideremos la siguiente expresión de un modelo no lineal:

itt XfY εβ += ),( (11.1.)

Donde f es una función cuya primera derivada es no lineal en β.

El método de Mínimos Cuadrados No Lineales, al igual que su homólogo lineal, trata de

minimizar el sumatorio de los errores del modelo al cuadrado, es decir:

[ ]∑∑==

−==T

ttt

T

tt XfYSR

1

2

1

2 );()(Min βεββ

(11.2.)

Derivando la expresión anterior, obtenemos las condiciones de primer y segundo orden,

necesarias y suficientes para la obtención del mínimo:

Condición de 1º orden

[ ] 0);(

·);(2)(

1

=∂

∂−−=

∂∂

∑=

T

t

ttt

XfXfY

SR

βββ

ββ

Condición de 2º orden

∂∂∂

−−∂

∂∂

∂=

∂∂∂

∑∑==

T

t

ttt

T

t

tt XfXfY

XfXfSR

1

2

1

2

'

);())·;((

'

);(·

);(2

'

)(

ββββ

ββ

ββ

βββ

Matriz que debe ser definida positiva.

Ejemplo 9.1.

Sea el modelo:

tx

tteY εββ β ++= 2

10

Minimizamos la expresión del sumatorio de los residuos del modelo al cuadrado tal que:

[ ]∑∑==

+−==T

t

xt

T

tt

teYSR1

210

1

2 )()( Min 2ββ

ββεβ

Derivando la expresión anterior, tenemos que:

20 1

10

( )2 ( ) 0t

Tx

tt

SRY eββ β β

β =

∂ = − − − = ∂ ∑

2 20 1

11

( )2 ( ) 0t t

Tx x

tt

SRY e eβ ββ β β

β =

∂ = − − − = ∂ ∑

2 20 1 1

12

( )2 ( ) 0t t

Tx x

t tt

SRY e x eβ ββ β β β

β =

∂ = − − − = ∂ ∑

Las ecuaciones obtenidas no poseen una solución analítica directa por lo que es necesario un

método iterativo para obtener los valores de los parámetros βi. Uno de los métodos utilizados para

resolver este tipo de problemas es el algoritmo de Newton-Raphson que pasamos a examinar a

continuación.

9.3.1. Algoritmo de Newton-Raphson

Supongamos que disponemos de una estimación iβ del mínimo β de la función );( βtXf ,

cuyas derivadas son continuas. Si consideramos un entorno del punto iβ , el valor numérico de f

en un punto de dicho entorno puede aproximarse mediante un desarrollo en serie de Taylor de

orden 2 tal que:

[ ] [ ] )ˆ()ˆ()'ˆ(2

1)ˆ()ˆ()ˆ()();( 2'

iiiiiit fffMXf βββββββββββ −∇−+−∇+=≅

Donde )ˆ( if β∇ y )ˆ(2if β∇ son, respectivamente, el gradiente (vector k x 1) y la matriz hessiana

(matriz simétrica de orden k x k) de la función )(βf evaluados en el punto iββ ˆ= .

Podemos mejorar la estimación actual, iβ , reemplazándola por aquel vector que minimice la

expresión cuadrática anterior tal que:

[ ] 0)ˆ()ˆ()ˆ( *2 =−∇+∇=∂∂

iii ffM βββββ

De donde obtenemos que:

[ ] )ˆ()ˆ(ˆˆ 12*1 iiii ff βββββ ∇∇−==

−

+ (11.3.)

La expresión (11.3) permite aproximarse al valor desconocido del vector de parámetros β a partir

de un vector inicial de estimaciones iβ suficientemente próximo a él.

Debe observarse que el punto *β que escogemos como nueva estimación minimiza realmente el

valor de f en el entorno de iβ si la matriz hessiana )ˆ(2if β∇ es definida positiva, lo que estará

garantizado si f es convexa en el punto iβ (es decir, si dicho punto estaba ya lo suficientemente

próximo a un mínimo local de f).

El procedimiento iterativo mediante el que se sustituyen las sucesivas estimaciones obtenidas a

través de la expresión (11.2) como punto de partida en la siguiente etapa del procedimiento hasta

que se satisfagan los criterios de convergencia que el investigador determine (por ejemplo, que la

diferencia entre las estimaciones de los parámetros obtenidos en cada etapa sea inferior a una

determinada cantidad) es lo que se conoce como algoritmo de Newton-Raphson.

La utilización de este algoritmo exige que se verifiquen dos supuestos: por un lado, deben existir

las derivadas que en él aparecen; asimismo, el hessiano de la función debe ser invertible.

El algoritmo de Newton-Raphson permite obtener numéricamente el estimador mínimo-

cuadrático de un modelo en el que Y es una función no lineal de β. En tal caso, la función objetivo

será la que vimos en (11.1), es decir:

[ ]∑=

−==T

ttt XfYSRf

1

2);()()( βββ

Se trata de hallar aquel vector de coeficientes β que minimiza la suma residual al cuadrado,

)(βSR . Para ello tomaremos las expresiones del gradiente y de la matriz hessiana que veíamos

anteriormente:

[ ] 0);(

·);(2)(

1

=∂

∂−−=

∂∂

∑=

T

t

ttt

XfXfY

SR

βββ

ββ

∂∂∂

−−∂

∂∂

∂=

∂∂∂

∑∑==

T

t

ttt

T

t

tt XfXfY

XfXfSR

1

2

1

2

'

);())·;((

'

);(·

);(2

'

)(

ββββ

ββ

ββ

βββ

Y las sustituiremos en la expresión (11.3) que define las etapas del algoritmo tal que:

[ ]

∂∂

−

∂∂∂

−−∂

∂∂

∂+= ∑∑∑

=

−

==+

T

t

ttt

T

t

tT

t

ttii

XfXfY

XfXfY

XfXf

1

1

1

2

11

);(·);(·

'

);())·;((

'

);(·

);(ˆˆβ

ββββ

βββ

ββ

βββ

Una vez se haya logrado la convergencia del algoritmo, se toma como matriz de varianzas y

covarianzas del estimador obtenido, el producto de la estimación de 2εσ y la inversa de la matriz

hessiana:

[ ] 122 )ˆ(−

∇ if βσ ε

Por lo que la distribución asintótica del vector de estimadores será:

[ ]

∇

−122 )ˆ(,îi fN βσβ ε

Ejemplo 9.2.

Veamos cómo se aplicaría algoritmo de Newton-Raphson al modelo que veíamos en el ejemplo

11.1 tomado en desviaciones respecto a la media. En primer lugar, para poder trabajar con la

expresión (11.3) necesitamos calcular el gradiente y la matriz hessiana de la función objetivo tal

que:

[ ]∑=

−==T

t

xt

teySRf1

21

2)()( ββββ

( )( )[ ]∑=

−−=∇T

t

xt

xx ttt eyeef1

11222 , 2)( βββ βββ

−−−=∇ ∑

=

T

t txx

ttxx

t

txx

tx

yeexyeex

yeexef

tttt

ttt

1 12

11

12

2

)2()2(

)2(2)(

2222

222

ββββ

βββ

βββββ

Por lo que la expresión para obtener las sucesivas iteraciones del algoritmo de Newton-Raphson

es:

( )

−

−−−+

=

∑∑

=

−

=+

t

t

t

tttt

tttx

t

T

tx

xT

t txx

ttxx

t

txx

tx

ii

eye

e

yeexyeex

yeexe2

2

2

2222

222 ˆ1

1ˆ

1

ˆ1

1ˆ

1ˆ2

1ˆ

1ˆ

ˆ1

ˆˆ2

2

1

12

1 ˆˆ

·)ˆ2(ˆ)ˆ2(

)ˆ2(ˆ

ˆ

ˆ

ˆ ββ

β

ββββ

ββββ

βββββ

ββ

ββ

9.4. EL ESTIMADOR DE MÁXIMA VEROSIMILITUD

Si el lector tiene algunos conocimientos de Estadística Teórica seguramente sabrá que la

estimación por Máxima Verosimilitud precisa del establecimiento de un supuesto acerca de la

distribución del término de error, a partir de la cual construiremos una función de verosimilitud

que deberemos maximizar.

En general, supondremos que el término de error del modelo, εt, sigue una distribución Normal

con media 0 y varianza, 2εσ ; en ese caso, la función de verosimilitud muestral será:

[ ] [ ]∑=

−−

=

−−

== ∏

T

t

tt XfYT

T

t

XfY

eeL 1

22

22

);(2

12

21

);(2

1

2

2

2

1

2

1),(

βσ

ε

βσ

ε

εεε

πσπσσβ

El logaritmo de la función evaluado en ( )2ˆ,ˆ εσβ es:

[ ] )ˆ(ˆ2

1ˆln

2-ln2

2)ˆ;(

ˆ2

1ˆln

2-ln2

2)ˆ,ˆ(ln

2

2

1

2

2

22 βσ

σπβσ

σπσβε

εε

εε SRTT

XfYTT

LT

tt −−=∑ −−−=

=

Como puede apreciarse, tal y como cabía esperar el parámetro 2ˆεσ no depende de ninguno de los

parámetros del vector β ; por tanto, para maximizar la función de verosimilitud bastará con

seleccionar aquel vector β que minimice la suma residual )ˆ(βSR . Las condiciones de

maximización de la función de verosimilitud serán por tanto:

[ ]∑ =∀=∂

∂−=

∂∂

−=∂

∂=

T

ti

ititt

i

i

i

i kif

XfYSRL

122

2

,...,2,1 0ˆ

)ˆ()ˆ;(

ˆ1

ˆ)ˆ(

·ˆ2

1ˆ

)ˆ,ˆ(ln

βββ

σββ

σβσβ

εε

ε

[ ]∑ =−+−=∂

∂=

T

ttt XfY

TL

1

2

422

2

0)ˆ;(ˆ2

1ˆ2ˆ

)ˆ,ˆ(ln βσσσ

σβεεε

ε

Las soluciones del sistema de ecuaciones anterior proporcionan las estimaciones de Máxima

Verosimilitud del vector β y el parámetro 2εσ bajo la hipótesis de Normalidad en el término de

error.

Como puede apreciarse, los resultados obtenidos coinciden el estimador de Mínimos Cuadrados

No Lineales; asimismo, de la segunda condición de optimalidad se deduce que la estimación de

2εσ es:

[ ]T

SR

T

XfYT

ttt )ˆ()ˆ;(

ˆ 1

2

2 ββσ ε =

∑ −= =

Expresión, como vemos, análoga a la obtenida para el caso lineal.

Finalmente, la expresión de la matriz de covarianzas del estimador de Máxima Verosimilitud

puede aproximarse, para muestras grandes, mediante la inversa de la matriz de información. Dicha

matriz viene dada por11:

∂∂

∂∂

=

4

'

22

20

01

),(

ε

εε

σ

ββσσβT

ff

I

k

k

Si invertimos dicha matriz y sustituimos los valores de los parámetros desconocidos por sus

correspondientes valores estimados tenemos que:

∂∂

∂∂

=

−

T

ff

Var

k

k

4

1'2

2

ˆ20

0ˆˆˆ

)ˆ,ˆ(

ε

εε

σ

ββσ

σβ

Siempre que

∂∂

∂∂

ββff

'

no sea una matriz singular.

11 El desarrollo de la demostración que conduce a esta expresión queda fuera de las pretensiones de este texto.

9.5. APROXIMACIÓN LINEAL DE TAYLOR

Consideremos el siguiente modelo de regresión no lineal siguiente:

itt XfY εβ += ),(

Haciendo lineal la función ),( βtXf , alrededor de una estimación inicial, β mediante un

desarrollo en serie de Taylor de primer orden tenemos que:

tt

tt

XfXfY εββ

βββ +−

∂∂

+≅ )ˆ(ˆ

)ˆ;()ˆ;(

'

Si simplificamos la notación obtenemos:

'

ˆ)ˆ;(

)ˆ(

∂∂

=β

ββ tXfz

Y por tanto:

tt zXfY εββββ +−+≅ )ˆ()ˆ()ˆ;( '

Operando queda que:

ttt zzXfY εβββββ +=+− )ˆ(ˆ)ˆ()ˆ;(

Obteniéndose el siguiente modelo lineal:

tt zY εββ +⋅≅ )ˆ(*

(11.4.)

Donde βββ ˆ)ˆ()ˆ;(* zXfYY ttt +−=

Para un valor determinado de β tanto *Y como )ˆ(βz son observables, y el modelo (11.4) posee

como estimador mínimo cuadrático a:

[ ] *1)ˆ()ˆ()'ˆ(

~tYzzz ββββ

−=

El desarrollo práctico sería el siguiente: debemos plantear una aproximación numérica inicial de

β ; a continuación generar las observaciones numéricas para las variables *Y, )ˆ(βz y proceder a

estimar el modelo (11.4) por MCO obteniendo nuevas estimaciones numéricas paraβ ( )β~ . Con

ellas, calculamos de nuevo las variables *Y, )ˆ(βz e iteramos el procedimiento hasta alcanzar

determinada convergencia.

Si desarrollamos la expresión de los estimadores obtenidos mediante MCO tenemos que:

[ ][ ] ( )

[ ] t

tt

t

zzz

zXfYzzz

Yzzz

εββββ

ββββββ

ββββ

ˆ)ˆ()ˆ()ˆ(ˆ

ˆ)ˆ()ˆ;()ˆ()ˆ()ˆ(

)ˆ()ˆ()ˆ(~

1'

1'

*1'

−

−

−

+=

+−=

==

(11.5.)

La expresión (11.5) proporciona de forma directa los estimadores MCO del modelo linealizado

mediante el desarrollo de Taylor, sin más que sustituir los valores indicados y teniendo en cuenta

que tε es el residuo obtenido al sustituir en el modelo original la estimación inicial, β .

La estimación del parámetro 2ˆεσ puede obtenerse de manera análoga al caso lineal tal que:

kT −= εεσ ε

~'~ˆ 2

Siendo )~,(~ βε XfY −=

Finalmente, si existe la inversa de [ ])ˆ()ˆ( ' ββ zz podemos derivar la distribución de probabilidad

del estimador β~

que será:

[ ]

−1'2 )ˆ()ˆ(, ββσβ ε zzN

Ejemplo 9.3

Si consideramos, ahora, la función:

tttttt uxfuxxy +=++= ),(22

1 θββ

Con )(βθ = , cuyo gradiente es:

( )'21 2

),(tt

t xxxf βθ

θ+=

∂∂

Entonces:

( )

ttttttt

tttttttt

xyxxxxy

xxxxyzxfyy

22

22

122

1

2122

1*

ˆˆ2ˆˆˆ

ˆˆ2ˆˆˆ)ˆ()ˆ,(

βββββ

ββββθθθ

+=++−−=

++−−=+−=,

tt xxz 211ˆ2)ˆ( βθ +=

Por lo que el modelo lineal a estimar resultará ser:

tt zy εθβ += )ˆ(1*

(11.6)

Vamos a aplicar dicho modelo a estimar una ecuación para los siguientes datos de la economía

española:

PIB(millones de euros moneda constante)

Ocupados estudios básicos (miles)

Ocupados estudios superiores (miles)

1991 342.598 10.284 2.773 1992 368.987 9.967 2.856 1993 381.747 9.333 2.960 1994 406.011 9.112 3.096 1995 447.205 9.155 3.357 1996 473.855 9.124 3.747 1997 503.921 9.300 4.046 1998 539.493 9.553 4.351 1999 579.942 9.964 4.725 2000 630.263 10.293 5.213 2001 680.678 10.556 5.590 2002 729.206 10.734 5.896 2003 782.531 11.103 6.193 2004 840.106 11.329 6.641 2005 905.455 11.743 7.231

Partimos de un valor de 1ˆ =β , y calculamos las variables transformadas:

ttt xyy 22* β+= tt xxz 211

ˆ2)ˆ( βθ +=

345.371 15.830 371.842 15.678 384.707 15.254 409.107 15.303 450.562 15.869 477.602 16.619 507.967 17.391 543.844 18.255 584.667 19.415 635.476 20.719 686.268 21.736 735.102 22.527 788.724 23.489 846.747 24.612 912.686 26.204

Utilizando MCO estimamos (1.5):

tt zy εθ += )ˆ(67,30 1*

Transformamos de nuevo las variables utilizando ahora 67,30ˆ =β , y estimamos de nuevo por

MCO el modelo (1.5):

ttt xyy 22* β+= tt xxz 211

ˆ2)ˆ( βθ +=

2.950.626 180.377 3.054.324 185.102 3.165.652 190.897 3.317.346 198.986 3.604.106 215.045 3.997.557 238.937 4.308.575 257.435 4.631.308 276.417 5.023.700 299.782 5.532.198 329.993 5.937.493 353.400 6.274.091 372.366 6.606.664 390.947 7.085.694 418.660

Obtenemos

tt zy εθ += )ˆ(81,16 1*

Seguimos iterando hasta y alcanzamos la convergencia al cabo de la quinta iteración:

Iteración β Diferencia

1 30,67 2 16,81 -13,86 3 11,42 -5,38 4 10,26 -1,16 5 10,20 -0,06

La ecuación estimada sería por tanto:

tttt uxxy ++= 22

1 20,1020,10

9.6. PROBLEMAS

11.1. Suponiendo que el término de error del modelo no lineal:

20 1

txt ty e uββ β= + +

Sigue una distribución Normal (0, 2εσ ), obtener la expresión analítica del algoritmo

Newton-Raphson.

11.2. Obtenga la expresión linealizada del modelo anterior aplicando el desarrollo en serie de

Taylor.

11.3 Obtenga la matriz de covarianzas de la estimación de máxima verosimilitud del modelo

tx

tteY εββ β ++= 2

10 es

SOLUCIONES

10.1.

( )2 21

1

ˆ( ) 2 1, ,t t

Tx x

t tt

f e x e uβ ββ β=

∇ = − ⋅∑∑

2 2

2 2 2 2

2 2 2 2 2

12 22

11 2 22 2 2

1 1 1 1

1

ˆ( ) 2

ˆ ˆ

t t

t t t t

t t t t t

x xtT

x x x xt t t

t x x x x xt t t t t t

e x e

f e e x e u x e

e x e u x e x e u x e

β β

β β β β

β β β β β

ββ β

β β β β=

∇ = − + − + − +

∑

( ) 12

1 1 1ˆ ˆ ˆ( )i i i if fβ β β β

−

− − − = − ∇ ∇

)

10.2.

2

2

2

ˆ*2 1

ˆ

1

ˆ

2 1

*0 1 1 2 2

ˆ ˆ

ˆ

t

t

t

xt t

xt

xt

t t t t

y y e

z e

z e

y z z u

β

β

β

β β

ββ β β

= +

=

=

= + + +

10.3. Inversa de la matriz de información siguiente:

2 2

2 2 2

2 2 2

1 12 2

12 2 22 2

2 1 1 1

2

1 0

01

( , ) 0

0 0 02

t t

t t t

t t t

x xt

x x xt

x x xe t t t

e

e

e x e

e e x e

I x e x e x e

T

β β

β β β

β β β

ββ

β σ β β βσ

σ

=

10. MÉTODOS DE ESTIMACIÓN NO PARAMÉTRICOS

10.1. INTRODUCCIÓN

Se dice que se ajusta el modelo paramétrico cuando se estiman sus parámetros a partir de un

conjunto de observaciones que siguen dicho modelo, de manera que pueden hacerse predicciones

de nuevos valores de Y conocido el valor de X, y tener información precisa acerca de la

incertidumbre asociada a la estimación y a la predicción. Sin embargo, si el modelo paramétrico

no es el adecuado al analisis de datos que estamos realizando, pueden llevar a conclusiones que

queden muy alejadas de la realidad, dado que el modelo paramétrico conlleva un grado de

exactitud en las afirmaciones que de el se derivan y que son adecuadas siempre y cuando se

cumplan los supuestos básicos sobre los que se apoya su construcción teórica. De hecho, los

modelos paramétricos presentan una estructura teórica tan rígida que no pueden adaptarse a

muchos conjuntos de datos de los que hoy día se disponen para el análisis económico.

La econometría no paramétrica aparece como consecuencia de intentos por solucionar problemas

que existen en la econometría paramétrica como, por ejemplo, la consistencia entre los datos y

los principios de maximización, homocedasticidad, o la necesidad de asumir una determinada

relación, por lo general de forma lineal entre las variables de interés. Esta preocupación llevó a

una serie de investigadores a utilizar formas funcionales flexibles para aproximarsea relaciones

desconocidas entre las variables.El plantear formas funcionales flexibles requiere el conocimiento

del valor esperado de la variable Y, condicional en las otras, X. Esto conlleva la necesidad de

estimar la función de densidad de Y condicional en X. La econometría no paramétrica no parte

de supuestos sobre la distribución de probabilidad de las variables bajo estudio, sino que trata de

estimar dicha distribución para encontrar la media condicional y los momentos de orden superior

(por ejemplo, la varianza) de la variable de interés. Una de las desventajas de este método es, sin

embargo, la necesidad de contar con muestras muy grandes si es que se desea estimar la función

de relación entre ambas variables de manera precisa. Además el tamaño de la muestra debe

aumentar considerablemente conforme aumenta el número de variables involucradas en la

relación.

Los modelos de regresión paramétricos suponen que los datos observados provienen de variables

aleatorias cuya distribución es conocida, salvo por la presencia de algunos parámetros cuyo valor

se desconoce.

εββ ++= xy 10 , con ( )2,0 σε N≈

Este es un modelo estadístico con tres parámetros desconocidos: 0β ; 1β y 2σ .

Una formulación general de un modelo de regresión paramétrico es la siguiente:

iixmy εθ += );( , ni ,...,1= , pℜ⊆Θ∈θ

Donde );( θixm es una función conocida de x y de θ , que es desconocido, nεε ...1 es una variable

aleatoria idénticamente distribuida con ( ) 0=iE ε y ( ) 2σε =iV . El modelo de regresión lineal

simple sería un caso particular con ( )1,ββθ o= y xxm ooi 11),;( ββββ += .

Se supone que se observan n pares de datos ( )ii yx , que provienen del siguiente modelo de

regresión no paramétrico:

iii xmy ε+= )(

Donde nεε ...1 es una variable aleatoria idénticamente distribuida con ( ) 0=iE ε y ( ) 2σε =iV ,

y los valores de la variable explicativa nxx ...1 son conocidos, por lo que se dice que el modelo

tiene diseño fijo, y dado que la varianza de los errores es constante el modelo es Homocedástico12.

Considerando ( )YX , una variable aleatoria bivariante con densidad conjunta ( )yxf , , cabe

definir la función de regresión como )/()( xXYExm == , es decir el valor esperado de Y

cuando X toma el valor conocido x . Entonces )()/( XmXYE = , y definiendo )(XmY −=ε

, se tiene que:

ε+= )(XmY , 0)/( =XE ε , 2)/( σε =XV

Sean ( )ii YX , , i=1…n, una muestra aleatoria simple de ( )YX , . Estos datos siguen el modelo de

regresión no paramétrico:

iii XmY ε+= )( , i=1…n.

12 Si se supone que la varianza es función de la variable explicativa x : ( ) ( )ii xV 2σε = , el modelo sería Heterocedástico.

Una vez establecido el modelo, el paso siguiente consiste en estimarlo (o ajustarlo) a partir de las

n observaciones disponibles. Es decir hay que construir un estimador )(ˆ xm de la función de

regresión y un estimador2σ de la varianza del error. Los procedimientos de estimación de )(xm

se conocen como métodos de suavizado.

El abanico de técnicas disponibles para estimar no paramétricamente la función de regresión es

amplísimo e incluye, entre otras, las siguientes:

• Ajuste local de modelos paramétricos. Se basa en hacer varios (o incluso infinitos, desde

un punto de vista teórico) ajustes paramétricos teniendo en cuenta únicamente los datos

cercanos al punto donde se desea estimar la función.

• Suavizado mediante splines. Se plantea el problema de buscar la función )(ˆ xm que

minimiza la suma de los cuadrados de los errores ( )(ˆ iii xmye −= ) más un término que

penaliza la falta de suavidad de las funciones )(ˆ xm ) candidatas (en términos de la

integral del cuadrado de su derivada segunda).

• Métodos basados en series ortogonales de funciones. Se elige una base ortonormal del

espacio vectorial de funciones y se estiman los coeficientes del desarrollo en esa base de

la función de regresión. Los ajustes por series de Fourier y mediante wavelets son los dos

enfoques más utilizados.

• Técnicas de aprendizaje supervisado. Las redes neuronales, los k vecinos más cercanos y

los árboles de regresión se usan habitualmente para estimar )(xm .

10.2. FUNCIÓN NUCLEO

Los histogramas son siempre, por naturaleza, funciones discontinuas; sin embargo, en muchos

casos es razonable suponer que la función e densidad de la variable que se está estimando es

continua. En este sentido, los histogramas son estimadores insatisfactorios. Los histogramas

tampoco son adecuados para estimar las modas, a lo sumo, pueden proporcionar “intervalos

modales", y al ser funciones constantes a trozos, su primera derivada es cero en casi todo punto,

lo que les hace completamente inadecuados para estimar la derivada de la función de densidad.

Los estimadores de tipo núcleo (o kernel) fueron diseñados para superar estas dificultades. La

idea original es bastante antigua y se remonta a los trabajos de Rosenblatt y Parzen en los años

50 y primeros 60. Los estimadores kernel son, sin duda, los más utilizados y mejor estudiados en

la teoría no paramétrica.

Dada una m.a.s. nXX ...1 con densidad f , estimamos dicha densidad en un punto t por medio

del estimador

( ) ∑=

−=

n

i

i

h

XtK

nhtf

1

1ˆ

donde h es una sucesión de parámetros de suavizado, llamados ventanas o amplitudes de banda

(windows, bandwidths) que deben tender a cero ”lentamente" ( 0→h , ∞→nh ) para poder

asegurar que f tiende a la verdadera densidad f de las variables iX y K es una función que

cumple 1=∫K

. Por ejemplo:

• Núcleo gaussiano

2

2

2

1 u

e−

π • Núcleo Epanechnikov13

( ) 121

4

3<− uIu

donde 1<uI es la función que vale 1 si 1<u y 0 si 1≥u

• Núcleo Triangular

( ) 11 <− uIu

• Núcleo Uniforme

12

1<uI

13 Otra expresión alternativa de la función núcleo de Epanechnikov es:

5

2

5

11

4

3<

−u

Iu

donde 5<uI es la función que vale

5

1 si 5<u y 0 si 5≥u

• Núcleo Biweight

( ) 121

16

15<− uIu

• Núcleo Triweight

( ) 121

32

35<− uIu

Para elegir la ventana h puede seguirse la siguiente regla14

51

101

8

3 −

= nsh nK πδ

Donde

• n es el tamaño de la muestra

• ( ) 2

1

1

21

−= ∑=

n

iin XX

ns

• Kδ depende del núcleo K, y se calcula como:

( )( )( )

51

22

2

=∫

∫dttKu

dttKKδ

Por ejemplo:

• Si K es el núcleo gaussiano, entonces

101

4

1

=π

δ K

• Si K es el núcleo Epanechnikov, entonces ( ) 51

15=Kδ

Ejemplo 10.1

Nuestra muestra 101...XX es:

2,1 2,6 1,9 4,5 0,7 4,6 5,4 2,9 5,4 0,2

Su desviación típica es 779,1=ns , utilizando una función núcleo de Gaussiana, la ventana h

será:

366.010779,18

3

4

1 51

10110

1

=××

×

= −ππ

h

Hacemos una grilla para t que va desde -2 a 8 con puntos semi-espaciados:

14 Por lo general, los programs informáticos eligen el ancho de ventana siguiendo criterios de optimización (error cuadrático medio.

t

-2 -1,166666667 -0,333333333 0,5 1,333333333 2,166666667 3 3,833333333 4,666666667 5,5 6,333333333 7,166666667 8

Para cada jt

calculamos

−h

XtK ij

:

t

−h

XtK j 1

−h

XtK j 2

−h

XtK j 3

−h

XtK j 4

−h

XtK j 5

−h

XtK

j 6

−h

XtK j 7

−h

XtK

j 8

−h

XtK j 9

−h

XtK j 10

∑=

−n

i

ij

h

XtK

1

-2,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 -1,1667 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0004 0,0004 -0,3333 0,0000 0,0000 0,0000 0,0000 0,0075 0,0000 0,0000 0,0000 0,0000 0,1383 0,1458 0,5000 0,0000 0,0000 0,0003 0,0000 0,3437 0,0000 0,0000 0,0000 0,0000 0,2853 0,6293 1,3333 0,0447 0,0010 0,1206 0,0000 0,0896 0,0000 0,0000 0,0000 0,0000 0,0033 0,2593 2,1667 0,3924 0,1982 0,3061 0,0000 0,0001 0,0000 0,0000 0,0538 0,0000 0,0000 0,9507 3,0000 0,0195 0,2198 0,0044 0,0001 0,0000 0,0000 0,0000 0,3844 0,0000 0,0000 0,6282 3,8333 0,0000 0,0014 0,0000 0,0762 0,0000 0,0447 0,0000 0,0156 0,0000 0,0000 0,1379 4,6667 0,0000 0,0000 0,0000 0,3597 0,0000 0,3924 0,0538 0,0000 0,0538 0,0000 0,8598 5,5000 0,0000 0,0000 0,0000 0,0096 0,0000 0,0195 0,3844 0,0000 0,3844 0,0000 0,7979 6,3333 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0156 0,0000 0,0156 0,0000 0,0311 7,1667 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 8,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Para cada jt

se obtiene la estimación de f :

( ) ∑=

−=

n

i

i

h

XtK

nhtf

1

1ˆ:

t f(t)

-2 0 -1,166666667 0 -0,333333333 0,052488651 0,5 0,166657681 1,333333333 0,09328713 2,166666667 0,257268921 3 0,161036178 3,833333333 0,039861562 4,666666667 0,214170733 5,5 0,182116814 6,333333333 0 7,166666667 0 8 0

En la figura 10.1 se representa la función de desnidad estimada y la que se obtiene con un 1=h :

Figura 10.1.

Ejemplo 10.2

En R la estimación de una función de densidad kernel se realiza con la función “density”, con los

datos del ejemplo 10.1 hay que realizar el siguiente programa:

> x <- c(2.1,2.6,1.9,4.5,0.7,4.6,5.4,2.9,5.4,0.2)

0

0,05

0,1

0,15

0,2

0,25

0,3

-2 -1,2 -0,3 0,5 1,33 2,17 3 3,83 4,67 5,5 6,33 7,17 8

h=0.36 h=1

> density(x,kernel="epanechnikov") Call: density.default(x = x, kernel = "epanechnikov") Data: x (10 obs.); Bandwidth 'bw' = 1.065 x y Min. :-2.99424 Min. :0.00000 1st Qu.:-0.09712 1st Qu.:0.02366 Median : 2.80000 Median :0.09427 Mean : 2.80000 Mean :0.08621 3rd Qu.: 5.69712 3rd Qu.:0.15245 Max. : 8.59424 Max. :0.16948 > plot(density(x,kernel="epanechnikov"))

Figura 10.2

10.3. ESTIMADORES DE FUNCIÓN NUCLEO Y POLINOMIOS

LOCALES

La alternativa no paramétrica a los modelos de regresión, supone que

eXmY += )(

donde m es una función que no se supone “confinada" dentro de una familia paramétrica. Se trata

de estimar m a partir de una muestra ( )11,YX …; ( )nn YX , .

Los estimadores núcleo establecen que el peso de ( )ii YX , en la estimación dem es

)(ˆ

1

),(tf

h

XtK

hXtW

i

ii

−

=

donde K(t) es una función de densidad simétrica (por ejemplo, la normal estándar) y

)(ˆ tf es un estimador kernel de la densidad como el definido en el apartado anterior.

),( ii XtW es, para cada i, una función de ponderación que da “mayor importancia" a los valores

iX de la variable auxiliar que están cercanos a t.

Una expresión alternativa para ),( ii XtW

∑=

−

−

=n

j

i

i

ii

h

XtK

h

XtK

XtW

1

),(

A partir de los pesos iW puede resolverse el problema de mínimos cuadrados ponderados

siguiente:

( )( )( )2

1,

min ii

n

ii

baXtbaYW −+−∑

=

los parámetros así obtenidos dependen de t, porque los pesos iW también dependen de t, la recta

de regresión localmente ajustada alrededor de t sería :

))(()()( XttbtaXl t −+=

Y la estimación de la función en el punto en donde tX =

)()()(ˆ tatltm t ==

Las funciones núcleo usadas en la estimación no paramétrica de la regresión son las mismas que

en la densidad.

Si se generaliza al ajuste local de regresiones polinómicas de mayor grado, es decir si pretendemos

estimar una forma lineal del tipo:

qq XXX ββββ ++++ ...2

210

con la salvedad de que en vez del valor iX en la regresión lineal múltiple se utiliza el valor

( )iXt − . El estimador de polinomios locales de grado q asignado los pesos iW obtenidos

mediante la función núcleo se resuelve el siguiente problema de regresión polinómica ponderada:

( ) ( )( )( )2

101

.....min

0

qiqii

n

ii XtXtYW

q

−++−+−∑=

βββββ

Los parámetros ( )tjj ββ ˆˆ =

dependen del punto t en donde se realiza la estimación, y el polinomio

ajustado localmente alrededor de t sería:

( ) ( )∑=

−=−q

j

jjtq XtXtP

0, β

Siendo )(tm el valor de dicho polinomio estimado en el punto en donde tX = :

( ) ( ) ( )tPtm otqq β0ˆ , ==.

En el caso particular del ajuste de un polinomio de grado cero, se obtiene el estimador de Nadaraya

−Watson, o estimador núcleo de la regresión:

( )∑∑

∑

=

=

= =

−

−

=n

iiin

i

i

n

ii

i

K YXtW

h

XtK

Yh

XtK

tm1

1

1 ,)(ˆ

Ejemplo 10.3

Disponemos del siguiente conjunto de datos relativos a 163 personas con su edad y su índice de

masa corporal (relación entre peso y altura):

Figura 10.3.

Se va a obtener el estimador núcleo de la regresión:

∑

∑

=

=

−

−

=n

i

i

n

ii

i

K

h

XtK

Yh

XtK

tm

1

1)(ˆ

Donde iX es la edad de cada individuo e iY su masa corporal, va ha utilizarse una función núcleo

de Epanechnikov, cuyo ancho de ventana sería:

( ) ( ) 22,416214,168

315

8

315 5

110

15

15

110

15

1=××

×=××

×= −− ππ nsh n

Para cada edad (t ) calculamos

−h

XtK i

:

t

−h

XtK 1

−h

XtK 2

−h

XtK 3

−h

XtK 4

−h

XtK 5

−h

XtK i

−h

XtK 159

−h

XtK 160

−h

XtK 161

−h

XtK 162

∑=

−n

i

ij

h

XtK

1

16 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 1,228967175 17 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0753208 0,0000000 0,0000000 0,0000000 2,298278625 18 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,3704930 0,0000000 0,0000000 0,0000000 3,689804416 19 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,5813302 0,0000000 0,0000000 0,0000000 4,490985932

20

0,0000000 0,0753208 0,0000000 0,0000000 0,0000000 .. 0,7078326 0,0000000 0,0000000 0,0000000 4,777144002

21 0,0000000 0,3704930 0,0000000 0,0000000 0,0000000 .. 0,7500000 0,0000000 0,0000000 0,0000000 4,768129934 ..

.. .. .. .. .. .. .. .. .. .. ..

85 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 3,19280911 86 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 2,48497655 87 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 1,73497655 88 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 1,027144 89 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 0,44581379 90 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 0,07532083

0

5

10

15

20

25

30

35

40

45

0 20 40 60 80 100

Edad

Indi

ce d

e m

asa

corp

oral

Para cada edad (t ) calculamos i

i Yh

XtK

−

:

t 1

1 Yh

XtK

− 2

2 Yh

XtK

− 3

3 Yh

XtK

− 4

4 Yh

XtK

− 5

5 Yh

XtK

− i

i Yh

XtK

− 159

159 Yh

XtK

− 160

160 Yh

XtK

− 161

161 Yh

XtK

− 162

162 Yh

XtK

− i

n

i

i Yh

XtK∑

=

−

1

16 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 24,1149969 17 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 2,05894306 0,0000000 0,0000000 0,0000000 47,590736 18 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 10,1276624 0,0000000 0,0000000 0,0000000 78,5234969 19 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 15,8910333 0,0000000 0,0000000 0,0000000 96,7487803

20

0,0000000 1,32020961 0,0000000 0,0000000 0,0000000 .. 19,3490559 0,0000000 0,0000000 0,0000000 103,586796

21 0,0000000 6,49393249 0,0000000 0,0000000 0,0000000 .. 20,5017301 0,0000000 0,0000000 0,0000000 103,037148 ..

.. .. .. .. .. .. .. .. .. .. ..

85 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 90,1696692 86 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 69,1207607 87 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 48,0097761 88 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 29,5521528 89 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 14,3394414 90 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 .. 0,0000000 0,0000000 0,0000000 0,0000000 2,60213476

En la figura siguiente se representa el estimador )(ˆ xm obtenido:

Figura 10.4.

0

5

10

15

20

25

30

35

40

45

0 20 40 60 80 100

Edad

Indi

ce d

e m

asa

corp

oral

Ejemplo 10.4

Utiliando la base de datos “cars” de R, que contine las variables “dist” (distancia de parada) y

“speed”(velocidad), vamos a realizar la representación gráfica de la regresión kernel realizada

con el estimador de Nadaraya–Watson.

> data(cars) > plot(cars$speed, cars$dist) > lines(ksmooth(cars$speed, cars$dist, "normal", bandwidth = 2), col = 2) > lines(ksmooth(cars$speed, cars$dist, "normal", bandwidth = 5), col = 3)

Figura 10.4

Definida la matriz

( ) ( )

( ) ( )

−−

−−

=

qnn

q

t

XtXt

XtXt

X

...1

.....

.....

...1 11

Y definidos los vectores ( )′= nYYY ...1 , ( )′= nεεε ...1 , ( )′= qβββ ...0 . Se calcula la matriz de

pesos tW

( )( )

( )

=

tXW

tXW

tXW

W

nn

t

,...00

0.....

0...,.0

0...0,

22

11

Habría que estimar por mínimos cuadrados generalizados el modelo εβ += XY , cuya solución

es:

( ) YWXXWXt ttttt'1')(ˆ

−=β

Pueden tomar los pesos:

∑=

−

−

=n

j

i

i

ii

h

XtK

h

XtK

XtW

1

),(

o

−=

h

XtKXtW i

ii ),(

Ejemplo 10.5

Utilizando los datos de edades e índices de masas corporales, se ha realizado un ejercicio para

obtener un estimador de polinomio local a una función núcleo de núcleo de Epanechnikov, si se

desea obtener el estimador para una edad de 65 años (t=65); la matriz 65X quedaría:

Constante )65( iX−

2)65( iX−

1 -1 1

1 41 1681

1 19 361

1 20 400

1 11 121

1 -17 289

. . .

1 5 25

1 13 169

1 33 1089

1 34 1156

1 3 9

1 38 1444

Los pesos ),65( ii XW serían:

),65( ii XW

0,70783255

0

0

0

0

0

.

0

0

0

0

0

0

La matriz 6565'65 XWX quedaría

−−

−=

855,117044,6896,11

044,6.896,11347,0

896,11347,0669,2

6565'65 XWX

Y el estimador ( ) YWXXWX 65'65

1

6565'65)65(ˆ −

=β :

=321,0

255,0

196,22

)65(β

Es estimador del indice de masa corporal para la edad de 65 años sería:

( ) ( ) 196,2265ˆ65ˆ 2 == om β

El estimador del parámetro de suavizado h tiene una importancia crucial en el aspecto y

propiedades del estimador de función de regresión. Valores pequeños de h dan mayor

flexibilidad al estimador y le permiten acercarse a todos los datos observados, pero originan altos

errores de predicción (sobre-estimación), valores mas altos de h ofrecerán un menor grado de

ajustes a los datos pero predicican mejor, pero si h es demasiado elevado tendremos una falta de

ajuste a los datos (sub-estimación).

Si la cantidad de datos de que disponemos lo permite, lo habitual es obtener dos muestras una

para la estimación del modelo (muestra de entrenamiento) y otra muestra para predecir (muestra

de test). En este caso una medida de calidad del parametro h de suavizado es el error cuadrático

medio de la población de la muestra de test:

( )( )∑=

−=tn

ititi

ttest XmY

nhECMP

1

2,, ˆ

1)(

Donde ( )titi YX ,, ,

, tni ...1= , es la muestra test y ( )Xm es el estimador no paramétrico construido

con la muestra de entrenamiento. El valor h que minimice dicho error sería el parámetro de

suavización elegido.

Si no de puede disponer de una muestra de test, la alternativa consiste en sacar de la muestra

consecutivamente cada una de las observaciones iX , y estimar el modelo con los restantes datos

y predecir el dato ausente con el estimador obtenido, para después calcular el error de predicción.

Se construye entonces la siguiente medida del error de predicción (validación cruzada) para cada

h:

( )( )∑=

−=n

iiiiCV XmY

nhECMP

1

2ˆ1

)(

Donde ( )Xmiˆ es el estimador obtenido al excluir la observación i-esima.

El valor h que minimice dicho error de validación cruzada sería el parámetro de suavización

elegido.

Teniendo presente que el valor que predecimos iY no deja de ser una combinación lineal de los

valores observados:

( ) SYYWXXWXXXY tttttt ===− '1'ˆˆ β

Siendo ( ) tttttt WXXWXXS '1' −= , matriz que se denomina de suavizado cuyo elemento ( )ji , se

nombra ijs.

Dado que:

∑=

−−

=n

i ii

iiCV s

YY

nhECMP

1

2

1

ˆ1)(

no es necesario ajustar las n regresiones no paramétricas, sino que vasta con evaluar todos los

datos y anotar los valores de la diagonal principal de la matriz S .

Una modificación de la función anterior (Validación cruzada generalizada) permite obtener un

estimador de la varianza de los errores del modelo:

∑=

−−

=n

i

iiGCV

nvYY

nhECMP

1

2

1

ˆ1)(

Donde ( ) ∑

=

==n

iiisSTrazav

1

Entonces:

vn

nhECMPGCV −

=2ˆ

)( εσ

y

( )∑=

−−

=n

iii YY

vn 1

22 ˆ1ˆ εσ

10.4. REGRESIÓN POR SPLINES

Para poder estimar la función f de la forma más sencilla posible, deberíamos poder representar

f de forma que iii exfY += )( , nei ....,2,1= se convierta en un modelo lineal.

Y esto se puede hacer eligiendo una base de funciones de dimensión q que genere un subespacio

de funciones que incluya a f como elemento y que pueda expresarse como:

( )∑=

=q

jjj xsxf

1

)( β

Siendo jβ un parámetro desconocido, asociado al elemento j ,

)(xsj de dicha base de

funciones.

De manera que:

( ) i

q

jjji exsY +=∑

=1

β , nei ....,2,1= (10.1.)

Se convierte en un modelo lineal de dimensión q .

La regresión con funciones base polinómicas es la propuesta más sencilla para este tipo de

estimaciones.

Supongamos que f es un polinomio de grado 4 de forma que el espacio de polinomios de grado

4 contiene a f . Una base de este subespacio es:

=

=

=

==

45

34

23

2

1

)(

)(

)(

)(

1)(

xxs

xxs

xxs

xxs

xs

Con lo que el modelo (10.1) se convierte en:

iiiiii exxxxY +++++= 45

34

2321 βββββ

Un spline es una curva diferenciable definida en porciones mediante polinomios, que se utiliza

como bases de funciones para aproximar curvas con formas complicadas.

Las bases de spilines más populares:

• Bases de polinomios truncados.

• Bases de splines cúbicos.

• Bases de B-splines.

• Bases de thin plate splines.

Una función spline está formada por varios polinomios, cada uno definido sobre un subintervalo,

que se unen entre sí obedeciendo a ciertas condiciones de continuidad.

Supongamos que se ha fijado un entero 0≥q , de manera que disponemos de q+1 puntos, a los

que denominaremos nodos, tales que qtttt <<<< ....210 , en los que troceamos nuestro

conjunto de. Decimos entonces que una función spline de grado q con nodos en qttt ,....,, 21 es

una función S que satisface las condiciones:

(i) en cada intervalo [ )jj tt ,1− , S es un polinomio de grado menor o igual a q .

(ii) S tiene una derivada de orden (q-1) continua en [ ]qo tt ,

.

Los splines de grado 0 son funciones constantes por zonas. La expresión matemática de un spline

de grado 0 es la siguiente:

[ )

[ )

[ )

∈=

∈=

∈=

−−−

+

qqqq

jjjj

oo

ttxcxS

ttxcxS

ttxcxS

xS

,)(

..

,)(

,)(

)(

111

1

10

En la figura 10.3 se muestran las gráficas correspondientes a los splines de grado cero.

Figura 10.3.

Los splines de grado 0, se define en un solo tramo de nudo y ni siquiera es continua en los nudos.

Equivale a realizar una regresión por tramos.

iiqqiioi excxcxcY ++++= −− 11110 .... βββ

siendo

[ )

∈

=+

resto

ttxc

jj

j

0

,1 1

Un spline de grado 1 o lineal se puede definir por:

[ )

[ )

[ )

∈+=

∈+=

∈+=

−−−−

+

qqqqq

jjjjj

ooo

ttxbxaxS

ttxbxaxS

ttxbxaxS

xS

,)(

..

,)(

,)(

)(

1111

1

10

La representación gráfica de un spline lineal aparece en la figura 10.4:

Figura 10.4.

Las funciones de spilines más comúnmente utilizadas son las de grado 3 ó cúbicas. Son

polinomios de grado tres a trozos, que son continuos en los nodos al igual que su primera y

segunda derivada, proporcionando proporciona un excelente ajuste a los puntos tabulados y a

través de cálculo que no es excesivamente complejo.

Sobre cada intervalo [ ] [ ] [ ]qqo tttttt ,,...,,,, 1211 − , S está definido por un polinomio cúbico

diferente. Si el polinomio cúbico que representa a b en el intervalo [ ]1, +jj tt

, por tanto:

[ )

[ )

[ )

∈+++=

∈+++=

∈+++=

−−−−−−

+

qqqqqqq

jjjjjjj

ooooo

ttxdxcxbxaxS

ttxdxcxbxaxS

ttxdxcxbxaxS

xS

,)(

..

,)(

,)(

)(

1113

13

11

123

1033

Los polinomios 1−jS y jS

interpolan el mismo valor en el punto jt, es decir, se cumple:

( ) ( )ijiij xSyxS ==−1

por lo que se garantiza que S es continuo en todo el intervalo. Además, se supone que S' y S'' son

continuas, condición que se emplea en la deducción de una expresión para la función del spline

cúbico.

Aplicando las condiciones de continuidad del spline S y de las derivadas primera S' y segunda S'',

es posible encontrar la expresión analítica del spline.

Una de las bases de splines cúbicos más utilizadas basadas en 2−q nodos interiores, *jx ,

2,...,1 −= qj , es:

=

==

+ ),()(

)(

1)(

)(*

2

1

jj

o

xxRxS

xxS

xS

xS

Siendo

( ) ( ) ( ) ( )

+−−−−−−

−−

−−= 240

72

12

12

124

112

12

112

12

14

1),(2422

zxzxxzzxR

Con esta base de splines definimos f a través de un modelo lineal con matriz de regresores X

con n filas y q columnas cuya i_esima fila es:

( ) ( ) ( )[ ]*2

*2

*1 ,,...,,,,,,1 −= kiiiii xxRxxRxxRxX

Los elementos de una base de splines cúbicos son polinomios de grado 3. Un Spline cúbico se

representa en la figura 10.5

Figura 10.5.

Ejemplo 10.5

Se va a aproximar la función representada con la siguiente tabla de datos:

Y X

2 0,1

4 0,2

5 0,4

3 0,5

2 0,7

6 0,9

Una Base de splines cúbicos basada en 2 nodos interiores, 31*

1 =xy 3

2*1 =x

,

Con lo que el modelo lineal será

( ) ( ) iiiii exRxRxY ++++= 3/2,31, 4321 ββββ

La expresión general de la matriz de los regresores X será:

( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )

=

32,9.03

1,9.09.013

2,7.031,7.07.01

32,5.03

1,5.05.013

2,4.031,4.04.01

32,2.03

1,2.02.013

2,1.031,1.01.01

RR

RR

RR

RR

RR

RR

X

Que da como resultado:

=

0,00100931-30,00218832-9.01

90,0019474740,00025622-7.01

10,0017425410,001742545.01

20,0008139910,002246094.01

0,00128477-80,000739912.01

0,00218832-10,00100931-1.01

X

De forma que los coeficientes MCO obtendidos:

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%

Superior 95%

Intercepción -1,28441535 0,463139089 -2,7732821 0,1091437 -3,27714201 0,70831132

x 9,92100052 0,890608598 11,13957416 0,00796254 6,08902101 13,75298

( )31,ixR

1541,86453 168,4360681 9,154004551 0,01172431 817,142626 2266,58644

( )32,ixR

-1745,47096 171,1229452 -10,2000989 0,00947511 -2481,75357 -1009,18835

Dan como resultado la siguiente estimación:

Figura 10.6.

Un tema importante es la elección del grado de suavización del spline. Una de las posibilidades

es a través del contraste de hipótesis, valorar la posibilidad de utilizar uno o más nodos. Pero lo

aconsejado es mantener fija la base de splines y controlar el grado de suavización añadiendo una

penalización a la función objetivo de mínimos cuadrados:

βλβ S'

Donde Ses una matriz de orden qq× con coeficientes conocidos que dependen de la base

elegida y un parámetro de suavizado λ .

La solución del modelo de regresión lineal penalizado en donde la matriz de regresores está ahora

definida por la base de splines y la penalización sería:

( ) yXSXXpenal ''ˆ 1−−= λβ

El modelo de regresión lineal con spilines penalizados es equivalente al siguiente modelo de

regresión lineal:

eXY += β''

En donde )'0...0,0,(' YY = es un vector de dimensión 1)( ×+ qn , es decir el vector Yseguido

de tantos ceros como nodos se han utilizado en la base de splines.

La matriz de regresores

=

λB

XX '

tiene ahora orden qqn ×+ )( , siendo B una matriz que

cumple BBS '= y que se obtiene a través de la descomposición de Cholesky y λ el parámetro

de suavizado y eun vector de 1)( ×+ qn errores aleatorios.

0

1

2

3

4

5

6

7

0 0,2 0,4 0,6 0,8 1

y-estimada

y

Ejemplo 10.6

En el modelo anterior, el modelo de regresión lineal equivalente al penalizado se construiría con:

=

0

0

0

0

6

2

3

5

4

2

'Y

( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )

( ) ( )( ) ( )

=

32,3

23

1,3200

32,3

13

1,3100

0000

00003

2,9.031,9.09.01

32,7.03

1,7.07.013

2,5.031,5.05.01

32,4.03

1,4.04.013

2,2.031,2.02.01

32,1.03

1,1.01.01

'

RR

RR

RR

RR

RR

RR

RR

RR

X

λλλλ

La matriz de penalización es por tanto

( ) ( )( ) ( )

=

=

0,0021604910,0001028800

10,000102880,0021604900

0000

0000

32,3

23

1,3200

32,3

13

1,3100

0000

0000

RR

RRS

El parámetro de suavización,λ , es a priori desconocido y hay que determinarlo, si es muy alto

suaviza los datos en exceso, un criterio utilizado para elegir el parámetroλ es del valor que

minimiza el estadístico general de validación cruzada:

( )( ) ( )( )( )( )''

'''''1

11

XSXXXItraza

yXSXXXyyXSXXXynvg −

−−

−−−−−−=

λλλ

La regresión por splines puede realizarse con múltiples variables explicativas, si tenemos ahora

dos explicativas, ix y iz , y queremos estimar el siguiente modelo aditivo:

iiii ezfxfy ++= )()( 21

Representaríamos cada una de estas dos funciones a través de una base de splines penalizados,

que tomando la base cúbica quedaría:

( )∑−

=

++=2

1

*211 ,)(

q

jjii xxRxxf δδ

y

( )∑−

=

++=2

1

*212 ,)(

q

jjii zzRzzf γγ

Ejemplo 10.7

Partiendo de la base de datos “cars” utilizada en el ejemplo 10.4, la función R “smooth.spline”

realiza la regresión por splines utilizando una base de splinee cúbicos penalizados:

> plot(speed, dist, main = "data(cars) & smoothing splines") > cars.spl1 <- smooth.spline(speed, dist) > cars.spl1 Call: smooth.spline(x = speed, y = dist) Smoothing Parameter spar= 0.7801305 lambda= 0.1112206 (11 iterations) Equivalent Degrees of Freedom (Df): 2.635278 Penalized Criterion: 4187.776 GCV: 244.1044

En la función “smooth.spline” el parámetro de suavizado es un valor generalmente entre 0 y 1, en

tanto que el coeficiente que denomina λ se obtiene en el criterio de aceptación (logaritmo de

verosimilitud penalizado). En el ejercicio el programa elige un 7801305,0=spar . Si se desea

un función menos suavizada habrá que elegir un parámetro de suavizado más bajo, en linea roja

se representa en el gráfico la regresión por splines que se obtendría con un parámetro de suavizado

de valor 0,10.

> cars.spl2 <- smooth.spline(speed, dist,spar=0.10) > lines(cars.spl1, col = "blue") > lines(cars.spl2, col = "red")

10.5. APROXIMACIÓN POR SERIES DE FOURIER

La forma de Fourier permite aproximar arbitrariamente cerca tanto a la función como a sus

derivadas sobre todo el dominio de definición de las mismas. La idea que subyace en este tipo de

aproximaciones (que podrían denominarse semi-no-paramétricas) es ampliar el orden de la base

de expansión, cuando el tamaño de la muestra aumenta, hasta conseguir la convergencia asintótica

de la función aproximante a la verdadera función generadora de los datos y a sus derivadas

(Gallant, A.R.;1981,1984).

Un polinomio de Fourier viene dado por la expresión:

( ) ( )( )∑=

++k

jojoj tjwvtjwu

a

1

sincos2

Donde k es el número de ciclos teóricos o armónicos que consideramos, siendo el máximo n/2.

nw

π20 = es la frecuencia fundamental (también denominada frecuencia angular fundamental).

t toma los valores enteros comprendidos entre 1 y n (es decir, t = 1, 2, 3, ...n).

Los coeficientes de los armónicos vienen dados por las expresiones:

( )( ) ( )∑∑∑===

===n

iioij

n

iiij

n

ii jtwy

nvjtwy

nuy

n

a

110

1

sin2

,cos2

,2

2

La aproximación a una función no periódica )(xg por una serie de expansión de Fourier se realiza

en Gallart (1981) añadiendo es esta un término lineal y cuadrático. De esta forma que la

aproximación univariada se escribe como:

( ) ( ) ( )jxsvjxucxbxaxg j

J

jj sincos

2

1/

1

2 −+++= ∑=

θ (10.2.)

El vector de parámetros es ( )JJ vuvucba ,,...,,,, 11=θ de longitud JK 23+= .

Suponiendo que los datos siguieran el modelo iii exgy += )( para i=1,2,…,n estimariamos θ

por mínimos cuadrados, minimizando

( ) ( ) ( )[ ]∑=

−=n

iiKin xgyns

1

2/1 θθ

Dado que la variable exógena ix no esta expresada en forma periódica, debe de transformase o

normalizarse en un intervalo de longitud menor que π2 , [ ]π2,0 .

Considerando 0θ la solución al problema de minimización anterior, podríamos obtener diferentes

soluciones minimocuadráticas para )(xg , considerando diferentes valores de n y K y elegir aquel

de ellos que mejor aproxime, )(xg , )()/( xgdxd , y )()/( 22 xgdxd .

La expresión de la primera y segunda derivada de la función (10.2) son las siguientes:

( ) ( ) ( )( )∑=

−−++=J

jjjx jjxvjxucxbxgD

1

cossin/θ

( ) ( ) ( )( )∑=

+−+=J

jjjx jjxsenvjxucxgD

1

22 cos/θ

La aproximación multivariada se describe:

( ) ( ) ( )[ ]∑ ∑=

−++++=A

jjo xjkvxjkuuCxxxbuxg1

''0 sincos2'

2

1'/

ααααααθ

Donde ∑=

−=A

akkuC1

'0

ααα . La regla de formación de la secuencia αk está dada en Gallant

(1981) y en Gallant (1982) para diferentes sistemas.

Ejemplo 10.7

Vamos a estimar una forma de flexibilidad global para el PIB trimestral de España, en índices

de volumen ajustados a estacinalidad y calendario, y utilizando como regresor los puestos de

trabajo equivalentes a tiempo completo, todas las series están obtenidas de la Contabilidad

Nacional Trimestral de España del INE. Base 2000. Datos corregidos de estacionalidad y

calendario.

Puestos de trabajo equivalentes a tiempo completo Producto interior bruto 1995TI 12974 81,35 1995TII 13027 81,62 1995TIII 13043 81,85 1995TIV 13036 82,28 1996TI 13021 82,75 1996TII 13123 83,44 1996TIII 13310 84,14 1996TIV 13358 84,68 1997TI 13458 85,57 1997TII 13630 86,36 1997TIII 13756 87,35 1997TIV 13828 88,69 1998TI 13974 89,5 1998TII 14186 90,35 1998TIII 14391 91,43 1998TIV 14481 92,24 1999TI 14655 93,14 1999TII 14869 94,56 1999TIII 15026 95,99 1999TIV 15132 97,08 2000TI 15360 98,56 2000TII 15592 99,65 2000TIII 15867 100,36 2000TIV 15859 101,44 2001TI 15972 102,51 2001TII 16106 103,17 2001TIII 16290 104,12 2001TIV 16333 104,79 2002TI 16354 105,25 2002TII 16530 106,14 2002TIII 16702 106,79 2002TIV 16608 107,62 2003TI 16763 108,61 2003TII 16871 109,33 2003TIII 17108 110,02 2003TIV 17053 111,03 2004TI 17230 111,81 2004TII 17291 112,71 2004TIII 17574 114,01 2004TIV 17524 114,8 2005TI 17646 115,85 2005TII 17874 116,93 2005TIII 18225 117,93 2005TIV 18136 119,02 2006TI 18280 120,14 2006TII 18493 121,41 2006TIII 18702 122,48 2006TIV 18692 123,83 2007TI 18887 125,04

2007TII 19080 126,21 2007TIII 19253 127,13 2007TIV 19148 128,14

Fuente: Contabilidad Nacional de España. INE

La aproximación utilizada es la descrita en (10.2) con la variable dependiente transformada en un

intervalo menor a 2π utilizando la siguiente función de transformación )max(

2

X

Xx

⋅= π . En la

ecuación se utilizan 7 parámetros, la constante, el asociado x , el asociado a 22x y los

parámetros asociados a los dos primeros armónicos. El resultado de la estimación mínimo

cuadrática de (10.2) aparecen en la tabla adjunta:

x 2

2x

COS (x) SENO(x) COS(2x) SENO(2x) ( )θ/xg

4,2340 17,9271 -0,4603 -0,8878 -0,5762 0,8173 81,645 4,2513 18,0739 -0,4449 -0,8956 -0,6042 0,7969 82,087 4,2566 18,1183 -0,4402 -0,8979 -0,6124 0,7905 82,220 4,2543 18,0989 -0,4423 -0,8969 -0,6088 0,7933 82,162 4,2494 18,0572 -0,4466 -0,8947 -0,6010 0,7992 82,038 4,2827 18,3413 -0,4166 -0,9091 -0,6529 0,7575 82,875 4,3437 18,8677 -0,3604 -0,9328 -0,7402 0,6724 84,356 4,3594 19,0040 -0,3457 -0,9383 -0,7609 0,6488 84,725 4,3920 19,2896 -0,3149 -0,9491 -0,8016 0,5978 85,480 4,4481 19,7858 -0,2612 -0,9653 -0,8636 0,5043 86,735 4,4892 20,1534 -0,2213 -0,9752 -0,9021 0,4316 87,622 4,5127 20,3649 -0,1983 -0,9801 -0,9213 0,3888 88,118 4,5604 20,7972 -0,1514 -0,9885 -0,9541 0,2993 89,101 4,6296 21,4330 -0,0827 -0,9966 -0,9863 0,1649 90,486 4,6965 22,0569 -0,0159 -0,9999 -0,9995 0,0318 91,790 4,7259 22,3337 0,0135 -0,9999 -0,9996 -0,0269 92,357 4,7826 22,8736 0,0702 -0,9975 -0,9901 -0,1400 93,446 4,8525 23,5465 0,1396 -0,9902 -0,9610 -0,2765 94,789 4,9037 24,0464 0,1902 -0,9818 -0,9277 -0,3734 95,785 4,9383 24,3868 0,2240 -0,9746 -0,8996 -0,4366 96,466 5,0127 25,1273 0,2958 -0,9552 -0,8250 -0,5652 97,958 5,0884 25,8921 0,3672 -0,9301 -0,7303 -0,6832 99,525 5,1782 26,8134 0,4491 -0,8935 -0,5966 -0,8026 101,453 5,1756 26,7864 0,4468 -0,8946 -0,6008 -0,7994 101,396 5,2124 27,1695 0,4795 -0,8776 -0,5402 -0,8415 102,210 5,2562 27,6273 0,5174 -0,8558 -0,4647 -0,8855 103,191 5,3162 28,2621 0,5678 -0,8232 -0,3552 -0,9348 104,566 5,3302 28,4115 0,5793 -0,8151 -0,3288 -0,9444 104,891 5,3371 28,4847 0,5849 -0,8111 -0,3159 -0,9488 105,050 5,3945 29,1010 0,6305 -0,7762 -0,2050 -0,9788 106,397 5,4507 29,7098 0,6730 -0,7396 -0,0941 -0,9956 107,730

5,4200 29,3763 0,6500 -0,7599 -0,1550 -0,9879 107,000 5,4706 29,9272 0,6876 -0,7261 -0,0544 -0,9985 108,206 5,5058 30,3141 0,7128 -0,7014 0,0161 -0,9999 109,050 5,5832 31,1718 0,7648 -0,6442 0,1699 -0,9855 110,909 5,5652 30,9717 0,7531 -0,6579 0,1345 -0,9909 110,477 5,6230 31,6179 0,7899 -0,6133 0,2478 -0,9688 111,864 5,6429 31,8422 0,8019 -0,5974 0,2861 -0,9582 112,341 5,7352 32,8931 0,8536 -0,5209 0,4573 -0,8893 114,538 5,7189 32,7061 0,8450 -0,5348 0,4280 -0,9038 114,152 5,7587 33,1631 0,8656 -0,5007 0,4985 -0,8669 115,093 5,8332 34,0256 0,9004 -0,4350 0,6216 -0,7834 116,835 5,9477 35,3751 0,9443 -0,3292 0,7832 -0,6217 119,491 5,9187 35,0305 0,9343 -0,3565 0,7458 -0,6662 118,819 5,9656 35,5890 0,9500 -0,3122 0,8050 -0,5932 119,908 6,0352 36,4232 0,9694 -0,2455 0,8795 -0,4760 121,533 6,1034 37,2511 0,9839 -0,1789 0,9360 -0,3519 123,171 6,1001 37,2113 0,9833 -0,1821 0,9337 -0,3580 123,091 6,1637 37,9917 0,9929 -0,1192 0,9716 -0,2366 124,686 6,2267 38,7721 0,9984 -0,0564 0,9936 -0,1127 126,372 6,2832 39,4784 1,0000 0,0000 1,0000 0,0000 128,013 6,2489 39,0490 0,9994 -0,0343 0,9977 -0,0685 127,000

La representación gráfica de los resultados obtenidos está en la figura 10.7.

Figura 10.7.

75

85

95

105

115

125

135

19

95TI

19

96TI

19

97TI

19

98TI

19

99TI

20

00TI

20

01TI

20

02TI

20

03TI

20

04TI

20

05TI

20

06TI

20

07TI

Aproximación FFF

PIB (IV)

A continuación figuran los coeficientes obtenidos en la estimación MCO de la expansión de

Fourier:

Coeficientes COEFICIENTE VARIANZA SENO (2X) 25,7726 48,4461 COS (2X) 30,5090 27,1992 SENO (x) -452,1873 644,8903 COS(x) 153,4978 389,0007

22x

163,5181 267,6648

x -1623,8053 2811,5767 Constante 3691,2378 6689,6026

10.6. PROBLEMAS

10.1 Estimar un funcion de densidad kernel con los siguientes datos utilizando una función de

distancia de Epanechnikov y una grilla de 12 datos con valores entre 300 y 700.

349 368 388 414 444 484 518 550 586 635 686

10.2 Realice una regresión polinómica de segundo grado entre el Consumo (Y) y la Renta (X).

Años Consumo Renta 2000 349 388 2001 368 408 2002 388 433 2003 414 465 2004 444 498 2005 484 538 2006 518 574 2007 550 614 2008 586 656 2009 635 699 2010 686 748

10.3 Ajuste un spiline cúbico a la relación entre ventas (Y) y publicidad (X), con base de 2

nodos interiores, 31*

1 =x y 32*

2 =x .

VENTAS PUBLIC. 2000 500 25 2001 1000 10 2002 2000 5 2003 3500 10 2004 3800 25 2005 4000 40

10.4 Realice el ejercicio anterior en R, señale el parámetro de suavización elegido por la

función y represente los resultados obtenidos.

10.5 Utilizando los datos del ejercicio 10.2 Ajustar una función de Fourier a la relación entre

Consumo (Y) y la Renta (X) con K=5.

SOLUCIONES

10.1.

t f(t)

300 0,00000

333,3333333 0,00195

366,6666667 0,00383

400 0,00365

433,3333333 0,00269

466,6666667 0,00234

500 0,00249

533,3333333 0,00253

566,6666667 0,00244

600 0,00197

633,3333333 0,00145

666,6666667 0,00080

700 0,00000

10.2

248,6862,047,68 ttt XXY ++=)

10.3

*2

*1 33.419,413,7480,1642ˆ

tttt XXXY −++=

10.4

485,1=spar

10.5

)(23,66)(cos73.786,3051,17502,579ˆ 2ttttt xsenoxenoxxY −−+−=

ANEXO I. NOCIONES DE ALGEBRA MATRICIAL

MATRICES

Definición

Una matriz de orden n×m contiene n·m elementos dispuestos en n filas y en m columnas; su

notación matemática habitual es:

nmnn

m

m

xxx

xxx

xxx

...

......

...

...

21

22221

11211

Tipos de Matrices

Una matriz de orden 1×m tiene una sola fila y m columnas y recibe la denominación de vector

fila:

[ ]11 12 1... mx x x

Una matriz de orden n×1 tiene n filas y una sola columna y recibe el nombre de vector columna:

11

21

1n

x

x

x

M

Una matriz que posee con igual número de filas que de columnas, es decir, de orden n×n, se

denomina matriz cuadrada.

11 12 1

21 22 2

1 2

...

...

. . ... .

...

n

n

n n nn

x x x

x x x

x x x

Llamamos matriz unidad o identidad a la matriz cuadrada de orden n×n con n unos situados en

la diagonal principal, siendo ceros los elementos restantes; es decir:

=

1...00

......

0...10

0...01

nI

Una matriz diagonal es aquella que únicamente tiene al menos un elemento no nulo en la diagonal

principal, es decir:

=

nna

a

a

A

...00

......

0...0

0...0

22

11

Una matriz derivada de otra a la que se le han eliminado parte de sus filas y columnas, se denomina

submatriz.

Ejemplo

B =

−12

23 seria una submatriz de la matriz A=

−−121

231

012

, de orden 3×3.

Operaciones con matrices

Suma

Si dos matrices A y B son del mismo orden, y tienen como elementos genéricos aij y bij, definimos

la matriz C, suma de A y B, como la matriz cuyo elemento genérico sería cij=aij+bij.

Así, por ejemplo, si disponemos de dos matrices, A y B, de orden 2×2:

11 12 11 12

21 22 21 22

a a b b

A Ba a b b

= =

La suma de ambas matrices sería:

11 12 11 12 11 11 12 12

21 22 21 22 21 21 22 22

a a b b a b a bC

a a b b a b a b

+ + = + = + +

Multiplicación

a) Multiplicación por un escalar

La matriz A multiplicada por un número escalar λ cualquiera, da como resultado otra matriz cuyo

elemento genérico es λ·aij. Así, por ejemplo, si consideramos una matriz de orden 2×2, el

resultado de multiplicarla por un escalar λ sería:

=

2221

1211

2221

1211

aa

aa

aa

aa

λλλλ

λ

b) Multiplicación de matrices

Si una matriz A es de orden m×n y la B es de orden n×p (o si la matriz A es de orden n×m y la B

es de orden p×n), definimos la matriz C, producto de A y B, como la matriz de orden m×p (ó

n×n) cuyo elemento genérico es:

∑=

=n

kkjikij bac

1

Por ejemplo, si deseáramos multiplicar una matriz de orden 3×2 por una matriz de orden 2×3

tendríamos que el resultado es una matriz 3×3 tal que:

11 12 11 11 12 21 11 12 12 22 11 13 12 2311 12 13

21 22 21 11 22 21 21 12 22 22 21 13 22 2321 22 23

31 32 31 11 32 21 31 12 32 22 31 13 32 23

·

a a a b a b a b a b a b a bb b b

a a a b a b a b a b a b a bb b b

a a a b a b a b a b a b a b

+ + + = + + + + + +

Del mismo modo, si quisiéramos multiplicar una matriz de orden 2×3 por una matriz de orden

3×2 tendríamos que el resultado es una matriz 2×2 de la forma:

11 1211 12 13 11 11 12 21 13 31 11 12 12 22 13 32

21 2221 22 23 21 11 22 21 23 31 21 12 22 22 23 32

31 32

·

a ab b b b a b a b a b a b a b a

a ab b b b a b a b a b a b a b a

a a

+ + + + = + + + +

En conclusión, para que dos matrices se puedan multiplicar tiene que existir coincidencia entre el

número de columnas de la primera matriz y el número de filas de la segunda matriz o viceversa.

Ejemplo

2 1 0 2 1 2 2 1 1 0 3 2 ( 1) 1 2 0 1 5 0

1 3 2 · 1 2 1 2 3 1 ( 2) 3 1 ( 1) 3 2 ( 2) 1 1 3

1 2 1 3 1 ( 1) 2 2 1 1 3 ( 1) ( 1) 2 2 1 1 3 6

− × + × + × × − + × + × − = × + × + − × × − + × + − × = − − − × + × + × − × − + × + ×

c) Producto Kronecker

Otra forma de multiplicación matricial es el producto directo o Kronecker. Si A es una matriz de

orden m×n y B es de orden p×q, el producto Kronecker BA⊗ se define como:

=⊗

BaBaBa

BaBaBa

BaBaBa

BA

mnmm

n

n

...

......

...

...

21

22221

11211

La matriz resultante BA⊗ es una matriz de orden mp×nq.

Traspuesta de una matriz

La traspuesta de una matriz A de rango n×m es una matriz A’ de orden m×n obtenida mediante

el intercambio de filas y columnas de A, de tal forma que el elemento genérico aij pasa a ser aji en

la matriz traspuesta. Por ejemplo, si consideramos una matriz de orden 3×2:

=

3231

2221

1211

aa

aa

aa

A

Su traspuesta será:

=

322212

312111'aaa

aaaA

Las matrices traspuestas verifican las siguientes propiedades:

1) (A’)’=A

2) (A+B)’=A’+B’

3) (AB)’=A’B’

4) Si una matriz verifica AA’=A’A=I se dice que A es una matriz ortogonal

5) Si una matriz de orden n×n verifica que A=A’ , esto es, que los elementos situados por

encima de la diagonal principal son simétricos a los elementos situados por debajo de la

diagonal principal, se dice que es una matriz simétrica.

Ejemplo

La matriz A es simétrica tal que:

3 1 1

1 5 1

1 1 3

A A

− ′= = − −

−

DETERMINANTES

Una matriz cuadrada A de orden n×n se puede hacer corresponder con un escalar A , denominado

determinante, a partir de la suma de los productos cruzados de sus elementos.

Así, el determinante de una matriz A de orden 2×2 puede obtenerse como:

11 1211 22 12 21

21 22

a aA a a a a

a a= = −

Del mismo modo, el determinante de una matriz de orden 3×3 se obtiene operando de la siguiente

forma:

322311322113312213312312332112332211

333231

232221

131211

aaaaaaaaaaaaaaaaaa

aaa

aaa

aaa

A −+−+−==

En el cálculo de un determinante hay que tener presente que:

− Cada término contiene uno y solo un elemento de cada fila y cada columna.

− El número de elementos de cada término es el mismo que el número de filas (o columnas)

del determinante. El determinante de una matriz de orden 2×2 tiene dos elementos en

cada término, mientras que un determinante de una matriz de orden 3×3 tiene tres

elementos en cada término; y en general, un determinante n×n tiene n elementos en cada

término.

− Los términos alternan en signo.

− El desarrollo de un determinante 2×2 tiene dos términos, mientras que el determinante

de una matriz de orden 3×3, seis términos. Y en general, un determinante de orden n×n

tiene n! términos.

Propiedades de los determinantes

− Una matriz cuyo determinante tiene valor cero se denomina matriz singular.

− Si todos los elementos de una fila o columna son iguales a cero, el determinante también

será cero.

− El determinante de una matriz con dos filas (o columnas) iguales es cero.

− El determinante de una matriz y de su traspuesta son iguales tal que 'A A= .

− El intercambio de dos filas o de dos columnas cualesquiera de una matriz cambian el

signo de su determinante.

RANGO DE UNA MATRIZ

El rango de una matriz se define como el número máximo de columnas de A que son linealmente

independientes. En el caso de una matriz no singular, (tal que 0≠A ), el rango de A viene dado

por el número de filas (o columnas) de A. En el caso de una matriz singular, 0=A , el rango

será el orden de la submatriz cuadrada más grande cuyo determinante no sea igual a cero.

Ejemplo

Sea la matriz A:

−=101

210

012

A

La matriz A es singular ya que:

00)2(20001101)2(1101112

101

210

012

=×−×−××+××−×−×+××−××=−=A

Dado que

−10

21es una submatriz de la matriz A, y el determinante de dicha submatriz no es

cero: 1×1-(-2)×0, entonces el rango de A es 2.

Menor y cofactor del elemento ija de una matriz

Se denomina menor ijA del elemento ija de una matriz al determinante de la submatriz

resultante de eliminar la fila y la columna correspondiente a dicho elemento. Así, en una matriz

de orden 3×3:

=

333231

232221

131211

aaa

aaa

aaa

A

El menor de 11a será 3332

232211 aa

aaA = , el menor de12a será

3331

232112 aa

aaA = y el menor de13a

será3231

222113 aa

aaA =

Por su parte, el cofactor de un elemento ija se define como:

ijij

ij Ac )1(−=

En el ejemplo anterior, en la matriz A el cofactor 1111 Ac = , el cofactor 1212 Ac −= y el cofactor

1313 Ac = .

En consecuencia el determinante de una matriz A cuadrada de orden 3, se puede escribir como:

131312121111131312121111 AaAaAacacacaA +−=++=

Y en general el determinante de una matriz cuadrada de orden n, puede ser desarrollado a partir

de los elementos de cualquier fila, mediante la siguiente expresión:

ininiiii cacacaA +++= ...2211

Ejemplo

−−=121

231

012

A

El determinante de A puede ser escrito como:

1521

310

11

211

12

232 =

−+

−−

−−

=A

La matriz de cofactores de una matriz A de orden n×n se obtiene reemplazando cada elemento de

dicha matriz por su cofactor.

La transpuesta de la matriz de cofactores recibe el nombre de matriz adjunta de A.

MATRICES INVERSAS

La matriz inversa de una matriz cuadrada de orden n, A-1, es aquella que verifica que A·A-1=I. La

inversa de una matriz se calcula a partir de la siguiente expresión:

=

A

c

A

c

A

c

A

c

A

c

A

c

adjAA

nnnn

n

...

......

......

......

...

)(1

21

12111

En consecuencia para hallar la inversa de una matriz hay que realizar los siguientes pasos:

1. Calcular el determinante de dicha matriz.

2. Obtener los cofactores, y con ellos la matriz de cofactores.

3. Transponer la matriz de cofactores para obtener la matriz adjunta.

4. Dividir cada elemento de la matriz adjunta por el determinante de A.

Ejemplo

−−=121

231

012

A

El determinante es 15

La matriz de cofactores es:

3 2 1 2 1 3

2 1 1 1 1 27 1 5

1 0 2 0 2 11 2 5

2 1 1 1 1 22 4 5

1 0 2 0 2 1

3 2 1 2 1 3

A =

− − − − −

− − = − − − − −

− − −

Y la matriz adjunta de A es:

−

−−=

555

421

217

adjA

Por tanto, la inversa de A es:

−−−

−−=

−

−−

=−

33,033,033,0

62,031,0640,0

31,060,064,0

15

5

15

5

15

515

4

15

2

15

115

2

15

1

15

7

1A

Propiedad

Dado el producto de dos matrices A·B=C, donde A es una matriz cuadrada no singular, se verifica

que B=A-1·C.

DIAGONALIZACIÓN, VALORES SINGULARES E INVERSA GENER ALIZADA

Sea A una matriz cuadrada de orden n×n:

11 12 1

21 22 2

1 2

...

...

. . ... .

...

n

n

n n nn

a a a

a a aA

a a a

=

Se dice que el vector:

=

nv

v

v

V.2

1

es un vector propio de A de valor propio λ si verifica que:

VAV λ=

Los valores propios λ se obtienen resolviendo la ecuación característica, ecuación polinómica de

grado n, que se obtiene igualando a cero el determinante de la matriz IA λ− , es decir,

resolviendo:

0=− IA λ

La solución de la ecuación característica origina un polinomio con respecto a λ, cuya solución

implica la existencia de n raíces ó n posibles valores para λ.

Así, por ejemplo, si A es una matriz de orden 2×2, entonces su ecuación característica se obtiene

como:

0))(( 211222112221

1211 =−−−=−

−=− aaaa

aa

aaIA λλ

λλ

λ

0)())(( 2112221122112

21122211 =−++−=−−− aaaaaaaaaa λλλλ

Si λ es una raíz, entonces el vector propio de valor propio λ puede obtenerse resolviendo a su vez

el siguiente sistema de ecuaciones lineales:

0)(...

.....................................................

0...)(

0...)(

1212111

1212111

1212111

=−+++

=++−+=+++−

nn

nn

nn

vavava

vavava

vavava

λ

λλ

O en expresado matricialmente:

0)( =− VIA λ

Como puede apreciarse, una matriz A tiene tantos vectores propios como raíces o valores propios

tenga.

Propiedades

− El producto de los valores propios de una matriz es igual a su determinante.

− Si C es la matriz-columna de todos los vectores propios de A y Dλ es la matriz diagonal

con todos los vectores propios entonces se demuestra que:

λCDAC =

− Si la matriz A es simétrica entonces sus valores propios son siempre números reales; si

además son positivos se dice que es una matriz simétrica definida positiva.

Si una matriz simétrica es definida positiva de rango n y se puede descomponer en la

forma:

'PPA =

donde P es una matriz de rango n y de orden n×n no necesariamente simétrica.

− Toda matriz simétrica puede expresarse como el producto:

'CCDA λ=

Donde C es una matriz ortogonal, con los vectores propios normalizados.

− Asimismo, si una matriz A es definida positiva, entonces existe una matriz Λ , tal que:

=Λ

nλ

λλ

.00

....

0.0

0.0

2

1

verificándose entonces que P C= Λ .

Ejemplo

Sea la matriz A:

−−−

−=

311

151

113

A

La ecuación característica a través de la que calculamos los valores propios de A es:

0363611 23 =−+−=− λλλλIA

Las raíces de la ecuación característica son 2,3,6 321 === λλλ ; al ser los valores propios

números reales positivos, la matriz A es definida positiva.

El vector propio correspondiente al valor propio 61 =λ , se obtiene resolviendo el siguiente

sistema lineal:

0)63(

0)65(

0)63(

321

321

321

=−+−=−−+−

=+−−

vvv

vvv

vvv

La solución de dicho sistema es 1,2,1 321 =−== vvv

De igual forma, podemos calcular los vectores propios asociados a 32 =λ y .23 =λ

La matriz ortogonal con los vectores propios de A normalizados será entonces:

1 1 16 3 2

2 1 06 3

1 1 16 3 2

C

−= −

Y entonces se verifica que:

'

1 1 1 1 2 16 3 2 6 6 63 1 1 6 0 0

2 1 1 1 11 5 1 0 · 0 3 0 ·6 3 3 3 3

1 1 3 0 0 21 1 1 1 10

6 3 2 2 2

A CD Cλ=

− − −− − = − − −

y además:

1 1 16 0 06 3 2

2 1 0 0 3 06 3

0 0 21 1 16 3 2

P C

P

= Λ

−= −

ANEXO II. TABLAS ESTADÍSTICAS

TABLA II.1. DISTRIBUCIÓN NORMAL (0, 1)

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

TABLA II.2. DISTRIBUCIÓN t DE STUDENT

K 0.995 0.99 0.975 0.95 0.9 0.8 0.75 0.7 0.6 0.55

1 63.656 31.821 12.706 6.314 3.078 1.376 1.000 0.727 0.325 0.158

2 9.925 6.965 4.303 2.920 1.886 1.061 0.816 0.617 0.289 0.142

3 5.841 4.541 3.182 2.353 1.638 0.978 0.765 0.584 0.277 0.137

4 4.604 3.747 2.776 2.132 1.533 0.941 0.741 0.569 0.271 0.134

5 4.032 3.365 2.571 2.015 1.476 0.920 0.727 0.559 0.267 0.132

6 3.707 3.143 2.447 1.943 1.440 0.906 0.718 0.553 0.265 0.131

7 3.499 2.998 2.365 1.895 1.415 0.896 0.711 0.549 0.263 0.130

8 3.355 2.896 2.306 1.860 1.397 0.889 0.706 0.546 0.262 0.130

9 3.250 2.821 2.262 1.833 1.383 0.883 0.703 0.543 0.261 0.129

10 3.169 2.764 2.228 1.812 1.372 0.879 0.700 0.542 0.260 0.129

11 3.106 2.718 2.201 1.796 1.363 0.876 0.697 0.540 0.260 0.129

12 3.055 2.681 2.179 1.782 1.356 0.873 0.695 0.539 0.259 0.128

13 3.012 2.650 2.160 1.771 1.350 0.870 0.694 0.538 0.259 0.128

14 2.977 2.624 2.145 1.761 1.345 0.868 0.692 0.537 0.258 0.128

15 2.947 0.000 2.131 1.753 1.341 0.866 0.691 0.536 0.258 0.128

16 2.921 2.583 2.120 1.746 1.337 0.865 0.690 0.535 0.258 0.128

17 2.898 2.567 2.110 1.740 1.333 0.863 0.689 0.534 0.257 0.128

18 2.878 2.552 2.101 1.734 1.330 0.862 0.688 0.534 0.257 0.127

19 2.861 2.539 2.093 1.729 1.328 0.861 0.688 0.533 0.257 0.127

20 2.845 2.528 2.086 1.725 1.325 0.860 0.687 0.533 0.257 0.127

21 2.831 2.518 2.080 1.721 1.323 0.859 0.686 0.532 0.257 0.127

22 2.819 2.508 2.074 1.717 1.321 0.858 0.686 0.532 0.256 0.127

23 2.807 2.500 2.069 1.714 1.319 0.858 0.685 0.532 0.256 0.127

24 2.797 2.492 2.064 1.711 1.318 0.857 0.685 0.531 0.256 0.127

25 2.787 2.485 2.060 1.708 1.316 0.856 0.684 0.531 0.256 0.127

26 2.779 2.479 2.056 1.706 1.315 0.856 0.684 0.531 0.256 0.127

27 2.771 2.473 2.052 1.703 1.314 0.855 0.684 0.531 0.256 0.127

28 2.763 2.467 2.048 1.701 1.313 0.855 0.683 0.530 0.256 0.127

29 2.756 2.462 2.045 1.699 1.311 0.854 0.683 0.530 0.256 0.127

30 2.750 2.457 2.042 1.697 1.310 0.854 0.683 0.530 0.256 0.127

40 2.704 2.423 2.021 1.684 1.303 0.851 0.681 0.529 0.255 0.126

60 2.660 2.390 2.000 1.671 1.296 0.848 0.679 0.527 0.254 0.126

∞ 2.576 2.326 1.960 1.645 1.282 0.842 0.674 0.524 0.253 0.126

TABLA II.3. DISTRIBUCIÓN 2kχ

K 0.995 0.99 0.975 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.025 0.01

1 7.8794 6.6349 5.0239 3.8415 2.7055 1.3233 0.4549 0.1015 0.0158 0.0039 0.0010 0.0002

2 10.5965 9.2104 7.3778 5.9915 4.6052 2.7726 1.3863 0.5754 0.2107 0.1026 0.0506 0.0201

3 12.8381 11.3449 9.3484 7.8147 6.2514 4.1083 2.3660 1.2125 0.5844 0.3518 0.2158 0.1148

4 14.8602 13.2767 11.1433 9.4877 7.7794 5.3853 3.3567 1.9226 1.0636 0.7107 0.4844 0.2971

5 16.7496 15.0863 12.8325 11.0705 9.2363 6.6257 4.3515 2.6746 1.6103 1.1455 0.8312 0.5543

6 18.5475 16.8119 14.4494 12.5916 10.6446 7.8408 5.3481 3.4546 2.2041 1.6354 1.2373 0.8721

7 20.2777 18.4753 16.0128 14.0671 12.0170 9.0371 6.3458 4.2549 2.8331 2.1673 1.6899 1.2390

8 21.9549 20.0902 17.5345 15.5073 13.3616 10.2189 7.3441 5.0706 3.4895 2.7326 2.1797 1.6465

9 23.5893 21.6660 19.0228 16.9190 14.6837 11.3887 8.3428 5.8988 4.1682 3.3251 2.7004 2.0879

10 25.1881 23.2093 20.4832 18.3070 15.9872 12.5489 9.3418 6.7372 4.8652 3.9403 3.2470 2.5582

11 26.7569 24.7250 21.9200 19.6752 17.2750 13.7007 10.3410 7.5841 5.5778 4.5748 3.8157 3.0535

12 28.2997 26.2170 23.3367 21.0261 18.5493 14.8454 11.3403 8.4384 6.3038 5.2260 4.4038 3.5706

13 29.8193 27.6882 24.7356 22.3620 19.8119 15.9839 12.3398 9.2991 7.0415 5.8919 5.0087 4.1069

14 31.3194 29.1412 26.1189 23.6848 21.0641 17.1169 13.3393 10.1653 7.7895 6.5706 5.6287 4.6604

15 32.8015 30.5780 27.4884 24.9958 22.3071 18.2451 14.3389 11.0365 8.5468 7.2609 6.2621 5.2294

16 34.2671 31.9999 28.8453 26.2962 23.5418 19.3689 15.3385 11.9122 9.3122 7.9616 6.9077 5.8122

17 35.7184 33.4087 30.1910 27.5871 24.7690 20.4887 16.3382 12.7919 10.0852 8.6718 7.5642 6.4077

18 37.1564 34.8052 31.5264 28.8693 25.9894 21.6049 17.3379 13.6753 10.8649 9.3904 8.2307 7.0149

19 38.5821 36.1908 32.8523 30.1435 27.2036 22.7178 18.3376 14.5620 11.6509 10.1170 8.9065 7.6327

20 39.9969 37.5663 34.1696 31.4104 28.4120 23.8277 19.3374 15.4518 12.4426 10.8508 9.5908 8.2604

21 41.4009 38.9322 35.4789 32.6706 29.6151 24.9348 20.3372 16.3444 13.2396 11.5913 10.2829 8.8972

22 42.7957 40.2894 36.7807 33.9245 30.8133 26.0393 21.3370 17.2396 14.0415 12.3380 10.9823 9.5425

23 44.1814 41.6383 38.0756 35.1725 32.0069 27.1413 22.3369 18.1373 14.8480 13.0905 11.6885 10.1957

24 45.5584 42.9798 39.3641 36.4150 33.1962 28.2412 23.3367 19.0373 15.6587 13.8484 12.4011 10.8563

25 46.9280 44.3140 40.6465 37.6525 34.3816 29.3388 24.3366 19.9393 16.4734 14.6114 13.1197 11.5240

26 48.2898 45.6416 41.9231 38.8851 35.5632 30.4346 25.3365 20.8434 17.2919 15.3792 13.8439 12.1982

27 49.6450 46.9628 43.1945 40.1133 36.7412 31.5284 26.3363 21.7494 18.1139 16.1514 14.5734 12.8785

28 50.9936 48.2782 44.4608 41.3372 37.9159 32.6205 27.3362 22.6572 18.9392 16.9279 15.3079 13.5647

29 52.3355 49.5878 45.7223 42.5569 39.0875 33.7109 28.3361 23.5666 19.7677 17.7084 16.0471 14.2564

30 53.6719 50.8922 46.9792 43.7730 40.2560 34.7997 29.3360 24.4776 20.5992 18.4927 16.7908 14.9535

40 66.7660 63.6908 59.3417 55.7585 51.8050 45.6160 39.3353 33.6603 29.0505 26.5093 24.4331 22.1642

50 79.4898 76.1538 71.4202 67.5048 63.1671 56.3336 49.3349 42.9421 37.6886 34.7642 32.3574 29.7067

60 91.9518 88.3794 83.2977 79.0820 74.3970 66.9815 59.3347 52.2938 46.4589 43.1880 40.4817 37.4848

70 104.2148 100.4251 95.0231 90.5313 85.5270 77.5766 69.3345 61.6983 55.3289 51.7393 48.7575 45.4417

80 116.3209 112.3288 106.6285 101.8795 96.5782 88.1303 79.3343 71.1445 64.2778 60.3915 57.1532 53.5400

90 128.2987 124.1162 118.1359 113.1452 107.5650 98.6499 89.3342 80.6247 73.2911 69.1260 65.6466 61.7540

100 140.1697 135.8069 129.5613 124.3421 118.4980 109.1412 99.3341 90.1332 82.3581 77.9294 74.2219 70.0650

TABLA II.4. DISTRIBUCIÓN F DE SNEDECOR

Percentiles de 95

(n1 = Grados de libertad del numerador; n2 = Grados de libertad del denominador)

1 2 3 4 5 6 7 8 9 10 15 20 25 30 40 50 120 ∞

1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 245.9 248.0 249.3 250.1 251.1 251.8 253.3 254.3

2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.43 19.45 19.46 19.46 19.47 19.48 19.49 19.50

3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.70 8.66 8.63 8.62 8.59 8.58 8.55 8.53

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.86 5.80 5.77 5.75 5.72 5.70 5.66 5.63

5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.62 4.56 4.52 4.50 4.46 4.44 4.40 4.37

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 3.94 3.87 3.83 3.81 3.77 3.75 3.70 3.67

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.51 3.44 3.40 3.38 3.34 3.32 3.27 3.23

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.22 3.15 3.11 3.08 3.04 3.02 2.97 2.93

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.01 2.94 2.89 2.86 2.83 2.80 2.75 2.71

10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.85 2.77 2.73 2.70 2.66 2.64 2.58 2.54

11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.72 2.65 2.60 2.57 2.53 2.51 2.45 2.40

12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.62 2.54 2.50 2.47 2.43 2.40 2.34 2.30

13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.53 2.46 2.41 2.38 2.34 2.31 2.25 2.21

14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.46 2.39 2.34 2.31 2.27 2.24 2.18 2.13

15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.40 2.33 2.28 2.25 2.20 2.18 2.11 2.07

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.35 2.28 2.23 2.19 2.15 2.12 2.06 2.01

17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.31 2.23 2.18 2.15 2.10 2.08 2.01 1.96

18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.27 2.19 2.14 2.11 2.06 2.04 1.97 1.92

19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.23 2.16 2.11 2.07 2.03 2.00 1.93 1.88

n1

n2

20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.20 2.12 2.07 2.04 1.99 1.97 1.90 1.84

21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.18 2.10 2.05 2.01 1.96 1.94 1.87 1.81

22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.15 2.07 2.02 1.98 1.94 1.91 1.84 1.78

23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.13 2.05 2.00 1.96 1.91 1.88 1.81 1.76

24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.11 2.03 1.97 1.94 1.89 1.86 1.79 1.73

25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.09 2.01 1.96 1.92 1.87 1.84 1.77 1.71

26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.07 1.99 1.94 1.90 1.85 1.82 1.75 1.69

27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.06 1.97 1.92 1.88 1.84 1.81 1.73 1.67

28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.04 1.96 1.91 1.87 1.82 1.79 1.71 1.65

29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.03 1.94 1.89 1.85 1.81 1.77 1.70 1.64

30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.01 1.93 1.88 1.84 1.79 1.76 1.68 1.62

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 1.92 1.84 1.78 1.74 1.69 1.66 1.58 1.51

60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.84 1.75 1.69 1.65 1.59 1.56 1.47 1.39

120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.75 1.66 1.60 1.55 1.50 1.46 1.35 1.25

∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.67 1.57 1.51 1.46 1.39 1.35 1.22 1.01

Percentiles de 99

(n1 = Grados de libertad del numerador; n2 = Grados de libertad del denominador)

1 2 3 4 5 6 7 8 9 10 15 20 25 30 40 50 120 ∞

1 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 6022.40 6055.93 6156.97

6208.66

6239.86

6260.35

6286.43

6302.26

6339.51

6365.59

2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.43

99.45

99.46

99.47

99.48

99.48

99.49

99.50

3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 26.87

26.69

26.58

26.50

26.41

26.35

26.22

26.13

4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.20

14.02

13.91

13.84

13.75

13.69

13.56

13.46

5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.72 9.55 9.45 9.38 9.29 9.24 9.11 9.02

6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.56 7.40 7.30 7.23 7.14 7.09 6.97 6.88

7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.31 6.16 6.06 5.99 5.91 5.86 5.74 5.65

8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.52 5.36 5.26 5.20 5.12 5.07 4.95 4.86

9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 4.96 4.81 4.71 4.65 4.57 4.52 4.40 4.31

10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.56 4.41 4.31 4.25 4.17 4.12 4.00 3.91

11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.25 4.10 4.01 3.94 3.86 3.81 3.69 3.60

12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.01 3.86 3.76 3.70 3.62 3.57 3.45 3.36

13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.82 3.66 3.57 3.51 3.43 3.38 3.25 3.17

14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.66 3.51 3.41 3.35 3.27 3.22 3.09 3.00

15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.52 3.37 3.28 3.21 3.13 3.08 2.96 2.87

16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.41 3.26 3.16 3.10 3.02 2.97 2.84 2.75

17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.31 3.16 3.07 3.00 2.92 2.87 2.75 2.65

18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.23 3.08 2.98 2.92 2.84 2.78 2.66 2.57

19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.15 3.00 2.91 2.84 2.76 2.71 2.58 2.49

20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.09 2.94 2.84 2.78 2.69 2.64 2.52 2.42

n1

n2

21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.03 2.88 2.79 2.72 2.64 2.58 2.46 2.36

22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 2.98 2.83 2.73 2.67 2.58 2.53 2.40 2.31

23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 2.93 2.78 2.69 2.62 2.54 2.48 2.35 2.26

24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 2.89 2.74 2.64 2.58 2.49 2.44 2.31 2.21

25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.85 2.70 2.60 2.54 2.45 2.40 2.27 2.17

26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.81 2.66 2.57 2.50 2.42 2.36 2.23 2.13

27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.78 2.63 2.54 2.47 2.38 2.33 2.20 2.10

28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.75 2.60 2.51 2.44 2.35 2.30 2.17 2.06

29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.73 2.57 2.48 2.41 2.33 2.27 2.14 2.03

30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.70 2.55 2.45 2.39 2.30 2.25 2.11 2.01

40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.52 2.37 2.27 2.20 2.11 2.06 1.92 1.80

60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.35 2.20 2.10 2.03 1.94 1.88 1.73 1.60

120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.19 2.03 1.93 1.86 1.76 1.70 1.53 1.38

∞ 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.04 1.88 1.77 1.70 1.59 1.52 1.32 1.00

TABLA II.5. DISTRIBUCIÓN DEL ESTADÍSTICO DEL CONTRA STE DE DURBIN-

WATSON

Se tabulan los valores de dL y dU para un nivel de significación α=0.05

BIBLIOGRAFÍA

Achim Zeileis, Torsten Hothorn (2002). Diagnostic Checking in Regression Relationships. R

News 2(3), 7-10. URL http://CRAN.R-project.org/doc/Rnews/

Albright,R., Lerman,S. y Manski,C. (1977), “Development Of An Estimation Program For The

M. Probit Model”. Federal Highway Administration

Akaike, H. (1974), “A new look at the statistical model identification”, IEEE Transactions on

Automatic Control AC-19, pp. 716–723.

Amemiya, T. (1978), “On A Two-Step Estimation Of A Multivariate Logit Model”, Journal Of

Econometrics 8.

Anderson, R. L. (1942), “Distribution of the Serial Correlation Coefficient”, Annals of

Mathematical Statistics, 1942: 1-13.

Aznar, A. y Trívez, F. J. (1993), Métodos de Predicción en Economía II: Análisis de Series

Temporales, Ed. Ariel.

Balestra, P. y Nerlove, M. (1966), “Pooling Cross Section And Time Series Data In The

Estimation Of Coefficients In A Structural Equation”, Econometrica 34.

Bassmann, R. (1957). “A Generalized Classical Method Of Linear Estimation Of Coefficients In

A Structural Equation.” Econometrica 25, pp. 77-83

Box, G.E.P., Jenkins, G.M. y Reinsel, G.C. (1994), Time Series Analysis - Forecasting and

Control, 3rd Edition, Prentice Hall.

Burns, A.F. y Mitchell, W.C. (1947), Measuring Business Cycles, New York: Columbia

University Press For The NBER.

Chateld, Cris (2004). The Analysis of Time Series: An Introduction (6th edn.), 2004. CRC Press

Chow, G.C. (1983), Econometrics, McGraw-Hill, New York.

Christ (1960). “Simultaneus Equations Estimation: Any Veredict Yet?”. Econometrica 28, pp.

835-845.

Cochrane, D. y Orcutt, G. H. (1949a), “Application Of Least Squares Regression To Relationships

Containing Autocorrelated Error Terms”, Journal of American Statistical Association 44, pp. 32-

61.

Cochrane, D. y Orcutt, G. H. (1949b), “A Sampling Study Of The Merits Of Autorregressive And

Reduced Form Transformations In Regression Analysis” Journal of American Statistical

Association 44, pp. 356-372.

Dickey, D.A. y W.A. Fuller (1979), “Distribution of the Estimators for Autoregressive Time

Series with a Unit Root,” Journal of the American Statistical Association, 74, p. 427–431.

Durbin, J. y Koopman, S. J. (2001), Time Series Analysis by State Space Models (Oxford

Statistical Science Series, nº 24), Oxford University Press.

Durbin, J. y Watson, G. S. (1950), “Testing for Serial Correlation Least Squares Regressions”,

Biometrika, vol 37. pp. 409-428.

Engle, Robert F. (1974), Band Spectrum Regression,International Economic Review 15,1-11.

Frisch, R. (1933). Pitfalls In The Statistical Construction Of Demand and Supply Analysis, Hans

Buske Verlag. Leipzig.

Frisch, R. (1936). “Note On Term 'Econometrics' “, Econometrica 1, pp. 1-4.

Gallant, A. R.(1981) "On the Bias in Flexible Functional Forms and an Essentially Unbiased Form." J. Econometrics 15(1981):211-45. Gallant, A. R.(1984) "The Fourier Flexible Form." Amer. J. Agr. Econ. 66(1984):204-15

Goldfield, S. M. y Quandt, R. E. (1965), “Some test for Homocedasticy”, Journal of American

Statistical Association. Vol 37. pp 539-547.

Granger, C. W. J. (1969), “Investigating causal relations by econometric models and cross-

spectral methods”, Econometrica 37, p. 424-438.

Granger, C.W.J.(1981), “Some properties of time series data and their use in econometric model

specification”, Journal of Econometrics 16, pp. 121-130.

Granger, C.W.J., y Newbold, P. (1974), “Spurious regressions in econometrics”, Journal of

Econometrics 2, pp. 111-120

Greene, W. H. (2000), Análisis Econométrico, Ed. Prentice Hall

Gujarati, D. (1997), Basic Econometrics, McGraw-Hill

Gujarati, D. (2003), Econometría, Ed. McGraw-Hill

Haavelmo, T. (1943). “The Statistical Implications Of A System Of Simultaneous Equations.”

Econometrica 11, pp. 1-12.

Haavelmo, T. (1944). “The Probability Approach In Econometrics”, Suplemento de

Econometrica 12. pp. 1-118.

Hamilton, J. D. (1994), Time Series Analysis, Princeton University Press.

Hannan, E.J. (1963), Regression for Time Series, in Rosenblatt, M. (ed.), Time Series Analysis,

New York, John Wiley.

Harvey, A.C. (1978), Linear Regression in the Frequency Domain, International Economic

Review, 19, 507-512.

Hausman, J.A. (1974), “Estimation and Inference in Nonlinear Structural Models”, Annals of

Economic and Social Measurement, con Berndt E., Hall R.E. y Hall, B.H. October 1974.

Hausman, J.A. (1974): “Full Information Instrumental Variables Estimations of Simultaneas

Equations Systems”, Annals of Economic and Social Measurement, Vol 3. nº 4. pp. 641-652.

Hausman, J.A. (1978), “Specification tests in econometrics”, Econometrica, 46, pp. 1251-71.

Hildreth, C. (1960). “Simultaneus Equations Estimation: Any Veredict Yet?”. Econometrica 28,

pp. 846-854.

Hsiao, C. (1986), Analysis of Panel Data. Cambridge University Press.

Johnston, J. (1997), Econometric Methods. McGraw-Hill.

Johnston, J. y Dinardo, J. (2001), Métodos De Econometría, Ed. Vicens-Vives 3ª Ed.

Intriligator, M. D. (1978). Econometrics Models. Techniques And Applications. North-Holland.

New York.

Klein, L. R. (1960). “Single Equation Vs. Equation System Methods Of Estimation In

Econometrics.” Econometrica 28, pp. 866-871.

Klein, L. R. y Goldberger, A. (1955), An Econometric Model Of United States, 1929-1952. North-

Holland, Amsterdam.

Koopmans, T.C., Rubin, H. y Leipnik, R.B. (1950). “Measuring The Equation System Of

Dinamic Economics”, en Statistical Inference In Dinamic Economic Models, Cowles Commision

Monografico nº 10. John Wiley. Nueva York.

Kuh, L.M. (1959), “The Validity Of Cross-Sectionally Estimated Behavior Equations”

Econometrica 27.

Liu, T. (1960), “Underidentification, Structural Estimation, And Forecasting” Econometrica 28,

pp. 855-865.

Lucas, R.E. (1972), “Expectations And The Neutrality Of Money” Journal Of Economic Theory

4, pp. 103-124.

Lucas, R.E. (1973), “Some International Evidence On Output-Inflation Tradeoffs”, American

Economic Review 63, pp.326-334.

Lucas, R. E. (1976), “Econometric Policy Evaluation: A critique”, Journal of Monetary

Economics 1, nº 2, Supplementary Series: 19-46.

McFadden, D. (1974), “Conditional Logit Analysis Of Qualitative Choice Behaviour”, en

Frontiers In Econometrics, Ed. P. Zarembka, Academic Press. Nueva York.

McFadden, D. (1976), “Quantal Choice Analysis: A Survey”, Annals Of Economic And Social

Measurement.

Mitchell, W. C. (1928), Business Cycles: The Problem In Its Setting. National Bureau Of

Economic Research.

Mood, A. M. (1950), Introduction to the Theory of Statistics, McGraw-Hill.

Moore, H. L. (1914), Economic Cycles: Their Law And Causes. Macmillan Press. Nueva York.

Moore, H. L. (1917), Forecasting The Yield And The Price Of Cotton. Macmillan Press.

Muth, J.F. (1961), “Rational Expectations And The Theory Of Price Movements”, Econometrica

29, pp. 315-335.

Novales, A. (1993), Econometría, 2ª Edición, McGraw-Hill.

Pindyck, R. S. y Rubinfield, D. L. (1976), Econometric Models and Economic Forecast,

McGraw-Hill.

Pindyck, R. S. y Rubinfield, D. L. (1980), Modelos Econométricos, Ed. Labor.

Pulido, A. (1983), Modelos Econométricos, Ed. Pirámide

Rosenberg, B. (1973), “A Survey Of Stochastic Parameter Regression”, Annals Of Economic And

Social Measurement 2.

Samuelson, P. A., Koopmans, T. C. y Stone, J. (1954), “Report Of The Evaluative Committe For

Econometrica”, Econometrica 22, pp. 141-146.

Sargan, J. D. (1958), “The Estimation Of Economic Relationships Using Instrumental Variables”,


Sargent, T. (1973), “Rational Expectations, The Real Rate Of Interest And The Natural Rate

Of Unemployment”, Brookings Papers On Economic Activity 2, pp. 429-472.

Sargent, T.J. (1984), “Vector autoregressions, expectations and advice”, American Economic

Review 74, pp.408-415

Sargent, T. y Wallace, N. (1975), “Rational Expectations And The Theory Of Economic Policy”,

Journal Of Monetary Economics 2, pp. 169-184.

Schultz, M. (1938), “The Theory And Measurement Of Demand”, Chicago University Of

Chicago Press.

Schwarz, G. (1978), “Estimating the dimension of a model”, Annals of Statistics 6, 461–464.

Sims, C. A. (1980), “Macroeconomics and Reality”, Econometrica, vol. 48, p. 1-48

Sims, C.A. (1982), “Policy Analysis With Economic Models”, Brookings Papers On Economic

Activity 1, pp. 107-164.

Stewart, M. y Wallis, K. (1984), Introducción a la Econometría, Alianza Editorial.

Swamy, P. A. y Menhta, J. S. (1977), “Estimation Of Linear Models With Time And Cross-

Sectionaly Varying Coefficients”, Journal Of The American Statistical Association 72.

Theil, H. (1954), “Estimation Of Parameters Of Econometrics Models”, Bulletin Of International

Statistics Institute 34, pp.122-128.

Tinbergen, J. (1930), “Bestimmung Und Deutung Von Angebotkurven”, Zeitschrift Für

Nationalökonomie 1.

Venables, W. N. y Ripley, B. D. (2002), Modern Applied Statistics with S. 4ª Ed., Springer.

White, H. (1980), “An Heteroskedastic-Consistent Regression with Independent Observation”,


Working, E.J. (1927), “What Do Statistical Demand Curves Show?”, Quarterly Journal Of

Economics 41.

Wright, P.G. (1915), “Review Of Economic Cycles By Henry Moore”, Quarterly Journal Of

Economics 29.

Wright, P.G. (1928), “The Tariff On Animal And Vegetable Oils”, New York, The Mcmillan

Company.

Documents

ECONOMETRÍA APLICADA I - Econometria aplicada · Máster en Economía Aplicada y Programa Modular Economía Aplicada. La parte que redacté de manual de Econometría y Econometría