377
Universidad de Chile Facultad de Economía & Negocios ECONOMETRIA 1 R R e e c c o o p p i i l l a a c c i i ó ó n n d d e e P P r r u u e e b b a a s s A A n n t t e e r r i i o o r r e e s s (Desde Primavera 2004, Hasta Otoño 2008) -Jmaggior-

Magno Econometría

Embed Size (px)

Citation preview

Page 1: Magno Econometría

Universidad de Chile Facultad de Economía & Negocios

ECONOMETRIA 1

RReeccooppiillaacciióónn ddee PPrruueebbaass AAnntteerriioorreess (Desde Primavera 2004, Hasta Otoño 2008)

-Jmaggior-

Page 2: Magno Econometría

CCOONNTTRROOLLEESS 11

Page 3: Magno Econometría

Econometría IProfesores: J.M. Benavente, A. Otero y J. Vásquez.

Primavera 2004

Control 1

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayu-

dantes, no puedo tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tiene

derecho a reclamo. Contestar sólo en el espacio disponible

Pregunta 1: (30 puntos) En un modelo de regresión lineal la pendiente que se obtiene a

partir de la muestra disponible es siempre igual a la pendiente verdadera (poblacional) que

relaciona las variables.

....................................................................................................................

....................................................................................................................

....................................................................................................................

....................................................................................................................

....................................................................................................................

....................................................................................................................

....................................................................................................................

....................................................................................................................

Pregunta 2: Ud. dispone de los siguientes datos, donde Y es la variable dependiente y X

la variable explicativa. Complete la siguiente tabla con la información requerida:

Y X Y u

2 1 ....... .......-2 0 ....... .......1 4 ....... .......3 1 ....... .......β1 .......β2 .......

1

Page 4: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Pauta Control 1

Pregunta 1: (30 puntos) Mientras mayor es el tamaño de la muestra que disponemos, más seaproxima un estimador a su valor poblacional. Comente.Si bien cuando el tamaño de muestra aumenta, esta cada vez se parece más a la población, unestimador para que en el límite sea igual al valor poblacional tiene que cumplir con la propie-dad de consistencia. Recordar que un estimador es simplemente una fórmula o método que nosdice como aproximar un parámetro poblacional a través de una muestra, existen estimadoresconsistentes y otros que no lo son, a pesar que la muestra sea infinito un estimador puede serdistinto a su valor verdadero, en este caso es inconsistente.

Pregunta 2: Suponga que la variable aleatoria yi esta compuesta por la suma de un com-ponente fijo y uno aleatorio:

yi = βxi︸︷︷︸fijo

+ ui︸︷︷︸aleatorio

para i = 1, ..., N

donde xi es una variable determinística (fija), β es un parámetro que mide la influencia de xsobre y y ui es una variable aleatoria que se distribuye Normal N(0, σ2).

Determine las propiedades del siguiente estimador de β:

β =y

xdonde y =

1N

N∑

i=1

yi , x =1N

N∑

i=1

xi

R:

β =y

x=

1N

∑Ni=1 yi

1N

∑Ni=1 xi

=∑N

i=1 yi∑Ni=1 xi

(1)

Reemplazando yi = βxi + ui (expresión poblacional) en (1):

β =∑N

i=1(βxi + ui)∑Ni=1 xi

= β

∑Ni=1 xi∑Ni=1 xi

+∑N

i=1 ui∑Ni=1 xi

(2)

= β +∑N

i=1 ui∑Ni=1 xi

(3)

⇒ β − β =∑N

i=1 ui∑Ni=1 xi

(4)

Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3):

E[β] = β +∑N

i=1 E[ui]∑Ni=1 xi

= β

1

Page 5: Magno Econometría

Utilizando la propiedad de operador lineal de la Esperanza, y el supuesto que ui tiene esperanzaigual a cero, el estimador propuesto es insesgado. (20 PUNTOS)

Ahora calculemos su varianza:

V (β) = E[β − E[β]︸︷︷︸β

]2

= E[β − β]2 utilizando (4)

= E

[∑Ni=1 ui∑Ni=1 xi

]2

=1

(∑N

i=1 xi)2· E

[N∑

i=1

ui

]2

=1

(∑N

i=1 xi)2· E

[N∑

i=1

u2i + N(N − 1)ui · uj

]

=1

(∑N

i=1 xi)2·

N∑

i=1

E[u2i ]︸ ︷︷ ︸

σ2

+N(N − 1) E[ui · uj ]︸ ︷︷ ︸0

V (β) =n · σ2

(∑N

i=1 xi)2

(30 PUNTOS)

El Error cuadrático medio (ECM) se este estimador es igual a la varianza, ya que es un es-timador insesgado:

ECM(β) = V (β) + [sesgo︸ ︷︷ ︸0

]2

ECM(β) =n · σ2

(∑N

i=1 xi)2

(10 PUNTOS)

Por último, el estimador es consistente ya que es insesgado es muestras pequeñas (10 PUN-TOS). Además se puede demostrar que:

lımn→∞

V (β) =n · σ2

(∑N

i=1 xi)2= lım

n→∞n2 · σ2

n(∑N

i=1 xi)2= lım

n→∞σ2

n· 1(∑N

i=1 xi

n

)2

⇒ lımn→∞

σ2

n· 1(x)2

⇒ 1(x)2

lımn→∞

σ2

n︸ ︷︷ ︸0

= 0

⇒ βm.s→ β

⇒ βp→ β o plim(β) = β

y por lo tanto, es consistente.

2

Page 6: Magno Econometría

Econometría I

Profesores: Andrés OteroJaviera Vásquez.

Otoño 2005

Control 1

Pregunta 1: (30 puntos) El único problema de no incluir un término constanteen el Modelo de Regresión Lineal, es que no se garantiza que la recta de regresiónpase por las medias o equivalentemente que la suma de los errores estimados seaigual a cero. Comente.

Falso, si bien el no incluir un término constante en el modelo de regresión li-neal tiene el problema de no garantizar que la recta de regresión pase por lasmedias ni que la suma de los errores estimados sea igual a cero, este no es elúnico problema. El no incluir el término constante genera sesgo en la estimaciónde la pendiente al obligar a que la recta pase por el origen, tal como se muestraen el siguiente gráfico:

.

.. ... .

...

... .....

. ..

. . ... .

con constantesin constante

Sesgo en la estimación de la pendiente,provocado por la estimación de unmodelo de regresión lineal sin constante

1

Page 7: Magno Econometría

Pregunta 2: (70 puntos) Ud. dispone de los siguientes datos, donde Y es lavariable dependiente y X la variable explicativa. Complete la siguiente tabla conla información requerida:

Y X Y − Y X −X (Y − Y )(X −X) (X −X)2 Y u

12 2 7 0.5 3.5 0.25 6.1 5.92 1 -3 -0.5 1.5 0.25 3.9 -1.95 3 0 1.5 0 2.25 8.3 -3.31 0 4 -1.5 6 2.25 1.7 -0.7

Suma 11 5 0Promedio 5 1.5 5

β1 1.7β2 2.2

β2 =

∑ni=1(Y − Y )(X −X)∑n

i=1(X −X)2=

11

5= 2,2

β1 = Y − β2X = 5− 2,2 · 1,5 = 1,7

2

Page 8: Magno Econometría

Econometría I

Profesores: Emerson MeloRodrigo MonteroJaviera Vásquez

Primavera 2005

Pauta Control 1

Rut: .......................................

Ud. Dispone de 40 minutos para resolver este control, no puede hacer consultas a los ayudantes,no puedo tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tiene derechoa reclamo. Contestar sólo en el espacio disponible

Pregunta 1: Usted es gerente de costos de una prestigiosa empresa multinacional, y el ge-rente general, al cual todos llaman muy cariñosamente “Pato”, lo llama a su oficina, y le planteael siguiente problema: “...existe la necesidad de justificar frente al directorio el esquema de re-muneraciones que se aplica en la empresa. Como usted es alguien preparado, que ha estudiadoen la Universidad de Chile, necesito que me muestre cual es el premio que la empresa entrega asus trabajadores por cada año de estudio que tienen (años de escolaridad)”. La siguiente tablapresenta la información de que usted dispone:

Años de escolaridad (S) Salario (W ) Número de trabajadores0 150000 103 170000 55 185000 47 190000 810 215000 912 250000 1017 550000 517 650000 417 800000 5

Usted decide hacer un informe al respecto, y para ello debe dar respuesta a las siguientesinterrogantes. NOTA: trabaje todos los cálculos con DOS decimales.

1. Plantee el modelo a estimar, definiendo claramente cada una de las variables involucradas.(3 puntos)

Respuesta: Se debe estimar el siguiente modelo:

Wi = α + βSi + µi

donde Wi corresponde al salario del trabajador i, Si corresponde a los años de escolaridaddel trabajador i, y µi representa el términos de error, bien comportado. Los parámetrosa estimar vienen dados por α y β. Por lo tanto, el modelo plantea a priori una relaciónlineal y directa entre los años de escolaridad y el salario de la persona.

1

Page 9: Magno Econometría

2. Escriba y grafique la función objetivo. Ayuda: para graficar la función objetivo asuma quesólo existe un parámetro que debe ser estimado. (4 puntos)

Respuesta: La función objetivo a minimizar es:

mınα,β

N∑

i=1

µ2i = mın

α,β

N∑

i=1

(Wi − α− βSi)2

Graficamente:

Funciónobjetivo

Solución

3. ¿Cuáles son las estimaciones MCO de los parámetros poblacionales α y β? (6 puntos)

Respuesta:

β =∑N

i=1 siwi∑Ni=1 s2

i

=59941583, 33

2080, 98= 28804, 45

α = W − βS = 306583, 33− (28804, 45 · 8, 98) = 47823, 34

donde si y wi representan los años de escolaridad y el salario en desvíos respecto de lamedia.

4. Demuestre matemáticamente y numéricamente que la suma de los errores estimados esigual a cero. (4 puntos)

Respuesta: La función objetivo a minimizar es:

mınα,β

N∑

i=1

µ2i = mın

α,β

N∑

i=1

(Wi − α− βSi)2

Derivando con respecto a α:

∂∑N

i=1(Wi − α− βSi)2

∂α= −2

N∑

i=1

(Wi − α− βSi) = 0

Por lo tanto:N∑

i=1

(Wi − α− βSi) = 0 ⇒N∑

i=1

µi = 0

2

Page 10: Magno Econometría

Numericamente:

60∑

i=1

µi = (10 · 102176, 66) + (5 · 35763, 30)

+(4 · −6845, 60) + (8 · −59454, 50) + (9 · −120867, 86)+(10 · −143476, 76) + (5 · 12500, 98) + (4 · 112500, 98)

+(5 · 262500, 98) = 0

5. Considere la siguiente transformación de los salarios:

W ∗ = ln(W )

donde ln() corresponde al logaritmo natual. Estime nuevamente el modelo, pero utilizan-do como variable dependiente W ∗ en lugar de W . ¿Qué representa el coeficiente estimadopara la pendiente? Demuestre. (Ayuda: recuerde el concepto de semi-elasticidad) (9 pun-tos)

Respuesta: El modelo a estimar sería el siguiente:

W ∗i = γ + δSi + µi

Los estimadores MCO son:

δ =∑N

i=1 siw∗i∑N

i=1 s2i

=174, 072080, 98

= 0, 08

γ = W ∗ − δS = 12, 46− (0, 08 · 8, 98) = 11, 71

donde si y w∗i representan los años de escolaridad y el logaritmo del salario en desvíosrespecto de la media. El coeficiente estimado (δ) representa el porcentaje de incrementoen el salario por un año adicional de escolaridad. Matemáticamente:

∂ln(Wi)∂Si

=1

WidWi = δ

6. Recuerde que Pato quiere conocer el premio salarial que la empresa entrega a sus traba-jadores por cada año de escolaridad. ¿Cuál sería? Ayuda: utilice el resultado encontradoen (5). (4 puntos).

Respuesta: Por cada año adicional de escolaridad el trabajador recibe un premio de8% en su salario.

3

Page 11: Magno Econometría

Econometría I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.Ayudante : Roberto Jaramillo M.

Control 1 - Pauta de Corrección

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a losayudantes, no puedo tener nada más que lápiz en su escritorio. Si contesta con lápizmina no tiene derecho a reclamo. Debe contestar sólo en el espacio disponible.

Pregunta 1 (30 puntos)

Considere la especicación estocástica de la Función de Regresión Poblacional

Yi = E[Yi|Xi] + ui,

donde la la Función de Regresión Poblacional considerando 2 variables y una relaciónlineal es:

E[Yi|Xi] = β0 + β1Xi.

(a) Explique cuál es el supuesto detrás de la Función de Regresión Poblacional.

El supuesto esencial detrás de la Función de Regresión Poblacional es que seasume que se puede representar correctamente, en valor esperado (en promedio),a la variable dependiente a través de una función lineal de las variables explicati-vas. Se llama función poblacional porque se asume que se dispone del total de losdatos de la economía.

(b) Explique algebraicamente por qué la media condicional de ui es igual a cero(E[ui|Xi] = 0).

Se tiene

Yi = E[Yi|Xi] + ui

⇒ E[Yi|Xi] = E[E[Yi|Xi]|Xi] + ui

⇔ E[Yi|Xi] = E[Yi|Xi] + E[ui|Xi]

⇔ E[ui|Xi] = 0.

1

Page 12: Magno Econometría

Dada la ley del valor esperado iterado (E[E[A|B]|B] = E[A|B]).

Pregunta 2 (30 puntos)

(a) Explique la diferencia entre causalidad económica y correlación estadística.

La principal diferencia que existe entre causalidad económica y correlación es-tadística es que la primera es una relación de causa-efecto en un sentido económi-co. En cambio, la correlación estadística es simplemente una observación estadís-tica que indica un grado de relación lineal. La correlación estadística no nece-sariamente implica que una variable correlacionada con otra se comporte de unaforma cuando la variable con la que tiene la correlación cambie, no hay necesari-amente una causalidad. En el ejemplo dado en clases, existe un grado de relaciónentre la calidad de un vino y el clima, pero no se puede decir que el clima estáprovocado por la calidad del vino.

(b) Explique la diferencia entre la representación estocástica de la Función de Regre-sión Muestral y representación estocástica de la Función de Regresión Poblacional.

La diferencia está en la cantidad de datos disponibles para la regresión. En larepresentación estocástica de la Función de Regresión Poblacional, tal como lodice su nombre, se dispone de los datos que corresponden a la población, que rep-resentan el total de datos. En cambio, la Función de Regresión Muestralal serMuestral está utilizando un subconjunto de la población, lo que nos puede llevara conclusiones distintas por las ucuaciones entre las distintas muestras, tratan-do esta última de estimar a la Función de Regresión Poblacional con los datosdisponibles en la muestra. El término de error en la función poblacional corre-sponde al error generado por tratar de explicar la variable dependiente a través deuna especicación funcional en particular, mientras que en la función muestral eltérmino de error recoge además el error de estimación de los parámetros.

2

Page 13: Magno Econometría

Econometría IProfesoras: Claudia Sanhueza

Javiera Vásquez.Otoño 2006

Pauta Control 1

Pregunta 1: (30 puntos) Si un estimador β converge, entonces este estimador es consistente.Comente.

Esto no es necesariamente cierto, ya que el estimador puede converger a un valor distinto delvalor poblacional del parámetro. Sólo si el estimador converge al verdadero valor del parámetro(poblacional) este estimador es consistente.

Pregunta 2: (70 puntos) Suponga que la variable aleatoria yi esta compuesta por la sumade un componente fijo y uno aleatorio:

yi = βxi︸︷︷︸fijo

+ ui︸︷︷︸aleatorio

para i = 1, ..., N

donde xi es una variable determinística (fija), β es un parámetro que mide la influencia de x so-bre y y ui es una variable aleatoria independiente e idénticamente distribuida Normal N(0, σ2).

Determine si el siguiente estimador de β es insesgado, calcule su varianza y determine si esconsistente:

β =y

xdonde y =

1N

N∑

i=1

yi , x =1N

N∑

i=1

xi

R:

β =y

x=

1N

∑Ni=1 yi

1N

∑Ni=1 xi

=∑N

i=1 yi∑Ni=1 xi

(1)

Reemplazando yi = βxi + ui (expresión poblacional) en (1):

β =∑N

i=1(βxi + ui)∑Ni=1 xi

= β

∑Ni=1 xi∑Ni=1 xi

+∑N

i=1 ui∑Ni=1 xi

(2)

= β +∑N

i=1 ui∑Ni=1 xi

(3)

⇒ β − β =∑N

i=1 ui∑Ni=1 xi

(4)

Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3):

E[β] = β +∑N

i=1 E[ui]∑Ni=1 xi

= β

1

Page 14: Magno Econometría

Utilizando la propiedad de operador lineal de la Esperanza, y el supuesto que ui tiene esperanzaigual a cero, el estimador propuesto es insesgado. (20 PUNTOS)

Ahora calculemos su varianza:

V (β) = E[β − E[β]︸︷︷︸β

]2

= E[β − β]2 utilizando (4)

= E

[∑Ni=1 ui∑Ni=1 xi

]2

=1

(∑N

i=1 xi)2· E

[N∑

i=1

ui

]2

=1

(∑N

i=1 xi)2· E

[N∑

i=1

u2i + N(N − 1)ui · uj

]

=1

(∑N

i=1 xi)2·

N∑

i=1

E[u2i ]︸ ︷︷ ︸

σ2

+N(N − 1) E[ui · uj ]︸ ︷︷ ︸0

V (β) =n · σ2

(∑N

i=1 xi)2

(30 PUNTOS)

El Error cuadrático medio (ECM) se este estimador es igual a la varianza, ya que es un es-timador insesgado:

ECM(β) = V (β) + [sesgo︸ ︷︷ ︸0

]2

ECM(β) =n · σ2

(∑N

i=1 xi)2

Para demostrar que es consistente, en el límite el error cuadrático medio (o varianza) debe serigual a cero, de esta forma el estimador converge en media cuadrática a su verdadero valor, yes estimador se dice consistente:

lımn→∞

V (β) =n · σ2

(∑N

i=1 xi)2= lım

n→∞n2 · σ2

n(∑N

i=1 xi)2= lım

n→∞σ2

n· 1(∑N

i=1 xi

n

)2

⇒ lımn→∞

σ2

n· 1(x)2

⇒ 1(x)2

lımn→∞

σ2

n︸ ︷︷ ︸0

= 0

⇒ βm.s→ β

⇒ βp→ β o plim(β) = β

y por lo tanto, es consistente.

(20 PUNTOS)

2

Page 15: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Control 1

Semestre: Primavera 2006Profesores: José Miguel Benavente, Rodrigo MonteroTiempo de duración: 20 minutosNo hay preguntas de ningún tipo para los ayudantes.

Comente (6 puntos)

En el contexto del modelo de regresión lineal de dos variables (Yi = α+βXi +µi)

el signo de β estará determinado por el signo del coeficiente de correlación entre

X e Y .

Respuesta. El coeficiente de correlación entre X e Y se define como:

ρ =Cov(X, Y )

σXσY

donde σX y σY representan las desviaciones estándar de X e Y , respectivamente.

Por lo tanto:

ρ =

∑xy√∑

x2√∑

y2

donde la letra en minúsculas indica que la variable se encuentra en desvíos re-

specto a la media. Por lo tanto:

β = ρ

√∑y2

√∑x2

Es decir, el signo del estimador de β va a depender del signo del coeficiente

de correlación entre X e Y . Por lo tanto, el comente es verdadero.

Problema (14 puntos)

Considere el siguiente modelo:

Yi = α + βXi + µi

1

Page 16: Magno Econometría

donde µi es independiente e identicamente distribuido con media 0 y varianza σ2.

La variable X tiene las siguientes realizaciones: X1 = 1, X2 = 2, X3 = 3, X4 = 4,

X5 = 5 y X6 = 6.

Un econometrista estima la pendiente de esta relación mediante la siguiente ex-

presión:

β =1

8(Y6 + Y5 − Y2 − Y1)

1. Muestre que este estimador es insesgado.

Respuesta. Reemplazando:

β =1

8(βX6 + βX5 − βX2 − βX1 + µ6 + µ5 − µ2 − µ1)

Reemplazando por los valores de X:

β =1

8(8β + µ6 + µ5 − µ2 − µ1) = β +

1

8(µ6 + µ5 − µ2 − µ1)

Aplicando esperanza se llega a:

E(β) = β

Por lo tanto, este estimador es insesgado.

2. Derive su varianza y determine la eficiencia relativa de este estimador re-

specto al estimador de mínimos cuadrados ordinarios.

Respuesta. Se sabe que:

β = β +1

8(µ6 + µ5 − µ2 − µ1)

Aplicando varianza:

V ar(β) =1

64V ar(µ6 + µ5 − µ2 − µ1) =

σ2

16

2

Page 17: Magno Econometría

Por otro lado:

V ar(βMCO) =σ2

∑x2

=2

35σ2

Por lo tanto, la eficiencia relativa de este estimador viene dada por:

V ar(β)

V ar(βMCO)=

35

32> 1

ES decir, este estimador es menos eficiente que el estimador de mínimos

cuadrados ordinarios.

3

Page 18: Magno Econometría

Econometrıa ISemestre Primavera 2007

Control 1

Pauta Desarrollo

Profesores: Jose Miguel Benavente, Rodrigo Montero P.

Ayudantes: Rodrigo Bravo C., Felipe Rıos B., Loreto Silva V.

Puntaje Total: 100 pts.

1. (50 Pts.) Considere el modelo de regresion lineal Y = Xβ + µ con regresores determinısticos yerrores identica e independientemente distribuidos pero con primero momento igual a a, (µi ∼iid(a, σ2),∀i). Entonces si a es distinto de cero entonces V ar(βMCO) 6= σ2(X ′X)−1 y por ende elestimador deja de ser eficiente.

Respuesta: Falso por los dos motivos siguientes:

Si E(u) = a, entonces V ar(βMCO) sigue siendo σ2(X ′X)−1 ya que el supuesto en el enunciadono altera el hecho que var(u) = σ2

u · I.

Si E(u) = a, el estimador βMCO ya no es insesgado y por ende no podemos hablar deeficiencia. Ya que es una propiedad que se aplica solo a los estimadores insesgados.

2. (50 Pts.) Demuestre que en un modelo de regresion lineal multiple con k regresores, el estimadorinsesgado de la varianza del error es:

σ =∑n

i=1 ui2

n− k

Respuesta:

Primero, el vector de residuos estimados puede escribirse en funcion de los residuos poblacionalesde la siguiente forma:

u = Mu

Donde M = In −X(X ′X)−1X ′, matriz de dimension nxn idempotente y que satisface MX = 0.

Entonces: E(u′u) = E(u′MMu) = E(u′Mu), dada las caracterısticas de la matriz M. Como u′Mues un escalar entonces E(u′Mu) = E[Tr(u′Mu)].

Al cambiar el orden de las matrices queda:

E(u′Mu) = E[Tr(u′Mu) = E[tr(Mu′u)] = Tr[E(Mu′u)] = Tr[ME(u′u)] = Tr[Mσ2uIn] =

σ2uTr(M) = σ2

u[Tr(In)− Tr[X(X ′X)−1X ′]] = σ2u(n− k)

Por lo tanto como E(u′Mu) = σ2u(n − k) para que la suma de los errores al cuadrado sea un

estimador insesgado de σ2u debemos dividir por (n− k).

σ =∑n

i=1 ui2

n− k⇒ E(σ) =

E(∑n

i=1 ui2)

n− k=

(n− k)σ2u

n− k= σ2

u

1

Page 19: Magno Econometría

1) Comentes

a) Cuando hay variables omitidas en la regresión, que son determinantes de la variable dependiente, entonces el estimador MCO de la variable incluida siempre estará sesgado.

b) El teorema de Gauss-Markov prueba que, con errores homocedásticos, el estimador OLS es insesgado.

c) Una de las condiciones importantes de Gauss-Markov es var(ui|X1,…, Xn) = 2uσ , 0 <

2uσ

< ∞ for i = 1,…, n,.

d) Cuando los errores son heterocedásticos OLS es insesgado y eficientes, a menos que haya autocorrelación.

e) Discuta intuitivamente la fórmula para el F estadístico para testaer las restricciones

1 0β = y 2 0β = : µ

µ1 2

1 2

2 2,1 2 1

2

,

21

2 1

t t

t t

t t t tF

ρ

ρ

+ − = −

.

Answer: For the case when there is no correlation between the two explanatory variables, the

formula reduces to a simple average of the squared t-statistics, i.e., ( )2 21 2

1

2F t t= + .

The 2,F ∞ distribution is the distribution of a random variable with a chi-squared

distribution with 2 degrees of freedom, divided by 2. Equivalently, the

2,F ∞ distribution is the distribution of the average of 2 squared standard normal

random variables. Because the t-statistics are uncorrelated by assumption, they are independent standard normal random variables under the null hypothesis. If either

1β or 2β are nonzero (or both), then either 21t or

22t or both will be large. This

leads to a large F-statistic, and hence a rejection of the null hypothesis.

2) Preguntas Largas

2.1) Considere el modelo 1i i iY X uβ= + , donde 2i i iu cX e= y todos los X y e son i.i.d. y

distribuidos N(0,1).

a) Pruebe si son satisfechos cada uno de los supuestos extendidos del modelo de regresión múltiple

b) Será el estimador OLS de 1β eficiente?

c) Cómo estimaría 1β por WLS?

Consider the model 1i i iY X uβ= + , where 2

i i iu cX e= and all of the X’s and e’s are i.i.d. and

distributed N(0,1). (a) Which of the Extended Least Squares Assumptions are satisfied here? Prove your assertions.

Page 20: Magno Econometría

Answer: The extended least squares assumptions are:

1. E(cXiei|Xi) = 0 (conditional mean zero) – this holds here since the X’s and e’s are i.i.d;

2. (Xi, Yi), i = 1,…, n are independent and identically distributed (i.i.d.) draws from their joint distribution - this applies here;

3. (Xi, ui) have nonzero finite fourth moments – this follows from the normal distribution, which has moments of all orders.

4. var(ui|Xi) = 2uσ (homoskedasticity) – this fails since var(ui|Xi) =

4iX ; and

5. The conditional distribution of ui given Xi is normal (normal errors) – this

holds since ,i iX u is perfectly normal, so to speak.

(b) Would an OLS estimator of 1β be efficient here?

Answer: Since the model is heteroskedastic, WLS offers efficiency gains.

(c) How would you estimate 1β by WLS?

Answer: You would weight each observation by 21/ iX , i.e., regress

2/i iY X on 1/ iX .

2.2) Se tienen datos de 104 países para determinar cuales son los determinantes de las diferencias entre calidad de vida (medido por nivel de inreso percápita) en el mundo. Recuerde de su curso de Maroeconomía que el modelo de crecimiento neoclásico sugiere que el nivel de producto por trabajador (ingreso per cápita) están determinados, entre otros, por la tasa de ahorro y el crecimiento de la población. Para testear este modelo se corre la siguiente regresión:

·RelPersInc = 0.339 – 12.894×n + 1.397×sK R2=0.621, SER = 0.177

donde RelPersInc es PIB por trabajador relativo a US, n es el crecimiento de la población promedio, 1980-1990, y sK es la tasa de inversión promedio como porcentaje del PIB de 1960 a1990 (recuerde inversión=ahorro).

a) Interprete los resultados. Son los signos esperados? Explique. b) Recuerdas que también el capital humano important para determinar las

diferencias en estándar de vida de un país. Por eso agregas datos adicional es de años de educación promedio para 1985 (Educ) a la regersión. Los nuevos resultados son:

·RelPersInc = 0.046 – 5.869×n + 0.738×sK + 0.055×Educ R2=0.775, SER = 0.1377 Cómo afecta los resultados anteriores?

Page 21: Magno Econometría

c) Chequeando los resultados te das cuenta que ahora hay 86 observaciones, ya que los datos de Educ no están disponibles para todos los países. Tienes que modificar alguna de tus conclusiones en (b)?

d) Brazil tiene los siguientes valores: RelPersInc = 0.30, n = 0.021, sK = 0.169,

Educ = 3.5. Tú ecuación sobre estima o sub estima el PIB percápita de Brazil? Qué pasaría si Brazil logra duplicar su nivel educacional?

You have collected data for 104 countries to address the difficult questions of the determinants for differences in the standard of living among the countries of the world. You recall from your macroeconomics lectures that the neoclassical growth model suggests that output per worker (per capita income) levels are determined by, among others, the saving rate and population growth rate. To test the predictions of this growth model, you run the following regression:

·RelPersInc = 0.339 – 12.894×n + 1.397× sK , R2=0.621, SER = 0.177

where RelPersInc is GDP per worker relative to the United States, n is the average population growth rate, 1980-1990, and sK is the average investment share of GDP from 1960 to1990 (remember investment equals saving).

(a) Interpret the results. Do the signs correspond to what you expected them to be? Explain.

Answer: The Solow growth model predicts higher productivity with higher saving rates and lower population growth. The signs therefore correspond to prior expectations. A 10 percent point increase in the saving rate results in a roughly 14 percent increase in per capita income relative to the United States. Lowering the population growth rate by 1 percent results in a 13 percent higher per capita income relative to the United States. It is best not to interpret the intercept. The regression explains approximately 62 percent of the variation in per capita income among the 104 countries of the world.

(b) You remember that human capital in addition to physical capital also plays a role in

determining the standard of living of a country. You therefore collect additional data on the average educational attainment in years for 1985, and add this variable (Educ) to the above regression. This results in the modified regression output:

·RelPersInc = 0.046 – 5.869×n + 0.738× sK + 0.055×Educ, R2=0.775, SER = 0.1377 How has the inclusion of Educ affected your previous results?

Answer: The coefficient on the population growth rate is roughly half of what it was originally, while the coefficient on the saving rate has approximately doubled. The regression R2 has increased significantly.

(c) Upon checking the regression output, you realize that there are only 86 observations, since

data for Educ is not available for all 104 countries in your sample. Do you have to modify some of your statements in (d)?

Page 22: Magno Econometría

Answer: When comparing results, you should ensure that the sample is identical, since comparisons are not valid otherwise.

(d) Brazil has the following values in your sample: RelPersInc = 0.30, n = 0.021, sK = 0.169, Educ =

3.5. Does your equation overpredict or underpredict the relative GDP per worker? What would happen to this result if Brazil managed to double the average educational attainment?

Answer: The predicted value for Brazil is 0.240. Hence the regression underpredicts Brazil’s

per capita income. Increasing Educ to 7.0 would result in a predicted per capita income of 0.43, which is a substantial increase from both its current actual position and the previously predicted value.

2.3) Una sub-muestra de la encuesta de CASEN 2003 tiene los siguientes datos de salarios por hora individuales, edad y género. Leíste en las noticias que por cada peso que gana un hombre la mujer gana 0,7 pesos. Para testear está hipótesis, primero regresionas ingresos en una variable binaria que toma el valor 1 si es mujer y 0 si es hombre, y una constante. Estos son los resultados:

a) Desarrolle un test de diferencias de medias e indique si las diferencias entre los salarios de hombres y mujeres son estadísticamente significativas. Justique su elección de un test de una o dos colas. Es esta evidencia de discriminación en contra de la mujer? Por qué? Es probable que los errores se distribuyan normalmente en este caso? Si no, presenta esto un problema para hacer el test?

b) Decides incluir como control la edad (en años). Los resultados son los siguientes: Testee la significancia de edad y género. Por qué crees que la edad juega un rol en la determinación de los salarios.

2.3) A subsample from the Current Population Survey is taken, on weekly earnings of individuals,

their age, and their gender. You have read in the news that women make 70 cents to the $1 that men earn. To test this hypothesis, you first regress earnings on a constant and a binary variable, which takes on a value of 1 for females and is 0 otherwise. The results were:

·Earn = 570.70 - 170.72×Female, R2=0.084, SER = 282.12. (9.44) (13.52)

(a) Perform a difference in means test and indicate whether or not the difference in the mean

salaries is significantly different. Justify your choice of a one-sided or two-sided alternative test. Are these results evidence enough to argue that there is discrimination against females? Why or why not? Is it likely that the errors are normally distributed in this case? If not, does that present a problem to your test?

Answer: The t-statistic is -12.63, while the critical value is –1.64. The difference is therefore

statistically significant. A one-sided alternative was chosen since the claim is that females make less than males. This represents little evidence of discrimination, since attributes of males and females have not been included. Given that earnings distributions are not normally distributed, the errors will also not be distributed

Page 23: Magno Econometría

normally, and assuming that they are, results in problematic inference. (b) Test for the significance of the age and gender coefficients. Why do you think that age plays a

role in earnings determination?

Answer: The t-statistics are 9.36 for the age coefficient, and -13.00 for the gender coefficient. Both of these values are greater than the (absolute) critical value from the standard normal distribution (1.64). Hence you can reject the null hypothesis that these coefficients are zero. Age proxies “on the job training.” A better proxy that has been used frequently in the past is the Mincer experience variable (Age-Education-6). Obviously this is a better proxy for some subsample of individuals than for others.

2.4) Demuestre que aunque el estimar MCO en el modelo de regersión lienal simple,es

µ 11

2 2

1

n

i ii

n

ii

X Y nXY

X nX

β =

=

=

∑. Si minimizamos la suma de los cuadrados de los residuos en el

modelo de regresión lineal múltiple 0 1 1 2 2i i i iY X X uβ β β= + + + , los estimadores MCO no

son µ1 1

11

2 21 1

1

n

i ii

n

ii

X Y nX Y

X nX

β =

=

=

∑ y ¶

2 21

22 22 2

1

n

i ii

n

ii

X Y nX Y

X nX

β =

=

=

∑, a menos que 2 1

1

0n

i ii

X X=

=∑ .

For the simple linear regression model of Chapter 4, 0 1i i iY X uβ β= + + , the OLS estimator for the

intercept was ¶ µ0 1Y Xβ β= − , and µ 1

12 2

1

n

i ii

n

ii

X Y nXY

X nX

β =

=

=

∑. Intuitively, the OLS estimators for the

regression model 0 1 1 2 2i i i iY X X uβ β β= + + + might be ¶ µ ¶0 1 1 2 2Y X Xβ β β= − −

, µ1 1

11

2 21 1

1

n

i ii

n

ii

X Y nX Y

X nX

β =

=

=

∑ and ¶

2 21

22 22 2

1

n

i ii

n

ii

X Y nX Y

X nX

β =

=

=

∑. By minimizing the prediction mistakes of the

regression model with two explanatory variables, show that this cannot be the case.

Answer: To minimize the sum of squared prediction mistakes

20 1 1 2 2

1

( )n

i i ii

Y b b X b X=

− − −∑

Page 24: Magno Econometría

you need to take the following three derivatives with respect to 0 1,b b and 2b . This

results in

20 1 1 2 2 0 1 1 2 2

1 10

( ) 2 ( )n n

i i i i i ii i

Y b b X b X Y b b X b Xb = =

∂− − − = − − − −

∂∑ ∑

20 1 1 2 2 0 1 1 2 2 1

1 11

( ) 2 ( )n n

i i i i i i ii i

Y b b X b X Y b b X b X Xb = =

∂− − − = − − − −

∂∑ ∑

20 1 1 2 2 0 1 1 2 2 2

1 12

( ) 2 ( )n n

i i i i i i ii i

Y b b X b X Y b b X b X Xb = =

∂− − − = − − − −

∂∑ ∑

The OLS estimators are those for which the derivatives are zero. Hence we get

µ µ µ µ µ µ1 2 1 20 1 2 0 1 2

1

2 ( ) 0;n

i i ii

Y X X Y X Xβ β β β β β=

− − − − = = − −∑

µ µ µ µ µ µ21 2 1 1 1 1 2 10 1 2 0 1 2

1 1 1 1

2 ( ) 0;n n n n

i i i i i i i i ii i i i

Y X X X Y X nX X X Xβ β β β β β= = = =

− − − − = = + +∑ ∑ ∑ ∑

µ µ µ µ µ µ21 2 2 2 2 2 2 10 1 2 0 2 1

1 1 1 1

2 ( ) 0;n n n n

i i i i i i i i ii i i i

Y X X X Y X nX X X Xβ β β β β β= = = =

− − − − = = + +∑ ∑ ∑ ∑

It is clear that the first of these three expressions results in ¶ µ ¶0 1 1 2 2Y X Xβ β β= − − .

However, the second (third) expression involves terms in 2iX ( 1iX ), hence the

formula cannot be simplified to µ1 1

11

2 21 1

1

n

i ii

n

ii

X Y nX Y

X nX

β =

=

=

∑ ( ¶

2 21

22 22 2

1

n

i ii

n

ii

X Y nX Y

X nX

β =

=

=

∑)

unless special conditions hold (such as 2 11

0n

i ii

X X=

=∑ ).

Page 25: Magno Econometría

Control #1

Econometrıa I

Profesores: Tomas Rau y Javiera Vasquez

Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda

26 de marzo, 2008

Tiempo Total: 30 Minutos.

1. Comentes (10 puntos, 5 c/u)

1) La recta de regresion poblacional es igual a la funcion de regresion poblacional. (beautiful mind)

R. Depende. En general es falso. En particular, si las variables aleatorias tienen una distribucion normalbivariada, la esperanza condicional, i.e. la funcion de regresion poblacional es una funcion lineal de Xy por lo tanto es una recta de regresion poblacional. En ese caso es verdadero.

2) La representacion estocastica de la funcion de regresion poblacional implica que E(u|X) = 0. Por otraparte, la ley de las esperanzas iteradas implica que E(u) = 0. Esto es conveniente puesto que el errorpoblacional es cero, en promedio.

R. Verdadero. La representacion estocastica de la funcion de regresion poblacional implica que E(u|X) =0 puesto que asume que Y = E(Y |X) + u. Al tomar esperanza condicional a los dos lados de la ecua-cion tenemos que E(u|X) = 0. Tambien es cierto que la LEI implica que E(u) = 0 puesto queE[E(u|X)] = E(u) y E[E(0|X)] = 0. Ademas de conveniente es una condicion que impone la represen-tacion estocastica (si E(u|X) 6= 0 veremos mas adelante que MCO no sera insesgado ni consistente).

2. Problema (20 puntos)

Suponga que Ud. dispone de datos agragegados del Simce para colegios de dos comunas de Santiago:Puente Alto y Recoleta, las cuales seran indexadas por los ındices p y r respectivamente. Los puntajespromedios fueron Y p = 270 y Y r = 260 con varianzas muestrales dadas por S2

p= 100 y S2

r= 72. Por ultimo,

los tamanos muestrales logrados fueron de np = 10 y nr = 12. A pesar de la importante diferencia de 10puntos, personeros de la comuna de Recoleta insisten que la media en esa comuna serıa mas alta que enPuente Alto. Para ayudar a esclarecer esa diferencia, realice un test de diferencia de medias de la siguientehipotesis nula: H0 : µp < µr ante la alternativa H1 : µp ≥ µr. Asuma que las muestras son aleatorias simplesy utilice un nivel de significancia de α = 5 % y luego α = 1 %. ¿ Que puede inferir de los resultados de laspruebas de hipotesis?

R. Simplemente,

t =Y p − Y r

S2p/np + S2

r/nr

=10

4= 2,5

1

Page 26: Magno Econometría

ademas, t5 %,20 = 1,725 y t1 %,20 = 2,528. Por lo tanto, t > t5 %,20 lo cual implica que se rechaza lahipotesis nula que la media de Recoleta es mayor que la de Puente Alto a un 5% de significancia. Por otrolado, t < t1%,20, con lo cual no se rechaza la hipotesis nula a un 1% de significancia. Luego, dado que lasignicancia es la probabilidad de cometer error de tipo I, vemos que se rechaza facilmente para estandaresconvencionales (5 %) pero si somos un poco mas exigentes (o aversos al riesgo de cometer dicho error) norechazamos la hipotesis nula. Dado el tamano muestral y las propiedades asintoticas de los estimadores, essensato usar un nivel de significancia de 5% y asumir que existe un 5 % de probabilidad de cometer error detipo I e igualmente rechazar la hipotesis nula.

Cuadro 1: Valores Crıticos para una distribucion t-Studentn-k 90 % 95% 97.50% 99 % 99.50%

1 3.078 6.314 12.71 31.82 63.66

2 1.886 2.92 4.303 6.965 9.925

3 1.638 2.353 3.182 4.541 5.841

4 1.533 2.132 2.776 3.747 4.604

5 1.476 2.015 2.571 3.365 4.032

.

.

20 1.325 1.725 2.086 2.528 2.845

21 1.323 1.721 2.080 2.518 2.831

22 1.321 1.717 2.074 2.508 2.819

23 1.319 1.714 2.069 2.500 2.807

2

Page 27: Magno Econometría

CCOONNTTRROOLLEESS 22

Page 28: Magno Econometría

. .

.”

. -

ï . .

.I_

Econometria 1 - .“Profesores+ J.M. U.enavenle, A. Otero y J. Vásquez.

- PRIMAVkA 2 0 0 4 .., ~ ., <

CONTROL 2c

Nor11brc: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Rut: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . _. . . .control, no puede hacer consultas a los ayu-

dantes, no puedo tener nada m& que l&piz en su escritorio, si contesta con l&piz mina no tienederecho a reclamo. Contestar ~610 en el espacio disponible

Pregunta 1: (30 puntos) En el modelo de regresibn lineal de una variable explicativa si lavariable independiente -Y no raría, entonces el estimador ,/$ será igual al verdadero valor pobla-

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..*.....................................

Pregunta 2: (70 puntos) En un modelo de regresión lineal con k variables explicativas,Y = X/~+U. Demuestre que e l est imador mínimos cuadrados ordinarios cumple con la condiciónde minimizar la suma de errores al cuadrado.

.$M, =

N\J’ j& c

(hYn)

)JJM.= .’YY’ -

CQQ

Page 29: Magno Econometría
Page 30: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Control 2

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada más que lápizen su escritorio, si contesta con lápiz mina no tiene derecho a reclamo. Contestar sólo en elespacio disponible

Pregunta 1: (30 puntos) En el contexto de un Modelo de Regresión Lineal (MRL), la rec-ta de regresión pasa por los valores promedios de la variable dependiente. Comente.

Este se cumple siempre que el modelo de regresión incluya un término constante, es la constantejustamente quien cumple el rol de asegurar que el promedio muestral del valor estimado de Yse iguale con el promedio muestral de los valores observados de Y . Si el modelo incluye términoconstante por condición de primer orden se cumple que

∑ui = 0, y que el valor estimado de

la constante (β1) es β1 = Y − β2X, de lo que deduce inmediatamente que la recta de regresiónpasa por los valores promedio: Y = β1 + β2X. Por lo tanto, esta afirmación es verdadera sólosi estamos hablando de un modelo que incluye término constante.

Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresión Lineal Simple:

Yi = β1 + β2Xi + ui para i = 1, ..., N

Además posee la siguiente información muestral de X e Y:

Y 2 5 6 7X 0 10 18 20

a. Obtenga el estimador Mínimos Cuadrados Ordinarios de β1 y β2.

b. Determine β2, pero en un modelo sin constante. ¿Cómo cambia con respecto al obtenido ena.?

c. ¿Cúales son las consecuencias de no incorporar el término constante en la especificación?

R:

a. Los estimadores MCO de β1 y β2 son:

β1 = Y − β2X

β2 =∑4

i=1(Xi −X) · (Yi − Y )∑4i=1(Xi −X)2

Utilizando la información muestral entregada tenemos:

1

Page 31: Magno Econometría

Y X Y − Y X −X (Y − Y )(X −X) (X −X)2

2 0 -3 -12 36 1445 10 0 -2 0 46 18 1 6 6 367 20 2 8 16 64

Promedio 5 12Suma 58 248

De esta forma,

β2 =58248

= 0,233870968

β1 = 5− 0,233870968 · 12 = 2,193548387

También se puede obtener los estimadores de β1 y β2 utilizando la forma matricial del estimadorMCO:

β = (X ′X)−1X ′Y

utilizando la información disponible:

β =[

β1

β2

]=

[4 4848 824

]−1 [20298

]=

[2,1935483870,233870968

]

(40 puntos)

b. El estimador MCO de β2 es un modelo sin constante (Y = β2X + u) es1:

β2 =∑4

i=1 Xi · Yi∑4i=1 X2

i

Como el modelo no incluye constante, este estimador NO queda expresado en desvíos conrespecto a la media. Utilizando la información disponible:

Y X Y ·X X2

2 0 0 05 10 50 1006 18 108 3247 20 140 400

Promedio 5 12Suma 298 824

1Este se obtiene de minimizar la suma de los errores al cuadrado con respecto a β2:

mınβ2

4∑

i=1

(Yi − β2Xi)2

CPO :∂SE(β2)

∂β2

=4∑

i=1

2 · (Yi − β2Xi)(−Xi) = 0

⇒4∑

i=1

(−XiYi + β2X2i ) = 0

⇒ β2 =

∑4i=1 Xi · Yi∑4

i=1 X2i

2

Page 32: Magno Econometría

Por lo tanto,

β∗2 = 0,361650485

Como podemos apreciar el valor estimado para β2, es mayor que el en caso donde se incluye laconstante, esto porque al ser positiva la constante y omitirla se genera un sesgo hacia arriba delparámetro de pendiente. Esto se puede apreciar gráficamente en la siguiente figura, que dibujalas recta de regresión estimadas de un modelo con y sin constante:

Modelo conconstante

Modelo sinconstante

Al ser la constante positiva (cuando la estimamos), si la obligamos a ser cero (estimación siconstante), la pendiente de la recta de regresión aumenta para lograr minimizar la suma de loserrores al cuadrado.

(20 puntos)

c. Las consecuencias de estimar un modelo sin constante son:

Sesgo en el parámetro de pendiente (se omite una variable, la constante)

No se garantiza que∑n

i=1 ui = 0

No se garantiza que la recta de regresión pase por los valores promedios de las variablesobservadas, no se garantiza que el promedio estimado de la variable dependiente sea igualal promedio observado de dicha variable.

(10 puntos)

3

Page 33: Magno Econometría

Econometría IProfesores: A. Otero y J. Vásquez.

Primavera 2004

Pauta Control 2

Pregunta 1: (30 puntos) En un modelo de regresión lineal simple: Yi = β1+β2Xi+ui, mientrasmenor es la varianza de los errores estimados y mientras mayor es la varianza muestral de lavariable explicativa, el estimador MCO de β2 es menos preciso. Comente.

Recordemos que la varianza del estimador MCO de β2 es:

V ar(β2) =σ2

∑ni=1(Xi −X)2

=σ2

nn ·

∑ni=1(Xi −X)2

=σ2

n · V ar(X)

donde V ar(X) es el estimador muestral de la varianza de X. De esta forma, a medida queaumenta la varianza de X y disminuye la varianza de u, disminuye la varianza de β2 y el esti-mador es más preciso. Con lo cual el comente es falso.

Pregunta 2: (70 puntos) Demuestre que en un modelo de regresión lineal múltiple con kregresores, el estimador insesgado de la varianza del error es:

σ2 =∑n

i=1 u2i

n− k

Primero, el vector de residuos estimados puede escribirse en función de los residuos poblacio-nales de la siguiente forma:

u = Mu

Donde M = In−X(X ′X)−1X ′, matriz de dimensión nxn idempotente y que satisface MX = 0

⇒ E(u′u) = E(u′M ′Mu) = E(u′Mu), por las características de la matriz M.Como u′Mu es un escalar ⇒ E(u′Mu) = E[Tr(u′Mu)]

Recordemos que la traza es un operador lineal y antes de introducir la esperanza podemos,por propiedades de la traza, cambiar el orden de las matrices.

E(u′Mu) = E[Tr(u′Mu) = E[tr(Muu′)] = Tr[E(Muu′)] = Tr[ME(uu′)] = Tr[Mσ2uIn] =

σ2uTr(M) = σ2

u[Tr(In)− Tr[X(X ′X)−1X ′])] = σ2u(n− k)

Por lo tanto como E(u′u) = σ2u(n − k) para que la suma de los errores al cuadrado sea un

estimador insesgado de σ2u debemos dividir por (n− k).

σ2u = u′u

n−k ⇒ E(σ2u) = E(u′u)

n−k = (n−k)σ2u

n−k = σ2u

1

Page 34: Magno Econometría

Econometría I

Profesores: Emerson MeloRodrigo MonteroJaviera Vásquez

Primavera 2005

Pauta Control 2

Pregunta 1: (30 puntos) Si un estimador es insesgado, significa que no existe error de estima-ción. Comente.

Falso, al tratar de aproximar un parámetro poblacional a partir de una muestra siempreexiste un error de estimación, es inevitable debido a las fluctuaciones muestrales (Ver Figura).Lo que sucede si es el estimador es insesgado es que este error de estimación en promedio esigual a cero y por lo tanto, en valor esperado el estimador es igual a su valor poblacional.

Figura 5: Rectas de Regresión muestral y poblacional

Pregunta 2: (70 puntos) Sea el siguiente modelo de regresión lineal múltiple:

Yi = β1 + β2X2i + β3X3i + ui

Ud. dispone de la siguiente información sobre este modelo:

X ′X =

10 10 −510 56 63−5 63 115

X ′Y =

307756

a) (30 puntos) Encuentre la matriz (X’X) y (X’Y) del modelo en desvíos con respecto a la media.

Las matrices (X’X) y (X’Y) del modelo original tienen la siguiente forma generalizada:

X ′X =

n∑

X2i

∑X3i∑

X2i

∑X2

2i

∑X2iX3i∑

X3i

∑X2iX3i

∑X2

3i

X ′Y =

∑Yi∑

YiX2i∑YiX3i

1

Page 35: Magno Econometría

y las matrices (X’X) y (X’Y) del modelo en desvíos con respecto a la media tiene lasiguiente forma generalizada:

X ′X =[ ∑

(X2i −X2)2∑

(X2i −X2)(X3i −X3)∑(X2i −X2)(X3i −X3)

∑(X3i −X3)2

]X ′Y =

[ ∑(X2i −X2)(Yi − Y )∑(X3i −X3)(Yi − Y )

]

Debemos determinar los valores al interior de estas últimas matrices a partir de la infor-mación entregada:

Y =∑

Yi

n=

3010

= 3

X2 =∑

X2i

n=

1010

= 1

X3 =∑

X3i

n=−510

= −0,5∑

(X2i −X2)2 =∑

X22i − n ·X2

2= 56− 10 · 1 = 46

∑(X3i −X3)2 =

∑X2

3i − n ·X32

= 115− 10 · (−0,5)2 = 112,5∑

(X2i −X2)(X3i −X3) =∑

X2iX3i − nX2 ·X3 = 63− 10 · 1 · (−0,5) = 68∑

(X3i −X3)(X2i −X2) = 68∑

(X2i −X2)(Yi − Y ) =∑

X2iYi − nX2 · Y = 77− 10 · 1 · 3 = 47∑

(X3i −X3)(Yi − Y ) =∑

X3iYi − nX3 · Y = 56− 10 · (−0,5) · 3 = 71

Con estos valores podemos computar ambas matrices:

X ′X =[

46 6868 112,5

]X ′Y =

[4771

]

b) (30 puntos) Encuentre los estimadores MCO de β2 y β3

β =[

β2

β3

]=

[46 6868 112,5

]−1 [4771

]

=1

5175− 4624

[112,5 −68−68 46

] [4771

]

=1

551

[459,570

]

[β2

β3

]=

[0,8340,127

]

c) (10 puntos) Recupere el estimador MCO de β1

β1 = Y − β2X2 − β3X3

β1 = 3− 0,834 · 1− 0,127 · (−0,5) = 2,23

2

Page 36: Magno Econometría

Econometría I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.Ayudante : Roberto Jaramillo M.

Control 2 - Pauta de Corrección

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a losayudantes, no puedo tener nada más que lápiz en su escritorio. Si contesta con lápizmina no tiene derecho a reclamo. Debe contestar sólo en el espacio disponible.

Pregunta 1 (30 puntos)

(a) Explique verbalmente en qué consiste el método de Mínimos Cuadrados Ordinar-ios.

El método MCO busca escoger los coecientes de regresión de tal manera quela función de regresión muestral sea lo más cercana a la función de regresiónpoblacional, lo que esquivale a decir que trata de que los errores sean lo menorposible. Sin embargo, si tomamos sólo la minimización de la suma de los errores,puede darse que estos se compensen entre ellos, dando que este valor sea muybajo, pero que el modelo estimado no sea bueno. Para solucionar este problema,se minimiza la suma de los errores al cuadrado, lo que entrega una mayor pon-deración a los errores más grandes.

(b) Enumere y explique 4 de los 9 supuestos detrás del método de Mínimos Cuadra-dos Ordinarios.

(4 puntos cada uno, la explicación está en los apuntes).

1. El modelo de regresión es lineal

2. Los valores de X son jos

3. El valor medio del error ui es igual a cero

4. Homocedasticidad de ui

5. No existe autocorrelación entre los errores

6. La convarianza entre ui y Xi es cero

1

Page 37: Magno Econometría

7. El número de observaciones n debe ser mayor que el número de parámetrospor estimar

8. Variabilidad en los valores de X

9. El modelo de regresión está correctamente especicado

Pregunta 2 (30 puntos)

(a) Explique en qué consiste el sesgo en la estimación de un parámetro.

El sesgo en un parámetro corresponde a la diferencia entre el valor esperado delestimador del parámetro y el valor verdadero del parámetro. Por lo tanto, estamedida se conoce como E[β]− β. Si este es insesgado, entonces E[β] = β.

(b) Considere un modelo de 2 variables explicativas como

Yi = β0 + β1Xi + ui. (1)

Muestre detalladamente que el estimador de Mínimos Cuadrados Ordinarios (MCO)

de β1 =P

yixiPx2

ies insesgado. (Recuerde que xi = Xi − X, donde X es la media

aritmética de Xi).

Primero hay que obtener la especicación de este modelo cuando se dene endesvíos con respecto a la media. Para esto, podemos obtener la media de (1)

Yi = β0 + β1Xi + ui∑Yi =

∑β0 +

∑β1Xi +

∑ui∑

Yi

n=

∑β0

n+

∑β1Xi

n+

∑ui

n︸ ︷︷ ︸=0

Y = β0 + β1X (2)

Ahora restándole a (1) lo obtenido en (2)

Yi − Y = β1(Xi − X) + ui

yi = β1xi + ui (3)

de donde se obtiene el estimador de MCO para β1. Remplazamos en la fórmulael valor obtenido en (3):

2

Page 38: Magno Econometría

β1 =

∑yixi∑x2

i

=

∑xi(β1xi + ui)∑

x2i

= β1

∑x2

i∑x2

i

+

∑xiui∑x2

i

= β1 +

∑xiui∑x2

i

(4)

Ahora aplicando valor esperado a (4):

E[β1] = E

[β1 +

∑xiui∑x2

i

]= E[β1] + E

[∑xiui∑x2

i

]

= β1 +

∑ =0︷ ︸︸ ︷E(xiui)∑

x2i

E[β1] = β1 (5)

Lo que signica que β1 es insesgado.

3

Page 39: Magno Econometría

Universidad de ChileFacultad de Economia y Negocios

Econometría IOtoño 2006

Pauta Control 2

Profesoras: Claudia Sanhueza y Javiera Vásquez.

Pregunta 1: (70 puntos) Un modelo de regresion multiple incluye dos re-gresores: yi = β0 + β1x1i + β2x2i + εi.

En este modelo se cumplen todos los supuestos clasicos vistos en clases yademas se cumple que la E(x1ix2i) = σ12 .

Suponga que un investigador estima el modelo sin considerar u omitiendola variable x2i. Es bβ1, el estimador MCO de β1, un estimador insesgado?.Demuestre su respuesta. Ayuda: El modelo que estima este investigador tieneun error estocastico ui = β2x2i + εi.

(10 puntos) Usando la ayuda. El modelo que estima el investigador es en-tonces:

yi = β0 + β1x1i + ui, donde ui = β2x2i + εi

(10 puntos) Por lo tanto bβ1 expresado en desvios c/r a la media es:

bβ1 =

Xn

i=1(x1i − x1) (yi − y)Xn

i=1(x1i − x1)2

(10 puntos) Para ver si este estimador insesgado tomemos esperanza:

E³bβ1

´= E

Xn

i=1(x1i − x1) (yi − y)Xn

i=1(x1i − x1)2

= E

Xn

i=1(x1i − x1) [β1 (x1i − x1) + (ui − u)]Xn

i=1(x1i − x1)

2

= E

β1

Xn

i=1(x1i − x1)

2+Xn

i=1(x1i − x1) (ui − u)Xn

i=1(x1i − x1)2

= E

β1 +

Xn

i=1(x1i − x1) (ui − u)Xn

i=1(x1i − x1)

2

1

Page 40: Magno Econometría

(20 puntos) Pero ui = β2x2i + εi, en desvios c/r a la media es ui − u =β2 (x2i − x2) + εi, ya que ε = 0, entonces:

E³bβ1

´= E

β1 +

Xn

i=1(x1i − x1) (ui − u)Xn

i=1(x1i − x1)

2

= E

β1 +

Xn

i=1(x1i − x1) [β2 (x2i − x2) + εi]Xn

i=1(x1i − x1)2

= E

β1 + β2

Xn

i=1(x1i − x1) (x2i − x2)Xn

i=1(x1i − x1)2

+

Xn

i=1(x1i − x1) εiXn

i=1(x1i − x1)2

(10 puntos) Asumiendo los supestos clasicos del modelo original se cumpleny tenemos una muestra suficientemente grande:

E³bβ1

´→aβ1 + β2

σ12

V ar (x1)+ 0

= β1 + β2

σ12

V ar (x1)

(10 puntos) Por lo tanto bβ1 el estimador del modelo que omite la variablex2 cuando esta esta correlacionada con x1, es sesgado. (Esto no tienen puntos:Notar que si σ12 = 0 entonces bβ1 es insesgado).

Pregunta 2: (30 puntos) Un R2 y R2

alto no significa que no existe sesgode variables omitida. Comente.

(10 puntos) El R2 y R2

nos dice si las variables explicativas includias enel modelo "explican" la variable dependiente, las variables explicativas, son en-tonces buenos predictores de la variable dependiente.

(20 puntos) Sin embargo, puedo estar incluyendo variables no relevantesdesde el punto de vista teorico, o estar no observando variables que esten cor-relacionadas con algunas de las variables explicativas, e igual tener un alto R2

y R2. O sea, puedo estar estimando parametros sesgados y tener un alto R2 y

R2. Un sesgo de variable omitida puede darse con cualquier nivel de R2 y R

2.

2

Page 41: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Control 2

Semestre: Primavera 2006Profesores: José Miguel Benavente, Rodrigo MonteroTiempo de duración: 20 minutosNo hay preguntas de ningún tipo para los ayudantes

Comente (6 puntos)

Mientras más variables independientes se incluyan en el modelo, más precisas

serán las estimaciones, pues se utilizará una mayor cantidad de información.

Respuesta. Falso. A medida que se incorporan más regresores en la estimación

se va perdiendo precisión en las estimación. Esta situación se aprecia claramente

en el diagrama de Ballentine Venn, que muestrá cómo al incorporar regresores

adicionales acarrea una pérdida de información para hacer la estimación (área

roja). Teóricamente sería posible que no se produjera esta pérdida si es que el

regresor adicional es completamente ortogonal a los ya incorporados. A modo de

ejemplo, considere el siguiente modelo:

Yi = β1 + β2X2i + β3X3i + µi

La varianza para β2 viene dada por:

V ar(β2) =σ2∑

x22(1− r2

23)

donde r23 corresponde al coeficiente de correlación entre X2 y X3 (la variable en

minúsculas indica que se encuentra en desviación respecto a su media). Por lo

tanto, al aumentar la correlación entre ambas variables, la varianza del estimador

crece.

1

Page 42: Magno Econometría

Ejercicio (14 puntos)

Considere el siguiente modelo expresado en desvíos respecto a la media:

yi = β2x2i + β3x3i + µi

Se tiene además, la siguiente información:∑y2 =

493

3

∑x2

2 = 30∑

x23 = 3∑

x2y = 30∑

x3y = 20∑

x2x3 = 0

1. Calcule los estimadores para β2 y β3 (8 puntos)

Respuesta. Como las variables X2 y X3 son ortogonales (∑

x2x3 = 0),

entonces, cada estimador se obtiene igual que en el caso del modelo de

regresión lineal de dos variables:

β2 =

∑x2y∑x2

2

=30

30= 1

β3 =

∑x3y∑x2

3

=20

3

2. Calcule el R2 del modelo estimado (6 puntos)

Respuesta. Se sabe que:

yi = β2x2i + β3x3i + µi

Elevando al cuadrado y aplicando sumatoria:∑y2

i =∑

(β2x2i + β3x3i + µi)2

Dado que las variables independientes son ortogonales a los errores estima-

dos, y además, para este caso son ortogonales entre sí, entonces:

1 =β2

2

∑x2

2i + β23

∑x2

3i∑y2

i

+

∑µ2

i∑y2

i

Es decir:

R2 = 1−∑

µ2i∑

y2i

=β2

2

∑x2

2i + β23

∑x2

3i∑y2

i

=490

493

2

Page 43: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IControl 2

5 de septiembre, Primavera 2007Profesores: Jose Miguel Benavente y Rodrigo Montero

Ayudantes: Rodrigo Bravo,Felipe Rıos, Loreto Silva

1. Respecto al coeficiente de determinacion R2(33 puntos):

a. Defınalo (9 puntos).Medida de bondad de ajuste que indica que parte de la variabilidad de las y (variable depen-diente) es explicada por la variabilidad de las x (variables independientes)

R2 =ESS

TSS(1)

b. ¿Que se necesita para que este se pueda interpretar? (8 puntos) Se necesita que el modelo aestimar posea una constante, ası, el coeficiente de determinacion se encontrara entre 0 y 1.Si no incluye constante, se sale de aquel rango y pierde sentido la interpretacion

c. Explique las desventajas que presenta (8 puntos) La principal desventaja es que R2 siempreaumentara o al menos se mantendra igual al aumentar el numero de regresores. Se puedellegar, entonces, a altos R2 con regresores que practicamente no explican el modelo

d. ¿Que otro indicador alternativo pudiera utilizarse, y por que serıa mas conveniente? (8 puntos)Un indicador alternativo, dado lo anterior, es el R2 ajustado, el cual castiga la inclusion deuna variable poco relevante para el modelo, considerando los grados de liberdad restantes porsumar variables explicativas. Con esto, la medida de bondad del ajuste incluso puede disminuir

2. Comente en no mas de 10 lıneas la siguiente aseveracion: Para que el estimador β de mıni-mos cuadrados ordinarios sea MELI, se necesita que los errores tengan una distribucion N ∼(0, σ2)(33puntos)

Falso. Basandonos en la Clase 6, para que un estimador de minimos cuadrados ordinarios seaMELI, este debe ser Insesgado, un modelo lineal, y el mejor en el sentido de que cualquier otroestimador con estas caracterısticas tendra una varianza mayor. Si bien es cierto que es importanteque la esperanza de los errores sea cero tanto para estimar MCO como para el insesgamiento, estano es una propiedad exclusiva de la distribucion normal. Lo mismo ocurre para la homocedasticidad.Ambas cosas pueden ocurrir sin distribuirse normalmente. Incluso, estas dos caracteristicas sonsupuestos del metodo MCO, donde, en ningun supuesto se indica normalidad en los errores.

3. Suponga el siguiente modelo (34 puntos):

yi = β0 + β1xi + εi ε ∼ N(0, σ2)

σ2 = 1

x′x =(

1 22 6

)β =

(0,51

)Testee que cada parametro individualmente es cero. ¿En que caso se aceptarıa o rechazarıa lahipotesis nula?

1

Page 44: Magno Econometría

Departamento de Economıa Universidad de Chile

Plantear hipotesis:

H0 : β0 = 0 β0 6= 0

H0 : β1 = 0 β1 6= 0

Para encontrar la V ar(β), debemos invertir la matriz X’X y luego, multiplicarla por σ2

V ar(β) = σ2(X ′X)−1

σ2(X ′X)−1 = 1 ∗ (1

6− 4) ∗

(6 −2−2 1

)V ar(β) = 1 ∗

(3 −1−1 1

2

)

Por lo tanto, tenemos:

V ar(β0) = 3 V ar(β1) = 12

con lo cual podemos hacer los test t:

tβ0 = 0,5√3∼ tn−k tβ1 = 1√

12

∼ tn−k

La hipotesis nula se rechazara cuando ttabla < tcalculado

2

Page 45: Magno Econometría

Pauta Control #2

Econometrıa I

Profesores: Tomas Rau y Javiera Vasquez

Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda

9 de abril, 2008

Tiempo Total: 30 Minutos.

1. Comentes (10 puntos, 5 c/u)

1) En el modelo de k variables, el estimador MCO existe si, y solo si, la matriz X tiene inversa. (5 puntos)

R. Falso. En el caso general n > k solo se requiere que (X ′X)−1 exista y no que X tenga inversa(recuerde que solo las matrices cuadradas pueden tener inversa y Xn×k), luego en general el comentees falso. Ahora, si k = n la matriz X es cuadrada y se requiere que (X ′X)−1 = X−1(X ′)−1 y por lotanto necesitamos que X tenga inversa. Solo en este caso particular el comente serıa verdadero.

2) El modelo de regresion en desviaciones con respecto a la media no es muy util puesto que no podemosestimar el intercepto. (5 puntos)

R. Falso, siempre se puede recuperar el intercepto. Por ejemplo, si la RRP es Yi = β1 + β2Xi + ui, laRRP en desviacion con respecto a la media es yi = β2xi + u y podemos estimar β2. Pero el interceptosiempre se puede recuerar de la siguiente manera: β1 = Y − β2X.

2. Problema (20 puntos)

Sea el modelo de regresion de dos variables: yi = β1 + β2xi + ui, donde yi es la variable dependiente, xi esla variable independiente, β1, β2 son los parametros a estimar y ui es el error poblacional con media ceroy varianza desconocida σ2 (suponga que se cumplen todos los supuestos vistos en clases). Suponga que Ud.tiene una muestra aleatoria simple de yi, xi de tamano n.

i) Usando calculo, obtenga el estimador MCO de β2. (10 puntos)

R. Como vimos en la clase 5, si escribimos el modelo en desviacion con respecto a la media el problemaes mas sencillo:

mınβ2

SE(β2) =∑

(yi − β2xi)2

y las condiciones de primer orden estan dadas por

∂SE(β2)

∂β2

= −

2(yi − β2xi)xi = 0

1

Page 46: Magno Econometría

luego

β2 =

yixi∑

x2

i

ii) Obtenga la varianza de β2 y, sin necesidad de demostrar matematicamente, explique que ocurre sin = 2. (10 puntos)

R. La varianza se puede obtener facilmente de la expresion que encontramos en (i) (ver clase 5)

E(β2 − β2)2 = E

(∑

xiui∑

x2

i

)2

luego

var(β2) =σ2

x2

i

Si n = 2 tenemos que no se puede hacer inferencia en este caso puesto que no existe estimador de σ2

(recuerde que σ2 =∑

u2/(n − 2)).

2

Page 47: Magno Econometría

CCOONNTTRROOLLEESS 33

Page 48: Magno Econometría
Page 49: Magno Econometría
Page 50: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Control 3

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada más que lápizen su escritorio, si contesta con lápiz mina no tiene derecho a reclamo. Contestar sólo en elespacio disponible

Pregunta 1: (30 puntos) Es mejor predecir un valor puntual de y0 que el valor esperadoE(y0/x0), ya que uno hace lo primero con mayor precisión. Comente.

Falso, al tratar de predecir un valor puntal de y (y0), el error de predicción esta compuestode dos términos, uno asociado a las diferencias entre el estimador de los parámetros y el valorpoblacional de ellos y otro correspondiente al error intrínseco de y, es decir: e = x0(β − β) + u.Sin embargo, cuando se predice simplemente el valor promedio condicional de y, se elimina delerror de predicción, el error asociado a la desviación de una observación particular de y de suvalor promedio condicional, es decir, el error de predicción en este caso es: e = x0(β − β). Lavarianza del error de predicción en el primer caso es: σ2[1 + x0(X‘X)−1x0′ ], y en el segundocaso es simplemente: σ2x0(X‘X)−1x0′ . Por lo tanto, la predicción en el primer caso es menosprecisa que en el segundo.

Pregunta 2: (70 puntos) Con la información disponible sobre producto bruto real(Y), diaslaborales (L) y capital (K) para el sector agricola de Taiwan (1958-1972), se estima un modelode regresión lineal con las variables en logaritmos, de la siguiente forma:

ln(y) = β0 + β1ln(L) + β2ln(k) + u

A continuación se presenta la estimación realizada en Eviews:

Dependent Variable: LY Method: Least Squares Date: 12/31/04 Time: 13:57 Sample: 1958 1972 Included observations: 15 LY=C(1)+C(2)*LL+C(3)*LK

Coefficient Std. Error t-Statistic Prob. C(1) -3.338455 2.449508 -1.362908 0.1979

C(2) 1.498767 0.539803 2.776509 0.0168 C(3) 0.489858 0.102043 4.800487 0.0004

R-squared Mean dependent var 10.09653

Adjusted R-squared S.D. dependent var 0.207914 S.E. of regression 0.074810 Akaike info criterion -2.170875 Sum squared resid 0.067158 Schwarz criterion -2.029265 Log likelihood 19.28156 Durbin-Watson stat 0.891083

1

Page 51: Magno Econometría

donde:

- S.D dependent var (sy) es la desviación estándar de la variable dependiente, la que se construyede la siguiente forma:

sy =

√∑Ni=1(yi − y)2

N − 1

- S.E. of regression es el error estándar de la regresión (σ =√∑

u2i

N−k ).

- Sum squared resid corresponde a la suma de los errores al cuadrado.

Además se estima el siguiente modelo restringido:

ln(y) = β0 + ln(L) + ln(k) + u

Dependent Variable: LY Method: Least Squares Date: 12/31/04 Time: 13:58 Sample: 1958 1972 Included observations: 15 LY=C(1)+LL+LK

Coefficient Std. Error t-Statistic Prob. C(1) -5.673589 0.036429 -155.7450 0.0000 R-squared 0.539520 Mean dependent var 10.09653

Adjusted R-squared 0.539520 S.D. dependent var 0.207914 S.E. of regression 0.141088 Akaike info criterion -1.014528 Sum squared resid 0.278681 Schwarz criterion -0.967325 Log likelihood 8.608959 Durbin-Watson stat 0.250752

a) Testee la hipótesis de que todas las pendientes son igual a cero.

Recordemos que el Test-F de significancia global del modelo o que todas las pendien-tes son igual a cero, se puede escribir en función del R2 de la siguiente forma:

F =R2/(k − 1)

(1−R2)/(n− k)∼ Fk−1,n−k

En el tabla de regresión no se presenta la información del R2, por lo tanto se debe construir.Como el modelo incluye constante:

R2 = 1− RSS

TSS

La suma de los errores al cuadrado (RSS) se puede obtener directamente de la tabla (Sumsquared resid), el valor es de 0.067158.

2

Page 52: Magno Econometría

La suma total de cuadrados se puede obtener de la desviación estándar de la variabledependiente (S.D dependent var) reportada en la tabla:

sy =

√∑Ni=1(yi − y)2

N − 1= 0,207914

√∑Ni=1(yi − y)2

15− 1= 0,207914

N∑

i=1

(yi − y)2 = (0,207914)2 · 14

N∑

i=1

(yi − y)2 = 0,60519524

De esta forma, el R2 es:

R2 = 1− 0,0671580,60519524

= 0,889030

El estadístico F calculado para la hipótesis nula de que todas las pendientes son igual acero es:

F =0,889030/2

(1− 0,889030)/12= 48,06885

Si lo comparamos con el valor F de tabla a un 95% de confianza con 2 grados de libertad enel numerador y 12 grados de libertad en el denominador, que es igual a 3.89, la conclusiónes que se rechaza la hipótesis nula de que las pendientes del modelo son iguales a cero.

b) Testee la Hipótesis de que las pendientes suman uno.

Se puede construir un test-t con la información de las desviación estándar de los pa-rámetros y la información de covarianza entre los parámetros:

tc =β2 + β3 − 1√

V ar(β2) + V ar(β3) + 2Cov(β2, β3)∼ t12

tc =1,498767 + 0,489858− 1√

(0,539803)2 + (0,102043)2 + 2 · (−0,038427)

=0,988625

0,47428478= 2,08445441

Si lo comparamos con el valor de tabla de la distribución t a un 95% de confianza y con 12grados de libertad, que es igual a 2.179, se concluye que no se puede rechazar la hipótesisnula de que las pendientes sumen uno.

También se puede calcular el cuadrado del estadístico t, el que corresponde al estadís-tico F , y se debe comparar con un valor de tabla a un 95% de confianza con un grado delibertad en el numerador y 12 grados de libertad en el denominador, el que es igual a 4.75.Como el cuadrado del estadístico t calculado es 4.34495017, se concluye exactamente omismo, no se puede rechazar la nula de que las pendientes sumen uno.

3

Page 53: Magno Econometría

c) Construya un intervalo de confianza para β1 y β2.

La forma general del intervalo de confianza es:

P

[βi − t1−α/2,n−k

√V ar(βi) ≤ βi ≤ βi + t1−α/2,n−k

√V ar(βi)

]= 1− α

a un 95% de confianza, t0,975,12 = 2,179.

De esta forma, el intervalo de confianza de β1 es:

P [1,498767− 2,179 · 0,539803 ≤ β1 ≤ 1,498767 + 2,179 · 0,539803] = 0,95P [0,32253626 ≤ β1 ≤ 2,67499774] = 0,95

Por otra parte, el intervalo de confianza de β2 es:

P [0,489858− 2,179 · 0,102043 ≤ β2 ≤ 0,489858 + 2,179 · 0,102043] = 0,95P [0,2675063 ≤ β2 ≤ 0,7122097] = 0,95

4

Page 54: Magno Econometría

Econometría IProfesores: A. Otero y J. Vásquez.

Otoño 2005

Pauta Control 3

Pregunta 1: (30 puntos) En una prueba de hipótesis cualquiera, la zona de rechazo nuncacambia al cambiar la hipótesis nula. Comente.

Falso, cuando hacemos un test de hipótesis de la forma H0: Rβ = r para ver si rechazamos ono la hipótesis nula debemos comparar el valor calculado del estadístico con el valor de tablade una distribución F con q grados de libertad en el numerador y n − k grados de libertad enel denominador. Si bien el valor de tabla de la distribución F no cambia con r (los valores quetesteamos bajo la hipótesis nula) si cambia con el número de hipótesis que estemos testeando (q).

Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresión Lineal Simple:

Yi = β1 + β2Xi + ui para i = 1, ..., N

Además posee la siguiente información muestral de X e Y:

Y 4 10 12 14X 0 20 36 40

a. Obtenga el estimador Mínimos Cuadrados Ordinarios de β1 y β2.

β =[

β1

β2

]=

[4 9696 3296

]−1 [40

1192

]=

[4,3871

0,233870968

]

b. Testee la hipótesis nula conjunta de que β1 = 4,5 y β2 = 0,5.

Para testear H0: β1 = 4,5, β1 = 0,5, utilizamos el siguiente estadístico F:

[(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)]/q

u′u/(n− k)∼ F(q,n−k)

lo que se puede reescibir de la siguiente forma:

[(Rβ − r)′[RV ar(β)R′]−1(Rβ − r)]/q ∼ F(q,n−k)

donde:

Rβ − r =[

4,3871− 4,50,233870968− 0,5

]=

[ −0,1129−0,2661

]y

V ar(β) = σ2(X ′X)−1 =1,742

[0,83 −0,024−0,024 0,001

]=

[0,724 −0,021−0,021 0,0009

]

De esta forma, el valor calculado del estadístico F es:

F c =[ −0,1129 −0,2661

] [0,724 −0,021−0,021 0,0009

]−1 [ −0,1129−0,2661

]/2

=[ −0,1129 −0,2661

] [4,59 110,22

110,22 3784,29

] [ −0,1129−0,2661

]/2 = 137,32

1

Page 55: Magno Econometría

El valor de tabla de una distribución F con dos grados de libertad en el numerador y dosgrados de libertad en el denominador es 19, con lo cual se rechaza la hipótesis nula.

c. Determine β2, pero en un modelo sin constante. ¿Cómo cambia con respecto al obtenido ena.? El estimador MCO de β2 es un modelo sin constante (Y = β2X + u) es1:

β2 =∑4

i=1 Xi · Yi∑4i=1 X2

i

Como el modelo no incluye constante, este estimador NO queda expresado en desvíos conrespecto a la media. Utilizando la información disponible:

Y X Y ·X X2

4 0 0 010 20 200 40012 36 432 129614 40 560 1600

Promedio 12Suma 1192 3296

Por lo tanto,

β∗2 = 0,36165049

Como podemos apreciar el valor estimado para β2, es mayor que el en caso donde se incluyela constante, esto porque al ser positiva la constante y omitirla se genera un sesgo haciaarriba del parámetro de pendiente. Esto se puede apreciar gráficamente en la siguientefigura, que dibuja las recta de regresión estimadas de un modelo con y sin constante:

1Este se obtiene de minimizar la suma de los errores al cuadrado con respecto a β2:

mınβ2

4∑

i=1

(Yi − β2Xi)2

CPO :∂SE(β2)

∂β2

=4∑

i=1

2 · (Yi − β2Xi)(−Xi) = 0

⇒4∑

i=1

(−XiYi + β2X2i ) = 0

⇒ β2 =

∑4i=1 Xi · Yi∑4

i=1 X2i

2

Page 56: Magno Econometría

Modelo conconstante

Modelo sinconstante

Al ser la constante positiva (cuando la estimamos), si la obligamos a ser cero (estimaciónsi constante), la pendiente de la recta de regresión aumenta para lograr minimizar la sumade los errores al cuadrado.

3

Page 57: Magno Econometría

Econometría I

Profesores: Emerson MeloRodrigo MonteroJaviera Vásquez

Primavera 2005

Control 3

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes,no puedo tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tiene derechoa reclamo. Contestar sólo en el espacio disponible

Pregunta 1:(30 puntos) El método de mínimos cuadrados descansa fuertemente en el supuestode Normalidad del término de error. Luego el estimador M.C.O, β = (X ′X)−1X ′Y se obtienesolo bajo errores normales.Falso. El supuesto de Normalidad lo necesitamos para conocer la distribución de los estimadoresy de esta forma poder derivar los test t y F. Por otra parte la formula β = (X ′X)−1X ′Y resultasimplemente de plantear el problema de optimización de mínimos cuadrados, el cual no dependedel supuesto de Normalidad de los errores.

Pregunta 2: (70 puntos) Sea el siguiente modelo de regresión lineal múltiple:

Yi = β0 + β1X1i + β2X2i + β3X3i + ui

Los errores tienen el siguiente comportamiento u ∼ N(0, σ2I). Usted dispone de la siguienteinformación sobre los parámetros estimados de este modelo.

V(β) =

0,020,45 0,350,5 0,21 0,010,2 0,25 0,09 0,5

β =

2,51,20,850,02

Donde el tamaño muestral es de N=150

a) (30 puntos)Plantee matricialmente el estadístico asociado a la hipotesís1:

H0 : β0 = 1β1 + β2 = 2β3 = 1,5

Sabemos que dado que tenemos más de una restricción lineal, el estadístico que correspondees una F con la forma:

(Rβ − r)′[RV ar(β)R′]−1(Rβ − r) ∼ F(q,n−k)

1Sólo deje el estadistico expresado, no es necesario realizar el calculo.

1

Page 58: Magno Econometría

Luego las matrices involucradas son:

R =

1 0 0 00 1 1 00 0 0 1

y r =

12

1, 5

Luego a partir de los datos del enunciado se puede construir el test F, ya que planteamoslas matrices que están involucradas en el conjunto de restricciones lineales.

b) (30 puntos) Ahora testee la siguiente hipótesis.(Ind: Asuma un valor de tabla de 1.96 quecorresponde a un 95% de confianza. )

H0 : β1 + β2 = 0,5

¿ Con los datos del problema puede rechazar la hipótesis nula?

Como aquí solo tenemos una restricción lineal, es posible usar un test t.2 A partir de loanterior tenemos:

tc =β1 + β2 − 0, 5√

V (β1 + β2)=

β1 + β2 − 0, 5√V (β1) + V (β2) + 2Cov(β1, β2)

Reemplazando los datos del enunciado, se obtiene:

tc =1, 2 + 0, 85− 0, 5√

0, 35+, 01 + 2× 0, 21= 1, 76

Usando la indicación del enunciado, no es posible rechazar la hipotesis nula.

c) (10 puntos) Señale las diferencias que existen en los procedimientos de las partes a) y b). Ladiferencia es que con el test F podemos plantear mas de una hipótesis lineal ( en la partea) planteamos 3 restricciones), mientras que con el test t podemos trabajar solamentecon una restricción lineal. Ademas en ambos casos tenemos distribuciones estadísticasdistintas.

2Recordar que en ese caso el test F corresponde a un test al cuadrado.

2

Page 59: Magno Econometría

Econometría I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.Ayudante : Roberto Jaramillo M.

Control 3 - Pauta de Corrección

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a losayudantes, no puede tener nada más que lápiz en su escritorio. Si contesta con lápizmina no tiene derecho a reclamo.

Pregunta 1 (30 puntos)

(a) En un modelo de regresión con k variables, el estimador de Mínimos CuadradosOrdinarios (MCO) es β = (X ′X)−1X ′y. Muestre que la varianza de β es:

β = σ2u(X

′X)−1.

La varianza de β está dada por:

V ar(β) = E[(β − E[β]) · (β − E[β])′]

= E[(β − β) · (β − β)′].

Dado que

β = (X ′X)−1X ′y

= (X ′X)−1X ′(Xβ + u)

= β + (X ′X)−1X ′u,

se obtiene

V ar(β) = E[((X ′X)−1X ′u) · ((X ′X)−1X ′u)′]

= E[(X ′X)−1X ′uu′X(X ′X)−1]

= (X ′X)−1X ′E[uu′]X(X ′X)−1

= (X ′X)−1X ′σ2InX(X ′X)−1

= σ2(X ′X)−1.

1

Page 60: Magno Econometría

Notar que esto se cumple porque X no está correlacionado con los errores y porquelos errores no presentan autocorrelación y son homcedásticos.

(b) Explique por qué el estimador insesgado de la varianza de los errores es σ2u = u′u

n−k.

El estimador natural de las varianza de los errores es

σ2u =

u′u

n=

∑ni=1(ui − u)2

n=

∑ni=1 u2

i

n.

Sin embargo, para obtener los valores de u es necesario estimar k parámetros(β1, . . . , βk), de modo que la precisión de la estimación es menor al ser los gradosde libertad menores (n − k) en vez de n. De este modo, al corregir por lo gradosde libertad, se obtiene el estimador insesgado de la varianza.

Pregunta 2 (30 puntos)

(a) Explique qué signica que un estimador sea MELI.

Un estimador es MELI si es que es el Mejor Estimador Lineal Insesgado.

(b) Explique por qué el estimador de MCO es MELI.

El estimador de MCO es MELI porque es un estimador Lineal (el modelo esy = Xβ + u), es insesgado porque E[β] = β (dado el supuesto de independenciade las variables explicativas y de que el error se asume con media cero), y tienevarianza mínima (es eciente porque no hay otro estimador lineal insesgado conmenor varianza).

(c) Explique el Teorema de Gauss-Markov.

El Teorema de Gauss-Markov postula que el estimador de MCO es MELI.

2

Page 61: Magno Econometría

Econometría IProfesoras: Claudia Sanhueza

Javiera Vásquez.Otoño 2006

Control 3

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayu-dantes, no puedo tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tienederecho a reclamo. Contestar sólo en el espacio disponible

Pregunta 1: (30 puntos) Es imposible que en el siguiente modelo Y = β0 + β1X1 + β2X2 + u,los parámetros β1 y β2 sean individualmente no significativos, pero que el test F de significanciaglobal del modelo nos diga que este es significativo. Comente.

Falso. Hay dos posible argumentos.

Respuesta 1:

Es posible que los test de significancia individual de β1 y β2 nos digan que estos no son significa-tivos individualmente. Sin embargo, esto no quiere decir que en conjunto sean es-tadísticamenteno significativos. Lo anterior podría darse por la covarianza existente entre los coeficientes es-timados. En efecto, es posible que el área roja sea significativa, y la covarianza existente entreambos coeficientes sea tal que en conjunto logren explicar la variabilidad de la variable depen-diente. (Ver gráfico)

amarillo

azul

rojo

verde

café naranjo

Y

X Z

amarillo

azul

rojo

verde

café naranjo

Y

X Z

Respuesta 2:

El test t asociado a la significancia de un parametro está en función de la varianze de cadaparámetro.:

1

Page 62: Magno Econometría

tcalculado =βi√

V ar(βi

)

En general rechazamos la hipotesis nula de no significancia (H0:βi = 0 ), si la V ar(βi

)es

muy alta. Esto hace que el test t calculado sea bajo y por lo tanto caigamos en la zona de norechazo.

En cambio el test F de la significancia conjunta de los parámetros (H0:βi = 0, ∀i ) es unafunción la matriz de varianza y covarianza de todos los parámetros estimados:

F calculado =

[(Rβ − r

)′ [R

V ar(β)R′

]−1 (Rβ − r

)]

En este caso β y V ar(β)

es el vector de parametros y la matriz de var y cov de dichosparametros estimados. Por lo tanto, el test F toma en cuenta las covarianzas entre los paramet-ros.

En particular, en un modelo con dos variables explicativas y constante el test F tendría laforma de:

F calculado =

[0 1 00 0 1

]′

β1

β2

β3

[00

]

[0 1 00 0 1

]

V(β1

)Cov

(β1, β2

)Cov

(β1, β3

)

Cov(β2, β1

)V

(β2

)Cov

(β2, β3

)

Cov(β3, β1

)Cov

(β3, β2

)V

(β3

)

[0 1 00 0 1

]′

−1

[0 1 00 0 1

]′

β1

β2

β3

[00

]

=

(β2

β3

)′ V

(β2

)Cov

(β2, β3

)

Cov(β3, β2

)V

(β3

)−1 (

β2

β3

)

=β2

2V(β2

)− 2β2β3Cov

(β2, β3

)+ β2

3V(β3

)

V(β2

)V

(β3

)− Cov

(β2, β3

)2

Por lo tanto, si la covarianza entre los parametros es tal que contrarresta el efecto de lasvarianzas altas de los parametros podemos tener un test F suficientemente alto para rechazar laH0 de no significancia conjunta (H0:βi = 0,∀i ), y por ende el modelo explica la varianza total

2

Page 63: Magno Econometría

de la variable dependiente. A pesar de que no podamos rechazar las H0 de no significancia decada uno de los parametros del modelo (H0:βi = 0 ).

Pregunta 2: (70 puntos) Una pequeña tienda de comestibles observa que el precio de lasnaranjas varía mucho durante el año. Fuera de temporada el precio llega a los $60 por unidad,y dentro de la temporada los precios varían entre $10, $20 y $30 por unidad. A continuación sepresentan los datos para seis semanas con las cantidades de naranjas vendidas (y) y el precio(x):

Naranjas Vendidas Precio por naranjay (cientos) x (pesos)

6 104 205 304 403 502 60

Suponiendo que la demanda por naranjas viene dada por la siguiente ecuación:

y = α + βx + u

estime los parámetros de esta ecuación. Calcule un intervalo de confianza al 90% para la can-tidad de naranjas que se venden en la semana 7, si el precio es de $25 por unidad en esta semana.

Nota:∑

u2i = 1,77 y (X ′X)−1

[0,87 −0,02

−0,02 0,0006

]

Respuesta: El estimador MCO de β se obtiene de la siguiente forma:

β =∑

(Xi −X)(Yi − Y )∑(Xi −X)2

Y X (Y − Y ) (X −X) (Y − Y )(X −X) (X −X)2

6 10 2 -25 -50 6254 20 0 -15 0 2255 30 1 -5 -5 254 40 0 5 0 253 50 -1 15 -15 2252 60 -2 25 -50 625

Suma 24 210 - - -120 1750Promedio 4 35 - - -20 291.7

β =−1201750

= −0,068571429

α = Y − βX = 6,4

Ahora si se espera que en la semana 7 el precio de las naranjas sea $25 por unidad, la demandaesperada (predicción puntual) es:

y0 = 6,4− 0,068571429 ∗ 25 = 4,685714286

3

Page 64: Magno Econometría

El intervalo de confianza de la predicción es:

Pr[y0 − t0,95,4

√V ar(e0) ≤ y0 ≤ y0 + t0,95,4

√V ar(e0)] = 90%

donde t0,95,4 = 2,132

Ahora debemos calcular la varianza del error de predicción:

V ar(e0) = σ2µ(1 + x0(X ′X)−1x′0)

σ2µ =

∑u2

i

n− k=

1,774

= 0,4425

x0(X ′X)−1x′0 =[

1 25] [

0,87 −0,02−0,02 0,0006

] [1

25

]= 0,245

V ar(e0) = 0,4425(1 + 0,245) = 0,5509125

Entonces el intervalo de confianza de la predicción es:

Pr[4,685714286− 2,132√

0,5509125 ≤ y0 ≤ 4,685714286 + 2,132√

0,5509125] = 90 %Pr[3,10326969 ≤ y0 ≤ 6,268158882] = 90 %

4

Page 65: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Control 3

Semestre: Primavera 2006Profesores: José Miguel Benavente, Rodrigo MonteroTiempo de duración: 20 minutosNo hay preguntas de ningún tipo para los ayudantes

Comente (6 puntos)

La significancia global del modelo depende de la significancia individual de las

variables independientes incluidas.

Respuesta. Falso. Es posible que, aun cuando los coeficientes estimados no sean

individualmente significativos, sí lo sean en conjunto. Lo anterior podría darse en

el caso que la covarianza de los regresores sea capaz de “explicar” la variabilidad

de la variable dependiente. Como existe un alto grado de correlación entre las

variables independientes del modelo (es decir, un alto grado de multicolinealidad),

entonces, al menos una de estas variables tiene una influencia significativa sobre

la variable dependiente, pero no se puede establecer cual. Por otro lado, al existir

un alto grado de multicolinedlidad, es muy probable que los coeficientes, a nivel

individual, no sean estadísticamente significativos. Recuerde que:

var(β) = σ2(X ′X)−1

Si existe un alto grado de colinealidad entre las variables independientes del mod-

elo, el determinante de (X ′X) tiende a cero, por lo que se obtienen varianzas

“gigantes”.

1

Page 66: Magno Econometría

Ejercicio (14 puntos)

Con la información proporcionada por una muestra de 5 datos, se ha estimado el

siguiente modelo (mínimos cuadrados ordinarios):

Yi = 4 + 2, 5X1i − 1, 5X2i

El R2 del modelo es de 0,95 y∑

y2i = 28. Se cuenta además con la siguiente

información:

(X ′X)−1 =

26, 7 4, 5 −8

4, 5 1 −1, 5

−8 −1, 5 2, 5

Construya un intervalo de confianza para β0, β1 y β2 al 95 % (asuma un t∗

crítico igual a 1,96). ¿Son los coeficientes estadísticamente significativos?

Respuesta. Se sabe que:

var(β) = σ2(X ′X)−1

Además (es importante corregir por la pérdida en grados de libertad, ya que

la muestra es pequeña):

σ2 =

∑e2

i

n− k

Por otro lado, se sabe que:

R2 = 1−∑

e2i∑

y2i

= 0, 95

Es decir: ∑e2

i = 1, 4

Por lo tanto:

σ2 =1, 4

2= 0, 7

Finalmente:

var(β) = 0, 7

26, 7 4, 5 −8

4, 5 1 −1, 5

−8 −1, 5 2, 5

=

18, 69 3, 15 −5, 6

3, 15 0, 7 −1, 05

−5, 6 −1, 05 1, 75

2

Page 67: Magno Econometría

Los intervalos de confianza vienen dados por (4 puntos por cada uno):

P (4− 1, 96√

18, 69 < β0 < 4 + 1, 96√

18, 69) = 0, 95

P (−4, 47 < β0 < 12, 47) = 0, 95

P (2, 5− 1, 96√

0, 7 < β1 < 2, 5 + 1, 96√

0, 7) = 0, 95

P (0, 86 < β1 < 4, 13) = 0, 95

P (−1, 5− 1, 96√

1, 75 < β2 < −1, 5 + 1, 96√

1, 75) = 0, 95

P (−4, 09 < β2 < 1, 09) = 0, 95

Es decir, sólo β1 es estadísticamente significativo (2 puntos).

3

Page 68: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de ChilePauta Control 3

Semestre: Primavera 2007Profesores: José Miguel Benavente, Rodrigo MonteroAyudantes: Loreto Silva, Rodrigo Bravo, Felipe RíosTiempo de duración: 40 minutosNo hay preguntas de ningún tipo para los ayudantesEstá permitido utilizar calculadora

Una compañía telefónica está desarrollando un nuevo plan de contrato, paralo cual necesita ver cómo se relaciona la cantidad de minutos hablados duranteun mes con la edad de la persona. En particular, ellos disponen de la siguienteinformación:

i Edad (E) Minutos (M)1 14 652 16 543 18 554 22 705 26 776 27 907 27 1108 29 1209 30 150

Por lo tanto:∑E2

i = 5135∑

Ei = 209∑

Mi = 791∑

EiMi = 19686

Luego, el modelo a estimar es el siguiente:

Mi = α + βEi + ui

Donde u cumple con los supuestos convencionales que se hacen sobre el términode error. (NOTA: en caso de ser necesario trabaje con tres decimales)IMPORTANTE: esta pauta de corrección ha sido confeccionada con-siderando TODOS los decimales en los cálculos respectivos.

1

Page 69: Magno Econometría

1. Obtenga los estimadores MCO de α y β. (10 puntos)Respuesta. Se sabe que:(

α

β

)= (X ′X)−1X ′Y =

(n

∑Ei∑

Ei

∑E2

i

)−1 ( ∑Mi∑

EiMi

)Por lo tanto:(

α

β

)=

(9 209

209 5135

)−1 (791

19686

)=

(−20, 753354, 678374

)

2. Estime la varianza de u (σ2). (10 puntos)Respuesta. Se sabe que:

s2 = σ2 =

∑e2

i

n− k=

2412, 43054

7= 344, 63293

3. ¿Influye la edad de las personas en la cantidad de minutos que hablan porcelular? (Ayuda: Utilice 2,3 para el valor crítico de la distribución t). (10puntos)Respuesta. Se debe analizar la significancia estadística del coeficiente es-timado (β). Para ello se necesita estimar, en primer lugar, la varianza delestimador MCO:

V ar(β) = s2(X ′X)−1 = 344, 63293

(9 209

209 5135

)−1

En este caso, solo interesa el elemento 2x2 de la matriz, por lo tanto:

V ar(β) = 1, 2240317

Así:σβ = 1, 1063597

Luego, el test t se calcula como sigue:

tβ =β

σβ

=4, 678374

1, 1063597= 4, 2286193

Este valor es mayor al t crítico sugerido (2,3), por lo tanto, se rechaza lahipótesis nula, y el coeficiente estimado es estadísticamente significativo.

2

Page 70: Magno Econometría

4. Realice una predicción condicional de minutos a hablar para una personaque tiene 26 años de edad, y luego construya un intervalo de confianza al95 % para dicha predicción (Ayuda: Utilice 2,3 para el valor crítico de ladistribución t). (10 puntos)Respuesta. La predicción es:

M = −20, 75335 + 4, 678374(26) = 100, 88437

Por otro lado, se sabe que:

P (M − t∗√

V ar(eo) ≤ M + t∗√

V ar(eo)) = 1− α

Además:V ar(eo) = s2(1 + xo(X ′X)−1xo′

)

Luego:

V ar(eo) = 344, 63293

[(1 +

(1 26

) (9 209

209 5135

)−1 (126

)]= 215, 565586

Luego:

P (100, 88437− 2, 3(14, 6821519) ≤ 100, 88437 + 2, 3(14, 6821519)) = 1− α

P (67, 115421 ≤ 134, 65332) = 1− α

3

Page 71: Magno Econometría

Control #3

Econometrıa I

Profesores: Tomas Rau y Javiera Vasquez

Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda

23 de abril, 2008

Tiempo Total: 30 Minutos.

1. Comentes (10 puntos, 5 c/u)

1) Un alto R2 es garantıa de que la estimacion del modelo de regresion lineal es buena.

R. Falso. Un R2 alto no necesariamente indica que la estimacion es buena, esto puede deberse a unmodelo saturado con muchas variables y que artificialemente aumentan la bondad de ajuste (estopuede ser chequado viendo el R2 ajsutado). Tambien existen modelos matematicamente equivalentespero econometricamente distintos, unos con elevado R2 y otros con bajo R2 (ejemplo visto en clases).

2) El teorema de Gauss-Markov establece que dentro de la clase de estimadores insesgados el estimadorMCO es el mas eficiente.

R. Falso/Depende. El teorema de Gauss-Markov establece que dentro de la clase de estimadores LI-NEALMENTE insesgados el estimador MCO es el mas eficiente, bajo ciertos supuestos. Pueden existirestimadores no lineales e insesgados con menor varianza que el estimador de MCO.

2. Problema (20 puntos)

Sea el siguiente modelo de regresion lineal

y = β0 + β1x1 + β2x2 + β3x3 + ǫ

donde se cumplen los supuestos usuales vistos en clases.

a) Describa como testearıa la siguiente hipotesis

H0 : 3β1 − 2β3 = −8

Ha : 3β1 − 2β3 6= −8

Escriba explicitamente el estadıstico a usar, su distribucion bajo la hipotesis nula, y cuando rechaza ono rechaza la hipotesis nula.

R. Aqui hay dos alternativas: hacer un simple test-t o un test F mediante Rβ = r (caso 3). La primeraes trivial,

t =3β1 − 2β3 + 8

9V ar(β1) + 4V ar(β3) − 12Cov(β1, β3)∼ tn−k

1

Page 72: Magno Econometría

que sigue una distribucion t-student con n − k grados de libertad. Como la hipotesis es a dos colas yla distribucion t es simetrica debemos comparar el estadıstico con el valor tabla tα/2,n−k, donde α esel nivel de significancia del test (probabilidad de cometer error tipo I). Se rechaza la hipotesis nula si|t| > tα/2,n−k.

La otra alternativa es,

[(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)]/q

u′u/(n − k)≡ [(Rβ − r)′[σ2R(X ′X)−1R′]−1(Rβ − r)]/q ∼ F(q,n−k) (1)

donde R = [0, 3, 0,−2], r = −8 y q = 1. Luego el estadıstico sigue una distribucion F con (1,n-k) gradosde libertad y se rechaza el test si el estadıstico es mayor al valor crıtico Fα

(1,n−k).

b) Suponga que β0 = 1, β1 = 2, β2 = 2,5, β3 = 1, n=1000 y

σ2(X ′X)−1 =

3 0 0 00 4 0 30 0 9 00 3 0 9

Realice el test descrito en a) con un nivel de significancia del 5 % y diga si rechaza o no la hipotesisnula. Recuerde que t2,5 %,996 = 1,96 y que F 5 %

1,996 = 3,84

R. El test t es simplemente

t =3β1 − 2β3 + 8

9V ar(β1) + 4V ar(β3) − 12Cov(β1, β3)=

12√36 + 36 − 36

= 2

con lo cual tenemos que se rechaza la hipotesis nula puesto que t2,5%,996 = 1,96

La otra manera requiere un poco mas de algebra. Dado que q = 1 podemos reemplazarlo y calculemosla expresion en corchetes a la menos 1, es decir la varianza de Rβ

σ2R(X ′X)−1R′ =[

0 3 0 −2]

3 0 0 00 4 0 30 0 9 00 3 0 9

030

−2

=[

0 6 0 −9]

030

−2

= 36

luego,[(Rβ − r)′[σ2R(X ′X)−1R′]−1(Rβ − r)]/q = (12)(36)−112/1 = (12)2/36 = 4

Luego el estadıstico es mayor a F 5%1,996 = 3,84 y se rechaza la hipotesis nula.

2

Page 73: Magno Econometría

CCOONNTTRROOLLEESS 44

Page 74: Magno Econometría

Econometría IProfesores: J.M. Benavente, A. Otero y J. Vásquez.

Primavera 2004

Control 4

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayu-dantes, no puedo tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tienederecho a reclamo. Contestar sólo en el espacio disponible

Pregunta 1: (30 puntos) En un modelo de regresión lineal simple donde tanto la variabledependiente como explicativa están en logaritmos, el parámetro estimado representa una elas-ticidad. Comente.

Verdadero, cuando tenemos un modelo de regresión simple: ln(yi) = α + βln(xi) + ui, dondeambas variables (dependiente y explicativa) estan el logaritmos, el parámetro β que representael impacto marginal de ln(x) sobre ln(y) representa la elacticidad de y a x.Veamos esto con más detalle, β = ∂ln(y)

∂ln(x) , recordando que la dervivada de una variable en loga-

rimo es ∂ln(x)∂x = 1

x∆x, tenemos que β = ∂ln(y)∂ln(x) = ∆y

y · x∆x , lo que es implica β = %∆y

%∆x , lo quepor definición corresponde la elasticidad de y a x.

Pregunta 2: (70 puntos) Existe presunción que los egresados de Administración de la car-rera de Ingeniería Comercial tienen un mayor salario que aquellos egresados de Economía.

(a) Plantee un modelo que permita testear esta hipótesis. Explique explícitamente como lotestearía.

R: Suponiendo que disponemos datos de los alumnos egresados de Ingeniería Comercial, po-dríamos estimar el siguiente modelo:

Wi = β0 + β1D1i + ui

donde Wi es el logaritmo natural del salario y D1i es una variable dummy que toma el valor 1si la persona i egreso de administración y 0 si egreso de economía (también se puede definir D2i

que tome el valor 1 si la persona i egreso de economía y 0 si egreso de administración e incluiresta en el modelo, o incluir ambas dummies en el modelo y omitir la constante).De esta forma:

E[Wi/Administracion] = β0 + β1

E[Wi/Economia] = β0

Para comprobar esta hipótesis se requiere un parámetro β1 positivo y estadísticamente signi-

1

Page 75: Magno Econometría

ficativo. Explícitamente esto se testea mediante un test-t con H0: β1 = 0:

t =β1√V (β1)

∼ tn−k

(b) Plantee un modelo que además permita testear que dicha diferencia entre menciones no esigual entre universidades (Considere sólo las dos universidades más importante del país: Uni-versidad de Chile y Universidad Católica). Explique explícitamente como lo testearía.

Para testear esto además se debe incorporar una variable dummy que llamaremos D3, quetome el valor 1 si la persona i egreso de la Universidad de Chile y 0 si egreso de la UniversidadCatólica, de esta forma el modelo que nos permite testear esto es:

Wi = β0 + β1D1i + β2D3i + β3D1i ·D3i + ui

De esta forma:

E[Wi/Administracion en U. de Chile] = β0 + β1 + β2 + β3

E[Wi/Economia en U. de Chile] = β0 + β2

E[Wi/Administracion en U. Catolica] = β0 + β1

E[Wi/Economia en U. Catolica] = β0

Para testear se debe utilizar un test F para la hipótesis conjunta:

H0 : β1 = 0β2 = 0β3 = 0 o

H0 : Rβ = r

donde R=[03×1 I3] y r=03×1.

El estadístico F es:

[(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)]/q

u′u/(n− k)∼ F(q,n−k)

2

Page 76: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Control 4

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada más que lápizen su escritorio, si contesta con lápiz mina no tiene derecho a reclamo. Contestar sólo en elespacio disponible

Pregunta 1: (30 puntos) Bajo el supuesto de normalidad del término de error, el estima-dor Máximo Verosímil (MV) y el de Mínimos Cuadrados Ordinarios (MCO) son exactamenteiguales. Comente.

Efectivamente bajo el supuesto de normalidad del término de error, el estimador Máximo Ve-rosímil de los parámetros asociados a las variables explicativas (β) coincide con el estimadorMCO. Pero el estimador de la varianza del error (σ2) difiere, el estimador Máximo Verosímil deeste parámetro es un estimador sesgado, igual a la suma de los errores estimados al cuadradodividido por el tamaño de muestra. De esta forma, el comente es FALSO.

Pregunta 2: (70 puntos) Suponga que Ud. quiere estimar la siguiente función de producciónCobb-Douglas:

Y = ALαKγeu

para lo cual dispone datos de producto (Y), capital (K) y trabajo (L) de 10 países latinoame-ricanos.

a) Plantee una ecuación de regresión estimable por MCO.

R:

Como la función de producción Cobb-Douglas es una función no lineal es variables, paraque sea estimable por MCO se debe linealizar, lo que se hace aplicando logaritmo a estafunción, quedando el siguiente modelo logarítmico:

ln(Y ) = ln(A)︸ ︷︷ ︸β0

+ α︸︷︷︸β1

ln(L) + γ︸︷︷︸β2

ln(K) + u

ln(Y ) = β0 + β1ln(L) + β2ln(K) + u (1)

donde β1 = ∂ln(Y )∂ln(L) = %∆Y

%∆L = εY,L corresponde a la elasticidad del producto con respecto

al factor trabajo, y β2 = ∂ln(Y )∂ln(K) = %∆Y

%∆K = εY,K corresponde a la elasticidad del productocon respecto al factor Capital.

1

Page 77: Magno Econometría

b) Especifique un modelo que le permita testear que para cualquier nivel de Capital(K) yTrabajo (L), países grandes tienen en promedio un producto mayor que países pequeños.Además plantee explícitamente un test de hipótesis para ver la significancia estadísticade esta diferencia.

R:

Para testear esta hipótesis primero debemos definir la siguiente variable dummy:

D1 =

1 País grande0 País pequeño

Un modelo que nos permita testear que para cualquier nivel de capital y trabajo los paísesgrandes producen en promedio más que los pequeños, requiere introducir esta variabledummy (D1) en el modelo de la ecuación (1):

ln(Y ) = β0 + β1ln(L) + β2ln(K) + β3D1 + u (2)

De esta forma:

E(ln(Y)|país grande, K, L)=β0 + β3 + β1ln(L) + β2ln(K).

E(ln(Y)|país pequeño, K, L)=β0 + β1ln(L) + β2ln(K).

El parámetro β3 es quien mide esta diferencia en el promedio del producto par cual-quier nivel fijo de K y L, por lo tanto, para testear si esta diferencia es estadísticamentesignificativa, se debe testear la hipótesis de que β3 es estadísticamente significativo, másespecíficamente se debe realizar el siguiente test de hipótesis:

H0 : β3 = 0H1 : β3 6= 0

la que se realiza mediante un test-t:

t =β3√V (β3)

∼ tn−k

c) Especifique un modelo que le permite testear además de las diferencias en promedio dela parte b), que la elasticidad del producto con respecto al trabajo difiere entre paísesgrandes y pequeños. Nuevamente plantee explícitamente un test de hipótesis para ver lasignificancia estadística de esta diferencia.

R:

Para testear diferencias en la elasticidad del producto con respecto al trabajo, deberíamosincorporar otra variable más al modelo antes descrito (ecuación (2)), correspondiente auna variable interactiva, la multiplicación de la dummy y el logaritmo del trabajo, de lasiguiente forma:

ln(Y ) = β0 + β1ln(L) + β2ln(K) + β3D1 + β4D1 · ln(L) + u (3)

2

Page 78: Magno Econometría

De forma tal que,

E(ln(Y)|país grande, K, L)=β0 + β3 + β1ln(L) + β4ln(L) + β2ln(K).

E(ln(Y)|país pequeño, K, L)=β0 + β1ln(L) + β2ln(K).

Y así, la elasticidad del producto con respecto al trabajo para cada grupo es:

∂ E(ln(Y)|país grande, K, L)/∂ ln(L) =β1 + β4

∂ E(ln(Y)|país pequeño, K, L)/∂=β1

La diferencia en elasticidad del producto con respecto a trabajo entre los países grandesy pequeños estará determinada por el parámetro β4, para ver si la diferencia es estadísti-camente significativa se debe realizar el siguiente test:

H0 : β4 = 0H1 : β4 6= 0

la que se realiza mediante un test-t:

t =β4√V (β4)

∼ tn−k

3

Page 79: Magno Econometría

Econometría IProfesores: A. Otero y J. Vásquez.

Otoño 2005

Pauta Control 4

Pregunta 1: (30 puntos) Uno de los supuestos utilizados para derivar el estimador MCOasumía que las variables independientes eran determinísticas. Si levantamos este supuesto elestimador MCO sigue siendo insesgado pero ya no es el mejor estimador lineal e insesgado.Comente.

Falso, cuando tenemos regresores estocásticos tenemos que la media y varianza condicionaldel estimador MCO son: E[β|X] = β y V [β|X] = σ2(X ′X)−1, así en términos condicionales elestimador es MELI (insesgado y de mínima varianza). Los momentos incondicionales del esti-mador son: E[β] = β y V [β] = σ2E[(X ′X)−1], si bien el estimador es insesgado la varianza sólose puede obtener en términos de media de las variables explicativas. Sin embargo, como el esti-mador es MELI para cada valor de X (condicional) también lo será para los valores medios de X.

Pregunta 2: (70 puntos) Considere la siguiente variable aleatoria yt distribuida exponen-cialmente con parámetro θ0. Su función de densidad está dada por:

f(yt; θ0) =1θ0

e−ytθ0 yt > 0; θ0 > 0

Plantee la función de verosimulitud asociada a esta función de densidad exponencial (20puntos).

La función de densidad conjunta para las T observaciones se obtiene a través de la pita-toria de la densidad de cada observación:

f(y; θ0) =T∏

t=1

f(yt; θ0) =T∏

t=1

1θ0

e−ytθ0

=(

1θ0

)T

· e−1θ0

∑Tt=1 yt

Ahora la función de verosimilitud corresponde algebraicamente a la misma expresiónanterior, sólo que teóricamente la incógnita es el parámetro y se asume como dada lamuestra de tamaño T de la variable y:

L(θ0;y) =(

1θ0

)T

· e−1θ0

∑Tt=1 yt

Aplicando logaritmo natural a la expresión anterior, obtenemos la log-likelihood:

l(θ0;y) = −T ln(θ0)− 1θ0

T∑t=1

yt

Encuentre las condiciones de primer orden asociadas a la estimación por maxima verosi-militud de θ0 (20 puntos).

1

Page 80: Magno Econometría

Para obtener la condición de primer orden derivamos la log-likelihood con respecto aθ0 e igualamos a cero:

∂l

∂θ0= −T

θ+

1

θ2

T∑t=1

yt = 0

Encuentre el estimador máxima verosimilitud de θ0 ( 30 puntos).

El estimador máximo verosímil de θ0 denominado θ, se obtiene al despejar θ de la condi-ción de primer orden:

−T

θ+

1

θ2

T∑t=1

yt = 0

1

θ2

T∑t=1

yt =T

θ

θ =∑T

t=1 yt

T

2

Page 81: Magno Econometría

Econometría I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.Ayudante : Roberto Jaramillo M.

Control 4 - Pauta de Correción

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a losayudantes, no puede tener nada más que lápiz en su escritorio. Si contesta con lápizmina no tiene derecho a reclamo.

Pregunta 1 (30 puntos)

Una variable aleatoria x sigue una distribución exponencial si es que tiene la siguientefunción de densidad (pdf):

f(x) =

1θexp

(−xθ

)para x > 0

0 para x ≤ 0

donde θ > 0 es el parámetro de la distribución. Usando el método de MáximaVerosimilitud, muestre que el estimador máximo verosímil de θ es θ =

Pxi

n, donde n

es el tamaño muestral. Esto es, muestre que el estimador máximo verosímil de θ es elpromedio muestral x.

Dada la función de densidad, la función de verosimilitud será

L(xi, θ) =n∏

i=1

1

θexp

(−xi

θ

)=

(1

θ

)n

exp

(−1

θ

∑xi

),

y el logaritmo de la función de verosimilitud será

ln L(xi, θ) = −n ln(θ)− 1

θ

∑xi.

Tomando derviada con respecto a al parámetro θ para maximizar la función se obtiene

∂ ln L(xi, θ)

∂θ= −n

1

θ+

∑xi

θ2.

Finalmente, igualando a cero obtenemos

θ =

∑xi

n= x.

1

Page 82: Magno Econometría

Pregunta 2 (30 puntos)

Explique en qué consiste cada uno de los 3 test de hipótesis usados en inferencia bajoMáxima Verosimilitud. Haga una comparación crítica de los test, estableciendo susventajas y desventajas.

Los 3 tests usados en inferencia bajo Máxima Verosimilitud son: el test LR (LikelihoodRatio - Razón de Verosimilitud), el test de Wald y el test LM (Lagrange Multiplier -Multiplicador de Lagrange).

Los estadísticos de cada uno de los tests son los siguientes:

LR = 2 · ln(L(β, σ)− ln L(β, σ)

)a∼ χ2

q

W =(Rβ − r)′[R(X ′X)−1R′](Rβ − r)

σ2

a∼ χ2q

LM = n ·R2 a∼ χ2q

donde β y σ corresponden a los estimadores del modelo no restringido, β y σ son losestimadores del modelo restringido, y el R2 corresponde a aquel de la regresión auxil-iar de u sobre X, donde u son los residuos del modelo restringido y X es la matriz detodas las variables explicativas. Finalmente, q corresponde al número de restriccionesinvolucradas.

Asintóticamente los 3 tests son equivalentes en el sentido que el estadístico asoci-ado a cada uno de ellos sigue una distribución Chi-cuadrado. Dada la naturalezaasintótica de los test, deben ser aplicados con mucho cuidado en muestras relativa-mente pequeñas, en las cuales se debiera prefererir tests como el F o el t. Una ventajaimportante de estos tests es que permiten testear restricciones no lineales.

En el test LR, si la restricción reduce signicativamente la función de verosimilitud,entonces el test rechaza la hipótesis nula de las restricciones. Por lo tanto, el LR testrequiere la estimación del modelo no restringido y del modelo restringido. Sin embar-go, la construcción del estadístico LR es extremadamente simple, requiriendo simpleresta. Todos los paquetes económetricos entregan el valor la función de verosimilitud.

El test de Wald involucra sólo la estimación del modelo no restringido, y analiza lasimplicancias de las restricciones. La construcción del estadístico W involucra manejomatricial, haciéndolo más demandante.

El test LM analiza la pendiente de la función de verosimilitud y nalmente sólo re-quiere la estimación del modelo restringido. La construcción del estadístico requiereuna regresión auxiliar.

2

Page 83: Magno Econometría

Usualmente, el modelo original y el tipo de restricciones determinarán cuál test esmás sencillo de aplicar. En algunos casos el modelo no restringido puede ser tan com-plejo que el test LM se hace más conveniente. En otros casos, las restricciones puedengenerar un mayor costo de estimación del modelo restringido, haciendo que el test deWald sea más conveniente.

3

Page 84: Magno Econometría

Econometría IProfesoras: Javiera Vásquez.

Otoño 2006

Control 4

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayu-dantes, no puedo tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tienederecho a reclamo. Contestar sólo en el espacio disponible

Pregunta 1: (30 puntos) En un modelo que busca explicar que en promedio los hombresganan más que las mujeres, para cualquier nivel de escolaridad, da lo mismo incluir una dum-my en la regresión que estimar dos modelos separados, uno para los hombres y otro para lasmujeres. Comente.

Efectivamente en términos de especificación, es lo mismo plantear un modelo que capture ladiferencia por género mediante una variable dummy, que estimar separadamente un modelo deecuación de mincer, uno para los hombres y otro para las mujeres. Sin embargo, en términos deeficiencia no es lo mismo. Al separar los modelos el tamaño muestral utilizado es más pequeño(en cada uno de ellos) que al estimar un solo modelo, por lo que la primera metodología esmenos eficiente.

Pregunta 2: (70 puntos) Plantee un modelo que le permita testear que la demanda por heladosen verano es diferente a la demanda promedio en invierno, y que la reacción ante un cambio enel precio difiere en estas dos estaciones. Sea explícito en como testearía esto.

Para esta pregunta vamos a dar dos alternativas de respuesta, una 100% buena y una reg-ular (pero aceptable):

Respuesta 1: Definamos las siguientes Dummies:

d1i =

1 verano0

d2i =

1 invierno0

(1)

Entonces el modelo que nos permite testear lo planteado en el enunciado es el siguiente:

Qi = α + β1Pi + β2d1i + β3d2i + β4Pid1i + β5Pid2i + ui

Así,

E[Qi|verano, Pi] = α + β1Pi + β2 + β4Pi

E[Qi|invierno, Pi] = α + β1Pi + β3 + β5Pi

Entonces debemos realizar los siguientes test de hipótesis:

H0 : β2 = β3

H0 : β4 = β5

1

Page 85: Magno Econometría

Si se cumplen las hipótesis nulas se comprueba que no existe diferencia estadística en la deman-da por helados entre invierno y verano.

Respuesta 2: Definamos la siguiente dummy:

d1i =

1 verano0 invierno

(2)

Se plantea el siguiente modelo:

Qi = α + β1Pi + β2d1i + β3Pid1i + ui

Así,

E[Qi|verano, Pi] = α + β1Pi + β2 + β3Pi

E[Qi|invierno, Pi] = α + β1Pi

Entonces debemos realizar los siguientes test de hipótesis:

H0 : β2 = 0H0 : β3 = 0

Si se cumplen las hipótesis nulas se comprueba que no existe diferencia estadística en la deman-da por helados entre invierno y verano.

2

Page 86: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Control 4

Semestre: Primavera 2006Profesores: José Miguel Benavente, Rodrigo MonteroTiempo de duración: 20 minutosNo hay preguntas de ningún tipo para los ayudantes

Comente (6 puntos)

El supuesto de independencia (de las observaciones) es crucial para implementar

el estimador de máxima verosimilitud (MV).

Respuesta. Falso. Es sólo un supuesto, el cual podría no cumplirse, al menos,

por dos motivos: (i) el rezago de la variable dependiente (Yt−1) aparece como

regresor, (ii) los erroes se encuentran autocorrelacionados. Si el supuesto de inde-

pendencia no se cumpliera, aún es posible implementar el estimador de máxima

verosimilitud, para lo cual existen dos alternativas: (1) utilizar una función de

distribución multivariada, o (2) realizar una transformación del modelo.

Ejercicio (14 puntos)

Considere el siguiente modelo (expresado en términos matriciales):

Y = Xβ + u

Asumiendo que ui ∼ N(0, σ2) derive los estimadores de máxima verosimilitud

para β y σ2. Recuerde que en este contexto:

f(ui) =1√

2πσ2e

(− u2

i2σ2

)

1

Page 87: Magno Econometría

Respuesta. Asumiendo que las realizaciones del término de error son indepen-

dientes, la densidad conjunta se escribe de la siguiente manera:

f(u1, u2, ..., un; σ2) = f(u1) · f(u2) · · · f(un) = Πni=1f(ui)

Dado el supuesto de normalidad, entonces:

f(u1, u2, ..., un; σ2) = Πni=1

[1√

2πσ2e

(− u2

i2σ2

)]= Πn

i=1

1√2πσ2

e

(− u′u

2σ2

)

La densidad multivariada para Y condicional en X viene dada por la siguiente

expresión:

f(Y |X) = f(u)

∣∣∣∣ ∂u

∂Y

∣∣∣∣donde |∂u/∂Y | es el valor absoluto del determinante formado por la matriz de

derivadas parciales (nxn) de los elementos de u con respecto a los elementos de

Y . En este caso, esta matriz es la matriz identidad. De esta forma, la función de

verosimilitud para Y viene dada por:

f(Y1, Y2, ..., Yn; X, σ2, β) =1

(2πσ2)n/2e

(− (Y −Xβ)′(Y −Xβ)

2σ2

)

Luego, para obtener los estimadores de máxima verosimilitud se aplica logar-

itmo a la expresión anterior y se deriva respecto a β y σ2:

max

[−n

2ln(2π)− n

2ln(σ2)− (Y −Xβ)′(Y −Xβ)

2σ2

]Luego:

∂ln(L)

∂β=

1

σ2X ′(Y −Xβ) = 0

∂ln(L)

∂σ2= − n

2σ2+

1

2σ4(Y −Xβ)′(Y −Xβ)

Resolviendo:

βMV = (X ′X)−1X ′Y

y:

σ2MV =

(Y −Xβ)′(Y −Xβ)

n

2

Page 88: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de ChilePauta Control 4

Semestre: Primavera 2007Profesores: José Miguel Benavente, Rodrigo MonteroAyudantes: Loreto Silva, Rodrigo Bravo, Felipe RíosTiempo de duración: 40 minutosNo hay preguntas de ningún tipo para los ayudantesEstá permitido utilizar calculadora

Se ha utilizado un modelo lineal para explicar los gastos de construcción de unnuevo almacén (Gi) en función del tamaño del mismo (Ai). Para ello se disponíade los siguientes datos referentes a diez almacenes:∑

Ai = 10∑

A2i = 76

∑Gi = 80

∑AiGi = 154

Si se sabe que la calidad promedio de los materiales utilizados (Ci) es una variablerelevante para explicar los gastos de construcción, ¿qué consecuencias tendrála omisión de dicha variable en el modelo? Considere la siguiente informaciónadicional:∑

Ci = 15∑

C2i = 102

∑AiCi = 84

∑CiGi = 200

Ayuda: Recuerde que la inversa de una matriz A viene dada por la siguienteexpresión (todos estos pasos llevan puntaje):

A−1 =1

|A|adj(A)

donde |A| corresponde al determinante de la matriz A, y adj(A) es la adjunta deA, que corresponde a la matriz traspuesta de cofactores de A. En el caso de unamatriz de 3x3, la matriz de cofactores viene dada por:C11 C12 C13

C21 C22 C23

C31 C32 C33

donde Cij = (−1)i+jMij, y Mij es el determinante de la submatriz de 2x2 que seobtiene de eliminar la fila i y la columna j de la matriz A.

1

Page 89: Magno Econometría

Respuesta. Se sabe que el omitir una variable relevante tiene dos efectos: (i)estimación sesgada de los verdaderos parámetros poblacionales, (ii) estimaciónsesgada de las varianzas de los estimadores de mínimos cuadrados ordinarios. Porlo tanto, al estimar el modelo omitiendo la calidad promedio de los materiales seobtendrán estimaciones sesgadas, y esto es lo que se muestra a continuación. Sise estima el modelo:

Gi = β0 + β1Ai + ui

entonces:

βMCO =

(β0

β1

)=

(N

∑Ai∑

Ai

∑A2

i

)−1 ( ∑Gi∑

AiGi

)Por lo tanto:

βMCO =

(β0

β1

)=

(10 1010 76

)−1 (80154

)=

1

660

(76 −10−10 10

)−1 (80154

)Finalmente:

βMCO =

(β0

β1

)=

(6, 8781, 121

)Sin embargo, el verdadero modelo es el siguiente:

Gi = γ0 + γ1Ai + γ2Ci + ui

Así, el estimador de mínimos cuadrados ordinarios viene dado por:

γMCO =

γ0

γ1

γ2

=

N∑

Ai

∑Ci∑

Ai

∑A2

i

∑AiCi∑

Ci

∑AiCi

∑C2

i

−1 ∑Gi∑

AiGi∑CiGi

Por lo tanto:

γMCO =

γ0

γ1

γ2

=

10 10 1510 76 8415 84 102

−1 80154200

Se sabe que la inversa de una matriz viene dada por:

A−1 =1

|A|adj(A)

El determinante de la matriz de 3x3 que se debe invertir es 4860. Luego, faltadeterminar la matriz de cofactores. Así:

C11 = (−1)1+1

∣∣∣∣76 8484 102

∣∣∣∣ = 696

2

Page 90: Magno Econometría

C12 = (−1)1+2

∣∣∣∣10 8415 102

∣∣∣∣ = 240

C13 = (−1)1+3

∣∣∣∣10 7615 84

∣∣∣∣ = −300

C21 = (−1)2+1

∣∣∣∣10 1584 102

∣∣∣∣ = 240

C22 = (−1)2+2

∣∣∣∣10 1515 102

∣∣∣∣ = 795

C23 = (−1)2+3

∣∣∣∣10 1015 84

∣∣∣∣ = −690

C31 = (−1)3+1

∣∣∣∣10 1576 84

∣∣∣∣ = −300

C32 = (−1)3+2

∣∣∣∣10 1510 84

∣∣∣∣ = −690

C33 = (−1)3+3

∣∣∣∣10 1010 76

∣∣∣∣ = 660

La matriz adjunta (traspuesta de la matriz de cofactores) queda de la siguientemanera: 696 240 −300

240 795 −690−300 −690 660

Por lo tanto:

γMCO =

γ0

γ1

γ2

=1

4860

696 240 −300240 795 −690−300 −690 660

80154200

=

6, 7160, 7460, 358

El sesgo de los estimadores de MCO viene dado por:

sesgo(β0) = E(β0) − γ0 = 6, 878 − 6, 716 = 0, 162

sesgo(β1) = E(β1) − γ1 = 1, 211 − 0, 746 = 0, 465

De esta manera, al omitir la calidad promedio de los materiales se estarían so-brestimando los verdaderos parámetros poblacionales.

3

Page 91: Magno Econometría

Pauta Control N°4 Econometría I

Profesores: Tomás Rau y Javiera Vásquez

Ayudantes: Roberto Gillmore, Eugenio Rojas, y Jorge Sepúlveda

23 de Mayo de 2008

1. Si Ud. posee la siguiente función de producción Cobb-Douglas:

iuiii eKALY βα=

donde: Yi: producción de la empresa i Li: cantidad de trabajadores en la empresa i Ki: capital fijo de la empresa i. a) ¿Por qué razón el modelo anterior no es estimable por MCO? (5 ptos) La función Cobb-Douglas no es estimable tal cual se plantea, ya que la variable dependiente (Y) depende en forma no lineal de los parámetros del modelo. b) Menciones dos alternativas para que este modelo pueda ser estimado (10 ptos) 1- Se puede estimar por Máxima Verosimilud 2- Se puede linealizar el modelo aplicando logaritmo natural y estimar por MCO:

iiii uKLAY +++= lnln)ln(ln βαγ321

c) En el modelo estimable por MCO, ¿Qué variable agregaría para testear que el

producto promedio en las empresas del sector servicios es mayor que en los otros sectores económicos?. Explique como testearía esta hipótesis. (15 ptos)

Se debe definir una variable Dummy que tome valor 1 si la empresa pertenece al sector económico servicios, y 0 si es que la empresa

=casootroen

serviciosaperteneceiempresaDi

0

1

Luego incluyendo esta Dummy en el modelo:

iiiii uDKLY ++++= δβαγ lnlnln

Se estima que producto promedio (en logaritmo) condicional en trabajo y capital es:

Page 92: Magno Econometría

DKLDKLYE δβαγ +++= lnln],ln,ln|[ln

De esta forma el producto promedio (en logaritmo) de las empresas del sector servicios es:

δβαγ +++= KLDKLYE lnln],ln,ln|[ln

Y de los otros sectores económicos:

KLDKLYE lnln],ln,ln|[ln βαγ ++=

Luego para testear si existe una diferencia significativa, se debe realizar un test t sobre la hipótesis nula de que δ es igual a cero. Si se rechaza la hipótesis nula la diferencia en el producto promedio de este sector con respecto a los restantes es estadísticamente significativa. d) A partir del modelo anterior, ¿Qué variable agregaría para testear que la

productividad marginal del trabajo es mayor en el sector servicios que en otros sectores económicos? (15 ptos)

Para testear esta hipótesis se debería agregar al modelo anterior, una variable interactiva del lnL con la Dummy antes definida:

iiiiiii uDLDKLY +⋅++++= lnlnlnln φδβαγ

Así el valor esperado condicional del producto (en logaritmos) en este caso es:

DLDKLDKLYE ⋅++++= lnlnln],ln,ln|[ln φδβαγ

Entonces la elasticidad del producto con respecto al trabajo:

DL

DKLYEφα +=

ln

],ln,ln|[ln

Así, la elasticidad del sector servicios:

φα +=∂

L

DKLYE

ln

],ln,ln|[ln

Y la de los otros sectores:

α=∂

L

DKLYE

ln

],ln,ln|[ln

Page 93: Magno Econometría

2. Con respecto al siguiente modelo:

iiiiiii uEDEDEw +⋅+⋅++= 33221ln βββα

Donde: Wi: salario de la persona i. Ei: años de escolaridad de la persona i. D2i: variable dummy que toma valor 1 si la persona i tiene entre 8 y 11 años de escolaridad (incluido los entremos). D3i: variable dummy que toma valor 1 si la persona i 12 años de escolaridad o más. a) ¿Qué representan los coeficientes β1, β2 y β3? (15 ptos) Derivando el valor esperado del logaritmo del salario con respecto a los años de escolaridad, se obtiene el retorno a la educación:

iii DD

E

DDEwE33221

32 ],,|[lnβββ ++=

Para la gente que tiene menos de ocho años de escolaridad, el retorno a la educación es:

132 ],,|[ln

β=∂

E

DDEwE i

Para las personas que tienen 8 años y más de escolaridad pero menos de 12 años de escolaridad, el retorno a la educación es:

2132 ],,|[ln

ββ +=∂

E

DDEwE i

Y finalmente, para las personas que tienen 12 años de escolaridad o más, el retorno a la ecuación que resulta del modelo es:

3132 ],,|[ln

ββ +=∂

E

DDEwE i

De esta forma, β1 representa el retorno a la educación de las personas con menos de 8 años de educación (básica incompleta), el coeficiente β2 representa el aumento en retorno a la educación de las personas que tienen entre 8 y 11 años de educación (incluido los extremos) comparado con la gente con menos de 8 años de escolaridad, y el coeficiente β3 representa el aumento en retorno a la educación de las personas que

Page 94: Magno Econometría

tienen 12 años o más de educación comparado con la gente con menos de 8 años de escolaridad.

b) Si β1=0.05, β2=0.09 y β3=0.13. Realice un gráfico de la relación estimada entre logaritmo del salario y los años de educación. ¿Qué representa este gráfico?. (15 ptos)

Grafico

Retorno a la educación

Page 95: Magno Econometría

CCOONNTTRROOLLEESS 55

Page 96: Magno Econometría

Econometría IProfesores: J.M. Benavente, A. Otero y J. Vásquez.

Primavera 2004

Pauta Control 5

Pregunta 1: (30 puntos) La omisión de una variable relevante siempre subestima el verdaderovalor del β y su varianza. Comente.

Falso, la omisión de una variable relevante siempre produce sesgo en los parámetros a menosque la correlación entre la variable omitida y las explicativas incluidas sea cero, sin embargo, ladirección del sesgo no es siempre negativa, el signo del sesgo depende de dos cosas: la correlaciónentre la variable omitida y las variables explicativas incluidas y el valor del parámetro que ten-dría asociado la variable omitida (valor poblacional). Para un modelo sencillo con una variableexplicativa (x1) y una variable omitida (x2) se mostró en clases que el sesgo es: cov(x1,x2)

V (x1)β2.

Por otra parte, siempre al omitir una variable relevante, la varianza de los parámetros estimadaa partir del modelo incorrecto es menor que la del modelo verdadero que incluye la variableomitida.

Pregunta 2: (70 puntos)

Suponga que un amigo de usted esta interesado en estimar el retorno a la educación. Paraesto ha estimado los siguientes dos modelos.

Modelo 1:

Wi = β1 + β2Dsexoi + β3Esci + β4Expei + β5Expe2i + β6Dzonai + β7Dpatroni + ui

Modelo 2:

Wi = β1 + β2Dsexoi + β3Esci + β4Expei + β5Expe2i + β6Dzonai + ui

En donde Wi corresponde al logaritmo natural del salario del individuo i , Dsexoi es una vari-able dicotómica que toma el valor de 1 si el individuo i es hombre, Esci corresponde a laosaños de educación del individuo i, Expei y Expe2i corresponden a los años de experiencia yexperiencia al cuadrado del individuo i respectivamente, Dzonai es una variable dicotómica quetoma el valor de 1 si el individuo vive en una zona urbana y 0 sino, y Dpatroni es una variabledicotómica que toma el valor de 1 si el individuo es trabajador por cuenta propia.

En base a los resultados de los modelos calcule los criterios de información de Akaike y Schwarzy aconseje a su amigo sobre cual modelo debe considerar.

1

Page 97: Magno Econometría

Modelo 1:

Dependent Variable: LNW Method: Least Squares Date: 10/27/04 Time: 00:15 Included observations: 40191 LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6) *DZONA+C(7)*DPATRON

Coefficient Std. Error t-Statistic Prob. C(1) 9.931645 0.022411 443.1514 0.0000

C(2) 0.389195 0.010563 36.84418 0.0000 C(3) 0.117759 0.001023 115.1189 0.0000 C(4) 0.018930 0.000957 19.79067 0.0000 C(5) -0.000160 1.38E-05 -11.59811 0.0000 C(6) 0.188917 0.007530 25.08913 0.0000 C(7) 0.359617 0.007515 47.85069 0.0000

R-squared 0.368769 Mean dependent var 11.91058

Adjusted R-squared 0.368674 S.D. dependent var 0.848871 S.E. of regression 0.674479 Akaike info criterion ¿? Sum squared resid 18280.58 Schwarz criterion ¿? Log likelihood -41197.25 Durbin-Watson stat 1.705727

Modelo 2:

Dependent Variable: LNW Method: Least Squares Date: 10/27/04 Time: 00:24 Included observations: 40191 LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6) *DZONA

Coefficient Std. Error t-Statistic Prob. C(1) 9.938190 0.023040 431.3386 0.0000

C(2) 0.389363 0.010860 35.85326 0.0000 C(3) 0.120470 0.001050 114.7276 0.0000 C(4) 0.021630 0.000982 22.03435 0.0000 C(5) -0.000151 1.42E-05 -10.65890 0.0000 C(6) 0.176372 0.007737 22.79717 0.0000

R-squared 0.332801 Mean dependent var 11.91058

Adjusted R-squared 0.332718 S.D. dependent var 0.848871 S.E. of regression 0.693420 Akaike info criterion ¿? Sum squared resid 19322.21 Schwarz criterion ¿? Log likelihood -42310.86 Durbin-Watson stat 1.739436

AIC = −2lnL

n+

k

n

BIC = −2lnL

n+

ln(n) · kn

n k lnL AIC BICModelo I 40191 7 -41197.25 2.05025 2.0519Modelo II 40191 6 -42310.86 2.10564 2.10707

De acuerdo a ambos criterios se recomienda escoger el primer modelo, ya que este minimizaambos criterios de información.

2

Page 98: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Pauta Control 5

Pregunta 1: (30 puntos) El estimador de White me permite solucionar el problema de inefi-ciencia en el estimador MCO cuando los errores son Heterocedásticos. Comente.

Falso, el estimador de White sólo me permite estimar en forma consistente la matriz de varian-zas y covarianzas de los parámetros en presencia de Heterocedasticidad estimador por MCO. Elestimador MCO siempre será ineficiente, el estimador eficiente en este contexto es el de MínimosCuadrados Generalizados.Por lo tanto, White me permite estimar consistentemente la matriz de varianzas tçy covarianzasdel estimador MCO (que es ineficiente) para realizar la inferencia en forma correcta, utilizandoesta matriz.

Pregunta 2: (70 puntos) Suponga el siguiente modelo de regresión lineal:

Yn×1

= Xn×k

βk×1

+ un×1

Este modelo puede ser particionado de la siguiente forma:

Yn×1

= X1n×k1

β1k1×1

+ X2n×k2

β2k2×1

+ un×1

donde k1 + k2 = k

a) Obtenga el estimador MCO del subconjunto de parámetros β1.

R: El el modelo particionado de la siguiente forma:

Y = X1β1 + X2β2 + u

El sistema de ecuaciones normales (X ′X)β = X ′Y , se puede escribir de la siguiente forma:[

X ′1X1 X ′

1X2

X ′2X1 X ′

2X2

] [β1

β2

]=

[X ′

1YX ′

2Y

]

o alternativamente:

(X ′1X1)β1 + (X ′

1X2)β2 = X ′1Y (1)

(X ′2X1)β1 + (X ′

2X2)β2 = X ′2Y (2)

De (2) obtengo:

(X ′2X2)β2 = X ′

2(Y −X1β1)

⇒ β2 = (X ′2X2)−1X ′

2(Y −X1β1) (3)

Reemplazando (3) en (1):

X ′1Y = (X ′

1X1)β1 + X ′1X2(X ′

2X2)−1X ′2(Y −X1β1)

X ′1Y = (X ′

1X1)β1 + X ′1X2(X ′

2X2)−1X ′2Y − (X ′

1X1)β1 + X ′1X2(X ′

2X2)−1X ′2X1β1)

1

Page 99: Magno Econometría

Agrupando términos, se tiene:

X ′1[I − P2︸ ︷︷ ︸

M2

]Y = X ′1[I − P2︸ ︷︷ ︸

M2

]X1β1 (4)

donde P2 = X2(X ′2X2)−1X ′

2 es la matriz de proyección, y M2 = I − P2 es una matrizsimétrica e idempotente.

De (4) podemos despejar el estimador MCO del subconjunto de parámetros β1:

β1 = (X ′1M2X1)−1X ′

1M2Y (5)

b) Obtenga la matriz de varianzas y covarianzas del subconjunto de parámetros β1.

R:

Utilizando (5):

β1 = (X ′1M2X1)−1X ′

1M2(X1β1 + X2β2 + u)

β1 = (X ′1M2X1)−1X ′

1M2X1β1 + (X ′1M2X1)−1X ′

1 M2X2︸ ︷︷ ︸0

β2 + (X ′1M2X1)−1X ′

1M2u

β1 = β1 + (X ′1M2X1)−1X ′

1M2u

⇒ E(β1) = β1

La varianza del subconjunto de parámetros β1 entonces es:

V (β1) = E[(β1 − β1)(β1 − β1)′]= E[(X ′

1M2X1)−1X ′1M2uu′M2X1(X ′

1M2X1)−1]= (X ′

1M2X1)−1X ′1M2E[uu′]M2X1(X ′

1M2X1)−1

= (X ′1M2X1)−1X ′

1M2σ2IM2X1(X ′

1M2X1)−1

= σ2(X ′1M2X1)−1X ′

1M2X1(X ′1M2X1)−1

V (β1) = σ2(X ′1M2X1)−1

2

Page 100: Magno Econometría

Econometría IProfesores: A. Otero y J. Vásquez.

Otoño 2005

Pauta Control 5

Pregunta 1: (30 puntos) La omisión de variables relevantes produce subestimación en los pa-rámetros estimados por Mínimos Cuadrados Ordinarios. Comente.

Falso, es correcto que el estimador MCO será sesgado en presencia de variables relevantesomitidas, tenemos que E[β1] = β1 + (X ′

1X1)−1X ′1X2β2 lo que en un modelo sencillo de dos

variables (una incluida y la otra omitida) se reduce a E[β1] = β1 + Cov(X1,X2)V (X1)

β2. Pero el signodel sesgo depende de dos cosas: del signo de β2 y de la covarianza entre X1 y X2. Existen trescasos posibles:

1. β2 positivo y Cov(X1, X2) positiva, lo cual genera un sesgo hacia arriba o sobreestimación.

2. β2 positivo y Cov(X1, X2) negativa, lo cual genera un sesgo hacia abajo o subestimación.

3. β2 negativo y Cov(X1, X2) positiva, lo cual genera un sesgo hacia abajo o subestimación.

Pregunta 2: (70 puntos) Demuestre que los criterios de información de Akaike (AIC) y Schwarz(BIC):

AIC = −2 · lnL

n+ 2

k

n

BIC = −2 · lnL

n+ ln(n)

k

n

Se puedes escribir aproximadamente de la siguiente forma, bajo el supuesto de normalidaden el término de error en el modelo de regresión lineal Y = Xβ + u:

AIC = ln(σ2) + 2k

n

BIC = ln(σ2) + ln(n)k

n

Si los errores en el modelo Y = Xβ + u se distribuyen normal con media cero y varianza σ2,tenemos que:

Y ∼ N (Xβ, σ2)

Ahora debemos encontrar el logaritmo de la función de verosimilitud y reemplazarla en amboscriterios de información.

La función de densidad (o verosimilitud) individual es:

f(yi; Xi, β, σ2) = L(β, σ2; yi, Xi) =1√

2πσ2e−

(yi−Xiβ)2

2σ2

=1√

2πσ2e−

u2i

2σ2

1

Page 101: Magno Econometría

De esta forma, la verosimilitud conjunta es:

L(β, σ2;Y, X) =(

1√2πσ2

)n

e−∑n

i=1(yi−Xiβ)2

2σ2

=(

1√2πσ2

)n

e−∑n

i=1 u2i

2σ2

Finalmente el logaritmo de la verosimilitud es:

lnL(β, σ2; Y,X) = −n

2· ln(2π)− n

2· ln(σ2)−

∑ni=1 u2

i

2σ2

la que se puede evaluar en los estimadores (β, σ2):

lnL(β, σ2; Y,X) = −n

2· ln(2π)− n

2· ln(σ2)−

∑ni=1 u2

i

2σ2

Recordemos que σ2 =∑n

i=1 u2i

n , reemplazando en la expresión anterior:

lnL = −n

2· ln(2π)− n

2· ln(σ2)− n · σ2

2σ2

lnL = −n

2· ln(2π)− n

2· ln(σ2)− n

2lnL = −n

2[ln(2π) + ln(σ2) + 1

]

Por lo tanto, el logaritmo de la verosimilitud (lnL) es aproximadamente igual a:

lnL = −n

2· ln(σ2)

Reemplazando esta última expresión en las formulas originales de los criterios de informaciónde Akaike y Schwarz, se demuestra lo planteado.

2

Page 102: Magno Econometría

Econometría I

Profesores: Emerson MeloRodrigo MonteroJaime Ruiz-Tagle / Javiera Vásquez

Primavera 2005

Control 5 - Pauta de Corrección

Rut: .......................................

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los

ayudantes, no puedo tener nada más que lápiz en su escritorio. Si contesta con lápiz

mina no tiene derecho a reclamo. Debe contestar sólo en el espacio disponible.

Pregunta 1 (50 puntos)

Considere el siguiente modelo:

yi = β0 + β1x1i + ui

donde yi es la variable a explicar, x1i es la única variable explicativa, ui es el término deerror y i = 1, . . . , n. Asuma que se cumplen todos los supuestos del Modelo de regresiónLineal Clásico, y que los errores tienen un distribución normal ui ∼ N(µ, σ2).

Utilizando las condiciones de primer orden de la maximización de verosimilitud ,muestre que el estimador máximo verosímil pasa por los puntos medios de los datos so-bre yi y xi. Esto es, muestre que se cumple y = βMV

0 + βMV1 x1, donde βMV

0 y βMV1 son

los estimadores de máxima verosimilitud de β0 y β1 respectivamente.

1

Page 103: Magno Econometría

Para ello, recuerde que la función normal para una variable centrada en su media (esdecir, con media igual a cero) se escribe como:

f(x) =1

σ√

2π· exp

(− x2

2σ2

).

Solución La función de verosimilitud conjunta para errores i.i.d. con distribuciónnormal es:

L =n∏

i=1

1σ√

2π· exp

(− u2

i

2σ2

).

Luego, el logaritmo de la función de verosimilitud conjunta es:

ln(L) =n∑

i=1

ln(

1σ√

2π· exp

(− u2

i

2σ2

))

= −n · ln(σ)− n

2ln(2π) +

n∑i=1

(− u2

i

2σ2

).

Dado que ui = yi − β0 − β1x1i, la función a maximizar es

ln(L) = −n · ln(σ)− n

2ln(2π) +

n∑i=1

(−(yi − β0 − β1x1i)2

2σ2

).

De la condición de primer orden de maximización al derivar con respecto al parámetroβ0, imponiendo que la solución corresponde a la los estimadores de máxima verosimilitud(βMV

0 y βMV1 ) se obtiene:

2 ·n∑

i=1

(−(yi − βMV

0 − βMV1 x1i)

2σ2

)= 0

n∑i=1

(yi − βMV0 − βMV

1 x1i) = 0

n∑i=1

yi = n · βMV0 + βMV

1

n∑i=1

x1i∑ni=1 yi

n= βMV

0 + βMV1

∑ni=1 x1i

n

y = βMV0 + βMV

1 x1.

2

Page 104: Magno Econometría

Pregunta 2 (50 puntos)

Explique en qué consiste cada uno de los 3 test de hipótesis usados en inferencia ba-jo Máxima Verosimilitud. Haga una comparación crítica de los test, estableciendo susventajas y desventajas.

Solución Los 3 tests usados en inferencia bajo Máxima Verosimilitud son: el test LR(Likelihood Ratio - Razón de Verosimilitud), el test de Wald y el test LM (LagrangeMultiplier - Multiplicador de Lagrange).

Los estadísticos de cada uno de los tests son los siguientes:

LR = 2 · ln(L(β, σ)− lnL(β, σ)

)a∼ χ2

q

W =(Rβ − r)′[R(X ′X)−1R′](Rβ − r)

σ2

a∼ χ2q

LM = n ·R2 a∼ χ2q

donde β y σ corresponden a los estimadores del modelo no restringido, β y σ son losestimadores del modelo restringido, y el R2 corresponde a aquel de la regresión auxiliarde u sobre X, donde u son los residuos del modelo restringido y X es la matriz detodas las variables explicativas. Finalmente, q corresponde al número de restriccionesinvolucradas.

Asintóticamente los 3 tests son equivalentes en el sentido que el estadístico asociadoa cada uno de ellos sigue una distribución Chi-cuadrado. Dada la naturaleza asintóticade los test, deben ser aplicados con mucho cuidado en muestras relativamente pequeñas,en las cuales se debiera prefererir tests como el F o el t. Una ventaja importante deestos tests es que permiten testear restricciones no lineales.

En el test LR, si la restricción reduce signicativamente la función de verosimilitud,entonces el test rechaza la hipótesis nula de las restricciones. Por lo tanto, el LR testrequiere la estimación del modelo no restringido y del modelo restringido. Sin embargo,la construcción del estadístico LR es extremadamente simple, requiriendo simple resta.Todos los paquetes económetricos entregan el valor la función de verosimilitud.

3

Page 105: Magno Econometría

El test de Wald involucra sólo la estimación del modelo no restringido, y analiza lasimplicancias de las restricciones. La construcción del estadístico W involucra manejomatricial, haciéndolo más demandante.

El test LM analiza la pendiente de la función de verosimilitud y nalmente sólo re-quiere la estimación del modelo restringido. La construcción del estadístico requiereuna regresión auxiliar.

Usualmente, el modelo original y el tipo de restricciones determinarán cuál test es mássencillo de aplicar. En algunos casos el modelo no restringido puede ser tan complejoque el test LM se hace más conveniente. En otros casos, las restricciones pueden generarun mayor costo de estimación del modelo restringido, haciendo que el test de Wald seamás conveniente.

4

Page 106: Magno Econometría

Econometría I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.Ayudante : Roberto Jaramillo M.

Control 5 - Pauta de Correción

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayu-

dantes, no puede tener nada más que lápiz en su escritorio. Si contesta con lápiz mina no

tiene derecho a reclamo.

Pregunta 1 (30 puntos)

Los criterios de información de Akaike (AIC) y Schwartz (BIC) se denen como:

AIC = −2 ln(L)n

+k

n

BIC = −2 ln(L)n

+ kln(n)

n,

donde L es la función de verosimilutud conjunta, k el número de regresores y n es el númerode observaciones incluidas en el modelo.

(a) (15 puntos) ¾Para qué sirven estos criterios de información? Explique las consideracionesque hay que tener al utilizarlos.

Los criterios de información de Akaike y Schwartz se utilizan para seleccionar el mejor

modelo entre modelo anidados. Modelos anidados se reere a modelos que están con-

tenidos como un caso especial de otro. Los criterios de información se basan en el valor

maximizado del logaritmo de la función de verosimilitud para cada uno de los modelos.

Las consideraciones que hay que tener son: que los modelos a comparar sean efectiva-

mente anidados y que el número de observaciones en utilizado en la estimación de cada

uno de los modelos sea el mismo.

(b) (15 puntos) Explique intuitivamente por qué se busca minimizar (según esta denición)los criterios de información.

Sabemos que el logaritmo de la función de verosimilitud es siempre negativo dado que

la función de verosimilitud es una multpiplicación de probabilidades (el logaritmo de un

argumento menor que 1 y mayor que cero es siempre negativo), y que al estimar los

parámetros del modelo por Máxima Verosimilitud se buscó maximizar dicho valor. Por

1

Page 107: Magno Econometría

lo tanto, dado que para calcular el valor del índice se usa el valor del logaritmo de la

función de verosimilitud, sabemos que ambos índices, Akaike y Schwartz, son positivos.

Un valor de lnL más cercano a cero indicará un mejor ajuste, de modo que el índice

será minimizado para obtener el modelo óptimo.

Pregunta 2 (30 puntos)

(a) (10 puntos) Si se omite una variable relevante en la estimación de un modelo se pro-duce un sesgo. ¾Cuál la estimación que está sesgada? ¾De qué depende el signo del sesgo?

Al omitir una variable relevante del modelo se producirá un sesgo en la estimación de los

parámetros de todas las variables del modelo. El signo del sesgo depende de la relación

existente entre la variable omitida y el resto de las variables y del signo del parámetro

de la variable omitida en el modelo verdadero. Además, se producirá un sesgo en la esti-

mación la varianza de los estimadores de los parámetros. En particular, se subestimará

la varianza de los estimadores. Finalmente se sobreestimará la varianza de los errores.

(b) (10 puntos) Explique en qué consiste la heterocedasticidad y por qué podría surgir enla estimación de un modelo econométrico. Además, explique las consecuencias en la es-timación e interpretación de los resultados del modelo.

La heterocedasticidad corresponde a la existencia de errores cuyas varianzas no son

iguales, rompiendo con el supuesto de que los errores son homocedásticos con varian-

za σ2i = σ2

u ∀i. La heterocedasticidad podría surgir en un modelo econométrico porque

podría ocurrir que sea más fácil predecir (el modelo es mejor) para cierto tipo de observa-

ciones. Por ejemplo, en un contexto de una estimación de salarios, podría ser más fácil

predecir para aquellos con baja educación y más difícil para aquellos con alta educación.

Ello resulta en errores de estimación del modelo con varianzas más altas para aquellos

con alta educación.

La presencia de heterocedasticidad, al afectar solamente la varianza de los errores, no

genera sesgo en la estimación de los parámetros del modelo. No obstante, sí se pro-

duce un sesgo en la estimación de las varianzas de los parámetros. En particular, se

obtienen varianzas más grandes (el estimador de Mínimos Cuadrados Ordinarios deja

de ser MELI). Por esto, y dado que los tests de inferencia se construyen basados en las

varianzas de los estimadores, se obtendrá que los tests de hipótesis se invalidan, por lo

que la interpretación de los resultados de la estimación del modelo se hace incierta.

(c) (10 puntos) Explique en qué consiste y para qué sirve el método de estimación de Míni-mos Cuadrados Generalizados Factibles (MCGF). [Nota: No es necesaria una demostraciónmatricial, pero el uso de expresiones algebraicas puede contribuir a una explicación másclara].

Cuando estamos en presencia de heterocedasticidad, se puede estimar correctamente las

2

Page 108: Magno Econometría

varianzas si se conoce la estructura de la matriz de covarianzas y aplicando el método

de Mínimos Cuadrados Generalizados (MCG). No obstante, cuando no se conoce la es-

tructura de la matriz de covarianzas, no se puede aplicar MCG, pero sí se puede aplicar

Mínimos Cuadrados Generalizados Factibles (MCGF).

El método de MCGF (White, 1980) utiliza la se realiza en 2 etapas. En la primera

etapa se estima el modelo por MCO. En la segunda etapa, con la información contenida

en la matriz de covarianzas de los residuos, se corrige la matriz de covarianzas inicial

para tener una estimación consistente.

La matriz de covarianzas del estimador de MCO viene dada por:

V ar(β|X) = (X ′X)−1(X ′σ2uΩX)(X ′X)−1

= n(X ′X)−1(1n

σ2uX ′ΩX)(X ′X)−1

Se desconoce la matriz Ω. Luego el método de MCGF propone estimar 1nσ2

uX ′ΩX como

Σ =1n

n∑i=1

u2i xix

′i.

Finalmente, la matriz de covarianzas corregida resulta

V ar(β|X) = n(X ′X)−1Σ(X ′X)−1.

3

Page 109: Magno Econometría

Universidad de ChileFacultad de Economia y Negocios

CONTROL 5Econometrıa I

Otono 2006

Profesoras: Javiera Vasquez y Claudia Sanhueza.

Nombre:...........................................................................................................

Rut:...........................................................................................................

1. Dado el modelo de regresion:

yi = α + ui

Donde E(ui) = 0 y V (ui) = x2i . Encuentre el estimador MELI de α.

Respuesta

Dada la heterocedasticidad presente en el error, el metodo mas efi-ciente de estimacion es MCG, ya que se conoce la matriz de varianzasy covarianzas del error:

Ω =

x2

1 0 · · · 00 x2

2 · · · 0... 0

. . . 00 · · · 0 x2

n

, Ω−1 =

1x21

0 · · · 0

0 1x22

· · · 0... 0

. . . 00 · · · 0 1

x2n

Como el modelo incluye solo una variable explicativa, la constante, lamatriz X es un vector de unos y por lo tanto:

(X ′Ω−1X) =[

1 · · · 1]

1x21

0 · · · 0

0 1x22

· · · 0... 0

. . . 00 · · · 0 1

x2n

1...1

=T∑

i=1

1

x2i

1

Page 110: Magno Econometría

X ′Ω−1Y =[

1 · · · 1]

1x21

0 · · · 0

0 1x22

· · · 0... 0

. . . 00 · · · 0 1

x2n

y1...

yn

=T∑

i=1

yi

x2i

Con lo cual es estimador MCG queda:

αMCG = (X ′Ω−1X)−1X ′Ω−1Y =

∑Ti=1

yi

x2i∑T

i=11x2

i

2. La omision de una variable relevante siempre sobrestima el verdaderovalor del parametro y su varianza.

Respuesta

Falso, no siempre se sobrestima, la omision de una variable relevantesiempre produce sesgo en los parametros a menos que la correlacionentre la variable omitida y las explicativas incluidas sea cero, y el signodel sesgo depende de dos cosas: la correlacion entre la variable omitiday las variables explicativas incluidas y el valor del parametro asociadola variable omitida (valor poblacional). Para un modelo sencillo conuna variable explicativa (x1) y una variable omitida (x2) el sesgo es:cov(x1,x2)var(x1)

β2, donde se aprecia claramente lo anterior. Con respecto a la

varianza, el sesgo de esta no es claro, pues no podemos estimar σ2 demanera correcta.

2

Page 111: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Control 5

Semestre: Primavera 2006Profesores: José Miguel Benavente, Rodrigo MonteroTiempo de duración: 20 minutosNo hay preguntas de ningún tipo para los ayudantes

Comente (6 puntos)

Los modelos no lineales no pueden ser estimados por mínimos cuadrados ordinar-

ios (MCO).

Respuesta. Falso. Existen modelos no lineales que son linealizables, y por ende,

son susceptibles de ser estimados a través del método de mínimos cuadrados or-

dinarios. Un ejemplo de estos modelos lo constituye la función Cobb-Douglas. En

este caso particular, la linealización se efectúa a través de una transformación log-

arítmica. No obstante lo anterior, hay modelos que no son linealizables, y por lo

tanto, no pueden ser estimador por MCO. En este escenario existen dos alterna-

tivas de estimación: (i) mínimos cuadrados no lineales, (ii) máxima verosimilitud.

En ambos casos será necesario utilizar métodos numéricos para obtener la solu-

ción.

Ejercicio (14 puntos)

Se tiene una muestra de 20 trabajadores, de los cuales sólo 6 utilizan un com-

putador en su lugar de trabajo. El salario promedio de aquellos que no utilizan un

computador es de $280.000, mientras que la remuneración (promedio) de aquellos

que sí utilizan uno es de $300.000.

1

Page 112: Magno Econometría

1. Especifique el modelo que puede ser estimado para cuantificar el retorno al

uso del computador en el lugar de trabajo. Para ello considere la inclusión

de dos variables dummies. (3 puntos)

Respuesta. El modelo tiene la siguiente forma:

Yi = β1D1i + β2D2i + ui

donde Yi es el salario del trabajador, D1i es una variable dummy que toma

el valor uno si la persona no utiliza un computador en su lugar de trabajo,

y cero si no, D2i es una variable dummy que toma el valor uno si la persona

utiliza un computador en su lugar de trabajo, y cero si no, y finalmente, ui

es un término de error bien comportado.

2. Encuentre los estimadores MCO del modelo anterior. (6 puntos)

Respuesta. En términos matriciales, el modelo puede escribirse de la sigu-

iente forma:

Y = Xβ + u

donde:

X =

d11 d21

d12 d22

......

d1n d1n

= (D1 D2)

y:

β =

β1

β2

Luego:

β = (X ′X)−1X ′Y =

D′1D1 D′

1D2

D′2D1 D′

2D2

−1 D′1Y

D′2Y

(1)

2

Page 113: Magno Econometría

Finalmente: β1

β2

=

N1 0

0 N2

−1 ∑d1iYi∑d2iYi

=

Y1

Y2

=

280,000

300,000

(2)

3. Encuentre la matriz de varianzas y covarianzas. (3 puntos)

Respuesta. La estimación para la matriz de varianzas y covarianzas viene

dada por la siguiente expresión:

var(β) = σ2(X ′X)−1

Dado que no se conocen los salarios individuales, no es posible estimar σ2.

Por lo tanto:

var(β) = σ2

N1 0

0 N2

−1

=

σ2

140

0 σ2

6

4. Especifique nuevamente el modelo pero ahora incluya sólo una variable dum-

my, y deje como categoría base a aquellos que no utilizan un computador

en su lugar de trabajo. ¿Cómo se relacionan los coeficientes de este modelo

con aquellos definidos en la parte (1)? (2 puntos)

Respuesta. El modelo a estimar sería el siguiente:

Yi = γ0 + γ1D2i + ei

Por lo tanto, se cumple lo siguiente:

γ0 = β1

γ1 = β2 − β1

3

Page 114: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de ChilePauta Control 5

Semestre: Primavera 2007Profesores: José Miguel Benavente, Rodrigo MonteroAyudantes: Loreto Silva, Rodrigo Bravo, Felipe RíosTiempo de duración: 40 minutosNo hay preguntas de ningún tipo para los ayudantesEstá permitido utilizar calculadora

Considere dos muestras de datos para estimar el siguiente modelo: Yi = β0 +β1Xi + ui. La primera de ellas (muestra I) contiene la siguiente información:

X ′X =

(50 300300 2100

)Y ′X =

(300 2000

)Y ′Y = 2100

Por su parte, la segunda muestra (muestra II) presenta las siguientes caracterís-ticas:

X ′X =

(50 300300 2100

)Y ′X =

(300 2200

)Y ′Y = 2800

Así, se dispone en total de 100 datos, pero que han sido agrupados en dos mues-tras. En base a esta información responda lo siguiente:

1. Calcule los estimadores de mínimos cuadrados ordinarios (MCO) de las dosmuestras por separado. (30 puntos)Respuesta. Para la muestra I se tiene lo siguiente:

βMCO =

(β0

β1

)=

(50 300300 2100

)−1 (3002000

)=

(2

2/3

)Para la muestra II:

βMCO =

(β0

β1

)=

(50 300300 2100

)−1 (3002200

)=

(−24/3

)

1

Page 115: Magno Econometría

2. Estime la varianza de los residuos de MCO (σ2) para cada una de las mues-tras. (Ayuda: recuerde que: u′u = Y ′Y − β′X ′Y ) (30 puntos)Respuesta. Para la muestra I:

u′u = Y ′Y − β′X ′Y = 2100−(2 2/3

) (3002000

)=

500

3

Luego:

σI2 =

500/3

48= 3, 472

Para la muestra II:

u′u = Y ′Y − β′X ′Y = 2800−(−2 4/3

) (3002200

)=

1400

3

Luego:

σII2 =

1400/3

48= 9, 722

3. Aplique el test de Goldfeld y Quandt para evaluar la presencia de het-eroscedasticidad en los residuos de ambas muestras. Utilice un valor críticopara la distribución F igual a 1,61. (Ayuda: recuerde que el numerador deeste test corresponde a la muestra que tiene asociada una mayor varianzaen los residuos) (30 puntos)Respuesta. La hipótesis nula de este test es la presencia de errores ho-moscedásticos. El test es el siguiente:

GQ =uII

′uII/NII

uI′uI/NI

=σII

2

σI2

que se distribuye F con NII y NI grados de libertad en el numerador ydenominador, respectivamente, ya que el numerador del test correspondea la varianza estimada de los residuos de la muestra que tiene asociada lamayor varianza. Por lo tanto:

GQ =9, 722

3, 472= 2, 8

valor que es mayor al F crítico de tabla (1,61), por lo que se rechaza lahipótesis nula de errores homoscedásticos.

4. ¿Cuáles serían las consecuencias para la estimación de MCO el rechazar lahipótesis nula planteada por el test de Goldfeld y Quandt? (10 puntos)Respuesta. Frente a la presencia de errores heteroscedásticos, el estimadorMCO es insesgado y consistente, sin embargo, ya no es el más eficiente. Eneste contexto habría que aplicar el método de mínimos cuadrados general-izados (MCG) si es que se quisiera estimar utilizando las dos muestras enconjunto.

2

Page 116: Magno Econometría

Departamento de Economıa Universidad de Chile

STA300Econometrıa I

Profesores: Tomas Rau y Javiera Vasquez.Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda.

Otono 2008, Pauta Control 5

1. Suponga el siguiente modelo con una variables explicativa x1 mas una constante:

y = α+ x1β + u

De esta forma la matriz X es de la siguiente forma:

X =

1 x11

1 x12

1 x13

......

1 x1n

Muestre que el estimador de β obtenido a traves de la regresion particionada equivale al estimadordel modelo original en desvıos con respecto a la media.

Respuesta

y = Xβ + u Donde X = [i x1]

Donde i es un vector de dimension n de unos. El estimador particionado de β es

β = (x′1Mx1)−1 (x′1My)

Donde

M = I − i(i′i)−1i′

Es facil ver que i′i = n y que

ii′ =

1 1 · · · 11 1 · · · 1...

.... . . 1

1 1 · · · 1

n×n

Lo anterior implica:

i(i′i)−1i′ =

1n

1n · · · 1

n1n

1n · · · 1

n...

.... . . 1

n1n

1n · · · 1

n

n×n

Por lo tanto la matriz M corresponde a la matriz de desviaciones con respecto a la media.

1

Page 117: Magno Econometría

Departamento de Economıa Universidad de Chile

2. La omision de variables relevantes siempre sobreestima el verdadero valor del parametro y suvarianza. Comente.

RespuestaFalso, la omision de variables relevantes no genera problemas de eficiencia, al contrario, la varianza esmenor, pero sı genera problemas de sesgo, el cual depende de dos cosas:

i) La covarianza entre la variable omitida y la incluıda.

ii) Signo del parametro poblacional de la variable omitida.

Vemos que se estarıa sobreestimando si ambos son positivos o negativos y subestimando si es queexiste diferencia en el signo de estos elementos.

2

Page 118: Magno Econometría

CCOONNTTRROOLLEESS 66

Page 119: Magno Econometría

Econometría IProfesores: J.M. Benavente, A. Otero y J. Vásquez.

Primavera 2004

Control 6

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultasa los ayudantes, no puedo tener nada más que lápiz en su escritorio, si contestacon lápiz mina no tiene derecho a reclamo. Contestar sólo en el espacio disponible

Pregunta 1: (30 puntos)Si existe Heterocedasticidad en los errores, el estimadorMínimos Cuadrados Ordinarios será sesgado, sin embargo, cuando existe auto-correlación en los errores no se produce sesgo en los parámetros estimados. (Co-mente).

Falso, ambos problemas Heterocedasticidad y Autocorrelación no generan prob-lemas en la propiedad de insesgamiento de los parámetros estimados por MCO,ya que el supuesto de que E(u) = 0 no se ha quebrado. Ambos problemas generanproblemas de eficiencia en la estimación por MCO.

Pregunta 2: (70 puntos)

Dado el modelo de regresión yi = α + εi, donde E(εi) = 0, V (εi) = σ2εx

2i .

(a) Encuentre el estimador MELI de α.

El estimador eficiente de α es el estimador MCG (ya que conozco la matriz Ω oel patrón de Heterocedasticidad.

Ω =

x21 · · · 0 00 x2

2 · · · 0... . . . ...

...0 · · · 0 x2

n

(1)

1

Page 120: Magno Econometría

De esta forma Ω−1 es:

Ω−1 =

1x21· · · 0 0

0 1x22

· · · 0... . . . ...

...0 · · · 0 1

x2n

(2)

Además como nuestro modelo incluye como variable explicativa sólo la constante,nuestra matriz X es:

X =

11...1

(3)

De esta forma:

X ′Ω−1X =[

1 · · · 1 1]

1x21· · · 0 0

0 1x22

· · · 0... . . . ...

...0 · · · 0 1

x2n

11...1

=

T∑t=1

1

x2t

(4)

X ′Ω−1Y =[

1 · · · 1 1]

1x21· · · 0 0

0 1x22

· · · 0... . . . ...

...0 · · · 0 1

x2n

y1

y2...

yT

=

T∑t=1

yt

x2t

(5)

⇒ αMCG = (X ′Ω−1X)−1(X ′Ω−1Y ) =

∑Tt=1

yt

x2t∑T

t=11x2

t

(b) Encuentre el estimador de la varianza de α.

El estimador de la varianza de α es:

V (αMCG) = σ2ε(X

′Ω−1X)−1 =σ2

ε∑Tt=1

1x2

t

2

Page 121: Magno Econometría

Econometría IProfesores: A. Otero y J. Vásquez.

Otoño 2005

Pauta Control 6

Pregunta 1: (30 puntos) El estimador consistente de Newey and West es el más eficiente den-tro de los estimadores lineales cuando existe autocorrelación.

Falso, cuando tenemos problemas de autocorrelación el estimador MCO deja de ser eficien-te, su varianza es igual a σ2(X ′X)−1X ′ΩX(X ′X)−1> σ2(X ′X)−1. El estimador de Newey andWest nos permite estimar consistentemente esta varianza, la cual sigue siendo ineficiente.

Pregunta 2: (70 puntos) Considere el Modelo: yt = βxt+ut, donde E(ut) = 0, V (ut) = k(βxt)2

y Cov(ut, us) = 0 ∀t 6= s. Además dispone de 5 observaciones de la variable dependiente y dela variable explicativa:

yt xt

2 13 210 41 13 1

Encuentre el estimador eficiente de β y de su varianza.

Este modelo no tiene problemas de autocorrelación, pero si de heterocedasticidad, ya que lavarianza del error cambia para para observación t. De esta forma, el estimador eficiente es el deMCG que consiste en transformar el modelo original dividiendo cada observación de la variabledependiente y explicativas por la desviación estándar del error asociado a esta observación, unavez transformado el modelo se estima por MCO.

La variables yt y xt transformadas son:

y∗t =yt

σt=

yt√kβ2x2

t

=yt

βxt

√k

x∗t =xt

σt=

xt√kβ2x2

t

=1

β√

k

(10 puntos)

El método eficiente de MCG consiste en estimar por MCO el modelo: y∗t = βx∗t + u∗t , don-de u∗t

iid∼ (0, σ2):

1

Page 122: Magno Econometría

βMCG =∑T

t=1 y∗t x∗t∑Tt=1(x

∗t )2

=

∑Tt=1

yt

βxt

√k· 1

β√

k

∑Tt=1

(1

β√

k

)2

=1

β2k

∑Tt=1

yt

xt

Tβ2k

βMCG =

∑Tt=1

yt

xt

T

Reemplazando los valores de las 5 observaciones que se dispone:

βMCG =21 + 3

2 + 104 + 1

1 + 31

5

=2 + 1,5 + 2,5 + 1 + 3

5=

105

= 2

(40 puntos)

La varianza del estimador MCG es:

V (βMCG) = σ2(X ′Ω−1X)−1 o V (βMCG) = (X∗′X∗)−1

Por lo tanto:

V (βMCG) =1∑T

t=1(x∗t )2

=1

∑Tt=1

(1

β√

k

)2

=1T

β2k

V (βMCG) =β2k

T=

β2k

10

(20 puntos)

2

Page 123: Magno Econometría

EconometríaFacultad de Ciencias Económicas y Administrativas

Universidad de Chile

Control 6

Semestre: Primavera 2005Profesores: Emerson Melo, Rodrigo Montero y Jaime Ruiz-Tagle

Rut: .......................................

Tiempo de duración: 30 minutos

No hay preguntas de ningún tipo para los ayudantes.

Un investigador quiere estimar la siguiente relación:

Si = α + βSPi + µi (1)

donde Si representa los años de escolaridad del individuo i, SPi representan los

años de escolaridad (promedio) de los padres del individuo i, y µi es un término

de error bien comportado. En otras palabras, se está modelando el impacto que

tiene la escolaridad de los padres sobre los niveles de escolaridad de sus hijos. Sin

embargo, este investigador ha olvidado incluir la habilidad de los hijos como un

determinante clave de su escolaridad. En realidad, la verdadera relación existente

entre la escolaridad de los hijos y la de sus padres debería ser estimada a través

de la siguiente ecuación:

Si = α + βSPi + γHi + µi (2)

1. Demuestre que al estimar β a partir de la ecuación (1) se incurre en un

sesgo.

1

Page 124: Magno Econometría

Respuesta. El estimador de mínimos cuadrados ordinarios (MCO) de β

viene dado por:

β =

∑Ni=1 sP

i si∑Ni=1(s

Pi )2

donde la variable en minúsculas denota que se encuentra en desviación re-

specto de su media. Por otro lado, la ecuación (2) en desvíos respecto de la

media viene dada por:

si = βsPi + γhi + µi

Reemplazando si en la fórmula de la estimación de MCO, se tiene lo sigu-

iente:

β =

∑Ni=1 sP

i (βsPi + γhi + µi)∑N

i=1(sPi )2

finalmente:

β = β + γ

∑Ni=1 sP

i hi∑Ni=1(s

Pi )2

+

∑Ni=1 sP

i µi∑Ni=1(s

Pi )2

Aplicando esperanza a la expresión anterior:

E(β) = β + γCov(SP

i , Hi)

V ar(SPi )

Por lo tanto, al estimar β a través de (1) se incurre en un sesgo, el cual

viene dado por:

E(β)− β = γCov(SP

i , Hi)

V ar(SPi )

2. ¿De qué depende el sesgo de la estimación?

Respuesta. Como puede apreciarse del resultado anterior, el sesgo depende

de dos elementos:

a) (γ) El efecto que tiene la variable omitida, habilidad, sobre la variable

dependiente del modelo (escolaridad)

b) (Cov(SPi , Hi) La relación que existe entre la variable omitida, habil-

idad, y la variable explicativa incluida en la estimación del modelo

(escolaridad de los padres)

2

Page 125: Magno Econometría

3. ¿Es posible especular respecto de la dirección de este sesgo?

Respuesta. Por supuesto que sí. En primer lugar, es muy posible que el

efecto que tiene la habilidad sobre la escolaridad de las personas sea positivo

(γ), ya que personas más hábiles debieran alcanzar, en promedio, mayores

niveles educativos. Por otro lado, es también bastante probable que padres

con mayor escolaridad tengan a su vez hijos con mayor habilidad (hay un

mayor estímulo, y además, es probable que exista una correlación positiva

entre habilidades intergeneracionales). Por lo tanto, es muy probable que el

estimador MCO esté sesgado hacia arriba.

4. Suponga que dispone de los siguientes datos:

Escolaridad (S) Escolaridad de los padres (SP ) Habilidad (H)

0 1 2

2 1 2

4 5 3

7 3 5

9 12 4

11 12 7

16 14 9

17 9 10

21 20 10

Si usted omite la variable habilidad en su estimación, ¿cuál es el coeficiente

estimado para β?

Respuesta. El estimador MCO viene dado por:

β =

∑Ni=1 sP

i si∑Ni=1(s

Pi )2

=Cov(Si, S

Pi )

V ar(SPi )

=41, 95

42, 77= 0, 9808

5. Si ahora incluyera la variable habilidad en la estimación, ¿cómo esperaría

usted que fuera el coeficiente estimado para β? Justifique (5 puntos)

Respuesta. De acuerdo a lo señalado en (3) lo más probable es que el

estimador esté sesgado hacia arriba, por lo que se esperaría que la nueva

3

Page 126: Magno Econometría

estimación arrojara un coeficiente menor que el encontrado anteriormente.

Para poder justificar esto con la información que se dispone habría que

asumir que el efecto que tiene la habilidad sobre la escolaridad de las per-

sonas es positivo (γ > 0), supuesto que no es fuerte. Por otro lado, habría

que pronunciarse respecto de la relación existente entre la habilidad (H) y

la escolaridad de los padres (SPi ). Sin embargo, esto es posible de saber a

partir de los datos. En efecto:

Cov(SPi , Hi) = 41, 95

Con estos dos elementos, se concluye que el sesgo de la estimación sería

postivo.

4

Page 127: Magno Econometría

Econometría IProfesoras: Claudia Sanhueza

Javiera Vásquez.Otoño 2006

Control 6

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayu-dantes, no puedo tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tienederecho a reclamo. Contestar sólo en el espacio disponible

Pregunta 1: (30 puntos) La existencia de una tendencia creciente en la variable dependienteque no es considerada en modelo implica una sobrestimación del verdadero valor del parámetro.Comente.

La mayoría de las variables económicas tienen una tendencia, generalmente creciente. Si elconjunto de variables explicativas no explican adecuadamente este comportamiento, entonces eltérmino de error incorporará dicha tendencia, lo que conduce a la existencia de autocorrelaciónpositiva. Con rachas de residuos por sobre la media y luego bajo la media.

X

XXXX

XX

XXX

X

XX X

XXXXX

XX

X

Modeloverdadero

Modeloestimado

Autocorrelación producida por una tendencia

Pregunta 2: (70 puntos) Suponga el siguiente modelo de regresión: yt = βxt + ut con t=1,2 y3 (sólo 3 observaciones), además ut sigue un proceso autorregresivo de segundo orden AR(2):

ut = 0,1ut−1 + 0,5ut−2 + εt

Encuentre la matriz de varianzas y covarianzas del error. Disponemos de 3 observaciones, porlo tanto la matriz de varianzas y covarianzas del error sera de la siguiente forma:

E[uu′] = σ2Ω =

σ2 σ12 σ13

σ21 σ2 σ23

σ31 σ32 σ2

1

Page 128: Magno Econometría

De esta forma, necesitamos computar la varianza homocedástica del error, y dos covarianzas:σ1, que es la covarianza entre dos términos de error distanciados u periodo y σ2 que es la co-varianza entre dos errores distanciados dos periodos.

El término de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2:

ut = ρ1ut−1 + ρ2ut−2 + εt ρ1 = 0,1, ρ2 = 0,5

Primero computamos la varianza del error (σ2):

σ2 = E[u2t ] = E[ρ2

1u2t−1 + 2ρ1ρ2ut−1ut−2 + ρ2

2ut−2 + 2ρ1ut−1εt + 2ρ2ut−2εt + ε2t ]

⇒ σ2 = ρ21σ

2 + ρ22σ

2 + 2ρ1ρ2σ1 + σ2ε

⇒ σ2 =2ρ1ρ2

1− ρ21 − ρ2

2

· σ1 +σ2

ε

1− ρ21 − ρ2

2

=2 · 0,1 · 0,5

1− (0,1)2 − (0,5)2· σ1 +

σ2ε

1− (0,1)2 − (0,5)2

⇒ σ2 =0,10,64

· σ1 +σ2

ε

0,64(1)

Ahora calculemos la covarianza de primer orden (errores distanciados un periodo (σ1):

σ1 = E[utut−1] = E[(ρ1ut−1 + ρ2ut−2 + εt)ut−1]= ρ1σ

2 + ρ2σ1

⇒ σ1 =ρ1

1− ρ2· σ2 =

0,10,5

σ2 = 0,2σ2 (2)

Reemplazando (2) en (1):

σ2 =0,10,64

· 0,2σ2 +σ2

ε

0,64(1− 0,02

0,64

)σ2 =

σ2ε

0,64

⇒ σ2 =σ2

ε

0,62(3)

Reemplazando (3) en (2):

σ1 =0,20,62

· σ2ε (4)

Por último, calculemos la covarianza de segundo orden:

σ2 = E[utut−2] = E[(ρ1ut−1 + ρ2ut−2 + εt)ut−2]= ρ1σ1 + ρ2σ

2

σ2 = 0,1 · 0,20,62

· σ2ε + 0,5 · σ2

ε

0,62

⇒ σ2 =0,520,62

· σ2ε (5)

Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error:

E[uu′] =

σ2ε

0,620,20,62 · σ2

ε0,520,62 · σ2

ε

0,20,62 · σ2

εσ2

ε

0,620,20,62 · σ2

ε

0,520,62 · σ2

ε0,20,62 · σ2

εσ2

ε

0,62

=

σ2ε

0,62

1 0,2 0,520,2 1 0,20,52 0,2 1

2

Page 129: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Control 6

Semestre: Primavera 2006Profesores: José Miguel Benavente, Rodrigo MonteroTiempo de duración: 20 minutosNo hay preguntas de ningún tipo para los ayudantes

Comente (6 puntos)

En un proceso autoregresivo de primer orden, la estimación (MCO) de la pendi-

ente será inconsistente.

Respuesta. Falso. En un proceso AR(1), la pendiente se estima de la siguiente

manera (suponga que la ecuación a estimar incluye un intercepto):

β =

∑Tt=2 ytyt−1∑Tt=2 y2

t−1

= β +

∑Tt=2 yt−1ut∑Tt=2 y2

t−1

Aplicando esperanza:

E(β) = β + E

[∑Tt=2 yt−1ut∑Tt=2 y2

t−1

]El insesgamiento se cumplirá en la medida que el segundo término del lado dere-

cho sea cero. Es posible demostrar que el sesgo es igual a -(1 + 3β)/T . Por lo

tanto, el sesgo desaparece a medida que crece T , es decir, el estimador de MCO

es consistente.

Ejercicio (14 puntos)

Considere el siguiente modelo:

Yi = α + βXi + ui

1

Page 130: Magno Econometría

Existen sospechas de que la varianza del término de error para las primeras 22

observaciones (σ21) no es la misma que para las restantes 32 observaciones (σ2

2).

De hecho, para las primeras 22 observaciones (aquellas con los Xi más bajos), los

datos producen los siguientes resultados (expresados en desviaciones respecto a

la media):∑

xy = 100,∑

x2 = 10 y∑

y2 = 1040. Para el siguiente grupo de

observaciones (32), los resultados son:∑

xy = 216,∑

x2 = 16 y∑

y2 = 3156.

En base a esta información responda lo siguiente:

1. Realice un test de Goldfeld-Quandt al 5 % para determinar si las varianzas

son las mismas para ambos grupos de observaciones. (Ayuda: (1) Para im-

plementar el test no debe omitir observaciones. Trabaje directamente con

ambos grupos de datos; (2) Asuma que el F crítico es de 2,04.) (8 puntos)

Respuesta. El modelo, en desvíos respecto a la media es el siguiente:

yi = βxi + ui

Por lo tanto, la suma de cuadrados de la regresión (ESS) es igual a β2x2i .

De esta manera, para el primer grupo de observaciones se tiene lo siguiente:

ESS1 = β2x2i =

(∑xy∑x2

)2

x2i = 1000

Por lo tanto, la suma de los errores al cuadrado (RSS1) es:

RSS1 =∑

y2 − ESS1 = 40

Para el segundo grupo de observaciones se tiene lo siguiente:

ESS2 = β2x2i =

(∑xy∑x2

)2

x2i = 2916

Por lo tanto, la suma de los errores al cuadrado (RSS2) es:

RSS2 =∑

y2 − ESS2 = 240

2

Page 131: Magno Econometría

Luego, es estadístico de Goldfeld-Quandt es el siguiente:

u′2u2

u′1u1

∼ Fm,m

con m = (22 + 32− 0)/2− 2 = 25. Por lo tanto, dado que:

240

40= 6 > 2, 04

se rechaza la hipótesis nula de homoscedasticidad.

2. Asumiendo que la varianza del término de error difiere en ambos grupos

(σ21 6= σ2

2), ¿cómo obtendría el estimador de mínimos cuadrados factibles

(βMCF )? (6 puntos)

Respuesta. De acuerdo a lo encontrado en el apartado anterior, las var-

ianzas de ambos grupos efectivamente difieren. Para estimar por MCF se

requiere contar con una estimación para la matriz de varianzas y covarian-

zas. Para el primer grupo se tiene lo siguiente:

σ21 =

u′1u1

n1 − k=

40

20= 2

Y para el segundo grupo:

σ22 =

u′2u2

n2 − k=

240

30= 8

Por lo tanto:

σ21 =

1

4σ2

2

Una opción entonces es corregir los datos del primer modelo, de manera

de hacer homogéneas las varianzas. Para ello, se debe premultiplicar por la

matriz P . Se sabe que:

P ′P = Ω−1

3

Page 132: Magno Econometría

Dado que Ω es una matriz diagonal con 1/4 en su diagonal, entonces, se

cumple lo siguiente:2 0 · · · 0

0 2 · · · 0...

... . . . ...

0 0 · · · 2

′ 2 0 · · · 0

0 2 · · · 0...

... . . . ...

0 0 · · · 2

=

4 0 · · · 0

0 4 · · · 0...

... . . . ...

0 0 · · · 4

Luego:

Y ∗ = α + βX∗ + u∗

donde Y ∗ = 2Y , y así respectivamente para las otras variables. Por lo tanto,

para el primer grupo de observaciones, ahora se tiene que∑

xy = 400 y∑x2 = 40. El estimador MCF de β será:

β =400 + 216

40 + 16= 11

3. ¿Cómo se estimaría la varianza del estimador de mínimos cuadrados ordi-

narios, V ar(βMCO), si la varianza del término de error difiere entre los dos

períodos? (6 puntos)

Respuesta. La estimación de la varianza de ˆbetaMCO

viene dada por la

siguiente expresión:

var( ˆbeta) = (X ′X)−1X ′WX(X ′X)−1

donde la matriz W es una diagonal con 22 dos (2’s), seguidos de 32 ochos

(8’s). Por lo tanto:

var( ˆbeta) =1

(10 + 16)(2 · 10 + 8 · 16)

1

(10 + 16)= 0, 22

4

Page 133: Magno Econometría

Econometría IProfesores: J.M. Benavente, A. Otero y J. Vásquez.

Primavera 2004

Control 7

Nombre: ..........................................................................................

Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes,no puede usar calculadora, no puedo tener nada más que lápiz en su escritorio, si contesta conlápiz mina no tiene derecho a reclamo. Contestar sólo en el espacio disponible

Pregunta 1: (30 puntos) Si existe Heterocedasticidad en los errores, el estimador MínimosCuadrados Ordinarios será insesgado, sin embargo, cuando existe autocorrelación en los erroresse produce sesgo en los parámetros estimados. (Comente).

Falso, ambos problemas Heterocedasticidad y Autocorrelación no generan problemas en la pro-piedad de insesgamiento de los parámetros estimados por MCO, ya que el supuesto de queE(u) = 0 no se ha quebrado. Ambos problemas generan problemas de eficiencia en la estima-ción por MCO.

Pregunta 2: (70 puntos)

Suponga que en el siguiente modelo de regresión: yt = βxt + ut con t=1,2,3 (sólo 3 obser-vaciones en la muestra), ut sigue un proceso autorregresivo de segundo orden AR(2):

ut = 0,1ut−1 + 0,5ut−2 + εt

Encuentre la matriz de varianzas y covarianzas del error (u).

Disponemos de 3 observaciones, por lo tanto la matriz de varianzas y covarianzas del errorsera de la siguiente forma:

E[uu′] = σ2Ω =

σ2 σ12 σ13

σ21 σ2 σ23

σ31 σ32 σ2

De esta forma, necesitamos computar la varianza homocedástica del error, y dos covarianzas:σ1, que es la covarianza entre dos términos de error distanciados u periodo y σ2 que es la cova-rianza entre dos errores distanciados dos periodos.

El término de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2:

ut = ρ1ut−1 + ρ2ut−2 + εt ρ1 = 0,1, ρ2 = 0,5

1

Page 134: Magno Econometría

Primero computamos la varianza del error (σ2):

σ2 = E[u2t ] = E[ρ2

1u2t−1 + 2ρ1ρ2ut−1ut−2 + ρ2

2ut−2 + 2ρ1ut−1εt + 2ρ2ut−2εt + ε2t ]

⇒ σ2 = ρ21σ

2 + ρ22σ

2 + 2ρ1ρ2σ1 + σ2ε

⇒ σ2 =2ρ1ρ2

1− ρ21 − ρ2

2

· σ1 +σ2

ε

1− ρ21 − ρ2

2

=2 · 0,1 · 0,5

1− (0,1)2 − (0,5)2· σ1 +

σ2ε

1− (0,1)2 − (0,5)2

⇒ σ2 =0,10,64

· σ1 +σ2

ε

0,64(1)

Ahora calculemos la covarianza de primer orden (errores distanciados un periodo (σ1):

σ1 = E[utut−1] = E[(ρ1ut−1 + ρ2ut−2 + εt)ut−1]= ρ1σ

2 + ρ2σ1

⇒ σ1 =ρ1

1− ρ2· σ2 =

0,10,5

σ2 = 0,2σ2 (2)

Reemplazando (2) en (1):

σ2 =0,10,64

· 0,2σ2 +σ2

ε

0,64(1− 0,02

0,64

)σ2 =

σ2ε

0,64

⇒ σ2 =σ2

ε

0,62(3)

Reemplazando (3) en (2):

σ1 =0,20,62

· σ2ε (4)

Por último, calculemos la covarianza de segundo orden:

σ2 = E[utut−2] = E[(ρ1ut−1 + ρ2ut−2 + εt)ut−2]= ρ1σ1 + ρ2σ

2

σ2 = 0,1 · 0,20,62

· σ2ε + 0,5 · σ2

ε

0,62

⇒ σ2 =0,520,62

· σ2ε (5)

Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error:

E[uu′] =

σ2ε

0,620,20,62 · σ2

ε0,520,62 · σ2

ε

0,20,62 · σ2

εσ2

ε

0,620,20,62 · σ2

ε

0,520,62 · σ2

ε0,20,62 · σ2

εσ2

ε

0,62

=

σ2ε

0,62

1 0,2 0,520,2 1 0,20,52 0,2 1

2

Page 135: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Pauta Control Recuperativo

Pregunta 1: (30 puntos) Si la variable dependiente se encuentra medida con error, el estima-dor MCO subestima el valor poblacional de los parámetros. Sin embargo, si la(s) variable(s)explicativa(s) esta(n) medida(s) con error, el estimador MCO sobreestima el valor poblacionalde los parámetros. Comente.

Falso, si sólo la variable dependiente esta medida con error, los supuestos para que MCO seainsesgado no se ven afectados. Sin embargo, si la variable explicativa esta medida con error,se rompe el supuesto cov(ut, xt) = 0, el estimador MCO es sesgado hacia el origen, siempresubestima el verdadero valor del parámetro.

Pregunta 2: (70 puntos) Dado el siguiente modelo:

yt = β0 + β1xt + ut

ut = ρut−1 + εt

donde εtiid∼ N(0, σ2

ε). Además dispone de las siguientes observaciones:

t 1 2 3 4 5 6 7 8yt 22 26 32 34 40 46 46 50xt 4 6 10 12 14 16 20 22

Obtenga una estimación eficiente de los parámetros β0 y β1, sabiendo que ρ = 0,5.

R:

Para estimar eficiente el modelo debemos utilizar el método de Mínimos Cuadrados Gene-ralizados, que consiste en transformar el modelo original de forma tal que el error este libre deautocorrelación, como en este caso el error sigue un procedimiento AR(1) se debe transformarde la siguiente forma la variable dependiente y explicativa del modelo:

y∗t = yt − 0,5yt−1

x∗t = xt − 0,5xt−1

De esta forma, se tienen los siguientes datos transformados:

t yt xt y∗t x∗t x∗y∗ x∗21 22 42 26 6 15 4 60 163 32 10 19 7 133 494 34 12 18 7 126 495 40 14 23 8 184 646 46 16 26 9 234 817 46 20 23 12 276 1448 50 22 27 12 324 144

Suma 151 59 1337 547

1

Page 136: Magno Econometría

El estimador MCG consiste en estimar por MCO el modelo transformado:

y∗t = β0(1− ρ)︸ ︷︷ ︸α

+β1x∗t + εt

Así, el estimador MCG de los parámetros es:

βMCG = (X∗′X∗)−1X∗′Y ∗

X∗′X∗ =[

n∑8

t=2 x∗t∑8t=2 x∗t

∑8t=2 x∗2t

]=

[7 5959 547

]

X∗′Y ∗ =[ ∑8

t=2 y∗t∑8t=2 y∗t x∗t

]=

[1511337

]

⇒ βMCG =[

α

β1

]=

[7 5959 547

]−1 [1511337

]

⇒ βMCG =[

10,672413791,293103448

]

Debemos recuperar β0 de la siguiente forma:

α = β0(1− ρ)

⇒ β0 =α

(1− ρ)

β0 =10,67241379

0,5= 21,34482759

De esta forma, los estimadores eficientes de β0 y β1 son 1.29 y 21.35, respectivamente.

2

Page 137: Magno Econometría

SSOOLLEEMMNNEESS

Page 138: Magno Econometría

Solemne Econometría IProfesores: J.M. Benavente, A. Otero y J. Vásquez.

Primavera 2004

Nombre: ...........................................................................................

Rut: .......................................

Ud. Dispone de 120 minutos para resolver la Solemne, no puede hacer consultas alos ayudantes, sólo lápiz y calculadora sobre su escritorio, si contesta con lápiz mina notiene derecho a reclamo. Contestar sólo en el espacio disponible.

I. Comentes: De los siguientes 7 comentes Ud. debe elegir solo 4 deellos. Cada comente tiene 10 puntos asignados.

Comente 1: En el modelo de regresión lineal siempre se cumple que la∑n

i=1 ui = 0.

Repuesta:

Falso, esto sólo se cumple cuando el modelo incluye constante.Recordemos la CPOde MCO: X ′Xβ = X ′Y , donde el primer elemento de este vector de dimensión Kx1 es:∑

(β1 + β2x2 + ...+ βkxk) =∑

y ⇒ ∑(y− β1− β2x2− ...− βkxk) = 0 ⇒ ∑

u = 0. Si eltérmino constante no se incluye, esta primera CPO no existe. Recuerde que la constanteajusta la regresión de manera tal que se cumpla que ¯

Y = Y , si ésta no se incluye no segarantiza tal igualdad, como tampoco que

∑u = 0.

Comente 2: Suponga que la variable dependiente, pero no la independiente, esta ex-presada en desvíos con respecto a la media. ¿Qué implicancias tiene esto sobre el posiblesesgo de la estimación por MCO?

Repuesta:

No hay implicacias en el insesgamiento de β en un modelo del tipo y = α+xβ +u. Peroal estar y en devios respecto a su media, el modelo puede ser expresado de la siguientemanera: y−θ = α−θ+xβ +u, donde la constante que estimemos no será la misma queen un modelo donde y no esté en desvios con respecto a su media, está nueva constanteserá tal que ajuste la nueva escala de y (en desvios con respecto a la media) de maneraque ¯y = y. Por lo tanto la constante será sesgada.

Page 139: Magno Econometría

NO ESCRIBIR EN ESTA PÁGINA PORQUE NO SE VA A CORREGIR

Page 140: Magno Econometría

Comente 3: Los Experimentos de Montecarlo no son un ejercicio muy útil, porquedebemos conocer los verdaderos valores de los parámetros.

Repuesta:

Falso, son un ejercicio muy útil. Por lo demás, no se requiere el conocimiento de losverdaderos parámetros, ya que en este tipo de ejercicios uno es el "Dios", por lo tanto,uno determina cómo se generan las y, yo sé exactamente cual es su estructura y yo gen-ero la muestra de variables dependientes. Luego esto me permite ver el comportamientode los parámetros estimados, cuando, por ejemplo, se invalida algún supuesto de MCO,ya que conozco (yo lo impuse) los verdaderos parámetros.

Comente 4: Si estimo un modelo de regresión donde las ingresos son la variable depen-diente y la escolaridad la variable explicativa, debería obtener el mismo valor para elparámetro β si es que estimo un modelo de regresión donde la escolaridad es la variabledependiente y los ingresos la variable explicativa, ya que el análisis de regresión midesimplemente la relación estadística entre las variables.

Repuesta:

Falso, en un análisis de correlación da lo mismo la causalidad, en tal caso ambas vari-ables son tratadas en forma simétrica. Sin embargo, en el análisis de regresión se estudiael valor de Y (dependiente) condicional al valor de X (explicativa). Para una estimacióndel tipo y = α + xβ, no hay razones para pensar que un año adicional de educacióntiene el mismo impacto sobre el ingreso promedio, que el que tiene un peso adicional deingreso sobre el promedio de educación. β mide el impacto de un aumento unitario dex sobre el promedio de y.

Page 141: Magno Econometría

NO ESCRIBIR EN ESTA PÁGINA PORQUE NO SE VA A CORREGIR

Page 142: Magno Econometría

Comente 5: Si el tamaño de la muestra aumenta, el R2 debe disminuir.

Repuesta:

El comente es verdadero ya que el R2 no tiene corrección por los grados de libertad.Una regresión con N variables explicativas ajustan perfectamente a la muestra de Nobservaciones. A medida que el número de observaciones aumenta el ajuste se deterioraya que el perfecto ajuste de las N primeras observaciones tienen una influencia cada vezmenor en el ajuste de toda la muestra. Por ejemplo, dado el modelo: y = α+βx+u condos observaciones el ajuste es perfecto (una recta que une los dos puntos), si aumentoa tres el número de observaciones el ajuste (medido por el R2) va disminuyendo.

Comente 6: Si los errores del modelo de regresión lineal no tienen distribución normal,a pesar de que los estimadores MCO ya no son MELI, siguen siendo insesgados.

Repuesta:

El comente es falso ya que el resultado de que los estimadores por MCO son MELI norequiere que los errores se distribuyan normal. En efecto tal propiedad requiere que loserrores cumplan la siguiente condición: E(ui) = 0 ∀i, V ar(ui) = σ2I ∀i y Cov(uiuj) = 0∀i 6= j, es decir, que los errores ui ∼ iid sean independientes e idénticamente distribui-dos.

Page 143: Magno Econometría

Comente 7: El coeficiente de determinación (R2) siempre es positivo y menor a uno.Comente

Repuesta:

La no negatividad del R2, tal como la expresión ST = SE + SR, son válidas cuan-do existe término constante en el modelo. Cuando no se incluye constante el R2 puedetomar cualquier valor, siempre menor o igual a uno, pero incluyendo todos los realesnegativos.

Page 144: Magno Econometría

II. Preguntas Teóricas: De las siguientes 3 preguntas Ud. debe elegirsólo 2 de ellas. Cada pregunta tiene 20 puntos asignados.

Pregunta 1: Considere el siguiente modelo de regresión lineal:

Yi = β1 + ui, E(ui) = 0, E(u2i ) = σ2

u y E(uiuj) = 0 ∀i 6= j

(i) Derive el estimador MCO de β1 y llámelo β. Encuentre la esperanza, varianza yerror cuadrático medio de este estimador.

(ii) Considere el siguientes estimador alternativo de β1:

β =nY

n + 1

donde n es el tamaño de la muestra y Y el promedio muestral de Y . Encuentre laesperanza, varianza y error cuadrático medio de este otro estimador.

(iii) ¿ Cúal de estos dos estimadores (β ó β) elegiría Ud. y bajo que criterio?.

Respuesta Pregunta 1:

(i) Yi = β1 + ui, tengo sólo una variable explicativa, la cual es igual a 1.

x = i donde i =

1...1

β = (X ′X)−1X ′Y ⇒ X ′X =(

1 . . . 1)

1...1

=∑n

i=1 1 = n (escalar)

X ′Y =(

1 . . . 1)

y1

.

.

.yn

=∑n

i=1 yi (escalar), β =∑

yi

n = y

E(β) = E(∑

yi

n

)= 1

n

∑E(yi) = 1

n

∑E(β1+ui) = 1

n

∑β1 = nβ1

n = β1 (insesgado)

V ar(β) = E(β − E(β))2 como E(β1) = β1 ⇒ V ar(β) = ECM(β)

Page 145: Magno Econometría

Continuación Respuesta Pregunta 1:

V ar(β) = E(β − E(β))2 = E(∑

yi

n − β1

)2= E

(∑(β1+ui)

n − β1

)2

= E(

nβ1

n +∑

ui

n − β1

)2= E

(∑ui

n

)2= E

((∑

ui)2

n2

)como ui son iid ⇒

E(∑

ui)2 =∑

E(ui)2 ya que E(uiuj ) = 0

⇒ V ar(β) = nE(u2i )

n2 = σ2un = ECM(β)

(8 puntos)

(ii) β = nYn+1 = n

∑y

nn+1 =

∑yi

n+1 ⇒ E(β) = E(∑

yi

n+1

)= 1

n+1

∑E(yi) = n

n+1β1

⇒ β es sesgado β1 − β1 = nβ1

n+1 − β1 = −β1

n+1

V ar(β) = E(∑

yi

n+1 − nn+1β1

)2= E

[1

n+1

∑(yi − β1)

]2= E

(1

n+1

∑ui

)2= 1

(n+1)2E(

∑ui)2

como ui son iid⇒ E(∑

ui)2 =∑

E(ui)2 = nσ2u (puesto que E(uiuj) = 0 ∀i 6= j)

⇒ V ar(β) = n(n+1)2

σ2u

ECM(β) = E(∑

yi

n+1 − β1

)2= E

(∑yi−nβ1−β1

n+1

)2= E

(−β1

n+1 +∑

ui

n+1

)2= 1

(n+1)2E(

∑ui−

2β1∑

ui + β21) = 1

(n+1)2(nσ2

u + β21) =

n

(n + 1)2σ2

u

︸ ︷︷ ︸varianza

+(

β1

n + 1

)2

︸ ︷︷ ︸sesgo2

(8 puntos)

(iii) Si interesa el insesgamiento como único criterio elegiría MCO. Sin embargo, si seelige el estimador más eficiente debería elegir β, ya que V ar(β) = n

(n+1)2σ2

u <

σ2un = V ar(β). Si elegimos por error cuadrático medio, tengo que para n < σ2

u

β21−2σ2

u

se cumple que ECM(β) < ECM(β).(4 puntos)

Page 146: Magno Econometría

Pregunta 2: Demuestre que el estimador insesgado de σ2u en un modelo de regresión

lineal con k variables explicativas es:

σ2u =

u′un− k

Respuesta Pregunta 2:

Primero, el vector de residuos estimados puede escribirse en función de los residuospoblacionales de la siguiente forma:

u = Mu

Donde M = In − X(X ′X)X ′, matriz de dimensión nxn idempotente y que satisfaceMX = 0

⇒ E(u′u) = E(u′M ′Mu) = E(u′Mu), por las características de la matriz M.Como u′Mu es un escalar ⇒ E(u′Mu) = E[Tr(u′Mu)]

Recordemos que la traza es un operador lineal y antes de introducir la esperanza pode-mos, por propiedades de la traza, cambiar el orden de las matrices.

E(u′Mu) = E[Tr(u′Mu) = E[tr(Muu′)] = Tr[E(Muu′)] = Tr[ME(uu′)] = Tr[Mσ2uIn] =

σ2uTr(M) = σ2

u[Tr(In)− Tr[X(X ′X)X ′])] = σ2u(n− k)

Por lo tanto como E(u′u) = σ2u(n − k) para que la suma de los errores al cuadrado

sea un estimador insesgado de σ2u debemos dividir por (n− k).

σ2u = u′u

n−k ⇒ E(σ2u) = E(u′u)

n−k = (n−k)σ2u

n−k = σ2u

(20 puntos)

Page 147: Magno Econometría

Continuación Respuesta Pregunta 2:

Page 148: Magno Econometría

Pregunta 3: En un modelo de regresión Y = Xβ + u, encuentre la varianza del errorde predicción cuando se predice el valor esperado de la variable dependiente.

Respuesta Pregunta 3:

Si se quiere predecir E(Y ) y no un valor puntual de Y, se define el error de predic-ción de la siguiente forma:

e0 = E(Y0)− E(Y0) = E(Y0)−X0β = X0β −X0β = X0(β − β)

Si se cumplen todos los supuestos bajo los cuales β es MELI ⇒ E(β) = β⇒ E(e0) = 0.

V ar(e0) = E[(e0 −E(e0))(e0 − E(e0))′] = E(e0e′0)

= E(X0(β − β)(β − β)′X ′0)

= X0E(β − β)(β − β)′X ′0

= X0V ar(βX ′0)

∴ V ar(e0) = σ2uX0(X ′X)−1X ′

0

(20 puntos)

Page 149: Magno Econometría

Continuación Respuesta Pregunta 3:

Page 150: Magno Econometría

III. Ejercicio Práctico: La siguiente pregunta es obligatoria. Estapregunta tiene 40 puntos asignados.

Considere el siguiente modelo de regresión lineal con 3 variables:

yi = β1 + β2x2,i + β3x3,i + ui

se dispone de la siguiente información:

X ′X =

33 0 00 40 200 20 60

X ′Y =

1322492

n∑

i=1

y2i = 678

n∑

i=1

(yi − Y )2 = 150

(i) ¿Cual es el tamaño de la muestra?.

(ii) Calcular la ecuación de regresión.

(iii) Contraste la hipótesis de que las dos pendientes suman uno.

(iv) Calcular la predicción para yf , dado x2,f = −4 y x3,f = 2. Obtener un intervalode confianza al 95% para dicha predicción, donde f denota predicho.

Respuesta Ejercicio Práctico:

(i) Como X ′X =

n∑

x2∑

x3∑x2

∑x2

2

∑x2x3∑

x3∑

x2x3∑

x23

y X ′Y =

∑y∑

yx2∑yx3

∴ el tamaño de la muestar es 33.(4 puntos)

(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectoscalculamos las medias de las variables:

X2 =∑

X2

n = 0 X3 =∑

X3

n = 0 Y =∑

yn = 132

33 = 4⇒ ∑

(X2 − X2) =∑

X2;∑

(X3 − X3) =∑

X3∑(X2 − X2)(Y − Y ) =

∑(Y − Y )X2 =

∑Y X2 − Y

∑X2 =

∑Y X2

Análogamente∑

(X3 − X3)(Y − Y ) =∑

Y X3

Por lo tanto, las submatrices de X ′X y X ′Y están en desviaciones con respecto ala media. De esta forma, el modelo en desvíos se expresa mediante las siguientesmatrices:

X ′X =(

40 2020 60

)y X ′Y =

(2492

)

Page 151: Magno Econometría

Continuación Respuesta Ejercicio Práctico:

(X ′X)−1 = 12400−400

(60 −20−20 40

)=

(0,03 −0,01−0,01 0,02

)

∴ β = (X ′X)−1X ′Y =(

0,03 −0,01−0,01 0,02

)(2492

)=

( −0,21,6

)

el parámetro constante se recupera de la siguiente forma:

β1 = Y − β2X2 − β3X3 = Y = 4

∴ β1 = 4 β2 = −0,2 β3 = 1,6

La recta de regresión queda: Y = 4− 0,2X2 + 1,6X3

(12 puntos)

(iii) H0 : β2 + β3 = 1

t = β2+β3−1√V ar(β2)+V ar(β3)+2Cov(β2,β3)

∼ t33−3=30

V ar(β) = σ2u(X ′X)−1 =

∑u2

n−k

u = Y −Xβ ⇒ (Y −Xβ)′(Y −Xβ) = Y ′Y − 2β′X ′Y + β′X ′Xβ

Como Y ′Y =∑

y2 = 678 β′X ′Y =(

4 −0,2 1,6)

1322492

= 670,4

y además β′X ′Xβ =(

4 −0,2 1,6)

33 0 00 40 200 20 60

4−0,21,6

= 670,4

⇒ u′u = 678− 2 ∗ 670,4 + 670,4 = 7,6 ⇒ σ2u = 7,6

30 ≈ 0,25

∴ ˜V ar( ˆ )β = 0,25

(0,03 −0,01−0,01 0,02

)=

(0,0076 −0,0025−0,0025 0,0051

)

t = −0,2+1,6−1√0,0076+0,0051−2∗0,0025

= 0,4√0,0076

Al 5% de significancia: t 0,052

,30 = t1− 0,052

,30 = t0,975,30 = 2,042

∴ como tc = 4,59 > 2,042 = ttabla ⇒ se rechazaH0 : β2 + β3 = 1 (12 puntos)

Page 152: Magno Econometría

Continuación Respuesta Ejercicio Práctico:

(iv) Yf = Xf β = 4− 0,2 ∗ (−4) + 1,6 + (2) = 8

Intervalo de confianza:

Pr(Yf − t0,975,30

√˜V ar(e0) < Yf < Yf + t0,975,30

√˜V ar(e0)) = 0,95

˜V ar(e0) = σ2u + σ2

u

(1 −4 2

)

133 0 00 0,03 −0,010 −0,01 0,02

1−42

= 0,25 + 0,25 ∗ 0,75 = 0,44 ⇒√

˜V ar(e0) = 0,66

Pr(6,65 < Yf < 9,35) = 0,95

(12 puntos)

Page 153: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Pauta Solemne

Comente 1: (10 puntos) En un modelo de regresión lineal simple (Yi = β1 + β2Xi + ui), sila variable independiente no varía, el estimador MCO β2 será igual al valor poblacional delparámetro (β2).

El estimador de β2 es un modelo de regresión simple es: β =∑

(Xi−X)(Yi−Y )∑(Xi−X)2

, si X (variable

independiente) no varía entonces cada observación Xi es igual a X, y por lo tanto, el estimadorMCO no esta definido. Recuerde que el estimador MCO requiere que las X ′s varíen (Supuesto8). De esta forma, el comente es falso.

Comente 2: (10 puntos) El estimador MCO es el Mejor Estimador Lineal Insesgado, bajoel supuesto de normalidad del término de error.

El Teorema de Gauss-Markov demuestre que MCO es el Mejor Estimador Lineal Insesgado(MELI), bajo los supuestos de independencia e idéntica distribución del término de error, in-dependiente de cual sea esa distribución. De esta forma, el comente es falso ya que para queMCO cumpla con la propiedad MELI se requiere solamente errores i.i.d.

Comente 3: (10 puntos) El análisis de regresión estudia el grado de asociación lineal entredos variable aleatorias.

Falso, el análisis de regresión si bien hace un estudio de dependencia entre dos variables, estese hace entre una variable aleatoria (variable dependiente) y una variable fija (variable inde-pendiente) y además no se ve el grado de asociación lineal entre ellas, sino se trata de predecirel valor esperado de la variable dependiente condicional a la variable independiente. Lo que semenciona en el comente es el análisis de correlación, algo completamente diferente al análisisde regresión.

Comente 4: (10 puntos) Si en el límite la varianza de un estimador tiende a cero a medi-da que el tamaño de la muestra crece, entonces dicho estimador es consistente.

Si un estimador β converge en media cuadrática a su valor poblacional β, este estimador esconsistente. Para que converger en media cuadrática, se tiene que cumplir que en el limite elerror cuadrático medio es cero, es decir, lımn→∞E[β−β]2 = 0. Sólo si el estimador es insesgadoconvergencia en media cuadrática es equivalente a decir que en el límite la varianza tienda acero. Entonces el comente es Falso, esto se cumple SOLO si el estimador es insesgado.

1

Page 154: Magno Econometría

Pregunta 1: (15 puntos) Encuentre la expresión para la suma total al cuadrado cuando elmodelo de regresión no incluye un término constante.

Respuesta Pregunta 1:

Recordemos que la variable y puede ser expresada en función de su valor estimado y del errorestimado:

y = y + u (1)

Si premultiplicamos la expresión anterior por y′, tenemos (ojo, NO hemos expresado el modeloen desvíos):

y′y = y′y + y′u (2)

Reemplazando (1) en (2), y utilizando la condición de ortogonalidad entre las X y u:

y′y = (y + u)′y + (y + u)′u (3)y′y = y′y + u′y︸︷︷︸

0

+ y′u︸︷︷︸0

+u′u (4)

N∑

i=1

Y 2i =

N∑

i=1

Y 2i +

N∑

i=1

u2i (5)

La suma total de los cuadrados (ST), la suma total explicada (SE) y la suma total de losresiduos (SR), se definen de la siguiente forma:

ST =N∑

i=1

(Yi − Y )2 =N∑

i=1

Y 2i −NY

2 ⇒N∑

i=1

Y 2i = ST + NY

2(6)

SE =N∑

i=1

(Yi − Y )2 =N∑

i=1

Yi −NY2

⇒N∑

i=1

Y 2i = SE + NY

2

(7)

SR =N∑

i=1

u2i (8)

Utilizando (6), (7) y (8) en (5):

ST + NY2

= SE + NY2

+ SR

⇒ ST = SE + SR + N

(Y

2

− Y2)

Esta expresión difiere de la vista en clases por el último término, pero si el modelo incluyeseconstante se garantiza que el promedio observado de la variable dependiente es igual al promedioestimado para esta variable, con lo cual el último término es igual a cero, y se tiene la expresióntípica de descomposición de varianza.

2

Page 155: Magno Econometría

Pregunta 2: (15 puntos) Demuestre que el R2 siempre es mayor o igual que el R2.

Respuesta Pregunta 2:

R2 = 1− u′uY ′MY

(9)

R2 = 1− u′u/(n− k)Y ′MY/(n− 1)

(10)

Lo que se puede expresar alternativamente como:

(1−R2) =u′u

Y ′MY(11)

(1− R2) =u′u/(n− k)

Y ′MY/(n− 1)(12)

Si k=1, de la expresión (12) tenemos que:

(1− R2) =u′u/(n− 1)

Y ′MY/(n− 1)=

u′uY ′MY

= (1−R2)

⇒ R2 = R2

Por otro lado, si k>1 tenemos que (n−1)(n−k) > 1:

(1− R2) =u′u/(n− k)

Y ′MY/(n− 1)=

u′uY ′MY︸ ︷︷ ︸(1−R2)

· (n− 1)(n− k)︸ ︷︷ ︸

>1

⇒ (1− R2) = (1−R2) · (> 1)⇒ (1− R2) > (1−R2)

⇒ R2 < R2

3

Page 156: Magno Econometría

Pregunta 3: (40 puntos) Considere el siguiente modelo de regresión lineal con 3 variables:

yi = β1 + β2x2,i + β3x3,i + ui

se dispone de la siguiente información:

X ′X =

33 0 00 40 200 20 60

X ′Y =

1322492

n∑

i=1

y2i = 678

n∑

i=1

(yi − Y )2 = 150

(i) (5 puntos) ¿Cual es el tamaño de la muestra?.

(ii) (15 puntos) Calcular la ecuación de regresión.

(iii) (10 puntos) Vea si los parámetros son estadísticamente significativos.

(iv) (10 puntos) Contraste la hipótesis de que las dos pendientes suman uno.

Respuesta Pregunta 3:

(i) Como X ′X =

n∑

x2

∑x3∑

x2

∑x2

2

∑x2x3∑

x3

∑x2x3

∑x2

3

y X ′Y =

∑y∑

yx2∑yx3

∴ el tamaño de la muestra es 33.

(5 puntos)

(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectos calcu-lamos las medias de las variables:

X2 =∑

X2

n= 0 X3 =

∑X3

n= 0 Y =

∑y

n=

13233

= 4

⇒∑

(X2 −X2) =∑

X2;∑

(X3 −X3) =∑

X3

∑(X2 −X2)(Y − Y ) =

∑(Y − Y )X2 =

∑Y X2 − Y

∑X2 =

∑Y X2

Análogamente∑

(X3 − X3)(Y − Y ) =∑

Y X3

Por lo tanto, las submatrices de X ′X y X ′Y están en desviaciones con respecto a lamedia. De esta forma, el modelo en desvíos se expresa mediante las siguientes matrices:

X ′X =(

40 2020 60

)y X ′Y =

(2492

)

4

Page 157: Magno Econometría

Continuación Respuesta Pregunta 3:

(X ′X)−1 =1

2400− 400

(60 −20−20 40

)=

(0,03 −0,01−0,01 0,02

)

∴ β = (X ′X)−1X ′Y =(

0,03 −0,01−0,01 0,02

)(2492

)=

( −0,21,6

)

El parámetro constante se recupera de la siguiente forma:

β1 = Y − β2X2 − β3X3 = Y = 4

∴ β1 = 4 β2 = −0,2 β3 = 1,6

La recta de regresión queda: Y = 4− 0,2X2 + 1,6X3

(15 puntos)

(iii)

V ar(β) = σ2u(X ′X)−1 =

∑u2

n− k

u = Y −Xβ ⇒ (Y −Xβ)′(Y −Xβ) = Y ′Y − 2β′X ′Y + β′X ′Xβ

Como

Y ′Y =∑

y2 = 678 β′X ′Y =(

4 −0,2 1,6)

1322492

= 670,4

y además

β′X ′Xβ =(

4 −0,2 1,6)

33 0 00 40 200 20 60

4−0,21,6

= 670,4

⇒ u′u = 678− 2 ∗ 670,4 + 670,4 = 7,6 ⇒ σ2u =

7,630≈ 0,25

∴ V ar(β) = 0,25

33 0 00 40 200 20 60

−1

=

0,0076767677 0 00 0,0076 −0,002533330 −0,00253333 0,0050666667

Test de significancia de β1:

tc =4√

0,0076767677= 45,653155 ∼ t30

5

Page 158: Magno Econometría

si compramos el valor calculado para nuestro estadístico (tc) con el tt de tabla a un 5%de significancia y con 30 grados de libertad, que es 2.042. La conclusión es que se rechazala H0 : β1 = 0, y el parámetro de constante resulta ser estadísticamente significativo.

Test de significancia de β2:

tc =−0,2√0,0076

= −2,2941573 ∼ t30

Si lo comparamos con el valor de tabla de la distribución t (-2.042), el estadístico calculadoes menor al de tabla (o mayor en valor absoluto), de esta forma se rechaza la hipótesisnula de que β2 es igual a cero, y el parámetro resulta ser estadísticamente significativo.

Test de significancia de β3:

tc =1,6√

0,0050666667= 22,478059 ∼ t30

Si lo comparamos con el valor de tabla de la distribución t (2.042), el estadístico calculadoes mayor al de tabla, de esta forma, se rechaza la hipótesis nula de que β3 es igual a cero,y el parámetro resulta ser estadísticamente significativo.

(10 puntos).

(iv) H0 : β2 + β3 = 1

t =β2 + β3 − 1√

V ar(β2) + V ar(β3) + 2Cov(β2, β3)∼ t30

t =−0,2 + 1,6− 1√

0,0076 + 0,0051− 2 ∗ 0,0025=

0,4√0,0076

Al 5% de significancia: t0,975,30 = 2,042

∴ tc = 4,59 > 2,042 = ttabla

⇒ se rechaza H0 : β2 + β3 = 1

(10 puntos)

6

Page 159: Magno Econometría

7

Page 160: Magno Econometría

8

Page 161: Magno Econometría

Econometría IProfesora: Andrés Otero

Javiera Vásquez.Otoño 2005

Pauta Solemne

Parte I: Comentes (30 puntos) (Contestar sólo en las líneas disponible)

Pregunta 1: (5 puntos) Si el coeficiente de correlación en valor absoluto esta entre 0 y 1,el parámetro de pendiente en un modelo de regresión lineal simple también lo estará. Comente.

Respuesta: El coeficiente de correlación y el coeficiente de regresión son conceptualmentedistintos, el primero mide la asociación lineal entre dos variables y el segundo la influenciade una variable independiente X sobre el valor promedio de Y. Además, se puede demostraralgebraicamente que:

β = ρxy︸︷︷︸[0,1]

√∑y2

i√∑x2

i

Por lo tanto, aunque el coeficiente de correlación este entre 0 y 1, β va a depender de la escalade las variables del modelo.

Pregunta 2: (5 puntos) El teorema de Gauss Markov dice que el estimador Mínimos Cuadra-dos Ordinarios es el estimador con menor error cuadrático medio entre todos los estimadoreslineales e insesgados. Comente.

Respuesta: Verdadero, ECM(β) = V AR(β) + sesgo2. Por lo tanto, aplicando la propiedadde insesgamiento de MCO tendremos que el ECM es igual a la varianza del estimador. De estaforma el teorema de Gauss Markov nos dice que el estimador MCO es el estimador más eficiente(menor varianza y por ende menor ECM) entre todos los estimadores lineales e INSESGADOS.

Pregunta 3: (5 puntos) Si el p-value asociado a cierta hipótesis nula es 0, no puedo rechazarla hipótesis nula.

Respuesta: Falso, el p-value mide el nivel de significancia asociado al t-calculado de ciertahipótesis nula. Si este toma el valor de 0, significa que rechazo la hipótesis nula a un 0% designificancia (cometiendo 0% de error de tipo I).

Pregunta 4: (5 puntos) El estimador de Máxima Verosimilitud es equivalente al estimadorde Mínimos cuadrados Ordinarios. Comente.

Respuesta: Falso, sólo bajo el supuesto de normalidad en el término de error, el estimadorMCO y MV de β coincidirán. Sin embargo, el estimador de la varianza del error no coincide yaque el estimador de MV de σ2 es sesgado.

σ2MCO =

∑µ2

n− k6= σ2

MV =∑

µ2

n

1

Page 162: Magno Econometría

Pregunta 5: (5 puntos) En un modelo de regresión lineal que busca explicar el salario promedioutilizando como variable explicativa la educación, se obtiene la siguiente estimación muestral:Salario=40000+15000*Educación. Interprete.

Respuesta: Este modelo estima un impacto marginal de la educación sobre el salario de 15000,es decir, un año adicional de educación generá un icremento de 15000 en el salario promedio.Además, se estima que una persona sin educación obtiene un salario promedio de 40000.

Pregunta 6: (5 puntos) En un modelo de regresión lineal: Yi = β0 + β1X1 + β2X2 + u, sedetermina el siguiente intervalo de confianza para β2, Pr[−1,3956 < β2 < 2,8974] = 95 %, quepuede concluir sobre la significancia del parámetro β2 y sobre la hipótesis nula de que β2 esigual a 3.5.

Respuesta: La significancia de un parámetro o el testeo de una hipótesis en particular sepuede realizar utilizando un intervalo de confianza. Testeando la hipótesis nula de significanciaH0 : β2 = 0, podemos ver que 0 cae en la zona de no rechazo, con lo cual se puede concluir queel parámetro es significativo. Para H0 : β2 = 3,5, podemos ver que 3.5 cae fuera de la zona deconfianza determinada por el intervalo de confianza, por lo tanto se rechaza que β2 = 3,5.

2

Page 163: Magno Econometría

Parte II: Ejercicios Cortos (30 puntos) (Contestar sólo en el espacio dispo-nible)

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 pun-tos)

Ejercicio 1: Suponga que para estimar el modelo Yt = α + βXt + ut se dispone de las si-guientes observaciones:

t= 1 2 3 4 5 6Xt 1 2 3 4 5 6

y se propone utilizar el estimador β = 18 (Y6 + Y5 − Y2 − Y1). Determine si el estimador es

insesgado, calcule su varianza muestral y compárela con la del estimador MCO.

Respuesta : Reemplazando Y6, Y5, Y2 e Y1 por su expresión poblacional tenemos que:

β =18[α + βX6 + u6 + α + βX5 + u5 − α− βX2 − u2 − α− βX1 − u1]

Luego reemplazando X6, X5, X2 y X1 por sus valores observados, tenemos lo siguiente:

β =18[α + 6 · β + u6 + α + 5 · β + u5 − α− 2 · β − u2 − α− 1 · β − u1]

β =18[8 · β + u6 + u5 − u2 − u1] (1)

β = β +[u6 + u5 − u2 − u1]

8(2)

Si los errores cumplen con los supuestos tradicionales de tener media 0, varianza σ2 y ser inde-pendientes entre ellos, se puede demostrar al tomar valor esperado a la expresión (2) que β esinsesgado. (5 puntos).

Ahora la varianza de β se obtiene de la siguiente forma:

V [β] = E[β − E(β)]2 = E[β − β]2 (3)

Reemplazando (2) en (3):

V [β] = E

[[u6 + u5 − u2 − u1]

8

]2

V [β] =E[u6]2 + E[u5]2 + E[u2]2 + E[u1]2

64dado supuesto de independencia

V [β] =σ2 + σ2 + σ2 + σ2

64

V [β] =4σ2

64

V [β] =σ2

16

3

Page 164: Magno Econometría

(5 puntos)

Por otra parte, la varianza del estimador MCO (β) de este modelo es conocida e igual a:

V [β] = σ2(X ′X)−1 =σ2

∑6i=1(Xi −X)2

Tenemos que X = 216 = 3,5, además

∑6i=1(Xi−X)2 =

∑6i=1 X2

i −6 ·X2, donde

∑6i=1 X2

i = 91.De esta forma,

∑6i=1(Xi −X)2=91− 6 · 12,25 = 17,5

Por lo tanto:

V [β] =σ2

17,5

El estimador MCO tiene menor varianza que el estimado β.(5 puntos)

Ejercicio 2: Demuestre que en un modelo de regresión simple: Y = β1 + β2Xi + ui, la raízcuadrada del R2 (

√R2), es igual al coeficiente de correlación entre X e Y .

Respuesta:

El R2 se define como:

R2 =β′2X

′2M0X2β2

Y ′M0Y

En un modelo de regresión simple como el que se plantea, donde solo hay una variable explicativamás el término constante, el R2 se puede reescribir de la siguiente forma:

R2 =β2

2

∑ni=1(Xi −X)2∑n

i=1(Yi − Y )2

Aplicando raíz cuadrada a la expresión anterior:

√R2 = β2

√∑ni=1(Xi −X)2

√∑ni=1(Yi − Y )2

(4)

El estimador MCO de β2 en este modelo de regresión simple se define como:

β2 =∑n

i=1(Yi − Y )(Xi −X)∑ni=1(Xi −X)2

(5)

Reemplazando (5) en (6) y reduciendo términos:

√R2 =

∑ni=1(Yi − Y )(Xi −X)∑n

i=1(Xi −X)2·

√∑ni=1(Xi −X)2

√∑ni=1(Yi − Y )2

(6)

√R2 =

∑ni=1(Yi − Y )(Xi −X)√∑n

i=1(Xi −X)2 ·√∑n

i=1(Yi − Y )2= ρxy

(15 puntos)

4

Page 165: Magno Econometría

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)

Ejercicio 3: Con la información disponible de Homecenter entre los años 1994 y 2004 so-bre Número de Tiendas (N) y tamaño de la tienda (TAM), se quiere estimar el valor promediodel ingreso total en millones de dólares (INGT ). Se estima el siguiente modelo de regresiónlineal:

INGT = β0 + β1N + β2TAM + u

A continuación se presenta la estimación realizada en Eviews:

Dependent Variable: INGT Method: Least Squares Date: 04/15/05 Time: 15:59 Sample: 1994 2004 Included observations: 11 INGT=C(1)+C(2)*N+C(3)*TAM

Coefficient Std. Error t-Statistic Prob. C(1) 8085.608 3035.113 2.664022 0.0286

C(2) 51.42006 3.656119 C(3) -125.7441 39.65131 -3.171246 0.0132

R-squared Mean dependent var 4196.545

Adjusted R-squared S.D. dependent var 3933.725 S.E. of regression 276.5529 Akaike info criterion 14.30968 Sum squared resid 611852.2 Schwarz criterion 14.41820 Log likelihood -75.70325 Durbin-Watson stat 0.812131

donde:

- S.D dependent var (sy) es la desviación estándar de la variable dependiente, la que se construyede la siguiente forma:

sy =

√∑Ni=1(yi − y)2

N − 1

- S.E. of regression es el error estándar de la regresión (σ =√∑

u2i

N−k ).

- Sum squared resid corresponde a la suma de los errores al cuadrado.

Con esta información se le pide a Ud. que interprete el modelo, testee la significancia indi-vidual de cada uno de los parámetros y testee la significancia global del modelo.

5

Page 166: Magno Econometría

Respuesta:

ttn−k = tt8(95%) = 2,306

De la información de la tabla tenemos que c(1) y c(3) caen en la zona de rechazo si testeamosla hipótesis nula que los parámetros son iguales a cero. Por lo tanto, la constante y el tamañode la empresa son variables significativas para explicar el ingreso total.

Probabilidad

No seRechaza Se

Rechaza(2,5%)

SeRechaza(2,5%))

t=-2.306 t)=2.306

tc=2.66tc=-3.17

Para ver la significancia del número de tiendas debemos calcular el test t asociado a estahipótesis nula.

tc =β1 − 0√V (β1)

=51,423,66

= 14,06

Con lo cual se rechaza H0 de que β1 = 0, ya que tc > tt = 2,306. Por lo tanto, el parámetro essignificativo. Para ver la significancia global del modelo se puede utilizar la siguiente definicióndel estadístico de Fischer:

Fq,n−k =R2

k−1

(1−R2)n−k

∼ Fk−1,n−k

R2 =ESS

TSS⇒ R2 = 1− RSS

TSS= 1− u′u′∑

(Yi − Y )2

Sy =

√∑(Yi − Y )2

n− 1= 3933,725 ⇒

∑(Yi − Y )2 = 154741923,76

Sy =

√u′u′

n− k= 276,5529 ⇒

∑u2 = 611852,052

6

Page 167: Magno Econometría

R2 = 1− 611852,05154741923,76

= 0,996

F c =0,996

21−0,996

8

' 996

F t2,8 = 5,32

Por lo tanto, se rechaza la hipótesis de que todas las pendientes del modelo son iguales a cero.El modelo es globalmente significativo.

Ejercicio 4: Sea la matriz X ′X asociado al siguiente modelo de regresión lineal:

Y = β0 + β1X1 + β2X2 + u

X ′X =

5 20 2020 90 7120 71 96

X ′Y =

42186150

Se le pide que exprese ambas matrices en desvíos con respecto a la media y obtenga el estimadormínimos cuadrados ordinarios de β0, β1 y β2.

Respuesta:∑

(Xi −Xi)2 =∑

(Xi)2 − nX2

∑(Xi −Xi)(Xj −Xj) =

∑(XiXj)− nXiXj

X ′Xdes =[ ∑

(X1 −X1)2∑

(X1 −X1)(X2 −X2)∑(X2 −X2)2

]

Del enunciado se pueden extraer los siguientes datos: n = 5; X1 = 205 = 4; X2 = 20

5 = 4;∑X2

1 = 90 y∑

X22 = 96;

∑X2X3 = 71

∑x2

1 = 90− 5(4)2 = 10;∑

x22 = 96− 5(4)2 = 16;

∑x2x3 = 71− 5 ∗ 4 ∗ 4 = −9

Donde las variables en minúsculas representan desviaciones con respecto a la media.

7

Page 168: Magno Econometría

X ′Xdes =[

10 −9−9 16

]

X ′Ydes =[ ∑

(Yi − Y i)(X1 −X1)∑(Yi − Y i)(X2 −X2)

]

Además,∑

(Yi − Y i)(Xi −Xi) =∑

YiXi − nY iXi

∑yx1 = 18;

∑yx2 = −18

X ′Ydes =[

18−18

]

β =[

10 −9−9 16

]∗

[18−18

]

β =179

[16 99 10

]∗

[18−18

]=

[1,5949−0,2278

]

De esta forma, β1 = 1,5949, β2 = −0,2278 y β0 = Y −β1X1−β2X2 = 8,4−1,5949·4+0,2278·4 =2,93.

8

Page 169: Magno Econometría

Parte III: Ejercicio Obligatorio (60 puntos) (Contestar sólo en el espaciodisponible)

Suponga que esta interesado en estimar el ingreso de una tienda, para lo cual dispone de 90datos sobre: ingreso total en millones de pesos (ingt), el número de competidores en el mercado(nc), el gasto en publicidad en millones de pesos (gp) y el número de vendedores (nv). Ud. debeestimar el siguiente modelo de regresión lineal:

ingt = β0 + β1 ∗ nc + β2 ∗ gp + β3 ∗ nv + u

donde las matrices (X ′X)−1 y X ′Y vienen dadas por:

(X ′X)−1 =

5 −3 2 0−3 6 −2 −42 −2 4 30 −4 3 4

X ′Y =

3212

y además σ2u = 0,5 y

∑90i=1(Yi − Y )2 = 80

(i) (6 puntos) Interprete el modelo, ¿Que signos esperaría Ud. de para los parámetros de estemodelo?

Se espera que el nivel de ingresos de esta tienda, dependa negativamente del númerode competidores, positivamente del gato en publicidad y positivamente del número devendedores. De esta forma, podríamos esperar un signo negativo para β1 y positivo paraβ2 y β3.

(ii) (8 puntos) Encuentre el estimador MCO de los parámetros de este modelo.

El estimador MCO del vector de parámetros β = (X ′X)−1X ′Y , utilizando la informacióndisponible:

β =

β0

β1

β2

β3

=

5 −3 2 0−3 6 −2 −42 −2 4 30 −4 3 4

·

3212

β =

11−7123

(iii) (8 puntos) Testee la significancia estadística de β0, β1, β2 y β3.

Para ver la significancia individual de cada uno de los parámetros del modelo se utili-za el siguiente estadístico t:

tc =βi√

V ar(βi)asociado a la hipotesis nula H0 : βi = 0

9

Page 170: Magno Econometría

Para realizar los test primero necesitamos computar la matriz de varianzas y covarianzasde los parámetros:

V ar[β] = σ2(X ′X)−1 = 0,5 ∗

5 −3 2 0−3 6 −2 −42 −2 4 30 −4 3 4

=

2,5 −1,5 1 03 −1 −2

2 1,52

Para todas las hipótesis nulas se utiliza el mismo valor de tabla de la distribución t-student: tt = t86,95 % ≈ 1,99.

Test de significancia de β0:

tc =11√2,5

= 6,96

∴ Se rechaza la hipótesis nula de que β0 sea igual a cero, con lo cual el parámetro resultaser estadísticamente significativo.

Test de significancia de β1:

tc =−7√

3= −4,04

∴ Se rechaza la hipótesis nula de que β1 sea igual a cero, con lo cual el parámetro resultaser estadísticamente significativo.

Test de significancia de β2:

tc =12√

2= 8,46

∴ Se rechaza la hipótesis nula de que β2 sea igual a cero, con lo cual el parámetro resultaser estadísticamente significativo.

Test de significancia de β3:

tc =3√2

= 2,12

∴ Se rechaza la hipótesis nula de que β3 sea igual a cero, con lo cual el parámetro resultaser estadísticamente significativo.

(iv) (8 puntos) ¿Qué factor es más importante en determinar el los ingresos?. Como consultor,¿que recomendaría?

El gasto en publicidad y el número de vendedores tienen un impacto positivo sobre elnivel de ingresos, por el orden de magnitud parece ser más importante el gasto en publi-cidad, un millón adicional en gasto en publicidad aumenta en 12 millones el ingreso, porotra parte un aumento en 4 vendedores lograría el mismo aumento en los ingresos totales,habría que ver que resulta más rentable aumentar en 1 millón el gasto en publicidad o ocontratar 4 trabajadores más.

10

Page 171: Magno Econometría

(v) (8 puntos) Determine la Bondad de Ajuste del modelo, a través del R2 y R2.

R2 = 1− u′uY ′M0Y

= 1−∑n

i=1 u2i∑n

i=1(Yi − Y )2

De la información que se entrega sabemos que σ2 =∑n

i=1 u2i

86 = 0,5, por lo tanto∑n

i=1 u2i =

86 ·0,5 = 43. Además se nos entrega la información de que (Yi−Y )2 = 80. Reemplazando:

R2 = 1− 4380

= 0,4625

Para obtener el R2utilizamos la siguiente definición y luego reemplazando los valores

correspondientes:

R2

= 1−∑n

i=1 u2i /(n− k)∑n

i=1(Yi − Y )2/(n− 1)

R2

= 1− 43/8680/89

= 1− 0,5 · 8980

= 0,44375

(vi) (8 puntos) Testee la hipótesis de que todos los coeficientes a excepción de la constante soncero.

Bajo esta hipótesis nula el estadístico F calculado se puede escribir de la siguiente forma:

F c =R2/(k − 1)

(1−R2)/(n− k)

Reemplazando por lo valores correspondientes:

F c =0,4625/30,5375/86

=0,154

0,00625= 24.6

El valor de tabla del estadístico F a un 5% de significancia y con 3 grados de libertaden el numerador y 86 en el denominador es aproximadamente 2.7, con lo cual se rechazala hipótesis nula de que todos los parámetros del modelo a excepción del de la constantesean igual a cero, es decir, el modelo es globalmente significativo.

(vii) (8 puntos) Construya un intervalo de confianza para β1, β2, β3 y σ2.

Los intervalos de confianza para los parámetros β1, β2 y β3 se construyen de la siguienteforma:

Pr

[βi − t0,975,86 ·

√V ar(βi) < βi < βi + t0,975,86 ·

√V ar(βi)

]= 95 %

Intervalo de Confianza de β1:

Pr[−7− 1,99 ·

√3 < β1 < −7 + 1,99 ·

√3]

= 95 %

Pr [−10,45 < β1 < −3,55] = 95 %

11

Page 172: Magno Econometría

Intervalo de Confianza de β2:

Pr[12− 1,99 ·

√2 < β2 < 12 + 1,99 ·

√2]

= 95 %

Pr [9,19 < β2 < 14,81] = 95%

Intervalo de Confianza de β3:

Pr[3− 1,99 ·

√2 < β3 < 3 + 1,99 ·

√2]

= 95 %

Pr [0,19 < β3 < 5,81] = 95%

Por otra parte, el intervalo de confianza para σ2 se obtiene de la siguiente forma:

Pr

[(n− k)σ2

χ20,95,86

< σ2 <(n− k)σ2

χ20,05,86

]= 95 %

El valor de tabla de χ20,95,86 ≈ 65 (para la corrección se utilizó 43.8) y el de χ2

0,05,86 ≈ 107(para la corrección se utilizó 18.5). POr lo tanto,

Pr

[86 · 0,543,8

< σ2 <86 · 0,518,5

]= 95 %

Pr[0,98 < σ2 < 2,32

]= 95 %

(viii) (6 puntos) Que nivel de ingresos totales esperaría Ud. para el año 2005, si se espera queuna nueva tienda abra en el mercado con lo cual tendría 10 competidores, el gasto enpublicidad sea 100 y el el número de vendedores sea 30.

Del modelo estimado tenemos que el valor promedio del ingreso de la empresa depen-de de la siguiente forma de las variable explicativas:

ingt = 11− 7 ∗ nc + 12 ∗ gp + 3 ∗ nv

Reemplazando nc por 10, gp por 100 y nv por 30, se obtiene un valor predicho para elingreso del próximo año de 1,231 millones de pesos.

12

Page 173: Magno Econometría

Econometría IProfesores:

Emerson MeloRodrigo MonteroJaviera Vásquez

Primavera 2005

Pauta Solemne

Parte I: Comentes (30 puntos) (Contestar sólo en las líneas disponible)

Pregunta 1: (5 puntos) Si los coeficientes asociados a las pendientes de la regresión no sonestadísticamente significativos a nivel individual, entonces, tampoco lo serán en conjunto. Co-mente.

Respuesta:

Respuesta: No necesariamente. Es posible que los coeficientes asociados a las pendientes de laregresión no sean significativos a nivel individual, pero sí lo sean en su conjunto. Esto se debe aque podría ocurrir que la contribución individual que hace cada uno de los elementos presentesen X no sea significativa en sí, pero que en conjunto la covarianza existente entre éstos permita“explicar” de manera signficativa la variable dependiente.

Pregunta 2: (5 puntos) Significancia estadística implica significancia económica. Comente.

Respuesta: Falso. La significancia estadística (obtenida a través de un test t) no permiteinferir que se esté en presencia de signifcancia económica. Esto último depende críticamentedel modelo teórico subyacente. Recuerde que cuando el N (tamaño de la muestra) es lo su-ficientemente grande, entonces, es muy probable que todos los coeficientes estimados resultenser estadísticamente significativos. Por otro lado, que el coeficiente estimado no sea estadística-mente significativo no quiere decir que no lo sea desde el punto de vista del modelo que se estáestudiando. Muchas cosas (problemas) podrían estar pasando con los datos, por lo tanto, no sedebe hacer teoría a partir de éstos.

Pregunta 3: (5 puntos) Si el p-value asociado a cierta hipótesis nula es 0 no existirá zonade rechazo y por lo tanto, no es posible rechazar la hipótesis nula.

Respuesta: Falso, el p-value mide el nivel de significancia asociado al t-calculado de ciertahipótesis nula. Si este toma el valor de 0, significa que rechazo la hipótesis nula a un 0% designificancia (cometiendo 0% de error de tipo I).

Pregunta 4: (5 puntos) En el modelo de regresión lineal clásico dado que la distribuciónde los errores no tiene relevancia para la forma de los estimadores, siempre podremos realizarlos test de hípotesis tradicionales (tests t y F). Comente.

Respuesta: Falso, el supuesto de Normalidad es clave para poder derivar los estadísticos deprueba. Si los errores poseen otra distribución, entonces no es posible derivar los test t y Ftradicionales.

1

Page 174: Magno Econometría

Pregunta 5: (5 puntos) En un modelo de regresión lineal clásico siempre será convenienteincluir regresores, ya que esto permite aumentar el R2.

Respuesta: Falso, sabemos que una mejor medida de la bondad de ajuste del modelo, esel R2 que justamente controla por el número de regresores presentes en el modelo. Además,cada vez que se incluyen regresores, se debe considerar el sentido económico de incluirlo.

Pregunta 6: (5 puntos) En un modelo de regresión lineal: Yi = β0 + β1X1 + β2X2 + u, sedetermina el siguiente intervalo de confianza para β2, Pr[2,5367 < β2 < 3,2785] = 95 %, ¿Quepuede concluir sobre la significancia del parámetro β2 y sobre la hipótesis nula de que β2 esigual a 3.1?.

Respuesta: El intervalo de confianza de un parámetro mide el rango de valores posibles quepuede tomar, mide la zona donde no podemos rechazar la hipótesis nula de que el parámetrotome cierto valor (el que esta contenido en el intervalo de confianza). Como la hipótesis de sig-nificancia del parámetro testea que β2 = 0, y 0 esta fuera de intervalo de confianza se rechazaque β2 sea igual a cero y se puede concluir que el parámetro es estadísticamente significativo.Además como 3.1 esta dentro del intervalo de confianza, no se puede rechazar que β2 sea iguala 3.1.

2

Page 175: Magno Econometría

Parte II: Ejercicios Cortos (Contestar sólo en el espacio disponible)

Ejercicio 1: (15 puntos) En el modelo de regresión lineal clásico:

Y = Xβ + U

Demuestre usando matrices que σ = u′un−k es un estimador insesgado de la varianza del error del

modelo. (Ind: Utilice el operador Traza)

Respuesta:

Lo primero que debemos darnos cuenta para demostrar lo que se pide, es que :

u = Y −Xβ = Y − (X ′X)−1X ′Y = [In×n − (X ′X)−1X ′]Y

Sí definimos M = [In×n − (X ′X)−1X ′] , que como es bien sabemos es una matriz símetrica eidempotente. Luego

u = MY = M(Xβ + U) = MU

De esta forma, podemos escribir

u′u = U ′MU

Tomando esperanza en la expresión anterior, asumiendo X fijo

E(u′u) = E(U ′MU)

Usando el operador traza escribimos:

E(Tr(U ′MU)) = E(Tr(MU ′U))

y por propiedad del operador traza y de la esperanaza, se tiene

Tr(ME(UU ′)) = Tr(Mσ2In×n) = σ2Tr(M)

dondeTr(M) = Tr(In×n)− Tr((X ′X)−1X ′) = Tr(In×n)− Tr(Ik×k) = n− k

de donde se obtiene que:

E(u′u) = (n− k)σ2

y de esta forma el estimador insesgado será: σ2 = u′un−k

3

Page 176: Magno Econometría

Ejercicio 2: (15 puntos) El profesor O. Thero es un académico muy dedicado a sus labores, yama la docencia; es por ello que durante el semestre recién pasado dictó en cuatro universidadesdistintas el curso "Introducción a la Microeconomía". Una de las grandes interrogantes paraeste docente se refiere a cuáles serían los determinantes del éxito de sus estudiantes. Es por elloque una vez concluido los cursos decidió ir en busca de la respuesta, y construyó una base dedatos que contiene la información para cada uno de sus 300 estudiantes. El modelo que él haestimado es el siguiente:

Ni = α + βHi + γYi + δSi + ui

Donde Ni representa la nota final obtenida por el alumno i, Hi corresponde a las horas promedioque el alumno dedicaba cada semana al estudio de dicha asignatura (de acuerdo a la informaciónque recopiló en una breve encuesta hecha al final del curso), Yi es el ingreso per cápita de lafamilia y Si representa los años de escolaridad (promedio simple1) de los padres. Los resultadosde la estimación se presentan en la siguiente tabla:

Coeficiente Error Estándar p-valueConstante 2.48 0.074 0Horas 0.187 0.005 0Ingreso 9.9e(-07) 1.32e(-07) 0Escolaridad de padres -0.002 0.007 0.691N 300F-Test (p-value) 0R2 0.78R2 ajustado 0.77

En base a esta información:

i) Calcule el test t de significancia estadística para cada uno de los parámetros estimados (Ayu-da: utilice como valor crítico de tabla 1,96) (4 puntos)

Respuesta: La prueba consiste en calcular el estadístico t asociado a cada uno de loscoeficientes estimados:

tα =2, 480, 074

= 33, 51 > 1, 96 ⇒ significativo

tβ =0, 1870, 005

= 37, 4 > 1, 96 ⇒ significativo

tγ =9, 91, 32

= 7, 5 > 1, 96 ⇒ significativo

tδ =−0, 0020, 007

= | − 0, 28| < 1, 96 ⇒ no es significativo

ii) ¿Qué significa que el p-value del coeficiente asociado a la escolaridad de los padres sea de0,691? (2 puntos)

1Si =S

pi +Sm

i2

, donde p=padre y m=madre

4

Page 177: Magno Econometría

Respuesta: El p-value representa la probabilidad de que el valor crítico sea mayor queel t calculado, es decir, describe el nivel de signficancia asociado a un estadístico t par-ticular. Por lo tanto, un p-value de 0,05 representa significancia estadística del coeficienteestimado con un nivel de confianza del 95%. Como en este caso el p-value es ostensible-mente mayor que dicho valor, entonces, se puede concluir que el coeficiente asociado a laescolaridad de los padres, no es estadísticamente significativo al 5% (ni tampoco al 10%).

iii) ¿Qué significa que el p-value del test F sea de 0? (2 puntos)

Respuesta: El test F permite determinar la signifcancia estadística conjunta del modelo(testea que todas los coeficientes asociados a las pendientes son igual a cero). Si el p-valuede dicho test es cero (0), entonces, se rechaza la hipótesis nula con un 99% de confianza,es decir, el modelo es signifcativo en su conjunto.

iv) ¿Cuál es la nota esperada para un alumno que dedicaba 10 horas a la semana al estudio dela asignatura, cuyo ingreso familiar per cápita es de $43.000 y que la escolaridad promediode los padres es de 17 años? (2 puntos)

Respuesta:

Ni = 2, 48 + 0, 187 · (10) + 9, 9e(−7) · (43,000)− 0, 002 · (17) = 4, 3

v) ¿Por qué podría preferir usted fijarse en el R2 ajustado más que en el R2? (2 puntos)

Respuesta: El R2 presenta muchas deficiencias, dentro de las cuales cabe mencionarque es monotónonico en la incorporación de regresores adicionales. Por el contrario el R2

ajustado penaliza la incorporación de regresores por la pérdida de grados de libertad enque se incurre. Por lo tanto, eventualmente, mientras que el R2 siempre aumenta con laincorporación de una variable independiente adicional, el R2 ajustado podría disminuir.

vi) ¿Qué críticas podría usted hacerle a este modelo (mencione dos)? (4 puntos)

Respuesta: (1) Es posible que las respuestas de los alumnos estén sesgadas a la horade responder acerca de cuántas horas dedicó en promedio a la semana a estudiar la asig-natura. (2) Un determinante significativo de las notas de las personas viene dado por suhabilidad, la cual no es observable en este caso, y por ende, no se incorpora en el modelo.(3) La estimación MCO no restringe a que la predicción de la nota se encuentre en elrango uno siete. Por lo tanto, podría darse el caso que para alguna persona en particular,el modelo arroje una nota estimada que no pertenezca al rango admisible.

vii) Si el modelo fuera estimado nuevamente pero utilizando como variable dependiente ellogaritmo de la nota final del curso (N∗ = ln(N)), ¿qué representarían los coeficientesestimados? (2 puntos)

Respuesta: En este caso, los coeficientes estimados representarían semielasticidades.

5

Page 178: Magno Econometría

Ejercicio 3: (15 puntos) Para estimar el modelo yi = βxi+ui se propone el siguiente estimador:

β =∑n

i=1 xiyi

σ2

β2 +∑n

i=1 x2i

i) Pruebe que dicho estimador subestima el verdadero valor del parámetro. (8 puntos)

ii) Pruebe que (7 puntos):

E[β − β]2 =σ2

σ2

β2 +∑n

i=1 x2i

Respuesta:

i)

β =∑n

i=1 xiyi

σ2

β2 +∑n

i=1 x2i

=∑n

i=1 xi(βxi + ui)σ2

β2 +∑n

i=1 x2i

∑ni=1 x2

iσ2

β2 +∑n

i=1 x2i

+∑n

i=1 xiui

σ2

β2 +∑n

i=1 x2i

E[β] =β

∑ni=1 x2

iσ2

β2 +∑n

i=1 x2i

Por lo tanto, el sesgo es:

E[β]− β =β

∑ni=1 x2

iσ2

β2 +∑n

i=1 x2i

− β

E[β]− β =−σ2

β

σ2

β2 +∑n

i=1 x2i

Si β<0 ⇒ E[β] − β > 0 ⇒ E[β] > β, subestima ya que en valor esperado β es menosnegativo que β.

Si β>0 ⇒ E[β] − β < 0 ⇒ E[β] < β, subestima ya que en valor esperado β es menospositivo que β.

ii) Primero obtengamos β − β:

β − β =β

∑ni=1 x2

iσ2

β2 +∑n

i=1 x2i

+∑n

i=1 xiui

σ2

β2 +∑n

i=1 x2i

− β

β − β =−σ2

β

σ2

β2 +∑n

i=1 x2i

+∑n

i=1 xiui

σ2

β2 +∑n

i=1 x2i

6

Page 179: Magno Econometría

Ahora apliquemos elevamos al cuadrado la expresión anterior y aplicamos valor esperado:

E[β − β]2 =E

[(∑n

i=1 xiui)2 − 2 · σ2

β ·∑ni=1 xiui +

(σ2

β

)2]

[σ2

β2 +∑n

i=1 x2i

]2

E[β − β]2 =σ2

∑ni=1 x2

i + σ4

β2

[σ2

β2 +∑n

i=1 x2i

]2

E[β − β]2 =σ2

(∑ni=1 x2

i + σ2

β2

)

[σ2

β2 +∑n

i=1 x2i

]2

E[β − β]2 =σ2

σ2

β2 +∑n

i=1 x2i

7

Page 180: Magno Econometría

Parte III (30 puntos) (Contestar sólo en el espacio disponible)

Suponga que esta interesado en estimar la inversión realizada por una empresa, para lo cualdispone de 90 observaciones mensuales sobre: inversión en millones de pesos (inv), tasa de in-terés (r), utilidades en millones de pesos (ut) y crecimiento del PIB proyectado para el próximoperiodo (pib). Ud. debe estimar el siguiente modelo de regresión lineal:

inv = β0 + β1 ∗ r + β2 ∗ ut + β3 ∗ pib + u

donde las matrices (X ′X)−1 y X ′Y vienen dadas por:

(X ′X)−1 =

5 −3 2 0−3 6 −2 −42 −2 4 30 −4 3 4

X ′Y =

3212

y además σ2u = 0,5 y

∑90i=1(Yi − Y )2 = 80

(i) (5 puntos) Encuentre el estimador MCO de los parámetros de este modelo.

El estimador MCO del vector de parámetros β = (X ′X)−1X ′Y , utilizando la informacióndisponible:

β =

β0

β1

β2

β3

=

5 −3 2 0−3 6 −2 −42 −2 4 30 −4 3 4

·

3212

β =

11−7123

(ii) (6 puntos) Testee la significancia estadística de β1, β2 y β3.

Para ver la significancia individual de cada uno de los parámetros del modelo se utiliza elsiguiente estadístico t:

tc =βi√

V ar(βi)asociado a la hipotesis nula H0 : βi = 0

Para realizar los test primero necesitamos computar la matriz de varianzas y covarianzasde los parámetros:

V ar[β] = σ2(X ′X)−1 = 0,5 ∗

5 −3 2 0−3 6 −2 −42 −2 4 30 −4 3 4

=

2,5 −1,5 1 03 −1 −2

2 1,52

Para todas las hipótesis nulas se utiliza el mismo valor de tabla de la distribución t-student: tt = t86,95 % ≈ 1,99.

8

Page 181: Magno Econometría

Test de significancia de β1:

tc =−7√

3= −4,04

∴ Se rechaza la hipótesis nula de que β1 sea igual a cero, con lo cual el parámetro resultaser estadísticamente significativo.

Test de significancia de β2:

tc =12√

2= 8,46

∴ Se rechaza la hipótesis nula de que β2 sea igual a cero, con lo cual el parámetro resultaser estadísticamente significativo.

Test de significancia de β3:

tc =3√2

= 2,12

∴ Se rechaza la hipótesis nula de que β3 sea igual a cero, con lo cual el parámetro resultaser estadísticamente significativo.

(iii) (3 puntos) ¿Qué factor es más importante en determinar el la inversión?. Como consultor,¿que recomendaría? De la regresión se puede ver que la tasa de interés tiene un efectonegativo sobre la inversión, y que tanto las utilidades como el crecimiento esperado del PIBtienen un efecto positivo. De esta forma, se recomienda que en meses donde las utilidadeshan aumentado y se espera un mayor crecimiento del PIB, la inversión aumente.

(iv) (6 puntos) Determine la Bondad de Ajuste del modelo, a través del R2 y R2.

R2 = 1− u′uY ′M0Y

= 1−∑n

i=1 u2i∑n

i=1(Yi − Y )2

De la información que se entrega sabemos que σ2 =∑n

i=1 u2i

86 = 0,5, por lo tanto∑n

i=1 u2i =

86 ·0,5 = 43. Además se nos entrega la información de que (Yi−Y )2 = 80. Reemplazando:

R2 = 1− 4380

= 0,4625

Para obtener el R2utilizamos la siguiente definición y luego reemplazando los valores

correspondientes:

R2

= 1−∑n

i=1 u2i /(n− k)∑n

i=1(Yi − Y )2/(n− 1)

R2

= 1− 43/8680/89

= 1− 0,5 · 8980

= 0,44375

9

Page 182: Magno Econometría

(v) (3puntos) Testee la hipótesis de que todos los coeficientes a excepción de la constante soncero.

Bajo esta hipótesis nula el estadístico F calculado se puede escribir de la siguiente forma:

F c =R2/(k − 1)

(1−R2)/(n− k)

Reemplazando por lo valores correspondientes:

F c =0,4625/30,5375/86

=0,154

0,00625= 24.6

El valor de tabla del estadístico F a un 5% de significancia y con 3 grados de libertaden el numerador y 86 en el denominador es aproximadamente 2.7, con lo cual se rechazala hipótesis nula de que todos los parámetros del modelo a excepción del de la constantesean igual a cero, es decir, el modelo es globalmente significativo.

(vi) (3 puntos) Construya un intervalo de confianza para β2 y σ2.

El intervalo de confianza para β2 se construyen de la siguiente forma:

Pr

[βi − t0,975,86 ·

√V ar(βi) < βi < βi + t0,975,86 ·

√V ar(βi)

]= 95 %

Intervalo de Confianza de β2:

Pr[12− 1,99 ·

√2 < β2 < 12 + 1,99 ·

√2]

= 95 %

Pr [9,19 < β2 < 14,81] = 95%

Por otra parte, el intervalo de confianza para σ2 se obtiene de la siguiente forma:

Pr

[(n− k)σ2

χ20,95,86

< σ2 <(n− k)σ2

χ20,05,86

]= 95 %

El valor de tabla de χ20,95,86 ≈ 65 (para la corrección se utilizó 43.8) y el de χ2

0,05,86 ≈ 107(para la corrección se utilizó 18.5). Por lo tanto,

Pr

[86 · 0,543,8

< σ2 <86 · 0,518,5

]= 95 %

Pr[0,98 < σ2 < 2,32

]= 95 %

(vii) (4 puntos) Que nivel de inversión esperaría Ud. para el año 2006, si se espera que la tasade interés sea un 4%, las utilidades 10 millones de pesos y que el pib crecerá en un 7%.Del modelo estimado tenemos que el valor promedio de la inversión de la empresa dependede la siguiente forma de las variable explicativas:

inv = 11− 7 ∗ r + 12 ∗ ut + 3 ∗ pib

Reemplazando r por 0.04, ut por 10 y pib por 0.07, se obtiene un valor predicho para lainversión del próximo año es de 130.93 millones de pesos.

10

Page 183: Magno Econometría

Econometría I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.Ayudante : Roberto Jaramillo M.

Prueba Solemne - Pauta de Corrección

Instrucciones

Ud. Dispone de 90 minutos para resolver este control. No puede hacer consultas a losayudantes, no puede tener nada más que lápiz en su escritorio. Si contesta con lápizmina no tiene derecho a reclamo.

Pregunta 1 (30 puntos)

Considere un modelo con una sola variable explicativa

Yi = β0 + β1Xi + ui, (1)

donde Yi es el peso de una persona medido en gramos que se quiere explicar con lavariable explicativa Xi que es la altura medida en centímetros.

Usted sugiere que es más intuitivo usar kilogramos y metros para las medidas, encuyo caso el modelo a estimar sería

Y ∗

i = γ0 + γ1X∗

i + vi, (2)

donde Y ∗

i es el peso de una persona medido en kilogramos y X∗

i es la altura medidaen metros. [Recuerde que 1kg = 1.000 gramos y que 1m = 100cm.]

(a) (5 puntos) ¾Son los modelos equivalentes? Explique intituivamente.

Los modelos son equivalentes porque la relación entre peso y altura no tiene porqué verse alterada de acuerdo a las unidades de medida. Ciertamente los parámet-ros serán distintos, pero reejarán exactamente la misma relación entre las vari-ables. Simplemente se trata de un modelo con variables reescaladas.

(b) (10 puntos) A partir de la estimación por MCO en (1) y (2), derive una expresiónpara la relación existente entre los los estimadores β0 y γ0 y entre β1 y γ1.

1

Page 184: Magno Econometría

Sabemos que la estimación por MCO arroja

β1 =

∑xiyi

∑x2

i

donde yi y xi son las variables en desviaciones con respecto a la media. Además,

Yi = β0 + β1Xi

Dado que y∗

i = yi

1,000; x∗

i = xi

100, el modelo alternativo implica estimadores MCO

γ1 =

∑x∗

i y∗

i∑

x∗

i2 =

11,000×100

∑xiyi

1100×100

∑x2

i

=1

10· β1

yY ∗

i = γ0 + γ1X∗

i .

De donde se obtiene

γ0 = Y ∗

i − γ1X∗

i

= Y ∗

i −1

10· β1X

i

=1

1,000Yi −

1

10·

1

100· β1Xi

=1

1,000

[

Yi − β1Xi

]

γ0 =1

1,000· β0.

(c) (5 puntos) ¾Cuál modelo explica mejor el peso de una persona? Explique intitu-ivamente.

Dado que los modelos son equivalentes y que los parámetros son tienen unarelación proporcional, ambos modelos explican de igual forma el peso de una per-sona. La única diferencia es la unidad de medida, pero el la capacidad del modelopara esplicar es la misma porque se esta ocupando exactamente la misma infor-mación.

(d) (10 puntos) Derive una expresión para la relación entre el coeciente de bondaddel ajuste R2 del modelo en (1) y para el coeciente R2∗ en el modelo (2).

Sabemos que R2 = ESSTSS

= 1 −RSSTSS

, donde RSS =∑

u2i y TSS =

∑(Yi − Y )2.

2

Page 185: Magno Econometría

Dadas las relaciones de las variables, TSS∗ =∑

(Y ∗

i −Y ∗)2 = 11,0002 ·

∑(Yi−Y )2 =

11,0002 · TSS.

Por otro lado, RSS∗ =∑

u∗

i

2. Pero

u∗

i = Y ∗

i − Y ∗

i =Yi

1,000− (γ0 + γ1X

i )

=Yi

1,000−

(1

1,000β0 +

1

10β1Xi

1

100

)

=Yi

1,000−

1

1,000

(

β0 + β1Xi

)

=Yi

1,000−

Yi

1,000

=ui

1,000.

Por lo tanto, RSS∗ = 11,0002

∑u2

i .

Finalmente, R2∗ = 1 −RSS∗

TSS∗= 1 −

1

1,0002RSS

1

1,0002TSS

= 1 −RSSTSS

= R2.

Pregunta 2 (30 puntos)

Se tiene el siguiente modelo con 2 variables explicativas:

Yi = β1 + β2X2i + β3X3i + ui, (3)

(a) (5 puntos) Explique cómo testearía la hipótesis que los parámetros de las vari-ables explicativas son iguales entre sí. Plantee el problema matricialmente.

Se busca testear la hipótesis en forma matricial

H0 : Rq×k

βk×1

= rq×1

donde q corresponde al número de restricciones. Dado que sólo hay una restriccióndado que H0 : β2 = β3 ⇔ H0 : β2 − β3 = 0, la forma matricial es

H0 :

R︷ ︸︸ ︷[

0 1 −1]×

β︷ ︸︸ ︷

β1

β2

β3

=

r︷ ︸︸ ︷[

0].

3

Page 186: Magno Econometría

(b) (5 puntos) Explique cómo testearía la hipótesis conjunta que el parámetro de lavariable X2 es igual a 5 y que el parámetro de la variable X3 es no signicativo.Plantee el problema matricialmente.

Se busca testear la hipótesis en forma matricial donde q corresponde al númerode restricciones, en este caso 2. La hipótesis nula está dad por

H0 : β2 = 5

β3 = 0

O equivalentente en forma matricial

H0 :

[β2

β3

]

=

[50

]

.

De donde se obtiene que

H0 :

R︷ ︸︸ ︷[

0 1 00 0 1

]

×

β︷ ︸︸ ︷

β1

β2

β3

=

r︷ ︸︸ ︷[

50

]

.

(c) (5 puntos) Muestre que la varianza de Rβ es σ2uR(X ′X)−1R′, donde R es la matriz

que se utiliza para testear hipótesis lineales conjuntas.

Sabemos que, si se cumplen los supuestos del modelo, el estimador de MCO esinsesgado con varianza V ar(β) = σ2(X ′X)−1. Por lo tanto, E[β] = β y de estaforma E[Rβ] = Rβ, y la varianza será:

V ar(Rβ) = E[(Rβ − Rβ)(Rβ − Rβ)′]

= E[R(β − β)(β − β)′R′]

= RE[(β − β)(β − β)′]︸ ︷︷ ︸

V ar(β)

R′

= Rσ2(X ′X)−1R′

= σ2R(X ′X)−1R′.

(d) (10 puntos) Derive una expresión algebraica para el estadígrafo F explicitandocada uno de sus pasos.

4

Page 187: Magno Econometría

Dado que los errores se distribuyen u ∼ N(0, σ2I) por los supuestos del modelo, elestimador de MCO se distribuye se distribuye β ∼ N(β, σ2(X ′X)−1), y nalmenteRβ ∼ N(Rβ, σ2R(X ′X)−1R′). Estandarizando la distribución, se tiene que

Rβ − Rβ√

σ2R(X ′X)−1R′

∼ N(0, 1),

y bajo la hipótesis nula (si es que ésta se cumple)

Rβ − r√

σ2R(X ′X)−1R′

∼ N(0, 1).

Tomando la forma cuadrática de la expresión anterior y aplicando la propiedadde que una normal estándar al cuadrado se distribuye como una chi-cuadrado con1 grado de libertad y que la suma de q chi-cuadrados se distrbuye chi-cuadradocon q grados de libertad, se obtiene

(Rβ − r)′[σ2R(X ′X)−1R′]−1(Rβ − r) ∼ χ2q.

Por otro lado, se puede demostrar que u′uσ2 ∼ χ2

n−k. Por lo tanto utilizando lapropiedad de que una distribución F es una división de dos chi-cuadrado dividaspor sus respectivos grados de libertad, se puede obtener

(Rβ−r)′[σ2R(X′X)−1R′]−1(Rβ−r)q

u′uσ2(n−k)

∼ Fq,n−k,

lo que se simplica a

(Rβ−r)′[R(X′X)−1R′]−1(Rβ−r)q

u′un−k

∼ Fq,n−k.

Dado que u′un−k

corresponde al estimador insesgado de la varianza de los erroresσ2, el estadígrafo F nalmente se calcula como

(Rβ − r)′R[σ2(X ′X)−1R′]−1(Rβ − r)

q∼ Fq,n−k.

(e) (5 puntos) Suponga que el estadígrafo F de la hipótesis en (b) es igual a 3.13.Si la estimación se hizo con 20 observaciones, ¾rechazaría la hipótesis nula? ¾Dequé tamaño tendría que haber sido la muestra para que, con el estadígrafo quese calculó, se hubiese rechazado la hipótesis nula con un 95% de conanza. [Re-cuerde que la distribución F se escribe como Fd1,d2

, donde d1 y d2 son los grados

5

Page 188: Magno Econometría

de libertad correspondientes.]

Dado que el número de restricciones es q = 2 y que n−k = 17, los valores cíticoscorrespondientes en las tablas de la distribución F son: F2,17(α = 10 %) = 2,64,F2,17(α = 5 %) = 3,59, F2,17(α = 1 %) = 6,11. Por lo tanto, la hipótesis nula serechaza al 90% de signicancia y no se puede rechazar al 95% o más de con-anza, porque sólo al 90% el estadígrafo calculado es mayor al valor crítico de tabla.

Los valores críticos de tabla cercanos a 3.13 con un 95% de conanza son F2,60(α =5 %) = 3,15 y F2,120(α = 5 %) = 3,07. Por lo tanto, con una muestra de tamañon >= 123 se garantiza que el test se hubiera aceptado porque el estadígrafo cal-culado habría sido mayor al valor crítico de tabla.

Pregunta 3 (30 puntos)

(a) (10 puntos) Explique por qué en la predicción puntual existen dos fuentes de error.

En la predicción puntual se pretende predecir un valor en particular de la variabledependiente con el modelo estimado. Entonces, el error de predicción puntual sepuede escribir como

ei = Yi − Yi = Xiβ + ui − Xiβ

= Xi(β − β) + ui,

donde (β − β) corresponde al error de estimación de los parámetros y ui cor-responde al error aleatorio. Al querer predecir un valor en particular tendremos2 fuentes de error; una proveniente de la estimación de los parámetros (es unaestimación que siempre contiene algún grado de error) y otra proveniente de lanaturaleza estocástica del modelo, donde aunque el modelo sea perfecto siemprehabrá un componente aleatorio que genere error.

(b) (10 puntos) Utilizando la matriz de desvíos M0, derive la expresión matricial parael coeciente R2. Recuerde que para ello debe hacer una descomposición de lavarianza total de la variable a explicar entre la parte explicada de la varianza yla parte residual.

Primero expresamos el modelo general (asumiento que se usa una constante) endesvíos con respecto a la media, para lo cual premultiplicamos por la matriz M0

6

Page 189: Magno Econometría

y descomponemos la matriz X = [X1X2] con X1 = i, es decir, la constante:

M0Y = M0Xβ + M0u

= M0Xβ + M0u

= M0X1β1 + M0X2β2 + M0u

= M0i︸︷︷︸

=0

β1 + M0X2β2 + M0u

= M0X2β2 + M0u

M0Y = M0X2β2 + u.

Luego premultiplicamos por Y ′ para obtener la expresión de la suma total de loscuadrados (TSS):

TSS = Y ′M0Y = Y ′(M0X2β2 + u)

TSS = (Xβ + u)′(M0X2β2 + u)

= β′X ′M0X2β2︸ ︷︷ ︸

ESS

+ β′X ′u︸︷︷︸

=0

+ u′M0X2︸ ︷︷ ︸

=0

β2 + u′u︸︷︷︸

RSS

TSS = ESS + RSS,

donde ESS es la parte explicada de la varianza total y RSS es la parte residual(los términos que sea hacen iguales a cero lo hacen porque las variables explicativasson ortogonales a los residuos por construcción del modelo de MCO). Finalmente,para construir el coeciente de R2 se determina qué parte de la varianza total esexplicada por el modelo, es decir,

⇒ 1 =ESS

TSS+

RSS

TSS

⇔ R2 =ESS

TSS= 1 −

RSS

TSS.

(c) (10 puntos) Derive una expresión para el estimador de la varianza de los parámet-ros estimados por MCO. Explicite los supuestos que utilice.

Sabemos que el estimador de MCO es insesgado (bajo los supuestos del mode-lo) y es igual a

β = (X ′X)−1X ′Y

= (X ′X)−1X ′(Xβ + u)

= β + (X ′X)−1X ′u).

7

Page 190: Magno Econometría

Por lo tanto, la varianza es

V ar(β) = E[(β − E[β])(β − E[β])′] = E[((X ′X)−1X ′u)((X ′X)−1X ′u)′]

= E[(X ′X)−1X ′uu′X(X ′X)−1]

= (X ′X)−1X ′E[uu′]X(X ′X)−1

= (X ′X)−1X ′σ2uIX(X ′X)−1

V ar(β) = σ2u(X

′X)−1.

Esto es porque se asume que los errores son homocedásticos y que no existe auto-correlación.

8

Page 191: Magno Econometría

F Values for α = 0.10

d1

d2 1 2 3 4 5 6 7 8 9

1 39.86 49.5 53.59 55.83 57.24 58.2 58.91 59.44 59.86

2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38

3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24

4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94

5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32

6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96

7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72

8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56

9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44

10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35

11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.3 2.27

12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21

13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16

14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12

15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09

16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06

17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03

18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00

19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98

20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96

21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95

22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93

23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92

24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91

25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89

26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88

27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87

28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87

29 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1.86

30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85

40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79

60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74

120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68

inf 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63

919

F Value for α = 0.10

d1

d2 10 12 15 20 24 30 40 60 120 inf

1 60.19 60.71 61.22 61.74 62 62.26 62.53 62.79 63.06 63.33

2 9.39 9.41 9.42 9.44 9.45 9.46 9.47 9.47 9.48 9.49

3 5.23 5.22 5.20 5.18 5.18 5.17 5.16 5.15 5.14 5.13

4 3.92 3.90 3.87 3.84 3.83 3.82 3.80 3.79 3.78 3.76

5 3.30 3.27 3.24 3.21 3.19 3.17 3.16 3.14 3.12 3.10

6 2.94 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.72

7 2.70 2.67 2.63 2.59 2.58 2.56 2.54 2.51 2.49 2.47

8 2.54 2.50 2.46 2.42 2.40 2.38 2.36 2.34 2.32 2.29

9 2.42 2.38 2.34 2.30 2.28 2.25 2.23 2.21 2.18 2.16

10 2.32 2.28 2.24 2.20 2.18 2.16 2.13 2.11 2.08 2.06

11 2.25 2.21 2.17 2.12 2.10 2.08 2.05 2.03 2.00 1.97

12 2.19 2.15 2.10 2.06 2.04 2.01 1.99 1.96 1.93 1.90

13 2.40 2.10 2.05 2.01 1.98 1.96 1.93 1.90 1.88 1.85

14 2.10 2.05 2.01 1.96 1.94 1.91 1.89 1.86 1.83 1.80

15 2.06 2.02 1.97 1.92 1.90 1.87 1.85 1.82 1.79 1.76

16 2.03 1.99 1.94 1.89 1.87 1.84 1.81 1.78 1.75 1.72

17 2.00 1.96 1.91 1.86 1.84 1.81 1.78 1.75 1.72 1.69

18 1.98 1.93 1.89 1.84 1.81 1.78 1.75 1.72 1.69 1.66

19 1.96 1.91 1.86 1.81 1.79 1.76 1.73 1.70 1.67 1.63

20 1.94 1.89 1.84 1.79 1.77 1.74 1.71 1.68 1.64 1.61

21 1.92 1.87 1.83 1.78 1.75 1.72 1.69 1.66 1.62 1.59

22 1.90 1.86 1.81 1.76 1.73 1.70 1.67 1.64 1.60 1.57

23 1.89 1.84 1.80 1.74 1.72 1.69 1.66 1.62 1.59 1.55

24 1.88 1.83 1.78 1.73 1.70 1.67 1.64 1.61 1.57 1.53

25 1.87 1.82 1.77 1.72 1.69 1.66 1.63 1.59 1.56 1.52

26 1.86 1.81 1.76 1.71 1.80 1.65 1.61 1.58 1.54 1.50

27 1.85 1.80 1.75 1.70 1.67 1.64 1.60 1.57 1.53 1.49

28 1.84 1.79 1.74 1.69 1.66 1.63 1.59 1.56 1.52 1.48

29 1.83 1.78 1.73 1.68 1.65 1.62 1.58 1.55 1.51 1.47

30 1.82 1.77 1.72 1.67 1.64 1.61 1.57 1.54 1.50 1.46

40 1.76 1.71 1.66 1.61 1.57 1.54 1.51 1.47 1.42 1.38

60 1.71 1.66 1.60 1.54 1.51 1.48 1.44 1.40 1.35 1.29

120 1.65 1.60 1.55 1.48 1.45 1.41 1.37 1.32 1.26 1.19

inf 1.60 1.55 1.49 1.42 1.38 1.34 1.30 1.24 1.17 1.00

920

Page 192: Magno Econometría

F Values for α = 0.05

d1

d2 1 2 3 4 5 6 7 8 9

1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5

2 18.51 19.00 19.16 19.25 19.3 19.33 19.35 19.37 19.38

3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00

5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18

10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02

11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90

12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80

13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71

14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65

15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54

17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49

18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46

19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42

20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39

21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37

22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34

23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32

24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30

25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28

26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27

27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25

28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24

29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22

30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12

60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04

120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96

inf 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88

921

F Values for α = 0.05

d1

d2 10 12 15 20 24 30 40 60 120 inf

1 241.9 243.9 245.9 248.0 249.1 250.1 251.1 252.2 253.3 254.3

2 19.4 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.5

3 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53

4 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63

5 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36

6 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67

7 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23

8 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93

9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71

10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54

11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40

12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30

13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21

14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13

15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07

16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01

17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96

18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92

19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88

20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84

21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81

22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78

23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76

24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73

25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71

26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69

27 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67

28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65

29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64

30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62

40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51

60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39

120 1.91 1.83 1.75 1.66 1.10 1.55 1.50 1.43 1.35 1.25

inf 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00

922

Page 193: Magno Econometría

F Values for α = 0.01

d1

d2 1 2 3 4 5 6 7 8 9

1 4052 4999.5 5403 5625 5764 5859 5928 5982 6022

2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39

3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35

4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66

5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16

6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98

7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72

8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91

9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35

10 10.04 7.56 6.55 5.99 5.64 5.39 5.2 5.06 4.94

11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63

12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39

13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.14

14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03

15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89

16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78

17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68

18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60

19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52

20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46

21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40

22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35

23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30

24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26

25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22

26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18

27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15

28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12

29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09

30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07

40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89

60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72

120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56

inf 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41

923

F Values for α = 0.01

d1

d2 10 12 15 20 24 30 40 60 120 inf

1 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366

2 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50

3 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13

4 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46

5 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02

6 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88

7 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65

8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86

9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31

10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91

11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60

12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36

13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17

14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00

15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87

16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75

17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65

18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57

19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49

20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42

21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36

22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31

23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26

24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21

25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17

26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13

27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10

28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06

29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03

30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01

40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80

60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60

120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38

inf 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00

924

Page 194: Magno Econometría

Econometría IProfesoras: Claudia Sanhueza

Javiera Vásquez.Otoño 2006

Pauta Solemne

Comentes: (30 puntos)

1. En un modelo de regresión lineal simple β0 = 3, 0 y β1 = 2, 0,

a) la media de Y es 3,0 + 2,0 = 5,0.

b) se espera que Y aumente en 2,0 si X aumenta en 1 unidad.

c) los supuestos de mínimos cuadrados se cumplen.

d) el valor de β0 no importa.

R: La media de Y se describe como β0 + β1x, luego dependerá del valor de X cual sea lamedia de Y . Respecto a que se cumplan los supuestos de MCO, es necesario tener masinformación, y la afirmación de que el valor de β0 carece de cualquier fundamento. Porultimo la afirmación verdadera es el hecho de que dado que β1 = 2, 0, es la pendiente eneste modelo, representa el cambio marginal de una unidad adicional de X, por lo tantose espera que Y aumente en dos unidades por cada unidad adicional de X.

2. En el modelo de regresión lineal Y = Xβ + u, el estimador MCO alcanza la cota inferiorde Cramer-Rao.

R: Falso. Bajo el supuesto de normalidad del término de error, se tiene que el estimadorMCO y MV de β son equivalentes, pero no así el estimador de la varianza del error σ2.Entonces bajo el supuesto de normalidad tenemos que el estimador MCO de β alcanza lacota inferior de Cramer-Rao, pero no así el estimador de σ2.

3. En un modelo de regresión simple Y = α + Xβ + u, si la correlación entre Y y X espositiva, el parámetro estimado de β también será positivo.

R: Verdadero. En un modelo de regresión lineal simple es posible escribir el parámetro βde la siguiente forma:

β =Cov(Y,X)V ar(X)

= ρx,y ·√

V ar(Y )√V ar(X)

por tanto como el ratio entre las raíces de las varianzas de X e Y es siempre positivo, elsigno del parámetro esta directamente determinado por el signo de la correlación.

4. Cuando hay un problema de variable omitida,

a) el supuesto que E(ui|Xi) = 0 es violado.

b) el supuesto que (Xi, Yi) son iid es violado.

c) el supuesto que (Xi, ui) tiene cuarto momento finito es violado.

d) hay perfecta multicolinealidad.

1

Page 195: Magno Econometría

R: El problema de variable omitida (se dice solo variable omitida y no variable omitidarelevante porque si dicha variable no fuera relevante no sería omitida) implica que elerror µ de la regresión del modelo incorrecto esta capturando la información acerca dela variable omitida, por tanto si la variable omitida es correlacionada con alguna de lasvariables incluidas luego E(ui|Xi) 6= 0. El resto de las afirmaciones no son implicanciasderivadas del problema de variable omitida.

5. Si no hay suficientes variables explicativas en la regresión entonces los parámetros esti-mados estarán sesgados.

R: El hecho de que el numero de regresores afecte el sesgo de un parámetro estimadoes falso, sin embargo si se excluyen variables relevantes, y ocurre que ellas están cor-relacionadas con las incluidas, esto producirá un sesgo, pero una cantidad reducida devariables explicativas, a priori, no tiene implicaríais en el sesgo de un estimador.

6. Es equivalente realizar un Test F de significancia global del modelo y realizar varios testde significancia individual de todos los parámetros.

R: Falso, aunque realicemos todos los test de significancia individual para las pendi-entes del modelo este resultado no va a ser equivalente al test de significancia global, yaque este último considera la correlación entre las variables explicativas. Puede existir uncaso extremo que las variables tengan una correlación muy alta y esta varianza conjuntaexplique el comportamiento de la variable independiente, aunque cada una por separadono es capaz de explicar el comportamiento de Y .

2

Page 196: Magno Econometría

Demostraciones (30 puntos)

1. (15 puntos) En un modelo de regresión lineal con dos regresores yi=β0+β1X1i+β2X2i+ui.Demuestre que si los errores son homosedásticos y n es grande entonces la varianza delestimador de β1 se puede escribir como:

σ2β1

=1n· 11− ρ2

X1X2

· σ2u

σ2X1

donde ρ2X1X2

es el coeficiente de correlación poblacional entre los regresores X1 y X2, yσ2

X1es la varianza poblacional de X1

Respuesta:

Primero expresamos el modelo en desviaciones con respecto a la media:

Yi − Y = β1(X1i − X1) + β2(X2i − X2) + (ui − ˆu)

Como ˆu = 0 entonces queda:

Yi = β1X1i + β2X2i + ui

Donde ˜ representa que la variable esta en desviaciones con respecto a su media. Lamatriz X y la X ′X quedan:

X =

X11 X21

......

X1n X2n

, X ′X =

[ ∑X2

1i

∑X1iX2i∑

X2iX1i

∑X2

2i

]

Ahora invertimos X ′X y la multiplicamos por σ2u para obtener la matriz de varianzas y

covarianzas de β

σ2u(X ′X)−1 =

σ2u∑

X21i

∑X2

2i − (∑

X1iX2i)2

[ ∑X2

2i −∑X1iX2i

−∑X2iX1i

∑X2

1i

]

De la cual podemos obtener una expresión para la varianza de β1:

V (β1) =σ2

u

∑X2

2i∑X2

1i

∑X2

2i − (∑

X1iX2i)2

Ahora, sabemos que la correlación entre 2 variables esta definida como:

ρX1,X2 =Cov(X1i, X2i)√V (X1i)V (X2i)

=∑

X1iX2i√∑X2

1i

∑X2

2i

Ahora obtenemos ρ2X1,X2

y luego lo reemplazamos en la expresión para V (β1)

ρ2X1,X2

=(∑

X1iX2i)2∑X2

1i

∑X2

2i

3

Page 197: Magno Econometría

V (β1) =σ2

u

∑X2

2i∑X2

1i

∑X2

2i − ρ2X1,X2

∑X2

1i

∑X2

2i

=σ2

u

∑X2

2i∑X2

1i

∑X2

2i(1− ρ2X1,X2

)

Luego simplificando la expresión, y reemplazando la varianza poblacional de X1

V (β1) =σ2

u∑X2

1i(1− ρ2X1,X2

)=

1n· 11− ρ2

X1,X2

· σ2u

σ2X1

4

Page 198: Magno Econometría

2. (15 puntos) Demuestre que la varianza del error de una predicción individual, en unmodelo de regresión lineal simple, se puede expresar de la siguiente forma:

V AR(Y0 − Y0) = σ2

[1 +

1n

+(X0 −X)2∑

xi

]

R: Si se desea predecir el valor individual de Y correspondiente a X = X0, es decir, se quiereobtener:

Y0 = β1 + β2X0 + u0

Se predice de la siguiente forma:

Y0 = β1 + β2X0

El error de predicción Y0 − Y0 es:

Y0 − Y0 = β1 + β2X0 + u0 − (β1 + β2X0) (1)

= (β1 − β1) + (β2 − β2)X0 + u0 (2)

Por consiguiente,

E[Y0 − Y0] = E(β1 − β1) + E(β2 − β2)X0 + E(u0)= 0

porque β1 y β2 son insesgados, X0 es un número fijo y E(u0) es cero pos los supuestos típicos.Elevando (2) al cuadrado y tomando valor esperado se obtiene:

V [Y0 − Y0] = V (β1) + V (β2)X20 + 2X0cov(β1, β2) + V (u0) (3)

Además tenemos que:

V (β1) =∑

X2i

n∑

x2i

σ2 (4)

V (β2) =σ2

∑x2

i

(5)

Cov(β1, β2) = X

(σ2

∑x2

i

)(6)

Reemplazando (4), (5) y (6) en (3):

V [Y0 − Y0] =∑

X2i

n∑

x2i

σ2 +σ2

∑x2

i

X20 + 2X0X

(σ2

∑x2

i

)+ σ2

V [Y0 − Y0] = σ2

[1 +

1n

+(X0 −X)2∑

x2i

]

5

Page 199: Magno Econometría

Ejercicio Matemático (20 puntos) Una muestra de 20 observaciones correspondientes almodelo:

Yi = α + βXi + u i = 1, ..., n

en el que los errores se distribuyen independiente e idénticamente normal con media cero yvarianza constante, ofrece los siguientes datos:

∑Yi = 21,9

∑(Yi − Y )2 = 86,9

∑(Xi −X)(Yi − Y ) = 106,4

∑Xi = 186,2

∑(Xi −X)2 = 215,4

Estimar α y β y calcular los errores estándar, estimar el valor de la media condicional corre-spondiente a X = 10, y encontrar un intervalo de confianza del 95% para esta media.

Respuesta:

Utilizando MCO en desvios, los estimadores de α y β son:

β =∑

(Xi −X)(Yi − Y )∑(Xi −X)2

=106,4215,4

= 0,494

α = Y − βX =21,920

− 0,494186,220

= −3,504

Para calcular el error estándar, σu =√∑

u2

n−k , necesitamos la suma de los errores al cuadrado.Esta se puede obtener de la siguiente ecuación:

∑u2 =

∑(Yi − α− βXi)2

=∑

(Y 2i + α2 + β2X2

i − 2αYi − 2βXiYi + 2αβXi)

=∑

Y 2i + nα2 + β2

∑X2

i − 2α∑

Yi − 2β∑

XiYi + 2αβ∑

Xi (7)

Para obtener∑

u2 hay que obtener los valores que falta, que son∑

XiYi,∑

X2i y

∑Y 2

i :

∑(Xi − X)(Yi − Y ) = =

∑XiYi − nXY

⇒∑

XiYi =∑

(Xi − X)(Yi − Y ) + nXY

= 106,4 + 20 · 9,31 · 1,095∑XiYi = 310,289 (8)

∑(Xi − X)2 =

∑X2

i − nX2

⇒∑

X2i =

∑(Xi − X)2 + nX2

= 215,4 + 20 · 9,312

∑X2

i = 1948,922 (9)

6

Page 200: Magno Econometría

∑(Yi − Y )2 =

∑Y 2

i − nY 2

⇒∑

Y 2i =

∑(Yi − Y )2 + nY 2

= 86,9 + 20 · 1,0952 (10)

Reemplazando 8,9 y 10 en 7 queda:

∑u2 = 34,343

Por lo tanto, el error estándar σu =√∑

u2

n−k es:

σu =

√ ∑u2

n− k

=

√34,34320− 2

σ2u = 1,908

σu = 1,381

El valor de la media condicional para X = 10 es:

Y0 = α + β ·X0

Y0 = −3,504 + 0,494 · 10Y − 0 = 1,436

La desviación estándar del error de predicción:

σ2e = σ2

u(1 + X0(X ′X)−1X ′0)

La que para un modelo con constante y pendiente se resume en:

σ2e = σ2

u

(1 +

∑(Xi −X0)2

n ·∑(Xi − X)2

)

= 1,908(1 +2500,9

20 · 4308)

σ2e = 3,017

σe = 1,737

7

Page 201: Magno Econometría

El t de tabla para un test de dos colas con un 95% de confianza es tt = 2,101, por lo que elintervalo de confianza queda:

Y 0 − tt,α/2 · σe ≤ Y 0 ≤ Y 0 + tt,1−α/2 · σe

1,436− 2,101 · 1,737 ≤ Y 0 ≤ 1,436 + 2,101 · 1,737−2,213 ≤ Y 0 ≤ 5,085

8

Page 202: Magno Econometría

Ejercicio Empírico (40 puntos)

En la Table 5.2 se presentan los resultados de las regresiones de desempeño educacional en larazón profesor-alumno y otras variables de control de características de los estudiantes usandocolegios del grado K-8 de los distritos del Estado de California en Estados Unidos. EL modelogeneral es:

yi = c + β1X1i + β2X2i + β3X3i + β4X4i + ui

Donde y es el puntaje promedio de los colegios en el distrito (desempeño educacional), X1i es larazón profesor alumno, X2i es el porcentaje de alumnos que no saben inglés, X3i es el porcenta-je de alumnos que tienen derecho a almuerzo subsidiado, X4i es el porcentaje de los ingresosdel colegio que proviene del Gobierno, y c es el intercepto. SER es la desviación estándar dela regresión (σ2), R

2es el R cuadrado ajustado, y n es el número de observaciones de la regresión.

Notar que las columnas indican las variables explicativas que se incluyen en la regresión. Notodas ellas contienen todas las variables explicativas y controles.

9

Page 203: Magno Econometría

Las desviaciones estándares de los parámetros estimados se encuentra entre paréntesis aba-jo de los estimadores.

Un coeficiente individual es estadísticamente significativo al nivel 5% (*), nivel 1% (**) usandoun test de dos colas.

Usando los resultados de la Tabla 5.2 adjunta conteste las siguientes preguntas:

1. En la regresión de la columna (3), el valor estimado de β1 es -1,00. Qué significa un valorde -1,00 en esta regresión?

R: Mientras mas alumnos sean por profesor, existe una incidencia negativa sobre el punta-je estimado, además este efecto es estadísticamente distinto de cero al 1% de significancia.En otras palabras, si el ratio alumnos/profesores aumenta en una unidad, se espera queel promedio caiga en un punto, según nuestra especificación.

2. Usando los resultados de la columna (3), construya un intervalo de confianza para β1 del99%.

R: Un intervalo de confianza de 1 − α de significancia, con varianza desconocida y T-kgrados de libertad, se define como:

Pr[β1 − t1−α2 ,T−k δ(β1)

< β1 < β1 + t1−α2 ,T−k δ(β1)

] = 1− α (1)

Remplazando valores1

−1− 2, 575(0, 27) < β1 < −1 + 2, 575(0, 27) (2)

−1, 69525 < β1 < −0, 30475 (3)

3. Construya el R2 de la regresión en la columna (3).

R: Recordemos que:

R2 = 1− (1−R2)[

T − 1T − k

](4)

Despejando para R2:

R2 = 1 +[T − k

T − 1

](R2 − 1) (5)

Remplazando los datos:

R2 = 1 +[420− 4420− 1

](0, 773− 1) (6)

=⇒ R2 = 0, 7746 (7)

4. El R2en la regresión de la columna (3) es muchas mayor que la regresión de la columna

(1). Esto significa que puede ser eliminado un potencial sesgo de variable omitida? Ex-plique.

1Como el tamaño muestral es lo suficientemente grande, se puede usar una normal estandar para encontrarlos valores tipificados (T > 100).

10

Page 204: Magno Econometría

R: Es posible, ya que el R2, a diferencia del R2 el cual aumenta al incluir más regre-sores, corrige por los grados de libertad que se van perdiendo al incluir más regresores.Recordemos que R2 se define como:

R2 = 1 +(

µ′µ/(T − k)Y ′MY/(T − 1)

)(1)

Además posteriormente las variables que fueron omitidas en (1) e incluidas en (3) resul-taron ser significativas al 1%, por lo tanto, es probable que se este eliminado un potencialsesgo de variable relevante omitida.

5. Sea β4 el coeficiente de la variable “porcentaje de ingresos públicos".

a) Es β4 estadísticamente significativo en la regresión de la columna (4)? Construya unintervalo de confianza para β4 del 95% usando la regresión de la columna (4).

R: Por enunciado sabemos que es significativo al 1%. Recordemos la definición deun intervalo de confianza al 1− α :

Pr[β4 − t1−α2 ,T−k δ(β4)

< β4 < β4 + t1−α2 ,T−k δ(β4)

] = 1− α (1)

Remplazando valores:

−0, 79− 1, 96(0, 068) < β4 < −0, 79 + 1, 96(0, 068) (2)

−0, 92328 < β4 < −0, 65672 (3)

b) Es β4 estadísticamente significativo en la columna (5)? Construya un intervalo deconfianza para β4 del 95% usando la regresión de la columna (5).

R: Por enunciado sabemos que no es significativo al 5% ni al o %. Usando la definiciónde un intervalo de confianza:

0, 048− 1, 96(0, 059) < β4 < 0, 048 + 1, 96(0, 059) (4)

−0, 06764 < β4 < 0, 16364 (5)

Notemos que el intervalo de confianza pasa por cero.

c) Explica porque las respuestas de a y b son diferentes.

R: Por que en (4) se omitió X3, la cual esta correlacionada con X4, es decir queβ4 en (3) esta siendo sub estimada, ya que cov(X3, X4) 6= 0, la intuición de este ra-zonamiento es que mientras mayor sea la ayuda estatal, mayores serán los subsidiosde almuerzos otorgados. Como ejemplo de esto, cuando en el modelo lineal simple,se omite una variable relevante, obtenemos:

E(β1) = βi +(

cov(X1, X2)V (X1)

)β2 (6)

Siendo X2 la variable relevante omitida, el signo del sesgo del parámetro dependeráde la cov(X1, X2) y del beta de la variable omitida.

11

Page 205: Magno Econometría

6. Se lleva a cabo un test F para testear la hipótesis nula H0 : β2 = β4 = 0 para laespecificación de la regresión de la columna (5). El valor calculado del test es 6.88.

a) Es H0 rechazada al 1% de significancia? Explique.

R: El valor tipificado es: F = 6, 88, el cual debe ser comparado con el valor critico,que se obtiene de una F(2,415), ya que se tienen 2 restricciones y 415 grados de liber-tad con 1% de significancia. La hipótesis es rechazada, ya que F(2,415) ≈ 4, 6, por loque nuestro valor tipificado es mucho mayor al valor critico, es decir cae en la zonade rechazo.

b) Está el punto β2 = β4 = 0 contenido en el intervalo de confianza del conjunto al99% para β2 y β4? Explique.

R: Usando un intervalo de confianza para β2 y β4:

Pr[(β2+β4)−t1−α2 ,T−k δ(β2+β4)

< β2+β4 < (β2+β4)+t1−α2 ,T−k δ(β2+β4)

] = 1−α (1)

Recordemos que δ(β2 + β4) = δ(β2) + δ(β4) + 2cov(β2, β4), si suponemos que lacovarianza es pequeña, entonces (1) es aproximadamente:

−0, 082− 2, 575(0, 036 + 0, 059) < β2 + β4 < −0, 082 + 2, 575(0, 036 + 0, 059) (2)

−0, 326625 < β2 + β4 < 0, 162625 (3)

El intervalo de confianza pasa por 0, por lo cual el punto β2 = 0 y β4 = 0 estacontenido en el intervalo.

7. En la regresión representada en la columna (1), está la razón profesor alumno no correla-cionada con el error de la regresión? Es esta correlación positiva o negativa?

R: Existe una correlación, ya que hay variables relevantes omitidas. Por lo cual se vi-ola el supuesto que E(µi, Xi) = 0. En otras palabras, en las innovaciones o en el términode error, existen componentes sistemáticos, no ortogonales a las variables incluidas, queexplican la variable dependiente.

8. Comparando las columnas (1) y (2), crees que la razón profesor alumno y el porcentajede aprendices de inglés correlacionado positiva o negativamente? Explique.

R: A modo de dar una intuición del problema, usamos el modelo lineal simple, parapoder observar como afecta la no inclusión de una variable relevante, en cuyo caso nue-stro estimador estará sesgado:

E(β1) = βi +(

cov(X1, X2)V (X1)

)β2 (1)

Siendo X2 la variable relevante omitida, el signo del sesgo del parámetro dependerá dela cov(X1, X2) y del beta de la variable omitida. En (1), β1 esta siendo sub estimadocomparado con (2). La correlación es positiva ya que β2 < 0 en el modelo (2), por lo cualcov(X1, X2) > 0.

9. Supongamos que el tamaño muestral aumenta al doble, entonces n = 840. Como esperasque cambien los errores estándares de los estimadores MCO? Explique.

12

Page 206: Magno Econometría

R: Si T aumenta el doble, contamos con una mayor parte de la población, por lo cualestaremos mas cerca de estimar los verdaderos parámetros poblacionales, además nuestrasestimaciones son más precisas, ya que aumenta la variabilidad de las variables indepen-dientes, con esto la varianza de los betas será menor. Como la estimación es ahora masprecisas, los errores de MCO son menores.

13

Page 207: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Solemne

Semestre: Primavera 2006Profesores: José Miguel Benavente, Rodrigo MonteroTiempo de duración: 110 minutosNo hay preguntas de ningún tipo para los ayudantes

1. Comente en no más de 10 líneas las siguientesafirmaciones (30 puntos)

1. El supuesto de normalidad es clave para que el estimador de mínimoscuadrados ordinarios sea MELI.Respuesta. Falso. El estimador de mínimos cuadrados ordinarios es elmejor estimador lineal e insesgado. Dentro de los supuestos necesarios paraque eso se cumpla están: (i) el modelo es lineal (Y = Xβ +µ), (ii) la matrizX es de rango completo, (iii) los errores (disturbios) son esféricos, es decir,tienen media cero, y covarianza nula, y (iv) los regresores son no estocás-ticos. El supuesto de normalidad sólo es necesario para realizar inferenciaestadística, puesto que de esa manera se obtiene una distribución conocidapara el vector de parámetros estimados.

2. Mientras mayor sea la variabilidad de los datos más ineficientes serán lasestimaciones de MCO.Respuesta. Considere la varianza del estimador β en el contexto del modelode dos variables:

var(β) =σ2∑x2

El denominador de la expresión representa la variablidad de los x’s, es decir,a la variabilidad de los datos. De esta manera, mientras mayor sea ésta,menor será la varianza del estimador MCO, y por lo tanto, más precisas(eficientes) serán las estimaciones. El comente es falso.

1

Page 208: Magno Econometría

3. Si una variable es económicamente significativa, entonces, no debiera ocur-rir que estadísticamente no lo fuera.Respuesta. Falso. En términos económicos, la signficancia de la variableviene determinada por el modelo teórico subyacente. Sin embargo, a nivelestadístico la significancia estará determinada en parte por la naturaleza ycaracterísticas de los datos. En particular, la variable podría ser estadísti-camente no significativa debido a una alta colinealidad en los datos (covar-ianza). Esto ocurre pues mientras mayor sea ésta, mayor será también lavarianza del estimador, y por lo tanto, más probabilidades hay que el ceroesté contenido en el intervalo de confianza asociado.

4. El análisis econométrico permite descartar teorías, y de esa manera, pro-gresar en el entendimiento de la economía.Respuesta. En parte esto es correcto. En la medida que el análisis econométri-co sea el apropiado, y que los datos no estén muy contaminados, entonces,es posible validar teorías a partir de éste. Sin embargo, las conclusiones detodo análisis econométrico deben ponderarse adecuadamente en función delas limitaciones que éste ofrece. Ahora bien, si existe abundante evidenciaempírica que apoya cierta afirmación teórica, entonces, habría fundamentopara poder establecer que el modelo explica relativamente bien la realidad.

5. La singularidad de la matriz (X ′X) no afecta la precisión de las estima-ciones.Respuesta. La precisión de las estimaciones vienen dadas por su varianza,es decir:

var(β) = σ2(X ′X)−1 (1)

En la medida que la matriz (X ′X)−1 sea singular, esto es, no invertible,entonces, su inversa no existe, pues su determinante tiende a cero. Por lotanto, se tendrán varianzas gigantes, y en el límite, es decir, cuando lamatriz es singular, éstas no se podrán calcular. Por lo tanto, el comente esfalso.

6. Siempre es mejor utilizar un sólo modelo para predecir, en lugar de escogeruna combinación de distintos modelos.Respuesta. Falso. En la medida que se reconoce que ningún modelo esperfecto, y que por lo tanto, los defectos de uno pueden ser las virtudesde otro, entonces, al tomar más de un modelo para realizar proyecciones, yhacer una ponderación de éstas, será posible obtener mejores estimaciones.Esto ocurriría pues los errores de unos con otros tenderían a cancelarse,obteniéndose así una mejor predicción.

2

Page 209: Magno Econometría

2. Demostraciones (30 puntos)1. Considere el siguiente modelo: Yi = α + βXi + µi. Demuestre que:

var(αMCO) = σ2

[1

n+

X2∑x2

i

]Respuesta. Se sabe que:

α = Y − βX = α + βX + µ − βX = α − (β − β)X + µ

Por lo tanto:α − α = −(β − β)X + µ

Por lo tanto, la varianza de α puede escribirse como:

E(α−α)2 = E[−(β − β)X + µ]2 = X2E(β − β)2 + E(µ2)− 2XE[(β − β)µ]

Por otro lado, se sabe que:

E(β − β)2 =σ2∑x2

y:

E(µ2) =σ2

n

Además:E[(β − β)µ] = E

[(∑xµ∑x2

)1

n

∑µ

]E[(β − β)µ] =

1

n∑

x2E[(x1µ1 + x2µ2 + · · · + xnµn)(µ1 + µ2 + · · · + µn)]

E[(β − β)µ] =σ2

∑x

n∑

x2= 0

Reemplazando estos términos en la expresión original, se llega a lo siguiente:

E(α − α)2 = X2 σ2∑x2

+σ2

n

Finalmente:E(α − α)2 = σ2

[1

n+

X2∑x2

]

3

Page 210: Magno Econometría

2. Demuestre que σ2 =∑

µ2i

n−kes un estimador insesgado de σ2.

Respuesta. Considere lo siguiente:

µ = Y − Xβ = Y − X(X ′X)−1X ′Y = MY

con:M = I − X(X ′X)−1X ′

donde M es una matriz simétrica e idempotente. Note además lo siguiente:

µ = MY = M(Xβ + µ) = Mµ.

Un estimador natural de σ2 sería la suma de los errores estimados al cuadra-do, es decir:

µ′µ =∑

µ2

Aplicando esperanza:

E(µ′µ) = E(µ′M ′Mµ) = E(µ′Mµ)

Dado que la traza de un escalar es un escalar, se tiene:

E(µ′Mµ) = E[tr(µ′Mµ)] = E[tr(µµ′M)] = σ2tr(M)

Reemplazando M :

E(µ′Mµ) = σ2tr(I)−σ2tr[X(X ′X)−1X ′] = σ2tr(I)−σ2tr[(X ′X)−1(X ′X)]

Por lo tanto:E(µ′Mµ) = σ2(n − k)

Es decir, la suma de los cuadrados de los errores estimados es un estimadorsesgado de σ2. Por lo tanto, y dado el resultado anterior:

σ2 =

∑µ2

i

n − k

corresponde a un estimador insesgado de σ2.

4

Page 211: Magno Econometría

3. Matemático (20 puntos)Se quiere explicar la evolución de la demanda de pescado de una ciudad (Dt),

en función del ingreso medio disponible (Yt). Para ello se dispone de datos delos cien últimos meses, (donde la demanda viene medida en toneladas métricas,TM, y el ingreso disponible en millones de pesos). Se dispone de la siguienteinformación: ∑

Yt = 6∑

Dt = 3∑

D2t = 10∑

Y 2t = 36

∑DtYt = 15

con t = 1, 2, ..., 100.

1. Escriba un modelo de regresión adecuado para la estimación de la demandade pescado en función del ingreso y calcule los coeficientes estimados porMCO.Respuesta. El modelo a estimar sería el siguiente:

Dt = β0 + β1Yt + εt

con t = 1, ..., 100, y εt correspondería al término de error con media cero yvarianza homoscedástica. La estimación viene dada por:

β = (X ′X)−1X ′D (2)

Se tiene lo siguiente:(β0

β1

)=

(100 66 36

)−1 (3

15

)=

(0, 0050510, 415825

)2. Se piensa que una forma mejor de estimar la demanda sería incluyendo

además del ingreso medio disponible, los precios de pescado (Pt) como nuevavariable explicativa. Sabiendo que:∑

Pt = 4∑

YtPt = 30∑

P 2t = 100

∑PtDt = 5

calcule los nuevos coeficientes estimados.Respuesta. El nuevo a modelo a estimar viene dado por:

Dt = β0 + β1Yt + β2Pt + εt

Aplicando MCO se tiene lo siguiente: β0

β1

β2

=

100 6 46 36 304 30 100

−1 3155

=

0, 0040410, 499282−0, 09995

5

Page 212: Magno Econometría

3. Obtenga el R2 y R2 de los modelos estimados. Comente qué modelo seríapreferido en base a los resultados anteriores.Respuesta. Se sabe que:

D = D + ε = Xβ + ε

Por lo tanto:

D′D = (D + ε)′(D + ε) = D′D + ε′ε = βX ′Xβ + ε′ε = βX ′D + ε′ε (3)

Por otro lado, la variabilidad de D viene dada por:∑(Dt − D)2 =

∑D2

t − nD2 = D′D − nD2

Por lo tanto, la descomposición de la varianza viene dada por:

D′D − nD2 = (βX ′D − nD2) + ε′ε (4)

es decir: TSS = ESS + RSS. De esta manera, el R2 del primer modelo vienedado por:

R2 =βX ′D − nD2

D′D − nD2= 0, 621 (5)

y el R2 por:

R2 = 1 − (1 − R2)

(n − 1

n − k

)= 0, 617 (6)

Para el segundo modelo los resultados son:

R2 =βX ′D − nD2

D′D − nD2= 0, 697 (7)

y el R2 por:

R2 = 1 − (1 − R2)

(n − 1

n − k

)= 0, 691 (8)

El modelo preferido será aquel que tenga el mayor R2, es decir, el segundomodelo. No sería correcto fijarse en el R2, pues éste es monotónico frente a laincorporación de regresores adicionales, mientras que el R2 toma en cuenta lapérdida en grados de libertad en que se incurre.

6

Page 213: Magno Econometría

4. Analítico (20 puntos)Considere la siguiente estimación que ha sido generada a partir de la informa-

ción proporcionada por la Encuesta de Caracterización Nacional (CASEN) parael año 2003:

Variable Coeficiente Desviación Estándar

Años de escolaridad 0,1202 0,0007037Experiencia laboral 0,0212 0,0006365

Experiencia laboral al cuadrado -0,0000938 0,0000127Constante 5,0379 0,0112151

El modelo estimado es el siguiente:

Yi = β0 + β1X1i + β2X2i + β3X3i + µi

donde Yi corresponde al logaritmo del salario por hora, X1i son los años de esco-laridad, X2i representa la experiencia laboral del individuo, y X3i es el cuadradode ésta (es decir, X2

2i).

1. ¿Son económicamente significativos los coeficientes asociados a las pendi-entes?Respuesta. La teoría económica establece que los factores productivosdeben ser retribuidos de acuerdo a la contribución marginal que hacen alproceso productivo, es decir, de acuerdo a su productividad. La productivi-dad de los trabajadores no es observable, por lo que ésta suele aproximarsemediante las variables incluidas en este modelo, esto es, años de escolaridady experiencia laboral. El cuadrado de esta última trata de capturar el perfildecreciente que tiene el premio a la experiencia en el mercado laboral (dehecho, el coeficiente asociado es negativo).

2. ¿Son estadísticamente significativos los coeficientes asociados a las pendi-entes?Respuesta. Para evaluar esto se requieren construir los test t de cada unode los coeficientes estimados:

tβ1=

β1

σβ1

=0, 1202

0, 0007037= 170, 81

tβ2=

β2

σβ2

=0, 0212

0, 0006365= 33, 3

7

Page 214: Magno Econometría

tβ3=

β3

σβ3

=−0, 0000938

0, 0000127= −7, 38

Por lo tanto, las pendientes del modelo son estadísticamente distintas decero, pues el intervalo de confianza (al 95 %) no contendría el cero, ya quelos t∗ son todos mayores que dos (2) en valor absoluto.

3. ¿Es la constante estadísticamente significativa? Si así fuera, ¿tendría senti-do desde un punto de vista económico?Respuesta. A continuación se presenta el test t para la constante del mod-elo:

tβ0=

β0

σβ0

=5, 0379

0, 0112151= 449, 2

Dado que el t∗ es mayor que dos, entonces, la constante es significativa. Esteresultado tiene sentido desde un punto de vista económico, pues reflejaría dealguna forma el salario mínimo que paga el mercado, es decir, independientedel capital humano de la persona ésta recibiría al menos dicha cantidad.

4. ¿Cuál es el salario (mensual) estimado para una persona con 14 años deescolaridad, y cuatro años de experiencia laboral? (Asuma que la jornadalaboral es de 45 horas a la semana, y que el mes tiene 4,2 semanas)Respuesta. La predicción es la siguiente:

Yi = β0 + β1X1i + β2X2i + β3X3i

Reemplazando:

Yi = 5, 0379 + 0, 1202(14) + 0, 0212(4) − 0, 0000938(16) = 6, 8039992

Aplicando e(•) se llega a que el salario por hora estimado es de $901. Co-mo la persona trabaja 45 horas a la semana, y el mes tiene 4,2 semanas,entonces, el salario mensual estimado para esta persona es de $170.289.

8

Page 215: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Solemne

Semestre: Primavera 2007Profesores: José Miguel Benavente, Rodrigo MonteroAyudantes: Rodrigo Bravo, Felipe Ríos, Loreto SilvaTiempo de duración: 120 minutosNo hay preguntas de ningún tipo para los ayudantes

1. (30 puntos) Comente en no más de 10 líneaslas siguientes afirmaciones:

1. El estimador de mínimos cuadrados ordinarios (MCO) maximiza el valordel R2.Respuesta. Verdadero. Dado que el estimador MCO minimiza la suma delos residuos al cuadrado, entonces, automáticamente lo que hace es maxi-mizar la el valor del R2, el cual se define de la siguiente manera:

R2 = 1−∑

u2i∑

y2i

donde yi = Yi − Y .

2. Si un estimador es estadísticamente significativo, entonces, también es sig-nificativo desde un punto de vista económico.Respuesta. Falso. El hecho de que un coeficiente de una ecuación sea es-tadísticamente significativo, no quiere decir que sea significativo desde elpunto de vista económico. La significancia económica del coeficiente vienedada por el modelo en cuestión, el cual sustenta la inclusión de una deter-minada variable. Sin embargo, podría darse el caso que, por un problema delos datos, el coeficiente no sea estadísticamente significativo, aún cuando elmodelo establezca que dicha variable es relevante para explicar la variabledependiente (Y ).

1

Page 216: Magno Econometría

3. Una de las principales ventajas del test t es que es insensible al tamaño dela muestra, y por lo tanto, sus resultados siempre son confiables.Respuesta. Falso. Se sabe que el test t se define de la siguiente manera:

tβ =β

σβ

A su vez, sin perder generalidad, se sabe que para el caso del modelo de dosvariables (Yi = α + βXi + ui), la varianza del estimador MCO viene dadapor:

var(β) =σ2∑x2

i

donde:σ2 =

∑u2

i

N − k

donde k corresponde al número de parámetros a estimar. De esta manera,es posible apreciar cómo el tamaño muestral (N) afecta el valor del testt. Mientras mayor sea N menor es la varianza de β, y por ende, mayores el valor del test t. En consecuencia, es más probable que el coeficienteestimado resulte ser estadísticamente significativo.

2. Matemáticos1. (30 puntos) Sea el siguiente modelo:

Yi = α + βXi + ui

donde ui se encuentra independiente e idénticamente distribuido con mediacero y varianza σ2. Considere los siguientes dos estimadores alternativospara la pendiente del modelo (b):

b1 =Yn − Y1

Xn −X1

b2 =

∑Yi∑Xi

a) Determine si b1 y b2 son estimadores insesgados de β.Respuesta.

E(b1) = E

(Yn − Y1

Xn −X1

)=

1

Xn −X1

β(Xn −X1) = β

2

Page 217: Magno Econometría

ya que E(Yi) = α+βXi. Por lo tanto, b1 es un estimador insesgado deβ. Por otro lado:

E(b2) = E

( ∑Yi∑Xi

)=

1∑Xi

E(∑

Yi) =1∑Xi

∑(α + βXi)

Por lo tanto:

E(b2) =1∑Xi

(nα + β∑

Xi) =nα∑

Xi

+ β 6= β

Es decir, b2 es un estimador sesgado de β.

b) Encuentre las varianzas de b1 y b2.Respuesta. En primer lugar se debe establecer lo siguiente:

var(Yi) = var(α + βXi + ui) = σ2

ya que α y β son parámetros fijos, y Xi es una variable exógena almodelo (los valores de Xi son fijos. Luego:

var(b1) =1

(Xn −X1)2var(Yn − Y1) =

2σ2

(Xn −X1)2

ya que cov(Yi, Yj) = 0 para todo i 6= j, puesto que el término de error(ui) tiene una distribución independiente. Por otro lado:

var(b2) =1

(∑

Xi)2var(

∑Yi) =

nσ2

(∑

Xi)2

c) Muestre que var(b1) ≥ var(b), donde b corresponde al estimador demínimos cuadrados ordinarios para la pendiente del modelo.Respuesta. Se sabe que:

var(b) =σ2∑x2

i

donde xi = Xi − X. Luego, se debe demostrar lo siguiente:

2σ2

(Xn −X1)2≥ σ2∑

(Xi − X)2

o bien que:2∑

(Xi − X)2 ≥ (Xn −X1)2

3

Page 218: Magno Econometría

Se definen las siguientes variables, u = (X1− X) y v = (Xn− X). Porlo tanto:

2∑

(Xi − X)2 = 2(u2 +n−1∑i=2

(Xi − X)2 + v2) ≥ 2(u2 + v2)

Por otro lado:(Xn −X1)

2 = (v − u)2

Así, habría que probar que:

2(u2 + v2) ≥ (v − u)2 = v2 − 2vu + u2

Luego:u2 + v2 ≥ −2vu⇒ u2 + v2 + 2vu ≥ 0

Por lo tanto, para que var(b1) ≥ var(b), bastaría con probar que:

(u + v)2 ≥ 0

lo cual se cumple.

d) Muestre que existe un conjunto de datos Xi, con i = 1, 2, ..., n, paralos cuales se cumple que var(b2) < var(b). ¿Contradice este resultadoel Teorema de Gauss-Markov?Respuesta. Supongamos los siguientes datos: X1 = 1, X2 = 2 yX3 = 3. Luego:

var(b2) =nσ2

(∑

Xi)2=

3σ2

36= 0, 083σ2

Por otro lado:

var(b) =σ2∑x2

i

=σ2

(1− 2)2 + (2− 2)2 + (3− 2)2=

σ2

2= 0, 5σ2

Por lo tanto, var(b) ≥ var(b2), sin embargo, este resultado no con-tradice el teorema de Gauss-Markov ya que b2 no es un estimadorinsesgado de β.

2. (30 puntos) Considere la siguiente información sobre precios y cantidaddemandada:

4

Page 219: Magno Econometría

i Precio (P ) Cantidad (Q)1 1 892 1 863 1 744 1 795 1 686 1 847 0,95 1398 0,95 1229 0,95 10210 0,95 18611 0,95 17912 0,95 187

En base a estos datos, se plantea el siguiente modelo:

Qi = α + βPi + ei

Donde ei representa el término de error que cumple con los supuestos con-vencionales.

a) Encuentre los estimadores de mínimos cuadrados ordinarios (MCO)para α y β.Respuesta. La estimación para la pendiente del modelo viene dadapor:

β =

∑(Pi − P )(Qi − Q)∑

(Pi − P )2=

∑piqi∑p2

i

= −1450

Por otro lado, el intercepto se estima como:

α = Q− βP = 1530

b) Calcule la suma de los cuadrados totales (TSS), la suma de los cuadra-dos de la regresión (ESS), la suma de los errores al cuadrado (RSS) yel coeficiente R2.Respuesta. La suma de los cuadrados totales viene dada por:

TSS =∑

(Qi − Q)2 =∑

Q2i − nQ2 = 22760, 25

La suma de los cuadrados de la regresión viene dada por:

ESS = β2∑

(Qi − Q)2 = 15768, 75

5

Page 220: Magno Econometría

La suma de los errores al cuadrado viene dada por:

RSS = TSS − ESS = 22760, 25− 15768, 75 = 6991, 5

Y finalmente:R2 =

ESS

TSS=

15768, 75

22760, 25= 0, 69

c) Estime la varianza (σ2) del término de error (ei).Respuesta.

σ2 =e2

i

n− 2=

RSS

n− 2=

6991, 5

10= 699, 15

d) Calcule el error estándar de b (el estimador MCO de β) y haga un testsobre su significancia estadística (H0 : β = 0), utilizando un nivel designificancia del 5 %. (Ayuda: el valor crítico de una distribución t dedos colas con diez grados de libertad es c =2,23)Respuesta. El error estándar de b viene dado por:

σb =σ√∑

(Pi − P )2=

√699, 15

0, 0075= 305, 31

Por otro lado:tb =

b

σb

=−1450

305, 31= −4, 74

por lo tanto, se rechaza la hipótesuis nula, y el coeficiente es estadís-ticamente significativo.

e) Construya un intervalo de confianza de 95 % para β.Respuesta. El intervalo viene dado por:

b− cσb < β < b + cσb

Por lo tanto:−2130, 8 < β < −769, 15

3. (15 puntos) AnalíticoLa movilidad social es un tema que preocupa a las autoridades de muchos país-

es. Economías que presentan una elevada movilidad social son aquellas en dondeexiste una elevada probabilidad de “avanzar” a lo largo de la distribución de in-gresos, mediante un acceso razonable a las oportunidades que ofrece el mercado.Una de las principales herramientas para lograr movilidad social es la educación,

6

Page 221: Magno Econometría

puesto que permite a las personas aumentar su capacidad de generación de in-gresos.Con el objetivo de poder evaluar el nivel de movilidad social de Samunda, unpróspero país africano, un investigador propone la siguiente regresión:

SHi = α + βSP

i + ξi

donde SHi representa los años de escolaridad del individuo i, SP

i denota los añosde escolaridad promedio de los padres del individuo i (promedio simple de laescolaridad del padre y de la madre), y ξi es un término de error que resumetodos los otros aspectos que no han sido incluidos de manera explícita en laecuación, pero que afectan la escolaridad de i. Se sabe que 0 < β < 1. En base aesta información, responda:

1. Explique el trasfondo económico de la ecuación anterior.Respuesta. Básicamente, el modelo establece que la escolaridad de lospadres es un determinante fundamental de la escolaridad que puedan al-canzar los hijos.

2. Suponiendo que se cuenta con información confiable para estimar mediantemínimos cuadrados ordinarios (MCO) la relación planteada: ¿qué represen-taría βMCO en el contexto de la discusión sobre movilidad social? (Ayuda:piense en qué significaría que β = 1, es decir, que el impacto que tiene elnivel de escolaridad de los padres sobre la de los hijos fuera total.)Respuesta. En la medida que β = 1, entonces, no existiría movilidadpuesto que la escolaridad de los padres deerminaría, en promedio, uno a unola escolaridad de los hijos. Si β = 0, entonces, no habría ninguna relaciónentre la escolaridad de los padres y la de los hijos. En otras palabras, si elpadre tuviera solo educación básica incompleta, eso no sería razón para queel hijo no pudiera alcanzar la educación superior.

3. ¿Qué críticas podría hacerle al modelo propuesto? Mencione tres.Respuesta.

a) Omite variables relvantes, como por ejemplo, la habilidad de los indi-viduos

b) La relación no tiene por qué ser lineal, pudiera haber una relación mássofisticada para este modelo

c) Pudiera ser que la escolaridad del padre influya de mayor manera en laescolaridad de los hijos, por lo que el promedo simple de la escolaridadde los progenitores podría no ser la más apropiada.

7

Page 222: Magno Econometría

Rut:____________________________

1

Facultad de Economía y Negocios Universidad de Chile

PAUTA SOLEMNE Econometría 1

Primavera 2007 Profesora: Claudia Sanhueza

Ayudante: José Manuel Eguiguren Felipe Rios

Tiempo: Puntaje Total: p. 1) Preguntas de Elección Múltiple. (p)

i. In the multiple regression model, the adjusted R2, 2R a. cannot be negative. b. will never be greater than the regression R2. c. equals the square of the correlation coefficient r. d. cannot decrease when an additional explanatory variable is added.

Answer: b

ii. Consider the following multiple regression models (a) to (d) below. DFemme = 1 if the individual is a female, and is zero otherwise; DMale is a binary variable which takes on the value one if the individual is male, and is zero otherwise; DMarried is a binary variable which is unity for married individuals and is zero otherwise, and DSingle is (1-DMarried). Regressing weekly earnings (Earn) on a set of explanatory variables, you will experience perfect multicollinearity in the following cases unless:

a. · ¶ µ ¶ µ0 1 2 3 3i iEarn DFemme Dmale Xβ β β β= + + + .

b. · ¶ µ ¶ µ0 1 2 3 3i iEarn DMarried DSingle Xβ β β β= + + + .

c. · ¶ µ µ0 1 3 3i iEarn DFemme Xβ β β= + + .

d. · µ ¶ µ ¶ µ1 52 3 4 3i iEarn DFemme Dmale DMarried DSingle Xβ β β β β= + + + + .

Answer: c

iii. When there are omitted variables in the regression, which are determinants of the

dependent variable, then a. you cannot measure the effect of the omitted variable, but the estimator of

your included variable(s) is (are) unaffected. b. this has no effect on the estimator of your included variable because the

other variable is not included.

Page 223: Magno Econometría

Rut:____________________________

2

c. this will always bias the OLS estimator of the included variable. d. the OLS estimator is biased if the omitted variable is correlated with the

included variable.

Answer: d

iv. The assumption that X has full column rank implies that

a. the number of observations equals the number of regressors. b. binary variables are absent from the list of regressors. c. there is no perfect multicollinearity. d. none of the regressors appear in natural logarithm form.

Answer: c

v. One implication of the extended least squares assumptions in the multiple regression

model is that

a. feasible GLS should be used for estimation. b. E(U|X) = In. c. X′X is singular.

d. the conditional distribution of U given X is N(0n, 2uσ In).

Answer: d

vi. The following linear hypothesis can be tested using the F-test with the exception of

a. 2 3 4 51 and /β β β β= = .

e. 02 =β .

f. 1 2 3 41 and 2β β β β+ = = − .

g. β0 = β1 and β1 = 0.

Answer: a

vii. One of the properties of the OLS estimator is

a. X β = 0k+1.

b. that the coefficient vector β has full rank.

c. X′(Y – X β ) = 0k+1.

d. (X′X)-1= X′Y viii. The GLS estimator is defined as

a. (X′Ω-1X)-1(X′Ω-1Y). b. (X′X)-1X′Y.

Page 224: Magno Econometría

Rut:____________________________

3

c. A′Y. d. (X′X)-1X′U.

Answer: a

ix. β – β

a. cannot be calculated since the population parameter is unknown. b. = (X′X)-1X′U .

c. = Y - µY . d. = β + (X′X)-1X′U

Answer: b

x. In the case when the errors are homoskedastic and normally distributed, conditional on X, then

a. β is distributed N(β, ˆ|XβΣ ),where ˆ|Xβ

Σ = 2uσ I(k+1).

b. β is distributed N(β,β

Σ ), where β

Σ = ˆ( )n −β βΣ /n = 1 1− −

X V XQ QΣ /n.

c. β is distributed N(β, ˆ|XβΣ ),where ˆ|Xβ

Σ = 2uσ (X'X)-1.

d. U = PXY where PX = X(X′X)-1X′.

Answer: c 2) Ensayos y Preguntas Largas (p)

2.1. Give several economic examples of how to test various joint linear hypotheses using matrix notation. Include specifications of Rβ = r where you test for (i) all coefficients other than the constant being zero, (ii) a subset of coefficients being zero, and (iii) equality of coefficients. Talk about the possible distributions involved in finding critical values for your hypotheses.

Answer: Answers will vary by student. Many restrictions involve the equality of coefficients across

different types of entities in cross-sections (“stability”). Using earnings functions, students may suggest testing for the presence of regional effects, as in the textbook example at the end of Chapter 5 (exercises). The textbook tested jointly for the presence of interaction effects in the student achievement example at the end of Chapter 6. Students may want to test for the equality of returns to education and on-the-job training. The panel chapter allowed for the presence of fixed effects, the presence of which can be tested for. Testing for constant returns to scale in production functions is also frequently mentioned.

Consider the multiple regression model with k regressors plus the

Page 225: Magno Econometría

Rut:____________________________

4

constant. Let R be of order ( 1)q k× + , where q are the number of

restrictions. Then to test (i) for all coefficients other than the constant to be zero, 0 1 2: 0, 0,..., 0kH β β β= = = vs. 1 : 0jH β ≠ , at least one j, j=1,…,n,

you have R = [0k×1 Ik ] and r = 0k×1. In large samples, the test will produce

the overall regression F-statistic, which has a ,kF ∞ distribution. In case (ii),

reorder the variables so that the regressors with non-zero coefficients appear first, followed by the regressors with coefficients that are hypothesized to be zero. This leads to the following formulation

Yi = β0 + β1X1i + β2X2i + g g g + βk-qXk-q,i +βk-q+1Xk-q+1,i +βk-q+2Xk-q+2,i + . . . + βkXki + ui,

i = 1,…, n. R = [0q× (k-q+1) Iq ] and r = 0q×1. In large samples, the test will produce an F-statistic, which has an ,qF ∞ distribution. In (iii), assume that the task at hand is to

test the equality of two coefficients, say 0 1 2:H β β= vs. 1 1 2:H β β≠ , as in section

5.8 of the textbook. Then R = [0 1 -1 0 … 0], r = 0 and q = 1. This is a single restriction, and the F-statistic is the square of the corresponding t-statistic. Hence critical values can be found either from 1,F ∞ or from the standard normal table, after

taking the square root.

2.2. Consider the multiple regression model from Chapter 5, where k = 2 and the assumptions of the multiple regression model hold.

(a) Show what the X matrix and the β vector would look like in this case.

Answer:

11 21

0

12 22

1

2

1 2

1

1, and

1 n n

X X

X X

X X

β

β β

β

= =

M M MX

(b) Having collected data for 104 countries of the world from the Penn World Tables,

you want to estimate the effect of the population growth rate (X1i) and the saving rate (X2i) (average investment share of GDP from 1980 to 1990) on GDP per worker (relative to the U.S.) in 1990. What are your expected signs for the regression coefficient? What is the order of the (X′X) here?

Answer: You would expect the population growth rate to have a negative

coefficient, and the saving rate to have a positive coefficient. The order of X′X is 3×3.

(c) You are asked to find the OLS estimator for the intercept and slope in this model

Page 226: Magno Econometría

Rut:____________________________

5

using the formula β = (X′X)-1X′Y. Since you are more comfortable in inverting a

2×2 matrix (the inverse of a 2×2 matrix is,

11a b d b

c d c aad bc

−−

= −−

)

you decide to write the multiple regression model in deviations from mean form.

Show what the X matrix, the (X′X) matrix, and the X′Y matrix would look like now.

(Hint: use small letters to indicate deviations from mean, i.e., i iz Z Z= − and note

that

µ µ µ $

µ µ µ1 20 1 2

1 20 1 2 .

ii i iY X X u

Y X X

β β β

β β β

= + + +

= + +

Subtracting the second equation from the first, you get

µ µ $1 21 2 ii i iy x x uβ β= + + .)

Answer: X =

11 21

12 22

1 2n n

x x

x x

x x

M M, X′X =

21 1 2

1 1

21 2 2

1 1

n n

i i ii i

n n

i i ii i

x x x

x x x

= =

= =

∑ ∑

∑ ∑, X′Y =

11

21

n

i ii

n

i ii

y x

y x

=

=

∑.

(d) Show that the slope for the population growth rate is given by

21 2 2 1 2

1 1 1 11

2 2 21 2 1 2

1 1 1

ˆ

( )

n n n n

i i i i i i ii i i i

n n n

i i i ii i i

y x x y x x x

x x x x

β = = = =

= = =

=

∑ ∑ ∑ ∑

∑ ∑ ∑

Answer:

1

2 21 1 2 2 1 2

1 1 1 1

2 2 22 21 1 1 21 2 2 1 2 1

1 1 11 1 1 1

1

( )

n n n n

i i i i i ii i i i

n n nn n n n

i i i ii i i i i ii i ii i i i

x x x x x x

x x x xx x x x x x

= = = =

= = == = = =

=

− −

∑ ∑ ∑ ∑

∑ ∑ ∑∑ ∑ ∑ ∑.

Page 227: Magno Econometría

Rut:____________________________

6

Post multiplying this expression with 1

1

21

n

i ii

n

i ii

y x

y x

=

=

∑ results in the two least squares estimators

µ

µ

21 2 2 1 2

1 1 1 1

2 2 21 2 1 2

1 1 11

222 1 1 1 2

1 1 1 1

2 2 21 2 1 2

1 1 1

( )

( )

n n n n

i i i i i i ii i i i

n n n

i i i ii i i

n n n n

i i i i i i ii i i i

n n n

i i i ii i i

y x x y x x x

x x x x

y x x y x x x

x x x x

β

β

= = = =

= = =

= = = =

= = =

= −

∑ ∑ ∑ ∑

∑ ∑ ∑

∑ ∑ ∑ ∑

∑ ∑ ∑

, and hence gives the formula for µ1β .

Page 228: Magno Econometría

Rut:____________________________

7

(e) The various sums needed to calculate the OLS estimates are given below:

2 2 21 2

1 1 1

8.3103; .0122; 0.6422n n n

i i ii i i

y x x= = =

= = =∑ ∑ ∑

1 2 1 21 1 1

0.2304; 1.5676; 0.0520n n n

i i i i i ii i i

y x y x x x= = =

= − = = −∑ ∑ ∑

Find the numerical values for the effect of population growth and the saving rate on per capita income and interpret these.

Answer: µ

µ

21

22

0.2304 0.6422 (1.5676 ( 0.0520))

0.0122 0.6422 ( 0.0520)

1.5676 0.0122 (( 0.2304) ( 0.0520)

0.0122 0.6422 ( 0.0520)

β

β

− × − × − × − − =

× − − × − × − −

= 12.953

1.393

.

A reduction of the population growth rate by one percent increases the per capita income relative to the United States by roughly 0.13. An increase in the saving rate by ten percent increases per capita income relative to the United States by roughly 0.14.

(f) Indicate how you would find the intercept in the above case. Is this coefficient of

interest in the interpretation of the determinants of per capita income? If not, then why estimate it?

Answer: The first order condition for the OLS estimator in the case of k = 2 is

µ µ µ1 20 1 2

1 1 1

n n n

i i ii i i

Y n X Xβ β β= = =

= + +∑ ∑ ∑ , which, after dividing by n, results in

µ µ µ1 20 1 2Y X Xβ β β= − − . The intercept is only of interest if there are

observations close to the origin, which is not the case here. If it is set to zero, then the regression is forced through the origin, instead being allowed to choose a level.

2.3. Define the GLS estimator and discuss its properties when Ω is known. Why is this estimator sometimes called infeasible GLS? What happens when Ω is unknown? What would the Ω matrix look like for the case of independent sampling with

heteroskedastic errors, where var( |i iu X ) = 2 21( )i ich X Xσ= ? Since the inverse of

the error variance-covariance matrix is needed to compute the GLS estimator, find 1Ω − . The textbook shows that the original model Y = Xβ + U will be transformed

into Y% = X% β + U% , where Y% = FY, X% = FX, and U% = FU, and F′F = Ω-1. Find F in the above case, and describe what effect the transformation has on the original data.

Page 229: Magno Econometría

Rut:____________________________

8

Answer: ˆ GLSβ = (X′Ω-1X)-1(X′Ω-1Y). The key point for the GLS estimator with Ω

known is that Ω is used to create a transformed regression model such that the resulting error term satisfies the Gauss-Markov conditions. In that case, GLS is BLUE. However, since Ω is typically unknown, the estimator cannot be calculated, and is therefore sometimes referred to as infeasible GLS. If Ω is unknown, then a feasible GLS estimator can be calculated if Ω is a known function of a number of parameters which can be estimated. Once the parameters have been estimated, they can then be

used to calculate Ω , which is the estimator of Ω . The feasible GLS estimator is then

ˆ GLSβ = (X′ 1ˆ −Ω X)-1(X′ 1ˆ −Ω Y).

In the above example of heteroskedasticity,

E(UU′|X) = Ω(X) =

211

22 12

21

0 0

0 0

0 0 n

X

X

X

σ

L

L

M M O M

L

,

1Ω − (X) =

211

2122

21

10 0

10 01

10 0

n

X

X

X

σ

L

L

M M O M

L

, F =

11

12

1

10 0

10 0

10 0

n

X

X

X

L

L

M M O M

L

.

The transformation in effect scales all variables by 1X .

Page 230: Magno Econometría

Prueba Solemne

Econometrıa I

Profesor: Tomas Rau Binder

Ayudante: Victor Nahuelpan

27 de diciembre

Tiempo Total: 120 Minutos.

1. Preguntas Cortas (5 puntos, maximo 5 ren-

glones)

1. Defina funcion de regresion poblacional. R. La funcion de regresion pobla-cional es el lugar geometrico de las medias condicionales E(Yi|Xi) = f(Xi)que puede ser una funcion cualquiera. Un caso particular es la recta deregresion poblacional Y = Xβ + u.

2. Demuestre que E(u|X) = 0 ⇒ E(u) = 0. R. Por Ley de las EsperanzasIteradas (Iterated Law of Expectations) sabemos que E(E(u|X)) = E(u).Luego, reemplazando E(u|X) = 0, tenemos que E(u) = 0.

3. Muestre que β = (X ′X)−1X ′Y es insesgado. R. Reemplazando la recta

de regresion poblacional tenemos que β = β + (X ′X)−1X ′u. Tomandovalor esperado y usando el supuesto 2 (X no estocasticas) y supuesto 3

(E(u|X) = 0) tenemos que E(β) = β.

4. Muestre que el rango de Mn×n = In − X(X ′X)−1X ′ es igual a n − kdonde X es de orden n× k. Recuerde que el rango de una matriz simetri-ca e idempotente es igual a su traza. R. Usando las propiedades: tr(A-B)=tr(A)-tr(B) y tr(AB)=tr(BA). Tenemos que:

r(M) = tr(M) = tr(In) − tr(X(X ′X)−1X ′) = n − tr((X ′X)−1X ′X)

= n − tr(Ik) = n − k

5. ¿Que establece el Teorema de Gauss-Markov? R. Establece que bajo lossupuestos vistos en clases, el estimador MCO es MELI (mejor estimador

linealmente insesgado) o BLUE (best linear unbiased estimator)

1

Page 231: Magno Econometría

6. Comente la siguiente afirmacion: dado que los estimadores MCO de β y σ2

en el modelo de regresion lineal son identicos a los obtenidos por MaximaVerosimilitud, da lo mismo usar cualquiera de los dos metodos de estima-cion. R. Falso, el estimador MV para β es el mismo que MCO si se asumenormalidad en los errores. Ademas, el estimador MV para σ2 es sesga-do. Por otra parte, los estimadores MV tienen propiedades deseables queMCO no tienen como invarianza ante transformaciones, permiten estimarmodelos no lineales y testear hipotesis no lineales, entre otras.

2. Preguntas de Desarrollo

1. Suponga que el modelo de regresion lineal

yi = β1 + β2xi + ui

donde f(ui) = (1/λ)e−ui/λ y ui ≥ 0. Este modelo es bien particular puestoque los errores son asumidos positivos. Note que el valor esperado de ui

es igual a λ. Muestre que el estimador MCO de β2 es insesgado pero queel estimador MCO de β1 es sesgado. ¿Es consistente el estimador MCOde β1? Por ultimo, ¿bajo que condiciones es el estimador MCO de β1

consistente? (10 puntos)

R. Escribiendo el model en desviacones a la media tenemos: y = β2x + uy sabemos que

β2 =

xy∑

x2i

Luego un poquito de algebra despues de reemplazar la funcion de regresionpoblacional en desviaciones respecto de la media tenemos,

β2 = β2 +

xiui∑

x2i

E(β2) = β2 +

xiE(ui)∑

x2i

= β2 +

xiE(ui − u)∑

x2i

E(β2) = β2 +

xi(λ − λ)∑

x2i

= β2

Para β1 sabemos que:

β1 = Y − β2X

= β1 + β2X + u − β2X

tomando valor esperado

E(β1) = β1 + β2X + E(u) − E(β2)X

= β1 + λ

2

Page 232: Magno Econometría

Ahora, es claro que el estimador MCO para β1 no es consistente a no serque λ → 0 cuando n es muy grande.

2. Sea la funcion de regresion poblacional y = β1 + β2x + u y considere lasiguiente muestra aleatoria simple:

Y =

2110

X =

1 31 11 21 0

a) Calcule el estimador mınimo cuadratico de β y σ2. (10 puntos)

R. Podemos ver que en desviaciones con respecto de la media, lamuestra es

y =

100−1

x =

3/2−1/21/2−3/2

ademas:∑

xiyi = 3/2 + 3/2 = 3,∑

x2i = (3/2)2 + (1/2)2 + (1/2)2 +

(3/2)2 = 20/4 = 5. Luego

β2 = 3/5 = 0,6

β1 = Y − β2X = 1 − (3/5) × (3/2) = 1 − 9/10 = 0,1

Para estimar σ2 necesitamos los residuos

u =

1 − (3/5) × (3/2) = 0,10 + (3/5) × (1/2) = 0,3

0 − (3/5)× (1/2) = −0,3−1 + (3/5) × (3/2) = −0,1

u2 =

0,010,090,090,01

Luego,∑

u2i = 0,2 y σ2 = 0,2/2 = 0,1 dado que n − k = 2.

b) Testee la hipotesis nula H0 : β2 = 0 (a dos colas). ¿Es β2 significativoal 5 %?¿Y al 10%? Ver Cuadro 1 para los valores crıticos. (10 puntos)

R. Sabemos que la varianza de β2 = σ2/∑

x2i = 0,1/5 = 0,02. Por

lo tanto el error estandar de β2 es√

2/10 = 0,141. El test t es:

t =β2

SE(β2)=

6/10√2/10

= 4,24

y el valor crıtico de una t-student con 2 grados de libertad paraα = 5% es 4.303. Por lo tanto se rechaza H0. Si α = 10% el crıticoes 2.92 luego no se rechaza H0.

3

Page 233: Magno Econometría

c) Calcule el R2 y R2 ajustado. (10 puntos) R. Sabemos que R2 =ESS/TSS, luego

R2 =

β22x2

i∑

y2i

=β2

2

x2i

y2i

=0,62 × 5

2= 0,90

El R2 ajustado se escribe:

R2a = 1 − RSS/(n − k)

TSS/(n− 1)= 1 − 0,2/2

2/3= 0,85

3. Suponga que la distribucion condicional de y dado x es una exponencialcon parametro θx.

f(y|x, θ) =1

θxe−y/θx

donde y > 0, x > 0

a) Obtenga el estimador maximo verosımil de θ. (10 puntos) R. Escri-bamos la funcion de verosimilitud (en log)

l =

n∑

i=1

−logθ − logxi −yi

θxi

tomando derivadas obtenemeos el score:

s(θ) =∂l

∂θ= −n/θ + (1/θ2)

yi/xi

igualando el score a 0 obtenemos:

θ =1

n

yi/xi

b) Considere la siguiente muestra aleatoria simple

Y =

2413

X =

1213

obtenga una estimacion de θ. (5 puntos)

R. Note que si reemplazamos nos queda θ = (1/4)× (2+2+1+1) =3/2.

c) Pruebe la siguiente hipotesis: H0 : θ = 3 y H1 : θ 6= 3 usando un Testde Wald. (15 puntos)

Indicacion: recuerde que el valor esperado de una distribucion expo-nencial con parametro θ es igual a θ y considere las x’s fijas. Use el

4

Page 234: Magno Econometría

valor crıtico de una χ2 con 1 grado de libertad con α=5% visto enclases.

R. El test de Wald es:

W = (Rθ − r)′I(θ)(Rθ − r)

En este caso R = 1 y r = 3. Necesitamos la matriz de informacionque podemos calcularla como el negativo del valor esperado de lamatriz de segundas derivadas (que en este caso es un escalar). Luego,

I(θ) = −E

[

∂2l

∂θ2

]

= −n/θ2 + (2/θ3)∑

E(yi/xi)

usando que las x’s son fijas y que E(yi|xi) = θxi, tenemos que

I(θ) = −n/θ2 + (2/θ3)∑ θxi

xi= −n/θ2 + 2n/θ2 = n/θ2

Luego, reemplazamos el valor de Rθ = 2, r = 3 y evaluando I(θ) =4/(3/2)2 = 16/9 = 1.7, entonces

W = (1,5 − 3)′(1.7)(1,5 − 3) = (3/2)2 × (16/9) = 4

El crıtico de una χ2 con 1 grado de libertad y α =5% es 3.84. Luegose rechaza H0.

Cuadro 1: Valores Crıticos para una distribucion t-Studentn-k 90 % 95% 97.50 % 99% 99.50%

1 3.078 6.314 12.71 31.82 63.66

2 1.886 2.92 4.303 6.965 9.925

3 1.638 2.353 3.182 4.541 5.841

4 1.533 2.132 2.776 3.747 4.604

5 1.476 2.015 2.571 3.365 4.032

6 1.44 1.943 2.447 3.143 3.707

7 1.415 1.895 2.365 2.998 3.499

5

Page 235: Magno Econometría

Pauta Prueba Solemne

Econometrıa I

Profesores: Tomas Rau y Javiera Vasquez

Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda

06 de mayo de 2008

Tiempo Total: 150 minutos.

Puntaje Total: 130 puntos.

1. Comentes (5 puntos, maximo 5 renglones)

1. La funcion de regresion poblacional es el lugar geometrico de las esperanzascondicionales para distintos valores de X .

R. Verdadero. La funcion de regresion poblacional es el lugar geometricode la esperanza condicional de y en X , luego es una funcion de X . Enparticular E(Y |X = x), para distintos valores de X = x. Si bien no seexplicita en el texto si la esperanza es sobre y, se puede asumir dado quehablamos de una funcion de regresion.

2. Si tenemos dos estimadores de un parametro: uno sesgado y otro insesgado,elegiremos siempre el insesgado.

R. Falso. Preferiremos aquel que tenga un menor error cuadratico medio.

3. Si tenemos dos columnas de la matriz X linealmente dependientes el esti-mador MCO de β es igual a cero.

R. Falso. El estimador MCO de β no existe puesto que X ′X no tieneinversa si dos columnas de X son linealmente dependientes.

4. Cuando tenemos hipotesis lineales del tipo Rβ = r, si q = 1 podemos usarun simple test t.

R. Verdadero. Cuando q = 1, podemos escribir un test t teniendo cuida-do en incorporar las covarianzas en el calculo del error estandar de Rβ.Ademas, para un estadistico que sigue una F con (1,n-k) grados de liber-tad, su raız cuadrada sigue una t-student con n − k grados de libertad.

1

Page 236: Magno Econometría

5. La varianza del error de prediccion en el modelo de regresion lineal au-menta a medida que aumenta el valor de x.

R. Verdadero/depende. Como se pudo apreciar en la clase 11, la varianzadel error de prediccion depende de una forma cuadratica de X y como sevio en el grafico, el intervalo de confianza aumenta con x siempre y cuandoestemos a la derecha de x. La varianza tambien aumenta si nos movemosa la izquierda de x. Es por ello que la menor varianza (luego el intervalode confianza mas angosto) se logra en la media.

6. El metodo de maxima verosimilitud y de mınimos cuadrados ordinariosson equivalentes en el caso del modelo de regresion lineal puesto que arrojalos mismos estimadores.

R. Falso. En el caso en que los residuos sean independientes e identica-mente distribuidos con funcion de densidad de probabilidad normal, elestimador MV de β y el estimador MCO de β son numericamente equiva-lentes (no ası el de σ2) pero los metodos no son equivalentes. El metodo deMV permite testear hipotesis no lineales y es invariante a transformacionesy no ası el metodo de MCO.

2. Preguntas de Desarrollo

1. (50 puntos) Sea el modelo de regresion con k variables Y = Xβ +u, dondeY es un vector de n × 1, X una matriz de n × k, β un vector de k × 1y u un vector de n × 1. Suponga que se cumplen los supuestos vistos enclases y en especial E(u|X) = 0. Sea xi la i-esima columna de la matrizX y suponga que

∑nm=1 ximxjm = 0 para todo i 6= j, es decir que las

columnas son ortogonales.

a) Si la primera columna de X es un vector de unos, ¿que implica elsupuesto de ortogonalidad de las columnas de la matriz X? Ayuda:analice algunos elementos de X ′X . (10 puntos)

R. Si la primera columna es un vector de unos, y usando el supuestode ortogonalidad tenemos que

∑nm=1 xjm = 0 para todo j = 2, .., k

lo que implica que las medias son ceros para todas las variables.

b) Demuestre que el estimador MCO de β1, ..., βk es equivalente a esti-mar por MCO el modelo de UNA variable, es decir y = βixi +u paracada i = 1, .., k. (20 puntos)

R El estimador MCO de β1, ..., βk esta dado por la formula usual:

β = (X ′X)−1X ′Y

2

Page 237: Magno Econometría

Dado que∑n

m=1 xjm = 0, tenemos que todos los elementos fuera dela diagonal de X ′X son ceros (recuerde que la multiplicacion es filapor columna). Ası,

X ′X =

n 0 0 · · · 00∑

x22,i 0 · · · 0

......

.... . .

...0 0 0 · · ·

x2k,i

y ademas

X ′Y =

yi∑

x2,iyi

...∑

xk,iyi

Usando el hecho que la inversa de una matriz diagonal A con elementoaii es diagonal con elemento 1/aii tenemos que

β =

P

yi

nP

x2,iyiP

x2

2,i

...P

xk,iyiP

x2

k,i

Ahora, si se estima separadamente el modelo de UNA variable, esdecir y = βixi + u para cada i = 1, .., k, es facil notar que,

mınβi

j

(yj − βixi,j)2

obtenemos

βi =

j xi,jyj∑

j x2i,j

incluso para i = 1 puesto que∑

j x21,j =

j 12 = n, luego

βi =

j yi

n

c) Suponga que Ud. dispone de la informacion dada en el Cuadro 1

y adicionalmente Ud. sabe que∑

u2i = 2,5. Usando algebra matri-

cial obtenga X ′X y X ′Y . Obtenga los estimadores de β1, β2, β3. (10puntos)

R. Como sabemos, debemos multiplicar fila por columna, luego

3

Page 238: Magno Econometría

Cuadro 1: Datosx1 x2 x3 y1 1 -2 11 -1 1 -21 -1 -1 11 1 2 01 0 0 0

X ′X =

1 1 1 1 11 −1 −1 1 0

−2 1 −1 2 0

×

1 1 −21 −1 11 −1 −11 1 21 0 0

=

5 0 00 4 00 0 10

y

X ′Y =

1 1 1 1 11 −1 −1 1 0

−2 1 −1 2 0

×

1−2

100

=

02

−5

y finalmente

β =

1/5 0 00 1/4 00 0 1/10

×

02

−5

=

00,5

−0,5

d) Usando los resultados obtenidos en c), testee la siguiente hipotesis al5%

H0 :

(

β1 + β3

β2

)

=

(

40

)

HA :

(

β1 + β3

β2

)

6=(

40

)

Indicacion: escriba la hipotesis de la manera Rβ = r y utilice el testF visto en clases cuya formula esta dada por

(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)/q

u′u/(n − k)

(10 puntos)

4

Page 239: Magno Econometría

R. Escribamos la matriz R[

1 0 10 1 0

]

y Rβ − r,

Rβ − r =

[

β1 + β3 − 4

β2

]

=

[

−9/21/2

]

ahora, escribamos R(X ′X)−1R′

R(X ′X)−1R′ =

[

1 0 10 1 0

]

×

1/5 0 00 1/4 00 0 1/10

×

1 00 11 0

=

[

1/5 0 1/100 1/4 0

]

×

1 00 11 0

=

[

3/10 00 1/4

]

luego

[R(X ′X)−1R′]−1 =

[

10/3 00 4

]

y ası,

(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r) =[

−9/2 1/2]

[

10/3 00 4

] [

−9/21/2

]

=[

−90/6 2]

[

−9/21/2

]

= 810/12 + 1 = 68,5

y finalmente,

(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)/q

u′u/(n − k)=

68,5/2

2,5/2= 27,4

el valor crıtico de una F 5%(2,2) = 19, luego se rechaza la hipotesis nula.

2. (50 puntos) Suponga el modelo de regresion lineal

yi = β1 + β2x2,i + ui

donde ui is independiente e identicamente distribuido (i.i.d.) con funcion

de densidad de probabilidad f(ui) = (1/√

2πσ2)e−u2

i /2σ2

. Asuma que lasx’s son no estocasticas y note que x1,i = 1 para todo i.

5

Page 240: Magno Econometría

a) Escriba el logaritmo de la funcion del verosimiltud l(β1, β2, σ2; y, x).

(9 puntos)

R. El log de la funcion de verosimilitud para una observacion es

li(β1, β2, σ2) = −1

2ln(2π) − 1

2ln(σ2) − (yi − β1 − β2xi)

2

2σ2

luego el logaritmo de la funcion de verosimilitud es la suma,

l(β1, β2, σ2) = −n

2ln(2π) − n

2ln(σ2) −

(yi − β1 − β2xi)2

2σ2

b) Encuentre el Score. (9 puntos)

R. El Score es el vector de derivadas con los siguientes componentes

∂l

∂β1=

(yi − β1 − β2xi)

σ2

∂l

∂β2=

(yi − β1 − β2xi)xi

σ2

∂l

∂σ2= − n

2σ2+

1

2σ4

(yi − β1 − β2xi)2

c) Encuentre el estimador MV de β1, β2 y σ2. (9 puntos)

R. Igualando a cero el Score obtenemos los estimadores MV

β1 = y − β2x

β2 =

yixi − y∑

xi

nx2 −∑ x2i

σ2 =

(yi − β1 − β2xi)2

n

d) Suponga que Ud. dispone de la informacion dada en el Cuadro 2.Obtenga el estimador MV de β1 y β2. [Puede usar los resultados deortogonalidad] (9 puntos)

R. Usando el resultado del problema 1) parte b) y el hecho queel Cuadro 2 tiene exactamente los mismos valores para x1, x2 e y,sabemos que

β1 = 0

β2 = 0,5

6

Page 241: Magno Econometría

e) Suponga que se quiere testear la siguiente hipotesis: H0 : β1 = f(β2)y se estima el modelo restringido obteniendo la siguiente suma deerrores al cuadrado:

∑ni=1 u2

r,i = 10. Ademas Ud. conoce la suma de

los errores al cuadrado del modelo sin restricciones∑n

i=1 u2nr,i = 5.

Demuestre que

LR = n

[

ln(n∑

i=1

u2r,i) − ln(

n∑

i=1

u2nr,i)

]

Realice el test de LR al 5% usando el valor crıtico de una χ2 con ungrado de libertad (3.84). (14 puntos).

R. Como vimos en clases

LR = 2[l(βnr,1, βnr,2, σ2) − l(βr,1, βr,2, σ

2r )]

Ahora, el logaritmo de la funcion de verosimilitud evaluada en elestimador no restringido y restringido esta dada por

l(βnr,1, βnr,2, σ2) = −n

2ln(2π) − n

2ln

(

u2nr,i

n

)

− n

2

l(βr,1, βr,2, σ2r ) = −n

2ln(2π) − n

2ln

(

u2r,i

n

)

− n

2

donde en el tercer termino del log de la funcion de verosimilitud vienede reemplazar el estimador de σ2 para los dos casos. En el segundotermino se reemplaza el estimador de σ2 por la suma de los erroresal cuadrado en ambos casos. Ası,

LR = n

[

ln

(

n∑

i=1

u2r,i

)

− ln

(

n∑

i=1

u2nr,i

)]

Evaluando la expresion tenemos que,

LR = 5[ln(10) − ln(5)] = 3,46

se aprecia que el estadıstico LR=3.46 es menor que χ25%(1) = 3,84,

luego no se rechaza la hipotesis nula H0 : β1 = f(β2). Como vimos,MV permite testear hipotesis no lineales de una manera relativamentesencilla.

7

Page 242: Magno Econometría

Cuadro 2: Datosx1 x2 y1 1 11 -1 -21 -1 11 1 01 0 0

Cuadro 3: Valores Crıticos para la F al 5%df num/df den 1 2 3 4 5

2 18.51 19 19.16 19.25 19.33 10.13 9.55 9.28 9.12 9.014 7.71 6.94 6.59 6.39 6.265 6.61 5.79 5.41 5.19 5.05

8

Page 243: Magno Econometría

EEXXÁÁMMEENNEESS

Page 244: Magno Econometría

Econometría IProfesores: J.M. Benavente, A. Otero y J. Vásquez.

Primavera 2004

Examen Final

Nombre: ...........................................................................................

Rut: .......................................

Ud. Dispone de 120 minutos para resolver el examen, no puede hacer consultas a los ayu-dantes, no puede tener nada más que lápiz en su escritorio, si contesta con lápiz mina no tienederecho a reclamo.

1. Comentes

( 35 puntos)Debe responder 5 de los siguientes 8 comentes. Debe justificar sus respuestas

Comente 1: ( 7 puntos) La omisión de una variable relevante siempre siempre sesga la esti-mación MCO de β. Comente.

Falso, el sesgo que se produce en el parámetro depende de la covarianza entre la variablesexplicativas y la omitida, y el valor poblacional de la variable omitida.

En un modelo de regresión simple: E(β) = β1 + cov(x1,x2)var(x1)

βomitida

Si cov(x1, x2) = 0 no existe sesgo,Si βomitida = 0 no existe sesgo.

Comente 2: (7 puntos) La presencia de errores no esféricos implica que la estimación de lavarianza MCO de V (β) estará sesgada. Comente.

El estimador de MCO de la varianza era ˆvar(β)mco = σ2(x′x)−1, sin embargo, en presencia deerrores no esféricos y estimando por MCO, la varianza de β que obtenemos es: σ2(x′x)−1(x′Ωx)(x′x)−1,dado que Ω es una matriz definida positiva, siempre se cumple que:

ˆvar(β)mco = σ2(x′x)−1 > σ2(x′x)−1(x′Ωx)(x′x)−1

Donde (x′Ωx)(x′x)−1 corresponde al sesgo (> 1).

Comente 3: ( 7 puntos) Un estadístico de Durbin-Watson de 4 significa inequivocamente unapresencia de autocorrelación positiva. Comente.

La hipótesis nula de este estadístico es: Ho : ρ = 0 (no hay autocorrelación), dado que

1

Page 245: Magno Econometría

Dw '= 2(1 − ρ) podemos apreciar que cuando ρ = −1 significa que Dw '= 4. De estaforma si se rechaza Ho : ρ = 0, porque Dw = 4, es en favor de la hipótesis alternativa deautocorrelación negativa.

∴ Falso, inequivocamente hay autocorrelación negativa.

Comente 4: ( 7 puntos) Un síntoma de la existencia de multicolinealidad es la presencia deun R2 ajustado alto . Comente.

El síntoma corresponde no simplemente a la observación de un R2 alto, sino que además acom-pañado por estadísticos t que nos hacen concluir que los parámetros no son significativos (tbajos). Esto porque en presencia de multicolinealidades, las varianzas de los estimadores sonaltas, pues (x′x) es cercano a cero. Lo que resulta en estadísticos t pequeños.

Comente 5: ( 7 puntos) La estimación por Máxima Verosimilitud es MELI. Comente.

Falso, el estimador MELI es el de MCO. El estimador MV es asintonticamente más eficien-te ya que alcanza la cota de Cramer-Rao, aun cuando en muestras finitas puede ser sesgado.Bajo el supuesto de normalidad,el estimador MV y MCO de β coinciden. Sin embargo, difierenen la estimación de sus varianzas, ya que la varianza de MV es sesgada. De esta forma, MV esel mejor estimador pero en muestras grandes (Cramer-Rao).

Comente 6: ( 7 puntos) Si los errores del modelo de regresión lineal no tienen distribuciónnormal, a pesar de que los estimadores OLS ya no son MELI siguen siendo insesgados. Comente.

La propiedad de Meli no requiere de un supuesto específico de la distribución de los errores,simplemente requiere que éstas sean iid. Bajo independencia e idéntica distribución (cualquierasea), MCO será MELI.

Comente 7: ( 7 puntos) La inclusión de variables independientes rezagadas no trae consecuen-cias de sesgo ni de eficiencia en las estimaciones MCO . Comente.

Verdadero, cuando se incluyen rezagos de la variable dependiente MCO pierde la propiedadde insesgamiento, pero sigue siendo consistente. Sin embrago, si asumimos fijo los regresores(variables independientes), sus rezagos también los serán y por lo tanto, no se produce ningúnproblema con las propiedades de MCO. El único peligro es que se puede generar un problemade multicolinealidad.

Comente 8: ( 7 puntos) La utilización de la matriz de White permite corregir el problema deheterocedasticidad sin saber a priori la especificación de esta. Comente.

Falso, la estimación de White no ”corrige” la heterocedasticidad, sino que permite obtenerun estimador consistente de la matriz de varianzas y covarianzas con heterocedasticidad, y deesta forma, poder realizar la inferencia. Efectivamente, esto se puede hacer sin conocer el patrónde heterocedasticidad.Pero no se corrige la heterocedasticidad.

2

Page 246: Magno Econometría

2. Demostraciones

( 40 puntos) Debe responder 2 de las siguientes 4 demostraciones.

Pregunta 1: ( 20 puntos)

Demuestre que el R2 ajustado es menor que el R2.

Respuesta:

R2 = 1− u′uY ′MY

(1)

R2 = 1− u′u/(n− k)Y ′MY/(n− 1)

(2)

Reemplazando (1) en (2):

R2 = 1− (1−R2)(n− 1)(n− k)

=(n− k)− (1−R2)(n− 1)

(n− k)

(n− k)R2 = (n− k)− (1−R2)(n− 1) = (1− k) + R2(n− 1)

R2 =(1− k)(n− k)

+ R2 (n− 1)(n− k)

Para K = 1, R2 = 0 + R2 = R2, por ende son iguales.

Para K > 1, R2 = (−) + R2(< 1) ⇒ R2 < R2

3

Page 247: Magno Econometría

Pregunta 2: ( 20 puntos)

Considerando el siguiente modelo de regresión lineal con error de medición en la variable expli-cativa

Yi = Xiβ + ui ui ∼ N(0, σ2)

En donde X∗i = Xi + ei

Demuestre que el estimador por variables instrumentales se puede escribir como

βV I = (X∗′X∗)−1X∗′y

= [X∗′Z(Z ′Z)−1Z ′X∗]−1X∗′Z(Z ′Z)−1Z ′y (3)

Respuesta:

Modelo verdadero: Yi = Xiβ + ui, se observa: X∗i = Xi + ei

Como X∗i está medida con error, se puede utilizar el instrumento Z. Para obtener el esti-

mador de variables instrumentales hago un estimador en dos etapas:

Primera etapa: regresión entre X∗i y Zi, para obtener X∗

i :

X∗i = Ziρ + vi

ρ = (Z ′Z)−1Z ′X∗

X∗ = Z(Z ′Z)−1Z ′X∗

Segunda etapa: regresión entre Y y X∗ del modelo original.

Yi = X∗i β + ui

βV I = (X∗′X∗)−1X∗′Y

Dado que X∗ = Z(Z ′Z)−1Z ′X∗, podemos escribir βV I en función de Z.

βV I = (X∗′Z(Z ′Z)−1Z ′Z(Z ′Z)−1Z ′X∗)−1X∗′Z(Z ′Z)−1Z ′Y

βV I = (X∗′Z(Z ′Z)−1Z ′X∗)−1X∗′Z(Z ′Z)−1Z ′Y

4

Page 248: Magno Econometría

Pregunta 3: ( 20 puntos)

Considerando el siguiente modelo de regresión lineal

Yi = Xiβ + ui ui ∼ N(0, σ2)

Demuestre que el estimador de MCO de β es igual al estimador Máxima Verosimilitud de β .

Respuesta:

Sea Y = Xβ + U , para calcular MCo tenemos que:

mınβ

[(Y −Xβ)′(Y −Xβ)] = mınβ

N∑

i=1

u2

⇒ mınβ

[Y ′Y − 2βX ′Y + β′X ′Xβ]

∂β= 0 ⇒ −2X ′Y + 2X ′Xβ = 0 ⇒ βMCO = (X ′X)−1X ′Y

MV: bajo el supuesto de u ∼ N(0, σ2), la verosimilitud es:

L =1

(2Πσ2)n2

e−(Y−Xβ)′(Y−Xβ)

2σ2

⇒ ln(L) = l = −ln(2Π)− ln(σ2)− ln(n

2

)− −(Y −Xβ)′(Y −Xβ)

2σ2

∂l

∂β= − 1

2σ22(Y −Xβ)(−X ′) = 0 ⇒ βMV = (X ′X)−1X ′Y

Maximizar l con respecto a β es lo mismo que minimizar (Y −Xβ)′(Y −Xβ). Para ambos casosse resuelve igual problema, por lo que el estimador resultante es análogo en ambas estimaciones.

5

Page 249: Magno Econometría

Pregunta 4: ( 20 puntos)

Demuestre que la inclusión de variables irrelevantes disminuye la eficiencia de las estimacionesMCO.

Respuestas:

Modelo correcto: Y = X1β1 + uModelo incorrecto: Y = X1β1 + X2β2 + u

Recordando la regresión particionada: el estimador de β1 del modelo incorrecto es:

β1 = (X ′1M2X1)−1X ′

1M2Y

Donde M2 = I −X2(X ′2X2)−1X ′

2

⇒ β1 = (X ′1M2X1)−1X ′

1M2(X1β1 + u) = β1 + (X ′1M2X1)−1X ′

1M2u

⇒ E(β1) = β1 + (X ′1M2X1)−1X ′

1M2E(u)

Como E(u) = 0 ⇒ E(β1) = β1

Respecto a la varianza:

V (β1) = E[(β1 − E(β1))(β1 − E(β1))′]= E[(X ′

1M2X1)−1X ′1M2uu′M2X1(X ′

1M2X1)−1]

Como M2 es idempotente y simétrica.

V (β1) = σ2(X ′1M2X1)−1X ′

1M2X1(X ′1M2X1)−1

= σ2(X ′1M2X1)−1

La varianza verdadera (estimando el el modelo correcto) sería:

V ∗(β1) = σ2(X ′X)−1

[V ∗(β1)]−1 − [V (β1)]−1 =1σ2

(X ′1X1)− 1

σ2(X ′

1M2X1)

=1σ2

X ′1[I −M2]X1

=1σ2

X ′1X2(X ′

2X2)−1X ′2X1

Donde esta última es una matriz semidefinida positiva

∴ [V ∗(β1)]−1 > [V (β1)]−1 ⇒ [V ∗(β1)] < [V (β1)]

6

Page 250: Magno Econometría

3. Pregunta Obligatoria

( 45 puntos)

Suponga que un amigo de usted esta interesado en estimar el retorno a la educación utili-zando una encuesta de corte transversal, pero no esta muy seguro de los resultados obtenidos.

El modelo que su amigo estimó es el siguiente.

Wi = β1 + β2Dsexoi + β3Esci + β4Expei + ui

En donde Wi corresponde al logaritmo natural del salario del individuo i , Dsexoi es unavariable dicotómica que toma el valor de 1 si el individuo i es hombre, Esci corresponde a losaños de educación del individuo i, Expei corresponden a los años de experiencia construidamediante la proxy Expei = Edad− Esci − 6.

Los resultados obtenidos de su estimación son los siguientes.

Dependent Variable: W Method: Least Squares Included observations: 4021 after adjustments W=C(1)+C(2)*DSEXO+C(3)*ESC+ C(4)*EXPE

Coefficient Std. Error t-Statistic Prob.

C(1) 10.16332 0.061402 165.5208 0.0000 C(2) 0.347502 0.034635 10.03325 0.0000 C(3) 0.123967 0.003168 C(4) 0.012138 0.000964 12.58711 0.0000

R-squared 0.302890 Mean dependent var 11.89096

Adjusted R-squared 0.302369 S.D. dependent var 0.839496 S.E. of regression 0.701184 Akaike info criterion 2.128900 Sum squared resid 1974.992 Schwarz criterion 2.135167 Log likelihood -4276.154 Durbin-Watson stat

1. (5 puntos) Interprete el parámetro β3. ¿Es significativo?. ¿Cuánto aumenta en promedioWi ante un cambio porcentual de 1% de los años de educación? (Esc) = 9).

Respuesta:

β3 representa el retorno a la educación, mide el impacto marginal de un año de edu-cación sobre el ingreso.

β3 =∂lnWi

∂ESCi=

∂ %Wi

∂ESCi

Mide en cuanto cambia en términos porcentuales el ingreso, frente a un aumento en un

7

Page 251: Magno Econometría

año de educación.

Como t = 0,1239670,003168 = 39,13, (n− k) = 4021− 4 = 4017 y, además, t4017,95 % = 1,96

Esto implica que tc > tt ⇒ se rechaza Ho : β3 = 0 ⇒ β3 es estadísticamente signifi-cativo.

A su vez, como:

4%Wi = β34%ESCESC

= 0,123967 ∗ 0,01 ∗ 9= 0,01115703

= 1,11%

2. (7 puntos) Si su amigo quisiera testear la hipótesis de que los hombres poseen un mayorretorno a la educación superior. ¿Qué especificación le recomendaría y como testearía lasignificancia de esta hipótesis?.

Respuesta:

Wi = β1 + β2Dsexoi + β3Esci + β4Expei + β5DsexoESCi + ui

E[Wi/hombre] = β1 + β2 + β3Esci + β4Expei + β5ESCi

E[Wi/mujer] = β1 + β3Esci + β4Expei

En el caso de los hombres el retorno a la educación es:∂E[Wi/hombre]

∂ESC= β3 + β5

Para la mujeres:

∂E[Wi/mujer]∂ESC

= β3

Entonces para testear la hipótesis de que los hombres tienen mayor retorno a la educación,habría que ver la significancia de β5 en la especificación anterior (Ho : β5 = 0).

3. (7 puntos) Suponga que el investigador omite en la estimación la variable Expei. Cuá-les son los efectos en la estimación del retorno a la educación.(Cov(Expei, Esci) = −51,04)

Respuesta:

β3 = β3 +cov(Expe,ESC)

V (ECS)β4

= β3 − 51,04V (ESC)

0,012138

8

Page 252: Magno Econometría

Dado que si incluyéramos la variable experiencia su coeficiente sería positivo y dada lacorrelación positiva entre EXP y ESC (por la forma en que la experiencia se construye);la omisión de la variable experiencia generaría un sesgo hacia abajo en el parámetro delretorno a la educación.

4. (7 puntos) Su amigo esta preocupado por la posibilidad de que el modelo estimado presen-te heterocedasticidad. Sin embargo, no tiene muy claro los efectos de este problema y nosabe como tratarla. ¿Cuáles serían teóricamente los efectos sobre las estimaciones realiza-das si existiera heterocedasticidad?. Explique detalladamente algún método para testearsu presencia. Ante el desconocimiento de la estructura de heterocedasticidad. ¿Cuál seríael consejo que le daría a su amigo?.

Respuesta:

La presencia de heterocedasticidad no genera problemas sobre la propiedad de inses-gamiento del estimador de MCO, pero si sobre su eficiencia. Si se conoce el patrón deheterocedasticidad o se puede estimar, el estimador eficiente es el de MCG o MCF res-pectivamente.Posibles test: White, G. y Quant, Breusch y Pagan y Glesjer (en apunte está descrito).Si se desconoce el patrón de heterocedasticidad y es difícil de estimar, lo mejor es obte-ner una estimación consistente de la matriz de varianzas y covarianzas por el método deWhite, lo que me permite realizar la inferencia de forma correcta.

5. (7 puntos) Suponga que la varianza de los errores está dada por V (u) = σ2Expei. Comoestimaría el modelo? Qué resultados esperaría en comparación a los resultados obtenidosen la estimación?.

Respuesta:

Si conozco el patrón de heterocedasticidad : σ2i = σ2Expei, puedo componer la matriz Ω:

Expe1 0 0 . . 00 Expe2 0 . . 00 0 . 0 . 00 0 0 . 0 .0 0 0 0 . .0 0 0 . . Expen

Y estimar eficientemente β mediante el método de mínimos cuadrados generalizados:βMCG = (X ′Ω−1X)−1X ′Ω−1Y

Lo que es equivalente a aplicar MCO a un modelo transformado, cuya transformaciónconsiste en dividir cada observación de variable dependientes y explicativas por Expei.

6. (7 puntos) Su amigo esta preocupado, además, por la posibilidad de que el modelo esti-mado presente autocorrelación. Sin embargo, no tiene muy claro, nuevamente, los efectosde este problema y no sabe como tratarla. ¿Cuáles serían teóricamente los efectos sobrelas estimaciones realizadas si existiera autocorrelación?. Su amigo le proporciona ademáslos resultados de una estimación de un proceso AR(1) para los residuos de la regresiónoriginal. Construya el estadístico Durwin-Watson y testee la presencia de autocorrelación.Explique intuitivamente por qué este modelo arroja estos resultados.

9

Page 253: Magno Econometría

Dependent Variable: RESID01 Method: Least Squares Date: 12/01/04 Time: 12:27 Sample (adjusted): 6 6499 Included observations: 2480 after adjustments RESID01=C(1)*RESID01(-1)

Coefficient Std. Error t-Statistic Prob. C(1) 0.0085142 0.020 0.4208 0.673

Respuesta:

La autocorrelación al igual que la heterocedasticidad, no tiene impactos sobre el insesga-miento, pero si sobre la eficiencia de estimador de MCO.Un posible test es el Durbin-Watson (hay otros, ver apuntes)Si se desconoce el patrón de autocorrelación y no es posible estimarlo eficientemente, sepuede utilizar la estimación consistente de la matriz de varianzas y covarianzas utilizandoel método de Newey and West, para realizar la inferencia.Si ocupamos DW tenemos que : DW = 2(1− ρ) = 2(1− 0,0085142) = 1,98Con lo que se rechaza la hipótesis nula de autocorrelación.

El modelo arroja estos resultados, pues es un modelo de corte transversal donde es muyextraño encontrar autocorrelación entre individuos, recordar que la autocorrelación es unproblema común de series de tiempo.

7. (5 puntos) Como se mencionó en el enunciado la variable experiencia se construyó comoExpei = Edad − Esci − 6. ¿Qué consecuencias puede acarrear esta especificación de lavariable experiencia?. Explique detalladamente.

Respuesta:

Como la variable experiencia es construida a partir de otra variable explicativa (ESC),esto genera un gran grado de asociación entre dos variables explicativas del modelo omulticolinealidad.

10

Page 254: Magno Econometría

Econometría IProfesora: Javiera Vásquez.

Verano 2005

Examen

Comente 1: (10 puntos) Ud. posee información de la estimación de los siguientes modelos:

Modelo R2 Akaike Schwarz(1) yi = β0 + β1x1,i + β2x2,i + ui 0.96 2.15 3.19(2) yi = β0 + β1x1,i + β3x3,i + ui 0.85 2.10 2.98

De acuerdo a esta información me debería quedar con el modelo (2). Comente.

Falso, de acuerdo a la información reportada me debería quedar con el modelo (1) que esel que tiene un mayor R2. Si bien el modelo (2) tiene menores criterios de información que el(1), estos modelos no son comparables utilizando los criterios de información ya que no sonmodelos anidados.

Comente 2: (10 puntos) El R2 mide la proporción de la varianza de la variable dependienteque es explicada por la varianza de las variables explicativas, de esta forma, siempre es unnúmero que esta entre 0 y 1. Comente.

Depende, cuando el modelo de regresión incluye un término constante, se cumple que: ST =SR + SE, lo que se conoce como la descomposición de varianza, lo que garantiza que el R2

sea siempre positivo. Sin embargo, si el modelo no incluye constante, no se cumple la ecuaciónanterior de descomposición de varianza y el R2 puede tomar valores negativos, pero sigue siendosiempre menor a 1.

Comente 3: (10 puntos) La omisión de una variable relevante siempre sesga la estimaciónMCO de β. Comente.

Falso, la omisión de una variable relevante siempre produce sesgo en los parámetros a me-nos que la correlación entre la variable omitida y las explicativas incluidas sea cero, el signo delsesgo depende de dos cosas: la correlación entre la variable omitida y las variables explicativasincluidas y el valor del parámetro que tendría asociado la variable omitida (valor poblacional).Para un modelo sencillo con una variable explicativa (x1) y una variable omitida (x2) se mostróen clases que el sesgo es: cov(x1,x2)

V (x1)β2.

Comente 4: (10 puntos) Si el estadístico Durbin-Watson (DW) tomo el valor de 2, estamosseguros que no existe autocorrelación en nuestro modelo. Comente.

Si el estadístico Durbin-Watson toma valor de 2, el coeficiente de correlación asociado a es-te valor del estadístico es de 0. Recordar que DW ' 2(1− ρ), de esta forma si DW es 2 implicaque ρ = 0. Sin embargo, como la hipótesis nula es de no autocorrelación en los errores, a pesarde que con este valor del estadístico no puede rechazar la nula, no significa que pueda aceptarque no existe autocorrelación. Además este test sólo sirve para testear autocorrelación de primerorden, entonces a pesar de que no se puede rechazar la hipótesis nula de autocorrelación de estetipo, puede existir autocorrelación de un orden superior. El comente es Falso.

1

Page 255: Magno Econometría

Pregunta 1: (15 puntos) Considere la siguiente función de densidad condicional

f(y|x) =λe−λy(λy)x

x!y ≥ 0, λ ≥ 0

Obtenga el estimador de máxima verosimilitud de λ.

Respuesta Pregunta 1:

Para cada observación i se tiene la siguiente densidad:

f(yi|xi, λ) =λe−λyi(λyi)xi

xi!

La verosimilitud asociada a cada observación i es:

li(λ|yi, xi) = ln(

λe−λyi(λyi)xi

xi!

)

= ln λ− λyi + xi(lnλ + ln yi)− ln(xi!) (1)

De esta forma, aplicando sumatoria a la ecuación (1) obtengo la verosimilitud conjunta:

L(λ|y,x) = n ln λ− λ

n∑

i=1

yi + ln λ

n∑

i=1

xi +n∑

i=1

xi ln yi −n∑

i=1

ln(xi!) (2)

Maximizando (2) con respecto a λ obtenemos el estimador Máximo Verosímil:

∂L

∂λ=

n

λ−

n∑

i=1

yi +∑n

i=1 xi

λ= 0

n− λ

n∑

i=1

yi +n∑

i=1

xi = 0

λ =n +

∑ni=1 xi∑n

i=1 yi

λ =1 + x

y

2

Page 256: Magno Econometría

Pregunta 2: (15 puntos) En el siguiente modelo de regresión lineal simple:

yi = βxi + ui i = 1, ..., n

donde xi esta medida con error, de forma tal que sólo accedemos a la variable x∗i = xi + ωi,con ωi

iid∼ (0, σ2ω). Demuestre que el estimador de variables instrumentales, es un estimador

consistente.

Respuesta Pregunta 2:

El estimador de variables instrumentales en este caso es:

βV I =∑n

i=1 ziyi∑ni=1 zix∗i

Entonces, reemplazando yi por su versión poblacional yi = βxi + ui:

βV I =∑n

i=1 zi(βxi + ui)∑ni=1 zix∗i

Ahora sumando y restando βωi a la expresión entre paréntesis y operando:

βV I =∑n

i=1 zi(βxi + ui + βωi − βωi)∑ni=1 zix∗i

βV I =∑n

i=1 zi(β(

x∗i︷ ︸︸ ︷xi + ωi) +

εi︷ ︸︸ ︷ui − βωi)∑n

i=1 zix∗i

βV I =∑n

i=1 zi(βx∗i + εi)∑ni=1 zix∗i

βV I = β +∑n

i=1 ziεi∑ni=1 zix∗i

βV I = β +∑n

i=1 ziεi/n∑ni=1 zix∗i /n

Aplicando plim a la expresión anterior:

plimβV I = plimβ +plim

∑ni=1 ziεi/n

plim∑n

i=1 zix∗i /n

plimβV I = β +

=0︷ ︸︸ ︷E(ziεi)E(zix

∗i )︸ ︷︷ ︸

6=0

⇒ plimβV I = β

Para que z sea un instrumento válido debe cumplir con que E(ziεi) = 0 y E(zix∗i ) 6= 0, con lo

cual se demuestra que el estimador de variable instrumentales es consistente.

3

Page 257: Magno Econometría

Pregunta 3: (15 puntos) Considere el siguiente modelo:

yt = C(1) + C(2)xt + C(3)yt−1 + ut

Del cual se obtiene el siguiente output en Eviews:

Dependent Variable: YMethod: Least SquaresDate: 01/21/05 Time: 23:31Sample (adjusted): 1976 2003Included observations: 28 after adjustmentsY=C(1)+C(2)*X+C(3)*Y(-1)

Coefficient Std.Error

t-Statistic Prob.

C(1) 1.021150 1.074276 0.950547 0.3509C(2) 0.271875 0.138389 1.964572 0.0607C(3) 0.712607 0.143427 4.968432 0.0000

R-squared 0.987964 Mean dependent var 32.68142Adjusted R-squared 0.987001 S.D. dependent var 17.33004S.E. of regression 1.975875 Akaike info criterion 4.300857Sum squared resid 97.60204 Schwarz criterion 4.443593Log likelihood -57.21199 Durbin-Watson stat 1.572226

Testee la existencia de autocorrelación en los errores.

Respuesta Pregunta 3:

Como el modelo incluye la variable dependiente rezagada como regresor, no se puede utilizar eltest de Durbin-Watson. Se tiene que utilizar el siguiente test h-Durbin:

h =(

1− DW

2

)·√

n

1− nσ2α

∼ N(0, 1)

Utilizando la información de la tabla anterior:

DW n σ2α

1.572226 28 (0,143427)2

De esta forma,

h =(

1− 1,5722262

)·√

281− 28 · (0,143427)2

= 1,738115749

El valor de tabla de la distribución normal estándar a un 95% de confianza es 1.960 y a un90% de confianza es 1.645, entonces a un 5% de significancia no se puede rechazar la nula deno autocorrelación en los errores, sin embargo a un 10% de significancia se rechaza la hipótesisnula. También podemos calcular el p-value:

Φ(1,738115749) = 0,9582 p = 2[1− Φ(1,738115749)] = 0,0836

4

Page 258: Magno Econometría

Pregunta 4: (20 puntos) Suponga que Ud. tiene que estimar el siguiente modelo:

yi = β1x1,i + β2x2,i + ui con i = 1, ..., 102.

De la cual obtiene los siguientes resultados:

β =[

0,50,4

]X ′X =

[10 88 10

]V (β) =

[0,7 −0,56−0,56 0,7

]V (y) = 25,2

a) Realice los test de significancia para cada uno de los parámetros.

b) Determine el número de condición de la matriz X, para ver la presencia de colinealidad entrelas variables explicativas.

Respuesta Pregunta 4:

(a) Test de significancia de β1:

tc =0,5√0,7

= 0,59 ∼ tt = t100 ≈ 1,98

∴ No se puede rechazar la hipótesis nula de que β1 sea 0, el parámetro no es estadísticamentesignificativo.

Test de significancia de β2:

tc =0,4√0,7

= 0,47 ∼ tt = t100 ≈ 1,98

∴ No se puede rechazar la hipótesis nula de que β2 sea 0, el parámetro no es estadísticamentesignificativo.

(b) El número de condición de la matriz X, se obtiene con el siguiente coeficiente de Bels-ley:

γ =√

λmax

λmin

donde λmax y λmin son los valores propios de la matriz B=S(X’X)S.

En esta caso la matriz (X’X) contiene los elementos necesiarios para construir la matriz S:

X ′X =[ ∑n

i=1 x21i

∑ni=1 x1ix2i∑n

i=1 x2ix1i

∑ni=1 x2

2i

]=

[10 88 10

]

De esta forma,

B = S(X ′X)S =

[1√10

00 1√

10

] [10 88 10

][1√10

00 1√

10

]

B =[

1 810

810 1

]

5

Page 259: Magno Econometría

Continuación Respuesta Pregunta 4:

Ahora debemos obtener los valores propios de la matriz B, para cual debemos resolver elsiguiente sistema de ecuaciones:

|B − λI| = 0∣∣∣∣[

1 810

810 1

]−

[λ 00 λ

]∣∣∣∣ = 0

⇒∣∣∣∣

1− λ 810

810 1− λ

∣∣∣∣ = 0

(1− λ)2 −(

810

)2

= 0

(1− λ) = ± 810

⇒ (1− λ1) =810⇒ λ1 =

210

⇒ (1− λ2) = − 810⇒ λ2 =

1810

De esta forma podemos construir el coeficiente de Belsley (recordar que un número mayor a 25sugiere la presencia de multicolinealidad):

γ =

√1810210

=

√182

=√

9 = 3

∴ No existe evidencia de presencia de multicolinealidad entre las variables explicativas de estemodelo.

6

Page 260: Magno Econometría

Pregunta 5: (20 puntos) Dado el modelo de regresión:

yi = α + εi donde E(εi) = 0 y V (εi) = σ2εx2

i

(a) Encuentre el estimador MELI de α.(b) Encuentre el estimador de la varianza de α.

Respuesta Pregunta 5:

(a) El estimador eficiente de α es el estimador MCG (ya que conozco la matriz Ω o el pa-trón de Heterocedasticidad.

Ω =

x21 · · · 0 00 x2

2 · · · 0...

. . ....

...0 · · · 0 x2

n

(3)

De esta forma Ω−1 es:

Ω−1 =

1x21

· · · 0 00 1

x22

· · · 0...

. . ....

...0 · · · 0 1

x2n

(4)

Además como nuestro modelo incluye como variable explicativa sólo la constante, nuestra matrizX es:

X =

11...1

(5)

De esta forma:

X ′Ω−1X =[

1 · · · 1 1]

1x21

· · · 0 00 1

x22

· · · 0...

. . ....

...0 · · · 0 1

x2n

11...1

=

T∑t=1

1x2

t

(6)

X ′Ω−1Y =[

1 · · · 1 1]

1x21

· · · 0 00 1

x22

· · · 0...

. . ....

...0 · · · 0 1

x2n

y1

y2

...yT

=

T∑t=1

yt

x2t

(7)

⇒ αMCG = (X ′Ω−1X)−1(X ′Ω−1Y ) =

∑Tt=1

yt

x2t∑T

t=11x2

t

(b) El estimador de la varianza de α es:

V (αMCG) = σ2ε(X ′Ω−1X)−1 =

σ2ε∑T

t=11x2

t

7

Page 261: Magno Econometría

Econometría IProfesores: Andrés Otero

Javiera Vásquez.Otoño 2005

Pauta Examen

Parte I: Comentes (30 puntos) (Contestar sólo en las líneas disponible)

Pregunta 1: (5 puntos) Si en un modelo de regresión de la forma: Yt = βXt + ut el esta-dístico Durbin-Watson nos indica presencia de autocorrelación, bastará con incluir la variabledependiente rezagada un periodo (Yt−1) como regresor para solucionar definitivamente el pro-blema. Comente.

Falso, la autocorrelación puede ser provocada por dos cosas: si la variable dependiente tie-ne una tendencia y esta no esta siendo capturada por las variables explicativas y por un patróndinámico omitido. En el primer caso incluir la variable Yt−1 como regresor no soluciona el pro-blema, en el segundo caso puede que al incluir un rezago de la variable dependiente se solucioneel problema de autocorrelación si es que esta es de orden 1, pero si la autocorrelación es de unorden superior habrá que incluir más rezagos de la variable dependiente como regresor.

Pregunta 2: (5 puntos) El problema de error de medición no es preocupante, ya que sólogenera inconsistencia en el estimador MCO de la variable que esta medida con error. Comente.

Falso, se puede demostrar que:

plim βMCO = β − [Σxx + Σωω]−1Σωωβ

(No es necesario poner esta ecuación).

Es decir, cuando existe error de medida, basta con que sólo una de las variables explicati-vas este medida con error para generar inconsistencia en todos los parámetros estimados porMCO. Basta con la la matriz W tenga una de sus columnas distinta de cero, para que

∑ωω

sea distinta de cero y se genere la inconsistencia. Esto porque una variable explicativa con errorcontamina toda la matriz (X ′X).

Pregunta 3: (5 puntos) Una de las variables macroeconómicas más estudiadas empíricamenteha sido la tasa de interés real(r). Suponga que usted esta interesado en estimar cuales son lasvariables que explican el comportamiento de la tasa de interés real. Sin embargo, no disponede esta serie. Frente a este problema un amigo de usted, gentilmente, le ha ofrecido ayuda. Suamigo le propone construir la tasa de interés real mediante la identidad de Fischer, la cual definea la tasa de interés real como la diferencia entre la tasa de interés nominal y las expectativasde inflación r = i− φe.Donde i corresponde a la tasa de interés nominal y φe a las expectativasde inflación. A partir de esto le ha aconsejado estimar el siguiente modelo

rt = β0 + β1i + β2φe + γXt + εt

Donde X es un conjunto de k − 3 variables explicativas tales como tipo de cambio nominal,oferta monetaria, tasa de interés externa y otros. Y ε es un error bien comportado.

1

Page 262: Magno Econometría

¿Qué le diría a su amigo acerca de la especificación propuesta? ¿ Cómo esperaría que fuerael ajuste del modelo y la significancia de los parámetros.?

Habría que decirle al amigo que esta cometiendo un importante error y que es mejor querevise los libros de econometría de nuevo. El esta proponiendo correr una regresión para unaecuación contable, por lo que por definición el modelo tendrá un buen ajuste y los parámetrosserán significativos. La causalidad de la tasa de interés nominal y las expectativas de inflaciónsobre la tasa de interés real que se esta tratando de estudiar esta dada por definición dada laforma en que se construyó esta última.

Pregunta 4: (5 puntos) Es sabido que la presencia de heterocedasticidad arroja problemade eficiencia en las estimaciones. En este contexto el estimador Mínimos Cuadrados Generaliza-dos Factibles será el mejor estimado lineal insesgado. Por lo tanto, siempre es mejor implementarMCGF que la corrección consistente de White.

La eficiencia del estimador MCGF depende de la calidad de la estimación del patrón de he-terocedasticidad. Si esta estimación es muy mala, por que por ejemplo no estamos seguro delpatrón heterocedástico, podemos estar agregando más problemas al modelo. Por lo tanto, enalgunos escenarios es mejor utilizar el estimador consistente de White.

Pregunta 5: (5 puntos) Un R2 alto siempre nos indica que nuestro modelo esta bien espe-cificado. Comente.

Falso, modelos con presencia de multicolinealidad pueden arrojar elevados R2. Sin embargo,la estimación de los parámetros del modelo será ineficiente arojando conclusiones erróneas so-bre la significancia de los parámetros involucrados.

Pregunta 6: (5 puntos) El estimador Máximo Verosímil es el más eficiente de todos los esti-madores. Comente.

Efectivamente, el estimador Máximo Verosímil es el más eficiente de todos los estimadoresal alcanzar la cota inferior de Cramer-Rao, que es la mínima varianza asintótica que puedealcanzar cualquier estimador. Sin embargo, esta eficiencia en sólo en forma asintótica, en mues-tras pequeñas el estimador más eficiente (Teorema de Gauss-Markov) es MCO (si se cumplenlos supuestos). Por lo tanto, el comente es falso.

2

Page 263: Magno Econometría

Parte II: Ejercicios (Contestar sólo en el espacio disponible)

Debe resolver obligatoriamente los siguientes cuatro ejercicios

Ejercicio 1: (15 puntos) Con datos de salario por hora y producción por hora para EstadosUnidos (1959-1998), se obtienen los siguientes resultados en Eviews:

40

50

60

70

80

90

100

110

120

1960 1965 1970 1975 1980 1985 1990 1995

produccion por hora salario por hora

Dependent Variable: SALARIO Method: Least Squares Date: 07/05/05 Time: 19:46 Sample: 1959 1998 Included observations: 40 SALARIO=C(1)+C(2)*PROD

Coefficient Std. Error t-Statistic Prob. C(1) 29.51925 1.942347 15.19773 0.0000

C(2) 0.713659 0.024105 29.60658 0.0000 R-squared 0.958449 Mean dependent var 85.64500

Adjusted R-squared 0.957356 S.D. dependent var 12.95632 S.E. of regression 2.675533 Akaike info criterion 4.854881 Sum squared resid 272.0220 Schwarz criterion 4.939325 Log likelihood -95.09761 Durbin-Watson stat 0.122904

Breusch-Godfrey Serial Correlation LM Test: F-statistic 75.13900 Probability 0.000000

Obs*R-squared 32.26962 Probability 0.000000

-6

-4

-2

0

2

4

1960 1965 1970 1975 1980 1985 1990 1995

SALARIO Residuals

Dependent Variable: SALARIO Method: Least Squares Date: 07/05/05 Time: 19:51 Sample: 1959 1998 Included observations: 40 SALARIO=C(1)+C(2)*PROD+C(3)*@TREND

Coefficient Std. Error t-Statistic Prob. C(1) 0.571953 13.59850 0.042060 0.9667

C(2) 1.305693 0.276476 4.722620 0.0000 C(3) -0.903238 0.420341 -2.148822 0.0383

R-squared 0.963059 Mean dependent var 85.64500

Adjusted R-squared 0.961063 S.D. dependent var 12.95632 S.E. of regression 2.556609 Akaike info criterion 4.787279 Sum squared resid 241.8413 Schwarz criterion 4.913945 Log likelihood -92.74559 Durbin-Watson stat 0.204600

Dependent Variable: ERRORES Method: Least Squares Date: 07/05/05 Time: 19:54 Sample (adjusted): 1960 1998 Included observations: 39 after adjustments ERRORES=C(4)*ERRORES(-1)

Coefficient Std. Error t-Statistic Prob. C(4) 0.914245 0.056337 16.22811 0.0000 R-squared 0.873615 Mean dependent var 0.120615

Adjusted R-squared 0.873615 S.D. dependent var 2.561492 S.E. of regression 0.910629 Akaike info criterion 2.675945 Sum squared resid 31.51134 Schwarz criterion 2.718600 Log likelihood -51.18093 Durbin-Watson stat 1.472987

Dependent Variable: DSALARIO Method: Least Squares Date: 07/05/05 Time: 19:57 Sample (adjusted): 1960 1998 Included observations: 39 after adjustments DSALARIO=C(5)+C(6)*DPROD

Coefficient Std. Error t-Statistic Prob. C(5) 4.109836 0.656965 6.255797 0.0000

C(6) 0.528938 0.077395 6.834267 0.0000 R-squared 0.557983 Mean dependent var 8.500412

Adjusted R-squared 0.546037 S.D. dependent var 1.273537 S.E. of regression 0.858069 Akaike info criterion 2.581655 Sum squared resid 27.24242 Schwarz criterion 2.666966 Log likelihood -48.34227 Durbin-Watson stat 1.620598

3

Page 264: Magno Econometría

¿Qué puede concluir sobre el modelo estimado?. Sea bastante detallado y utilice las herramien-tas aprendidas en clases.

Respuesta:

1. Se puede ver gráficamente que tanto el salario por hora como la producción por horatienen un comportamiento tendencial, estos ya es un indicio de que podemos estar enpresencia de autocorrelación. (1 punto)

2. La estimación del modelo: salario = β0 + β1Prod tiene parámetros estadísticamente sig-nificativos, con un R2 alto, nos muestra que por cada unidad adicional de producción estose refleja en un aumento de salario de 0.71 (1 punto), pero podemos ver que tenemos unproblema de autocorrelación, ya que el estadístico Durbin-Watson toma un valor de 0.12con lo cual cae en la zona de rechazo de la nula de autocorrelación en favor de la hipótesisalternativa de autocorrelación positiva (3 puntos). Esto se confirma con el resultado deltest de Breusch-Godfrey, ya que tiene un p-value de 0%, lo que nos indica rechazo de lahipótesis nula de no autocorrelación con 0% de error tipo I (2 puntos); y con la inspeccióngráfica de los residuos del modelo, los que claramente tienen el comportamiento esperadobajo autocorrelación positiva (rachas de valores por sobre la media seguidas de rachas devalores por debajo de la media) (2 puntos).

3. Como se menciono en un comienzo la autocorrelación puede ser provocada por la tendenciade las variables, sin embargo, la estimación que incluye una tendencia como variableexplicativa muestra que a pesar de que esta es estadísticamente significativa y que loscriterios de información nos muestran que esta especificación es mejor a la anterior, elproblema de autocorrelación sigue presente (DW=0.2) (2 puntos).

4. Si la tendencia no es sólo lo que causa la autocorrelación, debe ser porque además existeun comportamiento dinámico omitido, el cual debería estar en el error. La estimación deun proceso autorregresivo de primer orden para los errores muestra que efectivamente elerror tiene un comportamiento dinámico, el coeficiente de correlación serial es de 0,9 ysignificativo (1 punto).

5. Al transformar las variables en diferencias: DSalariot = Salariot − 0,9 ∗ Salariot−1 yDProdt = Prodt − 0,9 ∗ Prodt−1, y estimar el modelo con estas variables transformadas(primer paso del método de Cochrane-Orcutt), vemos que el problema de autocorrelaciónha desaparecido (DW=1.62) (2 puntos).

Conclusión: el modelo estimado tiene un problema de autocorrelación provocado tanto por laexistencia de una tendencia como de un comportamiento dinámico omitido (1 punto).

4

Page 265: Magno Econometría

Ejercicio 2: (15 puntos) Suponga que se tiene el siguiente modelo

yt = Xtβ + ut E(ut) = 0 V ar(ut) = σ2E(yt)2

Explique detalladamente cuales son las consecuencias sobre MCO cuando es aplicado a estemodelo ¿Cómo estimaría este modelo? ¿Que estimador utilizaría? ¿ De que dependerá la efi-ciencia de su estimación?. Plantee una expresión para el estimador óptimo de β y de σ2

u.

Respuesta:

Este modelo presenta heterocedasticidad por lo que las estimaciones por MCO son ineficientes.El patrón que sigue la heterocedasticidad depende del valor esperado de la variable dependienteyt, es decir, E(yt) = Xtβ. Dado que β es desconocido no podemos aplicar el estimador MCG. Sinembargo, podemos aplicar MCGF y el estimador Máximo Verosimilutud (MV). La aplicacióndel primero requiere una estimación en dos etapas, ya que es necesario obtener β para aplicar elmétodo. De esta forma se puede estimar el modelo por MCO ignorando la heterocedasticidady luego usar esta estimación para normalizar las variables y aplicar MCGF. Este método serámenos eficiente que MV debido a que este último estimará en conjunto todos los parámetrosinvolucrados. (5 puntos)

Para encontrar las expresiones de β y σ2 lo podían hacer por MV o MCG.

Estimador Máximo Verosímil:

La función de densidad (equivalente a la verosimilitud) para cada yt ∼ N (xtβ, σ2(xtβ)2) es:

f(yt) =1√

2πσ2(xtβ)2· e−

(yt−xtβ)2

2σ2(xtβ)2

El logaritmo de la verosimilitud es:

l(yt) = −12

ln(2π)− 12

ln σ2 − ln(β)− ln(xt)− (yt − xtβ)2

2σ2(xtβ)2

Así, el logaritmo de la verosimilitud conjunta es:

l(y) = −T

2ln(2π)− T

2ln σ2 − T ln(β)−

T∑t=1

ln(xt)−T∑

t=1

(yt − xtβ)2

2σ2(xtβ)2(1)

Maximizando (1) con respecto a β y σ2 obtenemos las condiciones de primer orden, las cualesnos entregan el estimador MV de ambos parámetros:

∂l

∂β= −T

β+

1

σ2β3

T∑t=1

(yt − xtβ)2

x2t

+1

σ2β2

T∑t=1

(yt − xtβ)xt

x2t

= 0 (2)

∂l

∂σ2= − T

2σ2+

1

2σ4β2

T∑t=1

(yt − xtβ)2

x2t

= 0 (3)

De (3) tengo:

1

2σ4β2

T∑t=1

(yt − xtβ)2

x2t

=T

2σ2

5

Page 266: Magno Econometría

De esta forma el estimador MV de σ2 es:

σ2 =

∑Tt=1

(yt−xtβ)2

(xtβ)2

T(4)

Reemplazando (4) en (2):

−T

β+

1

σ2β

T∑t=1

(yt − xtβ)2

x2t β

2

︸ ︷︷ ︸T σ2

+1

σ2β2

T∑t=1

(yt − xtβ)xt

x2t

= 0

−T

β+

T

β+

1

σ2β2

T∑t=1

(yt

xt− β

)= 0

T β =T∑

t=1

yt

xt

De esta forma, el estimador MV de β es:

β =

∑Tt=1

yt

xt

T

(10 puntos)

Estimador MCF:

La variables yt, xt y ut transformadas son (para lo cual previamente se debe estimar β):

y∗t =yt

σt=

yt√β2x2

t

=yt

βxt

x∗t =xt

σt=

xt√β2x2

t

=1

β

u∗t =ut

σt=

ut√β2x2

t

=ut

βxt

El método de MCF consiste en estimar por MCO el modelo: y∗t = βx∗t +u∗t , donde u∗tiid∼ (0, σ2):

βMCF =∑T

t=1 y∗t x∗t∑Tt=1(x

∗t )2

=

∑Tt=1

yt

βxt· 1

β

∑Tt=1

(1β

)2

=1

β2

∑Tt=1

yt

xt

Tβ2

βMCF =

∑Tt=1

yt

xt

T

6

Page 267: Magno Econometría

El estimador MCF de σ2 corresponde al promedio muestral de la suma de los errores estimadosal cuadrados (pero de los errores transformados):

σ2MCF =

∑Tt=1(u

∗t )

2

T

σ2MCF =

∑Tt=1

(yt−xtβ)2

(xtβ)2

T

(10 puntos)

7

Page 268: Magno Econometría

Ejercicio 3: (15 puntos) El semestre pasado mostró empíricamente que a los alumnos conmejor rendimiento en los controles les iba mejor en el examen.

En esta oportunidad se obtuvo la siguiente regresión estimada:

Dependent Variable: EXAMEN Method: Least Squares Date: 07/06/05 Time: 16:46 Sample: 1 110 Included observations: 110 EXAMEN=C(1)+C(2)*CONTROLES

Coefficient Std. Error t-Statistic Prob. C(1) 1.180496 0.625536 1.887175 0.0618

C(2) 0.664234 0.135391 4.906056 0.0000 R-squared 0.182248 Mean dependent var 4.211818

Adjusted R-squared 0.174676 S.D. dependent var 1.126880 S.E. of regression 1.023741 Akaike info criterion 2.902818 Sum squared resid 113.1888 Schwarz criterion 2.951918 Log likelihood -157.6550 Durbin-Watson stat 2.024406

Modelo 1:

a) ¿Qué problemas puede presentar esta estimación?. Explique.

b) Especifique Ud. un modelo que le permita explicar la nota del examen incluyendo todas lavariables relevantes, y que a su vez le permita testear diferencias por género. Explícita-mente, ¿Cómo lo testearía?.

c) Ahora plantee un modelo que le permita testear si existen diferencias en la productividad delestudio entre hombres y mujeres (midiendo productividad en horas de estudio). Expliquey grafique.

Respuesta:

a) Presentará serios problemas de omisión de variables relevantes. Ya que es muy probable queel rendimiento del alumno no solo dependa de como le fue en los controles pasados si no deun conjunto de otros regresores. Como por ejemplo las horas de estudio dedicadas para elexamen. Como es sabido el sesgo en la estimación dependerá del signo de los parámetrosque acompañen a las variables omitidas y de la relación de estas con las variables que sise incluyeron en el modelo.

b) Podría ser:

N.Examen = β0 + β1N.Controles + β2DummyGenero + β3Xi + ε (5)

Donde Xi corresponde a un conjunto de variables significativas que explican el rendimientodel alumno en el examen. La manera de testear diferencias por género es a tráves de untest t al parámetro β2.

8

Page 269: Magno Econometría

c) Ahora plantee un modelo que le permita testear si existen diferencias en la productividad delestudio entre hombres y mujeres (midiendo productividad en horas de estudio). Expliquey grafique.

N.Examen = β0+β1N.Controles+β2DummyGenero+β3Xi+β4DummyGeneroHE+ε(6)

Donde HE corresponde a las horas estudiadas para rendir el examen.

Horas Estudiadas

Nota

β0

β0+β2 βΗΕ

βΗΕ+βDGΗΕ

Ejercicio 4: (5 puntos) Sobre la tarea realizada para el curso, responda las siguientes preguntas:

a) Señale el modelo estimado y la procedencia de los datos utilizados.

b) Principales problemas de su estimación y como los detecto.

c) Principales conclusiones.

Respuesta:Individual

9

Page 270: Magno Econometría

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)

Ejercicio 5: Considere el siguiente modelo:

yt = β1 +xt

xt + β2+ ut ut ∼ N (0, σ2)

los resultados de la regresión son :

β =[

6√

52

]con σ2 = 16 y σ2

y = 18

Estos resultados se obtuvieron con la siguiente muestra de valores de X, xt = −4,−3,−3,−4.Compute los criterios de información del modelo original y uno que asume que β2 = 0. ¿Cuálprefiere?. [Ayuda: recuerde que cuando el error de un modelo se distribuye normal los criteriosde información se pueden escribir en función de σ2]

Respuesta:

Cuando el error del modelo de regresión sigue una distribución normal, los criterios de in-formación pueden ser aproximados de la siguiente forma:

AIC = ln(σ2) + 2k

n

BIC = ln(σ2) + ln(n)k

n

De esta forma, del modelo sin restringir se tiene los siguientes valores de los criterios de infor-mación:

AIC = ln(16) + 224

= 3,773

BIC = ln(16) + ln(4)24

= 3,466

El modelo restringido (asumiendo que β2=0) queda de la siguiente forma:

yt = β1 + 1 + ut

yt = β3 + ut

Como es un modelo que sólo incluye una constante el estimador MCO de β3 es:

β3 =∑T

t=1 yt

T= Y

El estimador de la varianza del error de este modelo es entonces:

σ2 =∑T

t=1 ut

T − k

=∑T

t=1(yt − β3xt)T − k

=∑T

t=1(yt − Y · 1)T − k

σ2 = σ2y

10

Page 271: Magno Econometría

Por lo tanto, los criterios de información del modelo restingido son:

AIC = ln(18) + 214

= 3,390

BIC = ln(18) + ln(4)14

= 3,237

Finalmente, de acuerdo a los criterios de información es mejor el segundo modelo.

11

Page 272: Magno Econometría

Ejercicio 6: Si x tiene una distribución uniforme, es decir:

f(xt) =1α

0 < x < α

Encuentre el estimador Máximo Verosímil de α.

Respuesta:

Al tener xt tiene una distribución uniforme, significa que la probabilidad de observar cual-quier xt es constante e igual a 1

α , la función de densidad de esta variable se puede dibujar dela siguiente forma:

xt

f(xt)

0 α

f(xt)=1/α

Como se puede apreciar esta función no tiene un máximo en el rango [0, α] de xt, la soluciónal problema de maximizar la probabilidad de ocurrencia de la muestra será una solución esquina.

Como alpha determina el rango donde se mueve xt, el valor que me maximiza la probabili-dad de ocurrencia de xt es:

αMV = maxxt

Veamos esto con más detalle, supongamos que tenemos la siguinete muestra de x = 1, 5, 3, 4, 2, 1,5, 9,los cuales tienen una distribución uniforme, que pasa si tomo α = minxt, en este caso yoestoy estimado que xt se puede mover entre 0 y 1, de acuerdo a esto la probabilidad de quemi muestra venga de una distribución uniforme con este α es bastante baja, ya que claramenteobservo valores mayores a 1 (Figura 1). Si eligiera α = 2 significa que xt se puede mover entre0 y 2, este valor de α tampoco maximiza la probabilidad de ocurrencia de la muestra, ya queobservo varios valores de xt mayores a dos (Figura 2). La única forma de maximizar la proba-bilidad de ocurrencia de la muestra, es escoger α igual al máximo valor observado de xt, asíde acuerdo a esta densidad xt se puede mover entre 0 y el máximo, y no existe ningún valorobservado de xt que quede fuera de este rango.

12

Page 273: Magno Econometría

xt

f(xt)

0α1 2 3 4 5 6 7 8 9

No sedeberiaobservar

Figura 1: Si alfa fuese igual a 1 (min)

xt

f(xt)

1 2 3 4 5 6 7 8 9

No sedeberiaobservar

Figura 2: Si alfa fuese igual a 2

xt

f(xt)

1 2 3 4 5 6 7 8 9

Figura 3: Si alfa fuese igual a 9 (max)

Es posibleobservar todas

lasobservaciones

13

Page 274: Magno Econometría

EconometríaFacultad de Ciencias Económicas y Administrativas

Universidad de Chile

Pauta Examen Final

Semestre: Primavera 2005Profesores: Emerson Melo, Rodrigo Montero y Jaime Ruiz-Tagle / Javiera VásquezNo hay preguntas de ningún tipo para los ayudantes.

Rut .......................................Folio .......................................Tiempo: 120 minutosPuntaje Total: 120 Puntos

1. Pregunta 1: Modelo Lineal Generalizado (40

puntos)

Considere el siguiente modelo de regresión lineal multiple:

Y = X1β + X2β2 + U

donde X1 y X2 son matrices de n× k1 y n× k2 respectivamente, mientras que β1

y β2 son de dimensión k1 × 1 y k2 × 1, Y es de dimensión n× 1, y el término de

error U cumple los supuestos del modelo de regresión lineal clásico.

1. Plantee el problema de mínimos cuadrados asociado al modelo.(5 puntos)

Sol: El problema de mínimos cuadrados viene dado por

mınβ1,β2

(Y −X1β1 −X2β2)′(Y −X1β1 −X2β2)

1

Page 275: Magno Econometría

Los supuestos sobre el término de error no son necesarios para plantear

el problema de optimización anterior, son necesarios cuando necesitamos

saber acerca de las propiedades de los estimadores.

2. Demuestre que los estimadores β1 y β2 vienen dados por:

β1 = (X ′1M2X1)

−1X ′1M2Y

β2 = (X ′2M1X2)

−1X ′2M1Y

donde Mi = [I −Xi(X′iXi)

−1X ′i] i = 1, 2 (15 puntos)

Sol:En clases vimos que las ecuaciones normales de este problema corre-

sponden a

X ′1X1β1 + X ′

1X2β2 = X ′1Y

X ′2X1β1 + X ′

2X2β2 = X ′2Y

Si despejamos β1 en la primera ecuación y lo reemplazamos en la segunda

tenemos que resulta una ecuación en términos de β2, que se escribe como:

X ′2X1[(X

′1X1)

−1X ′1 − (X ′

1X1)−1X ′

1X2β2] + X ′2X2β2 = X ′

2Y

Si se resuelve para β2 encontramos la expresión que se pide

3. Demuestre que E(βi) = βi con i = 1, 2 (5 puntos)

Sol: Consideremos el caso para β1, donde lo podemos reescribir como

β1 = β1 + (X ′1M2X1)

−1X ′1M2X2β2 + (X ′

1M2X1)−1X ′

1M2U

Pero podemos ver que M2X2 = 0, ademas si tomamos esperanza y dado los

supuestos del enunciado, se concluye que E(βi) = 0, i=1,2

2

Page 276: Magno Econometría

4. Demuestre que

V(βi) = σ2u(X

′1M2X1)

−1(5 puntos)

Sol: Es facíl ver que a partir de la parte c) se puede escribir

β1 − β1 = (X ′1M2X1)

−1X ′1M2U

Luego, para (β1 − β1)(β1 − β1)′, tenemos

(β1 − β1)(β1 − β1)′ = (X ′

1M2X1)−1X ′

1M2UU ′M2X1(X′1M2X1)

−1

Tomando E() en la expresión anterior, concluimos

5. Suponga ahora que los errores se distribuyen normalmente con media cero

y varianza constante, es decir, U Ã N(0, σ2I). Si usted estima el mode-

lo anterior por Máxima Verosimilitud que forma deben tener β1 y β2.

¿Porque? (5 puntos)

Sol:Bajo supuestos de Normalidad, independencia y que además los errores

se distribuyen identicamente, se tiene que los estimadores de MV coinciden

con los de OLS. Este es un resultado que probamos en clases, donde se

mostró que los estimadores de MCO y de MV coinciden bajo las condiciones

señaladas anteriormente.

6. Suponga ahora que los errores se distribuyen normalmente con media cero,

pero

V(ui) = σ2i ∀ i

Cov(ui, uj) = 0 ∀ i 6= j

¿Cambian sus conclusiones respecto a la parte e?. (5 puntos)

3

Page 277: Magno Econometría

Sol:Cuando tenemos errores heterocedásticos, se rompe el supuesto de que

sean idenicamente distribuidos. Luego a pesar de ser errores normales y no cor-

relacionados, ya no se distribuyen de manera identica, por lo tanto tenemos que

el resultado de la parte e) no es válido.

2. Pregunta 2: Heteroscedasticidad (40 Puntos)

Considere el siguiente modelo:

Y = Xβ + U

donde Y es un vector de dimensión nx1, y X es una matriz de dimensión nxk.

Finalmente, β representa el vector de coeficientes a ser estimados (kx1) y U (nx1)

corresponde al término de error que tiene la siguiente distribución U ∼ (0, σ2I).

1. Derive la matriz de varianzas y covarianzas del estimador de mínimos cuadra-

dos ordinarios (MCO) de β. (5 puntos)

Respuesta. Se sabe que:

βMCO = (X ′X)−1X ′Y

Reemplazando:

βMCO = (X ′X)−1X ′(Xβ + U) = β + (X ′X)−1X ′U

Despejando:

βMCO − β = (X ′X)−1X ′U

Por lo tanto:

(βMCO − β)(βMCO − β)′ = (X ′X)−1X ′UU ′X ′(X ′X)−1

Aplicando esperanza:

E[(βMCO − β)(βMCO − β)′] = (X ′X)−1X ′E(UU ′)X ′(X ′X)−1

4

Page 278: Magno Econometría

E[(βMCO − β)(βMCO − β)′] = (X ′X)−1X ′σ2IX ′(X ′X)−1

Finalmente:

V ar(βMCO) = σ2(X ′X)−1

A continuación asuma que: E(UU ′) = σ2Ω:

2. Derive la nueva matriz de varianzas y covarianzas del estimador de mínimos

cuadrados ordinarios (MCO) de β. (5 puntos)

Respuesta. Retomando el desarrollo anterior:

E[(βMCO − β)(βMCO − β)′] = (X ′X)−1X ′E(UU ′)X ′(X ′X)−1

Sin embargo, ahora se considera que:

E(UU ′) = σ2Ω

Por lo tanto:

E[(βMCO − β)(βMCO − β)′] = (X ′X)−1X ′σ2ΩX ′(X ′X)−1

Finalmente:

V ar(βMCO) = σ2(X ′X)−1X ′ΩX ′(X ′X)−1

3. Derive la matriz de varianzas y covarianzas del estimador MCG de β. (5

puntos)

Respuesta. Se sabe que:

βMCG = (X ′Ω−1X)−1X ′Ω−1Y

Reemplazando:

βMCG = (X ′Ω−1X)−1X ′Ω−1(Xβ + U) = β + (X ′Ω−1X)−1X ′Ω−1U

Despejando:

βMCG − β = (X ′Ω−1X)−1X ′Ω−1U

5

Page 279: Magno Econometría

Por lo tanto:

(βMCG − β)(βMCG − β)′ = (X ′Ω−1X)−1X ′Ω−1UU ′Ω−1X ′(X ′Ω−1X)−1

Aplicando esperanza:

E[(βMCG−β)(βMCG−β)′] = (X ′Ω−1X)−1X ′Ω−1E(UU ′)Ω−1X ′(X ′Ω−1X)−1

E[(βMCG − β)(βMCG − β)′] = (X ′Ω−1X)−1X ′Ω−1σ2ΩΩ−1X ′(X ′Ω−1X)−1

Finalmente:

V ar(βMCG) = σ2(X ′Ω−1X)−1

Considere ahora el siguiente modelo de sólo dos variables:

Yi = α + βXi + Ui

Suponga además que la heteroscedasticidad toma la siguiente forma:

σ2i = σ2X2

i

4. Encuentre E(UU ′). (5 puntos)

Respuesta. Como el término de error es heteroscedástico y libre de au-

tocorrelación la matriz de varianza y covarianza de éste toma la siguiente

forma:

E(UU ′) =

σ21 0 · · · 0

0 σ22 0

...... 0

. . . 0

0 · · · 0 σ2n

=

σ2X21 0 · · · 0

0 σ2X22 0

...... 0

. . . 0

0 · · · 0 σ2X2n

E(UU ′) = σ2

X21 0 · · · 0

0 X22 0

...... 0

. . . 0

0 · · · 0 X2n

= σ2Ω

6

Page 280: Magno Econometría

5. ¿Qué transformación le haría a los datos para llevar a cabo de la estimación

por MCG? (Ayuda: Recuerde que la matriz P tiene que cumplir lo siguiente

P ′P = Ω−1) (10 puntos)

Respuesta. Se tiene que cumplir lo siguiente:

P ′P = Ω−1

Dado que:

Ω =

X21 0 · · · 0

0 X22 0

...... 0

. . . 0

0 · · · 0 X2n

Entonces:

Ω−1 =

1/X21 0 · · · 0

0 1/X22 0

...... 0

. . . 0

0 · · · 0 1/X2n

Por lo tanto:

P ′P =

1/X21 0 · · · 0

0 1/X22 0

...... 0

. . . 0

0 · · · 0 1/X2n

De esta manera, se desprende que:

P =

1/X1 0 · · · 0

0 1/X2 0...

... 0. . . 0

0 · · · 0 1/Xn

La transformación, entonces, sería: X∗ = PX y Y ∗ = PY , donde X es una

matriz de nx2 e Y es un vector de nx1.

7

Page 281: Magno Econometría

Considere ahora los siguientes datos:

X 4 1 5 8 2

Y 6 3 12 15 4

6. Calcule el estimador de mínimos cuadrados generalizados para α y β. (10

puntos)

Respuesta. El modelo a estimar es el siguiente:

Y ∗i = α + βX∗

i + Ui

Por lo tanto:

β =

∑5i=1 x∗y∗∑5i=1(x

∗)2

donde la variable en minúsculas denota que se encuentra en desviación re-

specto de su media. Finalmente:

β ≈ 1, 22

y:

α ≈ Y ∗ − βX∗ = 1, 65

3. Pregunta 3 (40 puntos)

3.1. Problemas con los datos (20 puntos)

Considere el modelo:

yi = β0 + β1xi + ui (1)

donde ui ∼ N(0, σ2u). Se sabe que la variable xi está medida con error, de modo

que sólo se observa

x∗i = xi + vi

8

Page 282: Magno Econometría

donde vi ∼ N(0, σ2v) y es independiente de ui, de xi y de yi.

(a) (3 puntos) Reescriba el modelo en la equación (1) en función sólo de las

variables observables y de los términos de error.

Respuesta:

yi = β0 + β1xi + ui

= β0 + β1(x∗i − vi) + ui

= β0 + β1xi − β1vi + ui

= β0 + β1xi + (ui − β1vi)︸ ︷︷ ︸εi

yi = β0 + β1xi + εi.

(b) (5 puntos) Muestre que en el modelo en (a) el error está correlacionado con

la variable observable x∗i . Explique las implicancias de este problema.

Respuesta:

Cov(εi, x∗i ) = Cov(ui − β1vi, xi + vi)

= Cov(ui, xi) + Cov(ui, vi)− β1Cov(vi, xi)− β1Cov(vi, vi)

= 0 + 0− β1 · 0− β1σ2v

Cov(εi, x∗i ) = −β1σ

2v .

Se observa que el error εi está correlacionado con la variable observable x∗i .

Esto implica que la estimación por MCO generará estimadores sesgados de

9

Page 283: Magno Econometría

los parámetros β.

(c) (5 puntos) Explique cómo se podría solucionar el problema en (b).

Respuesta: Una forma de corrección es la utilización de variables instru-

mentales. La idea es utilizar un instrumento en vez de la variable medida

con error. Para ello, se requiere que el instrumento no esté correlacionado

con el término de error y que el instrumento sí esté correlacionado con la

variable explicativa para la cual actúa como instrumento (la variable medida

con error).

(d) (7 puntos) En el modelo en la equación (1) considere ahora que sólo la variable

dependiene yi está medida con error ωi ∼ N(0, σ2ω), el que es independiente

de xi y de ui. ¿Cuáles son las implicancias de este problema de medición?

Explique y justifique algebraicamente.

Respuesta: Si sólo la variable dependiente está medida con error, se tiene que

sólo se observa:

y∗i = yi + ωi.

De este modo, el modelo observable es

y∗i = β0 + β1xi + ui

yi + ωi = β0 + β1xi + ui

yi = β0 + β1xi + ui − ωi

yi = β0 + β1xi + (ui − ωi)︸ ︷︷ ︸εi

yi = β0 + β1xi + εi.

10

Page 284: Magno Econometría

Se tendrá entonces que la covarianza entre el término de error y las variables

explicativas es igual a cero:

Cov(εi, xi) = Cov(ui − ωi, xi)

= Cov(ui, xi) + Cov(ωi, xi)

Cov(εi, xi) = 0.

Por lo tanto, no habrá problema de sesgo en la estimación de los parámetros.

3.2. Predicción (20 puntos)

(a) (10 puntos) Cuando se analiza la capacidad de predicción de un modelo en

un período en particular, habitualmente se utiliza el índice Raíz del Error

Cuadrático Medio (Root of Mean Square Error - RMSE) o el Promedio del

Error Absoluto (Mean of Absolute Error - MAE). Defina estos dos índices

y explique intuitivamente qué significa cada uno de ellos. ¿Qué problema

tienen?

Respuesta: Los índices se definen como

RMSE =

√∑i(yi − yi)2

n0

MAE =

∑i |yi − yi|

n0

donde n0 corresponde al número de observaciones sobre las cuales se analiza

la calidad de la predicción.

El RMSE corresponde a una medida de diferencia de los valores predichos

respecto a los valores verdaderos. Estas diferencias se consideran al cuadrado

11

Page 285: Magno Econometría

y luego se calcula la raíz para re-escalar el índice. El índice MAE es similar,

pero considera el valor absoluto de las diferencias. Ambos índices calculan

un error promedio en la predicción para un conjunto de observaciones en

particular (habitualmente un período en particular en series de tiempo). El

problema obvio que ambos índices presentan es que la escala de comparación

para distintos valores de yi.

(b) (5 puntos) Considere dos modelos

(1) yt = β0 + β1x1t + ut

(2) yt = β0 + β1x1t + β2x2t + ut,

con t = 1 . . . T . Al estimar ambos modelos por MCO se calcula el índice

RMSE. En el modelo (1) obtiene un RMSE=1.8, mientras que en modelo 2

se obtiene RMSE=1.5. ¿Cuál modelo tiene menor error de predicción? ¿Son

comparables los RMSE?

Respuesta: El modelo (2) tiene menor error de predicción porque el error

promedio es 1.5, menor a 1.8. Esta comparación es válida sólo porque se con-

sidera el mismo período, es decir, el mismo conjunto de observaciones para yt.

(c) (5 puntos) En el modelo en (b), luego de estimar por MCO se calcula el

índice RMSE para el subperíodo ta hasta T para el modelo (1) y se obtiene

RMSE=1.2. ¿Cuál modelo es mejor para predecir?

Respuesta: En (a) el índice RMSE es calculado para toda la muestra, de

modo que para toda la muestra el modelo (2) es mejor para predecir. Sin

12

Page 286: Magno Econometría

emabargo, si el objetivo fundamental es predecir sólo en el subperíodo ta has-

ta T , el modelo (1) es más adecuado porque para ese subperíodo presenta un

error medio más bajo.

13

Page 287: Magno Econometría

Universidad de ChileFacultad de Economia y Negocios

PAUTA EXAMEN

Econometría I

Otoño 2006

Profesoras: Javiera Vasquez y Claudia Sanhueza.

Puntaje Total: 88 puntos.

1. (40 puntos) Establezca si cada una de las siguientes afirmaciones es verdadera, falsa oincierta. Y demuestre su argumento matemáticamente.

a) Sólo en el caso que se omita una variable que tiene una varianza no constante segenerará el problema de heterocedasticidad, si la variable omitida tiene una varianzaconstante no se genera mayor problema.

RESPUESTA:Supongamos el siguiente modelo:

yi = β0 + β1xi + ui

en el cual se ha omitido la variable zi, de forma tal que el error del modelo ui tienelos siguientes componentes:

ui = zi + εi εiiid∼ (0, σ2)

De esta forma la varianza del error del modelo, ui es:

v(ui) = V (zi) + V (εi)v(ui) = V (zi) + σ2

Si V (zi) es constante entonces V (ui) es constante y el modelo es homocedástico, en elcaso contrario tendremos heterocedasticidad. Por lo tanto, el comente es verdadero.

b) Un tema de preocupación en análisis de datos de corte transversal es la mediciónde ciertas variables con error. De echo, cuando una variable es medida con error seproduce sesgo en la estimación de los parámetros.

RESPUESTA:Depende, si la variable dependiente esta medida con error no se genera problema desesgo, sin embargo, si una o mas variables explicativas están medidas con error se

1

Page 288: Magno Econometría

genera un problema de sesgo en todos los parámetros del modelo.Supongamos el siguiente modelo:

yi = β0 + β1xi + ui

además tenemos que no observamos yi sino y∗i que esta medida con error:

y∗i = yi + ηi donde ηi ∼ (0, σ2)yi = y∗i − ηi

escribiendo el modelo en función de la variable observada:

y∗i = β0 + β1xi + ui + ηi︸ ︷︷ ︸εi

donde εi cumple con los supuesto tradicionales bajo los cuales MCO es insesgado.

Ahora si xi esta medida con error, de forma tal que observamos x∗i , tal que:

x∗i = xi + φi donde φi ∼ (0, σ2)xi = x∗i − φi

escribiendo el modelo en función de la variable observada:

yi = β0 + β1(x∗i − φi) + ui

yi = β0 + β1x∗i + (ui − β1φi)︸ ︷︷ ︸

µi

como la covarianza entre µi y x∗i es distinta de cero, se rompe el supuesto 6 MCO,y el estimador de β será sesgado.

Cov(µi, x∗i ) = Cov(ui − β1φi, xi + φi)

= Cov(ui, xi)− β1Cov(φi, xi) + Cov(ui, φi)− βCov(φi, φi)= 0− β1 · 0 + 0− β1σ

= −β1σ2φ︸ ︷︷ ︸

6=0

c) Tanto si existe heterosedasticidad como si hay una variable omitida relevante seviolan los supuestos del modelo de regresión lineal. Por lo tanto, los estimadoresMCO serán sesgados e ineficientes bajo cualquiera de estas circunstancias.

RESPUESTA:Cuando tenemos heterocedasticidad la varianza del término de error deja de ser σ2Ipasando a ser σ2Ω, como el error sigue teniendo valor esperado iguala cero, en estascircunstancias el estimador MCO sigue siendo insesgado:

β = β + (X ′X)−1X ′u

E[β] = β + (X ′X)−1X ′E[u]

E[β] = β

2

Page 289: Magno Econometría

Pero la matriz de varianzas y covarianzas de β es mayor a σ2(X ′X)−1, con lo cualel estimados deja de ser eficiente:

V [β] = E[(β − E(β))(β − E(β))′]

V [β] = E[(X ′X)−1X ′uu′X(X ′X)−1]

V [β] = σ2(X ′X)−1X ′ΩX(X ′X)−1

Ahora cuando omitimos variables relevantes, y si esta variable esta correlacionadacon las variables incluidas en el modelo, se produce un problema de sesgo, pero node eficiencia:

Si en el modelo:

Yi = β0 + β1Xi + ui

Se ha omitido la variable zi, tenemos que el modelo verdadero es:

Yi = β0 + β1Xi + β2Zi + εi donde εi ∼ (0, σ2)

El estimador MCO de β1 se define de la siguiente forma:

β1 =∑

xiyi∑x2

i

β1 =∑

xi(β1xi + β2zi + εi)∑x2

i

β1 = β1 +β2

∑zixi∑x2

i

+∑

εixi∑x2

i

E[β1] = β1 +β2

∑zixi∑x2

i

+∑

E[εi]xi∑x2

i

E[β1] = β1 +β2

∑zixi∑x2

i︸ ︷︷ ︸6=0

De esta forma el comente es Falso.d) Si la correlación muestral entre dos variables independientes es 0,95 entonces proba-

blemente el estadístico t de MCO no será válido (es decir la distribución no será unat bajo H0).

RESPUESTA:Falso, cuando tenemos una alta correlación entre las variables explicativas del modelola matriz (X’X) es casi singular (determinante cercano a cero), lo que hace que lamatriz de varianzas y covarianzas de los parámetros MCO σ2(X ′X)−1 sea grande.Como los estadisticos t para una hipótesis lineal se definen como:

t =βi − βi√

V (βi)

De esta forma, el estadístico t en esta situación tenderá a ser mucho más pequeño,por ende no se va a rechazar la hipótesis nula en casos que si debería ser rechazada,se comente más error tipo II, pero la distribución del estadístico sigue siendo t.

3

Page 290: Magno Econometría

e) Tanto el error de media en una variable dependiente, como si hay una variable omitidarelevante pueden corregirse usando la metodología de variables instrumentales. Esmás, este último estimador es insesgado.

RESPUESTA:Mitad falso mitad verdadero. El error de medida en la variable dependiente no pro-duce sesgo. Por lo tanto no hay para que usar variables instrumentales (IV).Demostración en b).En el caso de variable omitida relevante si hay sesgo y se puede corregir usando IV.Demostración: Supongamos el siguiente modelo de regresión simple:

yi = βxi + ui

Donde existe una variable hi omitida, la cual está correlacionada con xi. Es decirui = δhi + εi, donde εi es iid

(0, σ2

). Si existe una variable zi correlacionada con xi

(E (zixi) 6= 0) y no correlacionada con ui (E (ziui) = 0), o sea no correlacionada conhi (E (zihi) = 0), entonces zi puede ser usada como una variable instrumental paraxi, y βIV será insesgado.Demostración. Sabemos que el estimador de variables instrumentales será:

βIV =∑

ziyi∑zixi

=∑

zi (βxi + ui)∑zixi

= β +∑

zi (δhi + εi)∑zixi

= β + δ

∑zihi∑zixi

+∑

ziεi∑zixi

Tomando E (.) tenemos

E (βIV ) = β + δE

(∑zihi∑zixi

)+ E

( ∑ziεi∑zixi

)

= β

Ya que εi es iid(0, σ2

)y E (zihi) = 0.

2. (10 puntos) Suponga que el desempleo se puede explicar exclusivamente por el compor-tamiento del índice mensual de actividad económica (IMACEC):

TDt = α + βIMACECt + ut

Ahora plantee un modelo más general que le permita testear que el impacto del IMACECsobre la Tasa de Desempleo difiere entre el primer trimestre y el tercer trimestre del año.Sea explícito en como lo testearía.

RESPUESTA:

4

Page 291: Magno Econometría

Definamos las siguientes Dummies:

d1i =

1 primer trimestre: enero, febrero, marzo0

d2i =

1 tercer trimestre: julio, agosto, septiembre0

Entonces el modelo que nos permite testear lo planteado en el enunciado es el siguiente:

TDt = α + βIMACECt + β2IMACECtd1i + β3IMACECtd2i + ut

Así,

E[TDt|primertrimestre, IMACECt] = α + βIMACECt + β2IMACECt

E[TDt|tercertrimestre, IMACECt] = α + βIMACECt + β3IMACECt

Entonces debemos realizar el siguiente test de hipótesis:

H0 : β2 = β3

Si se cumplen la hipótesis nula se comprueba que no existe diferencia estadística entre elimpacto del IMACEC sobre la tasa de desempleo entre el primer y tercer trimestre.

3. (10 puntos) En el siguiente modelo de regresión:

Yi = β1 + β2Di + ui

donde Y representa el salario por hora, y D es la variable dicotómica, que toma el valor 1 sies un titulado universitario y 0 si es titulado de educación media. Utilizando las fórmulasdel estimador MCO, demuestre que β1 = Y m y β2 = Y u − Y m, donde el subíndice msignifica con educación media y u titulado universitario.

RESPUESTA:

En este modelo se tiene la siguiente matriz de variables explicativas (X):

X = [i D]

donde i es un vector columna de puros unos, y D es la variable dicotómica que tomavalores 1 y 0.Así se definen las siguientes matrices:

X ′X =[

i′i i′DD′i D′D

]=

[n nu

nu nu

]

X ′Y =[

i′YD′Y

]=

[ ∑Yi∑

D=1

Yi

]

donde n es el tamaño muestral, nu es la cantidad de individuos con educación universi-taria en la muestra, además definamos nm como la cantidad de individuos con educaciónmedia, de forma tal que n = nu+nm. Además

∑D=1

Yi es la suma de la variable dependiente

5

Page 292: Magno Econometría

sólo para los individuos con la dummy igual a uno, es decir, los con educación universitaria.

Ahora calculemos la inversa de la matriz (X ′X):

(X ′X)−1 =1

n · nu − nu · nu

[nu −nu

−nu n

]=

[ 1nm

− 1nm− 1

nm

nnu·nm)

]

De esta forma, el estimador MCO es:

β = (X ′X)−1X ′Y =[ 1

nm− 1

nm− 1nm

nnu·nm

]·[ ∑

Yi∑D=1

Yi

]=

∑Yi−

∑D=1

Yi

nm

−∑

Yi

nm+

n∑

D=1Yi

nu·nm

β =

∑D=0

Yi

nm

−( ∑

D=1Yi+

∑D=0

Yi

)

nm+

n∑

D=1Yi

nu·nm

β =

∑D=0

Yi

nm

−∑

D=0Yi

nm−

∑D=1

Yi

nm+

n∑

D=1Yi

nu·nm

β =

∑D=0

Yi

nm

−∑

D=0Yi

nm+

∑D=1

Yi

nm

(n

nu− 1

)

β =

∑D=0

Yi

nm

−∑

D=0Yi

nm+

∑D=1

Yi

nm

(nm

nu

)

β =

∑D=0

Yi

nm

−∑

D=0Yi

nm+

∑D=1

Yi

nu

β =[

Y m

Y u − Y m

]

4. (13 puntos) Sea hijos el número de hijos de una mujer y educ los años de escolaridad deella. Un modelo simple que regresiona fertilidad y educación es:

hijos = β0 + β1educ + u

en el que u es el error observado.

a) ¿Qué factores contiene u? ¿Es probable que se correlacione con educación? ¿Queefectos tendría esto sobre la estimación de β1? Demuestre matemáticamente su re-spuesta.

RESPUESTA:

u contiene todos los factores que también determinan la elección del número dehijos que tiene una mujer y un término de error aleatorio.

6

Page 293: Magno Econometría

Si alguno de los factores que contiene u está correlacionado con educ entoncesestimar por MCO entregará estimadores de β1 sesgados. Por ejemplo, el nivelde ingresos de una mujer también afecta en su decisión de si tener hijos o no,y está altamente correlacionada con educación. También el estado civil de lamujer, a mayor educación de la mujer mayor es la probabilidad de disoluciónmatrimonial.Demostración.Sea F es el set de variables omitidas correlacionadas con educación (E (educ.F ) 6= 0).

β =(X ′X

)−1X ′y

Donde β = [β0, β1]′, X = [1|educ] e y = hijos. Entonces:

E (β) =(X ′X

)−1X ′ (Xβ + u) = β +

(X ′X

)−1X ′ (Fγ + ε)

= β +(X ′X

)−1X ′Fγ +

(X ′X

)−1X ′ε

= β + (X ′X)−1X ′Fγ︸ ︷︷ ︸

6=0

Por lo tanto, β1 estará sesgado.b) ¿Un análisis de regresión simple plantearía el efecto ceteris paribus de la educación

en la fertilidad? Explique.

RESPUESTA:Un análisis de regresión simple como el que se plantea originalmente (hijos = β0 + β1educ + u),asume que un efecto de educ sujeto a una serie de supuestos c/r al error u. Este análi-sis ceteris paribus es más pertinente a un análisis de regresión lineal múltiple, en elcual cada parámetro mide el efecto sobre la variable dependiente de alguna variableindependiente, asumiendo constantes todas las otras variable dependientes.

5. (15 puntos) El modelo siguiente permite que el salario además dependa de los años deeducación de ambos padres, denominada educpm:

log(sal) = β0 + β1educ + β2educ ∗ educpm + β3exper + β4antig + u

a) Muestre cuál es, en forma decimal, la retribución de otro año de educación en estemodelo. ¿Qué signo esperaría de β2? ¿Por qué?

RESPUESTA:La variación porcentual en los salarios por un año adicional de educación es:

∂ log(sal)∂educ

=∆ %sal

∆educ = 1= ∆%sal = β1 + β2 ∗ educpm

Si la educación de los padres es mayor mayor probablemente será la educación de loshijos, por lo tanto β2 debería ser positivo.

b) Con datos la ecuación estimada es:

log(sal) = 5, 65(0,13)

+ 0, 047(0,010)

educ + 0, 00078(0,00021)

(educ ∗ educpm)

+0, 019(0,004)

exper + 0, 010(0,003)

antig + u

7

Page 294: Magno Econometría

n=722, R2=0,169Interprete el coeficiente del término de interacción. (Ayuda: elegir dos valores especí-ficos de educpm y comparar efecto de educ)

RESPUESTA:Un año adicional de educación implica 0, 047+0, 00078 ∗ educpm % más de salarios.Es decir una persona cuyos padres tienen 18 años de educación tiene un retorno a laeducación total de 0, 047 + 0, 00078 ∗ 18.Una persona cuyos padres tiene en promedio 17 años de educación tienen un retornoa la educación de 0, 047 + 0, 00078 ∗ 17.La diferencia es de 0, 00078.Es decir, un año adicional en la educación de los padres reporta 0,00078 más delog(sal), esto es 0, 078 % más de salario.

c) Cuando educpm se agrega como una variable adicional en la ecuación, obtenemos:

log(sal) = 4, 94(0,38)

+ 0, 97(0,027)

educ + 0, 033(0,017)

educpm

+0, 0016(0,0012)

(educ ∗ educpm) + 0, 020(0,004)

exper

+0, 010(0,003)

antig + u

n=722, R2=0,174¿El salario depende ahora de manera positiva de la educación de los padres? Pruebela hipótesis nula de que el salario no depende de la instrucción de los padres.

RESPUESTA:Si, ahora el salario depende en forma positiva e independiente de la educación de lospadres.

∂ log(sal)∂educpm

= 0, 033 + 0, 0016 ∗ educ

Probando la hipótesis nula de que el salario no depende de la instrucción de lospadres.Primero, en esta estimación ambas variables relacionadas con la educacion de lospadres son no significativas en forma independiente. Los valores de los test t respec-tivos son:t∗ = 0, 033/0, 017 = 1, 94t∗ = 0, 0016/0, 0012 = 1, 33Ambos son menores a 1,96 que es el valor del test t al 95% de confianza con muchasobservaciones. Sin embargo, antes cuando estaba solamente la variable interactivaesta era significativa al 95%, 0,00078/0,00021=3,71.Por lo tanto, la educación de los padres en forma independiente no es significativa,pero en forma interactiva si lo es. El efecto de la educación de los padres es a travésde que afectan la educación de los hijos. Pero no tienen un efecto directo en quelos hijos tengan mayores salarios. Esta última hipótesis sería verdad si, por ejemplo,padres más educados tienen más networks (pitutos) para que sus hijos tengan mejorestrabajos y por lo tanto mejores salarios.

8

Page 295: Magno Econometría

Adicionalmente uno podría testear la hipótesis de que ambos parámetros en conjuntosean cero, pero esto no se puede hacer con los datos entregados.H0 : βeducpm = 0 y βeduc∗educpm = 0Hipotesis conjunta de que ambos parametros sean cero. Un subconjunto de las pen-dientes del modelo son cero. Para testear esto se ocupa un test F, el cual es:

F =(u′∗u∗ − u′u) /k2

u′u/ (n− k)∼ F(k2,n−k)

donde u∗ denotan los residuos MCO restringidos (donde k2 representa el número deregresores del modelo restringido o sin las dos variables asociadas a la educación delos padres), mientras que u representan los residuos del modelo MCO original.

9

Page 296: Magno Econometría

EconometríaFacultad de Economía y Negocios

Universidad de Chile

Pauta Examen

Semestre: Primavera 2007Profesores: José Miguel Benavente, Rodrigo MonteroAyudantes: Loreto Silva, Rodrigo Bravo, Felipe RíosTiempo de duración: 150 minutosNo hay preguntas de ningún tipo para los ayudantesEstá permitido utilizar calculadora

1. Teoría (40 puntos)La empresa Gini está evaluando implementar una nueva estructura de remu-

neraciones, para lo cual es fundamental entender primero cómo se determinan en laactualidad los salarios de sus trabajadores. Es por ello que han decidido contratarloa usted, flamante ex-alumno del curso de econometría 1 para que les ayude en elanálisis econométrico de su problema. Con el objetivo de abordar adecuadamente elproblema planteado, usted propone estimar la siguiente ecuación:

wi = α0 + α1Si + α2Xi + εi

donde wi representa el logaritmo del salario que percibe el trabajador i, Si corre-sponde a los años de escolaridad del trabajador, Xi son los años que lleva el traba-jador en la empresa Gini (antiguedad), y finalmente, εi corresponde a un términode error con media cero y varianza σ2.

1. Analice si en este modelo se está omitiendo alguna variable relevante. Además,establezca cuáles serían las consecuencias sobre la estimación de los parámetros(por MCO) de dicha omisión. (8 puntos)Respuesta. El modelo planteado omite claramente algunas variables que sonrelevantes, como por ejemplo, la habilidad, la antiguedad al cuadrado (paraver perfil creciente o decreciente de la experiencia), y variables que reflejencaracterísticas cualitativas como género.Por lo tanto, la estimación por MCO será sesgada; la dirección de este sesgodependerá de la correlación de la posible variable omitida con las variablesexplicativas y con la variable dependiente del modelo.

2. Explique al menos dos procedimientos que usted utilizaría para detectar lapresencia de heteroscedasticidad en los residuos. En caso de haberla, ¿cuáles

1

Page 297: Magno Econometría

serían las consecuencias sobre la estimación de MCO? ¿Cómo podría corregirel problema? (8 puntos)Respuesta. Se deben mencionar y describir brevemente dos de los siguientestests: White, Goldfeld y Quandt, Breusch-Pagan, Glesjer.La estimación por MCO no será sesgada, sin embargo, las varianzas sí seránsesgadas.

3. Usted observa en los datos que existe un elevado grado de asociación (negati-vo) entre la variable antiguedad y escolaridad del trabajador. ¿Cómo podríausted determinar si tiene en verdad un problema de multicolinealidad en losdatos? En caso de haberla, ¿cuáles serían las consecuencias para la estimaciónde MCO. (8 puntos)Respuesta. Se debe mencionar y describir el test de Belsey y uno o mássíntomas que indiquen la presencia de multicolinealidad. Algunos de ellos po-drían ser: R2 alto con coeficientes estadísticamente no significativos, pequeñocambio en los datos produce grandes variaciones en estimaciones por MCO, ycoeficientes con signos y magnitudes distintas a las esperadas.En presencia de multicolinealidad, MCO sigue siendo MELI, sin embargo, lasvarianzas serán muy grandes.

4. Suponga que es posible clasificar a los trabajadores de la empresa Gini entres categorías: operarios, personal administrativo y profesionales. Expliquedetalladamente cómo podría incorporar esta información al modelo planteadooriginalmente. (8 puntos)Respuesta. Se deben definir detalladamente las variables dummies a incor-porar: una para cada categoría (1 si pertenece a ella y 0 en caso contrario).En caso de incoporar las tres variables dummies (hay tres categorías de tra-bajadores) se debe dejar fuera del modelo la constante.

5. Suponga que usted no está seguro con cuál de ambas especificaciones quedarse,es decir, la que excluye la información planteada en la pregunta anterior, o bien,aquella que explícitamente la incluye (tipo de trabajador: operarios, personaladministrativo y profesionales). ¿Cómo podría determinar usted qué especifi-cación es mejor? (8 puntos)Respuesta. Se debe notar que el modelo 1 está anidado en el modelo plantea-do en la pregunta anterior, por ende, es posible utilizar los denominados crite-rios de información, como el criterio de Akaike y Schwarz. Se escoge el modeloque minimice el criterio de información.

2. Ejercicios (50 puntos)1. (25 puntos) Considere el siguiente modelo con perturbaciones no esféricas, para

el cual usted dispone de cuatro observaciones:

Yi = β0 + β1Xi + ui

2

Page 298: Magno Econometría

donde var(ui) = δiσ2, y δ1=1; δ2=2; δ3=3; δ4=4. Por otro lado, se tiene lo

siguiente: Yi=(3,6,9,12), y Xi=(1,2,4,5). Estime los parámetros β0 y β0 por elmétodo de mínimos cuadrados ordinarios.Respuesta.

βMCG = (X ′Ω−1X)−1X ′Ω−1Y

X =

1 11 21 41 5

Y =

36912

Ω = V ar(ε) = E(ε′ε)

Ω = σ2

δ1 0 0 00 δ2 0 00 0 δ3 00 0 0 δ4

Ω = σ2

1 0 0 00 2 0 00 0 3 00 0 0 4

Ω−1 =1

σ2

1 0 0 00 1

20 0

0 0 13

00 0 0 1

4

Por lo tanto, sustituyendo con lo anterior, se pueden obtener los β de mínimoscuadrados generalizados:

βMCG =

(1, 0662, 133

)2. (25 puntos) Las ventas de gasolina en una determinada zona geográfica se

modelaron a través de la siguiente especificación:

Q = 70− 0, 01P + 0, 2Y − 1, 5S1 + 3, 6S2 + 4, 7S3

donde Q representan las ventas, P es el precio, Y corresponde al ingresodisponible, y Si son variables dummies trimestrales (i=1,2,3,4). Los valoresesperados para Y y P para el próximo año vienen dados por:

Trimestre 1 2 3 4P 110 116 122 114Y 100 102 104 103

3

Page 299: Magno Econometría

a) Calcule las ventas esperadas para para cada trimestre del próximo año.(7 puntos)Respuesta. Las ventas esperadas para cada trimestre del próximo añovienen dadas por:

Q1 = 70− 0, 01P1 + 0, 2Y1 − 1, 5 = 87, 4

Q2 = 70− 0, 01P2 + 0, 2Y2 + 3, 6 = 92, 84

Q3 = 70− 0, 01P3 + 0, 2Y3 + 4, 7 = 94, 28

Q4 = 70− 0, 01P4 + 0, 2Y4 = 89, 46

b) Otro investigador propone utilizar los mismos datos para estimar unaecuación igual que la anterior, pero desea utilizar las variables dummiesS2, S3 y S4. Encuentre los coeficientes asociados a esta especificación. (9puntos)Respuesta. Este investigador propone el siguiente modelo:

Q = α1 + α2S2 + α3S3 + α4S4 + βP + γY

Además, se sabe que la siguiente identidad se cumple para estos datos:

S4 = 1− S1 − S2 − S3

Luego, reemplazando en la ecuación anterior:

Q = α1 + α2S2 + α3S3 + α4(1− S1 − S2 − S3) + βP + γY

Reagrupando términos:

Q = (α1 + α4)− α4S1 + (α2 − α4)S2 + (α3 − α4)S3 + βP + γY

que corresponde a la regresión original. Por lo tanto, haciendo uso de laestimación original, se tiene que:

α1 + α4 = 70

α4 = 1, 5

α2 − α4 = 3, 6

α3 − α4 = 4, 7

β = −0, 01

γ = 0, 2

Así, los coeficientes estimados por este investigador serán: α1 = 68,5; α2

= 5,1; α3 = 6,2; α4 = 1,5; β = -0,01 y γ = 0,2.

4

Page 300: Magno Econometría

c) Un tercer investigador propone utilizar las cuatro variables dummies: S1,S2, S3 y S4. Encuentre los coeficientes asociados a esta estimación. (9puntos)Respuesta. El modelo a estimar utilizando las cuatro variables dummieses el siguiente:

Q = α1S1 + α2S2 + α3S3 + α4S4 + βP + γY

Haciendo uso de la misma identidad que en la pregunta anterior:

Q = α4 + (α1 − α4)S1 + (α2 − α4)S2 + (α3 − α4)S3 + βP + γY

que corresponde a la regresión original. Por lo tanto, haciendo uso de losresultados de la estimación original, se tiene que la estimación llevada acabo por este tercer investigador será: α1 = 68,5; α2 = 73,6; α3 = 74,7;α4 = 70; β = -0,01 y γ = 0,2.

3. (40 puntos) AnalíticoCon datos para 100 firmas se ha estimado la siguiente relación:

Yi = α + βXi + εi

donde Yi es el logaritmo del salario promedio anual de los gerentes de la firma i, yXi es el logaritmo de las utilidades (beneficios anuales). El siguiente gráfico muestrala dispersión de las observaciones (se han eliminado los datos correspondientes acuatro firmas pues tenían utilidades negativas en el año en cuestión):

Figura 1: Salarios de gerentes y utilidades de la empresa

6.5

7.0

7.5

8.0

8.5

0 2 4 6 8 10 12

LOGPROFIT

LOG

SA

LAR

Y

5

Page 301: Magno Econometría

Los resultados de la estimación son los siguientes:

Figura 2: Determinantes de los salarios de los gerentes

Variable Coefficient Std. Error t-Statistic Prob. C 6.350.338 0.128961 4.924.249 0.0000

LOGPROFIT 0.162212 0.021984 7.378.765 0.0000R-squared 0.366774 7.269.493

Adjusted R-squared 0.360037 0.408740

S.E. of regression 0.326982 0.622791

Sum squared resid 1.005.023 0.676215

Log likelihood -2.789.396 5.444.617

Durbin-Watson stat 2.233.248 0.000000

F-statistic

Prob(F-statistic)

Mean dependent var

S.D. dependent var

Akaike info criterion

Schwarz criterion

Dependent Variable: LOGSALARYMethod: Least SquaresSample(adjusted): 5 100Included observations: 96 after adjusting endpoints

1. Note que se han dejado fuera cuatro observaciones para llevar a cabo la esti-mación, ¿por qué? (8 puntos)Respuesta. Se dejaron fuera pues las utilidades de esas cuatro empresas erannegativas (pérdidas), por lo tanto, la función logaritmo se indefine.

2. ¿Son estadísticamente significativos los coeficientes estimados? ¿Tiene β el sig-no esperado? (8 puntos)Respuesta. Son estadísticamente significativos, lo cual se desprende del p-vañue (menor a 0,05), o bien, del cuociente entre el valor estimado del coefi-ciente y la desviación estándar del mismo (cuyo valor es mayor que 1,97).

3. Según los resultados del test de Ramsey RESET, ¿habría un problema de es-pecificación del modelo? (8 puntos)

6

Page 302: Magno Econometría

Figura 3: Test de Ramsey RESET

F-statistic 0.878905 0.350930Log likelihood ratio 0.902997 0.341979

Variable Coefficient Std. Error t-Statistic Prob.

C -5.981.640 1.315.475 -0.454713 0.6504

LOGPROFIT -0.582640 0.794813 -0.733053 0.4654

FITTED^2 0.312867 0.333725 0.937499 0.3509

Method: Least Squares

Sample: 5 100 ; Included observations: 96

Ramsey RESET Test: Probability Probability

Test Equation: Dependent Variable: LOGSALARY

Respuesta. Este test fue diseñado originalmente para detectar la omisión devariables relevantes en el modelo (Xs). Sin embargo, en la práctica ha resulta-do muy útil para detectar no linealidades presentes en el modelo. El p-valuedel test es mayor que 0,05 por lo tanto, no se puede rechazar la hipótesis nulade que el modelo está bien especificado.

4. Según los resultados del test de White sobre heteroscedasticidad, ¿existe unproblema de este tipo en los residuos? (8 puntos)

Figura 4: Test de heteroscedasticidad de White

F-statistic 0.589335 0.556754Obs*R-squared 1.201.465 0.548410

Variable Coefficient Std. Error t-Statistic Prob.

C -0.032151 0.140858 -0.228249 0.8200

LOGPROFIT 0.048798 0.046586 1.047.494 0.2976

LOGPROFIT^2 -0.004059 0.003746 -1.083.502 0.2814

R-squared 0.012515

White Heteroskedasticity Test: Probability

Probability

Test Equation: Dependent Variable: RESOLS^2

Method: Least Squares

Sample: 5 100 ; Included observations: 96

Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puederechazar la hipótesis nula de que los residuos del modelo son homoscedásticos.

5. Según los resultados del test de Breusch-Godfrey sobre correlación serial, ¿ex-

7

Page 303: Magno Econometría

iste un problema de este tipo en los residuos? (8 puntos)

Figura 5: Test de autocorrelación serial de Breusch-Godfrey

F-statistic 0.759000 0.471043Obs*R-squared 1.558.288 0.458798

Variable Coefficient Std. Error t-Statistic Prob.

C -0.005453 0.129438 -0.042130 0.9665

LOGPROFIT 0.001021 0.022068 0.046281 0.9632

RESOLS(-1) -0.119031 0.104460 -1.139.490 0.2575

RESOLS(-2) 0.035061 0.105207 0.333255 0.7397

R-squared 0.016232

Test Equation: Dependent Variable: RESOLSMethod: Least Squares

Breusch-Godfrey Serial Correlation LM Test: Probability Probability

Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puederechazar la hipótesis nula de que los residuos no están autocorrelacionados.

8

Page 304: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

1

ECONOMETRIA I

PROFESORA: JAVIERA VASQUEZ

Pauta Examen

I. Comentes (25 puntos)

I.1. El estimador MCO es el mejor estimador siempre que se cumpla el supuesto de normalidad en el término de error, de no ser así es preferible el estimador Máximo Verosímil. Comente. Respuesta: Falso, para que MCO sea el mejor estimador LINEAL INSESGADO se requiere sólo que el error sea independiente e idénticamente distribuido, el supuesto de normalidad sólo es necesario para la inferencia y predicciones. Por el contrario, el estimador Máximo Verosímil SI requiere el supuesto de distribución del término de error (ya sea normal o alguna otra) para la estimación. El estimador MV es preferible cuando la muestra es grande y el modelo no es lineal. I.2 Suponga que Ud. esta interesado en estimar la demanda por entradas al concierto de The Police, ¿Qué problemas puede presentar en la estimación de esta demanda?¿Qué metodología es la más apropiada en este caso?

Respuesta: Para estimar la demanda por el concierto de The Police podemos utilizar la demanda por artistas similares y ver que ha pasado cuando se han realizado estos conciertos, es decir, podemos tomar datos de número de personas en conciertos con característica similares y tratar de explicarlo por el día que se realiza, cantidad de conciertos en la misma semana, etc. El problema es que la variable dependiente, número de personas en el concierto, en algunos casos puede estar censurada ya que para algunos conciertos puede que la demanda haya sido mayor a la capacidad el Estadio Nacional (agotándose las entradas), para todos estos conciertos donde se agotaron las entradas la variable dependiente esta censurada a partir de la capacitada del estadio (80.000 personas). La metodología de estimación más apropiada en este caso es el modelo Tobit, que considera dentro de la estimación la probabilidad de estar censurado.

I.3 El único problema de estimar por MCO un modelo de probabilidad (donde la variable dependiente es binaria) es que las predicciones de la probabilidad pueden estar fuera del rango [0,1]. Comente.

Respuesta: Si bien este es un problema del modelo de probabilidad lineal no es el único, dos problemas adicionales es que el modelo de probabilidad tiene heterocedasticidad, y

Page 305: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

2

que MCO cumple con las características deseable cuando el modelo lineal, supuesto que no se cumple en los modelos de probabilidad, no incluir la no linealidad es equivalente a omitir una variable relevante generando sesgo en la estimación. I.4 Si en la estimación de un modelo de regresión de la forma Yt=βXt+ut el estadístico de Durban-Watson nos indica presencia de autocorrelación, bastará con incluir la variable dependiente rezada un periodo como regresor para solucionar definitivamente el problema. Comente.

Respuesta: Falso, la autocorrelación puede ser provocada por dos cosas: si la variable dependiente tiene una tendencia y esta no esta siendo capturada por las variables explicativas y por un patrón dinámico omitido. En el primer caso incluir la variable Yt-

1 como regresor no soluciona el problema, en el segundo caso puede que al incluir un rezago de la variable dependiente se solucione el problema de autocorrelación si es que esta es de orden 1, pero si la autocorrelación es de un orden superior habrá que incluir más rezagos de la variable dependiente como regresor.

I.5 Indique cuales son los problemas en la estimación MCO que generan problema de sólo problemas de sesgo e inconsistencia, y cuales generan sólo problemas de eficiencia. Respuesta: Problemas de sesgo/inconsistecia:

• Omisión de variables relevantes • Error de medición en las variables explicativas • No linealidades omitidas

Problemas de eficiencia:

• Inclusión de variables irrelevantes • Multicolinealidad • Heterocedasticidad/autocorrelación

Page 306: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

3

II. Demostración (20 puntos)

Considere el siguiente modelo de regresión múltiple que contiene tres variables explicativas:

ii uXXXY ++++= 3322110 ββββ Pero Ud. esta interesado en estimar la suma de los parámetros de X1 y X2 (θ=β1+β2). (i) Muestre que 21

ˆˆˆ ββθ += es un estimador insesgado de θ.

(ii) Encuentre la )ˆ(θVar en términos de )ˆ( 1βVar , )ˆ( 2βVar , y )ˆ,ˆ( 21 ββcorr Respuesta:

(i) Te tiene que demostrar que:

2121 ]ˆˆ[]ˆ[

ββββθθ

+=+

=

EE

Para lo cual hay que demostrar que los estimadores de β1 y β2 son insesgados. El modelo anterior se puede escribir como Y=Xβ+u, donde β es un vector que contiene los cuatro parámetros del modelo, y X una matriz que contiene las tres variables explicativas del modelo más una columna de unos que representa la constante. El estimador MCO del modelo es:

YXXX ')'(ˆ 1−=β

Reemplazando Y por la especificación poblacional del modelo, se tiene:

uXXXuXXXXXXX

uXXXX

')'(ˆ')'(')'(ˆ

)(')'(ˆ

1

11

1

−−

+=

+=

+=

ββ

ββ

ββ

Tomando valor esperado a la expresión anterior, y bajo los supuestos clásicos del modelo MCO, que el error es bien comportado, se obtiene que el estimador es insesgado.

ββ

ββ

=

+= −

]ˆ[

][')'(]ˆ[0

1

E

uEXXXE

Page 307: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

4

Por lo tanto,

θθββββ

ββββ

=

+=+

=

=

]ˆ[]ˆˆ[

]ˆ[]ˆ[

2121

22

11

EEEE

(ii) La varianza del estimador de θ equivale a:

2)]ˆ(ˆ[)ˆ( θθθ EEV −= Como acabamos de demostrar que el estimador es insesgado:

2]ˆ[)ˆ( θθθ −= EV Ahora reemplazando en función de los coeficientes β’s:

22121 )](ˆˆ[)ˆ( ββββθ +−+= EV

Reorganizando términos, elevando al cuadrado y aplicando valor esperado:

)ˆ()ˆ,ˆcov(2)ˆ()ˆ(])ˆ()]ˆ()ˆ[(2])ˆ[()ˆ(

])ˆ()ˆ()ˆ(2)ˆ[()ˆ(

)]ˆ()ˆ[()ˆ(

)](ˆˆ[)ˆ(

2211

2222211

211

2222211

211

22211

22121

ββββθββββββββθ

ββββββββθ

ββββθ

ββββθ

VVVEEEV

EV

EV

EV

++=

−+−⋅−+−=

−+−⋅−+−=

−+−=

+−+=

III. Ejercicio matemático (20 puntos)

Suponga que una variable aleatoria Y tiene la siguiente función de distribución de probabilidad:

⎪⎩

⎪⎨

−−======

=qpY

qYpY

Yf1)3Pr(

)2Pr()1Pr(

)(

Considerando esta función de distribución de probabilidad se toma una muestra aleatoria con n observaciones denotadas como Y1, Y2,…, Yn.

Page 308: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

5

(i) Derive la función de verosimilitud de los parámetros p y q. Respuesta: Sea n1 el número de observaciones donde Y=1, n2 el número de observaciones donde Y=2, y por lo tanto n-n1-n2 el número de observaciones donde Y=3. Entonces la distribución de probabilidad conjunta de las n observaciones se puede escribir de la siguiente forma:

∏=

−−−−⋅⋅======n

i

nnnnniinn qpqpyYyYyYyY

12211

2121 )1()Pr(),...,,Pr(

Así, la función de verosimilitud esta representada por la función anterior pero tratando a p y q como parámetros desconocidos. (ii) Derive los estimador máximo verosímil de p y q

Respuesta:

Aplicando logaritmo natural a la expresión encontrada en la parte (i) obtenemos la

log-likelihood a optimizar con respecto a p y q:

)1ln()()ln()ln(ln 2121 qpnnnqnpnLl −−−−++==

Tomando derivadas parciales con respecto a p y q:

)1(

)1(

212

211

qpnnn

qn

pl

qpnnn

pn

pl

−−−−

−=∂∂

−−−−

−=∂∂

Haciendo ambas ecuaciones iguales a cero (condiciones de primer orden) y

resolviendo se obtienen los estimadores MV de p y q:

0)1(

)2(

0)1(

)1(

212

211

=−−−−

=−−−−

qpnnn

qn

qpnnn

pn

Page 309: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

6

De (1):

)3(00

0)()1(

211

21111

211

=+−−=++−−−

=−−−−−

pnnpqnnpnpnnpqnpnn

nnnpqpn

Adicionalmente restando (2) de (1):

)4(

0

1

2

21

pnnq

qn

pn

=

=−

Reemplazando (4) en (3):

nnp

npn

pnnppnnnn

MV1

1

21

211

ˆ

0

0

=

=−

=+−⋅−

Y reemplazado la última expresión en (4):

nnqMV

2ˆ =

Page 310: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

7

IV. Ejercicios prácticos (70 puntos)

Ejercicio 1 (20 puntos): Suponga que Ud. es el secretario de estudios de la FEN y esta interesado en evaluar el impacto de distintos profesores sobre el rendimiento de los alumnos. Específicamente se debe concentrar en un ramo, por ejemplo, Econometría y plantear una metodología que le permita evaluar en forma científicamente correcta el efecto profesor sobre el rendimiento de los alumnos en esta asignatura. Sea especifico en como lo haría: datos, variables, método de estimación, etc; que problemas puede enfrentar, es decir, que puede amenazar la validez interna y/o externa de sus resultados. Respuesta: La mejor forma científica de evaluar el efecto del profesor sobre el rendimiento de los alumnos es diseñar un experimento donde los alumnos sean asignados aleatoriamente a un profesor u otro. Supongamos que específicamente estamos interesados en evaluar el desempeño del profesor 1, por lo cual se asignarán aleatoriamente cierta cantidad de alumnos a este profesor, los que serán parte del grupo de tratamiento, y los restantes alumnos que fueron asignados al otro profesor representan el grupo de control. La variable de resultado es el promedio del curso. Es importante para que los resultados de ambos grupos sean comparables y midan exactamente el efecto del profesor las evaluaciones, clases y ayudantes tienen que ser exactamente iguales, de esta forma la única fuente de variación es como el profesor explica la materia a sus alumnos. De esta forma, para estimar el efecto del profesor 1 sobre el rendimiento de los alumnos se debe definir la siguiente variable binaria:

⎩⎨⎧

=2011

profesordelalumnoessiprofesordelalumnoessi

T

Y se debe estimar entonces el siguiente modelo de regresión:

iiii uXTP +++= γββ 10

Donde β1 mide el efecto causal del profesor 1 sobre el promedio de los alumnos (P), además se deben incluir otras variables explicativas que permita limpiar por cualquier cosa que haya afectado la aleatoriedad completa del experimento. La comparación de la estimación del efecto causal sin otros regresores y con otros regresores ayuda a ver si existieron estas amenazas en el diseño experimental. Potenciales amenazas a la validez interna de los resultados:

- Que los alumnos no sean asignados 100% en forma aleatoria sino por rendimiento

Page 311: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

8

- Fallas en seguir el protocolo de tratamiento: pueden existir alumnos que quieran tomar con profesor 1 o 2 y hagan valer su prioridad para que se les sea concedido el profesor que deseen. O que se cambien de sección después de la asignación.

- Atrición: Alumnos que abandonan el curso, ya sea del grupo de control o tratamiento, por bajo rendimiento, carga académica o problemas médicos. Si la atrición no es aleatoria generará sesgo en la muestra resultante al final del experimento.

- Efecto experimental: si se le indica a los alumnos que están siendo sometidos a un experimento, estos consiente o inconscientemente tenderán a cambiar su comportamiento.

- Muestras pequeñas: El máximo número con que podrá contar cada curso es 60 alumnos, un tamaño muestral bastante reducido que incluso puede ser menor si menos alumnos toman el ramo en el semestre.

Potenciales amenazas a la validez externa de los resultados:

- Muestra no representativa: se tiene que elegir un semestre que corresponda al de la malla de los alumnos, no puede ser semestre de verano, ni el semestre donde toma la gente que repite el curso.

Ejercicio 2 (50 puntos): El siguiente cuadro muestra la estimación de una modelo de retorno a la educación para las mujeres en la fuerza de trabajo. Donde la variable dependiente es el logaritmo del salario por hora, el que ha sido regresionado contra los años de escolaridad (educ), la experiencia (exper), experiencia al cuadrado (expersq), ingreso familiar excluyendo su salario en miles de pesos (nwifeinc), la edad (age), número de hijos menores de 6 años (kidslt6), y número de hijos entre 6 y 18 años (kidsge6). Source | SS df MS Number of obs = 428 -------------+------------------------------ F( 7, 420) = 11.78 Model | 36.6476796 7 5.2353828 Prob > F = 0.0000 Residual | 186.679761 420 .444475622 R-squared = -------------+------------------------------ Adj R-squared = Total | 223.327441 427 .523015084 Root MSE = .66669 ------------------------------------------------------------------------------ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- educ | .0998844 .0150975 .0702084 .1295604 exper | .0407097 .0133723 .0144249 .0669946 expersq | -.0007473 .0004018 -1.86 0.064 -.0015371 .0000424 nwifeinc | .0056942 .0033195 1.72 0.087 -.0008307 .0122192 age | -.0035204 .0054145 -0.65 0.516 -.0141633 .0071225 kidslt6 | -.0558725 .0886034 -0.63 0.529 -.2300339 .1182889 kidsge6 | -.0176484 .027891 -0.63 0.527 -.0724718 .0371749 _cons | -.3579972 .3182963 -1.12 0.261 -.9836494 .2676551 ------------------------------------------------------------------------------

Page 312: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

9

Con respecto a esta estimación:

(i) Complete la información faltante (5 puntos) El R2 del modelo representa la proporción de la varianza de la variable dependiente que es explicada por la varianza de las variables explicativas, de esta forma corresponde a la razón entre la suma al cuadrado (SS) del modelo y la suma al cuadrado total:

3.04433040.01337230.0407097t

6.61595630.01509750.0998844t

0.15016672/4270.52301508

/4200.444475621)1/()/(1

0.16409842223.327441

36.6476796

expr

educ

2

2

==

==

=−=−−

−=

===

nSSTknSSRR

SSTSSMR

(ii) ¿Qué puede decir sobre la bondad de ajuste del modelo? (5 puntos)

Con respecto a la bondad de ajuste del modelo, tanto el R-cuadrado como el R-cuadrado ajustado indican que las variables explicativas del modelo explican sólo un 15% del comportamiento de la variable dependiente, lo que es relativamente bajo pero no despreciable.

(iii) ¿Qué puede decir sobre la significancia del retorno a la educación? (5

puntos)

Comparando el estadístico calculado (6.62) con el valor de tabla se rechaza la hipótesis nula de que el coeficiente sea igual a cero. Lo mismo se puede concluir al observar que el cero no esta incluido en el intervalo de confianza. De esta forma los años de escolaridad es una variable estadísticamente significativa para explicar el logaritmo del salario de las mujeres.

(iv) ¿Qué problemas presenta la estimación anterior? (5 puntos)

La estimación anterior presenta sesgo de selección, ya que sólo se esta utilizando a las mujeres que trabajan en la estimación no tenemos antecedentes de ingresos de las mujeres que no participan en el mercado del trabajo, esto hace que la distribución de la variable dependiente este truncada.

Page 313: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

10

La siguiente tabla muestra una estimación alternativa del mismo modelo. Heckman selection model Number of obs = 753 (regression model with sample selection) Censored obs = 325 Uncensored obs = 428 Wald chi2(7) = 75.37 Log likelihood = -883.8828 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- lwage | educ | .1066795 .0208209 5.12 0.000 .0658713 .1474876 exper | .0406657 .0132436 3.07 0.002 .0147088 .0666226 expersq | -.0007457 .0003979 -1.87 0.061 -.0015255 .0000341 nwifeinc | .0047293 .0038863 1.22 0.224 -.0028877 .0123463 age | -.0049886 .0062221 -0.80 0.423 -.0171837 .0072064 kidslt6 | -.0974594 .1250796 -0.78 0.436 -.3426109 .1476921 kidsge6 | -.0191121 .0278513 -0.69 0.493 -.0736996 .0354754 _cons | -.40472 .3311825 -1.22 0.222 -1.053826 .2443857 -------------+---------------------------------------------------------------- select | educ | .1568112 .0240434 6.52 0.000 .109687 .2039355 nwifeinc | -.0209167 .0045791 -4.57 0.000 -.0298915 -.0119418 age | -.034533 .007576 -4.56 0.000 -.0493817 -.0196843 kidslt6 | -.8921331 .1144159 -7.80 0.000 -1.116384 -.6678821 kidsge6 | -.0385341 .0404704 -0.95 0.341 -.1178545 .0407864 _cons | .4155959 .4726033 0.88 0.379 -.5106895 1.341881 -------------+---------------------------------------------------------------- /athrho | .121872 .2608112 0.47 0.640 -.3893085 .6330525 /lnsigma | -.4109284 .0383022 -10.73 0.000 -.4859993 -.3358574 -------------+---------------------------------------------------------------- rho | .1212722 .2569754 -.3707639 .5601505 sigma | .6630344 .0253957 .6150822 .714725 lambda | .0804076 .1717962 -.2563066 .4171219 ------------------------------------------------------------------------------ LR test of indep. eqns. (rho = 0): chi2(1) = 0.17 Prob > chi2 = 0.6777 ------------------------------------------------------------------------------ Al respecto se le pide que conteste las siguientes preguntas:

(v) ¿De que manera esta estimación soluciona el problema mencionado en la parte (iv)?. Explique teóricamente. (15 puntos)

Lo que hace la estimación es estimar el modelo original pero corrigiendo por el problema de truncamiento de la variable dependiente, sabemos que cuando la variable esta truncada la media de la variable cambia agregándole el inverso de mill evaluado en el punto de truncamiento. En los modelos de sesgo de selección o truncamiento incidental el inverso de mill no se evalua en un punto fijo sino que en una set de variables explicativas por sus respectivos coeficientes que son los que determinan la probabilidad de estar o no truncado. La ecuación que se estima y que corrige el problema de sesgo de selección es la siguiente:

Page 314: Magno Econometría

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ

DEPARTAMENTO DE ECONOMÍA – UNIVERSIDAD DE CHILE

11

)(]1,,|[ γρλβ iiiii ZXSZXYE +==

Donde S es la variable indicador de selección, cuya probabilidad de que sea igual a uno es estimada utilizando las variables Z, y γ son los coeficientes de esta estimación. La variable λ() es el IMR que corrige el problema de truncamiento pero no basado en un umbral fijo, sino con las variables que determinan la probabilidad de selección. El no incorporar la variable lambda o inverso de mill equivale a omitir una variable relevante por lo que los parámetros serán sesgados en la medida que exista una correlación importante entre la variable omitida y las variables incluidas en la estimación y en la medida que la variable omitida sea realmente relevante (o sea significativa). En la tabla anterior veíamos que la educación, ingreso familiar, edad y número de hijos menores de 6 años son importantes para explicar la probabilidad de que la mujer trabaje o no.

(vi) ¿Por qué cambia la estimación del retorno a la educación?¿esta siendo sub

o sobre estimado?¿porque? (10 puntos)

Vemos que el retorno a la educación cambia marginalmente entre una estimación y otra, en la primera estimación el coeficiente estaba siendo subestimado indicando que la correlación entre el inverso de mill y educación es negativa. Esto se debe a que a mayor años de escolaridad la probabilidad de trabajar aumenta (tal como lo muestra la estimación anterior), y con esto disminuye la probabilidad de estar truncado.

(vii) ¿con cual de las dos estimaciones se quedaría Ud.? (5 puntos)

Ya habíamos mencionado que no se ven diferencias significativas en el retorno educación sin corregir por que la muestra esta truncada y corrigiendo. Además el test de hipótesis sobre el coeficiente rho, indica que no se puede rechazar que este sea igual a cero, es decir, el inverso de mill no es estadísticamente significativo, indicando que el problema de sesgo de selección no era tan grave. Por lo tanto, me debería quedar con la estimación MCO que es la más eficiente y la mejor considerando que el problema se sesgo de selección no es relevante.

Page 315: Magno Econometría

Pauta Examen Final

Econometrıa I

Profesor: Tomas Rau Binder

Ayudante: Victor Nahuelpan

23 de enero

Tiempo Total: 180 Minutos.Puntaje Total: 150 puntos.

1. Comente las siguientes afirmaciones. Diga si estas son verda-deras, falsas o inciertas y justifique su respuesta. (30 puntos en

total, 5 puntos c/u, maximo 5 renglones)

a) La presencia de error de medida produce que el estimador MCO sea sesgago e inconsistente.

R. Incierto: si el error de medida es en la variable dependiente, este solo producira errores estandarmas elevados, pero el estimador MCO seguira siendo insesgado y consistente. Por otra parte, si elerror de medida es en las variables independientes, efectivamente, el estimador MCO sera sesgado einconsistente.

b) La multicolinealidad implica que necesariamente aumente la probabilidad de cometer error de tipo II.

R. Verdadero. Si existe multicolinealidad (no exacta, si la multicolinealidad es exacta el estimadorMCO no existe) los errores estandar seran muy elevados, con lo cual, los estadısticos seran pequenos(por ejemplo el estadıstico t o F) y tenderemos a no rechazar la hipotesis nula, aun cuando esta seafalsa. Por definicion, el error tipo II es el que se comete cuando uno no rechaza la hipotesis nula cuandoella es falsa, luego estaremos mas expuestos a este tipo de error.

c) Dado que el estimador de MCG es MELI, siempre deberıamos usar este metodo en lugar de MCO.

R. Incierto. Si bien es cierto que el estimador MCG es MELI ante perturbaciones no esfericas, no esmenos cierto que el estimador MCO tambien es MELI si se cumplen los supuestos del Teorema deGauss-Markov. En el caso de perturbaciones no esfericas, la matriz Ω es generalmente desconocida,luego es posible estimar usando MCF en lugar de MCG. En consencuencia, el comente solo es verdedaroen el caso que Ω es conocida y es diferente a la matriz de identidad. En todos los demas casos es falso.

d) La estimacion por el metodo de variables instrumentales es muy util para los casos en que el residuoesta correlacionado con las variables independientes.

R. Vedadero. El metodo sirve para esos casos, puesto que se viola el supuesto de que las variablesindependientes y el residuo no esten correlacionadas. Un ejemplo que vimos en clases es cuando hay errorde medida en las variables dependientes. Esto bajo el supuesto de que tenemos buenos instrumentos,que esten correlacionados con la variables independientes y no correlacionados con el residuo.

1

Page 316: Magno Econometría

e) El metodo de Cochrane-Orcutt sirve para obtener un estimador eficiente cuando estamos en presenciade autocorrelacion.

R. Incierto. Es verdadero si la Autocorrelacion es de primer orden, es decir, el proceso del error sigueun proceso AR(1). Es falso o incierto si la autocorrelacion es de mayor orden.

f) El criterio de informacion bayesiano (BIC) es mayor al criterio de Akaike (AIC) cuando n > 3.

R. Verdadero. De acuerdo a las formulas que vimos en clases, la unica diferencia entre el criterio BICy AIC es la manera en que penalizan la saturacion del modelo (la perdida de grados de libertad).Mientras el criterio AIC suma k/n el criterio BIC suma ln(n) × k/n. Luego, si n > 3, tenemos queBIC − AIC = ln(n) − 1 > 0.

2. Problema de Desarrollo (50 puntos)

Considere el siguiente modelo de regresion lineal:

y = β0 + β1x1 + β2x2 + u

donde u satisface todos los supuestos vistos en clases.

a) Suponga que Ud. no dispone de informacion para la variable x2 y posee una muestra aleatoria simplepara x1 e y. ¿De que manera afecta al estimador MCO de β1 si Ud. omite la variable x2 del modelode regresion lineal? (5 puntos)

R. La omision de una variable relevante, implica que el estimador MCO sera sesgado. La direccion delsesgo dependera del signo del parametro de la variable omitida (β2) y del signo de la covarianza de lavariable omitida (x2) y con aquella que esta en el modelo (x1). Si β2 o cov(x1, x2) = 0, la omision dela variable x2 no sesga la estimacion de β1.

b) Suponga ahora que Ud. consigue informacion para la variable x2 pero es advertido que esta fue medidacon error. ¿De que manera afecta al estimador MCO de β2 si Ud. estima el modelo con la informaciondisponible? (5 puntos)

R. El error de medida siempre produce un sesgo de atenuacion (hacia abajo) en la variable que semidio con error. Luego este caso no esta excento de dicho problema.

c) Suponga que Ud. finalmente consigue una muestra aleatoria simple para las variables y, x1 y x2 dondese le garantiza que no sufren de problemas de medicion, la cual esta dada en el cuadro 1.

Cuadro 1: Datosy x1 x2

2 2 0-2 -1 21 0 0

-1 -1 -2

Evalue la matriz X ′X . ¿Que puede decir acerca de la relacion entre x1 y x2? ¿Como cambia su respuestaen a)? (5 puntos)

2

Page 317: Magno Econometría

R. La matriz X ′X es diagonal y esta dada por:

X ′X =

4 0 00 6 00 0 8

Esto implica que las variables son ortogonales entre ellas, luego el producto punto entre x1 y x2 es ceroy tambien lo es su covarianza. La respuesta en a) cambia puesto que omitir x2 no produce problemasen la estimacion de β1

d) Obtenga el estimador MCO de β0, β1 y β2 (10 puntos)

R. La estimacion MCO entrega los siguientes valores:

β =

β0

β1

β2

=

07/6−1/4

e) Calcule los errores estandar y el R2, ¿Que puede decir acerca de la calidad de los datos? (10 puntos)

R. Los errores estandar son los siguientes:

SE(β) =

SE(β0)

SE(β1)

SE(β2)

=

0,5770,4710,408

y el R2 = 0,866. A la luz de los errores estandar, notamos que los test-t son en general bajos (dehecho ninguna variable es significativa al 5% si vemos los valores crıticos en el Cuadro 1) y el R2 esrelativamente alto, esto sugiere un potencial problema de multicolinealidad, pero debemos hacer unainspeccion mas formal para determinarlo.

f) Obtenga el numero de condicion (condition number) y discuta si estamos en presencia de multicolinea-lidad. Ayuda: recuerde que los valores propios de una matriz A, corresponde a las raıces de la siguienteecuacion |A − λI| = 0. (15 puntos)

R. La matriz que debemos calcular es S′(X ′X)S donde el elemento si,j = 1/√

x′

ixj donde xi es elvector columna que contiene todas las observaciones para la variable xi. Luego, una simple inspeccionnos muestra que S′(X ′X)S = I, es decir la matriz de identidad. Los valores propios de una matrizidentidad son iguales a 1. Luego el numero de condicion es igual aγ =

λmax/λmin = 1 < 25, y deacuerdo a este criterio no habrıa multicolinealidad.

3. Problemas de Analisis

Problema I (40 puntos)

Keynes postulo que la propension marginal a consumir (PMC = ∆Ct/∆Yt) esta acotada entre 0 y 1. Eltambien postulo que la propension media a consumir (PMEC = Ct/Yt) disminuye a medida que el ingresodisponible aumenta.

3

Page 318: Magno Econometría

a) Especifique la funcion lineal de consumo Keynesiana. Muestre que el supuesto de que la PMEC decrececon el ingreso implica que el itercepto es positivo. (5 puntos)

R. La funcion de consumo Keynesiana se puede escribir como una relacion lineal entre el consumo yel ingreso disponible.

Ct = β0 + β1Yt

Se puede ver que

PMEC =Ct

Yt

=β0

Yt

+ β1

Luego para que PMEC sea decreciente a medida que aumenta Yt, β0 tiene que ser positivo. Si este esigual a 0, la PMEC es constante. Si este fuera negativo, la PMEC serıa creciente.

b) Usando datos per capita anuales, la estimacion de la funcion de consumo para Estados Unidos fue lasiguiente para el perıodo 1929-1938:

C = 981,35 + 0,735Y , R2 = 0,98

(158,65) (0,038)

¿Puede Ud. rechazar la hipotesis nula que la pendiente es mayor que cero? ¿ y menor que uno? Testeela hipotesis que el intercepto es igual a cero. (10 puntos)

R. Asumiendo que los supuestos vistos en clases se cumplen, el estadıstico t para PMC es -6.97, luegono se rechaza la hipotesis nula H0 : β1 ≤ 1 ante la alternativa H0 : β1 > 1 al 5%. Note que es un testa una cola donde la zona de rechazo esta en la cola derecha con unvalor crıtico aproximadod e 1.895 yentonces t = −6,97 < 1,895.

Para la hipotesis nula H0 : β1 > 0 y H1 : β1 ≤ 0 tenemos que el estadıstico t=19.34 y el valor crıticoes -1.895 (la zona de rechazo esta en la cola izquierda). Luego, t = 19,34 > −1,895 con lo cual no serechaza la hipotesos nula.

Finalmente, la hipotesis nula H0 : β0 = 0 con la alternativa Ha : β0 6= 0 se rechaza puesto que t=6.18el cual es mayor que el valor crıtico 2.365.

c) Dada la identidad del producto para una economıa cerrada

Yt = Ct + It + Gt

muestre por que los economistas notaron una implicancia de polıtica muy importante del hecho que laPMEC disminuya en el tiempo (debido a que el producto crece). (10 puntos)

R. Si dividimos la identidad por Yt tenemos que,

1 =Ct

Yt

+It

Yt

+Gt

Yt

luego, si la PMEC decrece para mantener la igualdad debe crecer el gasto publico o la inversionrespecto al producto. El candidato mas probable era el gasto publico, lo cual es basicamente unapolıtica fiscal expansiva.

4

Page 319: Magno Econometría

d) Simon Kuznets, que gano el premio Nobel de economıa, junto datos sobre gasto en consumo e ingresodesde 1869 y 1938 y encontro que la PMEC era relativamente constante en el tiempo. Para reconciliareste hecho con los resultados de la regresion, Milton Friedman, tambien premio Nobel. formulo suhipotesis del ingreso permanente. En esencia Friedman postulo que tanto el consumo como el ingresoson medidos con error.

C∗

t = Ct + vt, Y ∗

t = Yt + wt

donde Ct y Yt son el consumo e ingreso “permanente” respectivamente y vt y wt son los errores demedida que fueron llamados consumo e ingreso transitorios respectivamente. Friedman pensaba que loscomponentes transitorios eran solo errores aleatorios, no correlacionados con las terminos permanentes.

Considere que el consumo e ingreso permanente estan relacionados de la siguiente manera:

Ct = k × Yt

ası la PMC y PMEC son iguales y ademas constantes en el tiempo. Por ultimo, asuma que el consumoe ingreso transitorio (vt y wt) son errores independientes. Muestre que si estimamos la regresion conlos datos observados (C∗

t e Y ∗

t ) la PMC estara sesgada hacia abajo y el intercepto sera mayor que cero,incluso en muestras grandes. Para simplificar el analisis asuma que Ct e Yt son independientes. (15puntos)

R. Recuerde que en presencia de error de medida en la variable independiente tenemos que

plimβ1 =β1

1 +σ2

ω

S2

Y

donde S2Y = plim 1

n

∑n

i=1Y 2

i . Luego, en este caso β1 = k y por lo tanto β1 < k. Para el interceptotenemos que,

β0 = C∗ − β1Y ∗

= C + v − β1Y − β1w

= β0 + β1Y − β1Y − β1w + v

= β0 + (β1 − β1)Y − β1w + v

plimβ0 = β0 + (β1 − plimβ1)µY

= β0 + β1

σ2w

σ2w + S2

Y

µY

Luego, plimβ0 > β0.

Problema II (30 puntos)

Sir Francis Galton (1822-1911), un antropologo y primo de Charles Darwin, creo el termino Regresion a

la mediocridad en estatura hereditaria, Galton comparo la altura de los hijos con la de sus padres, usandouna muestra de 930 hijos y 205 parejas. En esencia, el encontro que padres altos (bajos) tienen altos (bajos)hijos, pero que los ninos no seran tan altos (bajos) como sus padres, en promedio. Luego, habrıa lo queconocemos como regresion a la media, o como Galton se refirio, regresion a la mediocridad. Este resultadoes una falacia si se intenta inferir este comportamiento a lo largo del tiempo. Si fuera verdad, la varianza dela altura en humanos hubiese disminuido de generacion en generacion y ese no es el caso.

5

Page 320: Magno Econometría

a) Para investigar acerca este resultado Ud. junta datos de estudiantes universitarios y sus padres y estimala siguiente relacion:

Ae = 0,5 + 0,7 × Ap, R2 = 0,45, n = 1000

(0,7) (0,32)

donde Ae es la altura del estudiante medida en centimetros y Ap es la altura del padre del estudiante.Los valores entre parentesis son los errores estandar corregidos por heterocedasticidad. Haga un graficocon esta lınea de regresion junto con una lınea de 45 grados y explique por que el resultado encontradoarriba sugiere regresion a la media. (10 puntos)

R. Graficando la recta tenemos que

El resultado sugiere regresion a la media puesto que los hijos de padres bajos seran mas altos que suspadres y los hijos de padres altos seran mas bajos que sus padres. Si esto sucede de generacion engeneracion, tenemos que la altura de las personas convergera a un valor medio.

b) Investigando la literatura medica Ud. encuentra que la altura depende, en una proporcion importantısi-ma, de un gen llamado “phog” y de factores ambientales. Suponga la altura del hijo(a) esta determinadapor el padre y que padre e hijo(a) tienen exactamente el mismo gen el cual no cambia en el tiempo yque la altura es medida con error de la siguiente manera:

Xi,h = f(Xi) + vi,h, y Xi,p = f(Xi) + ui,p

donde Xi,h es la medida de la altura del hijo h que tiene un gen Xi y los factores ambientales estandades por vi,h para el hijo y ui,p para el padre. La estatura medida del padre esta dada por Xi,p.Considere que los factores ambientales son independientes el uno del otro y ademas son independientesdel gen. Combinando las dos ecuaciones, encuentre una funcion de regresion poblacional y discuta surelacion con la “falacia de Galton”. (10 puntos)

6

Page 321: Magno Econometría

R. Restando las dos ecuaciones tenemos la siguiente funcion de regresion poblacional:

Xi,h = Xi,p + (vi,h − vi,p)

claramente esta funcion no se condice con la “falacia de Galton” puesto que el intercepto es igual a 0y la pendiente es igual a 1, por lo tanto segun esta especificacion no habrıa regresion a la media.

c) ¿Como testearıa las dos restricciones implicitas en la funcion de regresion poblacional encontrada enb)? ¿A la luz de lo que encontro en sus estimaciones en a?, ¿como testearıa si estas restricciones secumplen o no? (10 puntos)

R. las restricciones son que e intercepto sea igual a cero y la pendiente igual a uno. Para testear las dosrestricciones habrıa que hacer un test conjunto como el test de Wald o un test F. Con lo encontrado enb) y solo con la informacion que tenemos de b), la unica manera de testear esas hipotesis separadamentemediantes test-t. Los valores de los test-t son para el intercepto t = 0,71 y para la pendiente t = −0,93,luego no se rechaza ninguna de las dos hipotesis. Esto no nos ayuda mucho, puesto que como se dijoanteriormente la unica manera de testear este modelo correctamente es haciendolo con un test dehipotesis conjunta.

Cuadro 2: Valores Crıticos para una distribucion t-Studentn-k 90 % 95% 97.50% 99 % 99.50%

1 3.078 6.314 12.71 31.82 63.66

2 1.886 2.92 4.303 6.965 9.925

3 1.638 2.353 3.182 4.541 5.841

4 1.533 2.132 2.776 3.747 4.604

5 1.476 2.015 2.571 3.365 4.032

6 1.44 1.943 2.447 3.143 3.707

7 1.415 1.895 2.365 2.998 3.499

7

Page 322: Magno Econometría

AAYYUUDDAANNTTÍÍAASS

Page 323: Magno Econometría

Ayudantía de Econometría 17 de Junio 2004

Heterocedasticidad y Autocorrelación Profesores: Javiera Vasquez y Andres Otero

1. Considere el siguiente modelo:

εβ +=iY

⎥⎥⎥

⎢⎢⎢

⎡=

531

Y ⎥⎥⎥

⎢⎢⎢

⎡=Ω

20050001

2

..εσ

a) Calcule MCOβ y MCGβ

b) Calcule )ˆ(Var MCOβ y )ˆ(Var MCGβ

c) Calcule la )ˆ(Var MCOβ que resultaría de un modelo sin heterocedasticidad.

d) ¿Cuál estimador es más eficiente?

2. Considere ahora N=50 en las siguientes estimaciones calculadas a partir de los residuos

de mínimos cuadrados ordinarios.

5.0R ˆˆˆe 2222

2110

2t =+++= −− ttt veaeaa

6.0R ˆˆˆe 22

2110

2t =+++= ttt wxcxcc

9.0R ˆˆˆˆe 2231210t =++++= −− tttt vebebxbb

4.0R ˆˆe 2110t =++= − tt webb

a) Evalúe la existencia de autocorrelación de orden 2 utilizando un test asintótico

b) Evalúe la existencia de heterocedasticidad utilizando un test F de bondad de ajuste.

3. Considere la siguiente información para responder las siguientes preguntas.

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

=

0175.223

Y dónde el modelo a estimar es

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

=

15221

X iii uxy += β

Page 324: Magno Econometría

3.1) Si . 5,2,1con ),0(~ 2 K=iiNui

3.1.1) Muestre cual es la variable dependiente e independiente que debe utilizar

para calcular . ˆy ˆMCGMCO ββ

3.1.2) Muestre cuanto vale Ω

3.2) Si con la información del apartado 3.1) Usted obtuvo los siguientes

resultados , , y 5.0ˆ =MCOβ 22.1 ˆ =MCGβ 3.0 )ˆVar( =MCGβ

[ ]∑ ∑= +=

−−− ⎥⎦

⎤⎢⎣

⎡+⎟

⎠⎞

⎜⎝⎛

+−

2

1

5

1

''1

1 j jt

tjtjttjtt xxxxeeL

j = 0.5

3.2.1) Evalúe si 5.0 =β asumiendo que existe heterocedasticidad del tipo

5,2,1con ),0(~ 2 K=iiNui

3.2.2) Evalúe si 1 =β asumiendo que el problema no es el señalado en 3.1, sino

que existe autocorrelación.

4. Considere el modelo:

N(0,5)~u u-u y 1-ttttt =+= εεα

Si , obtenga el estimador de ⎥⎥⎥

⎢⎢⎢

⎡=

354

y α

5. Considere el siguiente MRL donde se cumplen todos los supuestos de MCO.

uXY iii += β

donde y

⎥⎥⎥⎥

⎢⎢⎢⎢

−−

=

16

34

Y

⎥⎥⎥⎥

⎢⎢⎢⎢

−=

03

21

X

Sin embargo, se presume que puede existir heterocedasticidad.

a) ¿ Cuál es el usual estimador de la varianza de β en una estimación de MCO?

b) ¿Cuál es la matriz de varianza y covarianzas de White?

c) Realice un test de White para probar la existencia de heterocedasticidad.

Page 325: Magno Econometría

d) Realice un test de Lagrange Multiplier para testear autocorrelación (con un rezago),

¿cuál es la hipótesis alternativa para este caso en particular? Para este apartado usa en

vez de la información original, los siguientes vectores:

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

−−=

616

34

Y y

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

−=

303

21

X

6. Considere la siguiente estimación entre el retorno de las acciones de Microsoft y el

retorno de mercado medido por el retorno asociado al índice de Dow Jones.

Dependent Variable: RMICROSOFT Method: Least Squares Included observations: 150 after adjusting endpoints

Variable Coefficient

Std. Error t-Statistic Prob.

C 0.003845 0.002445 1.572531 0.1167RDOW JONES 0.941777 0.110496 8.523149 0.0000

[ ]

052.0148

25.0

0003.00007.08718.0

''1

1

0004.00012.07679.0

' 6914.5

015.00028.0)'(

150

1

2

150

1

21

150

11

5

1

150

1

150

1

21

==

⎥⎦

⎤⎢⎣

⎡ −=⎥

⎤⎢⎣

⎡+⎟

⎠⎞

⎜⎝⎛

+−

⎥⎦

⎤⎢⎣

⎡=⎥

⎤⎢⎣

⎡ −=

∑ ∑

= +=−−−

=

te

e

ee

xxxxeeL

j

xxeXX

t

tt

j jttjtjttjtt

iiii

a) Evalúe la existencia de autocorrelación de orden 1.

b) Basándose en la conclusión obtenida en a), evalúe la hipótesis nula de que el retorno de

Microsoft es igual al retorno del mercado.

Page 326: Magno Econometría

Resolucion Problema 5 y 6Ayudantıa Econometrıa 17 de Junio

Profesores Javiera Vasquez y Andres OteroPreparado por Javier Fernandez

Problema 5:

A) El estimador de la varianza de β es σ2(X ′X)−1, para lo cual necesitamosobtener el β, y luego con este, los e (para estimar σ2), por lo tanto:

β = (X ′X)−1X ′Y =28

14= 2,

Con lo que

Y =

24

−60

, e =

2

−10

−1

, σ2 =e′e

n− k=

4 + 1 + 0 + 1

4− 1= 2,

V ar(βmco) =2

14=

1

7

B) La matriz de varianzas y covarianzas de White (S0) esta definida de lasiguiente forma:

S0 =1

n

n∑i=1

e2~xi′~xi

Donde ~xi es un vector fila correspondiente a la iesima observacion, por lo tanto:

S0 =1

4[4 ∗ (1)2 + 1 ∗ (2)2 + 0 ∗ (−3)2 + 1 ∗ (0)2] = 2

C) Para realizar un test de White necesitamos primero estimar por MCO(que ya fue hecho en partes anteriores) y luego correr una regresion entre elerror estimado al cuadrado de la regresion MCO y todas las combinaciones po-sibles de X (notar que los regresores de esta regresion son todos combinacionesde variables o variables al cuadrado), sin olvidar la constante, pues usaremosel R2 de la regresion. En este caso, como la matriz X tiene solo una columna,el regresor es X2, con lo cual, si Y = e2 y Z es una matriz que posee unacolumna de unos, y otra con X2, la regresion entre Y y Z en desviaciones de

1

Page 327: Magno Econometría

media resulta como sigue:

Y − Y =

2,5

−0,5−1,5−0,5

, Z − Z =

−2,5

0,55,5

−3,5

, β =−13

49

Con los resultados anteriores se puede obtener el R2 de la regresion, pararealizar el test de White:

R2 =β′Z ′M0Zβ

Y ′M0Y=

[−1349

]2∗ 49

9= 0,3832

TWhite = n ∗R2 = 4 ∗ 0,3832 = 1,5328

Lo que se compara con 3.84, que es el T critico proveniente de una χ2 conp− 1 grados de libertad, donde p es el numero de parametros de la regresionauxiliar; dado lo anterior, no se rechaza la hipotesis nula de este test, que esde Homocedasticidad.

D) En este caso, lo que hace el test de Breusch-Godfrey (LM) es estimarpor MCO, y luego correr una regresion con el error estimado resultante de-pendiendo de una constante (pues se usa el R2), las variables X, y rezagos delerror. Luego el test es n ∗ R2 y debe distribuirse bajo la nula como una χ2

p,donde p es el numero de rezagos del error incluidos en la regresion.

Y =

43

−6−1

6

, X =

12

−303

, β =46

23= 2, e =

2

−10

−10

Ahora se corre una regresion entre:

e =

−1

0−1

0

y Z =

1 2 21 −3 −11 0 01 3 −1

Al hacerlo en desviaciones de media, el β y el R2 resultan como sigue:

β =

[0,0180,345

]y R2 =

β′Z ′M0Zβ

Y ′M0Y= 0,67

Con lo cual el test de Breusch-Godfrey toma la siguiente forma:

Tbg = n ∗R2 = 4 ∗ 0,67 = 2,68

El resultado anterior nos lleva a no rechazar la hipotesis nula (ausencia de auto-correlacion de hasta orden p), pues el T critico es 3.84. La hipotesis alternativade este test es la existencia de autocorrelacion de orden p, donde p, como ya sedijo, es el numero de rezagos del error que se incluyen en la regresion auxiliar.La hipotesis alternativa de este test es la existencia de autocorrelacion de almenos orden p, dado que no se verificaron ordenes superiores.

2

Page 328: Magno Econometría

Problema 6:

A) La autocorrelacion de orden 1 puede ser testeada con el test de DurbinWatson,1 que es de la forma 2(1−φ), en este caso disponemos de una estimacionde φ,2 que es:∑150

i=1 etet−1∑150i=1 e2

t−1

= 0,25, con lo cual el test queda: DW = 2(1− 0,25) = 1,5 (1)

lo anterior pudiese sugerir autocorrelacion positiva, y al comparar el DW conla zona critica3 (provenientes de algun libro, Greene por ejemplo) se apreciaque es estadıstico cae en la zona de autocorrelacion positiva, lo que entregaevidencia estadıstica a favor de la existencia de autocorrelacion de orden 1, ysolo de orden 1, ya que este test no entrega ningun tipo de conclusion acercade ordenes superiores de autocorrelacion.

B) En este caso, para realizar inferencia lo correcto es usar la matriz deNewey West al calcular el proxy a la matriz de varianzas y covarianzas, pueshay evidencia de autocorrelacion de al menos orden 1, y como no conocemosel patron exacto, esto es lo adecuado.La hipotesis conjunta que se pide evaluar es C = 0 y RDOWJONES = 1,pues esta es equivalente con que el retorno de Microsoft es igual al retorno delmercado.El estadıstico adecuado es un test F para hipotesis conjuntas, que depende dela normalidad del error, o un test asintotico de hipotesis conjuntas, como eltest de Wald, que requiere de una muestra grande. Dado el contexto, y todo loanterior, lo mas adecuado pareciera ser usar el test de Wald, (pues no estamosseguros de la normalidad del error, disponemos de un n grande, y ademasdebemos usar un estimador asintotico de σ2(X ′ΩX)) cuya expresion es comosigue:

TW =[RβMCO − q

]′ [RV (βMCO)R′

]−1 [RβMCO − q

](2)

Donde V (βMCO) es la correcta matriz de varianzas y covarianzas de βMCO, yen este caso particular, dado la presuncion de autocorrelacion, esta es de lasiguiente manera:

V (βMCO) = (X ′X)−1S∗(X ′X)−1 (3)

=

[0,0028 −0,015

5,6914

] [1

150

[0,7679 0,0012

0,0004

]+

[0,8718 −0,0007

0,0003

]] [0,0028 −0,015

5,6914

](4)

y [RβMCO − q] es de la forma:

=

[1 00 1

] [0,0038450,941777

]−

[01

](5)

1Recordar que se puede usar solo si la estimacion no incluye a la variable dependienterezagada.

2El parametro φ proviene de la relacion et = φet−1 + µ, donde µ es un ruido blanco.3En este caso, se uso una zona critica para un n = 150, y un K∗ = 1, hay que recordar

que este K∗ no incluye a la constante; ası es como la zona critica que nos interesa, que esla del lado izquierdo, esta entre 1.611 y 1.637.

3

Page 329: Magno Econometría

El calculo del estadıstico queda propuesto, al igual que la conclusion, la cualse obtiene al comparar el χ2

calc con un χ2(2) de tabla.

4

Page 330: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IOtono 2005

Ayudantıa No8

Profesores: Andres Otero y Javiera VasquezAyudantes: Rodrigo Bravo y Roberto Jaramillo

Comentes

Comente las siguientes afirmaciones. Utilice matematicas y graficos si lo cree pertinente.

1. Siempre podemos utilizar para testear hipotesis los test t y F.

Respuesta: Falso, ya que es necesario que se cumpla que el error este normalmente distribuido.Esto es porque cualquier funcion lineal de variables normalmente distribuidas estara tambien nor-malmente distribuida, lo que es equivalente a decir que si u esta normalmente distribuida, los βtambien lo estaran.

2. Una funcion de distribucion normal se caracteriza porque su simetrıa es cero, y su kurtosis esindefinida.

Respuesta: Falso. Es correcto que la funcion de distribucion normal tiene simetrıa igual a cero,pero su coeficiente de kurtosis (es decir, el ancho de las colas de la distribucion) es igual a 3.

3. Si los errores del modelo de regresion lineal no tienen distribucion normal, a pesar de que losestimadores MCO ya no son MELI, siguen siendo insesgados.

Respuesta: El comente es falso ya que el resultado de que los estimadores por MCO son MELIno requiere que los errores se distribuyan normal. En efecto tal propiedad requiere que los errorescumplan la siguiente condicion: E(ui) = 0 ∀i, V ar(ui) = σ2

i I y Cov(ui, uj) = 0 ∀ı 6= j, es decir,que los errores ui ∼ iid sean independientes e identicamente distribuidos.

4. Es mejor predecir un valor puntual de y0 que el valor esperado E(y0/x0), ya que uno hace loprimero con mayor precision.

Respuesta: Falso. La varianza del error de prediccion al predecir un valor puntual de y0 es mayorque al predecir E(y0/x0), por lo tanto lo primero es menos preciso.

Ejercicios

1. Encontrar la varianza del error de prediccion e = E(y0) −X0β (al predecir el valor de E(y0)), ycompararla con la varianza que se obtiene al predecir un valor puntual de y0

Respuesta:

e = E(y0)− Y 0β = x0β − x0β = x0(β − β) = x0(X ′X)−1X ′u

σ2e = E[e · e′] = E[x0(X ′X)−1X ′uu′X(X ′X)−1x′0]

σ2e = x0(X ′X)−1X ′(σ2

u)X(X ′X)−1x′0]

σ2e = σ2

u[x0(X ′X)−1X ′X(X ′X)−1x′0]

1

Page 331: Magno Econometría

Departamento de Economıa Universidad de Chile

σ2e = σ2

u[x0(X ′X)−1x′0]

Al calcular un valor puntual de y0, el error de prediccion es e0 = y0 − y0 = x0(β − β) + u0. Porlo tanto, calculando su varianza:

σ2e = E[e · e′] = E[(x0(β − β) + u0)(x0(β − β) + u0)′]

σ2e = E[x0(β − β)(β − β)′x′0 + x0(β − β)u′0 + (x0(β − β))′u0 + u0u′0]

σ2e = E[x0(β − β)(β − β)′x′0] + E[u0u′0]

σ2e = σ2

u[x0(X ′X)−1x′0] + σ2u

2. Suponga que con datos de 2 paıses (Uganda y Suiza) tomados anualmente durante 10 anos, ustedobtiene la siguiente estimacion:

Crecimiento = α ·RecursosNaturales + β ·HDI + u

Con α = 0, 01, β = 0, 01, σ2 = 0, 09. Ademas:

(X ′X)−1 =[1, 0 0, 20, 2 0, 1

]Suponga que usted se entera de que el proximo ano Uganda tendra 2 unidades de RecursosNaturalesy 0 de HDI, mientras que Suiza tendra 0 de RecursosNaturales y 2 de HDI.

¿Cual es su prediccion para el crecimiento de ambos paıses el proximo ano?

¿Cual es su certeza de la afirmacion anterior?

Respuesta: El modelo que usaremos para calcular la prediccion es el siguiente:

y = α ·RN + β ·HDI

Por lo tanto, la prediccion para el crecimiento de y de Uganda es:

y0 = x0β

[2 0

]·[0, 010, 01

]= 0, 02

Ahora hay que calcular el valor del estadıstico t, para ver si el valor es estadısticamente significa-tivo. Pero para calcular el estadıstico t, aun nos falta conocer la varianza de la prediccion de y.Recordar que estamos calculando la varianza del error de prediccion cuando se quiere conocer unvalor puntual (para cada paıs). Calculando para Uganda se obtiene:

2

Page 332: Magno Econometría

Departamento de Economıa Universidad de Chile

σ2e = σ2

u0 · [1 + x0(X ′X)−1x′0]

σ2e = 0,09[1 +

[2 0

]·[

1 0,20,2 0,1

]·[20

]]

σ2e = 0,09[1 +

[2 0,4

]·[20

]]

σ2e = 0,45

Calculando el intervalo de confianza:

Pr[tα/2,n−k <yt+1 − y0√

V ar(σ2e)

< t1−α/2,n−k] = 1− α

Los grados de libertad son 10-2=8. Ademas asumimos un grado de significancia de 0.05. Por lotanto el estadıstico t es igual a 2.306 (dos colas).

Esto implica que:

Pr[−2,306 <yt+1 − 0,02√

0,45< 2,306] = 0,95

Pr[−1,5269 < yt+1 < 1,5669] = 0,95

Siguiendo los mismos pasos anteriores para Suiza, obtenemos que el crecimiento (prediccion) es:

[0 2

]·[0, 010, 01

]= 0, 02

Para calcular el estadıstico t, es necesario calcular nuevamente la varianza del error de prediccion,ya que los datos de la matriz x0 cambiaron.

σ2e = σ2

u0 · [1 + x0(X ′X)−1x′0]

σ2e = 0,09[1 +

[0 2

]·[

1 0,20,2 0,1

]·[02

]]

σ2e = 0,09[1 +

[0,4 0,2

]·[02

]]

σ2e = 0,09[1 + 0,4]

σ2e = 0,126

Ya que se tiene la varianza del error de prediccion, ahora podemos calcular el intervalo de confianzade la prediccion del crecimeinto de Suiza.

Calculando el intervalo de confianza:

3

Page 333: Magno Econometría

Departamento de Economıa Universidad de Chile

Pr[tα/2,n−k <yt+1 − y0√

V ar(σ2e)

< t1−α/2,n−k] = 1− α

Los grados de libertad son 10-2=8. Ademas asumimos un grado de significancia de 0.05. Por lotanto el estadıstico t es igual a 2.306 (dos colas).

Esto implica que:

Pr[−2,306 <yt+1 − 0,02√

0,126< 2,306] = 0,95

Pr[−0,7986 < yt+1 < 0,8386] = 0,95

El nivel de certeza que utilizamos para calcular los intervalos de confianza fue del 95 por ciento.

3. La Subseccretarıa de electricidad y combustibles esta interesada en conocer la relacion que existeentre consumo de energıa electrica (y) y el consumo de gas natural (x). Con este fin, encargaa la Subdireccion General de Estudios la especificacion de un modelo econometrico entre estasvariables y su estimacion a partir de las series de datos disponibles en la subsecretarıa. Supongaque usted trabaja como tecnico en la citada subdireccion y es el encargado de realizar el informesolicitado. Para ello dispone de la siguiente informacion elaborada por su ayudante a partir de losdatos originales:

n = 35∑

x = 17,22∑

x2 = 10,92∑

y = 85∑(yi − y)2 = 12,15

∑xy = 37,1022 R2 = 0,7462

¿Es significativo el coeficiente del consumo de gas natural en la explicacion del consumo de energıa?

Respuesta: Primero es necesario calcular el valor del β

β =n

∑xy −

∑x

∑y

n∑

x2 − (∑

x)2

β =35 · 37,1022− 17,22 · 85

35 · 10,92− (17,22)2

β =−165,12385,6716

β = −1,9274

Ahora calculando la varianza del coeficiente:

V ar(β) =σ2

u∑(xi − x)2

Sin embargo aun nos falta conocer el valor de σ2u. Este valor lo podemos obtener del R2

R2 = 1− SR

ST

SR = ST (1−R2)

4

Page 334: Magno Econometría

Departamento de Economıa Universidad de Chile

SR = u′u = 12,15(1− 0,7462) = 3,08367

σ2u =

u′u

n− k

σ2u =

3,0836733

= 0,09345

Por lo tanto el estadıstico t es igual a :

t =−1,9274− 0√

0,09345= −6,305

En una tabla T, evaluando con 33 grados de libertad y con un α = 0,05, el t calculado es igual a(usamos el de 30 GL porque no esta disponible el de 33:

t0,975,30 = 2,042

Por lo tanto existe suficiente evidencia para decir que el coeficiente es estadısticamente significa-tivo, con un 95 por ciento de confianza.

5

Page 335: Magno Econometría

DemostraciónEconometría I

FACEA, Universidad de Chile

Matriz P cuando estamos en presencia de sólo Heterocedasticidad:

Recordemos que para aplicar Mínimos Cuadros Generalizados (MCG) debemoshacer una descomposición espectral de la matriz Ω:

Descomposición Espectral de una Matriz:1

Ω = CΛC ′

donde C es la matriz de vectores característicos, y Λ una matriz diagonal cuyoselementos en la diagonal son los valores propios asociados a cada vector propiode la matriz C.

Valores propios:

Los valores propios de la matriz Ω se obtienen resolviendo el siguiente sistema deecuaciones:

|Ω− λI| = 0

donde λ es el valor propio e I una matriz identidad con las misma dimensión de Ω.

Vectores propios:

Cada vector propio (c) tiene dimensión n × 1, y debe satisfacer la siguienteecuación:

(Ω− λI)c = 0

Además debe satisfacer que c′c=1.

Finalmente utilizando esta descomposición, el estimador MCG definía la matrizP = CΛ−1/2 para transformar el modelo a un modelo con matriz de varianzas ycovarianzas escalar o esférica de los errores.

EJEMPLO: Veamos como sería la matriz P cuando tenemos sólo Heterocedas-ticidad en el error, además asumamos un caso sumamente sencillo donde sólotenemos dos observaciones i=1,2.

En este caso la matriz Ω es2:

Ω =

[σ2

1 00 σ2

2

]

1Greene. Análisis Econometrico, págs. 30-33.2Recuerde que Ω se puede definir indistintamente reescalando por σ2 o no

1

Page 336: Magno Econometría

DemostraciónEconometría I

FACEA, Universidad de Chile

Obtengamos los valores propios de Ω para construir la matriz Λ:∣∣∣∣[

σ21 00 σ2

2

]−

[λ 00 λ

]∣∣∣∣ = 0

∣∣∣∣σ2

1 − λ 00 σ2

2 − λ

∣∣∣∣ = 0

⇒ (σ21 − λ)(σ2

2 − λ) = 0

⇒ σ21σ

22 − λσ2

1 − λσ22 + λ2 = 0

⇒ σ21σ

22 − λ(σ2

1 + σ22) + λ2 = 0

⇒ λ =(σ2

1 + σ22)±

√(σ2

1 + σ22)

2 − 4σ21σ

22

2

⇒ λ =(σ2

1 + σ22)±

√(σ2

1 − σ22)

2

2

⇒ λ =(σ2

1 + σ22)± (σ2

1 − σ22)

2⇒ λ1 = σ2

1

⇒ λ2 = σ22

De esta forma la matriz Λ es:

Λ =

[σ2

1 00 σ2

2

]

Ahora calculemos los vectores propios, recuerde que cada valor propio tiene asoci-ado un vector propio. Comencemos con el vector propio de λ1. Este debe cumplirlas siguientes ecuaciones:

[σ2

1 − λ1 00 σ2

2 − λ1

] [c1c2

]= 0 (1)

c′c = 1 ⇒ c21 + c2

2 = 1 (2)

De (1) obtenemos que c2(σ22 − σ2

1) = 0, lo que implica que c2 = 0. Utilizando (2)podemos obtener c1 = 1. De esta forma el vector propio asociado a λ1 es:

[10

]

De igual forma podemos calcular el vector propio asociado al segundo valor propio(λ2), el que debe cumplir con las siguientes ecuaciones:

[σ2

1 − λ2 00 σ2

2 − λ2

] [c1c2

]= 0 (3)

c′c = 1 ⇒ c21 + c2

2 = 1 (4)

2

Page 337: Magno Econometría

DemostraciónEconometría I

FACEA, Universidad de Chile

De (3) obtenemos que c1(σ21 − σ2

2) = 0, lo que implica que c1 = 0. Utilizando (4)podemos obtener c2 = 1. De esta forma el vector propio asociado a λ1 es:

[01

]

De esta forma, la matriz C de vectores propios es simplemente una identidad:

C =

[1 00 1

]

Luego la matriz P es:

P = CΛ−1/2 =

[1 00 1

] [ 1σ1

0

0 1σ2

]=

[ 1σ1

0

0 1σ2

]

De lo cual se obtiene una gran conclusión, cuando estoy sólo en presencia deHeterocedasticidad, para trasformar mi modelo en uno Homocedástico, debo di-vidir cada observación de mi variable dependiente y variables explicativas por ladesviación estándar de su error. Es decir, dividir (yi, xi) por σi.

3

Page 338: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IOtono 2005

Multicolinealidad y Error de Medicion

Profesores: Andres Otero y Javiera VasquezAyudantes: Jose Manuel Castellon y Roberto Jaramillo

1. Comentes

Comente las siguientes afirmaciones. Utilice matematicas y graficos si lo cree pertinente.

1. El error de medicion no genera ningun problema cuando este se encuentra en la variable indepen-diente. Sin embargo, si este se encuetra en la variable dependiente, el estimador MCO deja de serMELI.

Respuesta: Falso. El error de medicion cuando se encuentra en la variable dependiente no generaproblemas que provoquen que el estimador MCO deje de ser MELI, ya que no se ha roto el supuestode que cov(x, u) = 0. Sin embargo, cuando el error de medicion se encuentra en la variableindependiente, el estimador MCO deja de ser MELI.

2. La multicolinealidad es un problema grave, que siempre hay que eliminar.

Respuesta: No necesariamente. La multicolinealidad es problema que afecta muchos elementos enla estimacion de los modelos. Sin embargo, esta es propia del modelo que se esta analizando, porlo que si esta se trata de eliminar, se corre el riesgo de estar cambiando el modelo en sı.

3. Cuando los datos que estamos analizando tienen multicolinealidad, el estimador MCO no puedecalcular el valor de los parametros, porque la varianza de los coeficientes estimados es casi cero.

Respuesta: No siempre. Cuando la multicolinealidad es exacta, no se pueden calcular los parametrospor MCO, ya que det((X ′X)−1) no esta definido. Sin embargo, cuando no es exacta, sı se puedencalcular los parametros por MCO, pero estos tienen una serie de problemas.

4. Una de las formas mas faciles de identificar la multicolinealidad es cuando vemos que el modelo queestamos estimando tiene un R2 bajo, pero todos los coeficientes son estadısticamente significativos.

Respuesta: Falso, porque es al reves. Una de las formas mas faciles de detectar la multicolinealidad,es cuando se tiene un R2, pero los parametros no son estadısticamente significativos.

2. Ejercicios

1. Considerar el siguiente modelo:

Yi = βXi + ui

a) Demostrar que la covarianza entre el termino de error del modelo y la variable X es igual acero si es que la variable X es medida correctamente, pero la variable Y es medida con error.Respuesta: Para el siguiente modelo:

Y ∗i = βXi + ui (1)

Cuando la variable dependiente esta medida con error:

1

Page 339: Magno Econometría

Departamento de Economıa Universidad de Chile

Y ∗i = Yi + εi (2)

Reemplazando (2) en (1):

Yi + εi = βXi + ui

Yi = βXi + ui + εi

Con η = ui + εi

Yi = βXi + ηi

Para sacar la covarianza, sabemos que Cov(X, ηi) = E(X · ηi)

E(X · ηi) = E(X · (ui − εi))= E(Xui + Xεi)= E(Xui) + E(Xεi)= 0

b) Obtener una expresion para la covarianza entre el termino de error y la variable X, suponiendoque el error de medicion de Y es directamente proporcional a X.Respuesta:Si el error de medicion de Y es proporcional a X equivale a decir que:

Y ∗i = Yi + εi

εi = ρXi + δi

Siguiendo que Cov(Xi, ηi) = E(Xi · ηi)

E(Xi · ηi) = E(X · (ui − εi))= E(Xi · (ui − ρX − δi))= E(Xiui −X2ρ−Xδi)= E(Xiui)− E(X2ρ)− E(Xδi)= −E(X2

i ρ)6= 0

Por lo tanto MCO deja de ser MELI.

2. Considerar el siguiente modelo:

Yi = β1 + β2Xi + β3Zi + ui (3)

¿Sera igual que se tenga que Xi + Zi = 8 que β2 + β3 = 8 para obtener los parametros estimados?

2

Page 340: Magno Econometría

Departamento de Economıa Universidad de Chile

Respuesta:

Para ver los efectos de estas equivalencias, las reemplazaremos para observar los resultados quetienen sobre la estimacion MCO. Reemplazando Zi = 8−Xi en (3) resulta:

Yi = β1 + β2Xi + β3(8−Xi) + ui

= β1 + β2Xi + 8β3 − β3Xi + ui

= β1 + 8β3 + Xi(β2 − β3) + ui

Utilizando β4 = β1 + 8β3 y β2 − β3 = β5 queda:

Yi = β4 + β5Xi + ui (4)

En (4) el problema es que se genera es que al momento de estimar el modelo, encontrarıamoslos valores de β4 y β5, volviendose imposible encontrar los valores originales (antes de la trans-formacion) de ˆbeta1, ˆbeta2 y ˆbeta3. Esto se debe a que el modelo sin la transformacion tenıamulticolinealidad, que provoca alguns de los parametros no puedan ser estimados.

Ahora utilizando β3 = 8− β2 y reemplazando en (3) resulta:

Yi = β1 + β2Xi + (8− β2)Zi + ui

Por lo que no afectarıa nuestra estimacion, ya que β3 = 8− β2, y al encontrar los parametros nogenerarıa los problemas que aparecıan con la primera transformacion.

3. Suponga que usted tiene que estimar el siguiente modelo en desviacion con respecto a la media:

yi = β1x1,i + β2x2,i + ui

con i = 1, ..., 102

De la cual se obtienen los siguientes resultados:

β1 = 0,5, β2 = 0,4,∑

x21 =

∑x2

2 = 10,∑

x1x2 =∑

x2x1 = 8, V ar(β1) = V ar(β2) = 0,7,Cov(x1, x2) = Cov(x2, x1) = −0,56, V ar(y) = 25,2

a) Realice los test de significancia para cada uno de los parametros.

b) Determine el numero de condicion de la matriz X, para ver la presencia de colinealidad entrelas variables explicativas.

Respuesta:

a) Para realizar los test de significancia de los parametros utilizamos un estadıstico t, que secompara con el valor de tabla de un valor tn−k, en que n − k = 102 − 2 = 100 al 95% deconfianza con dos colas. El valor del estadıstico es 1.9840.Para β1:

t =β1√

V ar(β1)=

0,5√0,7

= 0,59

3

Page 341: Magno Econometría

Departamento de Economıa Universidad de Chile

Como t100,95 % = 1,9840, por lo que el parametro no es estadısticamente significativo.

Para β2:

t =β2√

V ar(β2)=

0,4√0,7

= 0,48

Como t100,95 % = 1,9840, por lo que el parametro tampoco es estadısticamente significativo.

b) El numero de condicion de la matriz X se obtiene calculando el valor de Belsley, que se

calcula como γ =√

λMAX

λMIN, en que λ son los valores propios de la matriz S(X ′X)−1S. S es

una matriz de n× n diagonal, en que su diagonal esta formada por 1Pxi

S =

1√P

x21

. . . 0

.... . .

...0 . . . 1√P

x2n

n×n

Para este ejercicio, el valor de S esta dado por:

S =

(1√10

00 1√

10

)(5)

Ademas la matriz (X ′X)−1 es igual a :

(X ′X)−1 =( ∑

x21

∑x1x2∑

x2x1

∑x2

2

)=(

10 88 10

)(6)

Por lo que la matriz B = S(X ′X)−1S utilizando (5) y (6) queda 1:

B = S(X ′X)−1S =(

1 4/54/5 1

)(7)

Ahora hay que calcular el o los valores propios de B, lo que se hace a continuacion:

|B − λI| = 0

|(

1 4/54/5 1

)− λ

(1 00 1

)| = 0

|(

1− λ 4/54/5 1− λ

)| = 0

Calculando el valor anterior (determinante) queda:

(1− λ)2 − (4/5)2 = 0 (8)

1Recomendable comprobar, para ejercitar la parte matematica

4

Page 342: Magno Econometría

Departamento de Economıa Universidad de Chile

De (8) obtenemos los valores propios λ1 = 1/5 y λ2 = 9/5 y reemplazando estos valores enel ındice de Belsley queda:

γ =√

λMAX

λMIN=

√9/51/5

= 3

Como el ındice es menor que 25, no estamos en presencia de multicolinealidad.

5

Page 343: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IPrimavera 2005

Ayudantıa Extra - 05-08-05

Profesores: J. Vasquez-F. Tagle, R. Montero, E. MeloAyudante: Roberto Jaramillo 1

1. Ejercicios

1. Derive los estimadores MCO a partir de un modelo con una variable explicativa.

a) ¿Que variaciones puede obtener de este modelo? Nota: Encuentre los estimadores cuando elmodelo tiene solo constante, solo pendiente, y ambas.Respuesta:Para todos los modelos que se definan, lo que se busca es minimizar las suma de los erroresal cuadrado.

1) Utilizando este criterio en un modelo con pendiente y constante:

yi = β0 + β1xi + ui

⇒ ui = yi − β0 − β1xi

⇒n∑

i=1

u2i =

n∑i=1

(yi − β0 − β1xi)2

Minimizando la suma de los errores al cuadrado:

MINβ0,β1

n∑i=1

u2i (1)

⇒∂

∑ni=1 u2

i

∂β0= 0 (2)

⇒∂

∑ni=1 u2

i

∂β1= 0 (3)

Trabajando con (2)

∂∑n

i=1 u2i

∂β0= 0

⇒ −2n∑

i=1

(yi − β0 − β1xi) = 0

n∑i=1

(yi − β0 − β1xi) = 0

n∑i=1

yi − nβ0 − β1

n∑i=1

xi = 0

β0 = y − β1x

[email protected]

1

Page 344: Magno Econometría

Departamento de Economıa Universidad de Chile

Usando ahora (3)

∂∑n

i=1 u2i

∂β1= 0

⇒ −2n∑

i=1

(yi − β0 − β1xi)xi = 0

n∑i=1

(yi − β0 − β1xi)xi = 0

n∑i=1

xiyi − β0

n∑i=1

xi − β1

n∑i=1

x2i = 0

Reemplazando el estimador de β0 en la ultima expresion resulta:

n∑i=1

xiyi − (y − β1x)n∑

i=1

xi − β1

n∑i=1

x2i = 0

n∑i=1

xiyi − (∑n

i=1 yi

n− β1

∑ni=1 xi

n)

n∑i=1

xi − β1

n∑i=1

x2i = 0

n∑i=1

xiyi −∑n

i=1 xi

∑ni=1 yi

n+ β1

(∑n

i=1 xi)2

n− β1

n∑i=1

x2i = 0

β1 =

nn∑

i=1

xiyi −n∑

i=1

xi

n∑i=1

yi

nn∑

i=1

x2i − (

n∑i=1

xi)2

2) Ahora usando un modelo que solo tiene constante:

yi = β0 + ui

⇒ ui = yi − β0

⇒n∑

i=1

u2i =

n∑i=1

(yi − β0)2

Minimizando la suma de los errores al cuadrado:

MINβ0

n∑i=1

u2i

⇒∂

∑ni=1 u2

i

∂β0= 0

⇒ −2n∑

i=1

(yi − β0) = 0

n∑i=1

yi − nβ0 = 0

β0 = y

2

Page 345: Magno Econometría

Departamento de Economıa Universidad de Chile

3) Y con un modelo solo con la pendiente:

yi = β1xi + ui

⇒ ui = yi − β1xi

⇒n∑

i=1

u2i =

n∑i=1

(yi − β1xi)2

Minimizando:

MINβ1

n∑i=1

u2i

⇒∂

∑ni=1 u2

i

∂β1xi= 0

⇒ −2n∑

i=1

(yi − β1xi)xi = 0

n∑i=1

xiyi − β1

n∑i=1

x2i = 0

β1 =

n∑i=1

xiyi

n∑i=1

x2i

b) Explique que diferencias puede inferir entre estos modelos, con respecto a sus propiedades.Respuesta:En el caso de un modelo sin constante, resulta:

−2n∑

i=1

(yi − β1xi︸ ︷︷ ︸ui

)xi = 0

⇒n∑

i=1

uixi = 0

Sin embargo no garantiza que la suma de los errores sea igual a cero.Viendo el caso de un modelo solo con constante:

−2n∑

i=1

(yi − β0︸ ︷︷ ︸ui

) = 0

⇒n∑

i=1

ui = 0

En este caso no garantiza que el error no este correlacionado con los datos, en caso de queestos se esten omitiendo.Estas dos condiciones se encuentran al mismo tiempo cuando se utiliza un modelo con con-stante y pendiente.

3

Page 346: Magno Econometría

Departamento de Economıa Universidad de Chile

c) ¿Son estos estimadores insesgados?Respuesta: Propuesto en la ayudantıa.

2. Suponga que usted, tras haber buscado en las paginas del curso Econometrıa I en los distintossemestres, encontro una base de datos con una muestra de las notas del primer control (PC) y lanota final (NF).

PC NF2.2 2.27.0 6.23.2 3.64.0 4.23.1 4.6

a) Estime por MCO el valor de los parametros del siguiente modelo:

yi = β0 + β1xi + ui (4)

Respuesta: Utilizaremos los estimadores cuando el modelo tiene pendiente y constante encon-trados en el ejercicio 1:

β0 = y − β1x (5)

β1 =

nn∑

i=1

xiyi −n∑

i=1

xi

n∑i=1

yi

nn∑

i=1

x2i − (

n∑i=1

xi)2(6)

Los elementos para encontrar los estimadores, que se sacan de la tabla son:n∑

i=1

xi = 19,5n∑

i=1

x2i = 89,69

n∑i=1

xiyi = 90,82n∑

i=1

yi = 20,8

Reemplazando estos valores en el estimador de β1:

β1 =5 · 90,82− 19,5 · 20,8

5 · 89,69− 19,52

β1 = 0,71

Ahora reemplazando en β0:

β0 = y − β1x

β0 = 20,8/5− 0,71 · 19,5/5

β0 = 1,391

4

Page 347: Magno Econometría

Departamento de Economıa Universidad de Chile

b) ¿Que puede decir del valor de los parametros?El modelo indica que existe una relacion positiva entre la nota que el alumno se saque en elprimer control, con respecto a la nota final que obtendra en el ramo. Esta relacion dice quesi la nota en el primer control aumenta un punto, la nota final lo hara en 0.71 puntos.

c) ¿Que problemas se pueden presentar al tener una muestra tan reducida como esta?Lo primero es que los datos pueden estar sesgados, ya que la muestra obtenida puede no serrepresentativa de los datos de la poblacion (error muestral).

d) Calcule ahora los valores de los parametros para los siguientes modelos:

yi = β0 + ui (7)yi = β1xi + ui (8)

¿Dan los mismos parametros? ¿Por que?Utilizando los estimadores que encontramos en el primer ejercicio, sabemos que para unmodelo solo con constante β0 = y; y para un modelo solo con la pendiente, el estimador deβ0 =

Pni=1 xiyiPni=1 x2

i. Reemplazando

En el caso del primer modelo (solo constante):

β0 = y

β0 = 20,8/5

β0 = 4,16

Ahora en en caso de que el modelo tenga solo pendiente:

β0 =∑n

i=1 xiyi∑ni=1 x2

i

β0 = 90,82/89,69

β0 = 1,01

Los parametros no son iguales por lo explicado en la parte b) del ejercicio 1, ya que los modelosno pueden asegurar las propiedades que se nombran en ese apartado.

3. La Subsecretarıa de electricidad y combustibles esta interesada en conocer la relacion que existeentre consumo de energıa electrica (y) y el consumo de gas natural (x). Con este fin, encargaa la Subdireccion General de Estudios la especificacion de un modelo econometrico entre estasvariables y su estimacion a partir de las series de datos disponibles en la subsecretarıa. Supongaque usted trabaja como tecnico en la citada subdireccion y es el encargado de realizar el informesolicitado. Para ello dispone de la siguiente informacion elaborada por su ayudante a partir de losdatos originales:

n = 35n∑

i=1

xi = 17,22n∑

i=1

x2i = 10,92

n∑i=1

(yi − y)2 = 12,15n∑

i=1

xiyi = 37,1022n∑

i=1

yi = 85

5

Page 348: Magno Econometría

Departamento de Economıa Universidad de Chile

Encuentre los valores de los parametros si define el modelo de la siguiente manera:

yi = β0 + β1xi + ui (9)

Respuesta: Como el modelo esta definido con pendiente y constante podemos, al igual como se hadefinido en los ejercicios anteriores, podemos utilizar los siguentes estimadores de los parametros:

β0 = y − β1x

β1 =

nn∑

i=1

xiyi −n∑

i=1

xi

n∑i=1

yi

nn∑

i=1

x2i − (

n∑i=1

xi)2

Reemplazando en el estimador de β1:

β1 =35 · 37,1022− 17,22 · 85

35 · 10,92− 17,22‘2

β1 = −1,93

Ahora reemplazando en β0:

β0 = y − β1x

β0 = 85/35 + 1,93 · 17,22/35

β0 = 3,38

Podemos decir que como la pendiente de la recta de regresion es negativa, al aumentar el consumode energıa electrica, disminuye el consumo de gas natural; y viceversa.

2. Comentes

Comente las siguientes afirmaciones.

1. La estimacion por MCO ademas de garantizar que la recta de regresion pasa por las mediasmuestrales de las variables, tambien garantiza que no estan relacionados el error y el valor predichode la variable dependiente.

2. Si la varianza de un estimador es igual a su Error Cuadratico Medio (ECM), podemos decir queel estimador es insesgado.

3. En el modelo de regresion lineal de una variable explicativa, si al variable independiente no varıa,entonces el estimador de β2 sera igual al verdadero valor poblacional de β2.

4. A un investigador no le conviene utilizar un parametro sesgado.

5. Cuando la varianza de las variables explicativas es alta, el estimador por MCO de la pendiente delmodelo es menos preciso.

6

Page 349: Magno Econometría

Departamento de Economıa Universidad de Chile

3. Propuestos

1. Encuentre al menos dos formas diferentes de expresar el calculo de los parametros por MCO,cuando el modelo tiene solo una variable explicativa. Ayuda: puede encontrar dos formas distintasencontrando las expresiones en desviaciones con respecto a la media, y otra forma es desarrollandoesta ultima expresion.

2. Para el ejercicio 1, analice las propiedades de los estimadores encontrados (insesgamiento, eficien-cia, menor ECM, consistencia)

3. Suponga que encontro una base de datos, pero ahora no sabe su procedencia. Lo unico que sabees que Y es la variable dependiente, y X es la variable explicativa.

X Y-8 0-1 10 34 52 4

Realice los mismos puntos que se le pedıan en el ejercicio 2

7

Page 350: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IPrimavera 2005

Ayudantıa Extra - 02-09-05

Profesores: J. Vasquez-F. Tagle, R. Montero, E. MeloAyudante: Roberto Jaramillo

1. Comentes

1. Un amigo suyo le comenta que en un modelo de regresion lineal, en el peor de los casos los residuosexplican un cero % la variabilidad del termino dependiente. ¿Que opina usted?

Respuesta: Si los residuos explican en un cero% la variabilidad del modelo, significa que el totalesta siendo explicado por las variables explicativas, lo que en teorıa muestra un modelo que bienajustado. Sin embargo, un R2 alto puede no ser el mejor de los casos, ya que se pueden presentarproblemas de inclusion de variables irrelevantes, multicolinealidad, pocos datos (R2 = 1 cuandohay solo dos datos), o que el modelo no incluya la constante.

2. La ventaja que tiene el test F, es que con una sola hipotesis me permite hacer todos los test designificancia de Student al mismo tiempo.

Respuesta: El test F permite testear al mismo tiempo un conjunto de hipotesis. Al testear lasignificancia estadıstica de un parametro, estamos realizando un test individual para cada uno delos parametros, lo que serıa distinto al testear que todos no son estadısticamente significativos almismo tiempo (Conjuntos distintos). Por esto el comente serıa falso.

3. En una prueba de hipotesis cualquiera, la zona de rechazo nunca cambia al cambiar la hipotesisnula.

Respuesta: Falso. Para ver si es que cambia la zona de rechazo de una hipotesis, hay que ver sicambia el estadıstico de tabla. El comente serıa falso, ya que en el caso de un estadıstico F alcambiar la cantidad de hipotesis nulas, el estadıstico F de tabla va cambiando.

4. La ventaja que tiene el test t de Student es que puedo utilizarlo sin importar la distribucion delerror, suponiendo que tenemos una muestra finita.

Respuesta: Para utilizar los Test t y F es necesario que el error este destribuido en forma normal.Si esto no sucede, no podrıamos conocer la distribucion de estos estadısticos.

2. Ejercicios

1. Encuentre la expresion para la suma total al cuadrado cuando el modelo de regresion no incluyeun termino constante.

y = y + u

y′y = y′y + y′u

y′y = (y + u)′y + (y + u)′uy′y = y′y + u′y︸︷︷︸

0

+ y′u︸︷︷︸0

+u′u

n∑i=1

y2i =

n∑i=1

yi2 +

n∑i=1

ui2 (1)

1

Page 351: Magno Econometría

Departamento de Economıa Universidad de Chile

Descomponiendo la Suma Total y la Suma Explicada:

ST =n∑

i=1

(yi − y)2

ST =n∑

i=1

y2i − ny2

n∑i=1

y2i = ST + ny2 (2)

SE =n∑

i=1

(yi − ¯y)2

SE =n∑

i=1

y2i − n¯y2

n∑i=1

y2i = SE + n¯y2 (3)

Reemplazando 2 y 3 en 1 queda:

ST + ny2 = SE + n¯y2 +n∑

i=1

ui2

︸ ︷︷ ︸SR

ST = SE + SR + n(¯y2 − y2)

2. Demuestre que el coeficiente R2 es siempre mayor o igual al R2.

R2 = 1− SR

STSR

ST= 1−R2 (4)

R2 = 1− SR

ST· n− 1n− k

(5)

Reemplazando 4 en 5 queda:

R2 = 1− (1−R2) · n− 1n− k

1− R2 = (1−R2) · n− 1n− k

k = 1 ⇒ R2 = R2

k > 1 ⇒ 1− R2 > 1−R2 ⇒ R2 < R2

2

Page 352: Magno Econometría

Departamento de Economıa Universidad de Chile

3. Tras haber tenido algun tiempo de ocio, usted ha encontrado una base de datos que tiene unamuestra representativa de las notas del ramo Econometrıa ”N”. En esta se encuentran las notasde los controles 2 y 3, y tambien la nota de la primera solemne. A usted le interesarıa saber comoafecto el rendimiento de los controles 2 y 3 en la solemne, ası que utilizando lo datos, realice lossiguientes puntos:

Nota C2 Nota C3 Nota Sol2.2 3.7 35.1 5.1 45.1 3.4 4.72.2 1.9 2.63.9 3.4 53.8 2.8 5.2

a) Establezca un modelo que le permita solucionar lo planteado.Respuesta:Nota Solemne = y

Nota Control 2= x1

Nota Control 3= x2

yi = β0 + β1x1,i + β2x2,i

b) Estime por MCO el valor de los parametros del modelo.Respuesta:

βMCO = (X ′X)−1X ′Y

En desviacion con respecto a la media

X ′X =(

8,32 4,134,13 5,72

)X ′X−1 =

130,53

(5,72 −4,13−4,13 8,32

)X ′Y =

(4,841,24

)βMCO =

(0,75−0,36

)

Para rescatar el valor de la constante:

β0 = y − x1β1 − x2β2

β0 = 2,51

c) Analice la significancia estadıstica de todos los parametros. Para esto encuentre los valoresde los estadısticos, con su respectivo P-value.Es necesario encontrar el valor de las varianzas de los estimadores:

3

Page 353: Magno Econometría

Departamento de Economıa Universidad de Chile

V ar(β) = σ2ui

(X ′X)−1

σ2ui

=∑n

i=1 u2i

n− k

σ2ui

=2,563

= 0,85

⇒ V ar(β) =0,8530,53

(5,72 −4,13−4,13 8,32

)V ar(β) =

(0,16 −0,12−0,12 0,23

)

tβi=

βi − 0√V ar(βi)

tβ1=

0,75− 0√0,16

= 1,875

tβ2=

−0,36− 0√0,23

= −0,75

P − valueβi= 2(1− Pr)

P − valueβ1= 0,15

P − valueβ2= 0,51

El t de tabla es: t95 %,GL=3 = 3,18Por lo tanto existe suficiente evidencia para afirmar que las pendientes no son estadistica-mente significativas, con un 95% de confianza.

d) Compruebe que la suma de los aportes marginales de los controles 2 y 3 resulta 1.Respuesta:

H0 : β1 + β2 = 1⇒

tH0 =β1 + β2 − 1√

V ar(β1) + V ar(β2) + 2Cov(β1, β2)

tH0 = −1,58

El t de tabla es: t95 %,GL=3 = 3,18Por lo tanto existe suficiente evidencia para afirmar que las pendientes suman uno, con un95% de confianza.

e) Testee que el parametro del control 2 es 0.3 y el del parametro del control 3 es 0.4

4

Page 354: Magno Econometría

Departamento de Economıa Universidad de Chile

q = 2n− k = 3

R =(

1 00 1

)β =

(0,75−0,36

)r =

(0,30,4

)Fq,n−k ∼ [(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)]/q

u′un−k

Fq,n−k =2,16/20,85

= 1,27

El F de tabla con un 95% de confianza es 9.55, por lo que existe suficiente evidencia para norechazar la hipotesis nula con un 95% de confianza

f ) Encuentre que porcentaje de la variabilidad se explica por los datos. Tambien realice algunajuste a este coeficiente en caso de encontrarlo necesario.Para encontrar ese porcentaje, hay que revisar el R2

R2 = 1− SR

ST

ST =n∑

i=1

(yi − y)2 =n∑

i=1

y2i − ny2

ST = 6,01

SR =n∑

i=1

ui2 = 2,56

R2 = 1− 2,566,01

= 0,57

Las variables independientes explican el modelo en un 57 %. Sin embargo, no estamos tomandoen cuenta el problema de los grados de libertad (son muy pocos datos para la cantidad deparametros), por lo que utilizamos el R2 para corregir esto:

R2 = 1− (1−R2)n− 1n− k

= 0,28

g) ¿Que nos dicen los datos que ha obtenido?Tarea...

5

Page 355: Magno Econometría

Pauta Comente Extra: Pregunta: mientras mayor es la varianza muestral y menor es la varianza de las variables explicativas, más preciso es el estimador MCO. Respuesta: el comente es falso, si bien, mientras mayor es el tamaño muestral (n) contamos con mayor información para estimar los parámetros y la muestra se acerca más a la población, lo que hace que nuestra estimación sea más precisa, necesitamos que la varianza de las variables explicativas sea la mayor posible para poder estimar el impacto que tiene un cambio marginal en la variable explicativa sobre la variables dependientes, mientras más variada sea X contamos con una amplia gama de valores que nos permiten identificar en forma más precisa su impacto sobre Y. En un modelo simple tenemos que la varianza del estimador MCO, tiene la siguiente forma:

∑ −= 2

2

)()ˆ(

XXV

i

σβ

Multiplicando y dividiendo por el tamaño muestral:

)()ˆ(

2

XnVV σβ =

Podemos observar que mientras mayor es el tamaño muestral menor es la varianza del estimador MCO (más preciso), y mientras mayor es la varianza de las variables explicativas menor es la varianza del estimador (más preciso).

Page 356: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IOtono 2006

Ayudantıa Extra 25/04/06

Profesores: Claudia Sanhueza, Javiera Vasquez.Ayudante: Roberto Jaramillo Moya1

Nota: Esta pauta ha sido publicada a modo de referencia. No ha sido revisada, por lo que es un muybuen ejercicio para el estudio buscar incongruencias.

1. Ejercicios

1. Para la siguiente base de datos:

Nota C2 Nota C3 Nota Sol2.2 3.7 35.1 5.1 45.1 3.4 4.72.2 1.9 2.63.9 3.4 53.8 2.8 5.2

Para esta muestra, que fue obtenida del curso Econometrıa I de algun semestre del pasado, re-sponda las siguientes preguntas:

a) Encuentre los estimadores de los parametros y su correspondiente matriz de varianzas ycovarianzas.

RESPUESTAAl trabajar con los datos en desviacion con respecto a la media:

X ′X =

8,32 4,134,13 5,72

X ′X−1 =1

30,53

5,72 −4,13−4,13 8,32

X ′Y =

4,841,24

βMCO =

0,75−0,36

β0 = 2,51nX

i=1

u2i = 2,56

La matriz de varianzas y covarianzas esta conformada por:

Es necesario encontrar el valor de las varianzas de los estimadores:

[email protected]

1

Page 357: Magno Econometría

Departamento de Economıa Universidad de Chile

V ar(β) = σ2ui

(X ′X)−1

σ2ui

=

Pni=1 u2

i

n− k

σ2ui

=2,56

3= 0,85

⇒ V ar(β) =0,85

30,53

5,72 −4,13−4,13 8,32

V ar(β) =

0,16 −0,12−0,12 0,23

b) Calcule el ajuste del modelo.

RESPUESTA

R2 = 1− SR

ST

ST =

nXi=1

(yi − y)2 =

nXi=1

y2i − ny2

ST = 6,01

SR =

nXi=1

ui2 = 2,56

R2 = 1− 2,56

6,01= 0,57

Las variables independientes explican el modelo en un 57%. Sin embargo, no estamos tomando encuenta el problema de los grados de libertad (son muy pocos datos para la cantidad de parametros),por lo que utilizamos el R2 para corregir esto:

R2 = 1− (1−R2)n− 1

n− k= 0,28

c) ¿Son significativos los parametros que acompanan a las variables indepedientes, a nivel indi-vidual y global?

RESPUESTA

tβi=

βi − 0qV ar(βi)

tβ1=

0,75− 0√0,16

= 1,875

tβ2=

−0,36− 0√0,23

= −0,75

2

Page 358: Magno Econometría

Departamento de Economıa Universidad de Chile

P − valueβi= 2(1− Pr)

P − valueβ1= 0,15

P − valueβ2= 0,51

El t de tabla es: t95 %,GL=3 = 3,18

Por lo tanto existe suficiente evidencia para afirmar que las pendientes no son estadisticamentesignificativas, con un 95% de confianza.

Para hacer un test de significancia global, podemos utilizar la siguiente formula:

F =R2/(k − 1)

(1−R2)/(n− k)∼ F(k−1,n−k)

F =0,57/(3− 1)

(1− 0,57)/(6− 3)= 1,99

El valor F crıtico es de 9.55 para un 95% , por lo que existe suficiente evidencia para afirmar que

los parametros no serıan significativos en forma global con un 95% de confianza.

d) Testee que la suma de las pendientes 1 y 2 es igual a uno.

RESPUESTA

H0 : β1 + β2 = 1

tH0 =β1 + β2 − 1q

V ar(β1) + V ar(β2) + 2Cov(β1, β2)

tH0 = −1,58

El t de tabla es: t95 %,GL=3 = 3,18

Por lo tanto existe suficiente evidencia para afirmar que las pendientes suman uno, con un 95% de

confianza.

e) Testee que el parametro del control 2 es 0.3 y el parametro del control 3 es 0.4

RESPUESTA

q = 2

n− k = 3

R =

1 00 1

β =

0,75−0,36

r =

0,30,4

Fq,n−k ∼ [(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)]/qu′un−k

Fq,n−k =2,16/2

0,85= 1,27

3

Page 359: Magno Econometría

Departamento de Economıa Universidad de Chile

El F de tabla con un 95% de confianza es 9.55, por lo que existe suficiente evidencia para no rechazar

la hipotesis nula con un 95% de confianza

f ) Si un alumno se saco un 3.6 en el control 2 y un 4.3 en el control 3, haga una prediccion delvalor puntual de esta.

RESPUESTA

y = 2,51 + 0,75 · 3,6 + (−0,36) · 4,3

y = 3,7

Para la varianza del error de prediccion:

V ar(e) = σ2u(1 + x0(X ′X)−1x′0))

= 0,85(1 +1

30,53

3,6 4,3

5,72 −4,13−4,13 8,32

3,64,3

)

V ar(e) = 3,64

El intervalo queda:

3,7− 3,18 ·√

3,64 ≤ y0 ≤ 3,7 + 3,18 ·√

3,64−2,37 ≤ y0 ≤ 9,78

4

Page 360: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IOtono 2006

Ayudantıa 16-6-6

Profesoras: Javiera Vasquez y Claudia SanhuezaAyudantes: Juan Carlos Caro, Javier Fernandez, Nicolas Grau, Roberto Jaramillo 1, Roque Montero

1. Comentes

1. Un estadıstico Durbin-Watson de 4 muestra inequıvocamente una autocorrelacion positiva.

2. Si existe Heterocedasticidad en los errores, el estimador Mınimos Cuadrados Ordinarios sera sesga-do, sin embargo, cuando existe autocorrelacion en los errores no se produce sesgo en los parametrosestimados.

3. La utilizacion de la matriz de White permite corregir el problema de heterocedasticidad sin sabera priori la especificacion de esta.

2. Ejercicios

1. Considere el siguiente modelo:

yt = C(1) + C(2)xt + C(3)yt−1 + ut

Testee la existencia de autocorrelacion en los errores.

RESPUESTAComo el modelo incluye la variable dependiente rezagada, no se puede utilizar el estadıstico Durbin-Watson.Se tiene que utilizar el test h-Durbin:

[email protected]

1

Page 361: Magno Econometría

Departamento de Economıa Universidad de Chile

h = (1− DW

2)

rn

1− nσ2α

∼ N(0, 1)

Con la informacion anterior: DW = 1,572226, n = 28 y σ2α = (0,143427)2

h = (1− 1,572226

2)

s28

1− 28(0,143427)2∼ N(0, 1)

h = 1,738115749

El estadıstico t, en un test de dos colas, es de 1.96, por lo que no podrıamos rechazar la hipotesis nula de

no autocorrelacion.

2. Dado el siguiente modelo

yt = β0 + β1xt + ut

ut = ρut−1 + εt

donde εt ∼iid N(0, σ2ε ). Ademas dispone de las siguientes observaciones:

t 1 2 3 4 5 6 7 8yt 22 26 32 34 40 46 46 50xt 4 6 10 12 14 16 20 22

Obtenga una estimacion eficiente de los parametros β0 y β1, sabiendo que ρ = 0,5.

RESPUESTAPara estimar eficiente el modelo debemos utilizar el metodo de Mınimos Cuadrados Generalizados, queconsiste en transformar el modelo original de forma tal que el error este libre de autocorrelacion, comoen este caso el error sigue un procedimiento AR(1) se debe transformar de la siguiente forma la variabledependiente y explicativa del modelo:

y∗t = yt − 0,5yt−1

x∗t = xt − 0,5xt−1

De esta forma, se tienen los siguientes datos transformados:

t yt xt y∗t x∗t x∗y∗ x∗2

1 22 42 26 6 15 4 60 163 32 10 19 7 133 494 34 12 18 7 126 495 40 14 23 8 184 646 46 16 26 9 234 817 46 20 23 12 276 1448 50 22 27 12 324 144

Suma 151 59 1337 547

2

Page 362: Magno Econometría

Departamento de Economıa Universidad de Chile

El estimador MCG consiste en estimar por MCO el modelo transformado:

y∗t = β0(1− ρ) + β1x∗t + εt

Ası, el estimador MCG de los parametros es:

X∗′X∗ =

n

P8t=2 x∗tP8

t=2 x∗tP8

t=2 x∗2t

=

7 5959 547

X∗′Y ∗ =

P8t=2 y∗tP8

t=2 x∗t y∗t

=

1511337

βMCG =

α

β1

=

7 5959 547

−1 1511337

βMCG =

10,671,29

3. Considere el modelo: yt = βxt + ut, donde E(ut) = 0, V (ut) = k(βxt)2 y Cov(ut, us) = 0 ∀ 6= s.Ademas dispone de 5 observaciones de la variable dependiente y de la variable explicativa:

yt xt

2 13 210 41 13 1

Encuentre el estimador eficiente de β y de su varianza.

RESPUESTAEste modelo no tiene problemas de autocorrelacion, pero si de heterocedasticidad, ya que la varianza delerror cambia para para observacion t. De esta forma, el estimador eficiente es el de MCG que consiste entransformar el modelo original dividiendo cada observacion de la variable dependiente y explicativas por ladesviacion estandar del error asociado a esta observacion, una vez transformado el modelo se estima porMCO. La variables yt y xt transformadas son:

y∗t =yt

σt=

ytpkβ2x2

t

=yt

βxt

√k

x∗t =xt

σt=

xtpkβ2x2

t

=1

β√

k

El metodo eficiente de MCG consiste en estimar por MCO el modelo: y∗t = βx∗t +u∗t , donde u∗t viid (0, σ2):

3

Page 363: Magno Econometría

Departamento de Economıa Universidad de Chile

βMCG =

Pni=1 y∗t x∗tPni=1 x∗2t

=

1

β√

k

yt

βxt√

kPni=1(

1

β√

k)2

=

Pnt=1

ytxt

n

=2/1 + 3/2 + 10/4 + 1/1 + 3/1

5

βMCG = 2

V (βMCG) = (X∗′X∗)−1

=1Pn

t=1(1

β√

k)2

V (βMCG) =β2k

n=

β2k

10

4

Page 364: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IPrimavera 2006

Profesores: Jose Miguel Benavente, Rodrigo Montero.Ayudantes: Javier Fernandez, Andrea Gutierrez, Roberto Jaramillo, Roque Montero.

Ayudantıa 05-09-06

1. Ejercicios

1. Tras haber tenido algun tiempo de ocio, usted ha encontrado una base de datos que tiene unamuestra representativa de las notas del ramo Econometrıa ”N”. En esta se encuentran las notasde los controles 2 y 3, y tambien la nota de la primera solemne. A usted le interesarıa saber comoafecto el rendimiento de los controles 2 y 3 en la solemne, ası que utilizando lo datos, realice lossiguientes puntos:

Nota C2 Nota C3 Nota Sol2.2 3.7 35.1 5.1 45.1 3.4 4.72.2 1.9 2.63.9 3.4 53.8 2.8 5.2

a) Establezca un modelo que le permita solucionar lo planteado.RESPUESTA

yi = β0 + β1x1 + β2x2

conyi = Nota Solemnex1 = Nota Control 2x2 = Nota Control 3

b) Estime por MCO el valor de los parametros del modelo.RESPUESTA

Trabajando con el modelo en desvıos con respecto a la media:

X ′X =

8,32 4,134,13 5,72

X ′X−1 =1

30,53

5,72 −4,13−4,13 8,32

X ′Y =

4,841,24

βMCO =

0,75−0,36

β0 = 2,51nX

i=1

u2i = 2,56

1

Page 365: Magno Econometría

Departamento de Economıa Universidad de Chile

c) Obtenga los coeficientes R2 y R2

RESPUESTA

R2 = 1− SR

ST

= 1−P

u2P(yi − y)2

= 1−P

u2Py2

i − ny2

= 0,55

R2 = 1− (1−R2)n− 1

n− k

= 1− (1− 0,55)6− 1

6− 3= 0,25

d) Analice la significancia estadıstica de todos los parametros. Para esto encuentre los valoresde los estadısticos, con su respectivo P-value.Es necesario encontrar el valor de las varianzas de los estimadores:

V ar(β) = σ2ui

(X ′X)−1

σ2ui

=∑n

i=1 u2i

n− k

σ2ui

=2,563

= 0,85

⇒ V ar(β) =0,8530,53

(5,72 −4,13−4,13 8,32

)V ar(β) =

(0,16 −0,12−0,12 0,23

)

tβi=

βi − 0√V ar(βi)

tβ1=

0,75− 0√0,16

= 1,875

tβ2=

−0,36− 0√0,23

= −0,75

P − valueβi= 2(1− Pr)

P − valueβ1= 0,15

P − valueβ2= 0,51

2

Page 366: Magno Econometría

Departamento de Economıa Universidad de Chile

El t de tabla es: t95 %,GL=3 = 3,18Por lo tanto existe suficiente evidencia para afirmar que las pendientes no son estadistica-mente significativas, con un 95% de confianza.

e) Compruebe que la suma de los aportes marginales de los controles 2 y 3 resulta 1.Respuesta:

H0 : β1 + β2 = 1⇒

tH0 =β1 + β2 − 1√

V ar(β1) + V ar(β2) + 2Cov(β1, β2)

tH0 = −1,58

El t de tabla es: t95 %,GL=3 = 3,18Por lo tanto existe suficiente evidencia para afirmar que las pendientes suman uno, con un95% de confianza.

f ) Testee que el parametro del control 2 es 0.3 y el del parametro del control 3 es 0.4

q = 2n− k = 3

R =(

1 00 1

)β =

(0,75−0,36

)r =

(0,30,4

)Fq,n−k ∼ [(Rβ − r)′[R(X ′X)−1R′]−1(Rβ − r)]/q

u′un−k

Fq,n−k =2,16/20,85

= 1,27

El F de tabla con un 95% de confianza es 9.55, por lo que existe suficiente evidencia para norechazar la hipotesis nula con un 95% de confianza

3

Page 367: Magno Econometría

Departamento de Economıa Universidad de Chile

Econometrıa IPrimavera 2006

Ayudantıa Extra - 17-10-06

Profesores: Jose Miguel Benavente, Rodrigo MonteroAyudantes: Javier Fernandez, Andrea Gutierrez, Roberto Jaramillo, Roque Montero

1. Comentes

1. El planteamiento de un modelo ANOVA tiene la ventaja de que genera un error tipo 1 menor quehacer varios test t al mismo tiempo.

RESPUESTAFalso, ya que la cantidad de test son distintos. Para ver la diferencia entre tres grupos, con ANOVA se

plantean dos test de sinificancia, y con una comparacion de medias 3, lo que genera que cada test en forma

indiviual sea distinto. Como al hacer un test de significancia individual en ANOVA incluye mas efectosal mismo tiempo (comparacion con mas medias), entonces la probabilidad de que el test se rechace es mas

alta, con lo que el comente serıa falso.

2. Ejercicios

1. En el siguiente modelo de regresion:

Yi = !1 + !2Di + ui (1)

Donde Y representa el salario por hora, y D es la variable dicotomica, que toma el valor 1 si es untitulado universitario y 0 si es titulado de educacion media. Utilizando las formulas del estimadorMCO, demuestre que !1 = Ym y !2 = Yu ! Ym, donde el subındice m significa con educacionmedia y u titulado universitario.

RESPUESTAPlanteando el modelo, la matriz X de variables explicativas queda

ˆi D

˜

X !X =

»i!

D!

– ˆi D

˜

X !X =

»i!i i!DD!i D!D

X !X =

»n nu

nu nu

–(2)

(X !X)"1 =

»nu !nu

!nu n

–· 1nu · n ! n2

u

(X !X)"1 =

»nu !nu

!nu n

–· 1nu · nm

(X !X)"1 =

»1/nm !1/nm

!1/nm n/(nu · nm)

–(3)

1

Page 368: Magno Econometría

Departamento de Economıa Universidad de Chile

X !Y =

»i!

D!

–Y

X !Y =

»i!YD!Y

X !Y =

» PyiP

D=1 yi

–(4)

! = (X !X)"1X !Y (5)

! =

»1/nm !1/nm

!1/nm n/(nu · nm)

– » PyiP

D=1 yi

–(6)

! =

" PYi"

PD=1 Yi

nm

!P

Yinm

+n

PD=1 Yi

nunm

#(7)

! =

" PD=0 Yinm

!P

D=0 Yinm

!P

D=1 Yinm

+n

PD=1 Yi

nunm

#(8)

! =

"Ym

!P

D=0 Yinm

+P

D=1 Yinm

( nnu

! 1)

#(9)

! =

"Ym

!Ym +P

D=1 Yinm

nmnu

#(10)

! =

"Ym

!Ym +P

D=1 Yinu

#(11)

! =

»Ym

Yu ! Ym

–(12)

2. Si tenemos el siguiente modelo que puede ser subdividido en dos grupos:

Grupo 1 = Yi = !N + !1Xi + u1,i (13)Grupo 2 = Yi = !C + !1Xi + u2,i (14)

Una forma de estimar este modelo es:

Yi = !0 + !Nhi + !Cdi + !1Xi + ui (15)

Donde hi = 1 si pertenece al grupo 1, y 0 si no. Ademas di = 1 ! hi. ¿Estan de acuerdo con elmodelo propuesto?

RESPUESTANo, debido a que la matriz de datos que se forma es:

X =ˆi hi di Xi

˜(16)

X =ˆi hi 1 ! hi Xi

˜(17)

2

Page 369: Magno Econometría

Departamento de Economıa Universidad de Chile

Y en este caso la columna de unos se puede formar con la suma de la columna 2 y la columna 3, por

lo que tendrıamos una columna LD, y la matriz seria singular y no calculable bajo MCO (Trampa de lasDummies).

3. De acuerdo a un estudio de un respetado profesor de esta facultad, en que se veıan las diferencias desueldos entre egresados de las distintas menciones, se han encontrado las siguientes conclusiones:

a) Existe la idea de que los egresados de Economıa de esta facultad, al salir recien de la carrera,ganan mas que los egresados de Administracion de la misma facultad. ¿Como plantearıa elmodelo y lo testearıa?RESPUESTAEl modelo se puede plantear de la siguiente forma:

yi = !0 + !1di + ui (18)

En que di toma el valor 1 si es egresado de Economıa y 0 si es de Administracion. En el caso que

quisieramos testear que los valores son distintos, solo hay que hacer un test de significancia de !1:t = !1

"!1

. Sin embargo, si lo que queremos testear es que un estudiante de Economıa recien egresado

gana mas que un estudiante de Administracion, entonces lo que hay que buscar es que el parametro

!1 sea mayor que cero, transformandose esto en un test de una cola, que se plantea igual que elanterior, pero lo que cambia es la zona de rechazo, que ahora solo se encuentra a la izquierda de la

curva de la tabla t-student.

b) A pesar de esto, se ha encontrado que los egresados de Administracion de esta facultad, amedida que pasa el tiempo, incluso pueden llegar a ganar mas que los egresados de economıa.¿Como puede afirmar esto?RESPUESTASe puede afirmar cuando se agrega una variable explicativa, que es el tiempo de haber egresado, yque la pendiente sea distinta para cada mencion. El modelo por plantear es el siguiente:

yi = !0 + !1di + !2t + !3tdi + ui (19)

En que !3 es la diferencia de pendiente entre las distintas menciones. Si testeamos la significancia

de !3, verıamos si la diferencia es significativa. Sin embargo, lo que se plantea es que en el futuro

un egresado de Administracion pueda ganar mas, por lo que ademas debemos testear si !3 es menorque cero. Para esto nuevamente tendrıamos que hacer un test de una cola, pero la zona de rechazo

estarıa a la derecha del test.

c) A pesar de no haber sido incluıdo en el estudio, tambien existe la creencia de que los recienegresados de la universidad que es competencia directa, pero no tan prestigiosa, obtienensalarios distintos. Plantee el modelo.RESPUESTADescartando la diferencia entre menciones, podemos plantear el modelo de la siguiente forma:

yi = !0 + !1chi + !2tcati + ui (20)

En que chi es una variable dicotomicaque toma el valor 1 si el egresado es de la Universidad de Chile,

y 0 si no; cati toma le valor 1 si pertenece a la Universidad no tan prestigiosa, y 0 si no; y tambiensi tenemos los datos de otras universidades, la media de estas va a estar determinada por !0.

3

Page 370: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios

Ayudantía Extra 03/11/2006Econometría I

Profesores: Rodrigo Montero, José Miguel BenaventeAyudantes: Roberto Jaramillo, Roque Montero, Javier Fernández, Andrea

Gutiérrez

Repaso de conceptos

1. Omisión de variable relevante e inclusión de variable irrelevante2. Heterocedasticidad

Comentes

1. La omisión de variables relevantes produce subestimación en los parámetros estimados por MCO.

Falso, es cierto que el estimador MCO siempre será sesgado en presencia de variables irrelevantes omitidas:

Sesgo

XVar

XXCovE 2

1

2111 )(

),()ˆ(

Por lo tanto el signo del sesgo dependerá del signo de 2 y la covarianza entre X1 y X2. Existen tres casos posibles:

2 positivo y covarianza positiva => sesgo positivo 2 positivo y covarianza negativa => sesgo negativo 2 negativo y covarianza positiva => sesgo negativo

2. En presencia de heterocedasticidad la mejor forma de estimar los parámetros de interés es mediante una transformación del modelo original, que consiste en dividir cada observación de la variable dependiente y explicativas ),( ii xy por la desviación

estándar del error asociado

Si no conocemos la matriz la eficiencia del estimador MCGF dependerá de la calidad de la estimación del patrón de heterocedasticidad. Si esta estimación es muy mala, por ejemplo no estamos seguros del patrón heterocedástico, podemos estar agregando más problemas al modelo. Por lo tanto, en algunos escenarios es mejor utilizar el estimador consistente de White.

Page 371: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios

3. La omisión de una variable irrelevante es una fuente de heterocedasticidad.

Falso. Efectivamente cuando omitimos una variable relevante en la especificación, dicha variable quedará parcialmente recogida en el comportamiento de las perturbaciones aleatorias (error), pudiendo introducir en estas su variación no necesariamente fija. No obstante al tratarse de una variable irrelevante esta no debiera afectar al modelo, y por lo tanto, su efecto no debería ser recogido por el término error.

4. Si hay heterocedasticidad, las pruebas convencionales t y F son invalidas.

Verdadero, con perturbaciones no esféricas existe una alta probabilidad de que cometamos errores, puesto que con heterocedasticidad los estimadores MCO serán ineficientes (varianzas más grandes). Esto podría traer como consecuencia que no rechacemos la hipótesis nula, cuando la deberíamos rechazar, o en otras palabras, digamos que una variable no es significante cuando si lo es.

Ejercicios

1. Como sabemos, la demanda por un bien depende de muchas variables, entre ellas el ingreso y precio del bien. Un economista está estimando la demanda por un producto X, para lo cual ha propuesto el siguiente modelo:

eYPbQ bb 210

a) Linealice el modelo y obtenga las elasticidades precio e ingreso.

YbPbQ

YbPbbQ

eYPbQ bb

lnlnln

lnlnlnln

21

210

021

Donde = 0lnb

Por definición:

Page 372: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios

2,

1,

ln

ln

%

%

ln

ln

%

%

bY

Q

YY

QQ

Y

Q

bP

Q

PP

QQ

P

Q

PQ

PQ

b) De sus conocimientos microeconómicos ¿Qué problema podría detectar en el modelo? ¿qué consecuencias implicaría y en qué sentido? ¿cómo lo solucionaría?

Como sabemos la demanda por un bien también depende del precio de sus sustitutos, por lo que podríamos estar omitiendo una variable relevante para el modelo, lo que implicaría sesgo en los parámetros.

Luego, agregando Ps a la estimación, el modelo verdadero es el siguiente:

PsbYbPbQ

PsbYbPbbQ

ePsYPbQ bbb

lnlnlnln

lnlnlnlnln

321

3210

0321

Entonces los parámetros estarán sesgados:

)(ln

)ln,(ln)( 311 PVar

PsPCOVbbbE

)(ln

)ln,(ln)( 322 YVar

PsYCOVbbbE

Intuitivamente: cuando el Ps aumenta, el Y real disminuye 0)ln,(ln PsYCOV , y cuando el Ps aumenta, aumenta la demanda por Q,

aumentando P 0)ln,(ln PsPCOV .

Entonces, como 3b es la elasticidad cruzada 03 b , el sesgo de 1b será

positivo, y el sesgo de 2b será negativo.

PQbE ,1)( YQbE ,2 )(

Page 373: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios

2. Considere el siguiente modelo de regresión clásico:

),0(~' Nuuxy tt

La estructura de I es la siguiente:

cfd

fbe

dea

I

a) ¿Cuál o cuáles supuestos del modelo de regresión clásico no se cumplirían en este caso particular? Cómo se le llama a este o estos problemas?

Se violan los supuestos:

Varianza del error constante => Heterocedasticidad Covarianza de los errores igual a 0 => Autocorrelación

b) Demuestre que el estimador MCO de los coeficientes de este modelo son insesgados.

c) ¿La varianza de los estimadores de este modelo, es insesgada?

No, ante presencia de heterocedasticidad y autocorrelación la varianza de los estimadores está sesgada.

d) Cómo se denomina el estimador MELI para los coeficientes de este modelo de regresión, suponiendo que los valores para a; b; c; d y f son conocidos?

Si los valores de la matriz I son conocidos el estimador MELI es Mínimos Cuadrados Generalizados (MCG)

e) Derive rigurosamente el estimador MELI que corresponde a la respuesta en (d), utilizando la notación matricial. (ayuda: PP'1 )

Page 374: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios

Minimizando la suma de los errores al cuadrado

3. Una empresa de autobuses desea estimar la demanda de billetes (Yt) en función de la variable constante, del precio de los mismos (X2t) y de la calidad del servicio, evaluada a través de los gastos que la empresa realiza para la mejora del mismo (X3t). Se dispone de 50 datos ordenados en forma creciente según la variable X3t y de la estimación MCO de las siguientes ecuaciones:

Las tres primeras ecuaciones se estimaron con los 50 datos; la cuarta se estimo con los 20 datos iniciales y la quinta con los 20 datos finales. Supondremos validas las aproximaciones asintóticas.

a) Contraste el supuesto de homoscedasticidad en el modelo estimado en la ecuación (1) con el contraste de White.

De los datos entregados nR2 = 50*0,053 = 2,65 este lo debo comparar con una 575,272

650 como es menor concluimos que no existe evidencia suficiente para demostrar heterocedasticidad a un 95% de confiabilidad.

b) Contraste el supuesto de homoscedasticidad en el modelo estimado en la ecuación (1) con el contraste de Goldfeld-Quandt, eliminando las 10 observaciones centrales.

Page 375: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios

2

221

222

111 ˆ/ˆ/ˆˆ

/ˆ'ˆuuknuu

knuu 204/150= 1,36 lo comparo con una F17,17=?

(disculpen, pero no encontré la tabla) por lo tanto no existe evidencia suficiente para demostrar heterocedasticidad.

4. Suponga que se tiene el siguiente modelo

Explique detalladamente cuales son las consecuencias sobre MCO cuando es aplicado a este modelo ¿Cómo estimaría este modelo? ¿Que estimador utilizaría? ¿ De que dependerá la eficiencia de su estimación?. Plantee una expresión para el estimador óptimo de y

2.

Este modelo presenta heterocedasticidad por lo que las estimaciones por MCO son ineficientes. El patrón que sigue la heterocedasticidad depende del valor esperado de la variable dependiente ty , es decir tt XyE )( . Dado que es desconocido no podemos aplicar el estimador MCG. Sin embargo, podemos aplicar MCGF y el estimador Máximo Verosimilutud (MV). La aplicación del primero requiere una estimación en dos etapas, ya que es necesario obtener para aplicar el método. De esta forma se puede estimar el modelo por MCO ignorando la heterocedasticidad y luego usar esta estimación para normalizar las variables y aplicar MCGF. Este método será menos eficiente que MV debido a que este último estimará en conjunto todos los parámetros involucrados.

Page 376: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios

Page 377: Magno Econometría

Universidad de Chile Facultad de Economía y Negocios