Upload
ojgaona
View
231
Download
0
Embed Size (px)
Citation preview
8/15/2019 D2 Mco Multiple
1/29
1
Regresión LinealMúltiple
y i = 0 + 1 x 1i + 2 x 2i + . . .
k x ki + ui
A. Estimación
Javier Aparicio
División de Estudios Políticos, CIDE
Curso de Verano ENCUP
ttp!""pu#licecono$ics.%ordpress.co$"verano&''(
Julio &''(
http://www.cide.edu/investigadores/aparicio/mailto:[email protected]://publiceconomics.wordpress.com/verano2009http://publiceconomics.wordpress.com/verano2009mailto:[email protected]://www.cide.edu/investigadores/aparicio/
8/15/2019 D2 Mco Multiple
2/29
2
Similitudes con regresión
simple β 0 es el intercepto β 1 a β k son k parámetros de pendiente u es el término de error o residual El supuesto de media condicional cero se
mantiene:E(u|x 1,x 2 , …,x k ) = 0
Igual que antes, minimizamos la suma deresiduales cuadrados, de modo que tenemosk+1 condiciones de primer orden (o k+1parámetros a estimar)
8/15/2019 D2 Mco Multiple
3/29
8/15/2019 D2 Mco Multiple
4/29
4
β interpretada como una“derivada parcial”
( )
2201
1
2
111
22110
ˆˆˆˆ :auxiliar regresiónunaderesidualeslosson
sonˆdonde,ˆˆˆ
entonces,ˆˆˆˆ
i.e.,2dondecasoelConsidere
x x
r r yr
x x y
k
iiii
γ γ
β
β β β
+=
=
++=
=
∑∑
8/15/2019 D2 Mco Multiple
5/29
5
“derivada parcial”
a ecuaci!n anterior implica que "regresar y
en x 1 # x 2 $ tiene el mismo estimador para x 1
que regresar y en los residuales de una
regresi!n de x 1 en x 2
Es decir, al relacionar x 1 con y, solamente
capturamos la in%ormaci!n de x i1 que no está
relacionada con x i2 & Estimamos el e%ecto de x 1 en y después de
controlar o aislar el e%ecto de x 2
8/15/2019 D2 Mco Multiple
6/29
!
Estimación simple vs.
múltiple
muestra.laenalgunancorrelaciótengannoy bieno
)ivosigniicat parcialeectountengano!i.e.0ˆ
:quemenosaˆ" general,#n
ˆˆˆˆmultipleregresiónlacon
""" simpleregresiónlaCompare
21
22
11
22110
110
x x
x
x x y
x y
=
≠
++=
+=
β
β β
β β β
β β
8/15/2019 D2 Mco Multiple
7/29
"
Suma de cuadrados#
$erminolog%a
( )( )
$$% $$#$$& queimplicacual'o
$$% :cuadradosde%esidual$umalaesˆ
$$#:cuadradosde#xplicada$umalaesˆ
$$&:cuadradosde&otal$umalaes
:siguientelodeinir podemosquemodo(e ˆˆ
:explicadonocomponenteunyco)!sistemtiexplicado
componenteunennobservaciócadaseparar*odemos
2
2
2
+=
∑
∑∑
−
−
+=
i
i
i
iii
u
y y
y y
u y y
'' es la suma de "desiaciones al cuadrado$ de las o*seraciones
de la muestra: es proporcional, más no igual, a -(y )&
8/15/2019 D2 Mco Multiple
8/29
&
'ondad de a(uste# ) 2
./!mo sa*er qué tan *ueno es el austeentre la regresi!n # los datos de la muestra
2odemos calcular la proporci!n de la 'uma
de cuadrados totales ('') que es"e3plicada$ por el modelo&
Esto es la llamada -4cuadrada de unaregresi!n: -5 = ''E6'' = 1 7 ''-6''
8/15/2019 D2 Mco Multiple
9/29
*
'ondad de a(uste# ) 2
( ) ( )[ ]
( )( ) ( )( )∑∑
∑
−−
−−=
22
2
2
2
ˆˆ
ˆˆ
:ˆ predic+os,valoreslosy,,observados
valoreslosentrencorrelaciódeecoeicientdel
cuadradoelcomodeinirse puedetambin
y y y y
y y y y R
y y
R
ii
ii
ii
8/15/2019 D2 Mco Multiple
10/29
1+
R,cuadrada# discusión
R 5 nunca decrecerá con%orme inclu#amos más
aria*les e3plicatias a la regresi!n, # por lo general
aumentará (as8 sea marginalmente)&
.2or qué Incluir aria*les adicionales aumenta la''E aunque no sean signi%icatias&
9ado que R 5 t8picamente aumenta con el nmero
de aria*les independientes, no es por s8 sola un
*uen criterio para comparar modelos&
8/15/2019 D2 Mco Multiple
11/29
11
β no sesgadas:
supuestos -auss/arov1& ;odelo po*lacional es lineal en sus parámetros: y = 0 + 1 x 1 + 2 x 2 +…+ k x k + u
5& ;uestra aleatoria de tama& ?inguna aria*le x es constante ni tiene una
correlaci!n lineal e3acta con otra (nomulticolinealidad)&
8/15/2019 D2 Mco Multiple
12/29
12
-emasiadas vs. pocas variales .'i incluimos aria*les que "no pertenecen
al modelo po*lacional$ en nuestra
especi%icaci!n o modelo
?o tiene impacto en el resto de las β estimadas: ;/@ permanece sin ses)o&
.'i e3cluimos aria*les que "sí pertenecen
al modelo$ En general, los estimadores ;/@ tendrán un
ses)o de varia#le o$itida&
8/15/2019 D2 Mco Multiple
13/29
8/15/2019 D2 Mco Multiple
14/29
14
Sesgo de variale omitida/continuación0
( ) ( )
( ) ( ) ( ) iiiii
iiii
iiii
u x x x x x x x
u x x x x
u x x y
∑∑∑
∑
−+−+−=
+++−
+++=
112112
2
111
2211011
22110
:es!5)denumeradorelquemodode
,
:verdadero66modeloel%etomando
β β
β β β
β β β
8/15/2019 D2 Mco Multiple
15/29
15
( )
( )( )( )
( )( )
( ) ( )
( )( )∑∑
∑∑
∑∑
−
−+=
=
−
−+
−
−+=
2
11
211211
2
11
11
2
11
211
21
"
tenemosesperado,alorcalcular val
0,)#!quedado
"
x x
x x x E
u
x x
u x x
x x
x x x
i
ii
i
i
ii
i
ii
β β β
β β β
Sesgo de variale omitida/continuación0
8/15/2019 D2 Mco Multiple
16/29
1!
Sesgo de variale omitida/continuación0
( )
( )( )
( )sesgo.untiene" i.e.,
""
quemodode
endeimpactoeldenota"
" donde
"""
:enderegresiónlaosConsiderem
1
1211
211
2
11
211
11102
12
β δ β β β
δ
δ δ δ
+=
−
−=+=
∑
∑
E
x x
x x
x x x x x
x x
i
ii
8/15/2019 D2 Mco Multiple
17/29
8/15/2019 D2 Mco Multiple
18/29
1&
Sesgo de variale omitida#resumen 9os casos donde el sesgo es igual a cero:
β 2 = 0, es decir, x 2 no pertenec8a al modelo po*lacional
x 1 # x 2 no están correlacionados en la muestra
'i la correlaci!n entre ( x 2 , x 1) # entre ( x 2 , y ) es delmismo signo, el sesgo es positio&
'i omites una aria*le x 2 que se muee en el mismo
sentido que x 1, # ésta a%ecta positiamente a y , 1
capturará parte de dicCo impacto (so*re4 estimada)& 'i la correlaci!n entre ( x 2 , x 1) # entre ( x 2 , y ) es de
signo opuesto, el sesgo es negatio&
8/15/2019 D2 Mco Multiple
19/29
1*
El caso ms general#sesgo en todas las β i écnicamente, s!lo podemos anticipar el signo de
este sesgo cuando el resto de las aria*lese3plicatias incluidas no est*n correlacionadasentre s8 ni con la aria*le omitida
'i esto no se cumple, el sesgo a%ecta a todas las β i estimadas, dependiendo de las coarianzas entrelas aria*les incluidas # con la aria*le omitida&
n as8, resulta til calcular el sesgo de aria*le
omitida asumiendo que las otras x no estáncorrelacionadas, an cuando este supuesto no secumpla&
8/15/2019 D2 Mco Multiple
20/29
2+
ariana de los estimadores6 Da imos que la "distri*uci!n muestral$ de los
estimadores está centrada en torno a los"erdaderos$ parámetros (insesgamiento)&
.ué tan dispersa será la distri*uci!n de losestimadores
2ara analizar esto, requerimos el FG supuestoHauss4;arko:
Var+u|x 1, x 2 ,…, x k - &
conocido como o$oscedasticidad (Comoskedasticit#): arianza constante&
8/15/2019 D2 Mco Multiple
21/29
21
ariana de 6 /cont.0
'ea x igual al ector de aria*les ( x 1, x 2 ,…x k )
'uponer que ar(u x ) = σ 5 tam*ién implicaque ar(y x ) = σ 5
os > supuestos requeridos para
insesgamiento, más el supuesto de
Comoscedasticidad son los llamadossupuestos auss/0ar1ov&
8/15/2019 D2 Mco Multiple
22/29
22
ariana de 6 /cont.0
( )( )
( ) x x
R R x xSST
RSST Var
j
j jij j
j j
j
otraslasen todasderegresiónunade
laesy
donde,1
ˆ
:/arov-ausssupuestos7los(ados
222
2
2
∑ −=
−=
σ β
Es decir, SST j captura la arianza de x i , mientras que R 2 j
captura la correlaci!n entre x j # las otras x del modelo&
8/15/2019 D2 Mco Multiple
23/29
23
omponentes de la arianade 6 arianza del error: a ma#or σ 5, ma#or arianza de
los estimadores ;/@& arianza muestral: a ma#or SST j , menor arianza
de los estimadores ;/@& ma#or tama
8/15/2019 D2 Mco Multiple
24/29
24
Error de especi7cación 8e7ciencia de los estimadores
6 ( )
( )( )
( ) ( )nados)correlacioestnnoyquemenos!a
ˆ" :generalenque,modo(e
,1
ˆ :correcto66modeloel paraque/ientras
" donde,
""" :6incorrecto6modeloelComparemos
21
11
2
2
1
2
1110
x x
Var Var
RSST Var
SST Var x y
j j
j
β β
σ β
σ β β β
<
−=
=+=
Estimar el modelo incorrecto produce una β 1 sesgada (por la aria*le
omitida) Jpero de menor arianza (ma#or precisi!n)K
Ln modelo con aria*les omitidas puede ser enga
8/15/2019 D2 Mco Multiple
25/29
25
Trade-of entre sesgo 8e7ciencia a arianza del estimador es menor en el modelo
"incorrecto$ pero, a menos que β 5 = 0, este modeloserá sesgado&
Ln modelo con varia#les o$itidas puede ser
enga
8/15/2019 D2 Mco Multiple
26/29
2!
Estimación de la variana delerror ?o conocemos la arianza del error, σ 5, porque no
o*seramos los errores de la po*laci!n, ui o que o*seramos son los residuales (estimados)
del modelo muestral:
2ero podemos usar los residuales estimados para
construir un estimador de la arianza del error&
kik iii x x yu β β β ˆ...ˆˆˆ 110 −−−−=
8/15/2019 D2 Mco Multiple
27/29
2"
ariana del error /cont0
( ) ( )
( ) ( )[ ]
212
22
1ˆˆ t+us,
1ˆˆ
j j j
i
RSST se
df SSRk nu
−=
≡−−= ∑
σ β
σ
)l - n 5 +k 6 7, o *ien )l - n 5 k 5 7 gl (i&e& grados de li*ertad) son el (nmero de
o*seraciones) 7 (nmero de parámetrosestimados)
ma#ores grados de li*ertad, ma#or precisi!n delos estimadores&
8/15/2019 D2 Mco Multiple
28/29
8/15/2019 D2 Mco Multiple
29/29
2*
$eorema 9auss,ar:ov
9ados los F supuestos Hauss4;arko, puededemostrarse que ;/@ es ";EI$ (B!" ):
;eor Estimador ineal Insesgado
Best inear !n#iased "stimator 9e modo que, si los supuestos H4; se
sostienen, usar ;/@ es una *uena idea&
'i, además de estos F supuestos,u M ?(0, σ5) ;/@ es el meor estimador(lineal o no lineal) insesgado&