Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
Universidade
de Vigo
Análisis de los cambios estructurales
Estabilidad de parámetrosEstabilidad de parámetrosEstabilidad de parámetrosEstabilidad de parámetros
Análisis de los cambios estructurales
Universidade
de Vigo
Universidade
de VigoEstabilidad de parámetrosEstabilidad de parámetrosEstabilidad de parámetrosEstabilidad de parámetros
� Queremos comprobar si los parámetros se mantienen losmismos a lo largo de toda la muestra o cambian de unvalor a otro.
� En general el hecho de cambio de parámetros llevaimplícito que existe otra variable independiente quecondiciona el modelo y los parámetros cambian decondiciona el modelo y los parámetros cambian deacuerdo a esa variable.
� Normalmente el cambio se observa en el tiempo, porello se habla de cambio estructural. Trabajaremos comosi el tiempo fuera la variable que indica el cambio (esdecir, el orden en que se observan los datos). Si fueraotra variable se reordenarían los datos de acuerdo a esanueva variable.
Universidade
de Vigo
Universidade
de VigoEjemplos de cambio de parámetrosEjemplos de cambio de parámetrosEjemplos de cambio de parámetrosEjemplos de cambio de parámetros
� Existen muchos motivos por el que pueden cambiar los parámetros en un modelo:� Intervenciones externas en un momento de tiempo, por
ejemplo anuncio de una subida del precio del petróleo, cambia las estructuras que relacionan variables fundamentales, renta consumo o inflación, o costes producción etc.. . El consumo o inflación, o costes producción etc.. . El hundimiento del Prestige.
� Existen dos grupos que tiene comportamientos diferentes , por ejemplo dos sectores industriales con relaciones de costes diferentes.
� Modelos con parámetros cambiantes, cuando estos cambian en cada momento del tiempo.
Universidade
de Vigo
Universidade
de VigoEfecto de la no estabilidadEfecto de la no estabilidadEfecto de la no estabilidadEfecto de la no estabilidad
� El hecho de que no haya estabilidad en los parámetros genera el mismo efecto que la falta de linealidad, pues el modelo esta mal especificado y las estimaciones son sesgadas e inconsistentes.sesgadas e inconsistentes.
� Eso significa que el método de estimación deja de ser válido, por ese motivo detectar la inestabilidad de parámetros es fundamental.
Universidade
de Vigo
Universidade
de VigoEjemplo para dos gruposEjemplo para dos gruposEjemplo para dos gruposEjemplo para dos grupos� La estabilidad nos asegura la siguiente relación
� Supongamos que el parámetro cambia según la siguiente relación
εβεβ ')'()(')'(')'( 111 XXXXXXXyXXXb −−− +=+==
+
+=
⇒>+=
<+=)2()2()2(
)1()1()1(
)2(
)1(
)2()2()2()2(
1
)1()1()1()1(
εβεβ
εβεβ
X
X
y
y
TtsiXy
TtsiXy
� Entonces la relación anterior se convierte en
� Por lo tanto, los estimadores dejan de ser insesgados y consistentes
+
=
⇒>+= )2()2()2()2(
1
)2()2()2()2( εβεβ XyTtsiXy
εβ
ββ
εββ
')'(
)''()''(
)(')'(')'(
1
)2()2()2()1()1()1(1)2()2()1()1(
)2()2(
)1()1(
11
XXX
XXXXXXXX
X
XXXXyXXXb
−
−
−−
+≠
=++=
=+
==
Universidade
de Vigo
Universidade
de VigoDiagnostico de la estabilidadDiagnostico de la estabilidadDiagnostico de la estabilidadDiagnostico de la estabilidad
� Gráficos
� Residuos respecto a variable de cambio estructural (tiempo)
� Test de hipótesis
� Test de Chow
Universidade
de Vigo
Gráficos de residuos respecto a Gráficos de residuos respecto a Gráficos de residuos respecto a Gráficos de residuos respecto a
variable estimadavariable estimadavariable estimadavariable estimada
� Se representa el residuo respecto al tiempo u otra variable de la que se sospeche influye en el cambio de
0.2
0.3
0.4
SHAZAM PLOT
E
influye en el cambio de los parámetros.
� Si aparece un cambio de tendencia es síntoma de cambio estructural
-0.5
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0 5 10 15 20 25
E
TIME
Cambio de
tendencia
Test de Chow
Diferentes versiones del test para analizar la estabilidad y la validez de modelos de regresión lineal
Universidade
de Vigo
Universidade
de Vigo
Universidade
de VigoTest de hipótesisTest de hipótesisTest de hipótesisTest de hipótesis
� Intentan delimitar si se produce un cambio en los parámetros.� También se puede hacer uso de estos test para ver si el modelo
se mantiene el mismo, en un periodo postmuestral, por ello se habla también de test postmuestrales.
� Pueden ser de dos tipos:� Fijo: Se establece un valor que se quiere comparar.� Fijo: Se establece un valor que se quiere comparar.� Secuencial: Compara el cambio de parámetros para todos los casos
posibles
� El primero contrasta si existe un cambio en un determinado punto, mientras que el segundo se utiliza también para detectar los puntos en los que se producen cambios.
� La construcción de ambos es la misma, sólo cambia el enfoquedel test, por tanto definiremos las versiones del test de Chowfijo y luego lo extendemos al caso secuencial.
Universidade
de Vigo
Universidade
de VigoTest de estabilidadTest de estabilidadTest de estabilidadTest de estabilidad
� La idea intuitiva del test es muy sencilla. Se supone que existe una observación a partir de la cual los parámetros son diferentes. Inicialmente el test de Chow suponía únicamente dos casos, que delimitaban la hipótesis nula y alternativa del test:� Que en toda la muestra los parámetros fueran iguales� A partir de la observación los parámetros son diferentes
� No obstante en la práctica, suele ser interesante diferenciar entre la constante y las pendientes del modelo. Eso nos permite establecer cuatro posibles modelos.
Universidade
de Vigo
Universidade
de Vigo
Modelos para el Test Modelos para el Test Modelos para el Test Modelos para el Test de validación o de validación o de validación o de validación o
estabilidad de parámetrosestabilidad de parámetrosestabilidad de parámetrosestabilidad de parámetros
Se contrastan cuatro posibles modelos:I. Los datos extramuestrales se ajustan perfectamente al modelo
expuesto en el caso muestral.
II. La constante es distinta pero las pendientes son comunes.
III. La constante es común pero las pendientes son distintas.III. La constante es común pero las pendientes son distintas.
IV. Tanto la constante como las pendientes son distintas.
� Vamos a analizar cada uno de esos modelos y luego estableceremos el test.
Universidade
de Vigo
Universidade
de VigoMatrices de diseño de los modelosMatrices de diseño de los modelosMatrices de diseño de los modelosMatrices de diseño de los modelos
� Para establecerlos consideraremos que el cambio se da en la observación j y nos quedan T-j observaciones finales.
� Por consiguiente dividimos la muestra en dos grupos los primeros T y los últimos m, que se refleja en representar el vector y la matriz X por matrices particionadasvector y la matriz X por matrices particionadas
11 1
*
11
*
22
1
1 ...
: : ... :
: : ... :
1 ...
k
j
T j
T kT
x x
i XYY X
i XY
x x
−
= = =
Corresponde a ij
Corresponde a iT-j
Corresponde a X1
Corresponde a X2
Universidade
de Vigo
Universidade
de VigoEjemplo de CENSAEjemplo de CENSAEjemplo de CENSAEjemplo de CENSA
� Vamos a aplicar los diferentes modelos a un ejemplo para comprobar si existe un cambio de parámetros en el modelo.
� El coste de fabricación de celulosa en una empresa (CENSA) depende de la cantidad de celulosa producida. Se recogen datos trimestrales de coste total (Y) y cantidad recogen datos trimestrales de coste total (Y) y cantidad producida (X) desde el año 1990 hasta 1999 ambos incluidos. Se supone que existe una relación lineal ente los costes y la producción. El segundo trimestre de 1995 ha entrado en vigor una legislación de costes medioambientales que incrementa los controles . Analice si eso tiene efectos sobre el modelo.
CMJ1
Diapositiva 13
CMJ1 aqui
copiar modelo
aplicar matricesCarlos Maria Jardon; 05/12/2007
Universidade
de Vigo
Universidade
de VigoPartición de los datosPartición de los datosPartición de los datosPartición de los datos
� Las matrices particionadas nos quedarán al considerar una variable independiente y 40 datos, cambiando en le dato 22
1 11
: ::
y x
21 21
22 22
40 40
: ::
1
1
: ::
1
y xY X
y x
y x
= =
Universidade
de Vigo
Universidade
de VigoModeloModeloModeloModelo I
� Los datos extramuestrales se ajustan perfectamente al modelo expuesto en el caso muestral, y en consecuencia, se podría estimar el modelo con los datos muestrales y los extramuestrales, ganando eficiencia en la estimación.
� La forma matricial del modelo será� La forma matricial del modelo será
Y=Xβ+εEn forma particionada sería
*
11
*
22
j
T j
i XY
i XYβ ε
−
= ⋅ +
Universidade
de Vigo
Universidade
de VigoModelo Modelo Modelo Modelo I: notacionesI: notacionesI: notacionesI: notaciones
� Para facilitar la comparación entre los modelos vamos a descomponer el vector β en dos subvectores: β0que tiene dimensión 1 y representa a la constante y β 1 que tiene dimensión k y es la pendiente de todas las variables independientes.
� Consideremos que el conjunto de las primeras j observaciones corresponden al grupo G1 y el conjunto de las restantes T-j observaciones corresponden al grupo G2.observaciones corresponden al grupo G2.
� Definimos dos variables ficticias: IG1 y IG2, que valen 1 cuando la observación pertenece a la muestra primera (G1) y o en el resto o viceversa 1 si pertenece a G2 y o en el resto.
� Definimos las correspondientes variables multiplicativas XIG1 y XIG2como resultado de multiplicar X por IG1 y IG2 respectivamente.
� Con estas notaciones el modelo podría escribirse de la siguiente forma
Universidade
de Vigo
Universidade
de VigoModelo I: desarrolloModelo I: desarrolloModelo I: desarrolloModelo I: desarrollo
*
11
*
22
j
T j
i XY
i XYβ ε
β β β β ε
−
= ⋅ + →
= + + + + →* *
1 0 2 0 1 1 1 2 2 1
* *
1 2 0 1 1 2 2 1
*
0 1
( ) ( )
G G G G
G G G G
Y I I X I X I
Y I I X I X I
Y X
β β β β ε
β β ε
β β ε
= + + + + →
= + + + + →
= + +
Universidade
de Vigo
Universidade
de VigoModelo I de celulosasModelo I de celulosasModelo I de celulosasModelo I de celulosas
� No se introduce ninguna variable adicional es una regresión simple entre Y y X1
|_ols y x1/resid=e predict=ye rstat noanovaREQUIRED MEMORY IS PAR= 5 CURRENT PAR= 4000OLS ESTIMATION
40 OBSERVATIONS DEPENDENT VARIABLE= Y...NOTE..SAMPLE RANGE SET TO: 1, 40...NOTE..SAMPLE RANGE SET TO: 1, 40R-SQUARE = 0.5460 R-SQUARE ADJUSTED = 0.5341VARIANCE OF THE ESTIMATE-SIGMA**2 = 6.2891STANDARD ERROR OF THE ESTIMATE-SIGMA = 2.5078SUM OF SQUARED ERRORS-SSE= 238.98MEAN OF DEPENDENT VARIABLE = 17.076LOG OF THE LIKELIHOOD FUNCTION = -92.5080VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 38 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.94249 0.1394 6.760 0.000 0.739 0.7389 0.5137
CONSTANT 8.3038 1.357 6.120 0.000 0.705 0.0000 0.4863
Universidade
de Vigo
Universidade
de VigoModelo IIModelo IIModelo IIModelo II
� La constante del modelo extramuestral es
distinta, pero las pendientes son iguales en
ambos modelos
� La forma matricial del modelo será
01*1 1
02 2*2 *2
0
0
T T
m m
iY X
iY X
ββ εβ
= ⋅ +
Universidade
de Vigo
Universidade
de VigoModelo IIModelo IIModelo IIModelo II
01*1 1
02 2*2 *2
0
0
j j
T j T j
iY X
iY X
ββ εβ− −
= ⋅ + →
* * * *
1 01 2 02 1 1 1 2 2 1
* *
0 2 02
G G G G
G
Y I I X I X I
I X
β
β β β β ε
β α β ε
= + + + + =
= + + +
Universidade
de Vigo
Universidade
de VigoModelo II de celulosasModelo II de celulosasModelo II de celulosasModelo II de celulosas
� Se introduce una variable ficticia adicional que mide el efecto del cambio estructural en el segundo trimestre de 1995
|_ols y x1 D22/resid=e predict=ye rstat noanova
REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 4000
OLS ESTIMATION
40 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 40...NOTE..SAMPLE RANGE SET TO: 1, 40
R-SQUARE = 0.9219 R-SQUARE ADJUSTED = 0.9176
VARIANCE OF THE ESTIMATE-SIGMA**2 = 1.1117
STANDARD ERROR OF THE ESTIMATE-SIGMA = 1.0544
SUM OF SQUARED ERRORS-SSE= 41.132
MEAN OF DEPENDENT VARIABLE = 17.076
LOG OF THE LIKELIHOOD FUNCTION = -57.3156
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 37 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.67155 0.6203E-01 10.83 0.000 0.872 0.5265 0.3660
D22 4.7134 0.3533 13.34 0.000 0.910 0.6488 0.1311
CONSTANT 8.5865 0.5708 15.04 0.000 0.927 0.0000 0.5029
Universidade
de Vigo
Universidade
de VigoModelo IIIModelo IIIModelo IIIModelo III
� La constante es la misma, pero las pendientes
del modelo extramuestral son distintas.
� La forma matricial del modelo será
3
*
2
*
1
0
*
2
*
1
2
1 0
0ε
βββ
+
⋅
=
×
× X
X
i
i
Y
Y kT
kmm
T
Universidade
de Vigo
Universidade
de VigoModelo IIIModelo IIIModelo IIIModelo III
0*1 *1
1 3*
2 2 *
2
0
0
T T k
m m k
iY X
iY X
ββ εβ
×
×
= ⋅ + →
2* * * *
1 0 2 0 1 1 1 2 2 2
* * * *
0 1 2 2 2
G G G G
G
Y I I X I X I
X X I
β
β β β β ε
β β α ε
= + + + + =
= + + +
Universidade
de Vigo
Universidade
de VigoModelo III de celulosasModelo III de celulosasModelo III de celulosasModelo III de celulosas
� Se introduce una variable ficticia adicional que mide el efecto del cambio estructural en la pendiente en el segundo trimestre de 1995
R-SQUARE = 0.9540 R-SQUARE ADJUSTED = 0.9515
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.65493
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.80928
SUM OF SQUARED ERRORS-SSE= 24.232SUM OF SQUARED ERRORS-SSE= 24.232
MEAN OF DEPENDENT VARIABLE = 17.076
LOG OF THE LIKELIHOOD FUNCTION = -46.7338VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 37 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.48966 0.5147E-01 9.513 0.000 0.842 0.3839 0.2669
X12 0.49185 0.2716E-01 18.11 0.000 0.948 0.7307 0.1407
CONSTANT 10.115 0.4491 22.52 0.000 0.965 0.0000 0.5924
Universidade
de Vigo
Universidade
de VigoModelo IVModelo IVModelo IVModelo IV
� Tanto la constante como las pendientes del
modelo extramuestral son distintas.
� La forma matricial del modelo será
β
4
*
2
*
1
02
01
*
2
*
1
2
1 0
0
0
0ε
ββββ
+
⋅
=
×
× X
X
i
i
Y
Y kT
kmm
m
T
T
Universidade
de Vigo
Universidade
de VigoModelo IVModelo IVModelo IVModelo IV
01
02*1 *1
1 4*
0 0
0 0
mT T kY i X
iY X
ββ
β ε×
= ⋅ + →
1 4*
2 2 *
2
* * * *
1 01 2 01 1 1 1 2 2 2
* * * *
0 2 0 2 1
0 0mT m k
G G G G
G G
iY X
Y I I X I X I
I X X I
β εβ
β β β β ε
β α β α ε
×
= ⋅ + →
= + + + + =
= + + + +
Universidade
de Vigo
Universidade
de VigoModelo IV: resolución practicaModelo IV: resolución practicaModelo IV: resolución practicaModelo IV: resolución practica
� Este test presupone que la muestra se divide en dos y se realiza una regresión para toda la muestra conjuntamente y otra considerando muestras separadas.
� Esto significa que se puede realizar la comparación de dos formas:formas:� Generando variables ficticias que nos midan los cambios
estructurales en el periodo prefijado
� Dividiendo el espacio en dos muestra y haciendo regresiones separadas
Universidade
de Vigo
Universidade
de VigoModelo IV de Modelo IV de Modelo IV de Modelo IV de celulosas: Caso 1celulosas: Caso 1celulosas: Caso 1celulosas: Caso 1
� Se introduce dos variables ficticias adicionales que miden el efecto del cambio estructural en el segundo trimestre de 1995
|_ols y x1 D22 X12/resid=e predict=ye rstat noanova
REQUIRED MEMORY IS PAR= 6 CURRENT PAR= 4000
OLS ESTIMATION
40 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 40
R-SQUARE = 0.9540 R-SQUARE ADJUSTED = 0.9501R-SQUARE = 0.9540 R-SQUARE ADJUSTED = 0.9501
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.67294
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.82033
SUM OF SQUARED ERRORS-SSE= 24.226
MEAN OF DEPENDENT VARIABLE = 17.076
LOG OF THE LIKELIHOOD FUNCTION = -46.7284
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 36 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.48659 0.6076E-01 8.009 0.000 0.800 0.3815 0.2652
D22 -0.98518E-01 0.9986 -0.9865E-01 0.922-0.016 -0.0136 -0.0027
X12 0.50134 0.1000 5.012 0.000 0.641 0.7448 0.1434
CONSTANT 10.144 0.5421 18.71 0.000 0.952 0.0000 0.5941
Universidade
de Vigo
Universidade
de Vigo
Modelo IV de Modelo IV de Modelo IV de Modelo IV de celulosas: Caso 2celulosas: Caso 2celulosas: Caso 2celulosas: Caso 2Se divide la muestra en dos a partir del segundo trimestre de 1995
|_SAMPLE 1 21
|_OLS Y X/NOANOVA
21 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 21
R-SQUARE = 0.9805 R-SQUARE ADJUSTED = 0.9795
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.45227E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.21267
SUM OF SQUARED ERRORS-SSE= 0.85930
MEAN OF DEPENDENT VARIABLE = 14.242
LOG OF THE LIKELIHOOD FUNCTION = 3.76191
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 19 DF P-VALUE CORR. COEFFICIENT AT MEANS
X 0.48659 0.1575E-01 30.89 0.000 0.990 0.9902 0.2877
CONSTANT 10.144 0.1405 72.19 0.000 0.998 0.0000 0.7123
|_gen1 SSE4A=$SSE
..NOTE..CURRENT VALUE OF $SSE = 0.85930
|_SAMPLE 22 40|_SAMPLE 22 40
|_OLS Y X/NOANOVA
19 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 22, 40
R-SQUARE = 0.8166 R-SQUARE ADJUSTED = 0.8058
VARIANCE OF THE ESTIMATE-SIGMA**2 = 1.3745
STANDARD ERROR OF THE ESTIMATE-SIGMA = 1.1724
SUM OF SQUARED ERRORS-SSE= 23.367
MEAN OF DEPENDENT VARIABLE = 20.208
LOG OF THE LIKELIHOOD FUNCTION = -28.9251
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 17 DF P-VALUE CORR. COEFFICIENT AT MEANS
X 0.98793 0.1136 8.700 0.000 0.904 0.9036 0.5029
CONSTANT 10.046 1.199 8.381 0.000 0.897 0.0000 0.4971
|_gen1 SSE4B=$SSE
..NOTE..CURRENT VALUE OF $SSE = 23.367
|_gen1 SSE4T=SSE4A+SSE4B
|_GEN1 F4=((SSE1-SSE4T)/1)/(SSE4T/(DF2))
|_DISTRIB F4/TYPE=F DF1=1 DF2=DF2
Universidade
de Vigo
Universidade
de VigoTest de estabilidad de los coeficientesTest de estabilidad de los coeficientesTest de estabilidad de los coeficientesTest de estabilidad de los coeficientes
� El esquema de decisión es similar en todos los test, si la suma de cuadrados disminuye mucho es que la restricción es falsa.
� La idea intuitiva del test es que si el añadir la diferencia de constantes apenas aporta información al modelo el valor de la F será cercano a la unidad, pero si aporta mucha información el valor de la F tenderá a ser muy grande.será cercano a la unidad, pero si aporta mucha información el valor de la F tenderá a ser muy grande.
� El estadístico sigue una F de Snedecor donde los grados de libertad dependen del número de restricciones, bajo las suposiciones del MRLC .
Universidade
de Vigo
Universidade
de Vigo
Test de Diferencia de ordenadas Test de Diferencia de ordenadas Test de Diferencia de ordenadas Test de Diferencia de ordenadas
con pendientes igualescon pendientes igualescon pendientes igualescon pendientes iguales
H01 :β01 =β02 → α0=0
H11 :β01 ≠β02 → α0≠0
Hipótesis a contrastar
Estadístico de prueba
22
21
−−+
−=
kmT
SCE
SCESCEF
Ley de distribución
Sigue una F de Snedecor con 1 y T+m-k-2
grados de libertad respectivamente
Universidade
de Vigo
Universidade
de Vigo
Test de Diferencia en todos los Test de Diferencia en todos los Test de Diferencia en todos los Test de Diferencia en todos los
coeficientes (Test de coeficientes (Test de coeficientes (Test de coeficientes (Test de ChowChowChowChow))))
Hipótesis a contrastar
H04 :β1 =β2 → α=0
H14 :β1 ≠β2 →α≠0
Estadístico de prueba
Ley de distribución
Sigue una F de Snedecor con k+1 y T+m-2k-2
grados de libertad respectivamente
22
1
4
41
−−+
+−
=
kmT
SCEk
SCESCE
F
Universidade
de Vigo
Universidade
de Vigo
Test de Diferencia entre las pendientes Test de Diferencia entre las pendientes Test de Diferencia entre las pendientes Test de Diferencia entre las pendientes
con ordenadas igualescon ordenadas igualescon ordenadas igualescon ordenadas iguales
Hipótesis a contrastar
H03 :β11 =β21 → α1=0
H13 :β11 ≠β21 →α1≠0
Estadístico de prueba
Ley de distribución
Sigue una F de Snedecor con k y T+m-2k-1
grados de libertad respectivamente
123
31
−−+
−
=
kmT
SCEk
SCESCE
F
Universidade
de Vigo
Universidade
de Vigo
Test de Diferencia entre las Test de Diferencia entre las Test de Diferencia entre las Test de Diferencia entre las
pendientes con ordenadas distintaspendientes con ordenadas distintaspendientes con ordenadas distintaspendientes con ordenadas distintas
Hipótesis a contrastar
H02 :β11 =β21 → α1=0
H12 :β11 ≠β21 →α1≠0
Estadístico de prueba
Ley de distribución
Sigue una F de Snedecor con k y T+m-2k-2
grados de libertad respectivamente
224
42
−−+
−
=
kmT
SCEk
SCESCE
F
Universidade
de Vigo
Universidade
de Vigo
Test de estabilidad en CENSATest de estabilidad en CENSATest de estabilidad en CENSATest de estabilidad en CENSA
|_*modelo 2
|_gen1 DF2=$N-3
|_gen1 SSE2=$SSE
..NOTE..CURRENT VALUE OF $SSE = 41.132
|_GEN1 F2=((SSE1-SSE2)/1)/(SSE2/(DF2))
|_DISTRIB F2/TYPE=F DF1=1 DF2=DF2
F DISTRIBUTION- DF1= 1.0000 DF2= 37.000
MEAN= 1.0571 VARIANCE= 2.4383 MODE= 0.0000
DATA PDF CDF 1-CDF
F2
ROW 1 177.98 0.89769E-16 1.0000 0.10377E-14
|_*modelo 3|_*modelo 3
|_gen1 SSE3=$SSE
..NOTE..CURRENT VALUE OF $SSE = 24.232
|_GEN1 F3=((SSE1-SSE3)/1)/(SSE3/(DF2))
|_DISTRIB F3/TYPE=F DF1=1 DF2=DF2
F DISTRIBUTION- DF1= 1.0000 DF2= 37.000
MEAN= 1.0571 VARIANCE= 2.4383 MODE= 0.0000
DATA PDF CDF 1-CDF
F3
ROW 1 327.90 0.28485E-20 1.0000 0.56024E-19
|_*modelo 4
|_gen1 SSE4=$SSE
..NOTE..CURRENT VALUE OF $SSE = 24.226
|_GEN1 F4=((SSE1-SSE4)/1)/(SSE4/(DF2))
|_DISTRIB F4/TYPE=F DF1=1 DF2=DF2
F DISTRIBUTION- DF1= 1.0000 DF2= 36.000
MEAN= 1.0588 VARIANCE= 2.4524 MODE= 0.0000
DATA PDF CDF 1-CDF
F4
ROW 1 319.13 0.90207E-20 1.0000 0.17745E-18
Universidade
de Vigo
Universidade
de Vigo
Test de Diferencia de ordenadas con Test de Diferencia de ordenadas con Test de Diferencia de ordenadas con Test de Diferencia de ordenadas con
pendientes iguales en mas de dos grupospendientes iguales en mas de dos grupospendientes iguales en mas de dos grupospendientes iguales en mas de dos grupos
H01 :β01 =β02=…=β0p H11 :β01 ≠β02 o ….o :β01 ≠β0p
Hipótesis a contrastar
Estadístico de prueba
1
1
2
21
−−−
−−
=
kpT
SCE
p
SCESCE
F
Ley de distribución
Sigue una F de Snedecor con p-1 y T-p-k-1
grados de libertad respectivamente
Universidade
de Vigo
Universidade
de VigoTest secuencialTest secuencialTest secuencialTest secuencial
� Se hace el test de Chow global anterior, es decir, se divide la muestra en dos grupos y se hace una regresión con todos los datos y otra con cada grupo separado, pero se va cambiando el punto donde se divide la muestra, por lo que se realiza un test para cada punto, de ahí que se le denomine secuencial.test para cada punto, de ahí que se le denomine secuencial.
� Para cada una de las divisiones se contrastan los modelos I y IV, o sea que se realiza el test de Chow.
� Los resultados de cada test son los que aparecen en las salidas correspondientes.
Universidade
de Vigo
Universidade
de Vigo
Test de Test de Test de Test de
SEQUENTIAL CHOW AND GOLDFELD-QUANDT TESTS
N1 N2 SSE1 SSE2 CHOW PVALUE G-Q DF1 DF2 PVALUE
3 37 0.10407 1.1946 0.16074 0.852 3.049 1 35 0.090
4 36 0.10822 1.1814 0.28848 0.751 1.557 2 34 0.225
5 35 0.14855 1.0684 1.3807 0.264 1.529 3 33 0.225
6 34 0.23548 1.0670 0.10728 0.899 1.766 4 32 0.160
7 33 0.25269 1.0573 0.39712E-02 0.996 1.482 5 31 0.224
8 32 0.25273 1.0572 0.37878E-02 0.996 1.195 6 30 0.336
9 31 0.25318 1.0569 0.22874E-02 0.998 0.9924 7 29 0.544
10 30 0.25414 1.0558 0.36368E-02 0.996 0.8424 8 28 0.426
11 29 0.35757 0.91204 0.57610 0.567 1.176 9 27 0.349
12 28 0.41705 0.88467 0.11788 0.889 1.226 10 26 0.321
13 27 0.42210 0.88365 0.61943E-01 0.940 1.086 11 25 0.411
14 26 0.42225 0.88276 0.72211E-01 0.930 0.9566 12 24 0.488
15 25 0.46611 0.81564 0.40009 0.673 1.011 13 23 0.473
16 24 0.59156 0.59202 1.9263 0.160 1.570 14 22 0.167
17 23 0.59218 0.58793 1.9850 0.152 1.410 15 21 0.229
18 22 0.59285 0.57254 2.2373 0.121 1.294 16 20 0.289
19 21 0.59598 0.57024 2.2229 0.123 1.168 17 19 0.369
20 20 0.65001 0.44490 3.5401 0.039 1.461 18 18 0.215
Test de Test de Test de Test de
ChowChowChowChow
en en en en
CENSACENSACENSACENSA
20 20 0.65001 0.44490 3.5401 0.039 1.461 18 18 0.215
21 19 0.65156 0.44464 3.5146 0.040 1.311 19 17 0.290
22 18 0.70655 0.44280 2.5198 0.095 1.277 20 16 0.313
23 17 0.78463 0.42915 1.4307 0.252 1.306 21 15 0.302
24 16 0.79515 0.42220 1.3735 0.266 1.198 22 14 0.371
25 15 0.80674 0.40456 1.4702 0.243 1.127 23 13 0.423
26 14 0.81618 0.37273 1.8370 0.174 1.095 24 12 0.452
27 13 0.81725 0.35201 2.1703 0.129 1.022 25 11 0.510
28 12 0.91346 0.30762 1.3144 0.281 1.142 26 10 0.433
29 11 0.91369 0.29363 1.5345 0.229 1.037 27 9 0.510
30 10 0.92380 0.25100 2.0751 0.140 1.052 28 8 0.508
31 9 0.92382 0.22642 2.5039 0.096 0.9849 29 7 0.441
32 8 1.0131 0.19806 1.4720 0.243 1.023 30 6 0.543
33 7 1.0138 0.19106 1.5746 0.221 0.8558 31 5 0.347
34 6 1.1252 0.13599 0.69948 0.503 1.034 32 4 0.561
35 5 1.1390 0.13386 0.52931 0.594 0.7735 33 3 0.293
36 4 1.1503 0.12981 0.42434 0.657 0.5213 34 2 0.162
37 3 1.2488 0.58998E-01 0.33249E-01 0.967 0.6048 35 1 0.207
Interacción entre Variables ficticias
en la regresión
Soluciones a la no estabilidad:
Universidade
de Vigo
Universidade
de Vigo
Universidade
de Vigo
Planteamiento de la regresión con Planteamiento de la regresión con Planteamiento de la regresión con Planteamiento de la regresión con
variables dicotómicasvariables dicotómicasvariables dicotómicasvariables dicotómicas
� Para formalizar las regresiones anteriores y por consiguiente la posible solución en caso de fallar al estabilidad debemos recurrir a las variables ficticias e introducirlas en la regresión.
� Recordemos que para definirlas debemos partir de una variable � Recordemos que para definirlas debemos partir de una variable cualquiera C que únicamente puede tomar dos valores A y B de forma que ambos son excluyentes y exhaustivos. Entonces la variable ficticia se define como
IA =1 si C = A
0 si C = B
Universidade
de Vigo
Universidade
de VigoRegresión con variables dicotómicasRegresión con variables dicotómicasRegresión con variables dicotómicasRegresión con variables dicotómicas
� En el caso mas simple, se introduciría en el modelo de regresión como una variable cualquiera
� Modelo sin variable ficticia
y X X= + + + +β β β εL
� Modelo con variable ficticia
y X Xk k= + + + +β β β ε0 1 1 L
y X X Ik k A= + + + + +β β β α ε0 1 1 L
Efecto de la variable
ficticia
Universidade
de Vigo
Universidade
de Vigo
Interacción en la Regresión con Interacción en la Regresión con Interacción en la Regresión con Interacción en la Regresión con
variables dicotómicasvariables dicotómicasvariables dicotómicasvariables dicotómicas
� Si existe interacción, esto es, las variables ficticias pueden afectar a las pendientes se deben construir unas nuevas variables como el producto de las variables exógenas originales y la variable ficticia. El modelo entonces quedaría como
y X X
I IX IX
k
A k k
= + + + +
+ + + + +
β β βα α α ε
0 1 1
0 1 1
L
L
Donde IXX si t A
si t Aj kj
j=
∈
∉
=0
1...
Universidade
de Vigo
Universidade
de Vigo
Regresión con variables Regresión con variables Regresión con variables Regresión con variables
multinomialesmultinomialesmultinomialesmultinomiales
� Cuando la variable, en vez de dos valorestoma mas, existen diferentes técnicas paraanalizar como afecta una variable cualitativa auna cuantitativa, pero dado que nuestrointerés se centra en las variables ficticiasharemos uso de esa técnica.haremos uso de esa técnica.
� Sea ahora una variable categórica C quetoma s valores diferentes, c1,….cs. Entoncesdebemos definir una variable ficticia paracada uno de los distintos valores.
Universidade
de Vigo
Universidade
de VigoTrampa de las variables ficticiasTrampa de las variables ficticiasTrampa de las variables ficticiasTrampa de las variables ficticias
� Sin embargo, a la hora de ver el efecto decada categoría sobre una determinadavariable dependiente, no se pueden incluirtodas las variables ficticias en la regresióntodas las variables ficticias en la regresión
� Pues entonces la matriz de regresores,presentaría una colinealidad perfecta.
� Debido a que la suma de las variables ficticiases el regresor ficticio (los valores querepresentan a la constante).
� Se conoce como trampa de las variablesficticias
Universidade
de Vigo
Universidade
de Vigo
Trampa de variables ficticias en Trampa de variables ficticias en Trampa de variables ficticias en Trampa de variables ficticias en
XUMAXUMAXUMAXUMA
|_OLS Y X1 X2 FS1 FS2 FS3 FS4
REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= YVARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
...MATRIX INVERSION FAILED IN ROW 7
...THIS USUALLY INDICATES PERFECT MULTICOLLINEARITY WITH VARIABLE CONSTANT
Universidade
de Vigo
Universidade
de Vigo
Solución a la trampa deSolución a la trampa deSolución a la trampa deSolución a la trampa de
las variables ficticiaslas variables ficticiaslas variables ficticiaslas variables ficticias
� Caben dos soluciones:
� Eliminar la constante
� Eliminar una de las variables ficticias
� La primera opción tiene la ventaja de que cada coeficiente nos cuantifica el impacto de la variable coeficiente nos cuantifica el impacto de la variable ficticia global, aunque se mezcla con el valor promedio,
� Tiene varios problemas por el hecho de eliminar la constante de la regresión, pues los residuos ya no tendrán media nula.
Universidade
de Vigo
Universidade
de VigoFicticias en XUMAFicticias en XUMAFicticias en XUMAFicticias en XUMA
|_OLS Y X1 X2 FS1 FS2 FS3 FS4/NOCONSTANT
REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
R-SQUARE = 0.9752 R-SQUARE ADJUSTED = 0.9663
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.59977E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.24490
SUM OF SQUARED ERRORS-SSE= 0.83968SUM OF SQUARED ERRORS-SSE= 0.83968
MEAN OF DEPENDENT VARIABLE = 13.708
LOG OF THE LIKELIHOOD FUNCTION = 3.32590
RAW MOMENT R-SQUARE = 0.9998
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 14 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.49868 0.2315E-01 21.55 0.000 0.985 0.9510 0.2150
X2 0.75696E-01 0.2308E-01 3.280 0.005 0.659 0.1556 0.0375
FS1 10.146 0.2576 39.38 0.000 0.996 3.3780 0.1850
FS2 10.117 0.2128 47.55 0.000 0.997 3.3684 0.1845
FS3 10.295 0.2225 46.28 0.000 0.997 3.4276 0.1878
FS4 10.431 0.2359 44.22 0.000 0.996 3.4729 0.1902
Recogen el efecto de la constante
repartido
Universidade
de Vigo
Universidade
de VigoTrampa de las variables ficticiasTrampa de las variables ficticiasTrampa de las variables ficticiasTrampa de las variables ficticias
� La segunda alternativa es la que se usa habitualmente, pero la interpretación de los coeficientes es distinta de la anterior.
� Cada uno de ellos mide conjuntamente el efecto diferencial de esa categoría respecto al promedio y al efecto de la categoría eliminada. Para explicarlo más claramente consideremos un modelo donde sólo � Para explicarlo más claramente consideremos un modelo donde sólo intervengan variables ficticias como regresores, para simplificar.
Universidade
de Vigo
Universidade
de VigoEfectos aisladosEfectos aisladosEfectos aisladosEfectos aislados
� El modelo sería
Y = β + β Ic−1
∑ + εY t = β0 + β jI jtj=1∑ + ε t
Se observa que hemos eliminado la categoría s, para
hacer la regresión. Si queremos ver el efecto diferencial
de cada categoría sobre el regresando, consideremos la
siguiente notación.
Universidade
de Vigo
Universidade
de VigoEfectos de cada categoríaEfectos de cada categoríaEfectos de cada categoríaEfectos de cada categoría
� En algunos casos interesa analizar el efecto de cada categoría independientemente y no respecto a una de ellas.
� En ese caso se puede hacer una transformación posterior.
Universidade
de Vigo
Universidade
de Vigo
Efectos aislados de los Efectos aislados de los Efectos aislados de los Efectos aislados de los ββββ
• Sea µ el efecto promedio de las categorías sobre el regresando y sea αj el efecto diferencial respecto al promedio de la categoría cj sobre el regresando. Entonces debe verificarse quedebe verificarse que
β0 = µ + αc
βj = αj − αc
α j
j=1
c
∑ = 0
Universidade
de Vigo
Universidade
de VigoEfectos aislados de los Efectos aislados de los Efectos aislados de los Efectos aislados de los αααα
� Despejando se obtiene que
αc = −β j
j=1
c−1
∑cc−1
∑α j = βj −
βjj=1
c−1
∑c
µ = β0 −
βjj=1
c−1
∑c
Universidade
de Vigo
Universidade
de Vigo
Regresión con variables Regresión con variables Regresión con variables Regresión con variables
multinomialesmultinomialesmultinomialesmultinomiales
� En el caso mas simple, se introduciría en el modelo de regresión cada una de las variables ficticias definidas como una variable cualquiera. Suponiendo s categorías
y X X
I I
k k
s s
= + + + +
+ + + +− −
β β βα α ε
0 1 1
1 1 1 1
L
L
Universidade
de Vigo
Universidade
de Vigo
Regresión con variables ficticias en Regresión con variables ficticias en Regresión con variables ficticias en Regresión con variables ficticias en
XUMAXUMAXUMAXUMA
|_OLS Y X1 X2 FS1 FS2 FS3
REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
R-SQUARE = 0.9752 R-SQUARE ADJUSTED = 0.9663
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.59977E-01VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.59977E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.24490
SUM OF SQUARED ERRORS-SSE= 0.83968
MEAN OF DEPENDENT VARIABLE = 13.708
LOG OF THE LIKELIHOOD FUNCTION = 3.32590
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 14 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.49868 0.2315E-01 21.55 0.000 0.985 0.9510 0.2150
X2 0.75696E-01 0.2308E-01 3.280 0.005 0.659 0.1556 0.0375
FS1 -0.28485 0.1743 -1.635 0.124-0.400 -0.0948 -0.0052
FS2 -0.31390 0.1601 -1.961 0.070-0.464 -0.1045 -0.0057
FS3 -0.13611 0.1563 -0.8709 0.398-0.227 -0.0453 -0.0025
CONSTANT 10.431 0.2359 44.22 0.000 0.996 0.0000 0.7609
Universidade
de Vigo
Universidade
de VigoInterpretaciónInterpretaciónInterpretaciónInterpretación
� Las pendientes se interpretan igual, pero ahora sería el efecto independientemente del sector
� La constante β0 sería el coste fijo en la categoría s, la que queda ausente del modelo
� La suma de β0 y αι sería el efecto fijo en la categoría iLa suma de 0 y ι sería el efecto fijo en la categoría i� Por tanto αι mide la diferencia entre los efectos de la
categoría i y la s.
Universidade
de Vigo
Universidade
de Vigo
Interacción en la Regresión con Interacción en la Regresión con Interacción en la Regresión con Interacción en la Regresión con
variables multinomialesvariables multinomialesvariables multinomialesvariables multinomiales
� Si existe interacción, esto es, las variables ficticias pueden afectar a las pendientes se deben construir unas nuevas variables como el producto de las variables exógenas originales y las variables ficticias. El modelo entonces quedaría como
y X X
I IX IX
k
A s k s k
= + + + +
+ + + + +− −
β β βα α α ε
0 1 1
0 11 11 1 1
L
L
Donde IXX si t C
si t Aj k l slj
j l=
∈
∉
= = −0
1 1 1... ; ...
Universidade
de Vigo
Universidade
de VigoInteracciones en XUMAInteracciones en XUMAInteracciones en XUMAInteracciones en XUMA
|_GENR IS21=FS2*X1
|_GENR IS22=FS2*X2
|_OLS Y X1 X2 FS2 IS21 IS22
REQUIRED MEMORY IS PAR= 6 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
R-SQUARE = 0.9722 R-SQUARE ADJUSTED = 0.9623
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.67102E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.25904
SUM OF SQUARED ERRORS-SSE= 0.93943
MEAN OF DEPENDENT VARIABLE = 13.708
LOG OF THE LIKELIHOOD FUNCTION = 2.20337
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 14 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.51733 0.2560E-01 20.21 0.000 0.983 0.9866 0.2230
X2 0.68416E-01 0.2619E-01 2.612 0.020 0.572 0.1407 0.0339
FS2 0.22659 0.4766 0.4754 0.642 0.126 0.0754 0.0041
IS21 -0.80899E-01 0.9314E-01 -0.8686 0.400-0.226 -0.1511 -0.0078
IS22 0.59235E-02 0.5941E-01 0.9971E-01 0.922 0.027 0.0136 0.0007
CONSTANT 10.228 0.2726 37.52 0.000 0.995 0.0000 0.7461