35
2 PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2006/2007 Práctica 3 1. Planteamiento y Objetivos de la Práctica En la presente práctica se propone la modelización univariante por medio del enfoque de Box-Jenkins de tres series temporales con características distintas. En cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que considere más importantes en cada ejemplo y dejar los pasos omitidos para que los cubran los alumnos después por su cuenta Con la presente práctica se intenta que el alumno aprenda a construir modelos ARIMA univariantes para una serie temporal por medio del enfoque de Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas hasta elaborar el posible modelo generador de los datos, de forma sintética los pasos a realizar son los siguientes: Especificación inicial Estimación Chequeo o validación Utilización del modelo 1 En la etapa de especificación inicial se deberá determinar el orden de integración de la serie temporal, es decir cual es el número de diferencias que se requerirán y si una de ellas debe ser anual (estacional) para convertir en estacionaria a la variable objeto de análisis, Z t (d,s). Z t = (1-B) d (1-B s ) D 1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredictibilidad, etc-, para basar sobre él la extracción de señales como el componente estacional

PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. …€¦ · 4 adecuado y se procede a su estimación, apropiado, usualmente el de máxima verosimilitud pero en Eviews este método no

  • Upload
    lyque

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

2

PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2006/2007 Práctica 3 1. Planteamiento y Objetivos de la Práctica

En la presente práctica se propone la modelización univariante por medio del

enfoque de Box-Jenkins de tres series temporales con características distintas. En

cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin

de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que

considere más importantes en cada ejemplo y dejar los pasos omitidos para que los

cubran los alumnos después por su cuenta

Con la presente práctica se intenta que el alumno aprenda a construir

modelos ARIMA univariantes para una serie temporal por medio del enfoque de

Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas

hasta elaborar el posible modelo generador de los datos, de forma sintética los

pasos a realizar son los siguientes:

• Especificación inicial

• Estimación

• Chequeo o validación

• Utilización del modelo 1

En la etapa de especificación inicial se deberá determinar el orden de

integración de la serie temporal, es decir cual es el número de diferencias que se

requerirán y si una de ellas debe ser anual (estacional) para convertir en

estacionaria a la variable objeto de análisis, Zt (d,s).

Zt = (1-B)d (1-Bs ) D

1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredictibilidad, etc-, para basar sobre él la extracción de señales como el componente estacional

3

Donde: d es el número de diferencias regulares y D las diferencias de tipo

estacional y habitualmente D = 0 ó 1 y se suele cumplir que: 0 ≤ d+D ≤ 2.

Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela

determinadas características relevantes de la misma, como sus correlogramas

simple y parcial y los tests de raíces unitarias.

Una vez decidido el orden d y D, es decir el número de raíces unitarias que

tiene la serie temporal, tanto de tipo regular como estacional, habrá que decidir el

orden del polinomio autorregresivo (p) y el de medias móviles (q) para lo cual

utilizamos como principales instrumentos el correlograma simple y el parcial de la

serie. Los criterios generales que deben servir de guía para determinar el orden p

del polinomio autorregresivo y el orden q del polinomio medias móviles se recogen

en las estructuras de los correlogramas simple (FAC) y parcial (FAP) y que para

los casos más sencillos se han visto en las clases teóricas. Un resumen de las

características de la estructura del correlograma simple y del parcial se recoge en

el esquema adjunto.

Características teóricas de la FAC y de la FAP de los procesos estacionarios Procesos FAC FAP

AR (p) Decrecimiento rápido hacia

cero sin llegar a anularse

P primeras autocorrelaciones

distintas de cero y el resto

ceros

MA (p) q primeras autocorrelaciones

significativas y el resto ceros

Decrecimiento rápido hacia

cero sin llegar a anularse

ARMA (p, q) Decrecimiento rápido hacia

cero sin llegar a anularse

Decrecimiento rápido hacia

cero sin llegar a anularse

Debe quedar claro que la identificación es siempre tentativa por lo que se

deben sugerir varios modelos como posibles procesos generadores de datos. Una

vez que se han sugerido uno o varios modelos se escoge el que parezca más

4

adecuado y se procede a su estimación, apropiado, usualmente el de máxima

verosimilitud pero en Eviews este método no está implementado. Posteriormente se

debe realizar el chequeo ó validación de esas estimaciones, es decir, decidir sobre

varios criterios la validez de dichas estimaciones.

En esta práctica se realiza la modelización de tres series temporales de

datos reales y características distintas. El primer caso se refiere a los gastos de

publicidad de una empresa con frecuencia anual, el segundo analiza el Índice de

Precios de Producción (PPI) de Estados Unidos con frecuencia trimestral y el último

modeliza una serie de frecuencia mensual y con estacionalidad, las viviendas de

nueva construcción en Estados Unidos.

2.Ejemplo1. Gastos en publicidad de una empresa

La serie que se modeliza es la de gastos en publicidad de una determinada

empresa. Su periodicidad es anual y el tamaño muestral abarca 54 observaciones

que comprenden el periodo 1947-2000; dada su frecuencia anual esta serie no

tendrá componente estacional. Los datos de esta variable se encuentran en el

Banco de Datos del curso de econometría II.

El primer paso que debemos dar para elaborar el modelo univariante de las series

es crear en Eviews el workfile con frecuencia anual y tamaño muestral indicado e

importamos los datos, tal y como hemos hecho en las prácticas anteriores. La

variable en Worfile la denominamos Gpubli

Una vez cargados los datos debemos verificar si la serie temporal es

estacionaria y en caso de que no lo sea realizar las transformaciones pertinentes

hasta convertirla en estacionaria. Para ello en primer lugar graficamos la serie

Gpubli, gráfico que se muestra a continuación.

La instrucción en Eviews para obtener el gráfico de la serie es:

Quik/Graph /gpubli/Line Graph

5

0

400

800

1200

1600

2000

10 15 20 25 30 35 40 45 50 55 60

GPUBLI

Gastos en publicidad de una determinada empresa

Se observa que tiene una tendencia creciente muy acentuada,

aproximadamente hasta 1925 y de sentido contrario después, lo que es un claro

signo de que la serie no es estacionaria en media, además ese crecimiento

muestras signos de regularidad por lo que la varianza aparentemente exhibe cierto

grado de estabilidad y no es del todo preciso tomar logaritmos.

En segundo lugar obtenemos los correlogramas

Instrucciones en Eviews para obtener los correlogramas de esta serie (Gpubli)

Quick/Series Statistics/Correlogram/ Gpubli También de forma alternativa en el objeto serie (ventas)

View/Correlogram

6

El correlograma simple (AC) confirma la sospecha anterior sobre la no

estacionariedad de la variable al mostrar un decrecimiento lento. Adicionalmente

llevamos a cabo el test de raíces unitarias de D-F

Instrucciones en Eviews para el test D-F:

Quick/Series Statistics/unit root/Gpubli Null Hypothesis: GPUBLI has a unit root Exogenous: Constant Lag Length: 4 (Automatic based on SIC, MAXLAG=10)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -2.391303 0.1494 Test critical values: 1% level -3.571310

5% level -2.922449

7

10% level -2.599224

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(GPUBLI) Method: Least Squares Date: 04/14/07 Time: 21:04 Sample (adjusted): 1912 1960 Included observations: 49 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

GPUBLI(-1) -0.213368 0.089226 -2.391303 0.0212D(GPUBLI(-1)) 0.204352 0.145737 1.402200 0.1680D(GPUBLI(-2)) -0.132356 0.146384 -0.904167 0.3709D(GPUBLI(-3)) -0.000612 0.138474 -0.004422 0.9965D(GPUBLI(-4)) 0.406138 0.138112 2.940633 0.0053

C 207.0751 90.85283 2.279236 0.0277

R-squared 0.349212 Mean dependent var 0.795918Adjusted R-squared 0.273539 S.D. dependent var 228.9130S.E. of regression 195.1087 Akaike info criterion 13.49927Sum squared resid 1636898. Schwarz criterion 13.73092Log likelihood -324.7321 F-statistic 4.614749Durbin-Watson stat 2.008555 Prob(F-statistic) 0.001854

El Valor del estadístico t (-2.391) de GPUBI(-1) es inferior a los valores críticos de

la distribución DF por lo que no se puede rechazar la hipótesis de la existencia de

una raíz unitaria, y por tanto, la serie no es estacionaria

Como un primer paso para eliminar la tendencia y convertir la serie en estacionaria

se prueba con el ajuste de una tendencia lineal determinística a la serie Gpubli y si

es adecuado eliminar la tendencia de la serie original. Para ello, se ajusta una

tendencia determinística a la variable ventas del tipo:

Gpubli = c +β t + µt

Cuya estimación se presenta a continuación

Instrucciones en Eviews para la estimación de la tendencia determinista :

Quick /estimate equation

8

Y en la ventana de la ecuación que se abre escribir: Gpubli c @trend+1 El resultado de la estimación es: Dependent Variable: GPUBLI Method: Least Squares Date: 04/15/07 Time: 08:43 Sample: 1907 1960 Included observations: 54

Variable Coefficient Std. Error t-Statistic Prob.

C 896.8644 103.4431 8.670126 0.0000@TREND+1 1.369240 3.272521 0.418405 0.6774

R-squared 0.003355 Mean dependent var 934.5185Adjusted R-squared -0.015811 S.D. dependent var 371.8789S.E. of regression 374.8072 Akaike info criterion 14.72703Sum squared resid 7304985. Schwarz criterion 14.80070Log likelihood -395.6299 F-statistic 0.175063Durbin-Watson stat 0.348633 Prob(F-statistic) 0.677374

Analizando esos resultados podemos observar que la estimación de los

residuos presentan un estadístico Durbin- Watson próximo a cero, lo que es

indicativo de una fuerte autocorrelación de primer orden y de la existencia una raíz

unitaria y que, por lo tanto, no cumplen las condiciones para que sean ruido

blanco. El gráfico de los residuos la serie Gpubli, que se muestra a continuación,

también muestra esos problemas y nos indica que los residuos se han mantenido

por encima y/o por debajo de la media durante un periodo demasiado largo. Por lo

tanto, ese ajuste no es adecuado puesto que olvida determinadas propiedades

importantes de la serie

9

-800

-400

0

400

800

1200

10 15 20 25 30 35 40 45 50 55 60

GPUBLI Residuals

Dado que el procedimiento anterior no es el adecuado, la tendencia es de

tipo estocástica y, por tanto, utilizamos a continuación el procedimiento de la

diferenciación para convertir a la serie en estacionaria. Tomamos la primera

diferencia en la serie Gpubli para lo que generamos la serie de DGpubli =Gpubli-Gpubli (-1), es decir, transformamos la serie de acuerdo con la siguiente expresión:

Zt =(1-B)Gpubli

La representación gráfica de la serie transformada y sus correspondientes

correlogramas se muestran a continuación.

10

-800

-600

-400

-200

0

200

400

600

10 15 20 25 30 35 40 45 50 55 60

D(GPUBLI,1)

Primera diferencia de la serie Gpubli

11

Tanto el gráfico de la serie DGpubli como su correlograma indican que la

primera diferencia de la serie puede ser estacionaria puesto que oscila en torno a

su nivel medio, aunque en el tramo central de la muestra las observaciones tienen

una intensa volatilidad, y el correlograma tiende a cero con cierta rapidez . No

obstante, se completa este análisis con el test DFA de raíces unitarias que se

muestra a continuación

Test de D-F Aumentado de DGpubli Null Hypothesis: D(GPUBLI) has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=10)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -7.301027 0.0000 Test critical values: 1% level -3.565430

5% level -2.919952 10% level -2.597905

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(GPUBLI,2) Method: Least Squares Date: 04/15/07 Time: 09:54 Sample (adjusted): 1910 1960 Included observations: 51 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

D(GPUBLI(-1)) -1.324626 0.181430 -7.301027 0.0000D(GPUBLI(-1),2) 0.401645 0.131385 3.057006 0.0036

C 0.638946 29.28717 0.021817 0.9827

R-squared 0.557836 Mean dependent var -3.098039Adjusted R-squared 0.539413 S.D. dependent var 308.1362S.E. of regression 209.1215 Akaike info criterion 13.58073Sum squared resid 2099127. Schwarz criterion 13.69437Log likelihood -343.3086 F-statistic 30.27851

12

Durbin-Watson stat 2.023024 Prob(F-statistic) 0.000000

El test DFA rechaza la hipótesis nula de una raíz unitaria en Dpubli puesto

que el valor del estadístico t (7,30) supera el valor de los puntos críticos de la

distribución DFA. Este resultado corrobora la estacionariedad de la serie Dpubli que

indican el gráfico y el correlograma de la serie

Por lo tanto, de estos resultados se deduce que la transformación que

convertiría a la serie en estacionaria sería:

Zt =(1-B)Gpubli,, Gpubli ∼I(1)

Una vez decidido el grado de integración de la serie, es decir, el número de raíces

unitarias que tiene, se debe determinar cuales son los posibles procesos ARMA

que generan la serie.

El análisis de los correlograma de la serie DPubli nos dice que un modelo que

puede generar la serie es un AR(2), puesto que el correlograma simple tiende a

cero con cierta rápidez, el parcial se anula después del segundo retardo. También

se puede sugerir como un modelo alternativo, un AR(4) puesto que el correlograma

simple se anula después del cuarto retardo, aunque restringiendo a cero los

retardos intermedios. Por otro lado, de la observación del gráfico de la serie que

consideramos estacionaria, D(Publi,1), se observa que su media puede que no sea

distinta de cero, por lo que no procede en principio la inclusión de un término

independiente, el cual es rechazado cuando se incluye en los modelos.

Los modelos sugeridos son:

1.1) ARIMA(2,1,0) ,, (1-φ1B- φ2B2 ) (1-B) Gpubli = C+at

1.2) ARIMA(4,1,0) ,, (1-φ1B- φ2B2 - φ3B3-φ4B4 ) (1-B) Gpubli = C+ at

El análisis de la estructura del correlograma probablemente sugiera algún modelo

adicional pero de momento nos quedamos con los propuestos.

13

Estimación

Una vez especificados varios modelos alternativos como posibles generadores de

la serie se debe proceder a la estimación de los mismos. Para ello en Eviews se

deben dar las siguientes instrucciones para estimar los modelos sugeridos.

Modelo 1.1: Quick/Estimate Equation/ LS d(Gpubli,1) c ar(1) ar(2)

Modelo 1.2: Quick/Estimate Equation/ LS d(Gpubli,1) c ar(1) ar(2) ar(3) ar(4) Los resultados de la estimación de estos modelos se presentan a continuación, sin

embargo algunos componentes del modelo 1.2 no eran significativos y finalmente

se han eliminado figurando en esa ecuación del modelo los componentes cuyos

parámetros son significativos, de hecho se han eliminado ar(1) y ar(3) Estimación Modelo1.1 Dependent Variable: D(GPUBLI) Method: Least Squares Date: 04/14/07 Time: 21:16 Sample (adjusted): 1910 1960 Included observations: 51 after adjustments Convergence achieved after 3 iterations

Variable Coefficient Std. Error t-Statistic Prob.

AR(1) 0.077068 0.130673 0.589779 0.5580AR(2) -0.401640 0.130038 -3.088634 0.0033

R-squared 0.165609 Mean dependent var 0.686275Adjusted R-squared 0.148580 S.D. dependent var 224.3115S.E. of regression 206.9776 Akaike info criterion 13.54152Sum squared resid 2099147. Schwarz criterion 13.61728Log likelihood -343.3089 Durbin-Watson stat 2.023100

Inverted AR Roots .04+.63i .04-.63i

Estimación modelo 1.2 Dependent Variable: D(GPUBLI)

14

Method: Least Squares Date: 04/14/07 Time: 21:26 Sample (adjusted): 1912 1960 Included observations: 49 after adjustments Convergence achieved after 2 iterations

Variable Coefficient Std. Error t-Statistic Prob.

AR(2) -0.268970 0.138461 -1.942575 0.0581AR(4) 0.324983 0.138116 2.352971 0.0229

R-squared 0.248989 Mean dependent var 0.795918Adjusted R-squared 0.233010 S.D. dependent var 228.9130S.E. of regression 200.4774 Akaike info criterion 13.47924Sum squared resid 1888986. Schwarz criterion 13.55646Log likelihood -328.2414 Durbin-Watson stat 1.788707

Inverted AR Roots .67

Una vez estimados los modelos especificados se debe validar dichas estimaciones,

es decir, se debe contrastar la adecuación del modelo a los datos, por medio de

una batería de tests estadísticos y econométricos vistos en clase y que se

encuentran en Eviews en el objeto ecuación .

Validación o chequeo

En la etapa de validación se presentan tres bloques de análisis: Un primero

referente a los resultados de la estimación, un segundo centrado en el análisis de

los residuos y, finalmente, un tercero dedicado a la comparación de modelos

alternativos.

• Análisis de la estimación.- Referente a la significatividad individual de los coeficientes por medio del

estadístico t de student pone de relieve que todos los coeficientes del modelo 1.2

son altamente significativos y mientras que ar(1) del modelo 1.1 no es significativo.

En cuanto a las condiciones de estacionariedad de los modelos estimados,

todas las raíces de los polinomios de retardos caen fuera de circulo de radio

15

unidad, ver cuadros anteriores de estimaciones, debe tenerse en cuenta que

Eviews muestra la inversa de las raíces, por lo que esas inversas caen todas dentro

del circulo de radio unidad.

De la observación de los resultados de la estimación se deduce que el modelo 1.2

presenta un error estandar ligeramente más bajo que el del modelo 1.1 y tanto el

estadístico de Akaike como el criterio de Schwarz son inferiores en el segundo

modelo .

En esta etapa también se suele analizar las correlaciones entre los coeficientes

estimados para verificar la posible existencia de multicolinealidad en el modelo. La

existencia de multicolinalidad indica una falta de precisión en las estimaciones

obtenidas y una cierta inestabilidad de los coeficientes estimados. Para obtener las

correlaciones entre los coeficientes se acude su matriz de correlaciones que

proporciona Eviews, para ello nos situamos en la ecuación estimada y marcamos lo

siguiente:

View/Correlation Matrix

La ejecución de esta instrucción muestra la matriz de coeficientes de la

ecuación estimada, para el modelo 1.1 se tiene:

Matriz de correlaciones del modelo 1

C AR(1) AR(2) C 0.380682 -0.005342 -0.015880

AR(1) -0.005342 0.018437 -0.011620 AR(2) -0.015880 -0.011620 0.016376

Se observa que esa matriz presenta unas correlaciones muy bajas por lo que no

muestra indicios de multicolinealidad. Para el modelo 1.2 se puede verificar de la

misma forma que tampoco presentan problemas de multicolinelidad.

Análisis de los residuos.

.El siguiente paso dentro del proceso de validación es el análisis de los

residuos de ambos modelos. Para ello en el objeto ecuación de Eviews se ofrecen

16

varios contrastes pero nos limitamos al contraste de que los residuos sean ruido

blanco, inspeccionando el correlograma de residuos, el estadístico Q de Box-

Pierce y el gráfico de residuos. Para ello, en Eviews una vez dentro del objeto

ecuación

Instrucciones: View/ Residual Tests/Correlogram-Q-Statistics Los resultados para el modelo.1.2 se presenta en la tabla adjunta y se puede

contemplar que las autocorrelaciones de los residuos no son significativas y entran

dentro de las bandas de confianza, lo que indica que no son distintas de cero. Por

su parte, el estadístico Q no muestra indicios de autocorreción global de los

residuos, puesto que el valor de Q estimado para los diferentes ordenes de

autocorrelación que se muestran en la tabla adjunta es siempre inferior al punto

critico de la χ2 con los correspondientes grados de libertad y los niveles estandar de

significatividad utilizados en el trabajo empírico, lo que nos lleva a rechazar la

hipótesis nula de autocorrelación global de los residuos. el valor de estimado.

Correlograma de los residuos del modelo 1.2

17

Instrucciones Eviews para el gráfico de residuos: View/Actual, Fitted, residuals

-800

-400

0

400

-800

-400

0

400

800

15 20 25 30 35 40 45 50 55 60

Residual Actual Fitted

18

El gráfico de los residuos también apoya la ausencia de autocorrelación residual,

puesto que la gran mayoría de los residuos entran dentro de las bandas de

confianza, con excepción de algún residuo anómalo. Por lo tanto, también muestra

claramente que los residuos son ruido blanco.

De la misma forma que el análisis llevado a cabo para el modelo 1.2 se

puede entrar en el objeto ecuación del modelo 1.1 y verificar que si los residuos son

ruido blanco. De hecho se observa que tanto el correlograma de residuos y el

estadistico Q como el gráfico de residuos no llegan a superar a los del modelo 1.2

Comparación de modelos alternativos.

Del análisis que se acaba de realizar en los dos apartados anteriores se

deduce que el modelo 1.2 superan el conjunto de pruebas estadísticas para validar

sus estimaciones. Además el modelo 1.2 presenta una menor varianza residual y

un menor Akaike, por lo que es preferible al 1.1.

Por lo tanto, los gastos en publicidad de la empresa, Gpubli, que es la

variable que se modelizada, viene explicada de forma satisfactoria por un modelo

sencillo ARIMA(4,0,0) restringiendo a cero los componentes AR(1) y AR(3).

3. Ejemplo 2. El Índice de precios Producción de Estados Unidos

La serie a modelizar es el Índice Precios de Producción de Estados Unidos

de frecuencia trimestral y el periodo muestral abarca 1960:01- 2002:01. Una vez

creado el el WorKfile y establecido el periodo muestral se deben importar los datos

del banco de datos, tal y como se ha hecho en el ejemplo anterior. La serie la

denominamos PPI en el Workfile

El primer paso en la modelización de la serie es su representación gráfica. Para ello

en Eviews, la instrucción es:

Quick/ Graph/ Line Graph /PPI

19

El resultado es el gráfico1a en el que se puede contemplar como la serie GDP

muestra una tendencia fuertemente creciente a lo largo del tiempo. Se realiza la

transformación logarítmica para atenuar la posible no estacionariedad en varianza y

se realiza el gráfico de la serie transformada. Para ello, en Eviews

GENR LPPI=LOG(PPI) y para su representación gráfica :

Quick/ Graph/ Line Graph / LPPI

La representación gráfica de esta serie LPPI se muestra en el gráfico 1b en el cual

se puede contemplar que la nueva serie exhibe también una clara tendencia

creciente lineal, lo que indica que esta serie no es estacionaria en media.

Gráfico 1 a. Evolución de PPI Gráfico 1b. Evolución de log(PPI)

20

40

60

80

100

120

1960 1965 1970 1975 1980 1985 1990 1995 2000

PPI

3.2

3.6

4.0

4.4

4.8

1960 1965 1970 1975 1980 1985 1990 1995 2000

LPPI

También se muestra a continuación el correlograma de LPPI

En Eviews una vez dentro del objeto serie LPPI:

View/Correlogram

20

El correlograma confirma también la no estacionariedad que mostraba el gráfico de

nivel de la serie LPPI puesto que tiende muy lentamente hacia cero

Se realiza también el test de DFA de raíces unitarias, cuyos resultados se presentan

a continuación. Para ello, en Eviews:

Quick/ SERIES STATISTIC/ Unit root / LPPI

21

Test D-F aumentado de la serie LPPI ..

El test DFA no rechaza la hipótesis nula de la existencia de una raíz unitaria en LPPI

puesto que el valor del estadístico t (-1.245) es notablemente inferior a los valores

críticos de la distribución DFA

Si ajustamos una tendencia temporal lineal simple de tipo determinístico a la serie

(LPPI), tal y como hicimos en el capítulo 1 del programa de la asignatura y práctica

1 y en la modelización de la serie ventas que acabamos de realizar, y restamos de

LPPI la serie ajustada podremos comprobar que ese no es un procedimiento

correcto para convertir a la serie en estacionaria. ( se deja al alumno que lo

compruebe). Por lo tanto, es claro que esa tendencia no es determinista sino

estocástica y debemos proceder con diferenciaciones para eliminar esa tendencia.

Comenzamos tomando una primera diferencia regular en la serie LPPI, cuyo gráfico

se muestra a continuación y también su correlograma.

22

Instrucciones en Eviews:

Genr DLPPI=D(LPPI,1) Quick/Graph/Line Graph/DLPPI

Quick/Series Statistic/Correlogram

-.04

-.02

.00

.02

.04

.06

.08

1960 1965 1970 1975 1980 1985 1990 1995 2000

D(LPPI)

Primera deferencia de LPPI

23

El gráfico de DLPPI muestra que la serie podría ser estacionaria y también en ese

sentido apunta el correlograma al mostrar un decaimiento con cierta rapidez. No

obstante, se realiza también el test de DFA, cuyos resultados se muestran a

continuación, y corrobora también la no existencia de una raíz unitaria en la serie

DLPPI y que, por tanto, esa transformación convierte a la serie en estacionaria.

Test DFA de la serie DLPPI Null Hypothesis: D(LPPI) has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=13)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -4.511989 0.0003 Test critical values: 1% level -3.469933

5% level -2.878829 10% level -2.576067

*MacKinnon (1996) one-sided p-values.

24

Augmented Dickey-Fuller Test Equation Dependent Variable: D(LPPI,2) Method: Least Squares Date: 04/14/07 Time: 18:53 Sample (adjusted): 1960Q4 2002Q1 Included observations: 166 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

D(LPPI(-1)) -0.311506 0.069040 -4.511989 0.0000D(LPPI(-1),2) -0.208661 0.078661 -2.652671 0.0088

C 0.002597 0.001046 2.482450 0.0141

R-squared 0.231434 Mean dependent var -1.71E-07Adjusted R-squared 0.222003 S.D. dependent var 0.012602S.E. of regression 0.011115 Akaike info criterion -6.143098Sum squared resid 0.020138 Schwarz criterion -6.086857Log likelihood 512.8771 F-statistic 24.54160Durbin-Watson stat 2.051191 Prob(F-statistic) 0.000000

Por lo tanto la serie LPPI tiene una raíz unitaria y la primera diferencia convierte a

dicha serie en estacionaria una vez eliminada su tendencia. La serie es del tipo

: Zt =(1-B)LPPI,, LPPI∼I(1)

Es decir, es integrable de orden 1 y tiene el siguiente significado:

DLPPI= LPPI- LPPI(-1) = log(PPI)-log(PPI(-1)), que es la tasa de variación intertrimestral de PPI o la tasa de inflación de los precios de producción o a la salida de fabrica.

Determinado el grado de diferenciación ó de raíces unitarias, pasamos a

especificar el orden de los polinomios AR y MA. Del análisis de los correlogramas

de DLPPI se deduce que en la FAC existen 2 ó tres ó quizás 4 coeficientes que son

distintos de cero y después todos son cero, mientras que en la FAP solo existe un

coeficiente significativo, que no es cero, el primero, y después tienden rápidamente

a cero. Esto sugiere que la serie (DLPPI) puede ser generada por modelos que

puede tener una estructura MA hasta orden 3 y un AR(1). Así, los posibles modelos

serian: ARIMA (1,1,3), ARIMA(1;1,2) ó ARIMA(1,1,1).

25

Por otro lado, de la observación del gráfico de la serie DLPPI se deduce que

la media de la serie es distinta de cero por lo que debe incluirse el término constante

en los modelos especificados

Los modelos tentativos serian por tanto:

2.1. ARIMA(1,1,0) ,, (1- φ1 B)(1-B)LPPI= µ +at

2.2. ARIMA(1,1,1) ,, (1- φ1 B)(1-B)LPPI= µ +(1- θ1B)at

2.3. ARIMA(1,1,1)x(0,0,1)s ,, (1- φ1 B) (1-B)LPPI= µ + (1- θ1B)(1-Θ 12B12) at

Estimación La estimación de los modelos anteriores en Eviews se hace por medio de las

siguientes instrucciones:

Quick/ Estimate Equation/ LS DLPPI c ar(1) Quick/ Estimate Equation/ LS DLPPI c ar(1) ma(1) Quick/ Estimate Equation/ LS DLPPI c ar(1) ma(1) sma(4)

Los resultados de la estimación de estos modelos se presentan a continuación:

Estimacion modelo 2.1 Dependent Variable: D(LPPI) Method: Least Squares Date: 04/14/07 Time: 09:45 Sample (adjusted): 1960Q3 2002Q1 Included observations: 167 after adjustments Convergence achieved after 3 iterations

Variable Coefficient Std. Error t-Statistic Prob.

C 0.008359 0.002213 3.777275 0.0002AR(1) 0.604968 0.062102 9.741485 0.0000

R-squared 0.365132 Mean dependent var 0.008398Adjusted R-squared 0.361284 S.D. dependent var 0.014135S.E. of regression 0.011297 Akaike info criterion -6.116710Sum squared resid 0.021057 Schwarz criterion -6.079369Log likelihood 512.7453 F-statistic 94.89653

26

Durbin-Watson stat 2.232988 Prob(F-statistic) 0.000000

Inverted AR Roots .60

Estimacion modelo 2.2 Dependent Variable: D(LPPI) Method: Least Squares Date: 04/14/07 Time: 10:21 Sample (adjusted): 1960Q3 2002Q1 Included observations: 167 after adjustments Convergence achieved after 7 iterations Backcast: 1959Q4

Variable Coefficient Std. Error t-Statistic Prob.

C 0.008092 0.003629 2.229971 0.0271AR(1) 0.872379 0.058040 15.03057 0.0000MA(1) -0.457266 0.102635 -4.455274 0.0000

R-squared 0.407837 Mean dependent var 0.008398Adjusted R-squared 0.400615 S.D. dependent var 0.014135S.E. of regression 0.010943 Akaike info criterion -6.174369Sum squared resid 0.019640 Schwarz criterion -6.118357Log likelihood 518.5598 F-statistic 56.47532Durbin-Watson stat 1.958243 Prob(F-statistic) 0.000000

Inverted AR Roots .87 Inverted MA Roots .46

Estimacion modelo 2.3 Dependent Variable: D(LPPI) Method: Least Squares Date: 04/14/07 Time: 10:26 Sample (adjusted): 1960Q3 2002Q1 Included observations: 167 after adjustments Convergence achieved after 8 iterations Backcast: 1958Q4 1959Q4

Variable Coefficient Std. Error t-Statistic Prob.

C 0.007848 0.003372 2.327825 0.0212AR(1) 0.814407 0.082838 9.831363 0.0000MA(1) -0.394349 0.124094 -3.177816 0.0018

SMA(4) 0.234611 0.084470 2.777430 0.0061

27

R-squared 0.427921 Mean dependent var 0.008398Adjusted R-squared 0.417392 S.D. dependent var 0.014135S.E. of regression 0.010789 Akaike info criterion -6.196898Sum squared resid 0.018974 Schwarz criterion -6.122216Log likelihood 521.4410 F-statistic 40.64187Durbin-Watson stat 1.963251 Prob(F-statistic) 0.000000

Inverted AR Roots .81 Inverted MA Roots .49-.49i .49+.49i .39 -.49+.49i

-.49+.49i

Validación

En cuanto a los coeficientes de los tres modelos son individualmente significativos,

según el contraste de la t de student.. Todos los modelos cumplen las condiciones

de estacionariedad y de invertibilidad puesto que tanto las raíces de los polinomios

autorregresivos como los de media móvil caen fuera del circulo de radio unidad. A

su vez, las matrices de correlaciones de los coeficientes de estos modelos no

muestran signos de multicolinealidad

Desde el punto de vista del error estandar de los modelos estimados el 2.3 es el

que presenta un valor menor (0,0108) seguido del 2.2 (0.0109). Desde el punto de

vista del criterio de Akaike, el modelo 2.3 presenta un valor inferior (-6.20) seguido

del modelo 2.2 (-6.17).

El análisis de los residuos de los tres modelos estimados a través de sus

correspondientes correlogramas, el estadístico Q y sus gráficos de residuos, que se

presentan a continuación para el modelo 2.3, nos indica que todos ellos cumplen las

condiciones para ser considerados como ruido blanco, excepto el 2.1. No obstante,

el modelo 2.3 es el que cumple esas condiciones con más holgura.

Del análisis anterior de los residuos y de la evaluación de las estimaciones de los

coeficientes de los distintos modelos el modelo preferido es el 2.3 seguido del

modelo 2.2. El modelo 2.1 es desechable desde el punto de vista estadístico dado

que sus residuos no son ruido blanco

28

Correlograma de los residuos del modelo 2.3

Grafico de residuos del modelo 2.3

-.06

-.04

-.02

.00

.02

.04

-.04

-.02

.00

.02

.04

.06

.08

1965 1970 1975 1980 1985 1990 1995 2000

Residual Actual Fitted

El alumno debe analizar los residuos de los modelos 2.2 y 2.3 a través del correlograma y del gráfico de residuos

29

4. Ejemplo 3. Viviendas de nueva construcción en USA

La serie a modelizar es el número de viviendas de nueva construcción en

Estados Unidos expresada en miles, la frecuencia es mensual y el periodo muestral

comprende 1959:06 1992:04. El objetivo que se persigue con este ejercicio es que

el alumno aprenda a construir un modelo univariante de una serie de frecuencia

mensual que tiene una marcada tendencia y estacionalidad.

Una vez creado el fichero de trabajo en Eviews para esa frecuencia y periodo

muestral, de la misma forma como se ha realizado en los dos ejercicios anteriores,

se realiza la representación gráfica de la serie objeto de análisis. La serie se

denomina HS

Instrucciones: Quick/Graph/ HS/Line graph

40

80

120

160

200

240

1960 1965 1970 1975 1980 1985 1990

HS

Viviendas de nueva construcción en USA

Este gráfico no es muy indicativo sobre la estacionariedad o no de la serie en

30

Como hemos visto en los dos ejemplos anteriores el correlograma es un

instrumento útil para verificar la estacionariedad de la serie. A continuación se

presenta el correlograma.

Instrucciones: Una vez en el objeto serie HS, View/ Correlogram En el correlograma de la serie HS se observa que las autocorrelaciones disminuyen

primero, y posteriormente alcanzar un pico relativo en el retardo 12, y disminuyen de

forma acusada en los retardos mayores. Por su parte, las autocorrelaciones

parciales muestran una punta positiva en el retardo 1 y otra negativa en el retardo

13, lo cual apunta a una posible estacionariedad de la serie en niveles.

31

No obstante, realizamos el contraste de Dickey- Fuller aumentado que se adjunta a

continuación:

Instrucciones: Quick/series statistic/Unit Root/HS Contraste de raiz unitaria (DFA) de la serie HS Null Hypothesis: HS has a unit root Exogenous: Constant Lag Length: 4 (Automatic based on SIC, MAXLAG=4)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -4.969008 0.0000 Test critical values: 1% level -3.446692

5% level -2.868638 10% level -2.570617

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(HS) Method: Least Squares Date: 03/28/07 Time: 18:33 Simple (adjusted): 1959M06 1992M04 Included observations: 395 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

HS(-1) -0.148240 0.029833 -4.969008 0.0000D(HS(-1)) 0.219352 0.049430 4.437661 0.0000D(HS(-2)) 0.111332 0.049647 2.242480 0.0255D(HS(-3)) -0.065359 0.049837 -1.311461 0.1905D(HS(-4)) -0.195488 0.049835 -3.922725 0.0001

C 18.73706 3.901098 4.803023 0.0000

R-squared 0.198754 Mean dependent var -0.108354Adjusted R-squared 0.188455 S.D. dependent var 19.94195S.E. of regression 17.96486 Akaike info criterion 8.629785Sum squared resid 125544.3 Schwarz criterion 8.690224Log likelihood -1698.383 F-statistic 19.29878Durbin-Watson stat 1.956461 Prob(F-statistic) 0.000000

32

La hipótesis de raíz unitaria queda fuertemente rechazada, según los resultados del

test DFA de la serie HS, el estadístico t (-4,97) supera ampliamente los valores

críticos de la distribución ADF, lo que confirma la estacionariedad de la serie HS en

niveles, como ya apuntaba de alguna forma el análisis gráfico y el del correlograma.

Para finalizar la etapa de especificación inicial debemos determinar cuales son los

modelos estacionales multiplicativos ARMA (p,q) Χ ARMA(P,Q)S que pueden

generar la serie.

Del análisis del correlograma de la serie HS se deduce que el proceso generador

de datos puede tener un componente autorregresivo regular de orden 1 y otro

estacional de orden 1, es decir un AR(1,0)xSAR(1,0)12.

Por lo tanto, comenzamos la estimación con este modelo

3.1. ARIMA(1,0)×(1,0)12 ,, (1- φ1 B) (1-φ12B12)HS = c+at

3.2. ARIMA(1,0,1)x(1,0,1)s ,, (1- φ1 B) (1-φ12B12) HS= c + (1- θ1B)(1-Θ 12B12) at

Instrucciones: Quick/ Estimate Equation/ HS c ar(1) sar(12) Estimación del modelo 3.1 Dependent Variable: HS Method: Least Squares Date: 03/28/07 Time: 18:38 Sample (adjusted): 1960M02 1992M04 Included observations: 387 after adjustments Convergence achieved after 7 iterations

Variable Coefficient Std. Error t-Statistic Prob.

C 125.7702 15.81167 7.954265 0.0000AR(1) 0.855642 0.026422 32.38374 0.0000

SAR(12) 0.684278 0.037380 18.30602 0.0000

33

R-squared 0.861497 Mean dependent var 127.0121Adjusted R-squared 0.860776 S.D. dependent var 37.98452S.E. of regression 14.17307 Akaike info criterion 8.148286Sum squared resid 77136.31 Schwarz criterion 8.178971Log likelihood -1573.693 F-statistic 1194.255Durbin-Watson stat 2.299600 Prob(F-statistic) 0.000000

Inverted AR Roots .97 .86 .84-.48i .84+.48i .48+.84i .48-.84i .00+.97i -.00-.97i -.48+.84i -.48-.84i -.84-.48i -.84+.48i -.97

Grafico residuos del modelo 3.1

-60

-40

-20

0

20

40

60

1965 1970 1975 1980 1985 1990

HS Residuals

Correlograma residuos del modelo 3.1

34

Estimación Modelo 3.2 Dependent Variable: HS Method: Least Squares Date: 03/28/07 Time: 18:43 Sample (adjusted): 1960M02 1992M04 Included observations: 387 after adjustments Convergence achieved after 22 iterations Backcast: 1959M01 1960M01

Variable Coefficient Std. Error t-Statistic Prob.

C 83.11975 184.3502 0.450880 0.6523AR(1) 0.955059 0.016389 58.27399 0.0000

SAR(12) 0.993375 0.003935 252.4190 0.0000MA(1) -0.227059 0.053509 -4.243383 0.0000

SMA(12) -0.949903 0.012323 -77.08240 0.0000

R-squared 0.906416 Mean dependent var 127.0121Adjusted R-squared 0.905436 S.D. dependent var 37.98452S.E. of regression 11.68070 Akaike info criterion 7.766589Sum squared resid 52119.61 Schwarz criterion 7.817731Log likelihood -1497.835 F-statistic 924.9762Durbin-Watson stat 2.009647 Prob(F-statistic) 0.000000

Inverted AR Roots 1.00 .96 .87-.50i .87+.50i .50+.87i .50-.87i .00+1.00i -.00-1.00i

35

-.50+.87i -.50-.87i -.87-.50i -.87+.50i -1.00

Inverted MA Roots 1.00 .86+.50i .86-.50i .50+.86i .50-.86i .23 .00+1.00i -.00-1.00i -.50+.86i -.50-.86i -.86-.50i -.86+.50i -1.00

Correlograma de los residuos del modelo 3.2

36

-40

-30

-20

-10

0

10

20

30

40

1965 1970 1975 1980 1985 1990

HS Residuals

Validación

El modelo 3.1 presenta todos su coeficientes significativos, según el t ratio, la matriz de coeficientes que se

puede consultar en la ventana de la ecuación no proporciona coeficientes de correlación elevados por lo que no

presentan signos de multicolinealidad. Analizando el correlogramas de los residuos se observa que el

estadistico Q presenta autocorrelación global , por lo que los residuos no son ruido blanco. El modelo, en

principio, no parece válido y además el coeficiente de AR(1) está próximo a 1 (0,9), lo que puede indicar la

necesidad de una nueva diferenciación, en el mismo sentido apunta el valor elevado de la raiz invertida de la

parte autorregresiva (0.97), lo que indica que la serie HS puede que no sea estacionaria

Los coeficientes del modelo 3.2 son altamente significativos y presenta mejoras sobre el modelo anterior, de

hecho el criterio de AIC y el SBC son inferiores y los residuos se parecen a un ruido blanco, tanto de la

observación de correlograma de los residuos como el estadistico. Sin embargo, los coeficientes autorregresivos

tienen valores cercanos a la unidad, lo que indican la necesidad de una difereciación regular y otra estacional,

en el mismo sentido apuntan las raices de los polinomios autorregresivos.

A la vista de los problemas anteriores se sugiere al alumno que pruebe diversos esquemas ARMA con

una diferenciación regular y otra estacional.