32
ESTADISTICA ESPAÑOLA vol. 35, Núm. 133, 1993, págs. 345 a 375 Predicción multivariante y multiperíodo de una serie temporal económica mediante una red neuronal ^ JOSE M .a OTERO FRANCISCO TRUJILLO Universidad de Málaga REStJMEN En este trabajo se compara la capacidad predictiva de una red neuronal artificial con las correspondientes a un modelo econométrico, un modelo de función de transferencia ARIMA y un modelo estructural de series ternporales. La variable a predecir es la tasa de actividad femenina en Andalucia. En todos los casos esta variable se hace depender de la tasa de ocupacián, a fin de tener en cuenta el efecto «ánimo-desánimo». Las predicciones se realizan con datas trimestrales a horizonte de un año. La conclusión es que las mejores predicciones se obtienen mediante la red neuronal y el modelo estructural de series tempora- les, sin que se aprecien diferencias significativas entre ambos. Palabras clave: Redes neuronales, modelos ARIMA, modelos de corrección por el error, modelos estructurales de series temporales, predicción, tasa de acti- vidad . Clasificación AMS: 90 A20, 62M 10 1. INTRODUCCION Los modelos de redes neuronales artificiales o, simplemente, redes neurona- les, se conocen también con nombres tales como modelos de cálculo distribuido en paraleio, métodos coneccionistas o sistemas neuromórficos. Estos modelos ' Este trabajo se ha financíado parcíalmente con una ayuda para proyectos de investigación de la CIGYT, PSB91-0810.

Predicción multivariante y multiperíodo de una serie temporal económica mediante una red neuronal

Embed Size (px)

DESCRIPTION

análisis multivariante

Citation preview

  • ESTADISTICA ESPAOLAvol. 35, Nm. 133, 1993, pgs. 345 a 375

    Prediccin multivariante y multiperodode una serie temporal econmica mediante

    una red neuronal ^JOSE M .a OTERO

    FRANCISCO TRUJILLOUniversidad de Mlaga

    REStJMEN

    En este trabajo se compara la capacidad predictiva de una red neuronalartificial con las correspondientes a un modelo economtrico, un modelo defuncin de transferencia ARIMA y un modelo estructural de series ternporales.La variable a predecir es la tasa de actividad femenina en Andalucia. En todoslos casos esta variable se hace depender de la tasa de ocupacin, a fin de teneren cuenta el efecto nimo-desnimo. Las predicciones se realizan con datastrimestrales a horizonte de un ao. La conclusin es que las mejores prediccionesse obtienen mediante la red neuronal y el modelo estructural de series tempora-les, sin que se aprecien diferencias significativas entre ambos.

    Palabras clave: Redes neuronales, modelos ARIMA, modelos de correccin porel error, modelos estructurales de series temporales, prediccin, tasa de acti-vidad .

    Clasificacin AMS: 90 A20, 62M 10

    1. INTRODUCCION

    Los modelos de redes neuronales artificiales o, simplemente, redes neurona-les, se conocen tambin con nombres tales como modelos de clculo distribuidoen paraleio, mtodos coneccionistas o sistemas neuromrficos. Estos modelos

    ' Este trabajo se ha financado parcalmente con una ayuda para proyectos de investigacin dela CIGYT, PSB91-0810.

  • - ^.3^.^i-^ ^ ^,,I;i_)j_>! li .,^, ^ `7^'^,r^(.)l /".

    se vienen aplcanda con xito a los campos del lenguaje y al reconocimiento deirngen+es donde se requieren abtas velocidades de clculo para discriminar entrerr^uchas hiptesis alternativas.

    Aunque los primeros trabajos sobre redes neuronales se remontan a los aoscuarenta, en la actualidad hay un resurgimiento en este campo debido a laaparicin de nuevas topologas de redes y de nuevos algoritmos.

    Las posibilidades patencales de aplicacin de las redes neuronales van msall del reconocimiento de patrones. Su capacidad para tra#ar inforrnacin queincorpra una componente aeatoria las hace aptas para abordar problemas q^^e

    FIGl1RA 1^Esquema de Red Neuronal con diez elementos de proceso

    y una capa intermedia

    OUTPUT

    CAPA DEL OUTPUT

    CAPA INTERMEDIA

    CAPA DEL INPUT

    __ _ _ ^__ _ _.^..._._^ _ --- ------^ ____ _--- -

    INPUT

  • F^F^E r^^^-;^ :^{^^r^ nn^^^_ r Pv^^^^^r^^r ^^ ^^ n^^,^ ^r^^^ fz^ ;^,,,

    conciernen a las tcnicas estadsticas tradicionales. Sus ventajas en este campofrente a los mtodos tradicionales, como sugiere Lippmann (1987), surgen delhecho de poder tratar de forma ms robusta las distribucianes generadas porprocesos no iineales y no gausianos, pues descansan en hiptesis ms dbilessobre las formas de las distribuciones subyacentes. Por otra parte poseen lacapacidad de adaptacin o aprendizaje en entornos cambiantes, lo que tambinproporciona un cierto grado de robustez.

    Las redes neuronales estn constituidas por muchos elementos de proceso 0nodos distribuidos espacialmente en forma de capas, que recuerdan las redesneuronales biolgicas, entre los cuales existen un gran nmero de interconexio-nes, vase la figura 1. La primera capa recibe todos los input de informacin,nodo a nodo. Dentro de cada elemento la informacin recibida se pondera ytransforma mediante una funcin predefinida. EI resultado de la transformacinconstituye el output del elemento en cuestin. A travs de las interconexiones eloutput de un elemento se convierte en input de otro elemento perteneciente a lamisma capa o a la siguiente. En la ltima capa cada elemento recibe informacinde los elementos de las capas precedentes y aporta una saiida (output). EIsistema en su conjunto se comporta como un modelo no lineal que recibeinformacin, la transforrna y proporciona unos resultados,

    Smolensky (1986) especifica una red neuronal dinmica en !a siguiente forma:U; (t+ 1) = F[^k Wki G Cuk Ct))1

    en donde u; (t) es el output de la unidad i en el tiempo t, F es la funcin detransferencia no lineal adoptada (sigmoide generalmente), G es una funcinumbral no lineal y Wk; es la ponderacin de ia conexin existente entre la unidadk y la unidad i.

    EI hecho de que las redes neuronales puedan usarse como modelos de funcinde transferencia no lineales ha propiciado su aplicacin a problemas de predic-cin desde e! trabajo pionero de Lapedes y Farber (1987), a partir del cual se haacumulado alguna evidencia sobre las capacidades predictivas de las redesneuronales en comparacin a los mtodos y modelos estadsticos y economtri-cos al uso.

    Para algunos autores las redes neuronales representan una nueva formarevolucionaria de enfocar ia prediccin, con importantes ventajas sobre los pro-cedimientos estadsticos. As, por ejemplo, para Hiew y Green (1992) (...) lossistemas de prediccin que incorporan la tecnologa de las redes neuronales (esdecir, capacidades de aprendizaje) sealan el comienzo de una nueva era en laevolucin de los sistemas de prediccin y de apoyo en la toma de decisiones.Estos sistemas son ms fciles de mantener (...) y simples de usar (...). Las redesneuronales revolucionarn los sistemas de apoyo en la toma de decisiones,

  • ;^^ t-f k ^ r., ^,

    ayudando a los ejecutivos a descubrir el conocimiento oculto en sus bases dedatos, de modo que les permita comprender mejor lo que ocurre, por qu ocurre,la verasimilitud de que vueiva a ocurrir y, a su vez, desarrollar planes que influyanpsitivamente en las ventajas competitivas de! resultado final. Sin embargo,creemas con Chatfield (1993) que el estado de conocimiento actual sobre esteema no permite hacer taies afirmaciones sin pecar de exageracin. Las paten-

    ciaiidades de esta metodologa en el campo de la prediccin ecanmica no sepueden establecer sino ponindola en relacin cn 1as tcnicas de modeiizacinhabitua[es en el aniisis estadistico y econorntrico 2.

    Par otra parte, en el campo de !a prediccin univariante de series temporalesse ha comparado el neuroclcula can ei anlisis Box-Jenkins a travs de susrespectivas capacidades predictivas, con resultados an no concluyentes Shar-da y Patil (1987) y Varfis y Versino (1990).

    Los modelos de redes neuronales se estn comenzando a aplicar, tambin confines predictivs, en la modelizacin econmica multivariante como alternativa alos modeios ms tradicionales de tipo economtrico y modelas ARIMA. EI pro-ceso de modelizacin tradicional se sustituye ahora par ei dei diseo de laarquitectura de Oa red, lo que cambia la forma de concebir los problemas com-plejas Canu et al .(1990) y Windsor y Harker (1990) con resultados satisfac-torios. Sus ventajas potencales en este campo san diversas, destacando sucapacidad adaptativa y su aptitud para integrar en un solo sistema diversosfactores (v.g. demogrfico, atmosfrico, etc.). Faltan, sin embargo, trabajos quecomparen la capacdad predictiva de estas redes con modeios alternativos.

    Este tipo de comparaciones, para ser vlidas, deben hacerse con modelosestadsticos y economtricos especificados, estimados y verificados de acuerdocon la metodologa idnea en cada caso. Este es un requisito que no se cumpieen todos los trabajos que conocemos, realizados, a veces, por expertos en reasdistintas a la prediccin econmica.

    En el presente artculo nos proponemos Ilevar a cabo un ejercicio de prediccinde una serie temporal econr^nica, la tasa de actividad de la mujer en Andaluca,comparando la capacidad predictiva de una red neuronal can la de varios mode-los estadsticas y economtricos desarrollados en la literatura especializadarelativa a ia prediccin.

    La tasa de actividad de la mujer es en la actuaiidad una variabie de crucialimportancia en la prediccin de la poblacin activa y del paro regional, cuya tasaest entre las ms elevadas de las regiones europeas. La participacin de la mujeren el mercado de trabajo andaluz ha venido creciendo suavemer^te durante el

    2 A este respecto se pueden consuttar Kuan y White (1991), Swanson y White { 1992) y White(1992), especialmente los captulos de la II y II I parte.

  • f,RF i}It .( I^ )PJ Ml.ll 11`3 AF11F^Ni'E 'r MIJL ^ IF'E f?It si ^34^^

    perodo de recesin econmica anterior a 1985, pero al iniciarse !a reactivacin haregistrado importantes crecimientos, pasando del 21 por 100 al 29 por 104 en cuatroaos. Hay, pues, a priori dos tipos de factores que han venido influyendo en la tasade actividad fernenina. EI primero es de naturaleza social y se manifiesta en unatendencia creciente en la participacin de la mu er en el mercado de trabajo. EIsegundo, de naturaleza socioeconmica, se denomina efecta nimo-desnimo yse manifiesta en la incidencia del ciclo econmico en la participacin de !a mujer enel mercado de trabajo. Cuando se crean empleos a un ritmo fuerte muchas mujeresdesanimadas en perodos anteriores, que no entraron en el mercado de trabajo 0que dejaron de ser activas para dedicarse a estudiar o a labores domsticas, buscantrabajo, pasando a engrosar las cifras de pablacin activa.

    Para describir este comportamiento de la tasa de actividad femenina y obtenerpredicciones a corto plazo, se aplca aqu un modelo de red neuronal artificial. Afin de valorar la capacidad predictiva de la red se comparan sus predicciones expost con las obtenidas mediante otros tres modelos estadsticos. EI primero esun modelo economtrico que hace uso de una especificacin que incorporainformacin a priori, el segundo es una funcin de transferencia (Box-Jenkins) yel tercero es un modelo estructural de series temporales. Todos estos modelostienen en comn el hecho de utilizar informacin sobre el empleo (u ocupacin)como variable que sirve para incorparar el efecto nimo-desnimo en el carn-portamiento de la tasa de actividad femenina. Seguimos as la evidencia ernpricaque para Espaa han obtenido Novales y Mateos (1989) y Treadway {1989) ynuestra propia evidencia para el caso andaluz Otero {1990) y Otero, Martn,Trujillo y Fernndez (1992).

    En un trabajo precedente, Otero y Trujillo {1991), diseamos una red parapredecir la serie antes citada, can horizonte temporal de un trimestre, y compa-ramos las predicciones con 1as de un modelo de funcin de transferencia y unmodelo de correccin por el error. La conclusin fue que las mejores prediccionesse obtenan mediante la red neuronai. Aqu hernos diseado una red neuronalms compleja para obtener predicciones a cuatro trimestres y campararlas conlas de los modelos mencionados en el prrafo anterior. Ahora los resultadosconfirman que la ventaja de la red neuronal se mantiene sobre los das primerosmodelos considerados y que, sin embargo, la red es ligerarnente superada porel modelo estructural de series temporales, si bien la diferencia entre las corres-pondientes predicciones no es significativa.

    2. DATOS Y MODELOS

    Los datos proceden de la Encuesta de Poblacin Activa (EPA) del InstitutoNacional de Estadstica. La tasa de actividad fernenina (TAM) se define como el

  • .3^^) E `..a^^C>,`^^^t
  • PRF DIC;(^ION MUl TlVA^tIANTE^ Y MUL T!PE^F^IC.^(^)(^)__

    351

    el estudio a ms conjuntos de predicciones, a fin de disponer de ms casos parala valoracin de los modelos, pero el tamao de la muestra disponible aconsejala solucin de compromiso adoptada.

    2.1. Modeio ARIMA

    EI modeio de funcin de tranferencia estimado en este estudia utliza la tasade ocupacin, TOCU, como input, siendo el output la tasa de actividad de lamujer, TAM. Se incluyen dos variables de intervencin, W84 y W87, para recagerlos cambios metodolgicos ya citados de la EPA.

    La funcin de transferencia se ha identificado y estimado usando la opcinautomtica del programa AUTOBOX. Este mdulo del programa realiza los pro-cesos de identificacin y estimacin de forma automtica y proporciona laspredicciones de TAM, condicionadas a los valores verdaderos de TOCU, paralos horizontes de prediccin deseados. Los resultados de las predicciones figuranms adelante en las tablas 1 a 3. Los resultados intermedios relativos a losprocesos de identificacin y estimacin se han omitido por razones de espacio ypor ser fclmente reproducibles mediante el programa.

    EI motivo de utilizar este programa en lugar de Ilevar a cabo nosotros mismosla identificacin y la estimacin del correspondiente modelo reside en la propiafinalidad del trabajo. Operando de esta forma estamos usando un punto dereferencia estndar, las predicciones obtenidas automticamente mediante AU-T4BOX (cuya caiidad es comparable a la de un buen experto en este tipo demodelizacin) para compararlas con las predicciones de los dems modefos.

    2.2. Modelo economtrico

    EI modelo economtrico que se ha estimado en este trabajo es bsicamenteel mismo que aparece especificado en Otero et al. (1992). Ahora, sin embargo,para dotar de mayor rigor al proceso de estimacin se reparametriza en formade modelo de correccin 'por el error y se aplica un test de cointegracin.

    Partimos de la ecuacin

    ^,-^ (1)--In{TAMt -1}^^c+RTOCU^+yt+ut

  • 352

    en donde:

    E^iA(:)ISTI(;A E::iPAP^JC^I_A

    TAM *= Tasa de actividad deseada de la rnujer,t= Trmina de tendencia {t = 1 en 1976.3},

    TOCU = Tasa de ocupacin.

    La expresin ( 1 } es la ecuacin de la logstica bajo el supuesto de que e# nivelde saturacin de TAM * es la unidad. Con esta especificacin evidenciamos queel comportamiento de !a tasa de actividad de la mujer responde a dos tipos defuerzas, una econmica, representada por TOGU y atra sociai, recogida por latendencia. La formulacin fogistica asegura que tas predicciones de TAM seencantrarn siempre dentro del rango admisible, que est comprendido entre C1y 1, al mismo tiempo que proporcona una hiptesis aceptabte a priori sobre laforma en que !a tasa de actividad de la mujer evoluciona a largo plazo.

    Hagamos el cambio de variable

    Yt = --In (TAM t ^ - 1) (2)*

    y al sustituir en (1) se tiene un modelo iineal. Cmo quiera que Yt es inobservable,utilizamos ahora ia hiptesis de ajuste parcial

    ^

    Yt-Yt-^ =b(^Ic --Yc-^) (3}

    Sustituyendo Yt en (3}, de acuerdo con (2) y { 1), se tiene el madelo dinmco

    Yt=rx+b^iTOCUt+S^yt+{1 -b)Yt_^+but_^ (4)S se considera que, adems de rigdeces en el comportamiento, existe incer-

    tidumbre sobre la ocupacin, !a especificacin dinmica sera entonces mscompleja vase t^tero, Martn, Trujillo y Fernndez ( 1992) .

    Yt = oco + ^3o TOGUt + ^i^ T4GUt_^ + ^32 TOGUt_2 + yo t ++ oc^ Yt_^ + cx2 Yt_2 + vc (5)

    Los coeficientes de esta ecuacin son, como en (4), funcianes de las parmetrosestructurales. Reescribiendo (5) en forma de modelo de correccin por el error,se tiene

    ^1Yt = {ao + yo) - a2 dYt-

    + (a^ +cxz- 1) Yt-^-_

    +^io ^TCJC U t-- (32 t^TOC U t_^ +

    yo _ _ ^t_ 1) _ .^^ + ^ + ^ TC^CUt_^ + vt

    (1 - ^^ - ^2) (1 - +cx^ - a2)

    {6}

    EI proceso de verificacin y estimacin es el siguiente, Primero se ha determi-nado el orden de integracin de cada variable, resuitando que ambas son I(1).

  • F'HE.DICC^ICJN MUL^TIVARIANTE Y MULTIPFf^IC)[)c) 35,3

    Habida cuenta que los datos son trimestrales, se ha comprobado tambin queambas series son estacionarias a las frecuencias estacionales, por lo que se hanutilizado variables ficticias para recoger las variaciones estacionales. Por ltimo,se ha comprobado que Y y TOCU son CI(1,1) (ver anexo 1).

    La estimacin se ha Ilevado a cabo por el procedimiento bietpico de Engle yGranger (1987). Para elfo primero se ha estimado (1) sustituyendo TAM t por elcorrespondiente valor observado contemporneo. Los coeficientes de largo plazode esta ecuacin son los que aparecen en el segundo miembro de (6) multipli-cando a t- 1 y TOCUt_^ por lo que una vez estimados en (1) se uti lizan paraconstruir la estimacin de la serie

    Z t = Yt-1 - __ __ l^-__. __ _ (t _ 1) _ ru ' _ r^ '__r^ _ TOCU t-1 (7)(1 - oc^ - oc2) (1 - oc^ -- ocz)

    Los valores asi obtenidos para Zt se utilizan para estimar (6). (Los correspon-dientes resultados estn recogidos en el anexo 1).

    Una vez estimada, la ecuacin (6) permite obtener las prediccione de Y. Deaqu, mediante la ecuacin de definicin (2), se hallan las correspondientespredicciones de nuestra variable de inters, TAM. Antes de proceder a la obten-cin de predicciones se ha sometido el modelo a una serie de tests que sedescriben someramente en el anexo 1.

    Obsrvese que, como estamos interesados en realizar prediccianes condicio-nales a un conjunto de valores dados de TOCUt (t = T+ 1, T+ 2,...,T + p), habrque operar iterativamente. En efecto, si la muestra se extendi al perodot= 1,2...T, fa prediccin de YT+^ se obtiene a partir de ZT+1, que es conocida,pues depende de YT. Para obtener la prediccin de YT+2, ser preciso disponerde ZT+2, pero sta depende de YT+^, que es desconocida, por lo que habr queestimarla en funcin de la prediccin de YT+^ realizada en el perodo anterior.Anlogamente, para obtener la prediccin de Y en el periodo T+ 3 ser precisohaber estimado previamente el valor correspondiente de Z a partir del valorpredicho para Y en el perodo T+ 2, y as sucesivamente.

    En nuestra aplicacin los parmetros a2, (3^ y^32 no han resultado significativos,lo que equivale a decir que el modelo de correccin por el error estimado ha sidoel que corresponde a la especificacin ms simple, (4).

    AI igual que en el caso del modela ARIMA, se han tenido en cuenta los cambiosde definicin de la EPA en 1984 y 1987 mediante el uso de sendas variablesficticias W84 y W87. Los resultados de las predicciones figuran ms adelante enlas tablas 1 a 3.

  • ^r7^ E `,Tn[)i`^TI('..A E ^;F.,^N^...,)^ .^

    2.3. Red neuronal

    como ya hemos seaiado, las redes neuronales artificiales estn formadas porelementos de proceso, que seran anlogos a las neuronas cerebrales, organi-zados o dispuestos en capas, de manera que los elementos de una capa estnconectados con los de otras, vase la figura 1. Asociado con cada par deelementos conectados existe un valor ajustable fiamado ponderacin, peso 0intensidad de la conexin, y que tiene la consideracin de unidad de memoriade la red. Igualmente, en ciertas redes hay un parmetro adicionai que operacomo un valor umbral interno que se debe rebasar para que se produzca unaactivacin del elemento de proceso 3.

    Una red neuronal tipca puede estar formada por diferentes capas de ele-mentos:

    i) La capa de entrada o del input, que es a travs de fa que se suministra ala red la informacin, expresada en forma de datos numricos.

    ii) Una varias capas ocultas, hacia las que se proyectan los datos desdelas elementos de la capa de entrada. En cada uno de los elementas pertenecien-tes a una capa oculta se calcula una suma ponderada de los datos de entraday el resultado se compara con un valor umbral a fin de activar o desactivar elelemento en cuestin. Seguidamente se aplica a dicha suma una funcin detransferencia, que en la mayora de las aplicaciones econmicas es la sigmaide,siendo el valor resultante la salida de ese elemento. Una red puede constar dems de una capa oculta o intermedia.

    iii) La capa de salida o del utput, a donde Ilega la informacin provenientede la capa del input de las capas interrnedias. En los elementos de esta capase obtienen de nuevo sumas ponderadas, que se pueden transformar medianteotra funcin de transferencia. Los valores que resultan constituyen la salida uautput de la red neuronal.

    La informacin puede discurrir por las conexiones entre los elementos dediferentes capas de dos formas: proalimentada (feedforward}, cuando la informa-cin fluye en una nica direccin, y retroalimentada ^feedbaek), cuando la infor-macin puede fluir en una direccin y en la contraria. Nuestra red pertenece alprimer tipo citado.

    Una vez diseada la red neuronal, en el proceso de modelizacin se puedendistinguir dos fases: la de aprendizaje o entrenamiento y la de prueba. Durantela primera se realiza e! ajuste de las ponderacones de la red, proceso queequivale, en cierto moda, al de estimacin estadstica de un modelo. La parte de

    3 Una visin general de la gnesis y de fos tipos de redes neuranales ms usuales se puedeencontrar, entre otros, en Simpson {1990).

  • F'f^Ef^,(,t;lt)^1 M1)l ^I`JAF^tIANTf "r' ^v1lJl TiF'E f11t i 3^`^

    la informacin utilizada en esta fase se denomina conjunto de aprendizaje. Dichainformacin se suministra a la red a fin de que se produzca el proceso deadaptacin o modificacin de las ponderaciones. La informacin se puede intro-ducir en la red de forma secuencial o de forma aleatoria. En este ltimo caso sesuele presentar un nmero elevado de veces hasta que el aprendizaje se com-pleta, esto es, hasta que las ponderaciones se estabilizan y se ha alcanzado eimnimo de la funcin de error.

    Durante la fase de prueba la red procesa un est^nulo, que se presenta comoun conjunto de datos de entrada, y crea una respuesta o salida utilizando lasponderaciones y parmetros establecidos en la fase anterior. Los datos deentrada deben ser, obviamente, distintos de los utilizados en la fase de entrena-mienta con objeto de poder comprobar la idoneidad de la red diseada. cuandola finalidad es predecir, la salida u output generado constituye, precisamente, elvalor predicho por la red. La informacin utilizada en esta fase se puede deno-minar conjunto de prueba.

    Como ya se ha sealado, una red neuronal aprende ajustando o cambiandolas ponderaciones o pesos de las conexiones entre los elementos en respuestaal estmulo generado por las entradas de cada elemento y de acuerdo can el tipode funcin de transferencia. Por consiguiente, el proceso de aprendizaje consisteen la adecuacin de estos pesos o, en trminos biolgicos, de las conexionessinpticas. Los diferentes mtodos de aprendizaje se pueden clasificar en doscategoras:

    a) Aprendizaje supervisado: es un proceso que incorpora un tutor externo y/oinformacin global. De modo que, con cada conjunto de datos de entrada, sesuministra a la red la salida esperada con objeto de evaluar el error producido,que se define coma la diferencia entre la salida actual de la red y la deseada. Enlas aplicaciones econmicas es el tipo de aprendizaje ms utilizado.

    b) Aprendizaje no supervisado: es un proceso autoorganizativo que no tienetutor externo y que cuenta slo con informacin local y control interno. Por tanto,can este aprendizaje la red autoorganiza los datos presentados y descubre suspropiedades internas ms sobresalientes.

    En las aplicaciones econmicas el algoritmo ms utlzado en la fase deaprendizaje es el de retropropagacin (back propagation), ya que se adapta muybien a! comportamiento subyacente que genera buena parte de las series eco-^nmicas as como al proceso de aprendizaje de los sujetos econmicos. Estealgoritmo fue desarrollado, entre otros, por Rumelhart, Hinton y Williams (1986).De forma muy sucinta podemos decir que opera de ta manera siguiente 4:

    ^ La forma como se expone en el texto es la que figura, entre otros, en Lapedes y Farber (1987,pgs. 6-10) y Lippmann (1987, pgs. 17-18).

  • ^3`^sf:> i :,rt^l_ . !^^ t'^, r .^,F^r,r^^ ^^

    i) Cada vez que se introduce en la red un vector de datos de entrada (input)y otro correspandiente a la salida deseada (output deseado) !a informacin sepropaga desde la capa de entrada a la de salida, pasando por las capas nter-medias ocultas. La red genera de esa forma las sumas ponderadas que corres-panden a cada elemento, las transforma mediante una funcin de transferenciay produce finalmente un vector de salida (output). Las ponderaciones iniciales sefjan aleatoriamente dentro de un intervalo de vaiores pequeos.

    ii} ^ara cada elemento de la capa de salida !a red catcula el error localescalado, que se define como el error bruto (diferencia entre el output deseadaque se suministra a la red y ei que sta ha generado) muftipi'rcado por la derivadade !a funcin de transferencia. Dicho error escalado sirve para calcular lasmodificaciones que deben experimentar las ponderaciones de la capa de salida(capa del autput).

    iii) Finalmente, los errores se propagan hacia atrs, de ah^ el nombre delalgoritmo, y se utilizan para cambiar el valor de las ponderaciones de los eie-mentos de ias capas ocultas a fin de minimizar el error global de la red 5.

    Denominando f(x,8) a!a salida (output) generado por la red, donde x denotael vector de valores suministrado a la capa del input y^ el vector de todas lasponderaciones, la expresin de actuaiizacin de las ponderaciones medianteretropropagacin (back propag ation) es:

    f^t.^ ^ = f^t + ^ D f { x c-^ ^ , ^t } [Y t + ^ - f ( x t+ ^ ^ ^t ) ]

    donde r^ es el coeficiente de aprendizaje, T7f es el gradiente de f respecto a lasponderaciones, 6, e Y es el output deseado. Las ponderaciones se ajustan enfuncin de! error cometido por ia red, [Yt+^ -- f(xt-^ ^, 8t)]. Arrancando ca n un vectoraleatorio inicial, ^80, las pnderaciones se van actualizando a medida que el errorproducido en la capa del output, tras cada lectura de un nuevo conjunto de datas,se propaga hacia atrs s.

    A pesar de su simplicidad y de la posibilidad de alcanzar un mnimo local, enlugar del gfobal, el algoritmo de retropropagacin ha demostrado en !a prcticaser altamente eficiente a la hora de determinar los valores de las ponderacionesque minimizan los errores. No obstante, para ia resoiucin de determinadosproblemas puede resultar lento, debido al elevado nmero de iteraciones que

    5 Existe la posibilidad de utilizar distintos tipos de funciones de error, siendo lo ms comn queen !as aplicacianes econmicas se opere con los errores cuadrticos.

    ^ Cmo sealan Kuan y 1/1/hite (1991), el algoritmo de retropropagacin es un caso particular delmtodo de aproximacin estocstica de Robbins y Monr {1951), !a diferencia reside en que en esteltimo el coeficiente de aprendizaje no permanece constante. En la primera referencia citada losautores se extienden sobre fas ventajas que ello implica en trminos de la convergencia del vectorde ponderaciones.

  • , ^ .,

    I'f^^^E [71^,^;E(1P^J MU! 1^^i^,'Af2^t"^f^^TE ^ ^J',^_al ^^!i'E ^^1i^_;{;^; .3^)1

    debe realizar, por lo que se han desarrollado otros algoritmos ms rpidos queno vamos a considerar aqu ^.

    Red neuronal para la prediccin de la tasa de actividad de la mujer en Andalucia

    En nuestro trabajo precedente, Otero y Trujillo (1991), diseamos una redneuronal para obtener predicciones a un trimestre de la tasa de actividad feme-nina en Andaluca, TAMt. Esa red podra utilizarse para realizar predicciones conhorizonte superior a un trimestre si para ello se retroalimenta, perodo a perodo,con las predicciones de los perodos anteriores, que entraran en la capa del inputcomo si fuesen valores observados. Este planteamiento presenta el inconvenien-te de que no se tratan adecuadamente los errores de prediccin. Su ventaja esque minimiza el nmero de elementos de proceso y, por tanto, que evita almximo los posibles problemas de sobreajuste que pueden presentar las redescuando su topologa es demasiado compleja en relacin al tarnao de la muestradisponible.

    En el presente artculo hemos preferido disear y ensayar una red especficams compleja para obtener predicciones multiperodo (cuatro trimestres), aun ariesgo de que su propia complejidad induzca problemas de sobreajuste. Aunqueexisten reglas empricas para detectar situaciones de este tipo, hemos preferidoignorarlas y esperar que, si hay sobreajuste, sus efectos repercutan en la calidadde las predicciones extramuestrales.

    Con estas premisas hemos realizado algunos ensayos para determinar latopologa ptima de nuestra red neuronal, esto es, establecer el nmero deelementos y capas, as como el tipo de funcin de transferencia en cada capa.La arquitectura de la red finalmente elegida para el presente estudio es relativa-mente simple, a pesar de lo cual consta de 35 elementos de proceso dispuestosen tres capas, vase la figura 3. Camo funcin de error hemos elegido el errorcuadrtico y como funciones de transferencia la sigmoide en la capa intermediay la senoidal en la de salida, habindose utilizado el algoritmo de retropropaga-cin durante el aprendizaje.

    La capa de entrada (input) est formada por 19 elementos que se puedenagrupar en cuatro clases segn el tipo de informacin que suministran. As, loselementos 2 al 5 corresponden a los valores retardados de TAMt entre uno ycuatro trimestres; los elementos 6 al 13 corresponden a los valores corrientesy retardados de la variable TOCU; los elementos 14 y 15 corresponden a sendasvariables binarias (- 1,1) que obedecen a carnbios metodolgicos en la EPA;finalmente los elementos 16 al 19 corresponden a cuatro variables binarias

    ' Vanse, por ejemplo, Kuan y White (1991) y Groot y Wi^rtz (1991 }.

  • k^-, I^^1 )^,', ^ If^,A E`^,f'AP^^^: ^; t^

    estacionaies que codifican el trimestre t-simo (t i 1, 2, 3, 4). EI programautiliZado 8 introduce automticamente un elemento corrector del sesgo (denomi-nado bias en la fgura 3) que siempre toma el valor 1 y que sera anlogo a lacanstante de una funcin linea! ^.

    FIGURA 3Red Neuronal para la prediccin de 1a Tasa de Actividad Femenina

    OU T F'U T

    ^ -a r.-^ L-2 t`.1^ ^t-a t-3^:'^. ^__ _ _ _._

    iAM

    L-^ t-1 t t+1 t+^___t+3^ ^84 w87 t^.._ _...._.v _ _ ___

    TUCl1

    INTE--RMEDIA

    r-.__ .__T

    \ ^Fi^t_ F^^taci.^nales

    ^^os elementos de la capa de entrada aparecen numerados desde el 2 al 19

    en la figura 3 y, por ias razones que se explcan ms adelante, se conectanparcialmente a algunos de los elementos de la capa intermedia en la formasguiente: el elemento corrector dei sesgo se conecta a todos fos de la capaintermedia, ios eiementos 2 al 10 y 14 a! 19 se conectan con !os elementos 20,21 y 22 de la capa intermedia; los elementos 3 al 5 y 7 al 11 se conectan con el23, e! 24 y el 25; los elementos 4, 5 y 8 al 12 se conectan con el 26, el 27 y el28; finalmente, los elementos 5 y 9 al 13 se conectan con el 29, el 30 y el 31.

    ^ NEURAL WORKS PROFESSIONAL II PLUS AND NEURAL WORKS EXPLORER de Neural-Ware, Inc. 1987-1991.

    9 Inicialmente la red inclua en ia capa de inputs elementos de tendencia, esto es, valores retardadosde TAM, ocho, doce, diecisis y veinte trimestres. Sin embarga, dado que no mejoraban 1os resuitadosque se obtienen con una configuracin ms simple, optamos por la topologa ms escueta.

  • F'RF DIC;c,IC.)N Ml_ll_ TI'vAf-tIAN1E ` M^11 TIE^F F^^c.i[^^ a 35^

    La capa intermedia consta de 12 elementos que, en grupos de tres, se conec-tan a los de la capa de salida (output). Esto es, los elementos 2Q, 21 y 22 seconectan al 32 y as sucesivamente, como puede verse en la figura 3.

    La capa de salida (output) est formada por cuatra elementos que, una vezentrenada la red, proporcionarn las predicciones correspondientes a cuatrotrimestres consecutivos. Son, por tanto, predicciones condicionadas en cadacaso a los valores de entrada. As pues, durante la fase de aprendizaje seproporciona a la red los valores de TAMt k { k= 0,1,2, 3) como output deseado,durante la fase de prueba la red genera las predicciones carrespondientes. Estoselementos, numerados desde e! 32 a! 35, se conectan entre s de izquierda aderecha, esto es, TAMt+, con TAMt+j (i = 0,1,2; j= 1,2,3; j>i). De manera que elvalor predicho de TAMt se utiliza para predecir TAM^+j (j = 1,2,3) y as sucesiva-mente.

    Justamente por tratarse de una prediccin multiperodo la conexin de loselementos de la capa de entrada a los de la capa intermedia y de stos a los dela capa de salida, no es completa sino parcial. EI elemento 32 (TAMt) se conectaa tres elementos de la capa intermedia que, a su vez, se conectan a los elemen-tos de la capa de entrada que suministran informacin retardada de TAM (desdeTAMt^. a TAMt_^) e informacin de !os valores corriente y retardados de TOCU(desde TOCUt a TOCUt^), as como a los elementos que corresponden a lasseis variables binarias consideradas. Para el resto de los elementos que integranla capa de salida !as conexiones siguen un esquema similar, si bien recibenmenos informacin de la capa de entrada, a travs de la capa ntermedia, en lamedida en que la reciben de otros elementos de la misma capa de salida 'oTampoco reciben informacin de las variables binarias.

    Despus de inicializar las ponderaciones, hacindolas iguales a nmeras alea-torios dentro de un intervalo pequeo, el proceso de aprendizaje se ha Ilevado acabo mediante el algoritmo de retropropagacin. EI conjunto de datos de apren-dizaje se extiende desde el tercer trimestre de 1976 hasta el cuarto de 1989, entotal 50 vectores de datos de entrada ^^. Los casos disponibles en la muestra sehan ledo aleatoriamente 30 veces a fin de conseguir la convergencia de lasponderaciones. Una vez terminado e! aprendizaje se ha suministrado a la red, atravs de la capa de entrada, la informacin relativa a los perodos de prediccin:1990.1-1990.4, 1990.2-1991.1, 1990.3-1991.2 y 1990.4-1991.3. A partir de dichosvalores y de las ponderaciones calculadas en la fase de aprendizaje la red

    'o As, por ejemplo, el elemento 33 (TAMt+, } slo recibe informacin a travs de la capa interme-dia, de los elementos de la capa de entrada correspondientes a los valores de TAMt _, a T^M,_^, dadoque recibe informacin directamente del elemento 32 (TAM,). Anlogamente sucede con los elemen-tos 34 ( TAMt+2j y 35 ( TAM,+3). Todos los elementos de la capa de salda reciben informacin, va lacapa intermedia, del valor contemporneo y de cuatro retardos de TOCU.

    " Ntese que debido a los retardos, el primer output que se suministra a la red corresponde altercer trimestre de 1977.

  • 36U

    proporciana los valores predichos de TAM para esos perodos. Los resultadosfiguran en las tablas 1 a 3.

    2.4. Model estructural de series temporales

    Un modelo estructural de series tempora^es puede recoger de forma explcitafa posible naturaleza estcstica de las componentes estructurales de !a serie,permitiendo una modelizacin rns flexible que la de los otros modelos de seriestemparales. Especificamos, por tanto, un modelo estructural de series temporalesque explica el comportamiento de TAM en funcin de unas componentes esta-csticas {tendencia y estacionalidad}, una variable explicativa, TOCU, y dosvarables de intervencin, que son las variables ficticias W84 y W87, ya utilizadasen los modelos anteriores para tener en cuenta cambios en la metodologa de laE PA.

    E! modelo formulado es como sigue:

    Yt = t + Yt + a^ YtW^ +^it TOCUt + b^ W84t + b2 W$7t + ut

    en donde:

    Y't =-In [TAM t1 - 1]{cambio de variable para representar una tendencia logsticaen una proporcin); ^yt es una componente estacional y t es una companente detendencia estocstica tal que

    F^^r^^^t^ai^;^ ^^^,^ F^ s^^^^^r^t^at_ a

    (9)

    t ^ t--1 + ^t-1 + V1t

    ^t = Rt-^ + vzt^ t - ..., -1,fJ,1,... (10)

    donde v^ t.^ NI (o, c^v^), v2 t^ NI ({^, csv2) y ambas son mutuamente indepen-dientes.

    La componente estacional estocstica representada es de tipa trigonomtrcoy se basa en 1a siguiente representacn determinista vase Hannan, Terrell yTuckweli { 197Q):

    [LI2]yt = ^ (y^ cos ^,^ t + y^ sen ^,^ t}; ^ = 2^cj/L; j = 1, . . ., [L/2] (11)

    ^=^

    en donde L es e1 nmero de observacones por ao y^,^ las frecuencias estacio-naies. Cuando L es par ei trmino del seno desaparece para j= Ll2 y, as, elnmero de parmetros, ^^ ^/ ^^ es siempre L-1, el mismo que en la formulacn

  • f'F^E^..I)I(;C;IC^N MIJI_^^t^^IVAF;IANTE^ Y MUC ^TIPE^:^.RIC)f^)C^ 361

    que utiliza variables ficticias. Podemos representar una componente estacionaltrigonomtrica estocstica, yt, mediante

    ^u2^Y^ = ^ Yj t

    j == 1

    junto al sistema

    Y*t ^yj t

    (12)

    + ^^ t ; ^ ` 1, . . . L/2 . 13^2 t ^ ' ^ j ( }

    r

    cos ^,j sen ^,j yj, t_^--sen ^,j cos ^,j y* t_1

    donde ^1 t-^ NI (0, a^^), ^2 t^. NI (0, 6?2) y ambas son mutuamente indepen^dientes.

    Con esta especificacin el modelo se ha estimado utilizando el programaSTAMP 12. EI resultado de las estimaciones, junto a diversos test de diagnsticoy estadsticos de la bondad de ajuste, aparecen resumidos en el Anexo 2. EIaspecto ms importante a destacar es que la variabie Yt_1 no ha resuftado sersignificativa, por lo que ei modelo ha perdido el carcter dinmico. En cambio lascomponentes estructurales de TAM han dejado de ser deterministas, a diferenciade los otros modelos de series temporales aplicados, lo que ha significado unaumento neto de parmetros a estimar. Las predicciones para los perodos yasealados figuran en las tablas 1 a 3.

    3. RESULTADOS Y CONCLUSI(^NES

    En la tabla 1 figuran los valores observados de la tasa de actividad femeninaen Andaluca (TAM) junto a los predichos con cada uno de los modelos utilizados,que designamos por MBJ (modelo ARIMA), MCE {modelo de carreccin por elerror), RNA (red neuronal artificial) y MEST (modelo estructural de series tempo-rales). En las tablas 2 y 3 se recogen la raz del error cuadrtico medio deprediccin y el error absoluto medio de prediccin, respectivamente, de cada unode los modelos en cada perodo.

    Segn las predicciones obtenidas y los resultados que figuran en las tablascitadas, cabe concluir que el modelo estructural de series temporales (MEST) esel que, por trmino medio, proporciona las predicciones ms acertadas para elconjunto de los cuatro perodos de prediccin considerados. En segundo fugaraparece la red neuronal artificial (RNA) que supera en precisin, por trminomedio, a los otros dos modelos utilizados y cuyos resultados son similares a losdel MEST. EI modelo de correccin por el error (MCE) presenta un sesgo de

    tz STAMP. ESRC Centre in Economic Computing. London School of Economics {versin 2, 1988).

  • ^362 ^ ^,1,^ ^:^ ^ ^^ r ^ ^: n ^^ :^, F^A r^^ ^._> i a

    prediccin pasitivo casi sistemtico, pues nicamente la prediccin correspon-diente a 1990.2 en el segundo periodo considerado es inferior al valor abservado.EI modela de funcin de transferencia (MBJ) es el que, por trmino medio, arrojalos peores resultados para el conjunto de los cuatro peradas de prediccinconsiderados.

    TABLA 1Predicciones de la tasa de actividad femenina (TAM)

    Trimestre TAM MBJ MCE RNA MEST

    1990.1 0.29786 0.29861 0.30702 0.29170 0.300191990.2 0.29309 0.29872 0.29780 0.29500 0.293071990.3 0.28785 0.30257 0.30248 0.29676 0.295801990.4 0.29550 0.30806 0.30668 0.29775 0.29711^ 990.2 0.29309 0.29288 0.29128 0.28857 0.294801990.3 0.28785 0.29175 0.29733 0.29514 0.294321990.4 0.29550 0.29358 0.30239 0.29840 0.297301991.1 0.30413 0.29845 0.31498 0.30039 0.304051990.3 0.28785 0.28919 0.29808 0.28899 0.294381990.4 0.29550 0.29307 0.30247 0.29572 0.296341991.1 0.30413 0.29794 0.31464 0.29918 0.303841991.2 0.29808 0.29922 0.30674 0.29936 0.302631990.4 0.29550 0.29638 0.29563 0.28954 0.292641991.1 0.30413 0.28504 0.30970 0.29561 0.300781991.2 0.29808 0.28698 0.30285 0.29786 0.300501991.3 0.29609 0.27321 0.29715 0.29357 0.29000

    Dadas las exiguas diferencias observadas entre los resultados de ios distintosprocedimientos, sobre todo de los dos que f'rguran a la cabeza, hemos tratadode verificar si son significativas. Para ello hemos aplicado, en primer lugar, el testpropuesto por Granger (1980, pg. 157) para determinar si hay diferenciassignificativas entre la raz del error cuadrtico medio del con unto de diecisispredicciones de MBJ, 2NA y MEST 13. La conclusin es que s hay diferenciasentre MBJ y Ivs otros dos modelos y que no las hay entre RNA y MEST 14.

    13 Para el conjunto de los diecisis errores de prediccin de cada uno de los modelos se admitela hiptesis de normalidad. En cambio la hiptesis de media nula se rechaza en e! caso de MCEcomo consecuencia det sesgo sistemtico de prediccin observado, por lo que ha sido eliminado deltest.

    14 Dicho resultado debe ser considerado simplemente como indicatva, debido a que el tamaode las series de errores es muy reducido y a que se estn combinando errores de prediccionesreferidas a horizontes temporales y perodos distinios.

  • F'^E[^)If^,^_;ION MIJI_^TIVARIAP^^JTE Y MUl T^F'E F^^^ )f^i?

    TA B LA 2Raiz dei error cuadrtico medio de predicc^n

    ;36 3

    Perodo MBJ MCE RNA MEST

    90.1-90.4 0.010087 0 010552 0.005615 0.00422190.2-91.1 0.003578 0.008039 0.004902 0.00346790.3-91.2 0.003438 0.009205 0,002619 0.00400690.4-91.3 0.015905 0.003705 0.005350 0.00394890.1-91.3 0.009738

    (3.3) *0.008283

    (2.8) *0.004771

    (1.6) *0.003920

    (1.3) *

    (*) Porcentaje respecto al valor medio de TAM en el perodo.

    TA B LA 3Error absoluto medio de prediccin

    Perodo MBJ MCE RNA MEST

    90.1-90.4 0.008418 0.009922 0.004807 0.00297990.2-91.1 0.002927 0.007260 0.004616 0.00251690.3-91.2 0.002774 0.009096 0.001898 0.00305590.4-91.3 0.013489 0.002885 0.004306 0.00368090.1-91.3 0.006902

    (2.3} *0.007291

    (2.5) *0. 003907

    (1.3) *0.00305$

    (1.0) *

    (*) Porcentaje respecto al va(or medio de TAIVI en e perodo.

    Adicianalmente hemos aplicado un test de abarcamiento en prediccinChong y Hendry (1986) para verificar si existen diferencias significativas

    entre el modelo estructural de series temporales (MEST) y el modelo de carrec-cin por el error (MCE), el resultado no ha sido concluyente. La aplicacin deotros criterias de seleccin de modelos, tales como el AIC de Akaike, el SBlC deSchwartz y el HQ de Hannan y Quin, permiten detectar pequeas diferenciasentre MCE y MEST a favor de este ltimo. Estos criterios no se han aplicado ala red neuronal, dado que las expresiones correspondientes deberan revisarsepara esta aplicacin y la forma en que se ha sugerido su uso en la literatura ^5no es apiicable en nuestro caso por una aparente saturacin de parmetros

    15 Groot, C. de y D. Wiartz (1991) y Kuan, C.-M. y H. White (1991).

  • . 3F^ z^ i^ . . 1 a:a ; ^^ ^ ^1 r. ^ _ ^ ^ ^ ^^ti t ^^ ! .^ ; r^

    debido al relativamente reducido tamao de nuestra muestra. Tal saturacin noparece afectar, sin embargo, a la capacdad predictiva de la red.

    La mayor bondad predictiva mostrada aparentemente por el modelo estructuralde series temporales puede venir explicada por su natural capacidad para captarcambios aleatorios suaves (es decir, sin punto de ruptura} en 1os parmetrosrelativos a las componentes estructurales (tendencia y variaciones estacionales)de la serie rriodelizada. A este respecto cabe sealar que, mediante el adecuadodiseo de los ficheros de datos de aprendizaje, tambin sera posible mejorar iacapacidad autoadaptativa de la red neuronal. Para ella habra que dar prioridaden el aprendizaje final a 1a informacin ms reciente, con objeto de paliar losefectos sabre las predcciones de cambios como los sealados. Este tipo deexperimento consume mucho tiempo y ha sido pospuesto para ulteriores inves-tigaciones.

    Catra cuestin que deber ser considerada en futuros trabajos es la relativaa los procedimientos de seleccin y simplificacin de la arquitectura de la red,con objeta de especificar redes ms escuetas, especialmente en casos comoel nuestro en que el reducido tamao muestral conlleva el riesgo de sobre-ajuste.

    En resumen, la red neuronal compite sin desventaja significativa con elmejor de los modelos estadsticos considerados en la tarea de generar pre-dicciones multiperodo de la tasa de actividad femenina en Andaluca. Esteresultado confirma y arnpla las conclusiones de otro trabajo previa, Otero yTrujillo (1991}, relativo a las predicciones uniperodo carrespondientes a lamisma variable.

    EI resultado anterior est condicionado a la arquitectura de la red utilizada que,en principia, es susceptible de mejora y simplificacin. Por otra parte, el alcancede las conclusiones queda limitado al problema concreto aqu tratado. No obs-tante, los resultados de este trabajo son estimulantes y la experiencia acumuladanos induce a pensar que en el futuro prximo se podrn superar mejorando latopologa de la red, lo que constituye un aliciente para continuar investigandosobre las posibilidades y limitaciones de las redes neuronales como modelos deprediccin de seres temporales econmicas.

    ANEXO 1. RESULTADOS RELATiVOS AL MODELO DE CORRECCION POREL ERRaR

    En primer lugar vamos a hallar el orden de integracin de la tasa de actividadfemenina en Andaluca (TAM}. Se dispone de datos trimestrales desde 1976,

  • ^^^^:E i^^^^.^^.,^,r^^ ^s^^^ ^^^,^^nfl^^ar^;TF ^^^ ^^^^;^ ^^;^ : ^^,,;^;:^ ^3F^`>

    trim. 3 a 1991, trim. 3 ^^. Se va a realizar la misma operacin con la tasa deocupacin (TOCU).

    ^os resultados del cuadro A.1 muestran que ambas series san integradas deprimer orden pues cuando se analizan 4TAM y oTCU se rechaza en todos loscasos la hiptesis de existencia de una raz unitaria. En cambio, cuando seanalizan TAM y TOCU dicha hiptesis no se rechaza.

    C UAD RO A.1.Ordenes de integracin de TAM y de TOCU

    REGRESION (1) DF Y DFA (2} VALOR CRITICO (3) Hn (4)

    ^1TAM,C --9,28 -2,91 RnTAM,T --9,65 -3,48 R

    ^STAM,T,A -7,5 --3,48 RTAM,N - 1,17 --1,94 NRTAM,C -0,22 -2,91 NRTAM,T -2,06 ---3,48 NR

    TAM,T,A -1,8 -3,49 NR

    ATOCU,T -9,8 --3,48 RATOCU,T,A -6,4 -3,48 R

    TOCU, N -^ ,4 -1,94 NRTOCU,C -2,2 -2,91 NRTOCU,T -1,2 -3,48 NR

    Notas:(1) Figura en primer lugar la variable y a continuacin:

    N =- Sin trmino independiente;C-- Con trmino independiente ( sin tendenciaT -_= Con tendencia;A = Ampliado con retardos.

    (2) Estadistico de Dickey-Fuller o, en su caso, de Dickey-Fuller ampliado.(3) Vaiores crticos del estadistico D. F. al 5%".(4) Hiptesis Ho de que existe una raiz unitaria;

    R = se rechaza.NR = no se rechaza.

    A continuacin varnos a camprobar que ambas series son estacionarias a lasfrecuencias estacionales. Para ello hay que verificar la posible existencia deraces unitarias estacionales en cada una de las dos series TAM y TOCU, lo queharemos mediante el procedimiento de Hylleberg, Engle, Granger y Yoo (1990).A tai fin se Ilevan a^cabo las regresiones complernentarias correspondientes, con

    '^ La posible existencia de integracin de tipo estacional de cada serie se investiga ms adelante." Valores proporcionados por el programa MicroTSP, Versin 7. D., por David M. Lilien, Quanti-

    tative Micro Software, lrvine, California. Este programa utiliza los vatores crticos de las tablaselaboradas por MacKinnon (1990).

  • 1^^')I`,11( A k `.^^E'^th^^"_)l f1

    datos trimestrales relativos al periodo 1976, trim. 3, 1991, trim. 3, cuyos resulta-dos aparecen resumidos en los cuadros A.2 y A.3, respectivamente, siendo:

    X^t = S(L}Xt =(1 + L+ L2 + L3) TAMX2t =-(1 - L+ L2 - L3) TAMtX3t = -(1 - L2) TAMtX4t = - L (1 - L2) TAM^

    y, anfogamente,

    U i t= S( L} Ut ={ 1+ L+ L2 + L3} TOC UtU2t =--(1 - L+ L^ - L3) TOCUtU3t = -(1 - L2) TOCU^U4t =- L(1 - L2) TOC U^

    CUADRO A.2.Regresin auxiliar para TAM

    Variable dependiente X=(1 - L4) TAMtPerodo muestral: 1979.3 - 1991.3Nrnera de abservaciones: 49

    VARIABLES COEFICIENTES RAZONES t

    Trrn. ndep. -0,0127711 -2,8194630Ficticia est. W2 0,0127299 6,4917551Ficticia est. W3 0,0077886 4,3559944Ficticia est. W4 0, 0108736 6,0541349

    X^ 0, 0060482 1,1702318X2 -0, 5985669 -9,0430744X3 -0,4810268 -7,3278174X4 0, 0962948 0,8590391

    X(-1 } 0, 5219706 5,6614517X(-3} 0, 2182959 2 , 6458008X(-4} -0,5407715 -7,4646468X(--5) 0, 3102246 4, 3709254X(-8} -0,1013794 --2,0903040

    R^ 0,953743Suma cuadrados residuos 0,000476Estad stico F 61, $5549Durbin-Watson 2, 758023Eliminanda X3 y X4Suma cuad. resid. regresin = 0,0^1188

  • F'+Zk [)It:(^.;I( )N MUL TIVAFZIAP^^a 1 E r^ MUL 1 iNE FlE( ^[^(_^

    C UAD RO A. 3.Regresin auxiliar para TOCU

    Variable dependiente U=(1 - L`^) TOCUtPerodo muestral: 1979.3 - 1991.3Nmero de observaciones: 49

    VARIABLE COEFICIENTE RAZC)NES t

    Trm. indep. -0,0073268 -0, 9268471Ficticia est. W2 0,0071553 4, 8871409Fictcia est. W3 0,0050030 3, 5042515Ficticia est. W4 0,0067326 4, 3925867

    U^ 0,0017671 0, 3076221U2 -0, 5515330 -10,005905U3 -0,5552736 -8,3129257U4 -0,0392232 -0, 3033948

    U(-1) 0,3883699 3, 3654019U(-3) 0,4236337 3,8038815u (-4> -0,6237850 -8, 6454109U (-5) 0,2128899 2, 5716292U(--7) 0,2219057 2, 7812624^(-8) -0,2165117 -3, 5076695

    R2Suma cuadrados residuosEstad stico FDurbin-Watson

    0,9636680,00036971,409632,864255

    3^r

    Eiiminando U3 y U^Suma cuad. resid. regresin T 0,001107

    En el caso de TAM, lo primero que destaca es ia presencia de una componenteestacional determinista dado que todos !os coeficientes de las variables ficticiasestacionales son significativamente diferentes de cero. En cuanto a la verificacinde races unitarias, hay que comparar las razones t que aparecen en el cuadroA.2, con los valores crticos proporcionados por las correspondientes tablas. Losresultados son como sigue:

    1. Dado que ^3^ (el coeficiente de X^ } no es significativamente negativo (siendosu valor positivo no hay ni que consultar la tabla) hay evidencia de una razunitaria a la frecuenca cero.

    2. Corno ^i2 es significativamente negativo al 5I y al 1%( pues -9,0 es menorque -3,04 y que -3,75, respectivamente, valores crticos que figuran en ia corres-pondiente tabla, en las columnas referidas at: ^2, y en la fila de tamaomuestral 48, que es el ms prximo al nuestro} no hay evidencia de una razunitaria a la frecuencia de dos ciclos por ao (estacionalidad semestral).

  • :i^i8 E ^^^^^C)^^,T^^^ ^ E ^^^^anr^(^^l ^

    3. Se rechaza la hiptesis ^33 =^i4 = 0(coeficientes de X3 e X4, respectiva-mente} pues

    F ! 0,001188 -- 0,000476)/2 = 26,9O,QQ0476/(49 - 13)

    valor que supera a las correspondientes valores crticos (al 5fo, 6,60, y al 1lo,9,22, valores que aparecen en la referda tabla, columnas correspondientes aF7>: ^3nn4}. Esto significa que no hay evidencia de races unitarias estacionalesa !a frecuencia anual.

    En el caso de TOCU los resultados son similares de acuerdo con e! cuadroA.3. Existe una componente estacional determinista y hay una raz unitar'ra afrecuencia cero. No existen races unitarias a las frecuencias estacionales.

    Esto justifica el uso de variables ficticias estacionales, dado que no existencomponentes estacionales estocsticas.

    EI siguiente paso consiste aplicar un test de cointegracin entre Y y TOCU,que son !as variables que se relacionan linealmente a largo plazo por sustitucinde (2) en ( 1). EI resultad^, a la vista del cuadro A.4, es que ambas variables sonCI(1,1).

    CUADRO A.4.Tests de caintegracin entre TAM y TOCU

    REGRESlON ESTATI CA i D. F.A. 2 VALOR ^CRITICO H

    Y, C, W84, W87, TOCU, W2, W3, W4Y, C, T, W84, W87 TQCU, W2, W3, W4

    -4,357-4,8fi6

    -4,084-4,595

    R

    R

    Notas:' Variables incluidas en la regresin de cointegracin

    C= constante; T= tendencia; W84 y W87 = variables ficticias para recoger cambios metodolgicosen la EPA; W2, W3, y W4 = variables ficticias estacionales.

    z Valor del estadstico correspondiente al test de DFA.(En este caso los retardos no han resultada ser significativos por lo que se trata del test de DF).

    3 EI valor crtico es el correspondiente a la tabla de Mackinnon al 1% 18.4 Hiptesis nula Ho: ut no es estacionario:

    R = se rechaza,NR = no se rechaza.

    'A Estos valores difieren de los proporcionados por e! programa Micro-TSP, versin 7.p, dado queen su clculo las variables W84, W87, W2, W3, y W4 no deben computarse coma regresores decointegracin, como hace automaticamente el programa.

  • ^'RED1(;C;IC^)N Ml_ll ^IfVAFtIANTE^^ Y Mlll 1 iF'Ff^1C)UC^^ 369

    Por ltimo, para la estimacin utilizaremos ei mtodo bietpico de Engie yGranger. En la primera etapa se obtiene la regresin esttica reflejada en elcuadro A.S.

    CUADRO A.5.Regresin esttica entre Y y TOCU

    Variable Dependiente: Y.Muestra: 1976.3 - 1991.3Nmero de observaciones: 61

    VARIABLE COEFICIENTE ESTADISTIC4 t

    C --2,2390139 -18,502642T 0,0058069 8, 0762922

    T+OC U 2,6862804 10,674031W 84 0,1384395 9,1748352W87 -0,2075212 -9, 9992142W2 -0, 047 9804 -4, 704847$W3 -0,0459493 -4,6106$87W4 -0,0306955 -3,0311884

    R2Error estndar de la reg.Estadstico F

    0,985940 Durbin-Watson 1,1442130,027282 Suma de cuadrados resid. 0,039448530,9225

    A continuacin se generan los residuos de esta regresin. Estos residuosretardados un perodo se designan par Zt. De Zt existen observaciones para elperodo 1976.4 a 1991.3.

    Segunda etapa. Hay que estimar el modelo de correccin por el error. Ennuestro caso, despus de probar el modelo (6), ha resultado significativo elmodelo de correccin por el error ms simple correspondiente a la formula-cin (4}, cuya estimacin figura en el Cuadro A.6.

    De acuerdo con los resultados de la estimacin el modelo parece adecuadopara describir los datos. Sin embargo, para afirmar este extremo es preciso antesIlevar a cabo diversos tests sobre los residuos. Si, adems, se pretende utilizarel modelo con fines predictivos conviene tambin aplicar algunos tests de esta-bilidad estructural.

  • 3I(1 ^^rF1t^i^-,ri^,^, E. ^^y^^r,r^r ^^ f,

    cuAORO a.s.Modelo de correccin por e1 error para Y y TOCU

    Variable Dependiente: o Y.Perodo muestral: 1976.4 -- 1991.3Nmero de observaciones: 60

    VARIABLE CEFIGIENTE ESTADISTIC t

    C 0,0077143 2,4740457n (TOCU) 2 , 9904195 5,6834709d {W84 ) 0,0782961 2,7659128d {W87) -0,1819300 -7,2113850

    z -0,4340028 --3, 3903502a (VV2) -0,0463764 -7, 54003180 (W3) -0,0454542 -6, 56562450 (W4) -0,03177$1 -5,1247470

    R2 0, 840468 Durbin-Watson 1,973795Error estndar, regresin 0,023256 Suma de cuadrad., resid. 0,(}28124Estad stico F 39,13627

    Tests de residuos. Para aplicar estos tests usamos el mismo software Mi-croTSP. En primer lugar, aplicamos el test de Breusch-Godfrey para verificar queno existe autocorrelacin en los residuos. Como los datos son trimestrales espe-cificamos que el nmero de retardos es 4. EI correspondiente vaior del estadsticodel multipiicador de Lagrange, ML = T^ R^, para !a regresin auxiliar es 0,64997.EI valor crtico de la ^2 con 4 grados de libertad al nivel de significacin de 0,05es 9,49. Por lo tanto, no se rechaza la hiptesis Ha. No hay, pues, evidencia deautacorrelacin de los residuos hasta cuarto arden.

    A continuacin aplicamas e! test ARCH especificando un solo retardo. EI valordel correspondiente estadistico ML = T^ R^ es 0,09295, que resulta inferior alcrtico, 3,84 {^2 can un grado de libertad y p= 0,05). No se rechaza, por tanto,HQ lo que significa que la evidencia es contraria a que la perturbacin de nuestramodelo presenta este tipo de heteroscedasticidad.

    Para verificar que la especificacin del modelo es, en general, correcta es decirque los errores de la ecuacin se comportan de forma regular, aplicar^os acontinuacin el test RESET de Ramsey ^9. Utilzando 5 potencias de Yt, elestadstico M^. correspondiente toma el valor 7,6848, que es inferior a 11,07, elvalor crtico de la x2 (5} al nivel de significacin p= 0, D5. Por lo tanto, de acuerdocon este test no hay evidencia de error de especificacin.

    '^ En este caso no hemos utilizadv el resultado que proporciona Mrcro TSP, cuya versin del #est,de acuerdo con lo expuesto en la pg. 15-17 del manual, difiere de la usual.

  • f'F2f (^^)li^^ ^IC)N MIJL TIVAF^IAf^^JTE Y h^^lil TE^'E F^tl(^![;^^^

    Tests de cambio estructural. No hay ninguna informacin a priori relativa a puntosde ruptura en el perodo muestral, excepto aquellos relacionados con cambiosmetodolgicos en la Encuesta de Poblacin Activa que ya vienen recogidos por iasdos variables ficticias W84 y W87. No existe, pues, ninguna hiptesis nula concretapara aplicar el test de Chow, ya que para eflo sera necesario sospechar de ante-mano de algn cambio estructural brusco en algn momento determinado.

    Por lo tanto, se han aplicado diversos tests grficos basados en Ios residuosrecursivos y, en el caso de que realmente existiera algn punto de ruptura debidoa causas no conocidas a priori, quedara IocaiiZado mediante alguno de loscorrespondientes grficos. No ha sido ste el caso.

    ANEXO 2. RESULTADOS RELATIVOS AL MODELO ESTRUCTURALDE SERIES TEMPORALES. (Programa STAMP)

    CUADRO A.7Estimaciones d^ los hiperparmetros

    Dependent variable is YSample period 76Q3 to 91 Q3Estimation by Scoring

    61 bservations

    Estimate Parameter Standard Error t-ratio

    .0002457 a2 (Level) .0001136 2.1639

    .0000017 az (Trend) .0000 Missing

    .0000069 6z (Seasonal} .0000 Missing

    .0000794 62 (Irregular) .0000771 1.0290

    CUADRO A.8.Estimaciones de los coeficientes de las variables de estado

    Sample period 76Q3 to 91 Q3 61 bservationsEstimate State RMSE t-ratio

    -1.9590 ^evel .2113 -9.2696.0065613 Trend .0047667 1.3765

    -.0147 Harmonic .0075903 --1.9374.004^288 Harmonic .0076091 .5820.0046772 Harmonic .0056160 .8328

    3.1291 TOCU , 5766 5.4267-.0786 W84 .0266 --2.9582-.0376 W87 .0234 --1.6089

  • C UAD RO A.9.Tests de diagnstico

    Residual skewness -.3578Residual kurtosis 2.7567Normality testsSkewness chi ^ 2(1 } _ 1.1949Kurtosis chi ^ 2(1) = .1382Normality chi ^ 2(2) _ 1. 3330Sum of squares of standardized residuals 52.7590Sum of squares about the mean 52.7587Mean of standardized residuals .0025230Heteroscedasticity test F (18,18) -_ 1.4913

    CUAQRO A.10.Tests de diagnstico. ^Continuacin)

    LAG 0 AUTOGORRELATIDN Q-STATISTIC

    1 * -.003321 .6513E-032 ** -.0$0635 .39173 ^* .095600 .95184 * -.020794 .97885 *** -.122676 1.9376 *,^ * -.126488 2.9777 *** .114349 3.8438 **,^ ^ -.190599 6.3029 * .044916 6.441

    10 * .021985 6.47511 ** -.084650 6.99212 ^^ -.074632 7.40313 *** .122290 8.53314 * -.015007 8.55015 *** -.139913 10.1016 **** .171131 12.4817 * -- .013892 12.5018 ** .064581 12.8519 ^** .118816 14.0920 *** .115816 15.3021 *** --.127698 16.8122 **** --.177804 19.83

    9 5 lo C . I . +-+ +++ 0 ^+ +_-+ _t_+ 2/SQRT(56) _ . 267261

  • ^^^f^f I i^^ ^ ^^ ^^ ^ M^^^ I ^^^^.^^^^^i^^,r^ j E M f. ^

    CUADRO A.11.Bondad de ajus#e

    Log-likelihood kernel 164.2504Prediction error variance, .fJ006715Prior and missing observations 8R2 = .9217RD2 = .7885RS2 = .5604Seasonality test 4.7821 Chi ^ 2(3}Seasonal effects from 91 Q3Q3 -.0100Q4 -.0002483Q1 .0194Q2 -.0091060

    BIBLIOGRAFIA

    CANU, S., SOBRAL, R. y LENGELLE, R. {1990). Formal Neural Network as anAdaptive Model for Water Demand. International Neural Netwark Cnference.Palais des Congres. Paris. July 9-13. Kluwer Academic Publishers, pgs.131-135.

    CHATFIELD, CH. (1993). Neural Ne#works: Forecasting Break-through or PassingFad?, lnternational Journal of Forecasting, 9, pgs. 1-3.

    CHONG , Y. Y. y D . HENDRY ( 198G} . Econometric Evaluation of Linear Macro-eco-nomic Models, Review of Economic Studies. LIII.

    DICKEY, D. A. y FULLER, W. A. (1981). Likelihood Ratio Statistics for Autoregres-sive Time Series with a Unit Root, Econometrica, vol. 49.

    ENGLE, R. F. y GRANGER, C. W. J. (1987). Cointegration and Error Correction:Representation, Estimation and Testing. Econometrica. Vol. 55. No. 2.

    GRANGER, C. W. J. (1980). Forecasting in Business and Economics. AcademicPress.

    GROOT, C. de y D. WIRTZ (1991). Forecasting Time Series with ConnectionistNets: Applications in Statistics, Signal Processing and Economics. Proc.Workshop on Industrial Applications of Neural Networks.

    HANNAN, E. J., TERRELL, R. D. y TucKwEL, N. (1970). The Seasonal Adjustment ofEconomic Time Series, International Economic Review, vol. 11.

  • i I'^> 1 I r,,^^, { ^^, F' ^^ r^^ i_^ L n,

    H^Ew, M. F. y G. W. GREErv (1992). E3eyond Statistics. A Forecasting System thaLearns, The Forum (IIF), 5(3), pgs. 1, 6.

    HYLLEBERG, S. R., ENGLE, R. F., .^.^RANGER, C. W. J. ^/ Y00, B. S . (1990} . Seasona!Integration and Cointegration, Journal of Econometrics, vol. 44.

    KuAN, C. M. y H. WHITE ( 1991). Artificial Neural Networks: An EconometricPerspective. UC San Diego Department of Economics Discussion Paper.

    LAPEDES, A. y FARBER, R. M. (1987}. Nonlinear signal processng using neuralnetworks; Prediction and System Modelling. Los Alamos National Lab Techni-cal Report. LA-UR-87-2261, July.

    LIPPMANN, R. P. (1987). An Introducton to Computng with Neural Nets. IEEEASSP Magazine, April pgs. 4-22.

    MACi'CINNON, J. G. {1990), Critical Values for Cointegration Tests, Mimeo,Queens Universty, Ontario.

    NovALES, A. y MATEOS, B. (1989) . Empleo, Capital Humano y Participacin Feme-nina en Espaa. FEDEA. Madrid.

    QTERO, J. M. {1990). Empleo y paro en Andalucia: Perspectivas a medio plazo.En Diez aos de Economa en la Comunidad Autnoma Andaluza. InformeEconmico-Financiero de Andaluca. 1989. ESECA. Caja General de Ahorrosy Monte de Piedad de Granada.

    OTERO, J. M. y TRUJILLO, F. {1991). Red Neurnal para la Prediccin de !a Tasade Actividad Femenna. Comunicacin presentada a 1a V Reunin ASEPELT-ESPAA. Gran Canaria, 20-21 de junio.

    oTERO, J. M., NiARTN, G., ^RUJlLLO, F. y FERNNDEZ, A. (1992). Papulation, LabourForce and Unempioyrnent in Andalusia: Prospects for 1993. InternationalJournal of Farecasting, 7, pgs. 483-492.

    RoBBlNS, H. y MoNRO, S. (1951). A Stochastic Approximation Method, Annalsof Mathematical Statstics, vol. 22, pgs. 400-407.

    RUMELHART, D. E., G. E. HINTON y R. J. UVILLIAMS {1986) . Learning Internal Repre -sentations by Error Propagation , en D . E. RUMELHART $c J. L. MCCLELLAND (EdS.),Parallel Distributed Processing: Explorations in the Microestructure of Cogni-tion. Vol. 1: Faundations MIT Press.

    SARDA, R. y PATlL, R. B. { 1987). Neural Networks as Forecasting Experts: anEmpirical Test. lEEE First International Conference on Neura/ Networks. SanDiego. California. June 21-24, pgs. I I-491, I I-494.

    SlMPSOM, P. K. (1990). Artificial Neural System. Pergamon Press. Inc.

  • PFZf_I)I(;(;IC)rv Mtll TIVAF2IANTE 'Y Mt1^ 11^'E^f^1^.^aU^^, 315

    SMO^ErvsKY, P. (1986). Neural and Conceptual Interpretation of PDP Models.En: Parallel Distributed Processing, vol. 2, J. L. McC^E^^AND y D. L. RuME^HARTy el PDP Research Group, Editors, MIT Press Cambridge, MA, pg. 397.

    SWArvsorv, N. R, y H. WHITE (1992}. A Model Selection Approach to Assessingthe Information in the Term Structure Usng Lnear Models and Artificial NeuralNetworks, UC San Diego Department of Economics, Research Group forEconometric Analysis, Discussion Paper.

    TREADWAY, A. B. (1989}. Anlisis Sectoriales de la Relacin Empleo-Producto:1964-1986 . E n: GARC A, M. F. et a l . Estudios Sobre Participacin Activa,Empleo y Paro en Espaa. FEDEA. Madrid.

    VARFIS, A. y VERs^NO, C. (1990). Univariate Economic Times Series Forecastingby Connectionist Methods. lnternational Neural Network Canference. Palaisdes Congres. Paris. July 9-13. Kluwer Academic Publishers, pgs. 342-345.

    WHITE, H.(1992}. Artificial Neural Networks. Ed . Blackwell .

    WfNDSOR, C. G. y HARKER, A. H. (1990). Multi-variate Financial Index Prediction.A Neura! Network Study . International Neural Network Conference. Palais desCOngres. Paris. July 9-13. Kluwer Academic Publishers, pgs. 357-360.

    A NEURAL NETWORK FOR A MULTIVARIATE AND MI^LTIPERIODFORECASTING OF AN ECONOMIC TIME SERIES

    SUMMARY

    This paper compares the forecasting performance of an artificial neural networkwith those correponding to an econometric model, a model of transfer functionARIMA and a structural model Of time series. The variable to be predicted is thefemale perticipation rate in Andalusia. In a11 cases this variable is to be dependenton the occupation rate, in order ta take into account the "encouraged-discouragedworker effect". One-year forecasts are obtained using quarterly data. A conclusionis that the best forecasts are those corresponding to the neural network and thestructural time series model, with no significative differences between them.

    Key words: Neural networks, ARIMA models, error correction rnodels, prediction,participation rate.

    Classification AMS: 90 A20, 62M 10.