ODELADO DEL ÍNDICE DE TIPO DE CAMBIO USANDO REDES ...importante (van Djck, 1999; Granger y Teräsvirta, 1993), de tal forma que la ... tir de los datos mismos, en aquellos casos donde

319Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006

MODELADO DEL ÍNDICE DE TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES ARTIFICIALES

MODELADO DEL ÍNDICE DE TIPO

DE CAMBIO REAL COLOMBIANO

USANDO REDES NEURONALES

ARTIFICIALES*

Juan David Velásquez Henao**

Lina María González Rivera***

* Artículo de investigación científica y tecnológica. Es producto de la investigación realizada por el grupo deFinanzas Computacionales en el modelado y la predicción de series temporales usando técnicas basadas eninteligencia artificial. Fue auspiciado por la Escuela de Sistemas, Facultad de Minas, Universidad Nacional deColombia. El artículo se recibió el 19-04-2005 y se aprobó el 05-12-2005.

** Candidato a doctor en Sistemas Energéticos, Universidad Nacional de Colombia. Magíster en Ingeniería deSistemas, Universidad Nacional de Colombia, 1997. Ingeniero civil, Universidad Nacional de Colombia, 1994.Profesor asociado de la Facultad de Minas, Universidad Nacional de Colombia, sede Medellín. Director delGrupo de Finanzas Computacionales, Facultad de Minas, Universidad Nacional de Colombia.Correo electrónico: [email protected]

*** Ingeniera de sistemas, Universidad Nacional de Colombia, 2006. Miembro del Grupo de Finanzas Computa-cionales, Facultad de Minas, Universidad Nacional de Colombia. Correo electrónico: [email protected]

320 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006

JUAN DAVID VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

RESUMEN

El modelaje y la predicción de las tasas decambio es un importante problema econó-mico. En el artículo se usa un modelo deredes neuronales artificiales para represen-tar la dinámica del índice del tipo de cambioreal colombiano, porque describe mejor ladinámica de la serie que un modelo linealautorregresivo, como lo muestra el resulta-do del contraste del radio de verosimilitud.El modelo fue aceptado después de aplicarleuna serie de pruebas estándar y de contras-tar sus resultados con los obtenidos usandoun modelo lineal autorregresivo. Los resul-tados indican que el valor actual de la seriedepende únicamente de su valor anterior.

Palabras clave: redes neuronales artificia-les, tasa de cambio, series de tiempo, mode-lado.

ABSTRACT

Modeling the Colombian Real ExchangeRate Index Using Artificial Neuronal Net-works

Modeling and forecasting exchange rates isa big economic headache. This paper usesan artificial neuronal network model to re-present the Colombian real exchange indexdynamics because it describes the seriesdynamics better than a self-regressive lin-ear model does, as may be appreciated inthe result of the verosimilitud radius con-trast. The model was accepted after apply-ing a series of standard tests and contrastingthe results against those obtained using aself-regressive linear model. The results in-dicated that the current value of a seriessolely depends on its previous value.

Key words: Artificial neuronal networks,exchange rate, time series, modeling.



Introducción

Durante las últimas décadas, la representa-ción de relaciones económicas no linealesha sido un problema de investigación muyimportante (van Djck, 1999; Granger yTeräsvirta, 1993), de tal forma que laeconometría empírica se ha nutrido de mu-chos modelos y técnicas, cuyos orígenesse encuentran en la estadística y la inteli-gencia artificial. Particularmente, el uso delas redes neuronales artificiales ha venidoganando terreno, debido a su capacidad pararepresentar relaciones desconocidas a par-tir de los datos mismos, en aquellos casosdonde la economía no brinda suficientes ele-mentos para establecer la forma funcionalde dicha relación. Más aún, se han dedica-do importantes esfuerzos para desarrollaraproximaciones metodológicas que permi-tan formular y formalizar esta clase de mo-delos a partir de criterios estadísticos y, así,abandonar los métodos ad hoc tradicionales–véase, por ejemplo, a Anders y Korn(1999), Fukumizu (2003), entre otros–.

Igualmente, ha resultado importante la apli-cación de estas metodologías en el modela-do y predicción de series económicas yfinancieras reales con el fin de ganar unamayor experiencia en su uso, ya que, talcomo lo señalan Granger y Teräsvirta(1993), no hay suficientes indicios que per-mitan determinar cuáles modelos podrían serlos más adecuados en la representaciónempírica de relaciones económicas.

Por otra parte, el modelado y la predicciónde las tasas de cambio han sido reconocidoscomo importantes problemas económicos, enespecial por la dificultad para realizar predic-

ciones tanto de corto como de largo plazo(Ince y Trafalis, 2006). En el modelado sepretende encontrar una descripción matemá-tica (modelo) de la dinámica que sigue unatasa de cambio particular, tal que se cumplanlos supuestos básicos en que se basa el mo-delo usado. Así, por ejemplo, los supuestosbásicos en que se fundamentan los modelosautorregresivos son los siguientes: (a) el va-lor actual de la serie se obtiene como unacombinación lineal de sus valores pasados;los residuales del modelo son (b) incorrela-cionados, (c) homocedásticos y (d) idénti-camente distribuidos (siguiendo unadistribución normal). El proceso de modela-do busca que el modelo finalmente obtenidocumpla con las condiciones estipuladas, detal forma que cualquier violación de ellas se-ría considerada una causal del rechazo delmodelo, lo que obligaría a reformularlo (eli-minando o adicionando valores rezagados dela serie, etc.) o a postular otro tipo de modelo(una red neuronal u otra técnica no lineal enmedia, o un modelo GARCH para losresiduales, etc.).

El modelo finalmente obtenido durante el pro-ceso de modelado es una teoría del funciona-miento de la dinámica de la serie estudiadaque permite esclarecer sus propiedades. El pro-ceso de formulación del modelo es, en sí mis-mo, un proceso de aprendizaje en que elmodelador, mediante un proceso de ensayo yerror, depura su conocimiento sobre la serieestudiada. En la predicción se pretende en-contrar aquel o aquellos modelos que permi-tan pronosticar con mayor precisión el valorfuturo de las tasas de cambio, uno o más pe-ríodos adelante. Este proceso es distinto aldel modelado, ya que en este último (el mode-lado) prima el cumplimiento de los supuestos



de la serie, mientras que en la predicción pri-ma la precisión de los pronósticos.

Los estudios recientes indican que la dificul-tad del modelado y la predicción de las tasasde cambio radica en que ellas siguen, en ge-neral, una dinámica inherentemente no lineal(Kilian y Taylor, 2003). No resulta sorpren-dente, entonces, que haya un número apre-ciable de aproximaciones metodológicasnovedosas a este problema –véase, por ejem-plo, a Ince y Trafalis (2006); De Gooijer, Rayy Krager (1998); Tseng, Tzeng, Yu y Yuan(2001); entre otros–, así como estudios ba-sados en la comparación entre diferentes cla-ses de modelos que buscan encontrar el mejorpredictor para cada tasa de cambio particu-lar –como trabajos recientes en este campose encuentran a Clements y Smith (2001), ElShazly y El Shazly (1999), Cao y Soofi(1999), entre otros–.

La modelación econométrica de las tasas no-minales de cambio del peso colombiano res-pecto al dólar americano es un tema querecientemente ha despertado el interés de losinvestigadores nacionales. Revéiz (2002) pre-senta un análisis descriptivo del comporta-miento de la tasa de cambio nominal diariaentre enero de 1994 y septiembre de 1999,que corresponde al período de vigencia de labanda cambiaria. Gómez (1999) desarrollaun modelo empírico en que relaciona las ta-sas de cambio real y nominal a partir la técni-ca de cointegración de Johansen. Patiño yAlonso (2005) analizan la capacidad de pre-dicción de la tasa de cambio nominal paraColombia en el período 1984:I-2004:I, usan-do los enfoques monetarios de precios rígi-dos y el modelo de Balassa-Samuelson, encontra de un modelo de paseo aleatorio. Milas

y Otero (2002) analizan las relaciones de lar-go plazo entre las tasas de cambio oficial yparalela bajo los regímenes de bandacambiaria y tasa de cambio flexible. Igual-mente, se han desarrollado estudios sobre latasa de cambio real para el caso colombiano,con el fin de explicar sus determinantes(Echavarría y Gaviria, 1992; Langebaek,1993; Calderón, 1995; Meisel, 1994).

Sin embargo, no se encontraron hallazgossobre la realización de estudios en el mode-lado del índice del tipo de cambio real(ITCR), aunque este es un importante indi-cador económico que permite comparar laevolución relativa de la tasa de cambio co-lombiana en relación con las monedas deuna canasta específica de países y las va-riaciones de los precios relativos. En esteartículo se contribuye en esa dirección, aldesarrollar un modelo univariado basado enredes neuronales artificiales del ITCR delpeso colombiano frente a 18 países miem-bros del Fondo Monetario Internacional(FMI)1 . Este reporte se encuentra organi-zado de la siguiente manera: la descripciónde la información utilizada y la metodologíade modelado son presentadas en la Sección1. El modelo obtenido, los resultados de laspruebas estadísticas de especificación y sudiscusión son presentados en la Sección 2.Finalmente, las principales conclusiones sonesbozadas en la Sección 3.

1 Este es un ejercicio de modelado y no de predic-ción, ya que se busca un modelo que pueda repre-sentar la dinámica de la serie estudiada y no elmodelo que permita pronosticarla con la mayorprecisión posible.



1. Datos y metodología

1.1 Información utilizada

1.1.1 Formación de la tasa de cambio

La tasa de cambio representativa del mer-cado (TRM) del peso colombiano respectoal dólar americano es el valor calculado ycertificado por la Superintendencia Finan-ciera (conocida anteriormente como la Su-perintendencia Bancaria), que correspondeal promedio ponderado de pesos colombia-nos pagados por cada dólar americano delas operaciones de compra y venta de dóla-res del día hábil inmediatamente anterior. Noincluye las operaciones de ventanilla y dederivados sobre divisas que llevan a cabolos establecimientos de crédito en las ciuda-des de Bogotá, Medellín, Cali y Barranqui-lla. La TRM para el día siguiente a un díaque es hábil en Colombia y festivo en Esta-dos Unidos es la misma TRM vigente el díafestivo. Es un indicador de las operacionesde compra y venta de dólares en el mercadocambiario, y sus fluctuaciones dependen dela relación entre la oferta y la demanda.

El mercado cambiario colombiano está com-puesto por un mercado regulado y por unmercado libre. El primero está conformadopor las transacciones que se realizan me-diante los intermediarios cambiarios autori-zados (como las entidades financieras);mientras que el mercado libre comprendelas demás transacciones de cambio entre eldólar y el peso colombiano realizadas por elpúblico en general.

Igualmente, el mercado cambiario está con-formado por los intermediarios y el público

en general. Los intermediarios comprendenlos establecimientos de crédito, las socieda-des comisionistas de bolsa y las casas decambio; entre tanto, el mercado libre estácompuesto por los compradores profesio-nales, que son agentes especializados, re-gistrados en las cámaras de comercio, y quenegocian con el público en general. El Esta-tuto Cambiario indica que las siguientes ope-raciones deben realizarse a través delmercado cambiario regulado:• Transacciones de dólares, derivadas de

las operaciones de exportación e impor-tación de bienes.

• Operaciones de endeudamiento exter-no, realizadas por los residentes del país,así como los costos financieros deriva-dos de éstas.

• Inversiones de capital del exterior en elpaís, así como los rendimientos asocia-dos con ellas.

• Inversiones de capital colombianas enel exterior. También incluye los rendi-mientos derivados de estas inversiones.

• Inversiones financieras en títulos emi-tidos y radicados en el exterior, asícomo los rendimientos asociados conellas.

• Avales y garantías en moneda extranjera.• Operaciones de derivados financieros,

como contratos forward y swaps de di-visas.

1.1.2 Efectos en la economía nacional

Adicionalmente a la importancia del cambiode divisas entre los agentes del mercado, laTRM es la base para la proyección de losingresos de los exportadores y los egresos



de los importadores, de tal forma que serealizan constantemente esfuerzos para pro-nosticar su evolución con la mayor preci-sión posible. Las tendencias marcadas haciala devaluación o revaluación del dólar ame-ricano afectan las ventas externas y hacenmenos o más competitivos los productosnacionales, vía precio, con los consiguien-tes efectos económicos.

De igual forma, aparte de que la TRM seusa como la base para el cálculo de la tasade interés efectiva de algunos activos, in-fluye directamente en el monto en pesos dela deuda del gobierno pactada en dólares yen la consiguiente estrategia gubernamentalpara su pago, pues la devaluación o reva-luación del peso en relación con el dólaramericano ejerce un efecto indirecto sobrelos índices de precios al productor y al con-sumidor. La TRM se considera uno de losindicadores de la situación económica ypolítica del país, ya que refleja indirectamentela confianza que tienen los inversionistas,tanto nacionales como extranjeros, en quese den condiciones favorables para la traídao permanencia de capitales.

1.1.3 Regulación histórica delmercado cambiario

La regulación del mercado cambiario Co-lombiano ha pasado por un proceso evoluti-vo: en el modelo anterior, la tasa de cambioera fijada por decreto una o dos veces porsemana (Milas y Otero, 2002); el modeloactual, vigente desde septiembre de 1999,está caracterizado por un régimen de flota-ción sucia. En este último, la tasa de cam-bio flota sobre una banda amplia sin ningúnsistema de piso o techo, y su valor es deter-

minado por la interacción de las fuerzas delmercado. No obstante, el Banco de la Re-pública se reserva el derecho de actuar so-bre el mercado cambiario para estabilizarlo,ya sea mediante la subasta de opciones tipoput y call, con los fines de acumular reser-vas o aumentar su liquidez, o mediante laintervención directa, cuando la TRM se en-cuentra cuatro puntos por encima o pordebajo de su promedio móvil de los últimosveinte días con el fin de disminuir suvolatilidad.

1.1.4 Información utilizada

Tal como lo indica el Banco de la República(2002), internacionalmente se prefiere el usode índices sobre la medición de la tasa decambio real, debido a las dificultades meto-dológicas y a los grandes costos que impli-ca su cálculo. La información utilizada enesta investigación corresponde al índice detipo de cambio real efectivo calculado porel FMI (ITCRFMI) para el peso colombia-no frente a 18 países de entre sus miem-bros, para el período comprendido entre1989:12 y 2003:10, el cual es publicado porel Banco de la República (Gráfico 1).

1.2 Metodología de modelado

1.2.1 El modelo de redes neuronales

Un perceptrón multicapa (MLP, por su siglaen inglés) es un modelo matemático que imitala estructura masivamente paralela de lasneuronas del cerebro, cuya representaciónse presenta en el Gráfico 2 –véase a Masters(1993 y 1995) para una revisión general–.Este modelo puede aproximar cualquier fun-ción continua definida en un dominio com-



pacto, con una precisión arbitraria previa-mente establecida (Hornik, Stinchcombe yWhite, 1989; Cybenko, 1989; Funahashi1989). En la práctica, los MLP se han ca-racterizado por ser muy tolerantes a infor-mación incompleta, inexacta o contaminadacon ruido (Masters, 1993), por lo que hansido usados en la modelación empírica deseries temporales no lineales. Zhang, Patuwoy Hu (1998) presentan una revisión generalsobre el estado del arte, mientras que apli-caciones específicas son presentadas porHeravi, Osborn y Birchenhall (2004);Swanson y White (1997a y 1997b);Faraway y Chatfield (1998); Darbellay ySlama (2000); Kuan y Liu (1995), entremuchos otros.

Gráfico 1Índice de tipo de cambio real efectivo (fuente FMI) calculado para el pesocolombiano frente a 18 países miembros del FMI entre 1989:12 y 2003:10

Fuente: Banco de la República.

El MLP presentado en el Gráfico 2 se definematemáticamente como:

(1)

Los parámetros Ω = [β*, βh, α*,h, αp,h],

h =1…H, p = 1…P son estimados usando elprincipio de máxima verosimilitud de losresiduales. La ecuación definida por (1) equi-vale a un modelo estadístico no paramétricode regresión no lineal (Sarle, 1994). En (1)se asume que ε

t sigue una distribución nor-

mal con media cero y varianza desconocidaσ2. H representa el número de neuronas enla capa oculta. P es el número de rezagos dela variable dependiente. Y g(·) es la función

t

H

h

P

p

pthph

y

ht ygy εαασ

ββ +

+⋅+= ∑ ∑

= =−−

1 1

,*,1*2

1



de activación de las neuronas de la capaoculta. En el contexto de las series tempo-rales, el modelo puede ser entendido comouna combinación lineal ponderada de latransformación no lineal de varios mode-los autorregresivos.

El problema de identificación o estimaciónde parámetros está relacionado con la mul-tiplicidad de puntos de mínima local de lafunción de error usada para la estimaciónde los parámetros, debido a que:• El modelo puede estar mal condiciona-

do, lo cual es síntoma de que las dife-rencias entre las magnitudes de losparámetros Ω son muy grandes. Ellopuede causar que las neuronas en la capaoculta estén en su nivel de saturación (di-ferentes entradas netas producen la mis-ma salida), y consecuentemente que elgradiente de la función de verosimilitud

sea cercano a cero, por lo que la optimi-zación numérica se hace ineficiente.

• Se pueden obtener modelos diferentescon el mismo error al permutar las neu-ronas de la capa oculta sin variar los va-lores de los parámetros, lo que equivalea intercambiar algunos de los elementosde Ω.

• Se pueden obtener modelos diferentescon el mismo error, cambiando de sig-no los parámetros asociados con las co-nexiones que entran y salen de la mismaneurona oculta, ya que para funcionesde activación que cumplen con g(u) =sgn(u)|u|, el cambio de signos no alterael resultado del MLP.

• El modelo no es globalmente identifica-ble, si la salida de una neurona oculta oel parámetro asociado con la conexiónentre ella y la neurona de salida son cero,

Gráfico 2Modelo de redes neuronales

Fuente: elaboración propia.



ya que algunos de los parámetros res-tantes podrían tomar cualquier valor.

El efecto nocivo de estas características delMLP puede ser mitigado al modificar la fun-ción de activación de las neuronas ocultas yal imponer algunas restricciones a los pará-metros del modelo:• Tal como es indicado por LeCun, Bottou,

Orr y Muller (1998), algunos autores hansugerido, por su experiencia práctica, quelas funciones tipo sigmoidea simétricasalrededor del origen, convergen más rá-pidamente que la función sigmoidea tra-dicional. Adicionalmente, la incorporaciónde un término lineal puede ayudar a laconvergencia, ya que se evita la satura-ción de la neurona y garantiza un gra-diente mínimo cuando la salida neta de lafunción sigmoidea es cercana a sus va-lores extremos. Consecuentemente conlas razones expuestas, el modelo pro-puesto activa sus neuronas de la capaoculta usando la función:

(2)

• El conjunto de parámetros βh, h = 1,…,H

pueden restringirse a ser positivos, yaque si uno de ellos es negativo, su sig-no puede alterarse multiplicando los pa-rámetros de las conexiones que entrany salen de la correspondiente neuronapor menos uno; esto se debe a que (2)es simétrica alrededor del origen, por loque g(u) = -g(-u).

• El conjunto de parámetros βh, h = 1,…,H

se restringe a que sus componentesestén ordenados de forma creciente0 < β1 = β2 = … = β

H, para evitar que

se puedan obtener nuevas configuracio-nes permutando las neuronas de la capaoculta.

La división de la entrada neta a la neuronapor 2σ

y escala automáticamente las entra-

das al modelo, de tal forma que no es nece-sario realizar su preprocesamiento.

1.2.2 Selección del modelo

Por otra parte, el problema de selección delmodelo (determinación de las variables rele-vantes y número de neuronas de la capa ocul-ta) puede resolverse de una forma másadecuada a partir de pruebas de hipótesis, talcomo es sugerido por Anders y Korn (1999).En este sentido, los contrastes de Wald, elmultiplicador de Lagrange y el radio de vero-similitud aplican, ya que los parámetros tie-nen una distribución asintóticamente normal,siempre y cuando en su estimación se use elprincipio de máxima verosimilitud y el mo-delo no tenga neuronas ocultas redundantes.

Ello implica que en el proceso de selecciónse debe agregar una nueva neurona en lacapa oculta, a fin de contrastar si la ganan-cia de su adición es significativa. Es biensabido que estos resultados son válidos si elmodelo no tiene neuronas ocultas redundan-tes, tal como es discutido por Fukumizu(2003), así como también que los tres con-trastes anteriores son equivalentes asintóti-camente; no obstante, poco es sabido cuandola muestra de datos es pequeña; usualmen-te, la elección del contraste usado para cadacaso particular se realiza en función de lafacilidad de su cálculo, aunque los resulta-dos pueden ser significativamente diferen-tes para un mismo caso.

uu

uug 01.0

)exp(1

)exp(1)( +

−+−−=



En este sentido, Anders y Korn (1999), asícomo muchos otros, argumentan que el pro-ceso de selección del modelo debe ser reali-zado en forma constructiva: el primermodelo contiene una neurona en la capaoculta; el segundo, dos, y así sucesivamen-te. Por otra parte, en este estudio se consi-dera que la prueba basada en el radio deverosimilitud es más apropiada, ya que tie-ne en cuenta el desempeño real del modeloaumentado con la nueva neurona, y no unaaproximación, como ocurre en el contrastede multiplicadores de Lagrange. Consecuen-temente, la metodología propuesta para laespecificación del MLP es la siguiente:1. Los regresores iniciales son determina-

dos a partir de la especificación de unmodelo AR de orden p usando un crite-rio de información como el de Akaike,Hannan y Quinn o Schwartz.

2. Se estima con el modelo con H = 1.3. Se agrega una nueva neurona oculta y se

estima el modelo.4. Si la nueva neurona es aceptada usando

la prueba del radio de verosimilitud seregresa al paso 3; de lo contrario se con-tinúa con el paso 5.

5. Fin del algoritmo.

1.2.3 Evaluación del modelo

El modelo estimado se evalúa mediante laaplicación de dos grupos de pruebas paradeterminar sus bondades en la representa-ción de la dinámica de la serie estudiada.Un primer grupo de pruebas está orientadoa determinar si la secuencia de errores ε

t

siguen una distribución normal. Las prue-bas restantes se usan para determinar si los

residuales son incorrelacionados o presen-tan algún tipo de heterocedasticidad. Unaverificación final, obligatoria para cualquiermodelo no lineal, es determinar sus pro-piedades dinámicas. Si el modelo es diver-gente, debería ser rechazado y, luego,realizar una nueva especificación o un nue-vo proceso de estimación de sus paráme-tros. Las pruebas específicas llevadas acabo y sus resultados son descritos en lapróxima sección.

2. Resultados obtenidos y discusión

En esta sección se reportan los resultadosde aplicar el proceso de especificación delMLP descrito en la sección anterior alITCRFMI. La serie se encuentra disponibleen la página web del Banco de la Repúblicade Colombia. Sus principales propiedadesestadísticas son resumidas en el Gráfico3. La inspección visual de la serie y de suautocorrelograma señalan indicios de queel ITCRFMI esté integrado; no obstante,los contrastes KPSS (con un estadísticode 2,109, p-crítico < 1%) y de Dickey-Fuller (con un estadístico de -1,3828,p-crítico > 10%) indican que la serie esestacionaria.

Siguiendo el primer paso del proceso deespecificación, se estimaron modelos au-torregresivos AR(p) para p = 1,…,12, y secalcularon para cada uno de ellos los crite-rios de información de Akaike, Hannan yQuinn y Schwartz. Los resultados son pre-sentados en el Cuadro 1. Para complemen-tar los resultados obtenidos en esta primerafase, se aplicaron las pruebas de no lineali-dad de Tsay, Kennan, White y RESET acada uno de los modelos AR(p) estimados.



Gráfico 3Propiedades estadísticas del ITCRFMI

Fuente: Elaboración propia.

Las pruebas de White y Tsay indican quela serie es no lineal para todos los modelosestimados, usando un valor crítico del 5%.La prueba RESET indica no linealidad paralos modelos AR(p) con p = 1, 3, 4, 11 y12. La prueba de Kennan indica una evi-dencia moderada a favor de la no linealidadpara el modelo AR(1). Los tres criterios deinformación considerados indican que elmodelo óptimo es un AR(1), y para el cuallas cuatro pruebas confirman la no lineali-dad de la serie estudiada.

Como segundo paso del procedimiento seestimaron modelos MLP con H = 1 y 2. Elestadístico para el contraste del radio deverosimilitud para los dos modelos es 2,923(p = 0,404), por lo que se rechaza el mode-lo con H = 2. Los parámetros del modeloobtenido (H = 1) son reportados en el Cua-dro 2, junto con los criterios de informa-ción calculados. En dicho cuadro, AIC es elcriterio de información de Akaike; HQC, elcriterio de información de Hannan-Quinn, ySC, el criterio de información de Schwartz.



Cuadro 1Criterios de información calculados para un modelo autorregresivo de orden P

* Valor crítico al 5% pero no al 1%.** Valor crítico al 1%.Fuente: elaboración propia.

Cuadro 2Parámetros del modelo de redes neuronales

La predicción un mes adelante puede serobservada en el Gráfico 4.

En el Gráfico 5 se resumen las principalespropiedades estadísticas de los residuales: LMy JB son las pruebas de normalidad de Lin-Muldhokar y Jarque-Bera, respectivamente;BP y LB son las pruebas de correlación serialde Box-Pierce y Ljung-Box, respectivamen-te; ARCH es la prueba de heterocedasticidadde Engle (1982). Los residuales del modelo


son incorrelacionados y no siguen una distri-bución normal. La prueba ARCH indica lapresencia de heterocedasticidad en losresiduales, pero se piensa que esto es un efec-to, debido a que no se han incluido variablesexplicativas, más que una propiedad intrín-seca de la serie misma.

P AK HQ SC Kennan RESET Tsay White 1 5,5509 5,5707 5,5999 4,854* 7,556** 4,903* -0,050** 2 5,5601 5,5865 5,6254 2,551 2,895 20,150** -0,037** 3 5,5533 5,5863 5,6349 2,638 3,117* 13,140** -0,039** 4 5,5612 5,6008 5,6591 2,539 3,029* 8,951** -0,030** 5 5,5946 5,6408 5,7089 2,315 2,731 6,454** -0,024** 6 5,8258 5,8787 5,9564 2,296 2,757 5,156** -0,024** 7 5,7981 5,8575 5,9450 2,288 2,737 4,582** -0,022** 8 6,3978 6,4638 6,5610 2,292 2,739 3,948** -0,023** 9 6,0394 6,1121 6,2190 2,369 2,837 3,431** -0,028** 10 6,0659 6,1451 6,2617 2,343 2,939 3,154** -0,032** 11 6,5986 6,6845 6,8108 2,397 3,118* 2,847** -0,035** 12 7,4414 7,5338 7,6699 2,736 3,811* 2,449** -0,046**

Parámetro Valor Error estándar Estadístico T α1,1 1,12 0,07 15,83 α*,1 -121,25 95,61 -1,27 β1 53,00 7,99 6,63 β* 107,97 88,54 1,22

AIC = 5,508; HQC = 5,535; SC = 5,574.



Gráfico 4Predicción un mes adelante usando un perceptrón multicapa con H = 1

Gráfico 5Propiedades estadísticas de los residuales del modelo


LM = 4,374 (p = 0,00); JB = 13233,5 (p = 0,00); BP(5) = 3,283(p = 0,656); LB(5) = 3,357 (p = 0,645); ARCH(1) = 30,003(p = 0,0); ARCH(5) = 7,021 (p = 0,219).Fuente: elaboración propia.



En el Cuadro 3 se reportan varias medidas deajuste entre la serie y el modelo; particular-mente, el estadístico U de Theil muestra laganancia en la predicción un paso adelante enrelación con la predicción asumiendo la hipó-tesis de que la serie sigue un paseo aleatorio.

En el Gráfico 6 se puede apreciar el pro-nóstico determinístico del modelo. Final-

mente, en el Cuadro 4 se presentan algu-nas de las propiedades de la serie analizaday del modelo de redes neuronales, las cua-les fueron estimadas para una muestra de10.000 datos usando bootstrapping. Suanálisis indica que la distribución de pro-babilidades del modelo reproduce con al-guna precisión la distribución de los datosde la serie real.

Cuadro 3Estadísticos del ajuste del modelo a la serie

Gráfico 6Pronóstico determinístico



Estadístico MLP (H = 1) AR (1) Error cuadrático medio 13,890 14,500 Error medio absoluto 2,119 2,091 Raíz del error cuadrático geométrico 1,336 1,219 U-Theil 0,972 0,994 R2 0,938 0,937



Para contrastar las ventajas del MLP, unmodelo AR(1) fue estimado. Los estadísti-cos del ajuste a la muestra son presentadosen el Cuadro 3 y señalan cómo el MLP reco-ge de mejor forma la dinámica de la serie es-tudiada. Una prueba del radio de verosimilitudfue aplicada a los dos modelos considerandoque ellos son independientes. El estadísticoobtenido fue 1,066 con p = 0,012, el cualindica que los pronósticos de ambos mode-los son significativamente diferentes el unodel otro, lo que confirma la ventaja de lamodelación usando la red neuronal artificial.

La relación σno_lineal/σlineal = 0,978, dondeσno_lineal y σlineal representan la desviación es-tándar de los residuos de los modelos MLPy AR(1), respectivamente, da una idea de laganancia relativa del ajuste de ambos mode-los a los datos. Su valor cercano a la unidadindica que el modelo no lineal es necesariopara caracterizar algunos períodos donde ladinámica de la serie es más compleja.

A partir del análisis anterior puede concluir-se que la red neuronal obtenida es una re-presentación más adecuada de la dinámica

del ITCRFMI en relación con un modeloautorregresivo, ya que se ha demostrado quela serie es no lineal.

Conclusiones

Tanto el modelado como el pronóstico devariables económicas y financieras son im-portantes problemas que han recibido mu-cha atención tanto de profesionales comode investigadores durante las últimas déca-das; consecuentemente, se han dedicadomuchos esfuerzos para desarrollar metodo-logías que buscan superar las falencias ylimitantes teóricas, conceptuales y prácti-cas que se presentan cuando cada serie par-ticular es analizada a la luz de los modelostradicionales. En este mismo sentido, resul-ta importante analizar la capacidad de mo-delado y predicción desde cada modelo ycada serie disponible en particular, esto es,determinar para cada serie cuál o cuáles sonlos modelos que mejor representan sus ca-racterísticas, y para cada modelo, estable-cer cuáles son las características de las seriesque representa mejor.

Cuadro 4Momentos y valores máximo y mínimo para el ITCRFMI

y los modelos considerados

Nota: los valores para los modelos fueron calculados realizando una simulación de 10.000 datosusando bootstrapping.Fuente: elaboración propia.

Estadístico ITCRFMI MLP(H=1) AR(1) Máximo 144,210 154,830 186,580 Mínimo 79,390 41,900 33,210 Media 107,970 115,750 111,410 Varianza 230,700 254,430 389,620 Curtosis 0,153 -0,678 -0,028 Asimetría 2,428 2,431 3,217



En este estudio se realiza una primera con-tribución en esta dirección, ya que se anali-za la serie del ITCRFMI con una redneuronal del tipo perceptrón multicapa, cuyaespecificación y aceptación está basada encriterios estadísticos, y se compara con unmodelo autorregresivo que usa las mismasentradas. Los principales resultados obteni-dos están relacionados con los siguientesaspectos: se demuestra a partir de criteriosestadísticos que la serie sigue una dinámicano lineal; la red neuronal desarrollada cap-tura las relaciones determinísticas de ordenno lineal entre el valor actual de la ITCRFMIy el valor del mes anterior, de tal forma quelos residuales obtenidos son menores enmagnitud en relación con un modelo linealque usa los mismos regresores. Consecuen-temente, el modelo desarrollado es poten-cialmente un mejor predictor de la serie encomparación con un modelo lineal.

Existen otros modelos no lineales que po-drían ser usados para representar la dinámi-ca de la serie estudiada, de tal forma que enun trabajo futuro se hace necesario compa-rar dichos modelos para establecer cuál deellos representa mejor la dinámica delITCRFMI.

Agradecimientos

Los autores expresan sus agradecimientosa dos evaluadores anónimos, cuyos comen-tarios permitieron mejorar ampliamente lacalidad del artículo.

Lista de referencias

Anders, U. y Korn, O. (1999). Model selection inneural networks. Neural Networks, 12, 309-323.

Ayala, M. y Castillo, R. D. (2005). Un modelo depredicción para el valor TRM: un acercamientodesde las redes neuronales artificiales. Recupe-rado de: http://www.usergioarboleda. edu.co/observatorio_economico/Redes_ Neuronales/Sistemas_Inteligentes.htm

Banco de la República (2002). Reportes del Emisor(40).

Calderón, A. (1995). La tasa de cambio real en Co-lombia: mitos y realidades. Coyuntura Econó-mica, XXV (2), 101-111.

Cao, L. y Soofi, A. S. (1999). Nonlinear determinis-tic forecasting of daily dollar exchange rates.International Journal of Forecasting, 15, 421-430.

Clements, M. P. y Smith, J. (2001). Evaluating fore-casts from SETAR models of exchange rates.Journal of International Money and Finance,20, 133-148.

Cybenko, G. (1989). Approximation by superposi-tions of a sigmoidal function. Mathematics ofControl, Signals and Systems 2, 202-314.

El Shazly, M. y El Shazly, H. E. (1999). Forecast-ing currency prices using a genetically evolvedneural network architecture. International Re-view of Financial Analysis, 81, 67-82.

Darbellay, G. y Slama, M. (2000), Forecasting theshort-term demand for electricity: do neural net-works stand a better chance? International Jour-nal of Forecasting, 16, 71-83.

De Gooijer, J. G., Ray, B. K. y Krager, H. (1998).Forecasting exchange rates using TSMARS.Journal of International Money and Finance,17, 513-534.



Echavarría, J. J y Gaviria, A. (1992). Los determi-nantes de la tasa de cambio y la coyuntura ac-tual en Colombia. Coyuntura Económica, XXII,4, 101-111.

Engle, R. (1982). Autoregressive conditionalheterocedasticity with estimates of the varianceof United Kingdom inflations. Econometrica(50), 987-1007.

Faraway, J. y Chatfield, C. (1998). Time series fore-casting with neural networks: a comparativestudy using the airline data. Journal of AppliedStatistics (47), 231-250.

Fukumizu, K. (2003). Likelihood ratio of unidenti-fiable models and multilayer neural networks.Annals of Statistics, 31 (3), 833-851.

Funahashi, K. (1989). On the approximate realiza-tion of continuous mappings by neural networks.Neural Neworks, 2, 183-192.

Granger, C. y Teräsvirta, T. (1993). Modeling non-linear economic relationships. Oxford: OxfordUniversity Press.

Gómez, J. (1999). A model of the nominal and realexchange rates in Colombia. Serie Borradores deEconomía (129). Bogotá: Banco de la República.

Heravi, S., Osborn, D. y Birchenhall, C. (2004).Linear versus neural network forecasts foreuropean industrial production series. Interna-tional Journal of Forecasting (20), 435-446.

Hornik, K., Stinchcombe, M. y White, H. (1989).Multilayer feedforward networks are universalapproximators. Neural Networks, 2, 359-366.

Ince, H. y Trafalis, T. B. (2006). A hybrid model forexchange rate prediction. Decision Support Sys-tems, 42(2), 1054-1062.

Kilian, L. y Taylor, M. P. (2003). Why is it sodifficult to beat the random walk forecast ofexchange rates? Journal of International Eco-nomics, 60, 85-107.

Kuan, C. y Liu, T. (1995). Forecasting exchangerates using feedforwad and recurrent neural net-works. Journal of Applied Econometrics (10),347-364.

Langebaek, A. (1993). Tasa de cambio real y tasa decambio de equilibrio. Serie Archivos de Ma-croeconomía. Departamento Nacional de Pla-neación, Unidad de Análisis Macroeconómico.Documento 19, 27 p.

LeCun, Y., Bottou, L., Orr, G. B. y Muller, K. R.(1998). Efficient backprop. En: Neural net-works: Tricks of the trade (pp. 5-50). SpringerLecture Notes in Computer Sciences 1524.

Masters, T. (1993). Practical neural network reci-pes in C++. New York: Academic Press.

Masters, T. (1995). Neural, novel and hybrid algo-rithms for time series prediction. New York:John Wiley and Sons.

Meisel, A. (1994). Cómo determinar si el peso estásobrevaluado o subvaluado. Borradores Sema-nales de Economía (6). Bogotá: Banco de laRepública.

Milas, C. y Otero, J. (2002). Modelling oficial andparallel exchange rates in Colombia under alter-native regimes: a non-linear approach. EconomicModelling, 20, 165-179.

Patiño, C. I. y Alonso, J. C. (2005). Determinan-tes de la tasa de cambio nominal en Colom-bia: evaluación de pronósticos. Manuscritono publicado.



Revéiz, A. (2002). Evolution of the Colombian pesowithin the currency bands, nonlinear analysisand stochastic modeling. Rev. Econ. Ros., 5(1),37-91.

Sarle, W. (1994). Neural networks and statisticalmodels. Documento presentado en The 19thAnnual SAS Users Group Int. Conference, Cary,NC: SAS Institute, pp. 1538-1550.

Swanson, N. y White, H. (1997a). Forecasting eco-nomic time series using adaptive versusnonadaptive and linear versus non-linear econo-metric models. International Journal of Fore-casting (13), 439-461.

Swanson, N. y White, H. (1997b). A model selec-tion approach to real time macroeconomic fore-

casting using linear models and artificial neuralnetworks. Review of Economics and Statistics(39), 540-550.

Tseng, F. M., Tzeng, G. H., Yu, H. C. y Yuan, B. J.C. (2001). Fuzzy ARIMA model for forecast-ing the foreign exchange market. Fuzzy Sets andSystems, 118, 9-19.

Van Djck, D. (1999), Smooth transition models:extensions and outlier robust inference. Tesis dePh. D. no publicada, Erasmus University, Rot-terdam, Holanda.

Zhang, G., Patuwo, B. y Hu, M. (1998). Forecast-ing with artificial neural networks: the state ofthe art. International Journal of Forecasting(14), 35-62.

Documents

ODELADO DEL ÍNDICE DE TIPO DE CAMBIO USANDO REDES ...importante (van Djck, 1999; Granger y Teräsvirta, 1993), de tal forma que la ... tir de los datos mismos, en aquellos casos donde