IDEA Advanced Statistical Methods Case Study

Embed Size (px)

Citation preview

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    1/58

     

                   

            

      

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    2/58

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    3/58

    Caso de estudioMétodos Estadísticos

    Avanzados de IDEAUn documento de CaseWare IDEA

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    4/58

    Copyright © 2013 (v9.1) CaseWare IDEA Inc. Todos los derechos reservados. Este manual ysus archivos de datos son propiedad registrada y poseen todos los derechos reservados.Ninguna parte de esta publicación podrá ser reproducida, emitida, transcripta, guardada en

    un sistema para su posterior recuperación o traducida en ningún idioma bajo ningúnconcepto sin el permiso de CaseWare IDEA Inc. CaseWare IDEA Inc. es una compañía privadade desarrollo y comercialización de software, con oficinas en Toronto y Ottawa, Canadá,compañías subsidiarias en Holanda y China y distribuidores asociados en más de 90 países.CaseWare IDEA Inc. es subsidiaria de CaseWare International Inc., líder mundial en softwarede inteligencia de negocios para auditores, contadores y profesionales en sistemas y finanzas(www.CaseWare-IDEA.com). IDEA es distribuida bajo licencia exclusiva por CaseWare IDEAInc, 469 King Street West, 2nd Floor, Toronto, CANADA, M5V 1K4. IDEA es una marcaregistrada de CaseWare International Inc.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    5/58

    Contenido

    Contenido

    Capítulo 1

    Información general ......................................................................... 7

    Capítulo 2

    Correlación ........................................................................................ 9Introducción.................................................................................................9Uso de la Correlación para investigaciones de mercado..............................10Conclusión .................................................................................................21

    Capítulo 3

    Análisis de tendencias.................................................................... 23Introducción...............................................................................................23Uso del Análisis de tendencias para investigaciones de mercado ................24Conclusión .................................................................................................38

    Capítulo 4

    Series de tiempo ............................................................................. 39Introducción...............................................................................................39Uso de las Series de tiempo para analizar datos del mercado laboral..........40Gráfico del resultado ..................................................................................53Conclusión .................................................................................................54

    Apéndice

    Apéndice ......................................................................................... 55

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    6/58

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    7/58

    Capítulo 1

    Información general

    Los Métodos Estadísticos Avanzados de IDEA pueden ser usados para análisis formando parte de unaserie de rutinas de monitorización continua.

    Este caso de estudio cubre el uso de los siguientes análisis estadísticos en IDEA y proporciona ejemplos

    acerca de cómo utilizar los mismos.

    • Correlación

    • Análisis de tendencias

    • Series de tiempo

    Si bien los cálculos para estos métodos estadísticos pueden ser llevados a cabo por otro producto queposea rutinas estadísticas incluyendo regresión lineal, o a través del uso de las fórmulas de Pearson, omediante el uso de las fórmulas de los libros de estadística, en IDEA estos cálculos pueden llevarse acabo tomando como base grupo por grupo.

    En el módulo Métodos Estadísticos Avanzados, estos grupos representan una unidad de auditoríadeterminada. Si bien el término unidad de auditoría puede ser utilizado para hacer referencia a unadivisión, departamento, franquicia, o alguna otra entidad, las pruebas pueden ser ejecutadas para unatarea que va más allá de estas unidades como puede ser el caso de proyectar una inversión o predecirerrores significativos o obtener resultados para una investigación profesional o académica.

    Si desea seguir las pruebas descriptas en los casos de estudio, los archivos requeridos para las mismaspueden ser encontrados en C:\Usuarios\\Mis documentos\Mis proyectosIDEA\Tutorial.

    Sus comentarios son importantes para nosotros. Por favor envíe sus comentarios relacionados con ladocumentación a [email protected].

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    8/58

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    9/58

    Capítulo 2

    Correlación

    Introducción   El Análisis de Correlación es una técnica estadística utilizada por auditores y otros analistas de datospara comparar los patrones numéricos en dos series de datos. Un alto nivel de correlación, esto es,una correlación cercana a 1, equivale a que los valores elevados de una serie de datos coinciden conlos valores elevados de una segunda serie de datos y, por contraposición, los valores bajos de la

    primera serie coinciden con los valores bajos de la segunda serie. El coeficiente de correlación es unnúmero único que nos indica que nivel de coincidencia existe en este sentido. El coeficiente deCorrelación puede ser desde -1 hasta +1.

    La Correlación originalmente fue utilizada en auditoría como un componente de una serie de rutinasde monitorización continua. Por ejemplo para una cadena de restaurantes se calcula el nivelpromedio mensual de ventas, y luego se calcula el análisis de correlación entre las ventas de cadalocal y las ventas promedio. Una correlación baja para alguno de los locales indicaría que el patrónestacional de dicho local se encuentra desviado de la norma. Otro ejemplo puede ser el análisis delos datos de una votación en la que se cree que cada candidato debería recibir el mismo porcentajede votos en cada distrito. Tomando una presunción simplista se asume que el candidato #1 recibe el60 por ciento de los votos, el candidato #2 recibe el 30 por ciento de los votos y el candidato #3recibe el 10% de los votos. Aquí el Análisis de Correlación puede utilizarse para ver, en cada distrito,

    que grado de certeza tuvieron los porcentajes pronosticados. Una correlación baja para algúndistrito indicaría que (a) los candidatos fueron más o menos favorecidos en el distrito o (b) hubo unerror en el recuento de votos.

    Las aplicaciones de los análisis de correlación no se encuentran limitadas a estos tipos de análisis,sino que también pueden ser útiles para comparar informes financieros entre dos períodos. Dehecho, esta técnica puede ser utilizada sobre cualquier serie de números cuando éstos deban sercomparados con una norma o comportamiento. Por ejemplo, puede compararse el consumo deelectricidad de todas las escuelas de un distrito con el consumo promedio, o los incobrables de cadasucursal de un banco con los patrones promedio establecidos previamente.

    Como consecuencia de un análisis de correlación puede obtenerse una base de datos o unresultado. Este resultado podrá ser visualizado en forma de cuadrícula o en forma gráfica. El gráfico

    nos muestra los distintos niveles de correlación, desde el más bajo hasta el más alto, pudiendoobservar las proporciones de estos valores para cada unidad de auditoría. A su vez el gráfico puedeser personalizado adaptándolo a su preferencia.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    10/58

    10 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    Uso de la

    Correlación para

    investigaciones de

    mercado

    Un investigador de mercado de una compañía que brinda servicios especializados en el control de lapolusión por emisiones de carbón, se encuentra haciendo un análisis de las emisiones ocurridas enseis países de América del Norte, Asia y Europa. La compañía sólo opera en los Estados Unidos y el

    objetivo del estudio es identificar aquellos países con mayor polusión para ofrecer los servicios de lacompañía en pos de un control de las emisiones de carbón. Es importante obtener estos datosrápidamente ya que, en unos días, habrá una reunión con la gente del departamento de ventaspara tratar este y otros temas.

    El investigador de mercado cuenta con datos confiables de un archivo de Microsoft® Excel obtenidodesde el sitio web de la Administración de Información Energética. Una parte de este archivo seencuentra en el directorio C:\Usuarios\\Mis documentos\Mis proyectosIDEA\Tutorial\EmisionesEIA.xls, siendo mostrado debajo en la Figura 1.1.

    Figura 1.1: Extracto de información de emisiones de EmisionesEIA.xls

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    11/58

    Capítulo 2: Correlación 11

    Para poder usar los datos en IDEA, se llevaron a cabo los siguientes pasos en el archivo de MicrosoftExcel. De todas formas, antes de llevar a cabo estos pasos, el analista de mercado hizo un back updel archivo original por precaución.

    • Fueron eliminados los encabezados, las filas de información y las filas en blanco utilizadascomo espacio entre las regiones.

    • Las columnas ocultas fueron aplicadas a la vista (la planilla empieza en B y luego tienevisible la columna D).

    • Aquellas regiones no requeridas para el análisis en cuestión como América Central,América del Sur, Africa y Oriente Medio fueron eliminadas.

    • Los años 1980 al 1984 inclusive al no ser requeridos para el análisis fueron eliminados.

    • Ciertas filas fueron combinadas para reflejar las realidades políticas actuales. Por ejemplo,los datos desde 1980 hasta 1990 muestran un valor para Alemania Occidental y otro paraAlemania Oriental, y desde 1991 muestran un único valor para Alemania. La región delBáltico posee algunos problemas debido a ciertas unificaciones de países. El investigadortomó el recaudo de que el análisis sea basado en los límites actuales y observó que lascorrelaciones bajas se hacían presentes en estos países formados a principio de losnoventa debido a que las series de datos tenían valores cero para los años anteriores.

    Un extracto del archivo de Excel actualizado con la Región, el País, el Código de País (de dos letras) ylos Valores de emisión es mostrada debajo en la figura 1.2 (los datos fueron ordenados en sentidodescendente por los valores del 2004). Este archivo es llamado EmisionesModificado.xls y puede serencontrado en C:\Usuarios\\Mis documentos\Mis proyectos IDEA\Tutorial.

    Figura 1.2: Extracto de los valores de emisión por país del archivo EmisionesModificado.xls

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    12/58

    12 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    En una planilla de Excel es muy común tener datos de diversos períodos en diferentes columnas. Sinembargo, para que estos datos sean analizados en IDEA, deberían ser convertidos al formato debase de datos donde cada fila es el registro de una transacción. En este caso, las emisiones de un

    país en un determinado año representan un registro. En este formato todos los valores numéricos seencuentran en un único campo (columna) llamado Carbón junto con otros campos, en este caso Paísy Año, indicando el grupo o unidad de auditoría y el período. El analista creó una nueva planilla deExcel (Emisiones por país.xls) con los datos listos para ser importados y analizados dentro de IDEA.Estos datos aparecen en la Figura 1.3.

    Figura 1.3: Datos en formato sugerido para importar en IDEA

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    13/58

    Capítulo 2: Correlación 13

    Luego el analista creó otra planilla llamada EmisionesTotales.xls con las emisiones totales a nivelmundial desde el archivo original (fila 248 del archivo EmisionesEIA.xls) para los años 1985 - 2004.Estas cifras representan el total de emisiones anuales para todos los países, no sólo para los 60

    países objeto de estudio. Ver la Figura 1.4 debajo.

    NOTA: Al usar la función Correlación de IDEA, no es necesario que los datos a ser examinados seancomparados con una serie de datos derivada del archivo original. La comparación puede basarsesobre cualquier dato relevante. Por ejemplo, el uso de la electricidad de una escuela podría sercomparado con el patrón medio estacional de las industrias de la zona (asumiendo que este dato seencuentra disponible).

    Figura 1.4: Emisiones anuales totales de todos los países

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    14/58

    14 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    Los últimos dos archivos EmisionesPaís.xls y EmisionesTotales.xls fueron importados individualmenteen IDEA usando el Asistente de Importación de IDEA con los siguientes pasos. Los archivos en IDEAposeen la extensión .imd (.idm si utiliza IDEA Unicode) y son importados dentro del proyecto. Si se

    encuentra llevando a cabo el análisis en base a lo descripto en este caso de estudio, especifique suproyecto en C:\Usuarios\\Mis documentos\Mis proyectos IDEA\Tutorial.

    1. En la pestaña Principal, dentro del grupo Importar haga clic en Escritorio.

    2. Seleccione la opción Microsoft Excel en la lista y luego el archivo Excel a ser importado.

    3. En el diálogo Microsoft Excel marque la casilla  Primera fila son nombres de campo y escribaun nombre para el archivo resultante como en la Figura 1.5.

    4. Haga clic en Aceptar.

    Figura 1.5: Apariencia requerida para el diálogo Microsoft Excel 

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    15/58

    Capítulo 2: Correlación 15

    Una vez importado los datos en IDEA el analista combinó los datos en dos archivos seleccionandoArchivo > Unir Bases de Datos, tal como aparece en la figura 1.6 con las siguientes especificaciones:

    • Se incluyeron todos los campos de la base de datos primaria.

    • Se incluyó sólo el campo TOTAL de la base de datos secundaria.

    • El campo clave de coincidencia fue AÑO.

    Figura 1.6: Apariencia requerida para el diálogo Unir Bases de Datos

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    16/58

    16 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos creada luego es ordenada por PAIS en dirección ascendente cambiando su nombrepor Emisiones tal como aparece en la Figura 1.7. La base de datos posee 1200 registros (60 países,20 registros por país).

    Figura 1.7: Base de datos resultantes de la función Unir Bases de Datos

    En las bases de datos de IDEA las columnas son referidas como campos y las filas como registros. Elcampo PAIS indica el grupo o unidad de auditoría a la que pertenece el registro. El campo AÑOindica el año de las emisiones para asegurarse que los números a ser comparados pertenezcan almismo año. El campo CARBON representa los valores de emisión para el país y el año de losprimeros dos campos. Los números del campo TOTAL muestran el total de emisiones a nivel mundialpara el año. Observe que el total del año para el primer registro es el mismo que el totalcorrespondiente al registro número 21. La diferencia entre estos dos registros es que uno hace

    referencia a 1985 y Albania mientras que el otro hace referencia a 1985 y Australia.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    17/58

    Capítulo 2: Correlación 17

    El analista calculó la correlación para CARBON y TOTAL usando PAIS para formar los grupos. Todaslas unidades de auditoría (países) fueron incluidas. Como salida se marcaron las opciones Crearresultado y Crear base de datos. Ver la Figura 1.8 debajo.

    Figura 1.8: Apariencia requerida para el diálogo Correlación

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    18/58

    18 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    Una porción de la base de datos es mostrada en la Figura 1.9 con las correlaciones ordenadas demenor a mayor.

    Figure 1.9: Valores de correlación ordenados de menor a mayor 

    El resultado de la función Correlación pasa a ser un componente de la base de datos de origen delmismo. Por consiguiente para ver el resultado, seleccione la pestaña Emisiones, para activar la basede datos, y luego seleccione el resultado Correlación en el área Resultados de la Ventana dePropiedades. El resultado puede ser visto en forma de cuadrícula o en forma gráfica haciendo clic enel botón correspondiente de la Barra de herramientas de Resultados. El gráfico de la correlación(desde la menor hasta la mayor) debería aparecer en pantalla de acuerdo a la Figura 1.10.

    Figura 1.10: Valores de correlación mostrados en un gráfico

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    19/58

    Capítulo 2: Correlación 19

    En base a la prueba efectuada el analista incluyó las siguientes observaciones en su informe:

    • Las emisiones totales a nivel mundial mostraron un aumento constante durante el período

    1985-2004. Si bien en algunos años se presentan algunas pequeñas disminuciones latendencia global refleja un aumento.

    • El rango de correlación va desde -0,80 (un alto nivel de correlación negativa) hasta 0,94(un alto nivel de correlación positiva). Esto significa que algunos países tuvieron tendenciasdecrecientes a lo largo del tiempo (aquellos con correlación negativa), otros tuvieroncorrelaciones cercanas a cero (lo que indica la no existencia de una tendencia creciente odecreciente), en tanto que otros tuvieron correlaciones altamente positivas (aquellos contendencias crecientes fuertes). La tabla con el detalle de algunos de estos casos se exhibea continuación. No aparece el gráfico debido a que la cantidad de países es mucho mayora las emisiones de cada país, lo que genera un gráfico donde el total por país parece seruna línea horizontal en la parte inferior del gráfico.

    Los siguientes son algunos ejemplos de la correlación resultante entre las emisiones individuales decada país y la emisión total a nivel mundial.

    En el caso de Bélgica, se presenta una gran correlación negativa (-0,799) debido a que las emisionesde Bélgica disminuyeron en tanto las emisiones a nivel mundial aumentaron.

    Figura 1.11: Valores de emisión para Bélgica

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    20/58

    20 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    En el caso de Irlanda, la correlación es cercana a cero (correlación débil) debido a que mientras lasemisiones a nivel mundial aumentaron, las emisiones en Irlanda aumentaron en algunos años ydisminuyeron en otros.

    Figura 1.12: Valores de emisión para Irlanda

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    21/58

    Capítulo 2: Correlación 21

    Finalmente para el caso de China, se presenta una gran correlación positiva (0,938) debido a que lasemisiones de China aumentaron al igual que las emisiones a nivel mundial.

    Figura 1.13: Valores de emisión para China

    Conclusión   Al final del proyecto, el analista advirtió que la correlación tomada en forma aislada no representa laverdadera historia. Por ejemplo un país podría tener una gran correlación positiva (lo que implica unaumento en sus emisiones), sin embargo si estas emisiones equivalen a números relativamentepequeños, dicho país no representaría un mercado viable como podría ocurrir con otro país con unacorrelación menor pero con números relativamente más grandes. Por lo tanto además de lascorrelaciones es necesario obtener una medida de los valores iniciales y los cambios promedio(aumento o disminución) año a año. Este análisis se detalla a continuación en la sección Análisis deTendencias.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    22/58

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    23/58

    Capítulo 3

    Análisis de tendencias

    Introducción   El Análisis de tendencias es una técnica estadística utilizada por auditores para obtener tendenciasen el comportamiento de los datos en un determinado período, y pronosticar valores futurosasumiendo que dicha tendencia se repetirá en el tiempo. La técnica de Análisis de tendenciasutilizada por el módulo Métodos Estadísticos Avanzados de IDEA se basa en la regresión lineal

    empleando métodos cuadrados. Esta técnica obtiene la línea recta que mejor ajusta los datos ypermite predecir nuevos valores en base a esta línea. Si los datos poseen un componente estacionalasociado (por ej. valores elevados asociados quizás a ciertos meses, o días de la semana, u horas deldía), entonces el método Series de Tiempo debería ser utilizado en lugar de la técnica Análisis detendencias.

    El Análisis de tendencias puede ser utilizado en auditoría como un componente de una serie derutinas de monitorización continuo. Por ejemplo puede ser utilizado para prueba de erroresintencionales o no intencionales en los datos de ventas de los locales informados en un informe.Para este caso un posible indicador de errores podría ser la disminución en las ventas de un localcuando, en promedio, existe un crecimiento en las ventas de todos los locales. El Análisis detendencias (o regresión lineal) puede ser utilizado para cuantificar la tendencia en las ventas de cadalocal. Una tendencia negativa sería un indicador de potenciales problemas en las ventas registradas.

    Otro uso del Análisis de tendencias puede ser el de proporcionar pronósticos para diversas entidadescontables en un entorno de monitorización continua. Estos pronósticos luego podrían sercomparados con los números reales y, de existir diferencias, habría un indicador de que estosnúmeros se han desviado de la tendencia sugerida en el pasado.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    24/58

    24 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    El Análisis de tendencias puede proporcionar las respuestas a muchas de las preguntas resultantesde un análisis:

    • Por ejemplo para el dueño de una franquicia: ¿qué locales han disminuido sus ventas si setoma en cuenta las tendencias de aumento anteriores?

    • Para un analista de inversión: ¿qué inversiones muestran una tendencias negativa en susvalores de mercado?

    • Para una oficina gubernamental: ¿qué entidades muestran un uso de fondos que excede asus tendencias del pasado?

    • Para un hospital: ¿qué secciones muestran un alto nivel, o una tendencia de aumento, enempleados con parte de enfermo?

    • Para un servicio de correo, ¿qué localidades muestran los aumentos más grandes engastos por combustible?

    • Para una universidad: ¿qué facultades muestran una disminución en la cantidad degraduados?

    Uso del Análisis de

    tendencias para

    investigaciones de

    mercado

    Como el resultado de la correlación de la sección anterior no le permitió ver la historia completa, elpaso siguiente del analista fue usar el Análisis de tendencias para estimar tanto el tamaño delmercado como sus modificaciones año a año. Para ello el analista usó la base de datos Emisiones porpaís - Total carbón tal como aparece en la Figura 2.1. Estos datos fueron importados desde elarchivo EmisiónPaís.xls (ver Figura 1.5).

    Figura 2.1: Extracto de la base de datos de IDEA Emisiones por país - Total carbón

    Al momento del análisis los datos del 2005 y 2006 no se encontraban disponibles. Por lo tanto elanalista decidió pronosticar los valores del 2004, basándose en los datos del período 1985-2003, yluego comparar el pronóstico con los datos reales del 2004.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    25/58

    Capítulo 3: Análisis de tendencias 25

    Para obtener el pronóstico, el analista primero creó una nueva base de datos (Pre-2004) noincluyendo los datos de la emisión de carbón para el 2004. Para ello utilizó la función ExtracciónDirecta con las opciones detalladas en la Figura 2.2.

    Figura 2.2: Apariencia requerida para el diálogo Extracción Directa

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    26/58

    26 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    Luego de ejecutar la extracción de los 1140 registros (60 países, 19 veces cada uno) obtuvo la basede datos resultante mostrada en la Figura 2.3 .

    Figure 2.3: Base de datos resultante Pre-2004

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    27/58

    Capítulo 3: Análisis de tendencias 27

    A continuación el analista utilizó la función Análisis de tendencias del módulo Métodos EstadísticosAvanzados de IDEA tal como muestra la Figura 2.4. Dado que el objetivo del analista era identificarposibles valores del mercado, sólo estableció un pronóstico para un período.

    Figura 2.4: Apariencia requerida para el diálogo Análisis de tendencias

    Como resultado obtuvo un Análisis de tendencias disponible en el área de Resultados de la Ventanade Propiedades. A su vez, se crearon las siguientes tres bases de datos: Análisis de Tendencias,Análisis de Tendencias Pronóstico y Análisis de Tendencias PEAP.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    28/58

    28 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos Análisis de Tendencias se detalla en la Figura 2.5 debajo:

    Figure 2.5: La base de datos resultante del Análisis de tendencias

    El campo CARBON_REF representa los datos originales. El campo CARBON_TEND representa losvalores de la línea recta adecuada a los datos. El campo CARBON_DIFERENCIA puede ser ignoradopuesto que es utilizado para el análisis de Series de Tiempo y no es aplicable para el análisis de

    tendencias. El campo PERIOD_PRONOS cuenta con un valor por grupo y para estos datos muestraque el pronóstico es para el período 20º de la serie de números. El campo CARBÓN_PRONOSTICOcuenta con un valor relevante para cada grupo, siendo éste la primera línea para cada grupo. ParaAlbania el pronóstico para el período 20º fue de -0,84. Esta resultado es matemáticamente correctopero es ilógico debido a que la polución nunca puede ser negativa.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    29/58

    Capítulo 3: Análisis de tendencias 29

    La Base de Datos Análisis de Tendencias PRONOSTICO, mostrada en la Figura 2.6, muestra losnombres de los grupos (en este caso los nombres de los países del campo PAIS), el número depronóstico (en este caso 20 por el período 20º) en el campo PERIOD_PRONOS, y el pronóstico

    numérico para el período 20º en el campo CARBON_PRONOSTICO. Esta base de datos esesencialmente una extracción de la base de datos Análisis de Tendencias.

    Figure 2.6: La base de datos resultante Análisis de Tendencias Pronóstico

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    30/58

    30 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos Análisis de Tendencias PEAP, mostrada en la Figura 2.7, incluye solamente lossiguientes campos:

    • PAIS - Identifica las unidades de auditoría que forman los grupos.

    • CARBON_PENDIENTE - La variación en la línea recta de período en período.

    • CARBON_PEAP - El Porcentaje de Error Absoluto Promedio. Consulte la Figura 2.7 y elApéndice para obtener una explicación detallada.

    Figura 2.7: La base de datos resultante Análisis de Tendencias PEAP 

    El resultado, accesible desde la Ventana de Propiedades para la base de datos sobre la cual fueejecutada la función (Pre-2004) también puede ser visto como un gráfico haciendo clic en el botónapropiado de la Barra de herramientas de Resultados.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    31/58

    Capítulo 3: Análisis de tendencias 31

    El resultado para Albania es mostrado como un gráfico en la Figura 2.8 debajo.

    Figura 2.8: El resultado para Albania mostrado como un gráfico

    Tenga en cuenta que la letra “A” en PEAP está haciendo referencia a Valores Absolutos. El valorabsoluto de -5 y+5 es en ambos casos +5.

    El PEAP de Albania (ver Figura 2.8) es particularmente elevado debido a que las diferencias (las líneasde color rojo) son expresadas como un porcentaje de los valores reales, y para los períodos 10 al 19los valores reales son muy pequeños. La longitud de las líneas de color rojo expresadas como unporcentaje de los valores reales pequeños resultan en PEAP elevado.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    32/58

    32 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    El analista observó los valores adecuados, los datos históricos y los valores pronosticados para cadapaís analizando los resultados del análisis en forma gráfica. El gráfico para India es mostrado en laFigura 2.9.

    Figura 2.9: El resultado para India mostrado como un gráfico

    El valor pronosticado (la marca en azul en la posición 20) parece ser un pronóstico razonable usandoel modelo de tendencia lineal. El PEAP es relativamente pequeño con un porcentaje del 3,48 porciento. Un PEAP pequeño implica que las diferencias entre los valores adecuados (la línea recta) y losvalores reales es relativamente pequeña.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    33/58

    Capítulo 3: Análisis de tendencias 33

    Para este proyecto el analista quiso combinar los valores reales y los valores pronosticados en unamisma base de datos. Para ello siguió los siguientes pasos:

    Como la comparación entre los valores reales y los valores pronosticados sólo es aplicable al año2004, el primer paso fue extraer los registros del 2004 de la base de datos original (Emisiones porpaís_Carbón_Total - ver Figura 2.1) en una nueva base de datos llamada Emisiones 2004 tal comomuestra la Figura 2.10.

    Figura 2.10: Apariencia requerida para el diálogo Extracción Directa

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    34/58

    34 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos Análisis de Tendencias Pronóstico luego fue unida a la nueva base de datosEmisiones 2004 usando la función Unir Bases de Datos de IDEA con las siguientes configuraciones(ver Figura 2.11).

    • Se incluyó el campo CARBON_PRONOSTICO de la base de datos secundaria.

    • El campo PAIS fue usado como el campo clave de coincidencia.

    Figura 2.11: Apariencia requerida para el diálogo Unir Bases de Datos

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    35/58

    Capítulo 3: Análisis de tendencias 35

    Finalmente la Base de Datos PEAP del Análisis de tendencias (con los campos CARBON_PENDIENTE yCARBON_PEAP) fue unida, como muestra la Figura 2.12 debajo, a la base de datos obtenida en elpaso 2.

    Figura 2.12: Apariencia requerida para el diálogo Unir Bases de Datos

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    36/58

    36 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos final, Emisiones reales y pronosticadas, con los campos de diversas bases de datoses mostrada en la Figura 2.13 debajo. El campo CARBON contiene las emisiones reales mientras queel campo CARBON_PRONOSTICO contiene los valores pronosticados a través del Análisis de

    tendencias.

    Figura 2.13: La base de datos resultante Emisiones reales y pronosticadas

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    37/58

    Capítulo 3: Análisis de tendencias 37

    Finalmente, para identificar los candidatos más prometedores, el analista llevó a cabo una extracción(ver Figura 2.14) usando el siguiente criterio:

    • Carbón Pronóstico mayor a 10

    • Pendiente mayor a 0 (esto representa una tendencia creciente año tras año)

    • PEAP menor a 50 (valores elevados de PEAP indicarían una tendencia errática)

    Figura 2.14: Apariencia requerida para el diálogo Extracción Directa

    La fórmula para el criterio de extracción fue CARBON_PRONOSTICO > 10 .AND.CARBON_PENDIENTE > 0 .AND. CARBON_PEAP < 50 se especificó mediante el Editor de ecuaciones.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    38/58

    38 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos resultante con los candidatos prometedores es mostrada en la Figura 2.15.

    Figure 2.5: La base de datos resultante Candidatos prometedores

    Conclusión   Se presentaron a la Gerencia los candidatos viables (ver Figura 2.15) junto con un resumen de losmétodos usados y una descripción de las fuentes de datos.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    39/58

    Capítulo 4

    Series de tiempo

    Introducción   La función Series de tiempo es utilizada por auditores y otros analistas de datos para calcular latendencia de los datos con un componente estacional a lo largo del tiempo permitiendo predecirvalores en el futuro asumiendo que dicha tendencia seguirá presente. El uso de esta técnica se vioamenazado por el hecho de que sus pruebas sólo podían ser aplicadas mediante programas

    estadísticos especializados pudiendo estos programas analizar sólo un grupo a la vez. Otro factorque limitaba el uso de esta técnica era que los diagnósticos (estadísticas e informes obtenidos) eranexcesivos haciendo dificultosa la tarea del auditor en cuanto a la focalización de los datosimportantes. Por último, al usar los paquetes especializados el usuario debía seleccionar entrediversos modelos puesto que no todos los modelos arrojan los mismos resultados.

    A diferencia de la Correlación o el Análisis de tendencias, existen varias fórmulas para el análisis delas Series de tiempo. IDEA optó por el método de Descomposición de las Series de tiempo debido aque este modelo era de mayor utilidad para trabajar con datos financieros. A su vez este modelotambién fue seleccionado luego de estudiar cuidadosamente cómo tratar los casos donde el patrónestacional se encuentra en aumento (volviéndose cada vez más extremo) y los casos donde los datosdel pasado contienen algunos valores excepcionalmente altos o bajos. Sus funciones han sidodiseñadas para ser ejecutadas en forma simultánea entre diversos grupos de datos (por ejemplo

    todos los locales de venta de una compañía) y los diagnósticos obtenidos han sido limitados aaquellos requeridos para estudios de tipo financiero. Esta técnica ajusta la mejor curva estacional alos datos pudiendo pronosticar valores futuros a partir de esta curva estacional.

    La función Series de tiempo puede ser utilizada para verificar si las ventas de los diferentes localescuentan con un componente estacional. Si los datos poseen un componente estacional asociado(por ej. valores elevados en ciertos meses, días de la semana u horas del día), entonces el métodoSeries de tiempo debería ser utilizado en lugar de la técnica Análisis de tendencias.

    Un componente estacional podría darse cuando los encargados de ventas registran ventas mayoresa las usuales al final de cada trimestre. Este fenómeno suele presentarse con bastante frecuencia enla realidad. Otro uso del Análisis de tendencias puede ser el de proporcionar pronósticos para variasentidades contables dentro de un ambiente de monitorización continua. Los pronósticos luego

    podrían ser comparados con los números reales y, en caso de presentarse diferencias significativas,esto indicaría que los números se han desviado de su tendencia pasada y del patrón estacionalasociado.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    40/58

    40 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La función Series de tiempo es más sofisticada que la función Análisis de tendencias (los resultadosserán iguales si el componente estacional es establecido en 1) y permite obtener respuestas adiversas preguntas como las siguientes:

    • Para el dueño de una franquicia, ¿cuáles son los locales de venta que están mostrando unacaída en las ventas comparada con la tendencia del pasado?

    • Para una línea aérea, ¿cuáles son los aeropuertos que están mostrando un aumento en elporcentaje de equipajes robados?

    • Para un banco, ¿cuáles son las sucursales que están mostrando un aumento en latramitación y otorgación de préstamos?

    • Para una comuna, ¿cuáles son las escuelas cuyo abastecimiento excede año a año losniveles presupuestados?

    • Para un departamento de policía, ¿cuáles son los empleados que presentan una tendenciaascendente en horas extras?

    • Para un hospital: ¿qué secciones muestran un alto nivel, o una tendencia de aumento, enempleados con parte de enfermo?

    • Para un servicio de correo, ¿qué localidades muestran los aumentos más grandes engastos por combustible?

    • Para una universidad, ¿cuáles son las disciplinas con una tendencia ascendente degraduados?

    Uso de las Series de

    tiempo para

    analizar datos delmercado laboral

    Para este caso de estudio nos focalizaremos en una compañía con base en Dallas que ofreceseminarios de capacitación a gente sin empleo como parte de un programa del gobierno diseñado

    para que los desempleados incorporen determinadas habilidades. El programa ha sido fuertementesubsidiado por el gobierno federal efectuándose un pago simbólico a quienes completen losseminarios. Quienes concurren a los seminarios cuentan con algunos beneficios adicionales sin tenerque postularse a nuevos trabajos durante la duración de los mismos. La compañía posee diversasoficinas en las distintas regiones geográficas del país. Cada región geográfica cuenta conaproximadamente 30 millones de personas. En el caso de California se trata como un único estado,en tanto otras regiones del país fueron divididas hasta en siete estados por región.

    Cada año los gerentes regionales presupuestan sus ingresos para el año entrante. En caso desuperar las metas previstas son recompensados con un bono significativo. Como esto puede ser unmotivo para que los gerentes regionales subestimen los valores presupuestados (con el fin deobtener el bono), el director de la compañía se decidió por investigar tal situación.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    41/58

    Capítulo 4: Series de tiempo 41

    Para ello se encargó de hacer un estudio de las ingresos presupuestados por los gerentes. El objetivodel estudio era determinar si:

    • Las expectativas de los gerentes regionales fueron subestimadas con el fin de obtener elbono de recompensa el año siguiente.

    • Los gerentes regionales realmente conocían los patrones estacionales del negocio. Esto es,si tomaron en cuenta en sus estimaciones los distintos períodos (estacionalidad) queafectan la cantidad de personas desempleadas y, consecuentemente, ver si ajustaron lacantidad de seminarios ya sea en forma creciente o decreciente debido a las variacionesdadas por la estacionalidad natural del negocio.

    Para el estudio el director empleó una estadística referente al desempleo emitida por el Ministerio deTrabajo de EE.UU. para el período 1998 - 2005. Estos números serían los utilizados para pronosticarlos ingresos del 2006. Estos pronósticos luego serían comparados con los pronósticos de losgerentes regionales para el 2006, los cuales fueron establecidos en 2005. De esta forma del Director

    obtendría un pronóstico estadístico para el 2006 comparándolo luego con los valores reales del2006. Los datos utilizados para el análisis se encontraban disponibles en un archivo de Excel, el cualno requería ninguna adaptación para su uso. El archivo puede ser encontrado en el siguientedirectorio: C:\Usuarios\\Mis documentos\Mis proyectosIDEA\Tutorial\Desempleados.xls.

    Los datos fueron importados en IDEA usando la opción Microsoft Excel del Asistente de Importaciónde IDEA con las especificaciones mostradas por la Figura 3.1.

    Figura 3.1: Apariencia requerida para el cuadro de diálogo de Microsoft Excel 

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    42/58

    42 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos de IDEA aparece en la Figura 3.2 (ordenada por ESTADO y AÑO).

    Figura 3.2: La base de datos resultante de IDEA ordenada por los campos ESTADO y AÑO

    Es importante tener en cuenta que los datos hacen referencia a períodos de 13 meses anuales,estando compuesto cada mes por cuatro semanas exactas. El último mes del año puede contar con29 o 30 días terminando el mes de Diciembre el día 31º. Esto permite una comparación sencilla a lolargo de los años. De no ser así algunos meses contarían con cuatro fines de semana mientras que

    otros meses tendrían cinco fines de semana.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    43/58

    Capítulo 4: Series de tiempo 43

    Para el estudio el Director utilizó la función Series de tiempo de IDEA con las especificacionesdetalladas en la Figura 3.3:

    Figura 3.3: Apariencia requerida para el diálogo Series de Tiempo

    El Director optó por crear un Resultado como salida así como una Base de datos de Series detiempo, una Base de datos de Pronósticos y una Base de datos PEAP La cantidad de pronósticosespecificada fue 13 para los 13 meses de cuatro semanas del 2006.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    44/58

    44 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La Base de datos de Series de tiempo creada (mostrada en la Figura 3.4) cuenta con algunoscálculos internos. Estos cálculos no son aplicables para la mayoría de las situaciones, pero podríanser de interés.

    Figura 3.4: Un extracto de la base de datos Series de Tiempo resultante

    La Base de Datos de Pronósticos cuenta con 13 pronósticos para cada unidad de auditoría (cadaestado). Esto es mostrado en la Figura 3.5 debajo. Esta base de datos es creada para que los valoresreales sean comparados con los valores pronosticados una vez que los valores reales se encuentrendisponibles.

    Figure 3.5: La base de datos Series de Tiempo Pronósticos resultante

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    45/58

    Capítulo 4: Series de tiempo 45

    La Base de Datos PEAP (mostrada en la Figura 3.6), proporciona el Porcentaje de Error AbsolutoPromedio para cada cálculo. Para obtener mayor información acerca del cálculo de PEAP, consulte elApéndice.

    Figure 3.6: La base de datos Series de Tiempo PEAP resultante

    El Director observó que algunos coeficientes PEAP eran relativamente elevados. El paso siguiente fueindexar la base de datos por el campo PERSONAS_PEAP en sentido descendente, para obtener loscoeficientes PEAP más elevados al principio. Las bases de datos pueden ser indexadas haciendodoble clic sobre el encabezado de campo, en este caso PERSONAS_PEAP. La base de datos indexadaes mostrada debajo en la Figura 3.7.

    Figura 3.7: La base de datos resultante Series de Tiempo PEAP con el campo PERSONAS_PEAP enorden descendente

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    46/58

    46 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    La base de datos indexada mostró que 23 estados (cerca de la mitad de los estados) tenían uncoeficiente PEAP superior al 10 por ciento. Esto significa que la desviación promedio de la líneaobtenida a partir de los valores reales fue superior al 10 por ciento. El Director también notó que los

    tres estados más importantes (California, Texas y New York) estaban dentro de los estados con PEAPmás elevados.

    Para ver esto en forma gráfica, el Director observó el Resultado creado por la función. Este resultadopuede accederse desde el área Resultados de la Ventana de Propiedades de la base de datos desdeel cual fue obtenido, en este caso "Desempleados". Si el resultado no es mostrado en forma gráfica,haga clic en el botón correspondiente de la Barra de herramientas de Resultados para alternar entreuna cuadrícula o un gráfico.

    Seleccione el estado a través del desplegable Unidad auditoría. Los gráficos para los estados deColorado (PEAP elevado), Maine (PEAP medio), y Montana (PEAP bajo) son mostrados en las Figuras3.8, 3.9 y 3.10 respectivamente.

    El resultado para el estado de Colorado con un PEAP de 18.60

    Figura 3.8: El resultado para Colorado mostrado como un gráfico

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    47/58

    Capítulo 4: Series de tiempo 47

    El resultado para el estado de Maine con un PEAP de 9.47

    Figura 3.9: El resultado para Maine mostrado como un gráfico

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    48/58

    48 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    El resultado para el estado de Montana con un PEAP de 3.49

    Figura 3.10: El resultado para el estado de Montana mostrado como un gráfico

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    49/58

    Capítulo 4: Series de tiempo 49

    El Director observó los distintos resultados encontrando para el caso de California un gráficoparticularmente interesante, de acuerdo a lo mostrado por la Figura 3.11.

    Figura 3.11: El resultado para el estado de California mostrado como un gráfico

    California tenía un coeficiente PEAP de 10.69. Esto indicaba que la línea obtenida (de color rojo)estaba, en promedio, "alejada" un 10 por ciento de la serie de puntos perteneciente a los datosreales. De esta forma el gráfico para California presentaba un problema para las matemáticas de lasSeries de tiempo. La serie de valores pertenecientes a California mostraba, primero una tendencia

    decreciente, luego un crecimiento y luego una tendencia decreciente nuevamente. Las matemáticasde las Series de Tiempo asumen que la tendencia (el movimiento global ascendente o descendente)es estable. es decir, se presenta un crecimiento o decrecimiento a lo largo del período.

    Al extrapolar los valores del gráfico para California en el futuro la tendencia global es generalmentecreciente. Esto indica que el análisis de las Series de tiempo ha identificado correctamente el patrónestacional (el pico cerca de mitad de año y al final del año) sin embargo la “altura” de los promediosestá identificando la tendencia promedio. Para el caso de California los valores pronosticadosparecen ser demasiado altos.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    50/58

    50 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    De esta forma el Director arribó a las siguientes conclusiones:

    • El coeficiente PEAP para 23 estados (Figura 3.7) mostró que los pronósticos no eran

    confiables debido que la función Series de tiempo fue pronosticando una tendenciapromedio mientras que los datos mostraron que el desempleo en 2006 estaríaprobablemente por debajo que en 2005. Por ejemplo, considerando la serie de datos{100, 98, 105, 150, 147, 154, 140, 137, 143} con una longitud temporal de 3. Elsegundo grupo de tres valores {150, 147, 154} muestra un importante crecimiento sobreel primer grupo de tres valores pero el último grupo de tres valores {140, 137, 143}muestra un decrecimiento comparado con la serie media de valores. Debido a que latendencia es creciente "en promedio" los pronósticos representan una serie de valoresmayores a la última serie de tres valores, incluso la serie final de tres valores es menor a laserie media de tres valores.

    • El análisis de las Series de tiempo muestra correctamente que existe un componenteestacional asociado a los datos.

    • Los futuros análisis deberían utilizar datos para cinco años y no para ocho años.

    • En este caso debería efectuarse un ajuste a los pronósticos de las Series de tiempo.

    Por lo tanto el Director volvió a efectuar el análisis basándose en lo siguiente:

    • El módulo Series de tiempo identificó correctamente el componente estacional.

    • Un pronóstico no influenciado por ningún factor arrojaría que el número de desempleados(en total por cada estado) sería igual al número de 2005.

    • Un pronóstico confiable tomaría los números del 2005 y sobrepondría el patrón estacionalpromedio asociado a los mismos.

    En consecuencia el Director revisó los pronósticos para California del siguiente modo:

    En la base de datos original de Desempleados utilizó la función Extracción Directa extrayendo losregistros de California para el 2005 (números de registros 508 - 520) a una nueva base de datosllamada Desempleados Cal 2005.

    Luego extrajo los registros de California de la Base de datos de Pronósticos (números de registros 53- 65) a una nueva base de datos llamada Pronósticos Cal 2006. En esta base de datos, usando lafunción Manejo de Campos cambió el Tipo de campo para PERIOD_PRONOS de Caracter aNumérico.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    51/58

    Capítulo 4: Series de tiempo 51

    Luego unió las dos bases de datos, Desempleados Cal 2005 y Pronósticos Cal 2006, creando unanueva base de datos con el nombre Pronósticos 2006 revisados (Figura 3.12) con las siguientesespecificaciones:

    • El campo clave de coincidencia fue PERIODO en la base de datos primaria yPERIOD_PRONOS en la base de datos secundaria.

    • Solamente incluyó el campo PERSONAS_PRONOSTICO de la base de datos secundaria.

    Figura 3.12: Apariencia requerida para el diálogo Unir Bases de Datos

    Luego en la base de datos Pronósticos 2006 revisados, el nombre del campoPERSONAS_PRONOSTICO es modificado por PRONOSTICO_2006 usando la función Manejo deCampos.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    52/58

    52 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    Haciendo clic en el enlace Estadísticas de campo de la Ventana de Propiedades, el Director chequeóel Valor Medio para los campos Numéricos PERSONAS y PRONOSTICO_2006. Los valores promediofueron 948.706,62 y 1.121.159,08 respectivamente tal como se muestra en la Figura 3.13.

    Figura 3.13: Las estadísticas de campo para los campos PERSONAS y PRONOSTICO_2006 

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    53/58

    Capítulo 4: Series de tiempo 53

    El Director insertó luego dos campos virtuales, PROMEDIO_2005 con los valores promedio delcampo PERSONAS, y PROMEDIO_PRONOSTICO con los valores promedio del campoPRONOSTICO_2006.

    Luego el Director insertó los siguientes dos campos virtuales tal como se muestra en la Figura 3.15:

    • FACTOR_ESTACIONAL para determinar el patrón estacional promedio. Para este campoempleó la fórmula PRONOSTICO_2006 / PROMEDIO_PRONOSTICO.

    • REVISADO_2006 el cual fue calculado multiplicando el promedio de 2005 con el factorestacional para imponer el patrón estacional promedio sobre los números pertenecientesal 2005 (PROMEDIO_2005 * FACTOR_ESTACIONAL).

    FACTOR_ESTACIONAL indica cuan lejos se encuentran los valores del período (un mes) del valorpromedio. Por ejemplo, el primer factor estacional de 1.062 muestra que los valores del Período 1 seencuentran 6.2 por ciento (1.062 - 1.000) sobre el promedio.

    El pronóstico revisado del 2006 es, por consiguiente, la cantidad de desempleados promedio del2005 multiplicada por los factores estacionales calculados por la función Series de Tiempo de IDEA.

    Gráfico del

    resultado

    Para justificar su informe el Director presentó el resultado en forma gráfica. Para ello siguió lossiguientes pasos:

    En la base de datos original de Desempleados extrajo los desempleados de California pertenecientesal período 2002 - 2005 (del 469 al 520) a una nueva base de datos llamada California 2002-2005.

    Desde la base de datos Pronósticos revisados 2006 extrajo los campos ESTADO, PERÍODO yREVISADO_2006 a una base de datos llamada California 2006.

    En la Base de datos California2006 Insertó un Campo Numérico Virtual con las siguientes

    especificaciones:

    • Nombre de campo: AÑO

    • Tipo: Numérico Virtual

    • Cantidad de Decimales: 0

    • Parámetro: 2006

    Usando la función Manejo de Campos modifique el nombre del campo REVISADO_2006 aPERSONAS.

    Tomando a la base de datos California 2002-2005 como la base de datos activa, usando la funciónAgregar Bases de Datos agregó la base de datos California 2006 para crear una nueva base de

    datos llamada California 2002-2006. Esta base de datos quedó conformada por 65 registros.En la nueva base de datos, usando la función Manejo de Campos, modificó el Tipo del campo AÑOde Numérico a Caracter puesto que los datos de este campo serían utilizados para el eje X delgráfico.

    Usando la función Graficar Datos obtuvo el gráfico detallado debajo en la Figura 3.16.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    54/58

    54 Caso de estudio Métodos Estadísticos Avanzados de IDEA

    Conclusión   El pronóstico del 2006 es, por consiguiente, el promedio del 2005 multiplicado por el factorestacional promedio del período bajo revisión (2006).

    Usando este método el director de la compañía pudo verificar si los presupuestos de los gerentesregionales estaban sesgados (demasiado altos o demasiado bajos en forma adrede) y si los gerentestenían conocimiento de la manera en que el patrón estacional afecta las ventas.

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    55/58

    Apéndice

    Apéndice

    La abreviación de PEAP hace referencia al Porcentaje de Error Absoluto Promedio. Este coeficiente sebasa en la serie de datos reales y la línea recta de pronósticos y se calcula de la siguiente manera:

    1. Para cada registro del grupo, se calcula la diferencia absoluta entre el valor real y la línea recta(valor adecuado) y luego se lo divide por el valor real.

    2. Se suman todas las diferencias absolutas calculadas anteriormente.

    3. Se calcula el promedio (dividiendo por la cantidad de registros de cada grupo).

    4. Se multiplica por 100.

    Cuanto más elevado sea el coeficiente PEAP, mayores serán las diferencias, en promedio, entre losvalores reales y los valores adecuados (línea recta). Estas diferencias son calculadas como unporcentaje.

    A continuación se proporciona un ejemplo simple con sólo dos valores reales y adecuados:

    Promedio = (0,0200 + 0,0476) / 2 = 0,0338

    Multiplicado por 100 = -.0338 * 100 = 3.38

    Porcentaje de Error Absoluto Promedio = 3.38

    Real Adecuado  Diferencia

    Absoluta (DA)DA divididapor Real

    100 98 2 0,0200

    105 110 5 0,0476

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    56/58

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    57/58

  • 8/18/2019 IDEA Advanced Statistical Methods Case Study

    58/58

    CASEWARE.COM