25
UNIVERSIDAD YACAMBÚ VICERRECTORADO DE INVESTIGACION Y POSTGRADO INSTITUTO DE INVESTIGACION Y POSGRADO DOCTORADO EN GERENCIA INTELIGENCIA DE NEGOCIOS (Business Intelligence “BI”) Doctorandos: Arráez, Oscar Camacho, Gisela Estanga, Marisela González, Beatriz Meléndez, Dilnan

Informe BI SIG Versión Def.docx

Embed Size (px)

Citation preview

UNIVERSIDAD YACAMBVICERRECTORADO DE INVESTIGACION Y POSTGRADOINSTITUTO DE INVESTIGACION Y POSGRADODOCTORADO EN GERENCIA

INTELIGENCIA DE NEGOCIOS (Business Intelligence BI)

Doctorandos:Arrez, OscarCamacho, GiselaEstanga, MariselaGonzlez, BeatrizMelndez, DilnanUrdaneta, Clareth Facilitador: Dr. Alfonso Carrillo

Barquisimeto, Agosto de 2014

INTRODUCCIN

Actualmente, en cualquier organizacin la toma de decisiones estratgicas es indispensable para lograr su mximo desarrollo. Generalmente estas decisiones, son basadas en grandes volmenes de informacin registrada en bases de datos operacionales o de otros tipos de fuentes de datos. La recopilacin y anlisis de esta informacin, dado su carcter heterogneo y su volumen, se convierte usualmente en un problema para las organizaciones y es aqu donde interviene la Inteligencia de Negocio (BI por sus siglas en ingls: Business Intelligence), mediante los Sistemas de Apoyo a la Toma de Decisiones. Como sustento a esta aplicacin, el objetivo de este trabajo es abordar los principales productos de Business Intelligence, en este caso: Sistemas de Informacin Ejecutiva (EIS), Datamart, Datawarehouse, OLTP (On-Line Transactional Processing): El procesamiento transaccional en lnea, OLAP, que proviene de Online Analitical Processing (Procesamiento Analtico en Lnea), su relacin e importancia a los Sistemas Gerenciales.

Business Intelligence o Inteligencia de negocios

En 1989, Howard Dresner, investigador de Gartner Group, propuso las siglas BI (Business Intelligence o Inteligencia de negocios) para referir el conjunto de conceptos y mtodos para mejorar la toma de decisiones empresariales mediante el uso de sistemas basados en hechos de apoyo. Segn esta definicin los datos constituyen la fuente principal del concepto. En este sentido, este tipo de herramientas y tcnicas deben garantizar el acceso de los usuarios a los datos con independencia de la procedencia de stos. Se busca ir ms all en la presentacin de la informacin, de manera que los usuarios gocen de acceso a herramientas de anlisis a travs de las cuales puedan acceder, seleccionar y manipular slo aquellos datos que les interesen.

Figura 1. Datos-Informacin-Conocimiento. Fuente: Open Task Professional Services.

Para Sinnexus (ver: http://www.sinnexus.com/business_intelligence/), la BI es la habilidad de transformar los datos en informacin, y la informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.Este conjunto de herramientas y metodologas tienen en comn las siguientes caractersticas: Accesibilidad a la informacin. Permite a los usuarios el acceso a los datos de manera independiente Apoyo en la toma de decisiones. Permite el acceso de los usuarios a herramientas de anlisis Orientacin al usuario final. Se busca la independencia entre los conocimientos tcnicos de los usuarios y su capacidad para utilizar estas herramientas. Desde una perspectiva ms prctica, BI incluye todas las metodologas, aplicaciones o tecnologas cuyo objetivo sea reunir y transformar datos en informacin estructurada en principio y a posteriori convertirla en conocimiento. El desarrollo de la BI en la organizacin actual puede generar importantes ventajas competitivas en las diferentes reas de conocimiento de la empresa: Mercadeo, finanzas, planificacin, produccin adems tiene una amplia gama de aplicaciones aparte de las ya mencionadas. De acuerdo con Sinnexus (ob cit), los principales productos de Business Intelligence que existen hoy en da son: Cuadro de Mando Integral (CMI): Tambin conocido como Balanced Scorecard (BSC) o dashboard, es una herramienta de control empresarial que permite establecer y monitorizar los objetivos de una empresa y de sus diferentes reas o unidades. Consiste bsicamente en una aplicacin que ayuda a una organizacin a expresar los objetivos e iniciativas necesarias para cumplir con su estrategia, mostrando de forma continuada cundo se alcanzan los resultados definidos en su plan estratgico. Sistemas de Soporte a la Decisin (DSS): Es una herramienta de BI enfocada al anlisis de los datos de una organizacin. El principal objetivo es explotar al mximo la informacin residente en una base de datos corporativa (datawarehouse o datamart), mostrando informes muy dinmicos y con gran potencial de navegacin, pero siempre con una interfaz grfica amigable, vistosa y sencilla. Sistemas de Informacin Ejecutiva (EIS): Se puede definir como una aplicacin informtica que muestra informes y listados de las diferentes reas de negocio, de forma consolidada, para facilitar la monitorizacin de la empresa o de una unidad de la misma. Provee a los gerentes de un acceso sencillo a informacin interna y externa de su compaa, que es relevante para sus factores clave de xito. Sistemas de Informacin Ejecutiva (EIS)

Un EIS es una herramienta software, basada en un sistema de soporte a la decisin o DSS, que provee a los ejecutivos de un acceso sencillo a informacin interna y externa de su empresa. La finalidad principal es que el ejecutivo tenga a su disposicin un panorama completo del estado de los indicadores de negocio que le afectan al instante, manteniendo tambin la posibilidad de analizar con detalle aquellos que no estn cumpliendo con las expectativas establecidas por la compaa, para determinar el plan de accin ms adecuado. Tambin se puede definir un EIS como una aplicacin informtica que muestra informes y listados de las diferentes reas de negocio, de forma consolidada, para facilitar la monitorizacin de la empresa o de una unidad de la misma. El EIS se caracteriza por ofrecer al gerente un acceso rpido y efectivo a la informacin compartida, utilizando interfaces grficas visuales e intuitivas. La base de datos ejecutiva enva y recibe informacin al ordenador personal y el mismo solicita informacin. Del ordenador personal, pasa al central que es el que proporciona informacin corporativa a otras estaciones de trabajo ejecutivo.

Carctersticas del EIS:

Diseado para cubrir las necesidades especficas y particulares de la alta administracin. Extraen, filtran, comprimen y dan seguimiento a informacin crtica del negocio. Pueden acceder a informacin en lnea extrayndolo directamente de las BDs de la organizacin. El sistema est soportado por elementos especficos de hardware.

Factores:

Que se vea bien. Que sea relevante. Que sea rpido. Que la informacin est disponible y actualizada.

Por otro lado, los principales componentes de orgenes de datos en el Business Intelligence que existen en la actualidad son: Datamart: es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Datawarehouse: es una base de datos corporativa que se caracteriza por integrar y depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo su anlisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creacin de un datawarehouse representa en la mayora de las ocasiones el primer paso, desde el punto de vista tcnico, para implantar una solucin completa y fiable de Business Intelligence. En la figura siguiente se muestra la relacin entre los elementos anteriormente explicados.

Figura 2. Componentes del BI. Fuente: Padrn, Liudmila (2006).

En lo que se refiere a las bases de datos que soportan una solucin BI, se destacan dos tipos de sistemas:OLTP (On-Line Transactional Processing): El procesamiento transaccional en lnea (OLTP On Line Transaction Processing), conocido tambin como procesamiento operacional, sustenta las operaciones diarias de la empresa y describe los requerimientos operacionales del sistema. Este procesamiento se refiere a un tipo de cmputo en el cual el nfasis est en el procesamiento de las transacciones tal y como son recibidas por las aplicaciones.Las aplicaciones de bases de datos con procesamiento transaccional en lnea (OLTP) son ptimas en el manejo de los datos que constantemente estn cambiando y usualmente tienen un gran nmero de usuarios que estn ejecutando transacciones simultneamente y que actualizan modifican los datos en tiempo real. Aunque los requerimientos individuales por usuarios sobre los datos tienden a referenciar pocos artculos, muchos de estos requerimientos son solicitados al mismo tiempo. De ah que las principales preocupaciones en este tipo de aplicacin sean la concurrencia y la atomicidad. Hace referencia a un sistema de almacenamiento que usa mltiples discos duros entre los que distribuye o replica los datos. Dependiendo de su configuracin (a la que suele llamarse nivel), los beneficios de un RAID respecto a un nico disco son uno o varios de los siguientes: mayor integridad, mayor tolerancia a fallos, mayor throughput (rendimiento) y mayor capacidad. Son bases de datos orientadas al procesamiento de transacciones. Una transaccin puede involucrar operaciones de insercin, modificacin y borrado de datos. El proceso transaccional es tpico de las bases de datos operacionales. Sus principales caractersticas son: El acceso a los datos est optimizado para tareas frecuentes de lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de bancos o hipermercados diariamente). Los datos se estructuran segn el nivel aplicacin (programa de gestin a medida, ERP o CRM implantado, sistema de informacin departamental...). Los formatos de los datos no son necesariamente uniformes en los diferentes departamentos (es comn la falta de compatibilidad y la existencia de islas de datos). El historial de datos suele limitarse a los datos actuales o recientes.

OLAP (On-Line Analytical Processing): son bases de datos orientadas al procesamiento analtico. Este anlisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algn tipo de informacin til: tendencias de ventas, patrones de comportamiento de los consumidores, elaboracin de informes complejos etc. El trmino OLAP, que proviene de Online Analitical Processing (Procesamiento Analtico en Lnea), define a una tecnologa que se basa en el anlisis multidimensional de los datos y que le permite al usuario tener una visin ms rpida e interactiva de los mismos. Este anlisis, tambin conocido como anlisis del hipercubo, organiza la informacin segn los parmetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendr la informacin requerida. Este sistema es tpico de los datamarts, se caracteriza por lo siguiente: El acceso a los datos suele ser de slo lectura. La accin ms comn es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones. Los datos se estructuran segn las reas de negocio, y los formatos de los datos estn integrados de manera uniforme en toda la organizacin. El historial de datos es a largo plazo, normalmente de dos a cinco aos. Las bases de datos OLAP se suelen alimentar de informacin procedente de los sistemas operacionales existentes, mediante un proceso de extraccin, transformacin y carga (ETL). Es una solucin utilizada en el campo de Business Intelligence cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de direccin, minera de datos y reas similares.

Figura 3: Integracin de estructuras OLTP Y OLAP en un Sistema Gerencial. Fuente: IconSystems 10g La razn de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para bsquedas (aunque peor desde el punto de vista operativo) es una base de datos multidimensional.

Objetivo

Su objetivo principal es agilizar la consulta de grandes cantidades de datos. Usa cubos, se usa en informe de ventas, minera de datos y similares.

Funcionalidad En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (tambin llamado cubo multidimensional o hipercubo). Se compone de hechos numricos llamados medidas que se clasifican por dimensiones. El cubo de metadatos es tpicamente creado a partir de un esquema en estrella o copo de nieve, esquema de las tablas en una base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensin de los cuadros.

Cubo OLAP

Para funcionar, las aplicaciones OLAP utilizan un tipo de base de datos que posee la peculiaridad de ser multidimensional, denominada Cubo OLAP, estoscubos son vectores en los cuales se dispone la informacin y gracias a este orden jerrquico es posible llevar a cabo un anlisis rpido de los datos. Cada una de las dimensiones que posee la base de datos incorpora un campo determinado para un tipo de dato especfico, que luego podr ser comparado con la informacin contenida en el resto de dimensiones, para hacer posible la evaluacin y posteriores informes de la informacin relevante para una organizacin. Una base de datos multidimensional puede contener varios cubos o vectores que extendern las posibilidades del sistema OLAP con el cual se trabaja.

Caractersticas de OLAP

Capacidad de anlisis.

Para que los usuarios sean capaces de explotar el potencial de la informacin en forma efectiva es necesario brindarles una buena combinacin de facilidades avanzadas para la manipulacin y presentacin de datos. Entre las caractersticas de OLAP dirigidas en este sentido se destacan la utilizacin de avanzadas interfaces grficas, capaces de presentar la informacin en forma numrica o grfica y de permitir el dilogo con el usuario directamente sobre la informacin que es visualizada. Rapidez.

Accesibilidad.

Esta tecnologa es de gran valor para los niveles ejecutivos ygerenciales debido a la importancia que reviste el contar coninformacin oportuna y facilidades para su anlisis en el momento de la toma de decisiones.

Beneficios.

Los beneficios que son posibles de obtener mediante la aplicacin de esta tecnologa estn estrechamente vinculados con el poder que la informacin puede aportar a las organizaciones que logren la capacidad de aplicarla como un agente activo para la mejora de los procesos y desarrollo de una ventaja competitiva. El uso oportuno, eficiente y profundo de la informacin, por parte de cada uno de los niveles de la organizacin puede ser la base de una mejora sustancial en el desarrollo de los procesos y la capacidad de la empresa de alcanzar sus objetivos. Otro de los beneficios de esta tecnologa es la reduccin de los costos propios de la generacin y trabajo con la informacin, mediante la aplicacin de mecanismos integrados y modernos de extraccin, armado, distribucin, comprensin y anlisis.

La estrategia.

Debido a la imperiosa necesidad de las organizaciones de poner en prctica los beneficios de esta tecnologa y a su capacidad de integracin con la tecnologa ya existente, es que se abre la oportunidad de encarar su incorporacin mediante proyectos cortos y de alto impacto en las reas claves. La estrategia consiste en el desarrollo de modelos multidimensionales que ataquen la descripcin de reas o temas especficos. Estos modelos son puestos en marcha e incorporados al proceso diario de trabajo, aprovechando los cortos tiempos que tambin presenta el entrenamiento en el uso de los sistemas por parte de los usuarios finales.

Tipos de sistemas OLAP

Tradicionalmente, los sistemas OLAP se clasifican segn las siguientes categoras:

ROLAP: Implementacin OLAP que almacena los datos en un motor relacional. Tpicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran desnormalizadas Los esquemas ms comunes sobre los que se trabaja son estrella copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura est compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que permite el anlisis de una enorme cantidad de datos.

MOLAP: Esta implementacin OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la informacin es usualmente calculado por adelantado. Estos valores pre calculados o agregaciones son la base de las ganancias de desempeo de este sistema. Algunos sistemas utilizan tcnicas de compresin de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.

HOLAP (Hybrid OLAP): Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional.Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las caractersticas especficas de los beneficios entre los proveedores).Algunas implementaciones MOLAP son propensas a la "explosin" de la base de datos; este fenmeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones: elevado nmero de dimensiones, resultados pre calculados y escasos datos multidimensionales. Las tcnicas habituales de atenuacin de la explosin de la base de datos no son todo lo eficientes que sera deseable.Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexacin y a las optimizaciones de almacenamiento. MOLAP tambin necesita menos espacio de almacenamiento en comparacin con los especializados ROLAP porque su almacenamiento especializado normalmente incluye tcnicas de compresin.ROLAP es generalmente ms escalable. Sin embargo, el gran volumen de pre procesamiento es difcil de implementar eficientemente por lo que con frecuencia se omite; por tanto, el rendimiento de una consulta ROLAP puede verse afectado.Desde la aparicin de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar clculos, las funciones especializadas que se pueden utilizar tienen ms limitaciones.HOLAP (OLAP Hbrido) engloba un conjunto de tcnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible. Generalmente puede pre-procesar rpidamente, escala bien, y proporciona una buena funcin de apoyo.

Otros tiposLos siguientes acrnimos a veces tambin se utilizan, aunque no son sistemas tan generalizados como los anteriores:

WOLAP o Web OLAP: OLAP basado u orientado para la web. DOLAP o Desktop OLAP: OLAP de escritorio RTOLAP o Real Time OLAP: OLAP en tiempo real SOLAP o Spatial OLAP: OLAP espacial

Cuadro 1:Comparacin entre los Tipos de sistemas OLAP Tipos de sistemas OLAP

CaractersticasROLAPMOLAPHOLAP (Hybrid OLAP)

Almacenamiento de Datosalmacena los datos en un motor relacionalalmacena los datos en una base de datos multidimensionalAlmacena algunos datos en un motor relacional y otros en una base de datos multidimensional.

EspacioMayor EspacioMenos espacioMenos espacio

RendimientoMenos rendimientomejor rendimientopuede pre-procesar rpidamente

Elaboracin propia , Fuente IconSystems 10g

En resumen, los sistemas y componentes del BI se diferencian de los sistemas operacionales en que estn optimizados para preguntar y divulgar sobre datos. Esto significa que, en un datawarehouse, los datos estn desnormalizados para apoyar consultas de alto rendimiento, mientras que en los sistemas operacionales suelen encontrarse normalizados para apoyar operaciones continuas de insercin, modificacin y borrado de datos. En este sentido, los procesos ETL (extraccin, transformacin y carga), que nutren los sistemas BI, tienen que traducir de uno o varios sistemas operacionales normalizados e independientes a un nico sistema desnormalizado, cuyos datos estn completamente integrados. En definitiva, retomando los aportes de Sinexxus, una solucin BI completa permite:* Observar: qu est ocurriendo?* Comprender: por qu ocurre?* Predecir: qu ocurrira?* Colaborar: qu debera hacer el equipo?* Decidir: qu camino se debe seguir? En conclusin, BI es una herramienta moderna y de nueva generacin, disponible para quienes tienen la necesidad de analizar el pasado, conocer el presente y usar herramientas estadsticas de prediccin, todo ello con la finalidad de estar un paso adelante de los competidores, mejorando el rendimiento y productividad de la organizacin. Fundamentar todas las decisiones no estructuradas, presentes en los niveles tctico (gerencia media) y estratgico (alta gerencia), sobre la base de un conocimiento preciso y elaborado, con el uso de herramientas y tcnicas evolucionadas y tecnolgicas, destinadas para el efecto, y basados en el modelo de los sistemas OLAP , permite tener organizaciones con informacin histrica que les ayudar a la toma de decisiones proyectados al futuro y orientados a una mejor toma de decisiones.

REFERENCIAS:Espieira, Sheldon y Asociados. Boletn de asesora gerencial. La inteligencia de negocios. ( Business Intelligence). N 10 2008. Disponible en https://www.pwc.com/ve/es/asesoria-gerencial/boletin/assets/boletin-advisory-edicion-10-2008. Consultado en agosto 2014.Sinnexus Business Intelligence Informtica estratgica. Disponible en: http://www.sinnexus.com/business_intelligence/index.aspx. Consultado en agosto 2014.ITMADRID. Qu es Inteligencia de Negocios (Business Intelligence)?. Disponible en: http://www.itmadrid.com/blog/que-es-inteligencia-de-negocios-business-intelligence/ . Consultado en agosto 2014.PADRN, Liudmila (2006). Almacenes de datos: importancia de la estandarizacin de las direcciones para las empresas de hoy en da.