22
Elaborado por: Guillermo Baquerizo I Término 2012-2013 Bases de Datos II OLAP Online Analytical Processing

Elaborado por: Guillermo Baquerizo I Término 2012-2013

Embed Size (px)

Citation preview

Page 1: Elaborado por: Guillermo Baquerizo I Término 2012-2013

Elaborado por: Guillermo BaquerizoI Término 2012-2013

Bases de Datos IIOLAP

Online Analytical Processing

Page 2: Elaborado por: Guillermo Baquerizo I Término 2012-2013

ObjetivosEl estudiante será capaz de aprender:

el propósito del procesamiento analítico en línea.

las relaciones entre OLAP y los almacenes de datos (DATA WAREHOUSE).

las características clave de las aplicaciones OLAP.

cómo representar cubos multidimensionales.las categorías de las herramientas OLAP.

Page 3: Elaborado por: Guillermo Baquerizo I Término 2012-2013

ConceptosOLAP.- Se refiere a la síntesis, análisis y

consolidación de grandes volúmenes de datos multidimensionales. Es una solución utilizada en el campo BI (Business Intelligence), para lo cual utiliza cubos de información y puede ser utilizado en DATA MINING (Minería de Datos).

Page 4: Elaborado por: Guillermo Baquerizo I Término 2012-2013

ConceptosLas bases de datos relacionales se utilizan

principalmente para soportar sistemas de procesamiento de transacciones en línea (OLTP, Online Transaction Processing).

Los DBMS (DataBase Management System) relacionales se han desarrollado para permitir la ejecución eficiente de un gran número de transacciones relativamente simples.

Page 5: Elaborado por: Guillermo Baquerizo I Término 2012-2013

ConceptosLos DBMS relacionales han tratado de

dirigirse al mercado de los almacenes de datos y han promocionado sus sistemas como herramientas para construir este tipo de almacenes.

Para consultas más avanzadas se requiere el OLAP.

Page 6: Elaborado por: Guillermo Baquerizo I Término 2012-2013

Esquema

ETL

ExtractionTransformatio

nLoading

Sistemas Operacional

es

Metadatos

Datos resumidos

ERP

CRM

Archivosplanos Data WareHouse

OLAP

Reportes

Minería de datos

Page 7: Elaborado por: Guillermo Baquerizo I Término 2012-2013

AplicacionesÁrea funcional

Ejemplos de aplicaciones OLAP

Finanzas Presupuestos, desgloses de costos por actividad, análisis de rendimiento financiero y modelado financiero.

Ventas Análisis de ventas y previsiones de ventas.

Marketing Análisis de investigación de mercados, previsiones de ventas, análisis de promociones, análisis y segmentación de clientes.

Fabricación Planificación de la producción y análisis de defectos.

Page 8: Elaborado por: Guillermo Baquerizo I Término 2012-2013

Cubos multidimensionalesConsidere un ejemplo con los datos

multidimensionales vistos desde:Una tabla de 3 camposUna matriz bidimensionalUn cubo tridimensional

Page 9: Elaborado por: Guillermo Baquerizo I Término 2012-2013

CategoríasLas herramientas OLAP pueden clasificarse

de acuerdo con la arquitectura utilizada para almacenar y procesar los datos multidimensionales. Hay cuatro categorías principales:MOLAPROLAPHOLAPDOLAP

Page 10: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP Multidimensional (MOLAP)Las estructuras de datos MOLAP utilizan

tecnología matricial y técnicas eficientes de almacenamiento que minimizan las necesidades de espacio en disco, gracias a la gestión de datos dispersos.

Se suelen centrar en datos para una aplicación específica de ayuda a la toma de decisiones.

Page 11: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP Multidimensional (MOLAP)Problemas:

Sólo pueden almacenarse y analizarse de manera eficiente una cantidad limitada de datos.

La navegación y el análisis de los datos están limitados, porque los datos se diseñan de acuerdo a requisitos previamente determinados.

Los productos MOLAP requieren un conjunto diferente de capacidades y herramientas para construir y mantener la base de datos, incrementándose el costo y la complejidad de las tareas de soporte.

Page 12: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP Multidimensional (MOLAP)

Servidor de base de datos relacional y/o sistemas

heredados

Carga

Servidor MOLAP Solicitud de datos

Herramientas de acceso de

usuario final

Conjunto de resultados

Page 13: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP Relacional (ROLAP)Soportan los productos RDBMS mediantes el

uso de un nivel de metadatos, evitando así la necesidad de crear una estructura de datos mutidimensional estática. Esto facilita la creación de múltiples vistas multidimensionales de la relación bidimensional.

Para mejorar las prestaciones, algunos productos ROLAP disponen de motores SQL mejorados para soportar la compeljidad del análisis multidimensional.

Page 14: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP Relacional (ROLAP)Problemas:

Rendimiento asociado con el procesamiento de consultas complejas que requieran efectuar múltiples pasadas a través de los datos relacionales.

Desarrollo de middleware para facilitar el desarrollo de aplicaciones multidimensionales, es decir, software que convierta la relación bidimensional en una estructura multidimensional.

Desarrollo de una opción para crear estructuras multidimensionales persistentes, junto con las funciones para ayudar en la administración de estas estructuras.

Page 15: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP Relacional (ROLAP)

Servidor de base de datos relacional

Conjunto de resultados

Servidor ROLAP Solicitud de datos

Herramientas de acceso de

usuario final

Conjunto de resultados

SQL

Page 16: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP híbrido (HOLAP)Proporcionan capacidades limitadas de

análisis, bien sobre productos SGBDR o bien utilizando un servidor MOLAP intermedio.

Las herramientas HOLAP suministran a la máquina de escritorio los datos seleccionados en la forma de un cubo de datos, el cual se almacena, analiza y mantiene localmente.

Page 17: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP híbrido (HOLAP)Problemas:

La arquitectura provoca una significativa redundancia de los datos y puede causar problemas en las redes que soporten muchos usuarios.

La capacidad de cada usuario para construir un cubo de datos personalizado puede provocar una falta de coherencia entre los datos de los diferentes usuarios.

Sólo puede mantenerse de manera eficiente una cantidad limitada de datos.

Page 18: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP híbrido (HOLAP)Servidor de base de datos

relacional

Carga

Servidor MOLAP

Solicitud de datos

Conjunto de resultados

Herramientas de acceso de

usuario final

SQL

Conjunto de resultados

Page 19: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP de Escritorio (DOLAP)Almacenan los datos OLAP en archivos

situados en la plataforma del cliente y soportan el procesamiento multidimensional del lado del cliente.

Estos datos pueden distribuirse por adelantado o bajo petición, posiblemente a través de la web.

Aunque también se pueden mantener en el disco o la RAM, algunos productos DOLAP sólo permiten acceso de lectura.

Page 20: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP de Escritorio (DOLAP)Problemas:

Provisión de controles de seguridad apropiados para soportar todos los entornos.

Hace falta reducir el esfuerzo necesario para implantar y mantener las herramientas DOLAP.

Las formas existentes son: correo electrónico, web o la tradicional arquitectura cliente-servidor.

Las tendencias actuales apuntan hacia la utilización de máquinas cliente simples.

Page 21: Elaborado por: Guillermo Baquerizo I Término 2012-2013

OLAP de Escritorio (DOLAP)

Servidor de base de datos relacional

Servidor MOLAP

La distribución de los datos OLAP desde una base de datos

relacional o desde un servidor MOLAP hasta el PC de

escritorio o portátil se realiza utilizando

correo electrónico, la web o una

arquitectura tradicional cliente-

servidor.

Page 22: Elaborado por: Guillermo Baquerizo I Término 2012-2013

Extensiones al lenguaje SQLSe pueden realizar cálculos utilizando

agregación del tipo de SUM, COUNT, MAX, MIN, AVG

Capacidades de agrupamiento ampliadas:Rollup: Niveles crecientes de agregación

desde el más detallado hasta el más general. La instrucción es:

SELECT … GROUP BY (ListaDeColumnas) WITH ROLLUP

Cube: Similar a Rollup, pero permite todas las posibles combinaciones de agregaciones.

La instrucción es: SELECT … GROUP BY (ListaDeColumnas) WITH

CUBE