23
OLAP vs OLTP

OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Embed Size (px)

Citation preview

Page 1: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

OLAP vs OLTP

Page 2: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

OLAP vs. OLTP• OLTP (On Line Transaction Processing)

(Procesamiento de transacción en línea) Bases de datos orientadas al

procesamiento de transacciones.• OLAP (On Line Analytic Processing)

(Procesamiento analítico en línea) Bases de datos orientadas al

procesamiento analítico.OLTP

Insert

Delete

Update

Select

ACID

OLAP

Page 3: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

OLAP

• Permite a los usuarios de negocio examinar minuciosamente los datos a su antojo.

• Normalmente, los datos en una organización se distribuyen en múltiples fuentes de datos y son incompatibles entre sí.

• Un ejemplo de venta: – Los datos de punto de ventas y las ventas realizadas a través del

call-center o en la web se almacenan en lugares y formatos diferentes. Para un ejecutivo obtener informes OLAP como - ¿Cuáles son los productos más populares comprados por clientes entre las edades de 15 a 30? es un proceso que lleva tiempo.

Page 4: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

• Parte del proceso de implementación OLAP consiste en extraer los datos de diferentes repositorios y hacerlos compatibles.

• Hacer compatibles los datos consiste en garantizar que el significado de los datos en un repositorio coincida con el de otros repositorios.

• Un ejemplo de datos incompatibles: – Las edades de los clientes se pueden almacenar como fecha

de nacimiento en las compras realizadas a través de Internet y almacenarse en categorías de edad (es decir, entre 15 y 30) para ventas en las tiendas.

Page 5: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

OLAP vs. OLTP

Sistema Operacional (OLTP)Data Warehouse (Basado en

Modelos Dimensionales: OLAP)

Almacena datos actuales. Almacena datos históricos.

Almacena datos de detalle. Amacena datos de detalle y datos agregados a distintos niveles.

Los datos son dinámicos (actualizables).

Los datos son estáticos.

Las transacciones son repetitivos. Los procesos no son previsibles.

El número de transacciones es elevado.

El número de transacciones es bajo o medio.

Dedicado al procesamiento de transacciones.

Dedicado al análisis de datos.

Orientado a los procesos de la organización.

Orientado a la información relevante.

Soporta decisiones diarias. Soporta decisiones estratégicas.

Sirve a muchos usuarios administrativos.

Sirve a técnicos de dirección.

Page 6: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Data Warehouse• El objetivo del almacenamiento de datos es generar un front-end de

análisis que apoye a los ejecutivos de negocios y gerentes de operaciones.

Page 7: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Pre-Data Warehouse• Proporciona los datos para el Data Warehouse.• Metadatos garantiza la exactitud de los datos que

entran en el proceso de ciclo de vida de los datos. Asegura que los datos tienen el formato y relevancia.

Limpieza de Datos• Antes de que los datos entren en el almacén de datos,

la extracción, transformación y limpieza (ETL) asegura que los datos pasan el umbral de calidad de datos.

• ETLs son también responsables de las tareas programadas que extraer los datos de los OLTPs.

Page 8: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Repositorios de Datos• El Data Warehouse es la base de datos que almacena datos activos de

valor de negocio para una organización. • Hay variantes de Almacenes de Datos - Data Marts y ODS. • Los Data Marts no son físicamente diferentes de los almacenes de datos.

– Pueden ser vistos como pequeños data warehouses basados en un departamento en lugar de a nivel de toda la compañía.

• Un Data Warehouse recoge datos y es el depositario de datos históricos. Por lo tanto, no siempre es eficiente para proporcionar análisis hasta la fecha . Aquí es donde los ODS, almacenes de datos operativos, ayudan.

• Los ODSs se utilizan para mantener los datos más recientes antes de la migración hacia el Data Warehouse.

• ODS se utilizan para almacenar datos que tienen una historia más profunda que OLTPs. Mantener grandes cantidades de datos en OLTPs puede reducir la velocidad de procesamiento – imaginen esperar en el cajero automático 10 minutos entre las indicaciones para las entradas.

Page 9: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Análisis Front End• Las aplicaciones de front-end que los usuarios de negocio a utilizan para

interactuar con los datos almacenados en los repositorios.• Data Mining: es el descubrimiento de patrones útiles en los datos. Por

ejemplo, ¿Cuál es la probabilidad de que un cliente migre a un competidor?• OLAP, procesamiento analítico en línea, se utiliza para analizar datos y a

menudo son utilizados por los gerentes de marketing. Por ejemplo: ¿Cuántos clientes entre los 24-45 años de edad, que viven en la provincia del Guayas, compran más de $1000 dólares en el supermercado en un mes?

• Las Herramientas de informes se utilizan para proporcionar informes sobre los datos.

• Las Herramientas de visualización de datos se usan para mostrar datos de un repositorio de datos. A menudo, la visualización de datos se combina con la minería de datos y herramientas OLAP. La Visualización de datos puede permitir al usuario manipular los datos para mostrar la relevancia y los patrones.

Page 10: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

OLTP

• Ejemplos de OLTPs pueden incluir ERP, CRM, SCM, aplicaciones de Punto de Venta, Call Center.

• Están diseñados para una velocidad de transacción óptima.

• Los datos no se almacenan por un período prolongado en OLTPs, por costos de almacenamiento y las razones de velocidad de transacciones.

Modelo de Datos para un OLTP

Page 11: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

OLAPModelo Dimensional de Datos

• OLAPs están diseñados para ofrecer un análisis general de lo que sucedió.

• Por lo tanto el almacenamiento de datos (es decir, el modelado de datos) tiene que establecerse de manera diferente.

• El método más común es el diseño de la estrella.

• Son distintos a la tercera forma normal, utilizados en sistemas OLTP.

El supervisor que dio la mayoría de los descuentos.La cantidad enviada en una fecha determinada, mes, año o trimestre.

En cual código postal el producto A se vende más.

Page 12: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

OLAP

Para obtener respuestas, como las anteriores, a partir de un modelo de datos cubos OLAP se crean.Para los usuarios es llamado cubo mientras que para los desarrolladores modelo multidimensional.Cubos OLAP no son estrictamente cuboides - es el nombre dado al proceso de vinculación de datos desde las diferentes dimensiones.

Tiempo

Producto

Cliente

Page 13: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Conceptos

• Dimensión: Es una categoría de información, por ejemplo, la dimensión del tiempo.

• Atributo: Es un nivel único dentro de una dimensión, por ejemplo Mes en la dimensión del tiempo.

• Jerarquía: La especificación de niveles que representa la relación entre los diferentes atributos en una dimensión, por ejemplo, Año->Trimestre->Mes->Día

Page 14: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Conceptos

• Tabla de hechos: La tabla de hechos contiene las medidas de interés. Por ejemplo, el monto de ventas puede ser esta medida. Esta medida puede ser almacenada en la tabla de hechos con la granularidad apropiada. Por ejemplo puede ser monto de ventas en cada tienda cada día.

Page 15: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Conceptos

• Granularidad: Se refiere al mínimo nivel de información que será almacenada en la tabla de hechos. Es el nivel de detalle.

Page 16: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Conceptos

• Tabla LookUp: Provee información detallada acerca de los atributos. Por ejemplo, una tabla LookUp para el atributo Trimestre incluiría una lista de información de todos los trimestres disponibles en el datawarehouse, y cada columna (cada trimestre) incluiría muchos campos entre ellos un id que identifique al Trimestre, y campos adicionales que especifiquen que tan particular es el trimestre (primer trimestre del año, etc.)

Page 17: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Enfoque Tecnológico

• Desktop OLAP (DOLAP)– El cubo se forma en el cliente– Las operaciones las realiza el cliente una vez que

se extrae la información de las bases.

Motor

MotorCliente

Cubo

Page 18: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Enfoque Tecnológico

• Relational OLAP (ROLAP)– El visualizador pregunta al cubo creado dónde está

la base, ambos creados por el RDMS (motor), si se requiere algo de otra base, los motores interactúan y el cubo se forma con esos datos.

Cliente

Page 19: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Enfoque Tecnológico

• Multidimensional OLAP (MOLAP)– El MDBMS forma la base, abstrayendo datos de

otras bases RDBMS.– El cubo es creado por el MDBMS– WAC permite la manipulación del cubo.

Cliente

MDBMS

RDBMS

RDBMS

Page 20: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Enfoque Tecnológico

• Hibrid OLAP (HOLAP): Mezcla el multidimensional con el ROLAP.

Page 21: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Visualizando el Cubo..

Gye Uio Cue Rio

Ana

Juan

Mia

Pablo

250

10

100

300

15

50

400

17

30

200 100

20

100

100 250 300

El punto cartesiano es un conjunto de valores.

El cubo siempre va a tener la dimensión del tiempo.

Page 22: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de

Visualizando el Cubo..

Gye Uio Cue Rio

Ana

Juan

Mia

Pablo

20032002

2001

Drill UP, Drill Down, subo y bajo según mi granularidad lo permita.

Cuando se quiere cambiar de columna, se lo hace bajo ciertas condiciones, como el efecto de la columna de pivoteo, al cambiarla, cambian sus coordenadas.

Page 23: OLAP vs OLTP. OLAP vs. OLTP OLTP (On Line Transaction Processing) (Procesamiento de transacción en línea) Bases de datos orientadas al procesamiento de