27
Facultad de Ingeniería y Ciencias Ingeniería en Sistemas de Computación e Informática Conceptos de Datawarehousing Ing. Jonathan Carrillo Quito, Marzo 2015 BASES DE DATOS MULTIDIMENSIONALES

2. Conceptos de Datawarehousing

Embed Size (px)

DESCRIPTION

Descripcion de un datawarehouse

Citation preview

  • Facultad de Ingeniera y CienciasIngeniera en Sistemas de Computacin e Informtica

    Conceptos de Datawarehousing

    Ing. Jonathan CarrilloQuito, Marzo 2015

    BASES DE DATOS MULTIDIMENSIONALES

  • Contenido:

    1. Introduccin a las bases de datos multidimensionales

    2. Evolucin, beneficios y problemas de los Datawarehouse

    3. Arquitectura de un Datawarehouse

    4. Data Marts

    5. Conclusin

    Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    DataWarehouse

    > Es una base de datos corporativa en la que se

    integra informacin depurada de las diversas

    fuentes que hay en la organizacin. Dicha

    informacin debe ser homognea y fiable, se

    almacena de forma que permita su anlisis desde

    muy diversas perspectivas, [y con] tiempos de

    respuesta ptimos.

    Ramos, 2011

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    DataWarehouse

    > Es un repositorio de datos que proporciona una

    visin global, comn e integrada de los datos de

    la organizacin independientemente de cmo se

    vayan a utilizar posteriormente por los

    consumidores o usuarios, con las propiedades

    siguientes: estable, coherente, fiable y con

    informacin histrica.

    Curto, 2011

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    DataWarehouse

    > El almacenamiento de datos (data warehousing)

    y el procesamiento analtico en lnea (on - line

    analytical processing ) OLAP, son elementos

    esenciales en el soporte de decisiones, de las

    bases de datos

    Chandhuri, S.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    DataWarehouse

    > Por medio de los conceptos anteriores, podemos

    decir entones que un dataWarehouse es:

    Una Base de Datos

    BDD: estable, coherente, fiable y con

    informacin histrica

    Almacena datos corporativos

    Integra informacin depurada

    Sirve como soporte para la toma de

    decisiones y para el anlisis de tendencias.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    > Bill Inmon fue uno de los primeros autores en

    escribir sobre el tema de los DataWarehouse en

    los siguientes trminos:

    Un Data Warehouse o Almacn de Datos es

    una coleccin de datos orientado a temas,

    integrado, de tiempo variante y no voltil,

    que se usa para el soporte del proceso de

    toma de decisiones gerenciales.

    Inmon, 1993

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Orientado a temas: la informacin se clasifica en

    base a los aspectos que son de inters para la

    empresa (clientes, productos, ventas)

    > Por ejemplo, para un fabricante, stos pueden ser

    clientes, productos, proveedores y vendedores.

    > Para una universidad pueden ser estudiantes,

    clases y profesores.

    > Para un hospital pueden ser pacientes, personal

    mdico, medicamentos, etc.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Orientado a temas:

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado: La integracin de datos se muestra de

    muchas maneras:

    > en convenciones de nombres consistentes,

    > en la medida uniforme de variables,

    > en la codificacin de estructuras consistentes,

    > en atributos fsicos de los datos consistentes,

    > fuentes mltiples y otros.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    DataWarehouse

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    > Para integrar, se debe tomar en cuenta las

    convenciones (estandarizacin) utilizada por los

    diseadores de las aplicaciones. stas se

    diferencian en:

    la codificacin,

    en las estructuras claves,

    en sus caractersticas fsicas,

    en las convenciones de nombramiento y

    otros. Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    >Codificacin. Los diseadores de aplicaciones

    codifican el campo GENERO por ejemplo, en

    varias formas.

    > Un diseador representa GENERO como una

    "M" y una "F", otros como un "1" y un "0", otros

    como una "X" y una "Y" e inclusive, como

    "masculino" y "femenino".

    > Por lo que GENERO debe llegar al

    DataWarehouse en un estado integrado uniforme.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    Ejemplo de Codificacin

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    Ejemplo de Codificacin

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    >Caractersticas Fsicas. Formatos de los

    atributos de medida de las fuentes de datos, por

    ejemplo en centmetros, otros en pulgadas, otros

    en millones de pies cbicos por segundo y otros

    en yardas.

    > Cualquiera que sea la fuente, cuando la

    informacin del atributo llegue al

    DataWarehouse necesitar ser una medida que

    mantenga el formato de la misma manera.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    Ejemplo de Caractersticas Fsicas

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    >Convenciones de Nombramiento: El mismo

    elemento es frecuentemente referido por nombres

    diferentes en las diversas aplicaciones.

    > Por ejemplo, bases de datos que no mantengan un

    estndar de nombramiento: NombEmple; con

    otra que mantenga una convencin:

    NombreEmpleado.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    >Fuentes Mltiples: El mismo elemento puede

    derivarse desde fuentes mltiples.

    > En este caso, el proceso de transformacin debe

    asegurar que la fuente apropiada sea usada,

    documentada y movida al DW.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    Ejemplo de Fuentes Mltiples

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    Integrado:

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    Ejemplo de Fuentes Mltiples

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    De tiempo variante:

    > Toda la informacin del DataWarehouse es

    requerida en algn momento, en contraste con la

    informacin en el ambiente operacional.

    > Como la informacin en el DataWarehouse es

    solicitada en cualquier momento (es decir, no

    "ahora mismo"), los datos encontrados en el DW

    se llaman de "tiempo variante".

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    De tiempo variante: La informacin del DW debe

    incluir los datos histricos para usarse en la

    identificacin y evaluacin de tendencias.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    La informacin del data warehouse es,

    para todos los propsitos prcticos,

    una serie larga de "snapshots" (vistas

    instantneas).

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    No voltil:

    > La informacin en el DW no se modifica ni se

    elimina, una vez almacenado un dato, ste se

    convierte en informacin de slo lectura, y se

    mantiene para futuras consultas. Los datos

    almacenados no son actualizados, slo son

    incrementados.

    > Las actualizaciones de la base de datos

    operacional no ocurren en el entorno del

    DataWarehouse, no se requieren mecanismos de

    control de la concurrencia y recuperacin.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    No voltil:

    > En el DW se requieren dos operaciones nada

    ms: Carga inicial de los datos y acceso a datos.

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

  • Conceptos de Datawarehousing

    1. Introduccin a las bases de datos multidimensionales

    Caractersticas de un DataWarehouse

    No voltil:

    > Operacional VS. DatawareHouse

    Ing. Jonathan Carrillo - Marzo 2015 Ing. Jonathan Carrillo - Marzo 2015

    Voltiles No voltiles

    DW