23
PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Embed Size (px)

Citation preview

Page 1: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

PENTAHO BI (Open Source)Introducción

Taller Técnicos PENTAHO – Junio 2011

Page 2: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Introducción a Pentaho BI: Enterprise & Community.

Componentes de la Plataforma Pentaho Reporting Análisis de Datos (Mondrian – JPIVOT) Dashboard Pentaho Data Integration Data Mining - WEKA

Instalación y Administración de Pentaho BI Comunity: Consola administrativa:

Definición de Datasource Usuarios y Roles Repositorio

Consola de Usuario  Taller Pentaho Junio 2011

UNNOBA

Page 3: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

¿Qué es Business Intelligence? “Inteligencia de Negocios es el proceso de convertir

datos en conocimientos y el conocimiento en acción, para la toma de decisiones”

DATOSDATOS ANÁLISISANÁLISIS CONOCIMIENTO

CONOCIMIENTO

Tecnologías involucradas: Data Warehouse Reporting Análisis OLAP (On-line Analytical Processing) Dashboards Integración de datos (ETL – Extract, Transform and load) Minería de datos

Taller Pentaho Junio 2011UNNOBA

Page 4: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Círculo virtuoso de la información

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

¿Qué pasó? - ¿Qué pasa ahora? - ¿Por qué pasó? - ¿Qué pasará?

Page 5: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Beneficios

ATOSATOS ANÁLISISANÁLISIS CONOCIMIENTO

CONOCIMIENTO

Crear un círculo virtuoso de la información ( datos – información – mejores decisiones – generan nuevos datos)

Permite una visión única, histórica, persistente y de calidad de la información.

Crear, manejar y mantener KPI (indicadores de rendimiento) y KGI (indicadores de metas).

Aporta información actualizada. Reduce la brecha de orientación de negocios entre el

departamento de IT y la organización. Mejorar la competitividad como resultado de ser capaces

de: Diferenciar lo relevante de lo superfluo Acceder más rápido a la información Tener mayor agilidad en la toma de decisiones.

Taller Pentaho Junio 2011UNNOBA

Page 6: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

¿Cuándo es necesaria la inteligencia de negocio?

ATOSATOS ANÁLISISANÁLISIS CONOCIMIENTO

CONOCIMIENTO

La toma de decisiones es realizada en forma intuitiva.

Se detectan problemas de calidad de información.

Excel Caos = uso intensivo de Excel como herramienta de análisis. Cada usuario con un archivo personalizado, por lo que la información es inconsistente entre las áreas y el costo de sincronización elevado.

Necesidad de cruzar información entre áreas.

Se ha alcanzado una masa crítica de datos.

Es necesario automatizar los procesos de extracción y distribución de la información.

Taller Pentaho Junio 2011UNNOBA

Page 7: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

¿Cómo detectar que no existe una estrategia de BI?

ATOSATOS ANÁLISISANÁLISIS CONOCIMIENTO

CONOCIMIENTO

Los usuarios identifican al departamento de IT como origen de sus problemas de inteligencia de negocios.

El nivel jerárquico más alto considera que BI representa otro centro de costo.

El departamento de IT continúa preguntando a los usuarios finales sobre las necesidades de los reportes.

El sistema de BI está soportado por una Mesa de Ayuda No es posible medir el uso del sistema de BI No hay un plan para desarrollar, contratar, retener y aumentar

el equipo de BI. No existe un responsable funcional (o bien el asignado no es el

adecuado). Existen múltiples soluciones que repiten funcionalidad. Alguien cree que es un éxito que la información consolidada

esté disponible a los usuarios finales al cabo de 2 semanas.

Los usuarios creen que la información en el DW no es correcta.Taller Pentaho Junio 2011UNNOBA

Page 8: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Fases de un Proceso BI

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Fase 1: recolectar los requerimientos de información específicos Fase 2: extraer de las diferentes fuentes de información. Fase 3: se integran y cargan los datos en crudo en un formato

utilizable para el análisis. Fase 4: se obtendrán las respuestas a las preguntas, mediante la

creación de reportes, indicadores de rendimiento, cuadros de mando, gráficos estadísticos, etc.

Fase 5: explorar los datos de manera sencilla e intuitiva.

Page 9: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

¿Porqué Open Source BI?

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

La solución elegida debería ser evaluada según los siguientes criterios: Adaptabilidad a todos los entornos. Sin costos de licencias Independencia del proveedor Garantías de permanencia. Upgrades y mejoras

frecuentes Tendencia a la calidad y utilización de estándares

(XML – MDX) Dedicación full a los servicios y a la solución de

negocios. Gran aprovechamiento de Web Services. La comunidad del software libre

Page 10: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Plataforma Pentaho Open Source BI

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Características más importantes: Aplicación web desarrollada en J2EE. Modular. Servidor Web: puede correr en servidores compatibles

con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.

Base de datos: vía JDBC, DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, Firebird, etc.

Sistema operativo: Multiplataforma. Repositorio de datos basado en XML. Todos los componentes están expuestos vía Web

Services Incluye: ETL, Reporting, OLAP, Data mining,

Dashboards, etc. Licencia: GNU GPL.

Page 11: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Plataforma Pentaho Open Source BI

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Estrategia “open core”: a partir de un núcleo open source se ofrecen servicios y módulos mejorados.

Existen dos versiones disponibles de Pentaho:

Pentaho Community EditionPentaho Community EditionCompletamente gratuita

Pentaho Enterprise EditionPentaho Enterprise EditionSe ofrece bajo modalidad de subscripción

Page 12: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Plataforma Pentaho Open Source BI

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Pentaho Community EditionPentaho Community Edition Pentaho Community EditionPentaho Community Edition

Versión comunitaria, sin costos de licencia, sin servicios de soporte asociados. Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de BI.AfPentaho soló la recomienda para:

Aficionados al BI Académicos Programadores de Software Abierto

Es totalmente software de código abierto, la licencia en su mayoría bajo la versión GNU.

http://community.pentaho.com/

Page 13: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Plataforma Pentaho Open Source BI

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Pentaho Enterprise EditionPentaho Enterprise Edition Pentaho Enterprise EditionPentaho Enterprise Edition

Versión empresarial, sin costos de licencia.

Tiene asociados servicios de soporte y mantención que se pagan a través de una suscripción anual.

Es una versión certificada que además posee algunas funcionalidades mejoradas para la consola de administración, y para la construcción de tableros de control.

http://www.pentaho.com

Page 14: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Componentes de la Plataforma

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Page 15: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Componentes de la Plataforma

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Existen productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios. Pentaho Report Designer: Contiene dos componentes:

Un editor basado con prestaciones profesionales destinado a desarrolladores.

Un Wizard que facilita el trabajo y permite a los usuarios obtener resultados de forma inmediata. Está destinada a usuarios con menos conocimientos técnicos.

Web ad-hoc Reporting: es un Wizard vía Web basado en metadatos que extiende la capacidad de los usuarios finales para la creación de informes sencillos.

Pentaho ReportingPentaho Reporting

Page 16: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Componentes de la Plataforma

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Carácterísticas Generales: Modelado Multi Dimensional de Datos:

Utiliza MONDRIAN como servidor OLAP de tipo ROLAP. El modelo de los cubos se guarda en archivos XML Lenguaje de consulta MDX

Navegación y Exploración de Datos: utiliza JPIVOT, el cual permite análisis Ad-Hoc de los

cubos de Mondrian. Este componente como otros puede ser reemplazado

por otras soluciones que se integran a Pentaho, p.e. PAT

Pentaho Análisis OLAP de DatosPentaho Análisis OLAP de Datos

Page 17: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Componentes de la Plataforma

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Pentaho Análisis OLAP de DatosPentaho Análisis OLAP de Datos

Page 18: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Componentes de la Plataforma

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Todos los componentes del modulo Pentaho Reporting y Pentaho Analysis (JPIVOT) pueden formar parte de un Dashboard. Identificación de Indicadores (KPI’s, Key

Performance Indicators) Monitoreo / Métricas

Investigar detalles subyacentes Drill a reportes de soporte

Seguimiento de excepciones Alertas basadas en reglas del negocio

Pentaho DashboardPentaho Dashboard

Page 19: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Componentes de la Plataforma

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Poderosa herramienta de ETL (Extracción, Transformación y Carga del DW).

Entorno gráfico de desarrollo . Multiplataforma Basado en dos tipos de objetos: Transformaciones

(colección de pasos en un proceso ETL) y trabajos (colección de transformaciones)

Incluye cuatro herramientas: SPOON: para diseñar transformaciones usando el entorno

gráfico PAN: para ejecutar transformaciones diseñadas con SPOON. CHEF: para crear trabajos KITCHEN: para ejecutar trabajos

Pentaho Data IntegrationPentaho Data Integration

Page 20: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Componentes de la Plataforma

DATOSDATOS

Taller Pentaho Junio 2011UNNOBA

Se utiliza para: Descubrir patrones ocultos y correlaciónales en los datos Prevenir eventos futuros basados en patrones históricos

Data Mining - WEKAData Mining - WEKA

Page 21: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Instalación

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

¿Qué necesitamos descargar para poder ver la solución propuesta? El servidor BI:

http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/3.6.0-stable/ Biserver-ce-3.6.0-stable.zip para Windows Biserver-ce-3.6.0-stable.tar.gz para Linux

El motor Postgresql 8.3 o superior y su correspondiente JDBC Pentaho Data Integration 4.1.0:

http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.1.0-stable/

Pdi-ce-4.1.0-stable.zip para Windows Pdi-ce-41.0-stable.tar.gz para Linux

Page 22: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Instalación

DATOSDATOS ANÁLISISANÁLISIS

Taller Pentaho Junio 2011UNNOBA

Al descomprimir el bi-server tendrán los siguientes directorios:

Pentaho/administrationconsole/biserver-ce/

Necesitarán configurar la siguiente variable de entorno: SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre en

windows Y copiar el driver jdbc de postgresql a:

C:\pentaho360\administration-console\jdbc en Windows Verificar que también esté el driver en:

c:\pentaho360\biserver-ce\tomcat\lib en Windows

Page 23: PENTAHO BI (Open Source) Introducción Taller Técnicos PENTAHO – Junio 2011

Referencias Bibliográficas y Otros…. Introducción al Business Intelligence – Josep Curto Díaz – ISBN: 978-84-9788-886-8

– Mayo 2010

Pentaho 3.2 Data Integration – María Carina Roldán - ISBN 978-1-847199-54-6 – 2010

“Proyecto de implementación de un Data Warehouse para universidades nacionales “ - Trabajo Final De Grado - Del Giudice Glenda, Della Mea (principalmente el Anexo 1)

Toda la documentación producida por el Ing. Darío Bernabeu.

Pentaho Solutions Business Intelligence and Data Warehousing with Pentaho and MySQL – Parte III - Roland Bouman, Jos van Dongen - ISBN: 978-0-470-48432-6

http://kettle.pentaho.org/ de la Community.

http://Sourceforge.net/projects/pentaho/files

Taller Pentaho Junio 2011 UNNOBA