Clase01 EIN 945

  • View
    228

  • Download
    0

Embed Size (px)

DESCRIPTION

BI

Text of Clase01 EIN 945

  • EIN945-Inteligencia de Negocios

    Unidad N 1: Introduccin a la Inteligencia de NegociosClase N01: Introduccin

  • Presentacin Profesor

    Gabriel Vergara Butrn

    MBA (Magster en Gestin y Direccin de Empresas)

    Ingeniero Civil Industrial

    Coordenadas:

    Mvil: 56-9-97487207E-mail: gavergar22@gmail.com

  • Programa del Curso

    Terico-Estratgico

  • Programa del Curso

    Prctico

  • Evaluaciones

    Ctedra I = 30% (80% terico, 20% prctico)

    Ctedra II = 30% (Actividades y Controles de Lectura)

    Examen = 40%

    Caractersticas:

    Sin eximicin.

  • Agenda

    La motivacin del problema

    Qu es el Business Intelligence?

    El Proceso KDD

    Las aplicaciones de Data Mining

    Data Warehouse

    Principales Modelos de Data Mining

    Algunas Aplicaciones

  • A cerca de Leyes, Monstruos y Gigantes

    Ley de Moore: La capacidad de procesamiento se duplica cada 18 meses

    Su primo ms agresivo: La capacidad de almacenamiento se duplica cada9 meses

    La brecha entre capacidad de procesar y lo que almacenamos, aumentacon el tiempo.

    0

    1,000,000

    2,000,000

    3,000,000

    4,000,000

    5,000,000

    6,000,000

    7,000,000

    1988 1990 1992 1994

    Disk

    Processing

    0

    1,000,000

    2,000,000

    3,000,000

    4,000,000

    5,000,000

    6,000,000

    7,000,000

    1988 1990 1992 1994

    Disk

    Processing

    0

    1,000,000

    2,000,000

    3,000,000

    4,000,000

    5,000,000

    6,000,000

    7,000,000

    1988 1990 1992 1994

    Disk

    Processing

  • A cerca de Leyes, Monstruos y Gigantes

    La librera del US Congress tiene 10 Teras de texto

    Fuentes multimedia: video, audio almacenan menos de 3 Petas. Gigabyte (109) viene del latn Gigas, para gigante

    Terabyte (1012) viene del griego Teras para Monstruo (terabytes: terror bytes)

    Vienen otros como: Peta, Exa, Zetta, etc

    Trabajar con estos monstruos es cosa sera.

    El ao 2000 se analiz que el 11% de todo el conocimiento humano se gener durante 1999.

  • La necesidad es la madre de la invencin

    Problema de Explosin de Datos:

    Sistema automticos de captura de informacin,

    madurez en la tecnologa de bases de datos e Internet

    llevan a importantes cantidades de datos almacenados

    en las bases de datos, data warehouses y otros

    repositorios de informacin.

    Enfoque competitivo.

    Bajo costo de computadores.

    Fuertes bases tericas/Data matemticas.

    Nos ahogamos en informacin, pero estamos

    hambrientos por conocimiento!

  • Yo manejo un supermercado (restaurant, tienda de videos o libros) y mi

    registro de cajas (o website) almacena transacciones en la Base de Datos.

    Puede ayudarme a visualizar las ventas?

    Puede generar perfiles de clientes?

    Dnde estoy ganando o perdiendo plata?

    Cmo los usuarios visitan mi website?

    Dgame algn patrn interesante

    Yo no s nada de Estadstica ni Data Mining, tampoco tengo estadsticos ni

    analistas dedicados!!!

    Pero ya tengo la Base de Datos

  • Muchos anlisis de consultas interesantes son difciles de precisar

    Por ejemplo: Qu registros son transacciones fraudulentas?

    Cules clientes son ms probables de elegir una Ford sobre una Toyota?

    Quines son buenos clientes en trminos de riesgo en mi base de datos?

    La base de Datos contiene informacin bueno/mal cliente, rentabilidad

    respondi/no respondi la encuesta

    Business Intelligence y Bases de Datos

  • Aumento explosivo de bases de datos.

    Los datos parecen siempre crecer y llenar el

    repositorio:

    Alta dimensionalidad

    Gran nmero de registros

    Nuevas Fuentes

    Las herramientas de anlisis actuales no soportan

    los nuevos requerimientos y escalas.

    El usuario final no es un estadstico.

    Por qu Business Intelligence?

  • Acceso a Datos

    Buscar algunos registros

    Reportes estndarSQL

    SQL/OLAP

    Optimizar Procesos de Negocios

    Ubicar un problema/ entender algonuevo

    Responder una pregunta difcil

    BI

  • Definicin de Business Intelligence

    Business intelligence es el proceso de extraccin de datosdesde una BD y luego el anlisis de esos datos para extraerinformacin susceptible de usar para tomar decisiones yacciones de negocios informadas.

    Preguntas a responder por aplicaciones de BusinessIntelligence:

    Como comparar las ventas totales de todos los productos del2013, con las ventas totales del 2012?

    Cmo est la rentabilidad a la fecha comparado con igual perododurante los ltimos cinco aos?

    Cunto gastaron nuestros clientes sobre 35 aos durante elltimo ao, y como su comportamiento ha evolucionado en eltiempo?

  • Definicin de Business Intelligence (2)

    Business intelligence (BI): es una amplia categora de

    aplicaciones y tecnologas para extraer, almacenar,

    analizar y entregar acceso a datos que ayuden a los

    usuarios de negocio, en la toma de decisiones.

    Aplicaciones BI applications incluyen trabajos en

    decision support systems (DSS), consultas y reportes,

    online analytical processing (OLAP), anlisis

    estadstico, pronstico y Data Mining.

  • Definicin de Business Intelligence (3)

    Se refiere a los procesos mediante los cuales las

    organizaciones renen datos y analizan para

    poder tomar decisiones centradas en su

    estrategia y modelo de negocio

    La capacidad de comprender las interrelaciones de los hechos presentados en tal forma como

    para orientar la accin hacia una meta deseada

    * Hans Peter Luhn (1958)

  • Inteligencia de Negocios

    Se dice que ha evolucionado desde los sistemas de apoyo a las decisiones, DSSUn Sistema de Soporte a la Decisin (DSS) es una herramienta de Business Intelligence enfocada al anlisis de los datos de una organizacin.En principio, puede parecer que el anlisis de datos es un proceso sencillo, y fcil de conseguir mediante una aplicacin hecha a medida o un ERP sofisticado. Sin embargo, no es as: estas aplicaciones suelen disponer de una serie de informes predefinidos en los que presentan la informacin de manera esttica, pero no permiten profundizar en los datos, navegar entre ellos, manejarlos desde distintas perspectivas... etc.

    Los datos son la fuente principal para realizar el anlisis detrs de este concepto

    Se busca ir ms all en la presentacin de la informacin, de manera que los usuarios tengan acceso a herramientas de anlisis

  • Inteligencia de Negocios

  • Inteligencia de Negocios

    Datos Datos Clientes Datos Tiendas Datos Demogrficos Datos Geogrficos

    Informacin X vive en Z S tiene Y aos X y S se cambiaron W tiene dinero en Z

    Conocimiento Una cantidad Y del producto A es usada en la regin Z Clientes de la clase P usan x% de producto C en el periodo D

    Decisiones Promocione el producto A en la regin Z Mailing a familias del perfil P Venta cruzada del servicio B a clientes C

  • Inteligencia de Negocios

    Data Warehouse Data Mart

    Data Mining

    MarketingCliente

  • Datos Superficiales Datos SuperficialesSe extraen con consultas tipo

    SQL

    Datos Multi-Dimensionales Datos Multi-Dimensionales Se extraen con

    OLAP

    Datos Escondidos Datos EscondidosSe extraen con procesos

    KDD

    Datos Profundos Datos ProfundosSe extraen con uso de la

    Intuicin

    Inteligencia de Negocios

    Datos en la WebSe extraen con Web Mining

    * Basado en Clase de Patricio Wolff (2012), MBE, U. de Chile.

    AnalticaSe utilizan tcnicas de

    Investigacin Operativa

  • Grficamente

    Empresas y Organizaciones tienen

    gran cantidad de datos almacenados.

    Los datos disponibles contienen

    informacin importante.

    La informacin est escondida en los datos.

    BI puede encontrar informacin

    nueva y potencialmente til en los datos

  • Qu es Business Intelligence?

  • Business Intelligence involucra muchos trminos

    Data Warehouse

    OLAP

    Data Mining

    Knowledge Discovery in Databases (KDD)

    Customer Relationship Management

    Database Marketing

    Balance Scorecard

  • Qu es Data Mining?

    Proceso para encontrar estructura interesante en

    los datos

    Estructura se refiere a patrones, modelos predictivos,

    relaciones ocultas, interesantes o susceptibles de

    generar margen para la empresa

    Ejemplos de tareas realizadas por Data Mining

    Modelos Predictivos (Clasificacin y Regresin)

    Segmentacin (Clustering)

    Afinidad de Datos (Summarization) relaciones entre campos, asociaciones, visualizacin de datos

  • Data Mining

    2.Seleccin y Preprocesamiento

    4.Interpretacin y Evaluacin

    Knowledge

    p(x)=0.02

    Warehouse

    Patrones y Modelos

    Datos preparados

    Datos Consolidados

    3.Data Mining

    1.Consolidacinde los Datos

    Conocimiento

    p(x)=0.02

    DW

    2.Seleccin y Preprocesamiento

    4.Interpretacin y Evaluacin

    Knowledge

    p(x)=0.02

    Warehouse

    Patrones y Modelos

    Datos preparados

    Datos Consolidados

    3.Data Mining

    1.Consolidacinde los Datos

    Conocimiento

    p(x)=0.02

    DW

    6. Apoyo a la Toma de Decisiones

    5. Visualizacindel conocimiento

    6. Apoyo a la Toma de Decisiones

    5. Visualizacindel conocimiento

  • Herramientas para Data Mining

    Redes Neuronales:

    MLP

    Mapas autoorganizativos