58
EIN945-Inteligencia de Negocios Unidad Nº 1: Introducción a la Inteligencia de Negocios Clase Nº01: Introducción

Clase01 EIN 945

Embed Size (px)

DESCRIPTION

BI

Citation preview

Page 1: Clase01 EIN 945

EIN945-Inteligencia de Negocios

Unidad Nº 1: Introducción a la Inteligencia de NegociosClase Nº01: Introducción

Page 2: Clase01 EIN 945

Presentación Profesor

Gabriel Vergara Butrón

MBA (Magíster en Gestión y Dirección de Empresas)

Ingeniero Civil Industrial

Coordenadas:

Móvil: 56-9-97487207E-mail: [email protected]

Page 3: Clase01 EIN 945

Programa del Curso

Teórico-Estratégico

Page 4: Clase01 EIN 945

Programa del Curso

Práctico

Page 5: Clase01 EIN 945

Evaluaciones

• Cátedra I = 30% (80% teórico, 20% práctico)

• Cátedra II = 30% (Actividades y Controles de Lectura)

• Examen = 40%

Características:

• Sin eximición.

Page 6: Clase01 EIN 945

Agenda

• La motivación del problema

• ¿Qué es el Business Intelligence?

• El Proceso KDD

• Las aplicaciones de Data Mining

• Data Warehouse

• Principales Modelos de Data Mining

• Algunas Aplicaciones

Page 7: Clase01 EIN 945

A cerca de Leyes, Monstruos y Gigantes

• Ley de Moore: “La capacidad de procesamiento se duplica cada 18 meses”

• Su primo más agresivo: “La capacidad de almacenamiento se duplica cada9 meses”

• La brecha entre capacidad de procesar y lo que almacenamos, aumentacon el tiempo.

0

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

1988 1990 1992 1994

Disk

Processing

0

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

1988 1990 1992 1994

Disk

Processing

0

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

1988 1990 1992 1994

Disk

Processing

Page 8: Clase01 EIN 945

A cerca de Leyes, Monstruos y Gigantes

• La librería del US Congress tiene 10 Teras de texto

• Fuentes multimedia: video, audio almacenan menos de 3 Petas.– Gigabyte (109) viene del latín Gigas, para “gigante”

– Terabyte (1012) viene del griego Teras para Monstruo (terabytes: terror bytes)

– Vienen otros como: Peta, Exa, Zetta, etc

• Trabajar con estos “monstruos” es cosa sería.

• El año 2000 se analizó que el 11% de todo el conocimiento humano se generó durante 1999.

Page 9: Clase01 EIN 945

“La necesidad es la madre de la invención”

• Problema de Explosión de Datos:

– Sistema automáticos de captura de información,

madurez en la tecnología de bases de datos e Internet

llevan a importantes cantidades de datos almacenados

en las bases de datos, data warehouses y otros

repositorios de información.

• Enfoque competitivo.

• Bajo costo de computadores.

• Fuertes bases teóricas/Data matemáticas.

Nos ahogamos en información, pero estamos

hambrientos por conocimiento!

Page 10: Clase01 EIN 945

Yo manejo un supermercado (restaurant, tienda de videos o libros) y mi

registro de cajas (o website) almacena transacciones en la Base de Datos.

• Puede ayudarme a visualizar las ventas?

• Puede generar perfiles de clientes?

• Dónde estoy ganando o perdiendo plata?

• Cómo los usuarios visitan mi website?

• Dígame algún patrón interesante

Yo no sé nada de Estadística ni Data Mining, tampoco tengo estadísticos ni

analistas dedicados!!!

Pero ya tengo la Base de Datos…

Page 11: Clase01 EIN 945

• Muchos análisis de consultas interesantes son difíciles de precisar

• Por ejemplo:– Qué registros son transacciones fraudulentas?

– Cuáles clientes son más probables de elegir una Ford sobre una Toyota?

– Quiénes son buenos clientes en términos de riesgo en mi base de datos?

• La base de Datos contiene información – bueno/mal cliente, rentabilidad

– respondió/no respondió la encuesta

Business Intelligence y Bases de Datos

Page 12: Clase01 EIN 945

• Aumento explosivo de bases de datos.

• Los datos parecen siempre crecer y llenar el

repositorio:

– Alta dimensionalidad

– Gran número de registros

– Nuevas Fuentes

• Las herramientas de análisis actuales no soportan

los nuevos requerimientos y escalas.

• El usuario final no es un estadístico.

¿Por qué Business Intelligence?

Page 13: Clase01 EIN 945

Acceso a Datos

• Buscar algunos registros

• Reportes estándarSQL

SQL/OLAP

• Optimizar Procesos de Negocios

• Ubicar un problema/ entender algo

nuevo

• Responder una pregunta difícil

BI

Page 14: Clase01 EIN 945

Definición de Business Intelligence

• “Business intelligence es el proceso de extracción de datosdesde una BD y luego el análisis de esos datos para extraerinformación susceptible de usar para tomar decisiones yacciones de negocios informadas”.

• Preguntas a responder por aplicaciones de BusinessIntelligence:

– ¿Como comparar las ventas totales de todos los productos del2013, con las ventas totales del 2012?

– ¿Cómo está la rentabilidad a la fecha comparado con igual períododurante los últimos cinco años?

– ¿Cuánto gastaron nuestros clientes sobre 35 años durante elúltimo año, y como su comportamiento ha evolucionado en eltiempo?

Page 15: Clase01 EIN 945

Definición de Business Intelligence (2)

• Business intelligence (BI): es una amplia categoría de

aplicaciones y tecnologías para extraer, almacenar,

analizar y entregar acceso a datos que ayuden a los

usuarios de negocio, en la toma de decisiones.

Aplicaciones BI applications incluyen trabajos en

decision support systems (DSS), consultas y reportes,

online analytical processing (OLAP), análisis

estadístico, pronóstico y Data Mining.

Page 16: Clase01 EIN 945

Definición de Business Intelligence (3)

Se refiere a los procesos mediante los cuales las

organizaciones reúnen datos y analizan para

poder tomar decisiones centradas en su

estrategia y modelo de negocio

La capacidad de comprender las interrelaciones de los hechos presentados en tal forma como

para orientar la acción hacia una meta deseada

* Hans Peter Luhn (1958)

Page 17: Clase01 EIN 945

Inteligencia de Negocios

• Se dice que ha evolucionado desde los sistemas de apoyo a las decisiones, DSSUn Sistema de Soporte a la Decisión (DSS) es una herramienta de Business Intelligence enfocada al análisis de los datos de una organización.En principio, puede parecer que el análisis de datos es un proceso sencillo, y fácil de conseguir mediante una aplicación hecha a medida o un ERP sofisticado. Sin embargo, no es así: estas aplicaciones suelen disponer de una serie de informes predefinidos en los que presentan la información de manera estática, pero no permiten profundizar en los datos, navegar entre ellos, manejarlos desde distintas perspectivas... etc.

• Los datos son la fuente principal para realizar el análisis detrás de este concepto

• Se busca ir más allá en la presentación de la información, de manera que los usuarios tengan acceso a herramientas de análisis

Page 18: Clase01 EIN 945

Inteligencia de Negocios

Page 19: Clase01 EIN 945

Inteligencia de Negocios

Datos• Datos Clientes• Datos Tiendas• Datos Demográficos• Datos Geográficos

Información• X vive en Z• S tiene Y años• X y S se cambiaron• W tiene dinero en Z

Conocimiento• Una cantidad Y del producto A es usada en la región Z• Clientes de la clase P usan x% de producto C en el periodo D

Decisiones• Promocione el producto A en la región Z• Mailing a familias del perfil P• Venta cruzada del servicio B a clientes C

Page 20: Clase01 EIN 945

Inteligencia de Negocios

Data Warehouse Data Mart

Data Mining

MarketingCliente

Page 21: Clase01 EIN 945

• Datos Superficiales• Datos SuperficialesSe extraen con consultas tipo

SQL

• Datos Multi-Dimensionales • Datos Multi-Dimensionales Se extraen con

OLAP

• Datos Escondidos• Datos EscondidosSe extraen con procesos

KDD

• Datos Profundos• Datos ProfundosSe extraen con uso de la

Intuición

Inteligencia de Negocios

Datos en la WebSe extraen con Web Mining

* Basado en Clase de Patricio Wolff (2012), MBE, U. de Chile.

AnalíticaSe utilizan técnicas de

Investigación Operativa

Page 22: Clase01 EIN 945

Gráficamente

�Empresas y Organizaciones tienen

gran cantidad de datos almacenados.

�Los datos disponibles contienen

información importante.

�La información está escondida en los datos.

�BI puede encontrar información

nueva y potencialmente útil en los datos

Page 23: Clase01 EIN 945

¿Qué es Business Intelligence?

Page 24: Clase01 EIN 945

Business Intelligence involucra muchos términos

• Data Warehouse

• OLAP

• Data Mining

• Knowledge Discovery in Databases (KDD)

• Customer Relationship Management

• Database Marketing

• Balance Scorecard

Page 25: Clase01 EIN 945

¿Qué es Data Mining?

Proceso para encontrar estructura interesante en

los datos

– Estructura se refiere a patrones, modelos predictivos,

relaciones ocultas, interesantes o susceptibles de

generar margen para la empresa

• Ejemplos de tareas realizadas por Data Mining

– Modelos Predictivos (Clasificación y Regresión)

– Segmentación (Clustering)

– Afinidad de Datos (Summarization)• relaciones entre campos, asociaciones, visualización de datos

Page 26: Clase01 EIN 945

Data Mining

2.Selección y Preprocesamiento

4.Interpretación y Evaluación

Knowledge

p(x)=0.02

Warehouse

Patrones y Modelos

Datos preparados

Datos Consolidados

3.Data Mining

1.Consolidaciónde los Datos

Conocimiento

p(x)=0.02

DW

2.Selección y Preprocesamiento

4.Interpretación y Evaluación

Knowledge

p(x)=0.02

Warehouse

Patrones y Modelos

Datos preparados

Datos Consolidados

3.Data Mining

1.Consolidaciónde los Datos

Conocimiento

p(x)=0.02

DW

6. Apoyo a la Toma de Decisiones

5. Visualizacióndel conocimiento

6. Apoyo a la Toma de Decisiones

5. Visualizacióndel conocimiento

Page 27: Clase01 EIN 945

Herramientas para Data Mining

• Redes Neuronales:

– MLP

– Mapas autoorganizativos

• Árboles de Decisión:

– CART

– ID3, C4.5

– CHAID

• Regresiones: logit, probit

• Reglas de Asociación

• Lógica Difusa

Page 28: Clase01 EIN 945

� Customer Relationship Management

Segmentación de clientes

Database Marketing

Predicción de compra

Retención de clientes

Predicción de fuga

� Detección de Fraude

Tarjetas de crédito

Uso de teléfonos (celulares)

� Predicción de series de tiempo

Más Aplicaciones

Page 29: Clase01 EIN 945

• Marketing y Ventas: Identificar potenciales clientes; establecer la

efectividad de las campañas de marketing.

• Análisis de Procesos de Manufactura: Identificar las causas de

problemas de manufactura.

• Entendiendo comportamiento de Consumidores: modelos de

retención de clientes, afinidades, clustering.

• Detección de Fraudes: Identificar transacciones fraudulentas.

Aplicaciones de Negocio

Page 30: Clase01 EIN 945

• Aprobar Créditos: Establecer Credit Scoring para un cliente a la hora

de pedir un préstamo.

• Gestión de Portfolio: optimizar un portfolio de instrumentos

financieros maximizando el retorno o minimizando el riesgo

• Análisis de websites: modelar preferencias de usuarios desde logs,

filtros colaborativos, caminos preferidos, etc.

Aplicaciones de Negocio

Page 31: Clase01 EIN 945

Evolución en distintas industrias

Razones iniciales:

En telecomunicación:En telecomunicación:En telecomunicación:En telecomunicación:

Facturación de llamadas

Potenciales:

En telecomunicaciónEn telecomunicaciónEn telecomunicaciónEn telecomunicación::::

Detección de fraude

En supermercados:En supermercados:En supermercados:En supermercados:

Gestión del inventario

En bancos:En bancos:En bancos:En bancos:

Manejo de cuentas

En supermercados:En supermercados:En supermercados:En supermercados:

Asociación de ventas

En bancos:En bancos:En bancos:En bancos:

Segmentación de clientes

En empresas de producción:En empresas de producción:En empresas de producción:En empresas de producción:

Control de procesos

En empresas de producciónEn empresas de producciónEn empresas de producciónEn empresas de producción: : : :

Mantención preventivo

Page 32: Clase01 EIN 945

Estrategia yMarketing

Base de Datos de

Marketing

DataWarehousing

KDD &Data Mining

Aumente el conocimiento sobre las decisiones

Ej: impacto sobre el marketing

Para qué es útil el Data Mining

Page 33: Clase01 EIN 945

Data Mining y CRM

• Aplicaciones descriptivas

– Segmentación de clientes

– Análisis de afinidad

• Aplicaciones Predictivas

– Recomendación de productos

– Modelos de scoring

Se optimiza cuando se usan de forma combinanda

Page 34: Clase01 EIN 945

Lealtad de clientes

Análisis de procesos

Adquisición de clientes

Detección

de fraude

Business

ChallengesTechnologies

Segmentación

Regresión

Logistica

Genetic

Algorithms

Arboles de

decisión

Chaid

CART

OLAP

Redes

Bayesianas

Redes

Neuronales

Brecha en el Análisis de datos

Desafíos del

NegocioHerramientas

Los Gerentes son incapaces de aplicar el poder de las herramientas de Data

Mining para lograr resultados útiles a sus negocios

Page 35: Clase01 EIN 945

Lealtad de clientes

Análisis de procesos

Adquisición de clientes

Detección

de fraude

Business

ChallengesTechnologies

Segmentación

Regresión

Logistica

Genetic

Algorithms

Arboles de

decisión

Chaid

CART

OLAP

Redes

Bayesianas

Redes

Neuronales

Brecha en el análisis de datos

Desafíos del

NegocioHerramientasEspecialistas

Estadísticos

Administradores

y analisitas de DB

Consultores

Data Miners

Los Gerentes son incapaces de aplicar el poder de las herramientas de Data

Mining para lograr resultados útiles a sus negocios

Page 36: Clase01 EIN 945

La Cadena de Valor

Datos• Datos Clientes• Datos Tiendas• Datos Demográficos• Datos Geográficos

Información• X vive en Z• S tiene Y anos• X y S se cambiaron• W tiene dinero en Z

Conocimiento• Una cantidad Y del producto A es usada en la región Z• Clientes de la clase P usan x% de producto C en el periodo D

Decisión• Promocione el producto A en la región Z• Mailing a familias del perfil P• Venta cruzada del servicio B a clientes C

Page 37: Clase01 EIN 945

Preguntas Claves Para un E-Business

1. ¿Número de nuevos clientesnuevos clientesnuevos clientesnuevos clientes?

2. ¿Cuáles son los caminos de navegación más popularescaminos de navegación más popularescaminos de navegación más popularescaminos de navegación más populares en mi sitio? ¿Son

los caminos diferentes para los clientes nuevos que los de los clientes

frecuentes?

3. ¿Cuáles son las palabras de búsqueda más frecuentespalabras de búsqueda más frecuentespalabras de búsqueda más frecuentespalabras de búsqueda más frecuentes?

4. ¿ Cuántas veces clientes “primerizos” compraronclientes “primerizos” compraronclientes “primerizos” compraronclientes “primerizos” compraron en el sitio ayer?

5. ¿Cuál fue el producto más rentableproducto más rentableproducto más rentableproducto más rentable ayer?

6. ¿Fue alto o bajo el ratio compra/visitaratio compra/visitaratio compra/visitaratio compra/visita comparado con el mismo día de la

semana pasada?

¿Como puedo generar un mejor retorno sobre la inversión y más ingresos para la compañía?

Page 38: Clase01 EIN 945

Inteligencia de Negocios

ProductosProductos

Servicios de Búsqueda

La ruta más corta

Reconocimiento (voz,

imagen)

FinancieroFinanciero

Planificación financiera de la cadena de Suministros

Gestión de Riesgos

Gestión de Recursos Humanos

Gestión de Recursos Humanos

Gestión de talentos

Staffing

Red LogísticaRed Logística

Optimización de Inventarios

Planificación de la

Distribución

Localización de plantas y bodegas

Plan de entrega

Producción y manufacturaProducción y manufactura

Programación de la

Producción

Costeo de Producción

Ventas y CRM

Ventas y CRM

Predicción de la demanda

Pricing

Gestión de Incidentes

Predicción de comportamien

to de ventas

Servicios Corporativos

Servicios Corporativos

Gestión de la calidad

Gestión de proyectos

Nuevos proyectos

* Basado en Clase de Patricio Wolff (2012), MBE, U. de Chile.

Page 39: Clase01 EIN 945

Ejemplos de Inteligencia de Negocios

Page 40: Clase01 EIN 945

Ejemplos de Inteligencia de Negocios

Page 41: Clase01 EIN 945

Ejemplos de Inteligencia de Negocios

* Forbes (2004) Proximity and priority: applying a gene expression algorithm to the TSP

Page 42: Clase01 EIN 945

Ejemplos de Inteligencia de Negocios

Page 43: Clase01 EIN 945

Ejemplos de Inteligencia de Negocios

*Trabelsi (2012) Heuristics and metaheuristics for mixed blocking constraints flowshop scheduling problems

Page 44: Clase01 EIN 945

Ejemplos de Inteligencia de Negocios

Page 45: Clase01 EIN 945

Ejemplos de Inteligencia de Negocios

* Miranda et al. (2005) Predicción de Fugas de Clientes para una Institución Financiera mediante Support Vector Machines

Page 46: Clase01 EIN 945

Implementación de Inteligencia de Negocios

– Módulos del ERP• Ej: SAP Business Warehouse

– Módulos externos añadidos al ERP• Ej: Jaspersoft

– Capa inteligente• Con orientación a Servicios

• Desarrollo a la medida

Page 47: Clase01 EIN 945

Plataformas de Inteligencia de Negocios

* Fuente: Gartner (2009)

Page 48: Clase01 EIN 945

Inteligencia de Negocios

• Ventajas de la Inteligencia de negocios

– Mejora en la calidad de las decisiones

– Orienta las decisiones a objetivos generales

– Control de Costos

– Profunda y realista visión del negocio

– Permite planificar y programar el trabajo

– Alinea la estrategia al establecer objetivos claros

– Integración de sistemas y áreas

Page 49: Clase01 EIN 945

Inteligencia de Negocios

• Desventajas de la Inteligencia de negocios

– La automatización podría no resultar

– No considera la intuición

– Podría resultar un desastre si operaciones y TI no están alineados

– Lo que se necesita podría no estar en los datos que se tienen

– En algunos casos deja explicito el know-how

– Si no se analizan la estrategia y los procesos “core” podría ser un tanque para matar un mosca

Page 50: Clase01 EIN 945

Enterprise Mining Process

KDD Process + Objetivos del Negocio + Eficiencia + Comunicación con el usuario de negocio

• Especificación del problema

– Objetivos y metas del negocio

• Levantamiento de Datos

– Casos a elegir

• Calidad de los datos / Limpieza

• Preprocesamiento de Datos

• Data mining

– Impacto del Negocio

• Gestión del Modelo

Page 51: Clase01 EIN 945

Agenda

• Inteligencia de Negocios

– Definición

– Niveles

– Procesos que apoya

– Ejemplos

– Implementación de BI

– Ventajas

Page 52: Clase01 EIN 945

Inteligencia de Negocios

• Consultas SQL (Structured Query Language)– Lenguaje declarativo de acceso a bases de datos

relacionales

– Permiten efectuar consultas con el fin de recuperar información de forma sencilla

SELECT c.nombre FROM cliente AS c, pedidos AS pWHERE c.id = p.cliente_id

AND p.npedido = 122;

Page 53: Clase01 EIN 945

Inteligencia de Negocios

• Las herramientas OLAP (OnLine AnalyticalProcessing)

– Proporcionan un análisis multidimensional de los datos, es decir, permiten resumir y segmentar los datos.

– Utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos

– Adecuadas para el análisis instantáneo de grandes cantidades de datos.

– Producen otros datos

(más agregados, combinados). Tiem

po

Page 54: Clase01 EIN 945

Inteligencia de Negocios

• El proceso KDD ( Knowledge Discovery in Databases)

– Identificación de los Objetivos

– Selección de datos

– Preprocesamiento

– Transformación

– Data Mining (descubrir patrones en los datos)

– Interpretación y Evaluación

– Integración al Negocio

Page 55: Clase01 EIN 945

Proceso KDD

Page 56: Clase01 EIN 945
Page 57: Clase01 EIN 945

Inteligencia de Negocios

• Se puede definir el Web mining en tres variantes:

– Minería del contenido de la Web (contenido de las páginas)

– Minería de la estructura de la Web (Estructura de enlaces)

– Minería de los registro de navegación en la Web

– Ha permitido que el comercio electrónico para hacer marketing personalizado

Page 58: Clase01 EIN 945

Inteligencia de Negocios

* Basado en Davenport y Harris (2007) Competing on Analytics