21
DATA MINING MINERÍA DE DATOS

Data mining

Embed Size (px)

Citation preview

Page 1: Data mining

DATA MININGMINERÍA DE DATOS

Page 2: Data mining

MINERIA DE DATOS“Torturar a los datos hasta que confiesen”

DATA MINING

Presentado por: Felipe Gudiño Diego

Alejandro Lobato Farias José Antonio

Sotelo Colín Iván JesúsRaúl Villafán BarandaSergio González Cruz

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data Mining

Page 3: Data mining

Introducción

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Definición

Técnicas y Algoritmos

Conclusión

Procesos

Software

Principales Usos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningContenido

DATA MINING

Page 4: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

INTRODUCCIÓN

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningIntroducción al DM

Page 5: Data mining

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningIntroducción al DM

Introducción

Era de la Información (Tecnologías de la Información y la

Comunicación) Información = Poder & Éxito

Ordenadores + Medios de Almacenamiento Masivo Enormes Cantidades de Información

Enormes Colecciones de Información = Nuevas necesidades

“Data Mining” – Minería de DatosExplorar y Analizar grandes volúmenes de InformaciónEncontrar correlaciones significativas (Tendencias &

Comportamientos)

Page 6: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

DEFINICIÓN DEL DM

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningDefinición del DM

Page 7: Data mining

² ² ² ² ²² ²Universidad Tecnológica Emiliano Zapata del Estado de

Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningDefinición del DM

Definición del DM

Proceso de exploración y análisis de grandes volúmenes de datos para hacerlos mas comprensibles, predecir tendencias y comportamientos.

Conjunto de técnicas y herramientas usadas para encontrar y entender relaciones en grandes cantidades de datos y presentarlas en una forma útil y ventajosa.

“Encontrar pepitas de oro o diamantes en una mina de carbón”

Principios: 1. La estadística clásica2. La inteligencia artificial (AI)3. La Maquina de aprendizaje

Data Mining – Minería de Datos90’s – Gregory Platetsky-

ShapiroKnowledge Discovery in

Databases

Data Fishing

Data Dredging

Data Archaelogy

Información Discovery

Page 8: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

PROCESOS PARA APLICAR DM

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningProcesos para aplicar el DM

Page 9: Data mining

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningProcesos para aplicar el DM

Procesos para aplicar DM

Selección del conjunto de datos

Análisis de los datos

Transformación del conjunto de datos de entrada

Seleccionar y aplicar la técnica de minería de datos

Extracción de conocimiento

Interpretación y evaluación de datos

Page 10: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Técnicas & Algoritmos de DM

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningTécnicas y Algoritmos de DM

Page 11: Data mining

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningTécnicas y Algoritmos de DM

Técnicas & Algoritmos de DM

IA y Estadística

Algoritmos: Clustering o clasificación, Reglas de asociación y Análisis de Secuencias.

Técnicas:Redes Neuronales, Método del Vecino mas Cercano,Reglas de inducción, Visualización de Datos,Arboles de decisión.

Page 12: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Principales Usos de DM

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningPrincipales Usos de DM

Page 13: Data mining

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningPrincipales Usos de DM

Principales Usos de DMNegocios y Comercio

Empleo

Elecciones

Medicina

Ciencia Ingeniería

Comportamiento de Internet

Page 14: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Software para aplicar DM

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningSoftware para aplicar DM

Page 15: Data mining

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningSoftware para aplicar DM

Software para aplicar DM

Ofrecen Soporte y Facilitan la toma de decisiones.

Comerciales y Libres

Desarrollo de Modelos de Minería de Datos

Uso del Estándar: PMML (Predictive Model Markup Language)

KNIME, Rap, Orage, RapidMiner

Page 16: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ejemplo

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningEjemplo

Page 17: Data mining

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningEjemplo

Ejemplo

El ejemplo clásico de aplicación de la minería de datos tiene que ver con la detección de hábitos de compra en supermercados. Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas.

Page 18: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Conclusión

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningConclusión

Page 19: Data mining

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningConclusión

Conclusión

Una visión a grande escala de los patrones que la información oculta.

Permite tomar decisiones asertivas a problemas, o para formular estrategias de mejora.  DataMining y modelos en constante evolución.

Los patrones pueden cambiar

Page 20: Data mining

DATA MINING

Universidad Tecnológica Emiliano Zapata del Estado de Morelos

Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones

Data MiningGracias

AIG R CA S“Torturar a los datos hasta que confiesen”

Page 21: Data mining

DATA MININGMINERÍA DE DATOS