Upload
diego-morientez-inc
View
955
Download
0
Tags:
Embed Size (px)
Citation preview
DATA MININGMINERÍA DE DATOS
MINERIA DE DATOS“Torturar a los datos hasta que confiesen”
DATA MINING
Presentado por: Felipe Gudiño Diego
Alejandro Lobato Farias José Antonio
Sotelo Colín Iván JesúsRaúl Villafán BarandaSergio González Cruz
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data Mining
Introducción
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Definición
Técnicas y Algoritmos
Conclusión
Procesos
Software
Principales Usos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningContenido
DATA MINING
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
INTRODUCCIÓN
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningIntroducción al DM
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningIntroducción al DM
Introducción
Era de la Información (Tecnologías de la Información y la
Comunicación) Información = Poder & Éxito
Ordenadores + Medios de Almacenamiento Masivo Enormes Cantidades de Información
Enormes Colecciones de Información = Nuevas necesidades
“Data Mining” – Minería de DatosExplorar y Analizar grandes volúmenes de InformaciónEncontrar correlaciones significativas (Tendencias &
Comportamientos)
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
DEFINICIÓN DEL DM
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningDefinición del DM
² ² ² ² ²² ²Universidad Tecnológica Emiliano Zapata del Estado de
Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningDefinición del DM
Definición del DM
Proceso de exploración y análisis de grandes volúmenes de datos para hacerlos mas comprensibles, predecir tendencias y comportamientos.
Conjunto de técnicas y herramientas usadas para encontrar y entender relaciones en grandes cantidades de datos y presentarlas en una forma útil y ventajosa.
“Encontrar pepitas de oro o diamantes en una mina de carbón”
Principios: 1. La estadística clásica2. La inteligencia artificial (AI)3. La Maquina de aprendizaje
Data Mining – Minería de Datos90’s – Gregory Platetsky-
ShapiroKnowledge Discovery in
Databases
Data Fishing
Data Dredging
Data Archaelogy
Información Discovery
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
PROCESOS PARA APLICAR DM
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningProcesos para aplicar el DM
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningProcesos para aplicar el DM
Procesos para aplicar DM
Selección del conjunto de datos
Análisis de los datos
Transformación del conjunto de datos de entrada
Seleccionar y aplicar la técnica de minería de datos
Extracción de conocimiento
Interpretación y evaluación de datos
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Técnicas & Algoritmos de DM
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningTécnicas y Algoritmos de DM
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningTécnicas y Algoritmos de DM
Técnicas & Algoritmos de DM
IA y Estadística
Algoritmos: Clustering o clasificación, Reglas de asociación y Análisis de Secuencias.
Técnicas:Redes Neuronales, Método del Vecino mas Cercano,Reglas de inducción, Visualización de Datos,Arboles de decisión.
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Principales Usos de DM
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningPrincipales Usos de DM
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningPrincipales Usos de DM
Principales Usos de DMNegocios y Comercio
Empleo
Elecciones
Medicina
Ciencia Ingeniería
Comportamiento de Internet
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Software para aplicar DM
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningSoftware para aplicar DM
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningSoftware para aplicar DM
Software para aplicar DM
Ofrecen Soporte y Facilitan la toma de decisiones.
Comerciales y Libres
Desarrollo de Modelos de Minería de Datos
Uso del Estándar: PMML (Predictive Model Markup Language)
KNIME, Rap, Orage, RapidMiner
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ejemplo
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningEjemplo
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningEjemplo
Ejemplo
El ejemplo clásico de aplicación de la minería de datos tiene que ver con la detección de hábitos de compra en supermercados. Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas.
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Conclusión
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningConclusión
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningConclusión
Conclusión
Una visión a grande escala de los patrones que la información oculta.
Permite tomar decisiones asertivas a problemas, o para formular estrategias de mejora. DataMining y modelos en constante evolución.
Los patrones pueden cambiar
DATA MINING
Universidad Tecnológica Emiliano Zapata del Estado de Morelos
Ingeniería en Tecnologías de la InformaciónBase de Datos para Aplicaciones
Data MiningGracias
AIG R CA S“Torturar a los datos hasta que confiesen”
DATA MININGMINERÍA DE DATOS