Upload
internet
View
111
Download
0
Embed Size (px)
Citation preview
DATA MININGDATA MININGDATA MININGDATA MINING
Fabiany LamboiaFabiany Lamboia
Luciano Machado PereiraLuciano Machado Pereira
SumárioSumárioSumárioSumário
• IntroduçãoIntrodução• ConceitosConceitos• Principais TarefasPrincipais Tarefas• TécnicasTécnicas• Algoritmos utilizadosAlgoritmos utilizados• AplicaçõesAplicações• TecnologiasTecnologias• ConclusãoConclusão
IntroduçãoIntroduçãoIntroduçãoIntrodução Empresas acumulam diversos dados em seus bancos de dados
Informação sobre os vários processos das funções da empresa
Estes dados podem contribuir com a empresa, sugerindo tendências e particularidades pertinentes a ela
A tecnologia de Data Mining com suas ferramentas permite a "mineração“ destes dados.
ConceitoConceitoConceitoConceito
Data mining (DM), é o processo de seleção, exploração de dados e criação de modelos que utiliza um grande volume de armazenamento de dados para identificar padrões previamente desconhecidos.
Principais Tarefas Principais Tarefas
• Classificação• Estimativa• Segmentação• Regressão• Agregação (cluster)
• Sumarização • Modelo de Dependência• Associação • Análise de Seqüência• Predição
Principais Tarefas Principais Tarefas
TécnicasTécnicas
• EstatísticaEstatística• Métodos LinearesMétodos Lineares• Indução de RegrasIndução de Regras
– Regras de ClassificaçãoRegras de Classificação– Regras de AssociaçãoRegras de Associação– Regras de CaracterizaçãoRegras de Caracterização
Algoritmos utilizadosAlgoritmos utilizadosAlgoritmos utilizadosAlgoritmos utilizados
• Árvores de DecisãoÁrvores de Decisão• ClusterCluster• Naive BayesNaive Bayes• Adaptive Bayes NetworkAdaptive Bayes Network
AplicaçãoAplicaçãoAplicaçãoAplicação
• Marketing• Vendas• Finanças• Manufatua• Saúde• Energia
TecnologiasTecnologiasTecnologiasTecnologias
• IBM DB2 Enterprise Edition 8.2: suporta IBM DB2 Enterprise Edition 8.2: suporta técnicas de árvore de decisão regressão, técnicas de árvore de decisão regressão, associação e técnicas de agrupamento;associação e técnicas de agrupamento;
• Oracle Database 10g: Naive Bayes, Oracle Database 10g: Naive Bayes, redes Adaptive Bayes e Support Vector redes Adaptive Bayes e Support Vector Machines;Machines;
• Microsoft SQL Server 2000 Analisys Microsoft SQL Server 2000 Analisys Services: suporta árvores de decisão.Services: suporta árvores de decisão.
Empresas Empresas Empresas Empresas • Wall Mart : 60% das mães que compram Wall Mart : 60% das mães que compram
boneca Barbie, levam também uma barra de boneca Barbie, levam também uma barra de chocolate;chocolate;
• Banco Itaú : aumentar sua taxa de retorno Banco Itaú : aumentar sua taxa de retorno nas malas diretas para 30%;nas malas diretas para 30%;
• Sprint : previa com 61% de segurança se o Sprint : previa com 61% de segurança se o consumidor trocaria de companhia de consumidor trocaria de companhia de telefone dentro de um período de 2 meses;telefone dentro de um período de 2 meses;
• SERPRO : cruzar e analisar informações em SERPRO : cruzar e analisar informações em cinco minutos, o que antes demorava quinze cinco minutos, o que antes demorava quinze dias de trabalho.dias de trabalho.
ConclusãoConclusãoConclusãoConclusão
A tendência é que todo desenvolvedor de banco de dados dever ser capaz de criar e treinar os modelos de data mining para incorporar esses recursos avançados nos aplicativos do consumidor.