26
Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Embed Size (px)

Citation preview

Page 1: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Mineração na Web – CIn/UFPE

Emmanuel TenórioThiago FialhoWagner Rolim

Filtragem de Informação

Page 2: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

RoteiroIntroduçãoFiltragem de Informação x

RecuperaçãoPerfil do usuárioTécnicas de FiltragemFiltragem Baseada no ConteúdoFiltragem ColaborativaConclusãoReferências

Page 3: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

IntroduçãoRecuperação de informação traz

grande volume de informações irrelevantes.

Page 4: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

IntroduçãoFalta de padronização e

classificação de conteúdo

Como encontrar algo relevante?Esforço próprioSorteRecomendação de amigos

Page 5: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Introdução

Necessidade de Filtragem de informação!!

Principais tiposFiltragem baseada em conteúdoFiltragem colaborativa

Page 6: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem x RecuperaçãoFiltragem de Informação

Recuperação de Informação

Perfil do usuárioArmazenamento, índices, tecnologia para recuperar docs

Maior tempo no casamento de interesses

Base estática no armazenamento

Início da interação provocada pelo sistema

Início da interação provocada pelo usuário (query)

Preferências Necessidade de momento

Page 7: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Perfil do UsuárioColeta de informações para conhecer o

usuárioDados pessoaisComportamentais

Possibilita a triagem de informação relevante

Identificação acontece no servidor (login) ou no cliente (cookies)

Page 8: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Perfil do UsuárioIdentificação por login

Cadastro de dados pessoaisMaior precisão

Identificação por cookiesSuposição de computador com um único

usuárioMais simples, menos confiável

Page 9: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Perfil do UsuárioForma Implícita: Inferência

Monitoramento de ações que indicam interesseAdicionar aos favoritosVisualizar página por muito tempoColocar produto em cesta de compras

Análise de estatística de acesso

Page 10: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Perfil do UsuárioForma Implícita: Desvantagem

O usuário pode comprar presente para outra pessoa!

Page 11: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Perfil do UsuárioForma Explícita

Definição explícita de preferências do usuário

Page 12: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Perfil do UsuárioForma Explícita: Desvantagem

Demanda tempo, paciência e atenção do usuário!

Page 13: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Técnicas de FiltragemCross Selling

Histórico de vendas de clientes com mesmo perfil

Filtragem Baseada em ConteúdoFiltragem Colaborativa

Page 14: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem Baseada em ConteúdoAnalisa a correlação entre as informações

contidas no perfil do usuário e as características extraídas dos itens selecionados a fim de sugerir os itens relevantes e descartar os itens que não são interessantes ao perfil do usuário.

Page 15: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem Baseada em ConteúdoSegundo Lichtnow et al (2006) a

filtragem por conteúdo parte do princípio de que os usuários tendem a se interessar por itens que se interessaram no passado

Segundo Schafer (1999), esta técnica pode ser chamada de recomendação de “item para item”

Page 16: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem Baseada em Conteúdo

Base de dados do perfil

Novo item relacionado com os itens antigos

Page 17: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem Baseada em ConteúdoO perfil do usuário pode ser atualizado

ManualmenteAutomaticamente de acordo com o feedback

ProblemasDesempenho comprometido cuja importância

é enormeComo extrair automaticamente atributos

relevantes de música, fotos, filmes etc.?Como descobrir coisas novas e

interessantes?

Page 18: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem Baseada em ConteúdoUm exemplo pode ser a filtragem de

conteúdos impróprios para crianças bloqueando o sistema de transmitir a informação como programas de acesso a sites destinados a adultos

Outro exemplo é o filtro de spam, onde um sistema verifica o conteúdo de uma mensagem e analisa o padrão das mensagem para identificar se ela se encaixa no perfil de spam ou até mesmo de vírus

Page 19: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem ColaborativaBaseada em análises anteriores de

outros usuário com o mesmo interesse

Nota: 5 estrelas

Nota: 5 estrelas

Sem notaChute: 5 estrelas

Page 20: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem ColaborativaMede a similaridade entre os

usuários

Pessoas que concordam no passado tendem a concordar novamente no futuro

Tem que garantir a honestidade da informação

Page 21: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem ColaborativaAplicação em qualquer domínioPode gerar recomendações

inesperadasPrincipais funções:

Retornar para o usuário somente informações importantes para ele

Recomendar o mesmo resultado para outros usuário com interesse comum

Page 22: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem ColaborativaPode ser dividida em 2 momentos:

1º - usuário como produtor da informação

Perfil dos usuários

Sistema de Recomendaçã

o

Informações coletadas de forma implícita ou explícita

Informações adicionadas ao perfil do usuário

Page 23: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem ColaborativaPode ser dividida em 2 momentos:

2º - usuário como consumidor da informação

Recomendações

Perfil dos usuários

Sistema de Recomendaçã

o

Usuário deseja receber uma recomendação

Informações são lidas pelos sistema de recomendação

O SR filtra os itens de acordo com o perfil do usuário

O SR gera as recomendações

As recomendações são entregues ao usuário

Page 24: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Filtragem ColaborativaA filtragem é feita em três passos:

Encontrar os usuários vizinhosProcessar as avaliações registradasAplicar a predição

Page 25: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

ConclusãoResolve o problema do retorno da

grande quantidade de conteúdo indesejado

Diminui o tempo gasto em pesquisas

Direcionamento de produtos

Page 26: Mineração na Web – CIn/UFPE Emmanuel Tenório Thiago Fialho Wagner Rolim Filtragem de Informação

Referênciashttp://www.slideshare.net/leandrociuffo/um-

estudo-de-caso-para-verificar-a-suscetibilidade-a-incentivos-de-avaliadores-de-produtos-na-web

http://www.frb.br/ciente/Impressa/Info/I.3.Oliveira,CAF.%20FiltragemColaborativa.pdf

www.cin.ufpe.br/~compint/aulas-IAS/ias/ias-021/filtragem.ppt

http://www.cin.ufpe.br/~tg/2001-2/bldb.pdf