19
VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos Miguel Tobar Toledo 1º Avaliador: Prof. Dr. Ricardo de Freitas PUC-CAMPINAS Faculdade de Engenharia de Computação Campinas 2008

VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Embed Size (px)

Citation preview

Page 1: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS

Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar ToledoPresidente da Banca: Prof. Dr. Carlos Miguel Tobar Toledo

1º Avaliador: Prof. Dr. Ricardo de FreitasAluno: Eduardo Rossit Paiossin

PUC-CAMPINASFaculdade de Engenharia de Computação

Campinas

2008

Page 2: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Conteúdo• Introdução• Problema• Objetivo• Técnicas de Visualização da Informação• Busca Semântica • Algoritmo de Desenho• Metodologia• Diagrama de Arquitetura• Plano de Avaliação• Complexidade• Conclusão

2TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 3: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Introdução

• Enorme quantidade de dados;

• Do ponto de vista do usuário, importa a absorção e a assimilação dos dados (informações) disponibilizados;

• Concepção de estruturas de visualização da informação

3TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 4: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Problema

• Os sistemas de busca convencionais utilizam como critério de pesquisa palavras-chave e índices;

• A dificuldade em visualizar as informações recuperadas em uma busca de forma eficaz pode acarretar problemas ainda maiores aos usuários;

• Perda de tempo filtrando informações não relevantes;

• Informação escondida na massa de dados.

4TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 5: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Objetivo

• O objetivo deste trabalho é obter resultados mais significativos que o sistema do Witerkosk (2006) apresenta para uma determinada pesquisa.

• A teoria sobre visualização da informação baseada em três dimensões (3D), proporciona melhorias significativas na visualização dos resultados;

• Combinada a buscas semânticas nos documentos.

5TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 6: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Visualização da Informação

• A técnica Overview-Detail (Card, MacKinlay e Shneiderman, 1999)

• Tem como objetivo principal oferecer ao usuário um mecanismo em que ele possa navegar sistemicamente na estrutura e na relação todo-parte.

6TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 7: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Visualização da Informação

• Aplicando as técnicas de Card, MacKinlay e Shneiderman (1999) a este trabalho;

• Transformação dos dados para que estes possam ser apresentados em forma de uma pirâmide.

7TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 8: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Busca Semântica

• Integração com o sistema de Witerkosk (2006);– Fases da Busca do sistema de Witerkosk (2006)

• Indexação dos documentos ;• Cálculo da freqüência inversa ;• Aplicação da decomposição em valores

singulares ;• Comparação de documentos

8TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 9: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Buscas Indiretas

• Melhoria no modo de utilização da busca;

• Buscas Indiretas consistem em utilizar os próprios resultados da busca direta como ponto de partida para novas buscas, ou seja, usar o próprio conteúdo dos resultados (monografias) como palavras-chave para novas buscas.

9TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 10: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Spring-Embbeder

• O modelo Spring-Embedder foi originalmente proposto por Eades (1984 apud CHEN, 2006) ;

• O Spring-Embedder é associado a dois tipos de forças: Forças de Atração (Fa) e Forças de Repulsão (Fr).

10TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 11: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Modo de desenho

• Módulo gráfico deste trabalho foi utilizada a API do Java 3D;

• Para a confecção da pirâmide, não era conhecido no mercado algoritmo algum de transformação;

11TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 12: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Metodologia

• As metodologias utilizadas foram a Engenharia Reversa (SOMMERVILLE, 2003) e a Prototipação (PRESSMAN, 1995).

• Em um primeiro momento, foi necessário utilizar a Engenharia Reversa (SOMMERVILLE, 2003; PRESSMAN, 1995) para realizar o estudo de um software já existente (WITERKOSK, 2006);

12TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 13: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Metodologia

• Num segundo momento, houve a necessidade de utilizar a metodologia de Prototipação (PRESSMAN, 1995).

13

Neste trabalho, as etapas de projeto rápido e de construção do protótipo foram unificadas, trabalhando ambas em conjunto

TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 14: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Diagrama de Arquitetura

14

Legenda:  - Em branco/azul, será desenvolvido pelo aluno - Em verde, se já está pronto, mas precisa integrar com o sistema.

TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 15: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Plano de Avaliação

• Especialista avaliar este trabalho;

• O especialista é o professor responsável pela disciplina Projeto Final II, do curso de Engenharia de Computação da PUC-Campinas;

15TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 16: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Plano de Avaliação

• Foi realizado o mesmo cadastro nos dois sistemas para proporcionar a comparação deste;

• O preenchimento de questionário estruturado, com o objetivo de avaliar se o objetivo do trabalho foi ou não alcançado.

16TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 17: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Complexidade

• Interface Gráfica 3D;• Visualização da Informação• Integração com outro sistema de busca• Trabalhar com Prototipação• Utilização do algoritmo de transformação

17TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 18: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Conclusão

• O foco principal do trabalho foi possibilitar ao usuário uma análise dos dados;

• Conclui-se que o desenvolvimento deste trabalho foi muito além das disciplinas vistas no curso de Engenharia de Computação, o que mostra que estas preparam o alicerce dos conhecimentos do autor deste trabalho

18TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA

Page 19: VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA ENTRE DOCUMENTOS Orientador / Co-Orientador : Prof. Dr. Carlos Miguel Tobar Toledo Presidente da Banca: Prof. Dr. Carlos

Conclusão

• A avaliação do especialista mostra que o objetivo deste trabalho foi cumprido, visto que o resultado da avaliação apresenta valor máximo de concordância em todas as afirmações do questionário.

TCC - VISUALIZAÇÃO DA LIGAÇÃO SEMÂNTICA 19