44
Apresentação da Disciplina

Modelos de Recuperação de Informação: Introdução

Embed Size (px)

DESCRIPTION

Primeira aula do curso "Modelos Computacionais de Recuperação de Informação"

Citation preview

Page 1: Modelos de Recuperação de Informação: Introdução

Apresentação da Disciplina

Page 2: Modelos de Recuperação de Informação: Introdução

ApresentaçãoPeríodo 1 (24/10 – Manhã)

◦ Apresentação da Disciplina◦ Meio Ambiente da Recuperação de

Informação◦ Interfaces da Escrita◦ Informação◦ Ciência da Informação x Ciência da

ComputaçãoPeríodo 2 (24/10 – Tarde)

◦ Recuperação de Informação

Page 3: Modelos de Recuperação de Informação: Introdução

Apresentação

Período 3 – 01/10 Manhã Modelos ClássicosPeríodo 4 – 01/10 Tarde Modelos Dinâmicos

Page 4: Modelos de Recuperação de Informação: Introdução

Apresentação

Período 5 – 08/10 Manhã Documento: definição Formas de RepresentaçãoPeríodo 6 – 08/10 Tarde Indexação Automática

Page 5: Modelos de Recuperação de Informação: Introdução

Apresentação

Período 7 – 15/10 Manhã Abordagens centradas no usuário Abordagem cognitivaPeríodo 8 – 15/10 Tarde Expansão de consulta

Page 6: Modelos de Recuperação de Informação: Introdução

Apresentação

Período 9 – 22/10 Manhã Expansão de consulta Relevance Feedback Período 10 – 22/10 Tarde Interfaces

Page 7: Modelos de Recuperação de Informação: Introdução

ApresentaçãoPeríodo 11 (5/11 – Manhã)

◦ Recuperação de Informação na Web◦ Web Semântica

Período 12 (05/11 – Tarde)◦ Medidas de Avaliação◦ Considerações Finais

Page 8: Modelos de Recuperação de Informação: Introdução

ApresentaçãoAvaliação

◦ Atividades em sala de aula◦ Artigo científico

Page 9: Modelos de Recuperação de Informação: Introdução

Introdução

Page 10: Modelos de Recuperação de Informação: Introdução

Introdução:

Meio Ambiente da Recuperação da Informação

Page 11: Modelos de Recuperação de Informação: Introdução

Língua e LinguagemChamamos “língua” um sistema programado em nosso cérebro que, essencialmente, estabelece uma relação entre os esquemas mentais que formam nossa compreensão do mundo e um código que os representa de maneira perceptível aos sentidos. Os seres humanos utilizam um grande número de tais sistemas (“línguas”), que diferem em muitos aspectos e também se assemelham em muitos outros aspectos. [...]

(PERINI, 2010)

Page 12: Modelos de Recuperação de Informação: Introdução

Língua e LinguagemO sistema em questão é de uma complexidade extrema: compreende regras (de pronúncia, de formação de palavras, de formação de frases, de relacionamento das formas com os significados), itens léxicos (palavras e morfemas, com suas propriedades gramaticais e seus significados), expressões idiomáticas (como pisar na bola ou mãe de santo) e clichês (como ficar sem fala e tomar café).

(PERINI, 2010)

Page 13: Modelos de Recuperação de Informação: Introdução

Analógico x DigitalNa sociedade contemporânea o processo de digitalização expande-se a velocidades crescentes com pretensão de universalidade. Afirma-se até mesmo que vivemos em um mundo digital, no qual se instaura a vida digitalO caráter eminentemente informático desse processo se articula com a concepção de que o germe de todo conhecimento e poder é a informação, devidamente organizada armazenada e, enfim, distribuída.

(TENÓRIO, 1998)

Page 14: Modelos de Recuperação de Informação: Introdução

Analógico x Digital“Binária, a informática? Sem dúvida, em um certo nível de funcionamento de seus circuitos, mas faz tempo que a maioria dos usuários não mais tm qualquer relação com esta interface. Em que um programa de hipertexto ou de desenho é “binário”?

(Lévy, 1993, p.102)

Page 15: Modelos de Recuperação de Informação: Introdução

Língua/Linguagem x ComputadoresLinguística Computacional

◦ A área responsável pela investigação do tratamento computacional da linguagem e das línguas naturais.

◦ De acordo com Vieira & Lima (2001, p. 1), a Linguística Computacional pode ser entendida como “a área de conhecimento que explora as relações entre linguística e informática, tornando possível a construção de sistemas com capacidade de reconhecer e produzir informação apresentada em linguagem natural”.

Page 16: Modelos de Recuperação de Informação: Introdução

Introdução:

As Interfaces da Escrita

Page 17: Modelos de Recuperação de Informação: Introdução

Vídeo

Suporte Técnico

Page 18: Modelos de Recuperação de Informação: Introdução

As interfaces da EscritaA impressão à primeira vista é sem dúvida

um operador quantitativo, pois multiplica as cópias.

Mas representa também a invenção, em algumas décadas, de uma interface padronizada extremamente original: página de título, cabeçalhos, numeração regular, sumários, notas, referências cruzadas.

Todos esses dispositivos lógicos, classificatórios e espaciais sustentam-se uns aos outros no interior de uma estrutura admiravelmente sistêmica.

Page 19: Modelos de Recuperação de Informação: Introdução

LivroSegmentação do saber em módulos;Páginas uniformemente numeradas;

Sumários e índices;Exame rápido do conteúdo;Acesso não linear e seletivo ao texto;Conexões a outros escritos (bibliografia)

Page 20: Modelos de Recuperação de Informação: Introdução

Livro

Page 21: Modelos de Recuperação de Informação: Introdução

JornalAdaptados a uma atitude de “atenção

flutuante”;No território quadriculado do livro

precisamos de índices, sumários, etc. O leitor do jornal realiza diretamente

uma navegação a olho nu;As manchetes chamam a atenção,

dando uma primeira ideia, pinçam-se aqui e ali algumas frases, uma foto e, de repente, encontramos algo que nos atrai.

Page 22: Modelos de Recuperação de Informação: Introdução

Jornal

Page 23: Modelos de Recuperação de Informação: Introdução

Revista

Page 24: Modelos de Recuperação de Informação: Introdução

ComputadorPacote terrivelmente redobrado, com

pouquíssima superfície que seja diretamente acessível em um mesmo instante. A manipulação deve então substituir o sobrevoo.

Ferramentas◦ Tela gráfica de alta resolução;◦ Representação icônica (figurada) das estruturas

de informação e dos comandos;◦ Uso do mouse, permitindo agir sobre o que

ocorre na tela;◦ Menus que mostram as operações que se pode

realizar;

Page 25: Modelos de Recuperação de Informação: Introdução

Computador

Page 26: Modelos de Recuperação de Informação: Introdução

Computador

Page 27: Modelos de Recuperação de Informação: Introdução

Computador

Page 28: Modelos de Recuperação de Informação: Introdução

Informação

Page 29: Modelos de Recuperação de Informação: Introdução

InformaçãoShannon e Weaver (1949, p.3)

definem informação como:O que acrescenta algo a uma representação [...] Recebemos informação quando o que conhecemos se modifica. Informação é aquilo que logicamente justifica alteração ou reforço de uma representação ou estado de coisas.

Esta definição, base da Teoria da Informação, foi fundamental na construção dos primeiros computadores eletrônicos.

Page 30: Modelos de Recuperação de Informação: Introdução

Teoria da Informação

Estou bem

Estou bemEstou malMeu fim está próximo

País 1

País 2

Page 31: Modelos de Recuperação de Informação: Introdução

InformaçãoSegundo Ruyer, (1972, p. 3):

A palavra ’informação’, em seu sentido usual, parece comportar, necessariamente, um elemento de consciência e de sentido. [...] A informação, no sentido habitual do termo, é a transmissão a um ser consciente de uma significação, de uma noção, por meio de uma mensagem com base em um suporte espaço-temporal: imprensa, mensagem telefônica, onda sonora, etc.

Page 32: Modelos de Recuperação de Informação: Introdução

InformaçãoBuckland (1991) identifica três principais usos

do termo “informação”:◦ Como processo - o ato de informar ou a comunicação do

conhecimento ou notícias sobre um fato ou ocorrência;◦ Como conhecimento - o que é percebido pela

informação enquanto processo, o conhecimento comunicado. Sua principal característica é a intangibilidade;

◦ Como coisa - aquilo que é visto como informativo: objetos, documentos, textos, dados ou eventos. A sua principal característica é a tangibilidade, sua materialidade.

A “informação como coisa” possui papel fundamental em sistema de recuperação de informação.

Page 33: Modelos de Recuperação de Informação: Introdução

A Ciência da Informação

Page 34: Modelos de Recuperação de Informação: Introdução

Ciência da Informação A Revolução Industrial; Novas invenções se seguiram durante o século XIX, a maioria

delas ligadas à transmissão de informação.◦ 1820 - desenvolvimento da fotografia◦ 1840 - John Benjamin Dancer combinou a fotografia com a microscopia

e se tornou o pioneiro da microfotografia e da microfilmagem.◦ 1843 - Alexander Bain patenteou o primeiro aparelho de fax da história.◦ 1876 - Alexander Graham Bell patenteou o seu telefone. ◦ 1877 - Thomas Edison criou a primeira máquina de gravar sons e em

1879 projetou a lâmpada elétrica. Início do século XX - Paul Otlet apresenta o termo

“Documentação” Em sua obra Paul Otlet mostra-se interessado em toda

novidade tecnológica que permita condensar e organizar a informação de acordo com suas necessidades e objetivos

Page 35: Modelos de Recuperação de Informação: Introdução

Ciência da Informação

Paul Otlet

Vannevar Bush

Page 36: Modelos de Recuperação de Informação: Introdução

Ciência da InformaçãoDisciplina que investiga as propriedades e o comportamento da informação, as forças que regem o fluxo da informação e os meios de processamento da informação para acessibilidade e usabilidade ótimas. Está relacionada com o corpo de conhecimento que abrange a origem, coleta, organização, armazenamento, recuperação, interpretação, transmissão, transformação e utilização da informação. Isto inclui a investigação das representações da informação nos sistemas naturais e artificiais, o uso de códigos para a transmissão eficiente de mensagem, e o estudo dos dispositivos e técnicas de processamento de informação tais como computadores e seus sistemas. É uma ciência interdisciplinar derivada de e relacionada a vários campos tais como matemática, lógica, linguística, psicologia, tecnologia da computação, pesquisa operacional, artes gráficas, comunicações, biblioteconomia, administração e outros campos similares. Possui um componente de ciência pura, que investiga o assunto sem considerar suas aplicações, e um componente de ciência aplicada, que desenvolve serviços e produtos. (BORKO, 1968, p. 3).

Page 37: Modelos de Recuperação de Informação: Introdução

Ciência da Informação[...] a Ciência da Informação é um campo dedicado às questões científicas e à prática profissional voltadas para os problemas da efetiva comunicação do conhecimento e de seus registros entre os seres humanos, no contexto social, institucional ou individual do uso e das necessidades de informação. No tratamento destas questões são consideradas de particular interesse as vantagens das modernas tecnologias informacionais (SARACEVIC, 1996, p. 47).

Page 38: Modelos de Recuperação de Informação: Introdução

A Ciência da Computaçãoe sua relação com aCiência da Informação

Page 39: Modelos de Recuperação de Informação: Introdução

Ciência da ComputaçãoDenning et al (1989, p. 12)

[…] o estudo sistemático de processos algorítmicos que descrevem e transferem informação: sua teoria, análise, projeto, eficiência, implementação e aplicação. A questão fundamental de toda a computação é: ‘O que pode ser (eficientemente) automatizado.

Fonseca Filho (1999, p. 13)[...] um corpo de conhecimento formado por uma infraestrutura conceitual e um edifício tecnológico onde se materializam o hardware e o software. A primeira fundamenta a segunda e a precedeu.

Page 40: Modelos de Recuperação de Informação: Introdução

Information Retrieval

Termo criado em 1951 por Calvin Mooers:

[A Recuperação de Informação] trata dos aspectos intelectuais da descrição da informação e sua especificação para busca, e também de qualquer sistema, técnicas ou máquinas que são empregadas para realizar esta operação.

Page 41: Modelos de Recuperação de Informação: Introdução

Information Retrieval

A Recuperação de Informação se firmou como uma área de pesquisa autônoma no seio da Ciência da Informação, com um acelerado desenvolvimento.

Para Saracevic (1999), a Recuperação de Informação pode ser considerada a vertente tecnológica da Ciência da Informação e é resultado da relação desta com a Ciência da Computação.

Page 42: Modelos de Recuperação de Informação: Introdução

Informação x Computação

Ciência da Informação

Ciência da Computação

Recuperação de

Informação

Page 43: Modelos de Recuperação de Informação: Introdução

Referênciasbibliográficas

Page 44: Modelos de Recuperação de Informação: Introdução

Referências bibliográficas BORKO, H. Information Science: What is it? American Documentation, v. 19, n. 1, 1968.

p.3-5. BUCKLAND, M.K. Information as thing. Journal of the American Society of Information

Science, v.42, n.5, 1991. p.351-360. DENNING, P.J. et al. Computing as a discipline. Communication of the ACM, v. 32, n. 1,

1989. p.9-23. FONSECA FILHO, C. História da computação – teoria e tecnologia. São Paulo: LTr, 1999. LÉVY, Pierre. As tecnologias da Inteligência. Rio de Janeiro: Editora 34, 1993. MOOERS, C. Zatocoding applied to mechanical organization of knowledge. American

Documentation, v. 2, n. 1, 1951, p.20-32. PERINI, Mário A. Sobre língua, linguagem e Linguística: uma entrevista com Mário A.

Perini . ReVEL. Vol. 8, n. 14, 2010. RUYER, R. A cibernética e a origem da informação. Rio de Janeiro: Paz e Terra, 1972. SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectivas em

Ciência da Informação, v. 1, n. 1, 1996, p.41-62. SARACEVIC, T. Information Science. Journal of the American Society for Information

Science, v. 50, n. 12, 1999, p.1051-1063. SHANNON, C.; WEAVER, W. The Mathematical Theory of Communication. University of

Illinois Press, 1949.