36
UNIVERSIDADE FEDERAL DE ALAGOAS UNIVERSIDADE FEDERAL DE ALAGOAS INSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTES INSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTES CURSO DE BIBLIOTECONOMIA CURSO DE BIBLIOTECONOMIA ANÁLISE DA INFORMAÇÃO I ANÁLISE DA INFORMAÇÃO I TRATAMENTO TEMÁTICO DA INFORMAÇÃO: Processos de Análise e Representação Prof. EdivanioDuarte de Souza [email protected] Maceió, Alagoas 2011.1

TRATAMENTO TEMÁTICO DA INFORMAÇÃO: Processos de … · tradução para um vocabulário de indexação; ... avaliação da satisfação do usuário em relação à representação

Embed Size (px)

Citation preview

UNIVERSIDADE FEDERAL DE ALAGOASUNIVERSIDADE FEDERAL DE ALAGOASINSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTESINSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTESCURSO DE BIBLIOTECONOMIACURSO DE BIBLIOTECONOMIAANÁLISE DA INFORMAÇÃO IANÁLISE DA INFORMAÇÃO I

TRATAMENTO TEMÁTICO DA INFORMAÇÃO:Processos de Análise e Representação

Prof. Edivanio Duarte de [email protected]

Maceió, Alagoas2011.1

Tratamento da Informação no Sistema de Tratamento da Informação no Sistema de Recuperação da Informação (SRI)Recuperação da Informação (SRI)

� Diversos modelos, mais ou menos, similares de SRI;� “Entrada;◦ desenvolvimento da coleção [seleção e aquisição];◦ tratamento da informação [análise e representação da informação];◦ armazenamento.

� Saída:� Saída:◦ análise/negociação de questões [usuário];◦ estratégia de busca;◦ busca;◦ disseminação” (DIAS; NAVES, 2007, p. 15, grifo meu).

� Em outros modelos, por exemplo, nos de Cesarino (1985), Lancaster (2004) e Dodebei (2007), o tratamento da informação faz parte de um subsistema intermediário dedicado ao “processamento/tratamento/armazenamento” da informação.

Tratamento da Informação na Ciência da Tratamento da Informação na Ciência da Informação/BiblioteconomiaInformação/Biblioteconomia

� Expressão ou área do conhecimento (Ciência a Informação/Biblioteconomia) que abarca:◦ descrição física e temática dos documentos em uma biblioteca ou

SRI;

◦ desenvolvimento de instrumentos a serem utilizados nessas ◦ desenvolvimento de instrumentos a serem utilizados nessas descrições (códigos, linguagens, normas, padrões);

◦ concepção e implantação de estrutura físicas ou bases de dados destinadas ao armazenamento dos documentos e de seus simulacros (fichas, registros eletrônicos, etc.);

� Compreende as disciplinas classificação, catalogação, indexação e outras delas derivadas ou a elas relacionadas, tais como metadados e ontologias (DIAS; NAVES, 2007).

Tratamento da InformaçãoTratamento da Informação

� Tipos de tratamento da informação:◦ tratamento descritivo: elementos físicos extraídos do documento

(catalogação) - identificação extrínseca;

◦ tratamento temático: descreve o conteúdo (assunto) do documento (indexação, catalogação de assuntos e classificação) -identificação intrínseca.

Etapas do tratamento temático:� Etapas do tratamento temático:◦ análise de assunto (análise conceitual, análise temática, análise

documentária ou análise de informação): leitura do documento e extração dos conceitos que representam o seu conteúdo;

◦ tradução: passagem dos termos extraídos em linguagem natural para linguagem de indexação ou linguagem documentária (descritores de assunto, cabeçalhos de assunto, palavras-chave, termos de indexação ou enunciados) (DIAS; NAVES, 2007).

Tratamento da InformaçãoTratamento da Informação

Os Processos de Tratamento da Os Processos de Tratamento da InformaçãoInformação

� Descrição física:◦ exame do documento (leitura técnica do documento);

◦ identificação de elementos que representamextrinsecamente/fisicamente o documento (autor, título, edição, editora, local de publicação, ano de publicação, quantidade de páginas/folhas, etc.);páginas/folhas, etc.);

◦ seleção dos elementos e forma de descrição com base num instrumento de representação/código de catalogação (AACR2).

� Descrição temática:◦ exame do documento (leitura técnica do documento);

◦ extração e seleção de conceitos que representam intrinsecamente/conteúdo o documento (DIAS; NAVES, 2007).

Atividades e Designações do Tratamento Atividades e Designações do Tratamento da Informaçãoda Informação

� Catalogação:◦ descrição dos aspectos físicos (objetivos) dos documentos (autor,

título, edição, editora, local de publicação, ano de publicação, quantidade de páginas/folhas, etc) – chamada de representação/catalogação descritiva;representação/catalogação descritiva;

◦ descrição do conteúdo do documento – catalogação por assunto (pontos de acesso ou pistas).

� Classificação:◦ descrição do conteúdo do documento:

a) lugar do documento na coleção organizada por assunto;

b) sistemas de classificação (CDD e CDU) para representar o assunto (DIAS; NAVES, 2007).

Atividades e Designações do Tratamento Atividades e Designações do Tratamento da Informaçãoda Informação

� Indexação:◦ representação do conteúdo do documento;

◦ atividade dos serviços de “indexação e resumo” (periódicos científicos).

� Metadados:� Metadados:◦ descrição física dos documentos em bibliotecas digitais;

◦ cumpre, nas bibliotecas digitais, papel semelhante ao da catalogação nas bibliotecas tradicionais.

� Ontologias:◦ organização dos recursos eletrônicos com base no conteúdo;

◦ atividade semelhante aos processos de catalogação, classificação e indexação, que são realizadas em bibliotecas tradicionais (DIAS; NAVES, 2007).

Atividades de Tratamento Temático da Atividades de Tratamento Temático da InformaçãoInformação

� Há uma tendência em considerá-las (indexação, catalogação de assuntos e classificação) sob uma única designação decorrente de suas semelhanças:◦ identificam o assunto do documento;

◦ traduzem esse assunto para uma linguagem de indexação ◦ traduzem esse assunto para uma linguagem de indexação (linguagem documentária);

� Há, porém, diferenças:◦ a classificação visa determinar um único local do documento na

coleção/estante;

◦ a indexação e a catalogação de assunto podem indicar para um documento várias entradas num índice ou num catálogo (política de indexação) (DIAS; NAVES, 2007).

Instrumentos Usados no Tratamento da Instrumentos Usados no Tratamento da InformaçãoInformação

� Tratamento descritivo:◦ Catalogação: códigos de catalogação (Instruções Prussianas, Código de

Panizzi, Código de Jewett e Código de Catalogação Anglo-Americano);◦ Referências (bibliográficas): normas de descrição (NBR 6023/ABNT);◦ Metadados: formatos de metadados (Dublin Core).

� Tratamento Temático:� Tratamento Temático:◦ Indexação: linguagens de indexação ou documentárias (Cabeçalhos de

Assunto e Tesauros);◦ Classificação: linguagens de indexação simbólicas ou sistemas de

classificação bibliográfica e documentária (Classificação Decimal de Dewey e Classificação Decimal Universal);◦ Resumo: normas de elaboração (NBR 6028/ABNT) (DIAS; NAVES, 2007).

� Dias e Naves (2007) citam as tabelas de notação de autor (Cutter e PHA) como instrumentos de representação temática, mas elas apenas auxiliam aqueles na formação do número de chamada.

Produtos do Tratamento da InformaçãoProdutos do Tratamento da Informação

� Registros bibliográficos (referência bibliográfica);

� Registros catalográficos (ficha catalográfica);

� Resumos (Abstracts e/ou Serviço de Indexação e Resumo);

� Metadados (registros bibliográficos ou catalográficos de � Metadados (registros bibliográficos ou catalográficos de documentos eletrônicos);

� Pontos de acesso de catálogos (autor, título e/ou assunto);

� Pontos de acesso de bibliografias (autor, título e/ou assunto);

� Arranjo sistemático de coleções de documentos (a própria organização da coleção) (DIAS; NAVES, 2007).

A IndexaçãoA Indexação

� O termo indexação assume dois sentidos na literatura:◦ indexação (lato sensu): construção de índices (autores, títulos e

assunto), em livros, catálogos ou bancos de dados;

◦ indexação (sticto sensu): pontos de acesso ou catalogação de assunto das informações contidas em documentos.

� Na literatura de língua inglesa:� Na literatura de língua inglesa:◦ indexação back-of-book: no final do livro (mais exaustiva);

◦ indexação acadêmica: base de dados de resumo e catálogos de bibliotecas (menos exaustiva).

� Etapas da indexação (abordagem clássica):◦ extração dos conceitos representativos;

◦ tradução (instrumentos de indexação – linguagens de indexação ou linguagens documentárias).

� Etapas da indexação:◦ análise do assunto do texto;

◦ expressão do conteúdo do assunto nas palavras dos indexadores (linguagem natural);

◦ tradução para um vocabulário de indexação;

◦ expressão do assunto em termos de índice (CHU; O’BRIEN, 1993 apud DIAS; NAVES, 2007, p. 28).

Processos da IndexaçãoProcessos da Indexação

apud DIAS; NAVES, 2007, p. 28).

� A literatura dá maior destaque ao processo de tradução, sobretudo, as linguagens de indexação e classificação/documentárias (elaboração e uso);

� Pouca literatura sobre como os indexadores decidem sobre o assunto do documento (sobre o que ele trata) – processo de análise da informação.

� Dificuldades na indexação:◦ processo subjetivo;

◦ percepções diferentes dos indexadores:� o efetivo conteúdo do documento;

� a parte desse conteúdo que poderá responder às necessidades dos usuários;

Processos da IndexaçãoProcessos da Indexação

usuários;

� os conceitos importantes que devem ser selecionados para representar esse conteúdo;

� os descritores definidos para representar esses conceitos (STREHL, 1998 apud DIAS; NAVES, 2007).

? ? ?DOCUMENTO CONTEÚDO CONCEITOS DESCRITORES

� Necessidade de política de indexação:◦ cobertura (especificidade e exaustividade);

◦ coeficientes de recuperabilidade (revocação e precisão).

� Consistência na indexação:◦ medida de similaridade (concordância) entre termos atribuídos

por diversos indexadores a um mesmo documento;

Processo da IndexaçãoProcesso da Indexação

por diversos indexadores a um mesmo documento;

◦ ponto crítico em todo o processo de indexação (subjetividade);

� Inconsistência na indexação:◦ medida de variação de termos atribuídos a um mesmo

documento por mais de um indexador (lista de indexação);

◦ diferentes indexadores atribui diferentes termos indexadores a um mesmo documento;

◦ localiza-se, principalmente, no momento da expressão (verbalização) dos conceitos (níveis de especificidade).

� Relevância na indexação:◦ julgamento feito pelo usuário diante do resultado da busca em

SRI;

◦ conexões entre as situações de usuários (questão feita pelo usuário) e informação contida nos documentos (resposta dada pelo SRI);

Processo de IndexaçãoProcesso de Indexação

pelo SRI);

◦ avaliação da satisfação do usuário em relação à representação do documento.

Questãorepresentação da necessidade de

informação

Documentorepresentação do

conteúdo do documento

Relevância

Situações de Usuários Informação dos Documentos

� A análise e a representação da informação constituem o processo de indexação;

� Análise da informação:◦ determinação do conteúdo de um documento.;◦ identificação dos conceitos centrais do conteúdo do documento.

� Representação da informação:◦ atribuição de termos representativos desses conceitos

Processos de Análise e RepresentaçãoProcessos de Análise e Representação

◦ atribuição de termos representativos desses conceitos (linguagem natural);◦ tradução desses termos em linguagem do SRI (vocabulário

controlado).

� Funções dos processos de análise e de representação da informação:◦ construção de pontos de acesso/índices /catálogos (meio);◦ recuperação da informação (fim).

Análise e Representação da InformaçãoAnálise e Representação da Informação

De que trata o documento?- determinação do conteúdo;

Análise da Informação

Como representar este conteúdo?- atribuição de termos àqueles conceitos;

Representação da InformaçãoDocumento

Esquema do Indexador

Catálogo*

conteúdo;- extração de conceitos.

àqueles conceitos;- tradução do termos em LI/LD.

- Seleção de materiais de informação;- Formação de acervos;- Desenvolvimento de acervos.

- Seleção de fontes de informação;- Formação de coleções;- Desenvolvimento de coleções.

VocabulárioControlado

*impresso ou on-line.

Análise e Representação da InformaçãoAnálise e Representação da Informação

Qual minha necessidade de informação?- determinação do conteúdo;

Análise da Informação

Como representar este conteúdo?- atribuição de termos àqueles conceitos;

Representação da InformaçãoNecessidade

de informação

Esquema do Usuário

Catálogo*

conteúdo;- extração de conceitos.

àqueles conceitos;- tradução do termos em LI/LD.

- Seleção de materiais de informação;- Formação de acervos;- Desenvolvimento de acervos.

- Seleção de fontes de informação;- Formação de coleções;- Desenvolvimento de coleções.

Controle de vocabulário(catálogo)

*impresso ou on-line.

� Linguagem de indexação/linguagem documentária: conjunto de termos e/ou símbolos usados para determinar/representar classes de assuntos em SRI;

� Componentes básicos:◦ vocabulário (termo propriamente dito): relação dos termos e/ou

símbolos empregados na representação temática do documento:� controle semântico ou de significado.

Linguagem de Indexação/DocumentáriaLinguagem de Indexação/Documentária

� controle semântico ou de significado.

◦ sintaxe (estrutura frásica): regras para a combinação de termos e/ou símbolos que representam os documentos:� estabelece regras sobre o uso dos termos indexadores;� revela relações existentes entre os conceitos e os termos da linguagem

de indexação;� controle estrutural por intermédio da coordenação conceitos simples

para representar conceitos compostos (especificar e definir ordem de citação, por exemplo).

� O uso de linguagem natural pode acarretar diversos problemas:◦ dispersão terminológica;

◦ dispersão sintática.

� O controle de vocabulário ou o uso de LI/LD diminui essa dispersão a um nível aceitável:◦ controle de relações semânticas;

◦ controle de relações sintáticas (PINTO, 1985)

Linguagem de Indexação/DocumentáriaLinguagem de Indexação/Documentária

◦ controle de relações sintáticas (PINTO, 1985)

� Classificação das LI/LD:◦ evolução histórica (conceito de coordenação):

� tradicionais (pré-coordenadas). Ex.: Os cabeçalhos de assunto , os sistemas de classificação (CDD, CDU);

� modernas (pós-coordenadas). Ex.: Os tesauros.

◦ Ordenação:� sistemas alfabéticos. Ex.: Os cabeçalhos de assunto.

� sistemas classificados. Ex.: Os sistemas de classificação (CDD, CDU) (CESARINO; PINTO, 1978).

� Indica o termo alternativo ou substitutivo na relação;

� Evidencia-se na própria definição do termo;

� Subtipos de relações semânticas:◦ Equivalências: fornecem termos substitutivos (“ver”, “use” “see” ou

“X”):� sinônimo e antônimo (adubos x fertilizantes);

� quase sinônimo (datiloscopia x impressão digital);

Relações SemânticasRelações Semânticas

� quase sinônimo (datiloscopia x impressão digital);

� grafias diferentes (contact x contato);

� abreviaturas e acrônimos (ONU x Organização das Nações Unidas);

� traduções (recall x revocação);

� ordem de citação (automação de bibliotecas x biblioteca, automação de).

◦ Hierárquicas: fornecem termos alternativos (“ver também”, “use também”, “see also” ou “XX”) – exprimem o posicionamento de um conceito em relação a outro.

◦ Hierárquicas (continuação):� gênero x espécie:a) quase-genérica (gato x animal de estimação)b) genérica (gato x mamífero)� todo x parte (aparelho respiratório x pulmão).

◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia

Relações SemânticasRelações Semânticas

◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia de busca:� coordenação (porta x janelas);

� genética (pai x filho);� concorrente (educação x ensino);� causa e efeito (ensino x aprendizagem);� instrumental (medicina preventiva x vacinação);� material (esquadrias x alumínio);� similaridade de processos (catalogação x classificação) (PINTO, 1985).

Relações SintáticasRelações Sintáticas� Indica a relação entre os termos que representam o assunto;� Necessidade de se recuperar a interseção entre dois ou mais

conceitos:◦ assuntos simples (um único conceitos);◦ assuntos compostos (dois ou mais conceitos).

� As relações sintáticas são temporárias: dependem do documento;documento;

� Definem a importância dos termos numa estrutura frásica(ordem de citação):

Ex.: Uso do procedimento em cadeia para acesso aos conceitos ocultos (Ranganathan):

1 - NORMAS PARA FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO2 - FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO – NORMAS PARA3 - ESQUADRIAS DE ALUMÍNIO - NORMAS PARA FUNDIÇÃO DE4 - ALUMÍNIO – NORMAS PARA FUNDIÇÃO DE ESQUADRIAS (PINTO,1985).

� Cutter em 1876:◦ regra: usar a ordem da linguagem natural. Ex. Biblioteca

Universitária;◦ cabeçalho invertido: quando o segundo termo do cabeçalho

composto for notoriamente mais significativo (subjetividade). Ex. Bibliotecas, Planejamento de.

Relações Sintáticas: ordem de citaçãoRelações Sintáticas: ordem de citação

“O MAIS SIGNIFICATIVO” – “O MENOS SIGNIFICATIVO”Ex. BIBLIOTECONOMIA - HISTÓRIA

� Kaiser em 1911: buscou maior consistência:

CONCRETO – PROCESSO (PINTO, 1985)Ex. BIBLIOTECA – PLANEJAMENTO.

� Coates em 1960 – teoria da concretividade decrescente:

COISA depois a AÇÃO

Ex. BIBLIOTECA – PLANEJAMENTO;

Introduzindo o elemento “material”:

Relações Sintáticas: ordem de citaçãoRelações Sintáticas: ordem de citação

Introduzindo o elemento “material”:

COISA – MATERIAL – AÇÃO e

Ex. BIBLIOTECA – LIVROS - SELEÇÃO;

Dependente da coisa: parte, tipo ou propriedade:

COISA – PARTE – MATERIAL – AÇÃO (PINTO, 1985).

Ex. BIBLIOTECA – SETOR DE PERIÓDICOS – ESTANTES – ORGANIZAÇÃO.

� Conceito: palavras ou grupos de palavras que expressam o conteúdo de um documento;

� Necessidade de controle de linguagem:◦ fatores humanos (autores, indexadores e usuários):

� diferenças de cultura;

� experiência dos autores;

Cabeçalho de Assunto: aspectos geraisCabeçalho de Assunto: aspectos gerais

� domínio da terminologia.

◦ fatores lingüísticos:� sinônimos: vários termos designam o mesmo conceitos;

� homógrafos: o mesmo termo designam conceitos diferentes;

� sintaxe: o sentido dos termos é condicionado pela posição que este ocupa na frase.

◦ fatores hierárquicos: um conceito implica em outros mais amplos e/ou mais restritos (CESARINO, PINTO, 1978).

� Funções dos cabeçalhos de assunto num SRI:◦ representar o assunto de maneira consistente;◦ permitir a coincidência entre linguagem do indexador e

linguagem do pesquisador;◦ possibilitar o indexador modular o nível de sua pesquisa do

mais geral para o mais específico, e vice-versa, segundo a necessidade do usuário.

Cabeçalho de Assunto: funções e princípiosCabeçalho de Assunto: funções e princípios

necessidade do usuário.

� Princípios de elaboração dos cabeçalhos de assunto:◦ princípio específico: os assuntos devem dar entrada por termos

específicos;◦ princípio de uso: os assuntos seguem o princípio da

conveniência do usuário;◦ princípio sindético: os assuntos devem ser interligados por uma

rede bem construída de referências cruzadas (ver e ver também) (CESARINO ; PINTO, 1978).

Características do Cabeçalho de AssuntoCaracterísticas do Cabeçalho de Assunto

FONTE: Cesarino e Pinto (1978).

Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação

FONTE: Cesarino e Pinto (1978).

Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação

FONTE: Cesarino e Pinto (1978).

Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação

FONTE: Cesarino e Pinto (1978).

Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação

FONTE: Cesarino e Pinto (1978).

Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação

FONTE: Cesarino e Pinto (1978).

� Pode-se adotar duas abordagens:◦ abordagem analítica:

� garantia literária;

� participação do usuário;

◦ abordagem formal:

Cabeçalho de Assunto: elaboraçãoCabeçalho de Assunto: elaboração

◦ abordagem formal: � trabalho de especialistas;

� opinião de especialistas (CESARINO; PINTO, 1978).

ReferênciasReferênciasASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 6028: informação e documentação – resumo – apresentação. Rio de Janeiro: ABNT, 2003. 2p.

CESARINO, M. A. N. Sistemas de recuperação de informação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 157-168, set. 1985. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.

______; PINTO, M. C. M. Cabeçalho de assunto como linguagem de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 7, n. 2, p. 268-288, set. 1978. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.

DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e prática. Brasília: Teshaurus, 2007. 116p.

DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002. 119p.

LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos Livros, 2004. 347p.

PINTO, M. C. M. F. Análise e representação de assuntos em sistemas de recuperação de informação; linguagens de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 169-186, set. 1985. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.