Upload
internet
View
106
Download
2
Embed Size (px)
Citation preview
TesaurosJosé Antonio M. Nascimento
Tesauros – Antecedentes históricos
• Tesauro – palavra de origem grega Thesaurós
• Em inglês – Treasury/storehouse • 1852 – Thesaurus of English
Words and Phrases – Peter Mark Roget
• Roget Thesaurus• Brasil – Dicionário Inverso –
Palavras Cruzadas
Tesauros – Antecedentes históricos
• A partir de 1940 – termo utilizado na C.I.
• Recuperação da informação – transporte de conceitos e suas relações mútuas.
• Controle de sinônimos e estruturas sintáticas simplificadas.
• Manipulação de grande quantidade de documentos
• Tesauro – evolução do índice remissivo?
Tesauros – composição
• Relações hierárquicas (paradigmáticas)
• Relações associativas (sintagmáticas)
• O tesauro é um instrumento auxiliar da indexação/recuperação de informações?
Tesauros – características
• Relações consistentes de descritores e termos.
• Complexa rede de referências cruzadas.
• Interação com o usuáriouniverso das demandas de
informação x universo dos documentos disponíveis
Tesauros – universo conceitual
• Estabelecendo um universo conceitual:
• Tesauros em um novo serviço de informação x usuários – estudo preliminar/projeto.
• Análise da informação/fontes de informação.
Tesauros – universo conceitual
• Estabelecendo um universo conceitual:
• Fontes primárias – comunicação do conhecimento em língua natural
Listas de pesquisa retrospectiva e perfis de interesse.
Discussões com usuário em potencial. Reunião de documentos representativos –
análise do comitê. Indexação de outros centros de
informação.
Tesauros – universo conceitual
• Estabelecendo um universo conceitual:
• Fontes secundárias– apresentação do conhecimento de forma estruturada.
Lista de descritores, classificações bibliográficas ou não, outros tesauros.
Tratados de terminologia. Enciclopédia/dicionários/glossários/
similares. Índices e resumos.
Tesauros – universo conceitual
• Na construção de tesauros é melhor usar fontes primárias pu secundárias?
Tesauros – universo conceitual
• Na construção de tesauros é melhor usar fontes primárias ou secundárias?
Coletando termos para um tesauro
Método de Dodebbei (1979)
• Conhecimento prévio do domínio – assunto.
• Observação do campo conceitual – tema.
Coletando termos para um tesauro
Metodologias em C.I• indutivo/empírico/analítico• Frequência de ocorrência do
termo x incidência dos termos nas estratégias de busca
• Hierarquia é construída através dos termos atése obter gêneros e mínimas espécies.
Coletando termos para um tesauro
Metodologias em C.I• Dedução/Gestalt• Formação de comitês para
discussão dos termos que irão compor a estrutura do tesauro.
• Qual o melhor método de recuperação da informação?
Tesauros – princípios do levantamento de termos
• Princípio da garantia literária:• Características da literatura
definem as classes definidas em um sistema de recuperação da informação/tesauro.
• Princípio do endosso do usuário:• Os termos escolhidos para o
tesauro são aqueles diretamente utilizados por usuários de um determinado campo do conhecimento.
Tesauros – abordagens teóricas na análise conceitual de termos
• Divisão lógica do processo dedutivo:• A hierarquização de conceitos é
um processo analítico – divisão do tema geral em espécies.
• Predicação conceitual:• O objeto é pensado como único,
distinto, constituindo como unidade – objetos individuais
Tesauros – Divisão lógica do processo dedutivo – aspectos da estrutura classificatória
• a) completude: • A divisão do conceito deve ser
completa, adequada e ordenada por complexidade crescente - simples ao completo ou do abstrato ao concreto.
• b) irredutibilidade• Não se deve enumerar mais do que os
elementos verdadeiramente distintos entre si, de maneira que nenhum esteja compreendido no outro.
Tesauros – Divisão lógica do processo dedutivo – aspectos da estrutura classificatória
• c) mútua exclusividade: • Para cada derivação deve-se utilizar
apenas um conceito.• Os conceitos devem estar totalmente
relacionados com a hierarquia adotada no tesauro. Os conceitos podem estar relacionados por:• Coordenação de classes –
relacionamento sintagmático.• Subordinação de classes –
relacionamento paradigmático.
Tesauros – processo dedutivo – limitações do uso da divisão lógica na concepção de classificações bibliográficas• a) relações gênero/espécie, coisa/variedades é
apenas uma das relações utilizadas nas classificações bibliográficas.
• b) é inadequado limitar-se às características que constituem qualidades genéricas essenciais.
• c) é comum o uso de características acidentais quando mais apropriadas ao entendimento do contexto.
• d) não se aplica apenas uma regra para dividir-se um gênero em tesauros.
• e) a divisão lógica não impõe uma ordem privilegiada de aplicação de características, assim como o arranjo de classes
• Não existe apenas uma relação entre documentos e termos de classes – relações entre as ciências/teoria geral dos sistemas – caráter interdisciplinar da pesquisa moderna.
Tesauros – predicação conceitual
Teoria Analítica do Conceito de Dahlberg (1992)
• Características do conceito são entendidas como elemento do conhecimento
• Soma total das predicações pode ser sintetizada em uma unidade do conhecimento
• Conceitos = unidades do conhecimento
Tesauros – predicação conceitualTeoria Analítica do Conceito de Dahlberg (1992) – Modelo de contrução de conceitos
Universo de itens: idéias, objetos, fatos, leis etc.
Item de referência
Atributos verdadeiros do item
Síntese dos atributosna forma verbal
Uso da forma verbalno universo do discurso
Tesauros – predicação conceitual/ divisão lógica
• As regras e os princípios delineados pela literatira
indicam que a concepção de linguagens documentárias
deve ser lógica na formação de relacionamento
conceituais, mas flexível nas aplicações subjetivas
Tesauros – predicação conceitual/ divisão lógica
• Não há como afirmar se um esquema de classificação é
melhor que o outro. A avaliação se dá pelo uso e pelos resultados obtidos –
representatividade do conhecimento.