30
Difusão de partituras através da web: o desafio de tornar acessíveis os repertórios brasileiros Rodrigo DE SANTIS * Rosana LANZELOTTE ** RESUMO: Grande parte dos projetos e pesquisas que focalizam arquivos e coleções de partituras brasileiras destina-se, entre outras formas, à difusão através da web. As consultas à web se guiam por informações descritivas e, consequentemente, para que sejam efetivas, é necessário que as partituras sejam descritas de maneira uniforme. Mais ainda, a expansão da web requer que os sítios interoperem entre si, no sentido de responderem cooperativamente a uma determinada busca. O presente trabalho, que se insere no âmbito do projeto Musica Brasilis, discute como se pretende tratar as questões de descrição de partituras com vistas à interoperabilidade, de forma a ampliar o alcance via web a partituras de compositores brasileiros. PALAVRAS-CHAVE: MIR; interoperabilidade; web semântica. ABSTRACT: Many research projects on Brazilian musical collections aim to make resources available on the web. User queries often address bibliographical aspects of musical resources. Thus, to attain large- scale availability and interoperability, musical resources should be uniformly described. This work is developed in the scope of Musica Brasilis project, which aims to investigate methods and techniques for making Brazilian musical scores available on the web. KEYWORDS: Musical Information Retrieval; interoperability; semantic web. 1. Introdução Em projetos de pesquisa voltados a coleções de documentos musicais, um dos aspectos primordiais diz respeito à descrição de partituras com vistas à recuperação. O surgimento de softwares para a edição de música, nos anos 1980, ensejou o aparecimento de versões digitais das partituras, o que acarreta novos problemas no tocante à descrição e, consequentemente, à recuperação destes documentos. A expansão da web e a multiplicação de sítios que oferecem recursos musicais em formato digital ensejaram o surgimento de uma nova área do conhecimento, denominada MIR – Recuperação da Informação Musical 1 –, que reúne competências de diversas outras áreas (DOWNIE, 2001), conforme mostra a Figura 1. * Pesquisador do Instituto Musica Brasilis (IMB). Doutorando em Ciência da Informação, Universidade Federal do Rio de Janeiro (UFRJ)/Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT). E-mail: [email protected] ** Fundadora do Instituto Musica Brasilis (IMB). Doutora em Informática, Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio). E-mail: [email protected] 1 No original, em inglês, Music Information Retrieval.

Difusão de partituras através da web: o desafio de tornar acessíveis os repertórios brasileiros

  • Upload
    unirio

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Difusão de partituras através da web: o desafio de tornar acessíveis os repertórios

brasileiros

Rodrigo DE SANTIS * Rosana LANZELOTTE **

RESUMO: Grande parte dos projetos e pesquisas que focalizam arquivos e coleções de partituras brasileiras destina-se, entre outras formas, à difusão através da web. As consultas à web se guiam por informações descritivas e, consequentemente, para que sejam efetivas, é necessário que as partituras sejam descritas de maneira uniforme. Mais ainda, a expansão da web requer que os sítios interoperem entre si, no sentido de responderem cooperativamente a uma determinada busca. O presente trabalho, que se insere no âmbito do projeto Musica Brasilis, discute como se pretende tratar as questões de descrição de partituras com vistas à interoperabilidade, de forma a ampliar o alcance via web a partituras de compositores brasileiros. PALAVRAS-CHAVE : MIR; interoperabilidade; web semântica. ABSTRACT : Many research projects on Brazilian musical collections aim to make resources available on the web. User queries often address bibliographical aspects of musical resources. Thus, to attain large-scale availability and interoperability, musical resources should be uniformly described. This work is developed in the scope of Musica Brasilis project, which aims to investigate methods and techniques for making Brazilian musical scores available on the web. KEYWORDS : Musical Information Retrieval; interoperability; semantic web.

1. Introdução

Em projetos de pesquisa voltados a coleções de documentos musicais, um dos

aspectos primordiais diz respeito à descrição de partituras com vistas à recuperação. O

surgimento de softwares para a edição de música, nos anos 1980, ensejou o

aparecimento de versões digitais das partituras, o que acarreta novos problemas no

tocante à descrição e, consequentemente, à recuperação destes documentos.

A expansão da web e a multiplicação de sítios que oferecem recursos musicais

em formato digital ensejaram o surgimento de uma nova área do conhecimento,

denominada MIR – Recuperação da Informação Musical1 –, que reúne competências de

diversas outras áreas (DOWNIE, 2001), conforme mostra a Figura 1.

* Pesquisador do Instituto Musica Brasilis (IMB). Doutorando em Ciência da Informação, Universidade Federal do Rio de Janeiro (UFRJ)/Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT). E-mail: [email protected] ** Fundadora do Instituto Musica Brasilis (IMB). Doutora em Informática, Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio). E-mail: [email protected] 1 No original, em inglês, Music Information Retrieval.

Figura 1. Áreas de conhecimento envolvidas em MIR

Em qualquer projeto que envolva coleções de partituras, os musicólogos

deparam-se com as seguintes questões:

a) Como descrever uma partitura: quais campos – metadados2 – utilizar;

b) Como preencher os valores dos campos, por exemplo, como grafar o nome do

compositor.

Essas questões são geralmente estudadas no âmbito da Ciência da Informação e

na sub-área de Biblioteconomia Musical.

O desconhecimento de sistemáticas oriundas da Ciência da Informação leva à

especificação empírica de metadados na maioria dos projetos. Como consequência,

torna-se impraticável a troca de informações entre os sítios e a difusão em larga escala

através da web. Segundo José Maria Neves:

“[...] a intercomplementaridade de nossos arquivos musicais somente produzirá seus resultados quando pudermos lançar mão de catálogos sistemáticos que incluam todas as informações disponíveis [...] e que, por sua construção, permitam todos os cruzamentos desejáveis”. (NEVES, 1998, p. 145)

O projeto Musica Brasilis tem, dentre seus principais objetivos, a difusão de

partituras de compositores brasileiros através da web (MUSICA BRASILIS, 2012).

Para além das questões de descrição de recursos, busca-se a interoperabilidade com

2 Metadados são campos para descrever recursos musicais. Por exemplo, nome do compositor, nome da obra e data de composição são metadados descritivos de uma composição musical.

sítios de mesma finalidade. Define-se como interoperabilidade a capacidade de um

sistema – informatizado ou não – de se comunicar de forma transparente com outro

sistema. Uma consulta feita a um determinado sítio poderá ser respondida com base nas

informações armazenadas por ele e por todos os sítios com os quais ele interopera.

Atualmente, a informação é organizada na web de forma que apenas o ser

humano é capaz de interpretá-la e, consequentemente, conduzir a tarefa de recuperação

de informação. Por esse motivo, um pesquisador que busque uma determinada partitura

na web é forçado a repetir a busca a sítios que ele conheça e sabe que são,

possivelmente, detentores da partitura que o interessa.

Este cenário tem evoluído no sentido da web semântica, em que padrões são

propostos pelo consórcio W3C3 para descrever a informação de forma a que possa ser

automaticamente processada pelo computador. Segundo Tim Berners-Lee, a web

semântica é “uma nova forma de conteúdos na web compreensíveis pelos computadores

desencadeará uma revolução de novas possibilidades” 4 (BERNERS-LEE et al, 2001,

p.28).

A Web Semântica não é outra web, mas uma extensão da atual, em que a

semântica da informação é expressa de acordo com padrões, o que possibilita que tanto

computadores como seres humanos possam interpretá-la.

O presente trabalho dá continuidade às pesquisas para investigar as

contribuições das áreas de Ciência da Computação e Ciência da Informação para a

difusão de partituras via web (LANZELOTTE et al, 2004), (BALLESTÉ et al, 2006),

(LANZELOTTE e BALLESTÉ, 2006), (STANECK e LANZELOTTE, 2007) e (DE

SANTIS e FERREIRA, 2007).

Na seção 2 deste trabalho, discute-se a problemática da organização e descrição

de coleções de partituras. A seção 3 é dedicada aos desafios para a busca e recuperação

de partituras em formato digital, na seção 4 são apresentados os conceitos básicos da

web semântica e as conclusões são resumidas na seção 5.

3 O World Wide Web Consortium (W3C) é um consórcio internacional que tem por finalidade estabelecer os padrões para a criação e a interpretação de conteúdos para a web. 4 No original, em ingles, “A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities."

2. Organização e descrição de coleções de partituras

Partituras são colecionadas por instituições litúrgicas, por orquestras, por

bibliotecas, por músicos e compositores, entre outros.

Nesta seção são discutidas questões de organização e descrição de coleções de

partituras e o impacto do surgimento do suporte digital.

2.1. Organização e descrição de partituras em suporte de papel

A organização de coleções de partituras em papel, sejam elas manuscritas ou

editadas, tem se apoiado nas metodologias propostas pela área de Arquivologia,

conforme ilustra a figura 2.

Figura 2. Organização de coleções segundo padrões e métodos da Arquivologia

enquanto padrões propostos pela Ciência da Informação deveriam ser adotados na

descrição de suas unidades, conforme ilustra a figura 3.

Figura 3. Descrição das unidades considerando padrões propostos pela Ciência da

Informação

A organização de uma coleção e a descrição de suas unidades são atividades

complementares e tem objetivos diferentes. A descrição de uma unidade documental,

cuja finalidade é a recuperação da informação nela contida, tem como objeto tanto o

suporte quanto seu conteúdo. Quando se trata de música, uma unidade documental – a

partitura – não necessariamente coincide com uma unidade musical, ou obra,

(CASTAGNA, 2004), o que acarreta em maior complexidade na atividade de descrição.

2.1.1. Organização e descrição de coleções do ponto de vista arquivístico

Para a organização e descrição de coleções, usa-se comumente a Norma Geral

Internacional de Descrição Arquivística ISAD(G), publicada pelo Conselho

Internacional de Arquivos (ICA, 2012), com o objetivo de identificar e descrever o

contexto e o conteúdo de documentos de um arquivo.

O ISAD(G) preconiza a organização hierárquica de um arquivo em níveis:

fundos, sub-fundos, séries e subséries, até chegar-se às unidades documentais, ou

documentos.

Em seu modelo proposto para a organização documental de acervos de

manuscritos musicais, Paulo Castagna (2004) propõe a utilização dos conceitos de

parte, conjunto e grupo, que guardam entre si uma relação hierárquica similar àquela

proposta pela norma ISAD(G), sendo a parte a unidade documental:

“A parte é um documento com música para uma única voz, instrumento ou naipe (conjunto de vozes ou instrumentos) e não deve ser confundido com partitura.[...] O conjunto corresponde à totalidade das partes vocais e/ou instrumentais referentes à(s) mesma(a) obra(s), elaboradas por um mesmo copista e em uma mesma época [...] O grupo [...] é uma reunião de conjuntos que possuem a mesma música, ou de conjuntos que compartilham obras entre si, podendo ter ainda outras características comuns.” (CASTAGNA, 2004, p.83).

A figura 4 ilustra a metodologia de organização documental.

Figura 4. Metodologia de organização documental

Cada unidade de descrição é identificada por um código estabelecido pelo

arquivista quando da organização do arquivo. Além do código, a norma ISAD(G)

propõe outros 25 elementos de metadados para descrever as unidades, dentre os quais:

Título, Nome do Criador, Data de Criação, Descrição do Conteúdo, Nível.

No universo arquivístico, não existe a demanda de interoperabilidade, pois a

organização, e a decorrente codificação e descrição, são específicos de um arquivo e

ficam circunscritos ao mesmo.

2.1.2. Unidades documentais do ponto de vista musicológico

No modelo proposto por Paulo Castagna, voltado aos manuscritos de música

religiosa brasileira, uma unidade documental é uma parte vocal ou instrumental e um

conjunto refere-se a uma obra (CASTAGNA, 2004). Para além de sua identificação e

organização arquivística, torna-se necessária a catalogação bibliográfica, do

documento, que consiste em descrevê-lo e aos seus conteúdos através de metadados,

para fins de pesquisa e recuperação.

Para descrever, ou catalogar, o conteúdo de uma unidade documental devem ser

adotados padrões e normas oriundos da área de Ciência da Informação. O mais utilizado

universalmente é o MARC 21, versão atual do padrão MARC – Machine-Readable

Cataloguing –, o primeiro padrão de catalogação passível de processamento por

computadores (MARC, 2012). O padrão MARC data de 1960, quando da

informatização da Biblioteca do Congresso dos Estados Unidos. Por ser aplicável a

recursos provenientes de todas as áreas do conhecimento, tornou-se extremamente

complexo e diversificado. Normas complementares fizeram-se necessárias para orientar

a catalogação no âmbito de áreas específicas, como a música.

Para além de um padrão de catalogação, o MARC é um padrão de intercâmbio

entre bibliotecas, que trocam registros MARC entre si.

A figura 5 mostra a aplicação do padrão MARC 21 à partitura da Ladainha de

Nossa Senhora das Dores, de autoria de José Maurício Nunes Garcia, editada por

Márcio Miranda Pontes, localizada na Biblioteca Nacional do Rio de Janeiro (BNRJ,

2012).

Figura 5. Ficha MARC21 correspondente à partitura da Ladainha de Nossa Senhora das

Dores contida na BNRJ

Conforme apontado na Seção 1, o problema da descrição de partituras envolve

duas questões:

a) quais campos – metadados – utilizar;

b) como preencher os valores dos campos.

O responsável pela catalogação deve selecionar os campos e subcampos MARC

aplicáveis ao recurso. Para o preenchimento dos campos, são geralmente adotadas as

regras AACR2 – Anglo American Cataloguing Rules (AACR2, 2012), que determinam

como preencher campos de nomes e datas, entre outros. As regras AACR2 preconizam

que um campo de nome deve ser preenchido começando pelo sobrenome, seguido de

vírgula, seguido do nome. Os anos de nascimento e falecimento do compositor devem

ser grafados: ano de nascimento, seguido de hífen, seguido do ano de falecimento.

Na Figura 5, consta um único campo referente ao título, que é o Título Principal,

tal como aparece na publicação. O catalogador optou por não utilizar o campo de Título

Uniforme, que, de acordo com AACR2 pode ser empregado:

“[...] para reunir todas as entradas de uma obra, quando aparecerem apresentações diferentes (por exemplo, edições, traduções) dessa obra sob vários títulos; para identificar uma obra, quando o título pelo qual é conhecida difere do título principal do item que está sendo catalogado; para distinguir entre duas ou mais obras publicadas sob títulos principais idênticos; para organizar o arquivo.” (CCAA2, 2004, p. 25).

Na área da musicologia, surgiu em 1952 a iniciativa RISM – Repertório

Internacional de Fontes Musicais5 –, projeto de âmbito internacional de coleta de

informações sobre manuscritos musicais (RISM, 2012). A coleta é centralizada por um

5 Do original, em francês, Repertoire Internationale des Sources Musicales.

comitê de redação sediado em Frankfurt, Alemanha, cuja função é normatizar e validar

os metadados enviados pelos órgãos colaboradores, obtidos a partir da análise de

documentos musicais manuscritos. A iniciativa RISM propôs um padrão de catalogação

a ser seguido pelos contribuintes que, por ser voltado para manuscritos musicais,

engloba aspectos específicos de partituras, como o incipit musical utilizado nos

catálogos temáticos.

Embora importante em seu momento de criação, a iniciativa RISM vai de

encontro às tendências atuais, pois, em plena era de cooperação em rede, propõe

concentrar, em uma base única, metadados sobre manuscritos de instituições espalhadas

pelo mundo. Além disso, o padrão RISM não se alinha com os modernos padrões

utilizados na web, com vistas à web semântica.

2.2. Coleções digitais de partituras

Com o aparecimento dos programas de edição de partituras, nos anos 1980,

surgiram as coleções digitais, a exemplo do que já havia ocorrido com os documentos

textuais. A existência de documentos em formato digital e a expansão da web ensejaram

o surgimento das bibliotecas digitais, termo utilizado pela primeira vez em 1988 e que

se consagrou na década de 1990 (LESK, 2004). Uma biblioteca digital é definida como

uma coleção organizada de recursos em formato digital. Da mesma forma que em uma

biblioteca convencional, os recursos são identificados através de metadados descritivos.

Uma das principais vantagens das bibliotecas digitais em comparação às

bibliotecas convencionais consiste na facilidade de acesso através da web que

possibilita o acesso remoto e simultâneo dos usuários aos documentos (POULTER,

1994).

Pode-se distinguir dois tipos de sítios web referentes a coleções de partituras:

• Sítios concentradores de metadados, como o RISM e o CMSRB6, em que o

usuário tem acesso apenas aos metadados descritivos das partituras e é remetido

a outros sítios;

• Sítios de partituras digitais, como o Musica Brasilis, CPDL7, IMSLP8 e SESC

Partituras9, em que o usuário tem acesso tanto aos metadados quanto aos

arquivos digitais das partituras em formato de imagem ou pdf.

6 Catálogo de Publicações de Música Sacra e Religiosa Brasileira, organizado pelo Professor Doutor Carlos Alberto Figueiredo. Disponível em <http://www.musicasacrabrasileira.com.br>. Acesso em: nov. 2012.

2.2.1. Padrões para a descrição de recursos em formato digital

Com o surgimento dos documentos digitais, tornou-se necessária a criação de

padrões para a descrição dos mesmos. Para atender a este objetivo, foi proposto em

1995 o Dublin Core (DC). Originada por um grupo interdisciplinar de representantes

das áreas de Biblioteconomia, Museologia e Ciência da Computação reunidos em

Dublin, Ohio, Estados Unidos, a iniciativa propõe um conjunto mínimo (em inglês,

core), de quinze elementos descritivos – metadados – para permitir a descrição e

recuperação de recursos digitais na web (DCMI, 2012).

A tabela 1 apresenta os elementos Dublin Core aplicados à edição digital da

Ladainha das Dores de Nossa Senhora de José Mauricio Nunes Garcia, disponível no

sítio Musica Brasilis.

Tabela 1. Elementos Dublin Core para a versão digital da partitura da Ladainha das

Dores de Nossa Senhora, contida no sítio Musica Brasilis

Elemento DC Significado Exemplo de conteúdo

title Título dado ao recurso Ladainha das Dores de Nossa Senhora

creator Autor Garcia, José Maurício Nunes

subject Assuntos Clássico;vocal;ladainha

publisher Responsável pela publicação Musica Brasilis

contributor Colaborador (neste caso, o editor)

Monteiro Neto, Antonio Campos

source Fonte a partir da qual o recurso foi gerado

Manuscrito contido no Acervo do Maestro Vespasiano Gregório dos Santos

date Data da edição 2010

type Natureza ou gênero do recurso

Recurso eletrônico

format Formato do recurso pdf

Identifier URL do recurso http://www.musicabrasilis.org.br/obras/jose-mauricio-nunes-garcia-ladainha-dores-de-nossa-senhora-cpm050a/partituras

language Idioma do conteúdo lat

language Idioma do conteúdo por

language Idioma do conteúdo eng

7 Choral Public Domain Library. Disponível em: <http://www.cpdl.org>. Acesso em: nov. 2012. 8 International Music Score Library Project. Disponível em: <http://imslp.org/>. Acesso em: nov. 2012. 9 SESC Partituras. Disponível em <http://www.sesc.com.br/sescpartituras>. Acesso em: nov. 2012.

Quando necessário, pode-se repetir um elemento Dublin Core para comportar

múltiplos valores, como no caso de language, no exemplo acima. O elemento identifier

remete ao URI – Identificador Uniforme de Recursos10. Trata-se de um endereço único

e estável de um recurso na web, que possibilita o apontamento e recuperação de forma

direta, sem obrigar o pesquisador a entrar na página inicial do sítio e procurar pelo

recurso a cada vez que desejar consultá-lo.

As principais características da proposta Dublin Core são:

• Simplicidade na descrição dos recursos – pode ser usado por uma larga

comunidade de usuários que não tenham conhecimento prévio de regras de

catalogação;

• Interoperabilidade;

• Consenso internacional;

• Extensibilidade – pode ser expandido para se adequar a modelos de descrição

mais elaborados ou a requisitos de aplicações específicas, como é o caso da

música.

O Dublin Core tem sido utilizado por agências governamentais e instituições em

vários países nas mais diversas áreas, dentre elas o The MusicBrainz Project11, projeto

que busca definir um conjunto de metadados para a descrição de gravações musicais, e a

base de dados da Biblioteca Digital de Teses e Dissertações da USP12 no Brasil.

É importante ressaltar que o Dublin Core não substitui os padrões de catalogação

utilizados pelas bibliotecas e sim soma-se a eles, quando se trata da versão digital de um

documento. Existe uma correspondência exata de cada elemento Dublin Core com um

campo ou subcampo MARC. Assim, fica assegurado o intercâmbio entre bibliotecas de

uma descrição feita segundo o Dublin Core.

2.2.2. Fidedignidade de recursos digitais

Quando se trata de documentos digitais, há uma preocupação com aspectos de

fidelidade ao original, segurança e validade. Essas questões são enfatizadas pelo

benchmark proposto pela Federação de Bibliotecas (DIGITAL LIBRARY

10 Do original, em inglês, Uniform Resource Identifier. 11 MusicBrainz - The Open Music Encyclopedia. Disponível em: <http://musicbrainz.org>. Acesso em: nov. 2012. 12 Biblioteca Digital de Teses e Dissertações da USP. Disponível em: <http:// www.teses.usp.br>. Acesso em: nov. 2012.

FEDERATION, 2012). Segundo o benchmark, um documento digital é uma reprodução

fidedigna se é formatado e descrito para atender aos seguintes requisitos:

• qualidade de reprodução, do ponto de vista de funcionalidade e uso;

• persistência, ou seja, o documento digital é permanentemente acessível;

• interoperabilidade, através de diferentes plataformas e ambientes de software.

Os critérios aplicam-se primordialmente a documentos digitais textuais, mas

podem ser estendidos a partituras em formato digital.

No tocante a coleções digitais de partituras, a persistência não tem sido sempre

assegurada. Exemplos conhecidos da comunidade de Musicologia são:

• os manuscritos musicais do acervo do maestro Vespasiano Gregório dos Santos,

de autores dos séculos XVIII, XIX e início do XX, inicialmente disponíveis

através do sítio <http://www.tmb.uemg.br>, e que podem ser hoje obtidos em

<http://www.editorapontes.com.br/tmb>;

• a Base Minas, desenvolvida pelo Laboratório de Musicologia, da ECA-USP,

sobre manuscritos musicais dos séculos XVIII e XIX, de Minas Gerais, acessível

originalmente através do sítio <http://www.cmu.eca.usp.br/lam/minas/>, e que

não está mais disponível para consultas.

O problema da falta de persistência só seria solucionado por uma política

pública de preservação de documentos digitais, a exemplo do que é feito pela Biblioteca

Nacional de França, que coleta, desde 2006, o conteúdo de todos os sítios franceses

(BNF, 2012). Esta coleta é o análogo do depósito legal, ao qual estão obrigados os

editores de obras impressas ou gravadas. A diferença, neste caso, é que a coleta dos

conteúdos de sítios é feita automaticamente pela Biblioteca Nacional da França e não

depende de ação por parte do “editor” do sítio.

3. Busca e recuperação de partituras em formato digital

O aumento significativo do número de sítios que disponibilizam partituras de

música brasileira através da web, ocorrido nos últimos anos, permitiu um avanço

incontestável no que diz respeito à difusão e ao acesso a esses recursos (COTTA, 2011).

No entanto, essas iniciativas são, na sua maioria, isoladas, sem a preocupação

com o intercâmbio dos dados. Em muitos casos, não se alinham aos padrões que

possibilitariam o aproveitamento pleno das potencialidades oferecidas pela web. Essas

limitações acarretam perda de precisão nas buscas e dificuldades na recuperação das

informações.

Nesta seção, essas questões são discutidas a partir apresentação de um problema-

exemplo: a busca na web da partitura da Ladainha das Dores de Nossa Senhora, de José

Mauricio Nunes Garcia.

3.1. Busca da partitura da Ladainha das Dores de Nossa Senhora

A busca da partitura foi realizada a partir da ferramenta mais popular da web, o

Google <http://www.google.com.br>13, através da submissão de consultas, com as

seguintes palavras-chave:

• partitura ladainha das dores de nossa senhora garcia

• ladainha das dores de nossa senhora garcia

• partitura ladainha dores nossa senhora jose mauricio nunes garcia

• ladainha dores nossa senhora jose mauricio nunes garcia

• partitura cpm 50a jose mauricio nunes garcia

• cpm 50a jose mauricio nunes garcia

• partitura ladainha nossa senhora dores nunes garcia

• ladainha nossa senhora dores nunes garcia

• partitura ladainha nossa senhora nunes garcia

• ladainha nossa senhora nunes garcia

Os resultados obtidos para as consultas foram bastante parecidos. Nas primeiras

posições invariavelmente apareceu o sítio Musica Brasilis. Nas pesquisas sem a palavra-

chave partitura, o sítio Catálogo de Publicações de Música Sacra e Religiosa Brasileira

também figurou sempre entre as primeiras respostas apresentadas14.

Esses resultados podem ser considerados surpreendentemente incompletos. Por

conhecimento prévio, é sabido que outros sítios contem informações a respeito da

referida partitura, dentre os quais: o da Biblioteca Nacional; o do Choral Public Domain

Library (CPDL); o da Editora Pontes (EP) e o sítio José Maurício Nunes Garcia

13 Segundo o relatório Experian Hitwise 2012, o Google, lidera o ranking de buscadores com 90,23% de participação das buscas realizadas no Brasil. Disponível em: <http://www.experianplc.com>. Acesso em: nov. 2012. 14 A Ladainha foi encontrada também no sítio Acervo Cleofe Person de Mattos, disponível em <http://www.acpm.com.br>. No entanto, por ser um sítio sobre o acervo da pesquisadora e não de coleção de partituras, o mesmo não foi utilizado para fins de comparação.

(JMNG). No entanto, nenhum destes foi apresentado como resultado às consultas

submetidas à ferramenta de busca Google15.

Esta primeira dificuldade revela um aspecto importante das buscas no ambiente

web: os sítios precisariam respeitar os padrões de construção estabelecidos pelo

consórcio W3C, sob a pena de não serem recuperados pelas ferramentas de busca. Este

cenário passa a exigir do pesquisador que conheça previamente todos os sítios que

podem conter o recurso procurado e o obriga a lançar consultas individuais a cada sítio.

Outra dificuldade encontrada em dois dos sítios – Editora Pontes e José

Mauricio Nunes Garcia –, é que estes não possuem mecanismos internos de busca. Isso

obriga o pesquisador a conhecer a estrutura do sítio ou então a “folhear” todo o

conteúdo até encontrar o que deseja.

Metade dos sítios considerados não utiliza o URI para apontar um recurso, o que

obriga o pesquisador a se utilizar da página de busca do sítio para chegar até ele.

A tabela 2 sumariza os sítios onde a Ladainha foi encontrada e algumas

características observadas em cada sítio.

Tabela 2. Características dos sítios

Sítio Endereço Tipo do sítio Localizado pelo Google

Busca interna

URI

Biblioteca Nacional – BNRJ

www.bn.br Biblioteca não sim não

Catálogo de Publicações de Música Sacra e Religiosa Brasileira – CMSRB

www.musicasacrabrasileira.com.br

Concentrador de metadados

sim sim sim

Choral Public Domain Library – CPDL

www.cpdl.org Partitura digital

sim sim sim

Editora Pontes – EP www.editorapontes.com.br

Partitura digital

não não não

José Maurício Nunes Garcia – JMNG

www.josemauricio.com.br/

Partitura digital

não não não

Musica Brasilis – MB

www.musicabrasilis.org.br

Partitura digital

sim sim sim

15 A partitura também foi buscada em outros sítios: o do Acervo Musical do Cabido Metropolitano do Rio de Janeiro, o do Museu de Música de Mariana, o da Biblioteca do Congresso dos Estados Unidos, o da British Library e o do International Music Score Library Project – IMSLP. Nesses casos não foram encontradas referências à Ladainha das Dores de Nossa Senhora.

3.2. Padronização como requisito para a recuperação

Na tabela 2, o sítio CPDL é dito “localizável” pelo Google, no entanto, não

retornou resultados para as consultas à Ladainha. Isto aconteceu porque a partitura foi

cadastrada com o título em inglês: Litany for the Sorrows of Our Lady, o que

impossibilita a sua recuperação através de uma busca por palavras-chave em português.

Vê-se aqui um exemplo de como a não utilização do título uniforme impacta

negativamente o acesso a um recurso.

Considerados os dois aspectos da descrição discutidos na seção anterior, a) quais

campos utilizar; e b) como preencher os campos, a tabela 3 ilustra o primeiro aspecto,

apresentando como se denominam os campos utilizados para descrever a Ladainha em

cada um dos sítios. Foram tabulados apenas alguns dos campos disponíveis,

notadamente aqueles que estavam presentes na maior parte dos sítios, o que serve ao

intuito de demonstrar como a falta de padronização se manifesta.

Tabela 3. Nomes de campos (metadados) utilizados em cada sítio

Sítio Autor Título Código Edição Instrumentação Seção

BNRJ Autoria Título n/d Título Título n/d

CMSRB Autor Nome da obra

Referên-cias

Editor; Editora

Formação n/d

CPDL Composer Title n/d Editor Instruments Movements

EP (sem metadado)

Título n/d Cópia Partes Seções

JMNG (sem metadado)

Título Nº CPM n/d n/d Movimentos

MB Compositor Título Título n/d Partes Movimentos

À exceção do sítio da Biblioteca Nacional, que adota o padrão MARC para

definir os metadados, nenhum outro sítio adota um padrão consagrado para a descrição

dos seus recursos. Cada sítio utiliza um conjunto empírico de metadados para descrever

os conteúdos, conforme seus objetivos internos. O CMSRB, por exemplo, é o único

sítio preocupado com as especificidades de descrição de música sacra e religiosa, ao

prever metadados como Destinação e Unidade, enquanto apenas o sítio da Editora

Pontes contém informações sobre Andamento, Tonalidade e Fórmula de Compasso de

cada seção.

A não adoção de normas de descrição para os valores dos metadados também

resultam numa confusão terminológica. Novamente a exceção é a Biblioteca Nacional,

que segue a norma AACR2 para a descrição de títulos, nomes e datas. A tabela 4 ilustra

o problema.

Tabela 4. Preenchimento dos campos (metadados) em cada sítio

Sítio Autor Título Código Edição Instrumen-

tação

Seções

BNRJ Garcia, José

Maurício Nunes

Ladainha de Nossa Senhora

das Dores

n/d Pesquisa e edição: Márcio Miranda Pontes

para coro, cordas, trompas e flauta solo =

for choir, strings, french horns and solo

flute

n/d

CMSRB GARCIA, José

Maurício Nunes

Ladainha de Nossa Senhora

das Dores

CPM 50a / MIOP 254

Pontes, Márcio

Miranda; Editora Pontes

Soprano, Contralto,

Tenor, Baixo [coro], Flauta, Trompa I-II, Violino I-II,

Viola, Violoncelo, Contrabaixo

n/d

CMSRB GARCIA, José

Maurício Nunes

Ladainha das Dores de Nossa Senhora

CPM 50a / MIOP 254

Monteiro Neto,

Antônio Campos; Choral Public

Domain Library (CPDL)

Soprano, Contralto,

Tenor, Baixo [coro], Flauta,

Clarineta, Trompa I-II, Violino I-II,

Viola, Violoncelo

n/d

CPDL José Maurício Nunes Garcia

Litany for the

Sorrows of Our Lady

n/d Antonio Campos Monteiro

Neto

Flute, clarinet, trumpets, strings

Kyrie Eleison; Pater de Coelis; Mater Angustiis;

Turtur Gemibunda; Rupes Constantiae;

Portus Naufragantium;

Magistra Apostolorum; Ab Omni Malo; Per

Lugubrem Corporis; Filia Dei; Agnus Dei

EP Jose Mauricio Nunes Garcia

Ladainha de N. S.

das Dores

n/d Cópia: Santos,

Vespasiano

Augusto dos Belo Horizont

e

s; a; t; b; v1; v2; va; vc; cb; fl; cl; cr 1 e 2; tp 1; tp2; tn

Kyrie eleison; Fili redemptor; Mater

Augustiis; Tur gemibunda; Rupris

constandi; Magistra

apostolorum; Per lugubrem corporis;

Agnus Dei JMNG José

Maurício Nunes Garcia

Ladainha das Dores de N. Sr.ª

50a n/d n/d Kyrie Eleison; Pater de Coelis; Mater Angustiis;

Turtur Gemibunda; Rupes Constantiae;

Portus Naufragantium;

Magistra Apostolorum; Ab Omni Malo; Per

Lugubrem Corporis; Filia Dei; Agnus Dei

MB José Mauricio Nunes Garcia

Ladainha das Dores de Nossa Senhora

CPM 50a

Antônio Campos

Clarineta; Coro (SATB); Flauta;

Trompas; Viola;

Violinos; Violoncelo / Contrabaixo

Ab Omni Malo Libera nos

Domine; Agnus Dei; Filia Dei; Kyrie Eleison;

Magistra Apostolorum;

Mater Angustiis; Pater de Coelis; Per Lugubrem

Corporis; Portus Naufragantium;

Rupes Constantiae; Turtur Gemibunda

A primeira constatação é que existem duas publicações distintas relativas à

mesma obra, e com títulos diferentes: Ladainha das Dores de Nossa Senhora e

Ladainha de Nossa Senhora das Dores. O único sítio que reflete esta questão é o

CMSRB, uma vez que os demais abordam apenas uma das publicações. Ainda em

relação ao título, além do já mencionado problema da tradução para o inglês no sítio

CPDL, observa-se a falta de padronização na grafia e o uso de abreviaturas de forma

não consistente entre os sítios (N. S. das Dores e Dores de N. Sr.ª).

Também é representativa a falta de padronização das informações relativas à

edição, à formação instrumental e às seções da obra: não há sequer dois sítios que

descrevam essas informações da mesma forma.

Somente um pesquisador conhecedor da terminologia empregada na área

musical é capaz de fazer as relações que identificam, por exemplo, que s, a, t, b nas

informações sobre Partes do sítio da Editora Pontes equivale a soprano, contralto, tenor

e baixo no campo Formação utilizado pelo CMSRB. Um computador não é capaz de

realizar esses cruzamentos dos dados obtidos nos vários sítios de forma automática.

Portanto, além de ser um aspecto necessário para permitir a correta recuperação

da informação, a padronização é um aspecto imprescindível para a consecução da

interoperabilidade.

3.3. Iniciativas para a interoperabilidade na web

Os sítios que contêm as partituras digitais da Ladainha provem arquivos digitais

diferentes. Um pesquisador interessado em todos os arquivos digitais ou em algum

específico possivelmente precisará percorrer todos os sítios até obter os resultados

desejados. A tabela 5 sumariza os conteúdos digitais oferecidos pelos sítios provedores

de partituras.

Tabela 5. Recursos de partituras digitais

Sítio Partitura completa disponível

Seções disponíveis Partes disponíveis

Choral Public Domain Library – CPDL

sim, editorada sim, editoradas não

Editora Pontes – EP sim, manuscrita sim, manuscritas sim, manuscritas José Maurício Nunes Garcia – JMNG

não sim, editoradas não

Musica Brasilis – MB sim, editorada sim, editoradas sim, editoradas

Embora sejam provedores de conteúdos complementares, nenhum dos sítios

mencionados interopera com outros.

Mesmo o mais trivial e antigo dos mecanismos de integração existentes na web,

o hyperlink, só é utilizado pelo sítio CPDL, que aponta para o sítio da Editora Pontes,

onde estão os manuscritos digitalizados16. O Catálogo de Música Sacra e Religiosa

16 O Musica Brasilis compartilha recursos com o sítio SESC Partituras através do apontamento mútuo de hyperlinks, no entanto, a Ladainha das Dores de Nossa Senhora não está incluída neste “intercâmbio”.

Brasileira apresenta referências textuais para os sítios da Editora Pontes e do CPDL,

mas não através de hyperlinks.

É de se notar, portanto, que apesar de todos os sítios estarem disponíveis na web

e serem complementares, eles permanecem isolados, não compartilhando dados nem

trocando recursos uns com os outros. Nem mesmo o sítio CMSRB, o único a considerar

as duas edições da Ladainha, promove a integração direta com as versões digitais dessas

publicações. As iniciativas centralizadoras, aliás, ao partirem do pressuposto de abrigar

todos os conteúdos existentes, vão de encontro ao princípio da interoperabilidade na

web, que se baseia na comunicação entre as múltiplas soluções distribuídas na rede.

Uma das principais iniciativas a se ocupar do propósito da interoperabilidade na

web foi o OAI-PMH – Protocolo para Coleta de Metadados, da Iniciativa Arquivos

Abertos17 (OAI-PMH, 2012).

Lançado em 2001, e atualmente na versão 2.0, o OAI-PMH tem por objetivo

agregar os descritores das várias fontes afiliadas à iniciativa e permitir uma busca

integrada. Cada instituição interessada em participar do projeto deve descrever os seus

recursos utilizando o padrão Dublin Core e cadastrar-se para que os descritores sejam

coletados regularmente pelo serviço de coleta – harvester – e passem, deste modo, a

fazer parte da base de dados central do serviço. A partir deste momento, qualquer

consulta lançada a este serviço central será respondida com base nos dados coletados de

todos os sítios afiliados. A figura 6 ilustra o funcionamento do OAI-PMH.

Figura 6. Funcionamento do OAI-PMH

17 Do original, em inglês, Open Archives Initiative - Protocol for Metadata Harvesting.

Apesar de oficialmente ainda estar em curso, o projeto OAI-PMH não é

atualizado desde 2008 e vem perdendo espaço como solução para o problema da

interoperabilidade na web por dois motivos principais:

• Embora resolva tecnicamente o problema, na prática o serviço é uma

proposta centralizadora que parte do princípio de uma base única que contem

as descrições em formato Dublin Core. A adesão a propostas centralizadoras

vai de encontro às atuais tendências de cooperação em rede, o que gera

resultados parciais e não satisfaz, de forma automática, a necessidade de

intercomplementaridade.

• O segundo motivo é que a iniciativa não resolve inteiramente o problema da

padronização das descrições. Ao estabelecer o Dublin Core como padrão de

metadados, o OAI-PMH resolve parte do problema, mas não dá conta do

modelo de catalogação. No breve exemplo a respeito da catalogação da

Ladainha, percebe-se a dificuldade em encontrar um título uniforme ou um

consenso acerca das informações sobre editor ou formação instrumental.

Portanto, mesmo que os metadados (quais campos) sejam padronizados, o

modelo de catalogação utilizado para descrever os recursos (como

preencher) também precisaria ser uniformizado para que as buscas

automáticas pudessem ser realizadas de forma satisfatória.

A informação na web é, por natureza, distribuída e sempre haverá múltiplas

iniciativas tratando do mesmo assunto, o que inviabiliza soluções centralizadoras. Mais

ainda, cada uma das iniciativas provavelmente descreve os recursos de forma diferente

das demais, conforme ilustrado no presente trabalho. O caminho, portanto, seria buscar

meios para que as diferentes formas de descrição possam ser processadas pelo

computador, de forma a possibilitar o cruzamento entre as múltiplas fontes, como um

ser humano é capaz de fazer. Essa é a proposta da web semântica, que busca explicitar a

semântica existente nas descrições dos recursos.

4. Web semântica

O conceito da web semântica surgiu da constatação feita pelo próprio criador da

web, Tim Berners-Lee, de que a web é incompleta, pois as informações nela existentes

não são exatas nem processáveis por computadores (BERNERS-LEE e FISCHETTI,

2001).

A partir desta constatação, foi criado um projeto de grande escala, capitaneado

pelo consórcio W3C, que tem por objetivo a proposta de padrões para se atingir a web

semântica (também chamada de web 3.0), baseado nos seguintes princípios:

• A informação existente na web deve ter significado exato;

• A informação existente na web deve ser processável por computadores;

• Os computadores devem poder integrar de forma automática a informação

oriunda da web. (SEMANTIC WEB, 2012).

A web semântica é implantada por uma arquitetura em camadas, conforme

ilustra a figura a seguir 7.

Figura 7. Arquitetura da web semântica

A camada estrutural diz respeito à identificação dos recursos. Um recurso deve

ser persistente e univocamente identificado através de seu URI. No exemplo da partitura

da Ladainha das Dores de Nossa Senhora, de José Maurício, existente no sítio Musica

Brasilis, o URI é http://www.musicabrasilis.org.br/obras/jose-mauricio-nunes-garcia-

ladainha-dores-de-nossa-senhora-cpm050a/partituras.

A camada sintática diz respeito à descrição dos recursos utilizando padrões de

metadados, como o exemplo apresentado na Tabela 1.

As camadas estrutural e sintática resolvem o primeiro princípio da web

semântica: o de garantir que a informação existente na web tenha um significado exato.

A camada semântica, por sua vez, é a responsável por fazer com que a

informação existente na web seja processável por computadores. Nela são definidos os

níveis de relacionamento entre os vocabulários.

A camada lógica se ocupa do terceiro e último princípio da web semântica,

tendo por objetivo permitir a criação de motores de busca que sejam capazes, não

apenas de recuperar informações declaradas de forma explícita, mas também de inferir

novas informações a partir dos relacionamentos entre os conteúdos. Isso é feito com

base em regras lógicas, o que torna os computadores capazes de realizar os cruzamentos

das informações oriundas da web, como o ser humano é capaz de fazer ao se deparar

com novos conteúdos.

Por fim, a camada de confiança, é a camada que tem por objetivo definir

mecanismos de garantia da confiabilidade das inferências realizadas na camada lógica,

evitando os sofismas e as inferências ambíguas.

Nas seções anteriores foram discutidos os aspectos relacionados às camadas

estrutural e sintática. A seguir, serão focalizadas as camadas semântica e lógica,

apresentando os padrões definidos pelo consórcio W3C com o objetivo de alcançar a

interoperabilidade na web.

4.1 Semântica e regras na descrição dos recursos

A descrição semântica dos conteúdos na web se dá através da criação de uma

nova camada sobre os dados já existentes. Essa é uma característica importante da web

semântica: ela não exige que as instituições refaçam a catalogação dos seus recursos

nem que reconstruam os seus sítios. A web semântica aproveita as estruturas e os dados

já existentes (desde que estejam em conformidade com as normas de descrição de

recursos na web) e é capaz de torná-los interoperáveis a partir da adição de uma camada

de descrição.

Essa descrição é realizada em três níveis de profundidade, conforme ilustra a

figura 8.

Figura 8. Níveis de descrição na web semântica

4.1.1 XML – Linguagem de Marcação Extensível18

Devido à sua capacidade de representar sintaticamente e de forma flexível uma

grande variedade de informações, a linguagem XML converteu-se em um padrão

internacional para o intercâmbio de dados em formato digital (ROLAND, 2000).

O projeto MusicXML (GOOD, 2001), no qual a XML é utilizada para acomodar

informações de partituras musicais, é um exemplo de sua flexibilidade e alta capacidade

expressiva. A MusicXML é compatível com as principais ferramentas de edição de

partituras, tais como Finale e Sibelius e tornou-se um formato de representação e

intercâmbio de dados musicais.

Como representado na figura 8, a XML é a base para as demais propostas da

web semântica. Através dela é possível representar qualquer conjunto de dados,

organizando-o de forma hierárquica e atribuindo-lhe uma estrutura consistente através

da representação através de pares “atributo � valor” .

A figura 9 apresenta um exemplo de representação visual da descrição em XML

dos atributos título e compositor de uma obra.

Figura 9. Representação visual de uma descrição em XML

18 Do original, em inglês, eXtensible Markup Language.

4.1.2 RDF – Estrutura para Descrição de Recursos19

O nível seguinte da arquitetura da web semântica é o RDF. Ele consiste de uma

estrutura de dados baseada na XML, mas com uma diferença importante: enquanto a

XML define a estrutura dos dados na forma “atributo � valor”, o RDF as declara na

forma “sujeito � predicado � objeto”.

Os sujeitos são os elementos que se deseja descrever, como, por exemplo, Obra,

Compositor, Instrumento. Os objetos são os elementos que contêm os valores das

descrições, como Nome, Título etc. Os predicados são as relações entre sujeitos e

objetos, como é composta por, possui, é parte de etc.

A figura 10 apresenta um exemplo de representação visual da descrição de

compositor e título de uma obra, usando o RDF.

Figura 10. Representação visual de uma descrição em RDF

Esta característica do RDF, de descrever usando triplas, aumenta a

expressividade das representações uma vez que os objetos podem ser sujeitos em outros

predicados, o que permite a criação de uma rede de significados com semântica. No

exemplo da Figura 10, Compositor é o sujeito na relação Compositor possui Nome ao

mesmo tempo em que é objeto na relação Obra é composta por Compositor.

As relações permitidas entre os sujeitos, predicados e objetos são definidas no

RDF Schema, o que impede a criação de declarações inválidas como Instrumento é

compositor de Obra, por exemplo.

Sujeitos e objetos são valorados a partir da criação de instâncias, por exemplo,

José Mauricio Nunes Garcia é uma instância de Compositor; Flauta é uma instância de

Instrumento. A figura 11 apresenta um exemplo de representação visual da descrição

em RDF considerando o uso de instâncias.

19 Do original, em inglês, Resource Description Framework.

Figura 11 Representação visual de uma descrição em RDF com instâncias

4.1.3 OWL – Linguagem de Ontologia para Web20

O nível mais alto de descrição da web semântica é a OWL. A OWL utiliza a

mesma estrutura do RDF para descrever os conteúdos, mas adiciona a ela um nível de

regras lógicas, visando a atender às necessidades de inferência para a integração

automática. A essa estrutura de representação semântica foi dada, na Ciência da

Computação, a denominação de ontologia.

Com a utilização de uma ontologia é possível criar uma representação, sob o

ponto de vista lógico, do modo como os usuários humanos constroem os

relacionamentos entre predicados e objetos. A seguir são apresentadas algumas

propriedades lógicas disponíveis na linguagem OWL, contextualizadas ao exemplo da

descrição da Ladainha.

• A propriedade Inversa permite fazer declarações tais como: toda vez que

houver um predicado é composta por relacionando Obra e Compositor

haverá outro predicado é o compositor de relacionando Compositor e Obra.

• A propriedade Funcional permite declarar que o valor de um predicado para

aquele sujeito é único, identificando-o funcionalmente. Por exemplo: cada

relação entre Obra e Edição caracteriza uma instância de publicação. Se

houver mais de uma edição para uma mesma obra, são publicações

diferentes, como no caso das edições da Ladainha feitas por Antônio

Campos Monteiro Neto e Márcio Miranda Pontes.

20 Do original, em inglês, Web Ontology Language.

• A propriedade Equivalente permite estabelecer que dois ou mais sujeitos são

equivalentes. A definição dessa propriedade resolve o problema de sítios

distintos usarem metadados diferentes para se referirem ao mesmo conteúdo.

É possível estabelecer que Compositor no contexto do Musica Brasilis é

equivalente a Autor no contexto do CMSRB. A propriedade Equivalente

aplica-se também para as instâncias, permitindo identificar, por exemplo,

que uma instância nomeada Ladainha das Dores de Nossa Senhora é

equivalente a Ladainha das Dores de N. Sra..

• A propriedade Transitiva permite declarar que uma propriedade se aplica a

todos os sujeitos que compõem uma hierarquia. Por exemplo: ao definir que

uma Obra é composta de Seções e que a propriedade Edições de uma Obra é

transitiva, isso significa, automaticamente, que uma Edição também conterá

Seções.

Os três níveis – XML, RDF e OWL – são complementares e compatíveis entre

si. Isso quer dizer que os dados descritos sintaticamente em XML podem ser estendidos

usando o framework RDF de forma a passarem a ter sua semântica descrita de forma

explícita. Da mesma forma, dados descritos em RDF podem receber informações sobre

as regras lógicas e passarem a compor uma ontologia OWL, que é o nível mais alto para

atingir a interoperabilidade na web semântica.

4.2 Interoperabilidade na web semântica

Sendo a interoperabilidade um dos principais objetivos da web semântica,

algumas iniciativas começam a se destacar neste sentido.

Uma delas é a OAI-ORE – Reuso e Intercâmbio de Objetos, da Iniciativa

Arquivos Abertos21 (OAI-ORE, 2012). Essa iniciativa, embora transcorra em paralelo,

pode ser entendida como a substituta natural da OAI-PMH abordada na seção 3.

A OAI-ORE consiste em um agregador de recursos descritos semanticamente

usando RDF. Uma mudança importante em relação ao OAI-PMH é o entendimento da

inviabilidade de centralizar as descrições dos recursos. Enquanto o OAI-PMH baseava-

se na coleta de metadados dos sítios afiliados, o OAI-ORE propõe que, a partir do

21 Do original, em inglês, Open Archives Initiative Object Reuse and Exchange.

mapeamento dos sítios que oferecem recursos, os próprios sítios contenham e ofereçam

a descrição semântica dos seus recursos em RDF.

No entanto, ainda há resquícios de um pensamento centralizador nesta proposta,

uma vez que o mapeamento dos sítios é feito através de um modelo específico, RMD –

Mapa de Descoberta de Recursos22 –, que espera uma descrição padronizada em Dublin

Core dos recursos e exige que as iniciativas afiliadas adotem o modelo proposto.

Uma iniciativa mais abrangente é o grupo de trabalho LDP – Plataforma de

Dados Interligados23, organizado pela W3C (W3C LDP, 2012) com o objetivo de

definir padrões aplicáveis e reutilizáveis à descrição dos recursos disponíveis na web.

Ao contrário das iniciativas OAI, ao invés de propor um padrão que deve ser seguido

por todos os participantes, a LDP não impõe um padrão e possibilita a conversão dos

diferentes padrões usados por cada iniciativa. Isso é feito a partir do mapeamento dos

metadados, assegurando-se a correspondência semântica.

Em um futuro breve, as buscas realizadas na web consultarão as descrições

distribuídas pelos diversos sítios e serão respondidas a partir dos cruzamentos das

informações, mesmo que estas estejam (e certamente estarão) descritas em formatos

diferentes.

4.3 Iniciativas para a web semântica no âmbito musical

Na área musical, a principal iniciativa relacionada à definição de um modelo

semântico é a MusicOntology (RAIMOND et al, 2007). Destinada especificamente à

descrição de fonogramas, artistas e álbuns, é parte importante do projeto DBTune

(DBTUNE, 2012).

No momento da elaboração deste trabalho, o DBTune é a única iniciativa do

âmbito musical integrante do Grupo de Trabalho LDP. A proposta do DBTune é mapear

semanticamente os registros de fonogramas e álbuns das coleções dos sítios MySpace,

MusicBrainz e rádio da BBC.

Não foram encontradas iniciativas similares destinadas à descrição de outros

recursos musicais, como partituras, nem tampouco modelos e padrões preocupados com

a descrição de características específicas de conteúdos musicais, como instrumentação,

tonalidade e compasso.

22 Do original, em inglês, Resource Map Discovery 23 Do original, em inglês, Linked Data Platform Working Group.

5. Conclusão

Ao longo deste trabalho, foram discutidas questões relativas à descrição de

partituras com vistas à recuperação. Do estágio inicial, da busca em arquivos e

bibliotecas, o problema evoluiu para a busca na web, o que implica em maior

complexidade no tocante à descrição. A pesquisa em bibliotecas, guiada por padrões

propostos pela Ciência da Informação, fica circunscrita a uma única instituição,

enquanto que, idealmente, a pesquisa na web deveria ser respondida por todos os sítios

que contem instâncias do recurso buscado, conforme ilustra a Figura 12.

Figura 12. Alcance das buscas na web

Percebendo a necessidade de concentrar em um único local as informações de

vários sítios, surgiram as iniciativas centralizadoras, como o RISM e o CMSRB.

Embora prestem um serviço inestimável, essas soluções vão de encontro às recentes

tendências de descentralização devido à dificuldade de se manterem atualizadas frente à

multiplicação de sítios e conteúdos disponíveis na internet.

O projeto RISM, criado em 1952, tinha o propósito de ser:

“[...] um projeto o mais exaustivo possível, que abarcasse todas as fontes musicais históricas existentes no mundo, com vistas a solucionar de uma vez por todas o problema do conhecimento o mais exato possível das fontes” (RISM, 1996, p. 10).

No momento de sua criação, anterior à internet, o RISM tratava o propósito de

cooperação em rede com a única abordagem viável: a da centralização dos metadados.

Atualmente, com a conectividade através da internet, a acuidade das iniciativas

centralizadoras é ameaçada pela volatilidade e pela inevitável obsolescência dos dados

(LÉVY, 1996).

Para atingir a interoperabilidade dentro do contexto da web, é necessário que os

vários sítios que contem recursos digitais cooperem entre si, o que só é viável se dois

requisitos forem atendidos:

a) A descrição dos recursos deve ser feita segundo padrões de metadados;

b) O sítio deve ser dotado de uma camada que exporte os metadados de forma a

explicitar a semântica da sua estrutura interna.

No tocante à questão “a”, dentre todas as iniciativas mencionadas, apenas a

Biblioteca Nacional utiliza um padrão internacionalmente consagrado – o MARC –,

embora as outras iniciativas utilizem um modelo interno consistente, ou seja: definem

um conjunto de metadados e o utilizam para descrever os seus recursos de maneira

uniforme.

O alinhamento com padrões web aponta para aqueles propostos pelo consórcio

W3C, principalmente o padrão RDF e a linguagem OWL. Atualmente, nenhuma das

iniciativas mencionadas no escopo desse artigo atende ao requisito “b”.

No âmbito do projeto Musica Brasilis, busca-se ambas as metas. No que se

refere aos metadados, por não se tratar de uma biblioteca, as partituras são descritas

seguindo um conjunto de metadados que guarda uma correspondência com padrões

como o MARC e o Dublin Core. Cada partitura do Musica Brasilis é univocamente

identificada por um endereço – o URI – o que faz com que possa ser apontada por

outros sítios. Uma vantagem subjacente é que a busca Google pelo título de uma obra

atinge, quase sempre, páginas de partituras do Musica Brasilis.

Tudo indica que o Google em breve incorporará aspectos da web semântica

(EFRATI, 2012). O Musica Brasilis busca desde já o alinhamento com o padrão RDF,

visando a atingir a interoperabilidade com outros sítios detentores de partituras, de

forma a assegurar o maior alcance possível dos repertórios brasileiros.

Referências Bibliográficas

BALLESTÉ, Adriana Olinto; ABREU JUNIOR, Jupiter Martins; LANZELOTTE, Rosana. Biblioteca Digital para a coleção de lundus do acervo Mozart de Araújo In: XVI Congresso da Associaçao Nacional de Pesquisa e Pos-Graduaçao em Musica - ANPPOM, Anais. Brasília, 2006.

BERNERS-LEE, Tim; FISCHETTI, Mark. Weaving the Web: The original design and ultimate destiny of the World Wide Web by its inventor. DIANE Publishing Company, 2001.

BERNERS-LEE, Tim,;HENDLER, James; LASSILA, Ora. The semantic web. Scientific american, v. 284, n. 5, p.28-37, 2001.

BNRJ. Biblioteca Nacional. Disponível em: <http://www.bn.br>. Acesso em: nov. 2012.

BNF. Bibliothèque nationale de France – Digital Legal Deposit. Disponível em: <http://www.bnf.fr/en/professionals/digital_legal_deposit.html>. Acesso em: nov. 2012.

CAA2. Código de Catalogação Anglo Americano. Preparado sob a direção do Joint Steering Commitee for Revision of AACR. – ed. 2. rev. 2002. São Paulo: FEBAB, 2004.

CASTAGNA, Paulo. Níveis de organização na música religiosa católica dos séculos XVIII e XIX: implicações arquivísticas e editoriais. In: I Colóquio Brasileiro De Arquivologia E Edição Musical. Anais. Mariana: Fundação Cultural e Educacional da Arquidiocese de Mariana, p.79-104, 2004.

COTTA, André Guerra. Novas considerações sobre o acesso ao Patrimônio Musical no Brasil. Liinc em Revista, v. 7, n. 2, p.466-484, 2011.

DE SANTIS, Rodrigo; FERREIRA, Tiago. Dspace para a implantação de bibliotecas digitais – aplicação a uma coleção de recursos musicais. In: SEMINÁRIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS BRASIL - SIBDB. Anais. São Paulo: Biblioteca Digital da UNICAMP, 2007.

DBTUNE – Music-Related RDF. Disponível em: <http://www.dbtune.org/>. Acesso em: nov. 2012.

DCMI. Dublin Core Metadata Initiative. Disponível em: <http://www.dublincore.org>. Acesso em: nov. 2012.

DIGITAL LIBRARY FEDERATION. Benchmark for Faithful Digital Reproductions of Monographs and Serials. Disponível em: <http://www.diglib.org/standards/bmarkfin.htm>. Acesso em: nov. 2012.

DOWNIE, J. Stephen. Music information retrieval annotated bibliography website project, phase I. In: J. S. Downie and D. Bainbridge (Eds.), Proceedings of the Second Annual International Symposium on Music Information Retrieval: ISMIR, 2001.

EFRATI, Amir. Google gives search a refresh. Wall Street Journal, Nova Iorque, 15 mar. 2012. Disponível em <http://online.wsj.com/article_email/SB10001424052702304459804577281842851136290-lMyQjAxMTAyMDIwNzEyNDcyWj.html>. Acesso em: nov. 2012.

GOOD, Michael. MusicXML for notation and analysis. The virtual score: representation, retrieval, restoration. pp. 113-124, 2001.

ICA – International Council of Archives. Disponível em: <http://www.ica.org/10207/standards/>. Acesso em: nov. 2012.

LESK, Michael. Understanding Digital Libraries. The Morgan Kaufmann Series in Multimedia Information and Systems, Elsevier, 2004.

LANZELOTTE, Rosana; BALLESTÉ, Adriana Olinto. Modelos de dados para Catálogos Temáticos In: VI Encontro de Musicologia Histórica Brasileira, 2006, Juiz de Fora. Anais. Juiz de Fora: Centro Cultural Pró-Musica, p.362-375. 2006.

LANZELOTTE, Rosana; ULHOA, Martha Tupinambá; BALLESTÉ, Adriana Olinto. Sistemas de Informações Musicais - disponibilização de acervos musicais via Web. OPUS - Revista da Associação Nacional de Pesquisa e Pós-graduação em Música - ANPPOM. v.10, pp.7-15, 2004.

LÉVY, Pierre. As tecnologias da inteligência. O futuro do pensamento na era da informática. São Paulo: Editora 34, 1996.

MARC. Machine-Readable Cataloguing. Disponível em: <http://www.loc.gov/marc>. Acesso em: nov. 2012.

MUSICA BRASILIS. Disponível em: <http://www.musicabrasilis.org.br>. Acesso em: nov. 2012.

NEVES, José Maria. Arquivos de manuscritos musicais brasileiros: breve panorama. Recuperação e propostas para uma sistematização latino-americana. Anais. I Simpósio Latino-Americano de Musicologia. Curitiba: Fundação Cultural de Curitiba, p.137-163, 1998.

OAI-ORE. Open Archives Initiative Object Reuse and Exchange. Disponível em: <http://www.openarchives.org/pmh/>. Acesso em: nov. 2012.

OAI-PMH. Open Archives Initiative – Protocol for Metadata Harvesting. Disponível em: <http://www.openarchives.org/ore>. Acesso em: nov. 2012.

POULTER, Alan. Building a browsable virtual library. Anais. Aslib, vol. 46, no. 6, pp. 151-155. MCB UP Ltd, 1994.

RAIMOND, Yves, ABDALLAH, Samer, SANDLER, Mark, GIASSON, Frederick. The music ontology. Anais. International Conference on Music Information Retrieval, pp. 417-422. 2007.

RISM. Répertoire International des Sources Musicales. Disponível em: <http://www.rism.info>. Acesso em: nov. 2012.

RISM – Répertoire International des Sources Musicales. Normas Internacionales para la catalogación de fuentes musicales históricas. Tradução espanhola e comentários: José V. González Valle, Antonio Ezquerro, Nieves Iglesias. Madrid: Arco/Libros, 1996.

ROLAND, Perry. XML4MIR: Extensible markup language for music information retrieval. Anais. International Conference on Music Information Retrieval 2000, 2000.

SEMANTIC WEB. Disponível em: <http://www.w3.org/standards/semanticweb/>. Acesso em: nov. 2012.

STANECK, José; LANZELOTTE, Rosana. Padrões de interoperabilidade para a difusão de recursos musicais. In: XVII Congresso da Associação Nacional de Pesquisa e Pós-Graduação em Música - ANPPOM, Anais. São Paulo, 2007.

W3C. World Wide Web Consortium. Disponível em: <http://www.w3c.org>. Acesso em: nov. 2012.

W3C LDP. Linked Data Platform (LDP) Working Group. Disponível em: <www.w3.org/2012/ldp/>. Acesso em: nov. 2012.