Upload
jean-francois-lutz
View
1.129
Download
0
Tags:
Embed Size (px)
Citation preview
Le profil d'application"Archives institutionnelles"
Journées Couperin AO3 avril 2009
Point de départ
Journées Couperin AO3 avril 2009
Journées Couperin AO - 3 avril 2009 3
Point de départ
Concevoir un format de métadonnées :
Répondant aux besoins des établissements en
matière de description des publications
scientifiques
Compatible avec le format de métadonnées de
HAL
Journées Couperin AO - 3 avril 2009 4
Point de départ Objectifs :
Permettre à chaque établissement de décrire au sein de son archive institutionnelle les publications scientifiques qu'il produit (besoin partagé par les établissements d'autres pays) :
Pouvoir avoir des informations sur la production d'une entité (laboratoire...) Pouvoir avoir des informations sur les droits liés aux ressources Pouvoir avoir des informations sur le contexte de publication de la
ressource
au moyen d’un format compatible avec les standards internationaux.
Permettre les échanges : Avec HAL ; Entre archives institutionnelles des établissements français ; Avec les archives institutionnelles, nationales et thématiques des autres
pays.
Journées Couperin AO - 3 avril 2009 5
Point de départ Les besoins des établissements :
Décrire la publication avec des données bibliographiques
standards et complètes
Décrire les liens entretenus par la publication avec des
agents (auteurs, éditeurs, organismes d'affiliation, tutelles...)
à l'instant T du référencement de la publication
Identifier ces agents et permettre le lien avec une
application de gestion de la recherche
Décrire le statut juridique de la publication et les éventuelles
restrictions d'accès
Journées Couperin AO - 3 avril 2009 6
Point de départ
Les besoins des établissements (suite)
Identifier le contexte de la publication :
« document hôte » dans le cas de regroupement de type actes,
revues,
autres publications dans la même archive ou dans une autre archive
Identifier si nécessaire l'événement qui a été l'occasion de
la publication.
AI (Archives Institutionnelles) un profil d'application du Dublin Core
Journées Couperin AO3 avril 2009
Journées Couperin AO - 3 avril 2009 8
Pourquoi un profil d'application du Dublin Core ?
Limite des formats existants :
Le Dublin Core, simple ou qualifié, ne répond pas à l'ensemble des besoins décrits plus haut. C'est un format générique.
Les formats créés dans d'autres pays sont trop fortement liés à leurs contextes nationaux.
La réponse du Dublin Core Metadata Initiative : le modèle abstrait du Dublin Core (DCAM)
Journées Couperin AO - 3 avril 2009 9
Le modèle abstrait du Dublin Core (DCAM)
Le DCAM est un cadre conceptuel complexe qui permet :
de décrire des éléments d'information (métadonnées) et leur structuration
indépendamment des syntaxes d'encodage
pour développer des profils d'application (i. e. modèles conceptuels ancrés dans un contexte précis) fondés sur les termes DCMI ou d'autres ensembles de termes compatibles
Journées Couperin AO - 3 avril 2009 10
Du modèle abstrait au profil d'application
La problématique du GTAO rencontre pleinement celle qui a présidé à l'émergence de la notion de profil d'application du Dublin Core, i. e. répondre à la tension qui existe entre : d'une part les besoins spécifiques de chaque
communauté et d'autre part la nécessité de l'interopérabilité
"The term application profile has been applied to describe the tailoring of standards for specific applications."
The Singapore Framework for Dublin Core Application Profiles - http://dublincore.org/documents/singapore-framework/
Journées Couperin AO - 3 avril 2009 11
Qu'est-ce qu'un profil d'application du Dublin Core (DCAP) ?
Un "Lego" permettant d'assembler des éléments issus de différents standards pour créer un nouveau standard répondant à des besoins spécifiques.
Un standard qui repose sur un cadre conceptuel complexe, le modèle abstrait du Dublin Core (DCAM), lui-même fondé sur les principes du RDF (la "langue" du web sémantique).
Une autre manière de concevoir les métadonnées.
Journées Couperin AO - 3 avril 2009 12
Un exemple de DCAP : SWAP
SWAP (ex-EAP) = Scholarly Works Application Profile :
Un profil d'application du Dublin Core pour la description de documents académiques
Un projet du groupe "Digital Repositories" du JISC entamé en 2006
Validé par le DCMI Usage Board en 2009
Basé sur les FRBR (Functional Requirements for Bibliographic Records)
Journées Couperin AO - 3 avril 2009 13
Un exemple de DCAP : SWAP
Pourquoi AI et pas SWAP ? SWAP n'est pas adapté au contexte français. SWAP et AI ont la même base : le Dublin Core. Ils sont
en quelque sorte deux « vues » de la description des publications scientifiques à l'aide de profils d'application du Dublin Core.
Les apports de SWAP à AI : Un exemple concret de profil d'application Un standard auquel on peut emprunter certaines
métadonnées et des vocabulaires
Journées Couperin AO - 3 avril 2009 14
Comment ça marche ?
Les règles de conception d'un DCAP sont décrits dans le Singapore Framework*.
5 composantes : 3 obligatoires :
Spécifications fonctionnelles : pour quel usage est créé le profil d'application ?
Modèle entités-relations : les composants de base du DSP Profil des ensembles de description (Description Set Profile ou
DSP) : le cœur du DCAP
2 optionnels : Recommandations d'usage Recommandations sur les syntaxes d'encodage : un profil
d'application n'est pas un schéma XML mais un modèle abstrait permettant d'écrire des schémas XML ou autres.
* The Singapore Framework for Dublin Core Application Profiles
http://dublincore.org/documents/singapore-framework/
Journées Couperin AO - 3 avril 2009 15
Les grands principes du DCAM
Le principe de base de RDF et du DCAM : le triple
Un triple est une phrase simple :
Sujet – Verbe – Complément Sujet = ressource Verbe = propriété ou prédicat Complément = valeur
→ Ressource – Propriété – Valeur
Ex : "La ressource dont l'URI est XXX a pour auteur Tintin"
peut se traduire en rdf :
XXX dc:creator « Tintin »
Journées Couperin AO - 3 avril 2009 16
Les grands principes du DCAM
Le « complément » (la valeur) peut elle-même être décrite par un triple.
Ressource XXX
Tintin
dc:creator
foaf:mbox
triple représenté dans un graphe :1 nœud – 1 arc – 1 nœud
Utilisation de termes issues de différents formats
Journées Couperin AO - 3 avril 2009 17
Les grands principes du DCAM :
La structure du DCAM :
Un enregistrement est un ensemble de descriptions
Un ensemble de descriptions comprend une ou plusieurs descriptions
Une description comprend une ou plusieurs déclarations
Une déclaration est un triple
Journées Couperin AO - 3 avril 2009 18
Les grands principes du DCAP
Les principes du DCAP :
Le modèle entités-relations Chaque entité décrite dans le modèle entités-relations peut être
le sujet d'une description Les différentes descriptions sont liées entre elles par les
relations décrites dans le modèle entités-relations
Le modèle entités-relations me permet de dire de quoi je parle.
Journées Couperin AO - 3 avril 2009 19
Les grands principes du DCAP
Les principes du DCAP : Le Description Set Profile :
Il décrit le contenu autorisé pour les éléments composant un enregistrement (ou "description set") : descriptions, déclarations, valeurs
Il peut être écrit à l'aide de différentes syntaxes : DC-Text, XML, RDF...
Le DSP me permet de contrôler ce que je dis sur les composants du modèle entités-relations
Le profil d'application AI
Journées Couperin AO3 avril 2009
Journées Couperin AO - 3 avril 2009 21
AI : spécifications fonctionnelles Le Profil d'Application AI et son environnement
Interopérabilité (avec HAL – avec d'autres archives institutionnelles – au sein du système d'information de l'établissement)
Conformité avec les standards
Adaptabilité (ouverture aux évolutions du web)
Le Profil d'Application AI et les documents décrits Fonctionnalités de recherche (recherche sur n'importe quel
élément d'indexation, repérage des ressources en texte intégral...)
Identification des auteurs et des affiliations (expression des affiliations des auteurs, recours à des formes d'autorités locales ou nationales...)
Gestion des droits (information sur les droits liés aux ressources)
Journées Couperin AO - 3 avril 2009 22
AI : modèle entités-relations et index des entités et de leur propriété (ébauche du DSP)
Journées Couperin AO - 3 avril 2009 23
Les livrables
L'objectif est de fournir à la communauté des établissements d'enseignements supérieur un profil d'application complet, avec des exemples de syntaxes d'encodage et des recommandations d'usage.
L'intégration du profil d'application AI dans les applications gérant les archives institutionnelles pourra se faire en se fondant sur ces exemples de syntaxe d'encodage ou en adoptant une autre syntaxe.
Journées Couperin AO - 3 avril 2009 24
Le bilan
Le travail du GTAO sur le profil d'application AI a dépassé la commande initiale.
Des perspectives intéressantes sont ouvertes par ce travail prospectif qui pourra bénéficier à l'ensemble de la communauté : Vers une convergence entre AI et TEF, deux formats
amenés à être utilisés simultanément par les archives institutionnelles des établissements d'enseignement supérieur ?