68
CC BY-NC-SA Vicky&Chuck Rogers, Flickr INTEROPERABILITÉ ET ÉCHANGES DE DONNÉES Pauline Moirez – BnF – 26 juin 2012 AAF - Archives et Internet : les nouveaux enjeux

Interopérabilité et échanges de données pour les archives

Embed Size (px)

DESCRIPTION

L'échange de données pour les institutions culturelles : le protocole OAI-PMH, le format Dublin Core, les portails de ressources culturelles et patrimoniales

Citation preview

Page 1: Interopérabilité et échanges de données pour les archives

CC

BY-N

C-S

A V

icky

&C

hu

ck R

og

ers

, Fl

ickr

INTEROPERABILITÉ ET ÉCHANGES DE DONNÉES

Pauline Moirez – BnF – 26 juin 2012

AAF - Archives et Internet : les nouveaux enjeux

Page 2: Interopérabilité et échanges de données pour les archives

CC

BY-N

C-N

D J M

ark

Dod

ds,

Flic

kr

Mais qu’est-ce que c’est que ces gros mots…?!?

Page 3: Interopérabilité et échanges de données pour les archives

CC

BY-N

D H

elg

a W

eb

er,

Flic

kr

L’interopérabilité, pour vous… ?

Page 4: Interopérabilité et échanges de données pour les archives

INTEROPERABILITE = Permettre l'échange de données entre

systèmes d'information

Pouvoir se parler (transport des

données)

Se comprendre (sens des données

échangées)

CC

BY-N

C-N

D Josh

Fass

bin

d, Fl

ickr

Page 5: Interopérabilité et échanges de données pour les archives

La recette de l’interopérabilité de Grand-Maman

CC

BY-N

C-S

A Joan

a H

ard

, Fl

ickr

Page 6: Interopérabilité et échanges de données pour les archives

Des ingrédients de qualité

CC

BY-N

C-S

A Joan

a H

ard

, Fl

ickr

Des données hétérogènes… mais propres

Page 7: Interopérabilité et échanges de données pour les archives

Du matériel de pro

CC

BY-N

C C

ap

tain

Bla

ub

eere

, Fl

ickr

Des protocoles d’échange normalisés

Page 8: Interopérabilité et échanges de données pour les archives

De bonnes proportions

CC

BY-N

C-S

A p

alo

eti

c, F

lickr

Un langage commun

Page 9: Interopérabilité et échanges de données pour les archives

CC

BY R

ob

ert

Cou

se-B

ake

r, F

lickr

ECHANGER, POURQUOI ?

Page 10: Interopérabilité et échanges de données pour les archives

CC

BY-N

D Jere

my S

alm

on

, Fl

ickr

Améliorer la visibilité et la dissémination

des collections

Page 11: Interopérabilité et échanges de données pour les archives

Organiser l’accès à l’information pour

les usagers

CC

BY-N

C-N

D A

lain

Bach

elli

er,

Flic

kr

Page 12: Interopérabilité et échanges de données pour les archives

CC

BY-S

A e

30

00

, Fl

ickr

Dupliquer ?

Page 13: Interopérabilité et échanges de données pour les archives

Le contexte administratif et technique : le référentiel général d’interopérabilité

(RGI)

« détermine notamment les répertoires de données, les normes et les standards qui doivent être utilisés

par les autorités administratives »

Publié par la DGME en 2009

Page 14: Interopérabilité et échanges de données pour les archives

Les niveaux d’interopérabilité du RGI

Ex. modélisation, ontologies, mais aussi SEDA

Ex. formats d’images, de documents multimédia, formats bureautiques, langage XML

Ex. protocoles et langages Web et messagerie, téléphonie, annuaires LDAP

Page 15: Interopérabilité et échanges de données pour les archives

Pour parler la même langue : normaliser !

Normes et standards

archivistiquesRéférentiels

Formats de métadonnées

Schémas d’encodage

EAD

EAC

Thesaurus W

Rameau

DublinCore

METS

LanguesISO 639

PaysISO 3166

Page 16: Interopérabilité et échanges de données pour les archives

Où es-tu ?

UniquesPérennesCitables

Des identifiants pour les

ressources numériques

CC

BY-N

C-N

D x

cod

e, Fl

ickr

Page 17: Interopérabilité et échanges de données pour les archives

ARK : un format d’identification pérenne

CC

BY-N

C-N

D F

rid

ay F

lets

, Fl

ickr

Page 18: Interopérabilité et échanges de données pour les archives

ARK aux AD de la Somme

http://archives.somme.fr/ark:/58483/a011260969022JKSv1y/1/1

Page 19: Interopérabilité et échanges de données pour les archives

Le système ARK : structure et

organisationhttp://gallica.bnf.fr/ark:/12148/

bpt6k5809503p/f2.image

protocoletype

d’identifiant

numéro d’autoriténommante

(NAAN)

autorité d’adressage

(NMAH)

nom ARK

qualifieurs(facultatif)

Et dans la vraie vie…

Page 20: Interopérabilité et échanges de données pour les archives

CC

BY-N

C d

r co

op

, Fl

ickr

OAI-PMH

Un protocole d’échange

incontournable dans le domaine culturel

Page 21: Interopérabilité et échanges de données pour les archives

CC

BY

-NC

-ND

Mary

lise

Doct

rin

al,

F

lick

r

OAI-PMH =

Open Archives Initiative - Protocol for Metadata

Harvesting

Page 22: Interopérabilité et échanges de données pour les archives

Principes de fonctionnement du protocole OAI-PMH

© M

inis

tère

de la C

ult

ure

, 2

00

5

Page 23: Interopérabilité et échanges de données pour les archives

CC

BY-N

C-N

D G

err

y B

ald

ing

, Fl

ickr

Les acteurs de l’OAI-PMH

Le fournisseur de données (entrepôt)

Le fournisseur de services

(moissonneur)

Page 24: Interopérabilité et échanges de données pour les archives

The place to be ?

L’OAI-PMH en 2012, c’est :

1740 entrepôts enregistrésPlus de 25 millions d’enregistrements moissonnables C

C B

Y-N

C-N

D v

ally

gir

l_tk

a, Fl

ickr

Page 25: Interopérabilité et échanges de données pour les archives

Les concepts documentaires de

l’OAI-PMHRESSOURCE

Objet physique ou numérique

ITEMNotice

informatique (URL +

métadonnées)LOT / SET

Ensemble d’enregistrem

ents

ENREGISTREMENT

Unité documentaire

dans un entrepôt OAI

Page 26: Interopérabilité et échanges de données pour les archives

Exemple de notice

OAI

Page 27: Interopérabilité et échanges de données pour les archives

Qu’y a-t-il dans un enregistrement OAI-PMH ?

•Un en-tête : header

- identifier (obligatoire, non répétable)- datestamp (obligatoire, non répétable)- setSpec (facultatif, répétable)- attribut de statut pour les items supprimés

Page 28: Interopérabilité et échanges de données pour les archives
Page 29: Interopérabilité et échanges de données pour les archives

•Des métadonnées : metadata

- métadonnées encodées en XML avec leur élément racine et leur espace de nom - les entrepôts doivent fournir leurs métadonnées en Dublin Core simple ; ils peuvent proposer en plus d’autres formats

Qu’y a-t-il dans un enregistrement OAI-PMH ?

Page 30: Interopérabilité et échanges de données pour les archives
Page 31: Interopérabilité et échanges de données pour les archives

OAI-PMH a le vocabulaire d’un bébé de 18 mois !

CC

BY-N

C-N

D W

on

derm

on

key2

k, F

lickr

Parlez-vous OAI-PMH ?

Page 32: Interopérabilité et échanges de données pour les archives

La syntaxe de moissonnage : les 6

verbesIdentify : identifier l’entrepôt

ListMetadataFormats : lister les formats utilisés (Dubin Core, EAD, etc.)

ListSets : lister les ensembles d’enregistrements

ListRecords : lister les ressources décrites

ListIdentifiers : lister les références des ressources

GetRecord : récupérer une ressource particulière

Page 33: Interopérabilité et échanges de données pour les archives

CC BY-NC-SA Musebrarian, Flickr

Page 34: Interopérabilité et échanges de données pour les archives

OAI-PMHLes atouts

Il s'appuie sur les standards du Web, le moissonnage est simple à mettre en œuvre.Les contenus ne sont pas dupliqués.Les métadonnées collectées sont mises à jour simplement et automatiquement (moissonnage différentiel/incrémental).Il s’adapte à des besoins transdisciplinaires sans interdire des besoins plus spécialisés.

Page 35: Interopérabilité et échanges de données pour les archives

OAI-PMHLes limites

Problèmes de granularité et de hiérarchisationPas d’interrogation finePas de liens simples avec les ressources extérieuresLimité à la communauté des chercheurs et bibliothécaires

Page 36: Interopérabilité et échanges de données pour les archives

A VOUS DE JOUER…!

(n° 1-5)

Page 37: Interopérabilité et échanges de données pour les archives

CC

BY-N

C-N

D s

.red

, Fl

ickr

Dublin Core

À protocole d’échange générique… format de

métadonnées générique !

Page 38: Interopérabilité et échanges de données pour les archives

CC

BY

-NC

-SA

Davi

d S

herr

et,

Fli

ckr

15 éléments de description, facultatifs et répétables

Page 39: Interopérabilité et échanges de données pour les archives

CC

BY

-NC

-SA

Davi

d S

ky,

sou

rce

Améliorer la recherche de ressources sur le web, en définissant un

ensemble de métadonnées communes

Page 40: Interopérabilité et échanges de données pour les archives

Les 15 éléments du Dublin Core simple

Contenu Propriété intellectuelle

Instanciation

Title Creator Date

Subject Contributor Type

Description Publisher Format

Source Rights Identifier

Language

Relation

Coverage

Tous facultatifs

Tous répétables

Page 41: Interopérabilité et échanges de données pour les archives
Page 42: Interopérabilité et échanges de données pour les archives
Page 43: Interopérabilité et échanges de données pour les archives

Mais comment je fais du Dublin Core avec mes données à moi ?

CC

BY-S

A t

an

gi_

bert

in, Fl

ickr

Page 44: Interopérabilité et échanges de données pour les archives

La problématique des conversions

CC

BY-N

D t

om

aB

, Fl

ickr

Page 45: Interopérabilité et échanges de données pour les archives

http://www.cartolis.org/detail_notice.php?num=AA00000001&x=11&y=13

Une notice dans Cartolis

Page 46: Interopérabilité et échanges de données pour les archives

http://www.cartolis.org/oai/oai2.php?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:cartolis.org:AA00000001

La même en Dublin Core…

Page 47: Interopérabilité et échanges de données pour les archives

Et avec l’EAD ?

GRANULARITÉHIERARCHIE

CC

BY-N

C-N

D R

icky

david

, Fl

ickr

COMPLEXITÉ

Page 48: Interopérabilité et échanges de données pour les archives

Un fonds d’archives en EAD : les papiers Pierre et Marie Curie

Page 49: Interopérabilité et échanges de données pour les archives

Du fichier XML-EAD très structuré et hiérarchisé…

Page 50: Interopérabilité et échanges de données pour les archives
Page 51: Interopérabilité et échanges de données pour les archives

… à l’enregistrement en Dublin Core

Page 52: Interopérabilité et échanges de données pour les archives
Page 53: Interopérabilité et échanges de données pour les archives

… et c’est pas fini…

A partir d’informations contenues dans <archdesc>

Page 54: Interopérabilité et échanges de données pour les archives

Tableau de conversion EAD > Dublin Core

Page 55: Interopérabilité et échanges de données pour les archives

Dublin CoreLes atouts

Généricité : permet de décrire des ressources numériques ou physiques, utilisable par de nombreuses communautés

SimplicitéGrande souplesseUtilisation internationale

Page 56: Interopérabilité et échanges de données pour les archives

Les limites

Simplification des métadonnéesLibertés d’interprétation qui limitent l’interopérabilité sémantiqueValeurs des éléments non normalisées

Faiblesse des informations techniques

Dublin Core

Page 57: Interopérabilité et échanges de données pour les archives

OAI-PMH est simpleDublin Core est simple

Ce n’est pas une raison pour faire n’importe quoi !

CC

BY-N

D c

urs

eth

ing

, Fl

ickr

Page 58: Interopérabilité et échanges de données pour les archives

A VOUS DE JOUER…!

(n°6)

Page 59: Interopérabilité et échanges de données pour les archives

… et donc, finalement, à quoi ça sert…?

CC

BY-N

C p

cgn

7, Fl

ickr

… à participer à des portails collectifs !

Page 60: Interopérabilité et échanges de données pour les archives

Europeana, mère de tous les portails…

Page 61: Interopérabilité et échanges de données pour les archives

La nébuleuse des projets liés à Europeana

Page 62: Interopérabilité et échanges de données pour les archives

Le Portail archivistique européen

Des portails par type d’institution

Page 63: Interopérabilité et échanges de données pour les archives

Le « guichet unique » français : le moteur Collections

Des portails nationaux

Page 64: Interopérabilité et échanges de données pour les archives

Une dynamique est lancée... Les portails culturels locaux se multiplient

Banque numérique des savoirs aquitains

(BnsA)

GeoCulture en Limousin

Manioc, bibliothèque numérique des

Caraïbes

Page 65: Interopérabilité et échanges de données pour les archives

Mais aussi...

Isidore, plateforme de recherche pour les

sciences humaines et sociales (SHS)

Gallica et ses 41 bibliothèques partenaires

Page 66: Interopérabilité et échanges de données pour les archives

A VOUS DE JOUER…!

(n°7)

Page 67: Interopérabilité et échanges de données pour les archives

Pour aller plus loin…InteropérabilitéInteropérabilité : faire des choix, échanger, gérer le temps (S. Pouyllau, 2010)Voir EAD et interopérabilité :comment permettre le moissonnage demétadonnées normalisées par des portails (L. Grand, F. Rolland, 2010)

Identifiants pérennesIdentifiants pérennes (E. Bermès, 2009)Des identifiants pérennes pour les ressources numériques - L’expérience de la BnF (E. Bermès, 2006)ARK, qu’est-ce que c’est ? (2012).

OAI-PMHSite officiel de l’Open archive initiativeLe protocole OAI et ses usages en bibliothèque (MCC, 2005)Guide d'interopérabilité OAI-PMH pour un référencement des documents numériques dans Gallica (2010)Le Guide des Bonnes Pratiques Numériques - Entrepôt OAI-PMH (TGE Adonis, 2010)

Dublin CoreSite officiel de la Dublin Core Metadata initiativeGuide d’utilisation du Dublin Core à la BnF (2008).

Page 68: Interopérabilité et échanges de données pour les archives

Merci de votre attention

CC

BY-N

C G

o E

sew

here

, flic

kr

[email protected]