111
Bibliothèques et crowdsourcing Stage ENSSIB – PBD 11 janvier 2017 Pauline Moirez, BnF Jean-Philippe Moreux, BnF CC BY-NC-ND _NDenis, Flickr

Bibliothèques et crowdsourcing

Embed Size (px)

Citation preview

Page 1: Bibliothèques et crowdsourcing

Bibliothèques et crowdsourcing

Stage ENSSIB – PBD 11 janvier 2017

Pauline Moirez, BnFJean-Philippe Moreux, BnF

 

CC B

Y-NC

-ND

_NDe

nis,

Flick

r

Page 2: Bibliothèques et crowdsourcing

CC B

Y-NC

-SA

Emily

Talia

ferro

Prin

ce, F

lick

Inventer de nouvelles relations avec nos

publics

Page 3: Bibliothèques et crowdsourcing

S’inscrire dans un écosystème où

l’interaction est la norme

CC B

Y-NC

DC

Smith

, Flic

kr

RESEAUX SOCIAUX WEB

MOBILE

WEB SOCIAL

GEOLOCALISATIONGAMIFICATION

Page 4: Bibliothèques et crowdsourcing

Galleries Libraries Archives Muséums

Echanger avec les autres institutions patrimoniales et culturelles

Diapo inspirée d’Antoine Courtin

Page 5: Bibliothèques et crowdsourcing

Comprendre et se conformer aux codes d'usages du web

CC

BY-

NC

-SA

Bibl

ioqu

est.

Page 6: Bibliothèques et crowdsourcing

CC

BY-

NC

-ND

, Fl

ickr

Pour enrichir nos collections et les services rendus à nos

usagers

Page 7: Bibliothèques et crowdsourcing

C’est une mission pour Super Librarian !

Page 8: Bibliothèques et crowdsourcing

Au programme

1. Contexte et enjeux du crowdsourcing pour les bibliothèques

2. Typologie de projets 3. Retour d’expérience sur la plateforme de correction d’OCR CORRECT

4. Contenus et données : qualité, nature, cadre juridique

5. Recruter et motiver les publics

Et des ateliers pratiques

Page 9: Bibliothèques et crowdsourcing

CC B

Y-NC

dr c

oop,

Flic

kr

Contexte et enjeux du crowdsourcing pour les

bibliothèques

1

Page 10: Bibliothèques et crowdsourcing

Arrêtons de parler de web 2.0…

CC B

Y-NC

-ND

Josh

Fass

bind

, Flic

kr

Vive le web social !

Page 11: Bibliothèques et crowdsourcing

Médias sociaux ou web social ?

Page 12: Bibliothèques et crowdsourcing

Les projets Wikimedia CC B

Y-SA

Wik

imed

ia F

ound

atio

n

Le web collaboratif

Page 13: Bibliothèques et crowdsourcing

CC

BY-

NC

-SA

mon

mim

oun,

Flic

kr

Une terminologie fluctuante…qui reflète différentes réalités

Crowdsourcing

Web collaboratifWeb participatif Métadonnées

sociales

Production participative

Community sourcing

Page 14: Bibliothèques et crowdsourcing

Les archives participatives

Kate Theimer

Un organisme, un site ou une collection auxquels des personnes qui ne sont pas

des professionnels des archives apportent leur connaissance ou ajoutent des

contenus, généralement dans un contexte numérique en ligne. Il en résulte une

meilleure compréhension des documents d’archives.

Page 15: Bibliothèques et crowdsourcing

Le musée participatif

Nina Simon

« Je définis une institution culturelle participative comme un endroit où

les visiteurs peuvent créer, partager et échanger entre eux autour des

objets culturels. »

Page 16: Bibliothèques et crowdsourcing

CC B

Y-NC

ryan

cr, F

lickr

Les enjeux culturels de la participation

Page 17: Bibliothèques et crowdsourcing

CC B

Y-ND

Jere

my

Salm

on, F

lickr

L’économie de la recommandation

Page 18: Bibliothèques et crowdsourcing

Notation et critiques

BM de Saint-Herblain

Page 19: Bibliothèques et crowdsourcing

Les « playlists » de l’INA

Organisation de l’information par les usagers

Page 20: Bibliothèques et crowdsourcing

What’s your MET ? au Metropolitain Museum

Marketing viral

Page 21: Bibliothèques et crowdsourcing

CC B

Y-ND

iT@

c, F

lickr Sciences citoyennes

Page 22: Bibliothèques et crowdsourcing

Ancient Lives (Université d’Oxford)

Page 24: Bibliothèques et crowdsourcing

Citizen Archivist (AN Etats-Unis)

Page 25: Bibliothèques et crowdsourcing

CC B

Y-NC

-ND

Libel

ulle

, Flic

kr

2 De nombreux types de projets de

crowdsourcing…

Page 26: Bibliothèques et crowdsourcing

Métadonnées sociales

CC B

Y yo

ppy,

Flic

kr

Page 27: Bibliothèques et crowdsourcing

CC B

Y-NC

-ND

Rick

ydav

id, F

lickr

Catalogues enrichisGranularité de description plus finePlein texteConstruction de nouveaux services

Page 28: Bibliothèques et crowdsourcing

L’indexation de la bibliothèque

Indexation en langage naturel (folksonomies)

Le tagging des usagers

La Library of Congress sur Flickr : plus de

20000 photographies, 67000 tags ajoutés

Page 29: Bibliothèques et crowdsourcing

Operation War Diaries (Archives nationales du Royaume-Uni)

Indexation collaborative

Page 30: Bibliothèques et crowdsourcing

Identification de photographies

BM de Lyon

Page 31: Bibliothèques et crowdsourcing

Identification de vidéos

Mémoire – Les images d’archives (CICLIC)

Page 32: Bibliothèques et crowdsourcing

Catalogage collectif de manuscrits

Manuscrits islamiques de l’Université du Michigan

Page 33: Bibliothèques et crowdsourcing

Rétroconversion de fichiers papiers

Convert-a-Card (Libcrowds, British Library)

Page 34: Bibliothèques et crowdsourcing

Géolocalisation des contenus

Map Warper de la NYPL : géoréférencement de cartes

anciennes

Page 35: Bibliothèques et crowdsourcing

CC B

Y-NC

-SA

mike

VC, F

lickr

Plein texte

Page 36: Bibliothèques et crowdsourcing

« Many hands make light work »Trove (Bibliothèque nationale d’Australie)

Correction collaborative

d’OCR

Page 37: Bibliothèques et crowdsourcing

Transcription collaborative

AnnoTate (Tate Gallery)

Page 38: Bibliothèques et crowdsourcing

Edition collaborative

Transcribe Bentham (Université de Londres)

Page 39: Bibliothèques et crowdsourcing

Edition annotée

Candide 2.0 (New York Public Library)

Page 40: Bibliothèques et crowdsourcing

SHS participatives

Transcrire (Huma-Num)

Page 41: Bibliothèques et crowdsourcing

Co-création de contenus et de savoirs

CC B

Y-NC

Don

McC

ullo

ugh,

Flic

kr

Page 42: Bibliothèques et crowdsourcing

CC

BY-

SA Je

nny

YE, W

ikim

edia

Com

mon

s

« Editathons » (journées contributives)

British Library

Page 43: Bibliothèques et crowdsourcing

Un wiki pour une institution

La « Rosalipédie » de la bibliothèque numérique de Toulouse

Page 44: Bibliothèques et crowdsourcing

Inventaires participatifs

Le Laboratoire des internautes des AD Vendée

Page 45: Bibliothèques et crowdsourcing

La « Grande collecte » 1914-1918

Collecte de documents privés

Page 46: Bibliothèques et crowdsourcing

Moving Here – 200 years of migrations in England (AN Royaume-Uni)

Collecte d’archives orales

Page 47: Bibliothèques et crowdsourcing

Une exposition sur place créée par les internautes au Brooklyn museum

Co-création d’expositio

n

Page 48: Bibliothèques et crowdsourcing

Hackathon BnF 2016

Hackathons

Projet GallicarteProjet GallicaLOL

Page 50: Bibliothèques et crowdsourcing
Page 51: Bibliothèques et crowdsourcing
Page 52: Bibliothèques et crowdsourcing

CC B

Y Am

anda

B, F

lickr3

Le crowdsourcing à la BnF : retour d’expérience sur le

projet Correct

Page 53: Bibliothèques et crowdsourcing

Disposer d’un mode texte de bonne qualité- Recherche plein texte - Accessibilité (synthèse vocale)- Text mining

OCR automatique insatisfaisant

Nécessité d’une relecture humaine

Sour

ce :

Gallic

a

Répondre à des besoins concrets dans Gallica

Page 54: Bibliothèques et crowdsourcing

Recherche plein texte dans Gallica

Page 55: Bibliothèques et crowdsourcing

OCR

Diapo empruntée à I. Josse

Page 56: Bibliothèques et crowdsourcing

Etude sur les usages collaboratifs (Plein Sens, 2008) « échanger sur Gallica, on n’y

pense pas »

Depuis 2010 : médiation numérique, communauté des Gallicanautes

Etude Usage et satisfaction de Gallica (GMV, 2011)

Sour

ce :

Gallic

a

Des usagers disposés à participer

Page 57: Bibliothèques et crowdsourcing
Page 58: Bibliothèques et crowdsourcing

Les Gallicanautes brûlent de corriger Gallica !

Source : Twitter.Diapo empruntée à M. Leroy-Terquem

Page 59: Bibliothèques et crowdsourcing

Les bibliothécaires sont de plus en plus favorables au crowdsourcing- Complémentarité des

métadonnées professionnelles et sociales

- Multiplication des sources de données (dérivation de notices, éditeurs, etc.)

Sour

ce :

Gallic

a

Evolution de la culture professionnelle

Page 60: Bibliothèques et crowdsourcing

Ouverture de 1365 documents sur la bibliothèque numérique Wikisource - S’appuyer sur une

plateforme préexistante (éditeur de texte) et des contributeurs wikisourciens

- Expérimenter un premier projet collaboratif

Sour

ce :

Gallic

a

Le partenariat BnF / Wikimedia France (2009)

Page 61: Bibliothèques et crowdsourcing
Page 62: Bibliothèques et crowdsourcing
Page 63: Bibliothèques et crowdsourcing

Fin 2016 : 111 documents corrigés par une double vérification ; 153 documents validés par un seul correcteur - Faiblesse de la

communication et de la médiation institutionnelle

- Difficulté de s’insérer dans la communauté des Wikisourciens

- Difficulté de réintégrer les documents produits 

Sour

ce :

Gallic

a

Un bilan mitigé

Page 64: Bibliothèques et crowdsourcing

Le projet FUI12 OzalidConception de la plateforme collaborative Correct de correction et d’enrichissement de documents numérisés

9 partenaires :- Coordination : Orange Labs- Entreprises : Jamespot,

Urbilog, I2S- Labos de recherche : ISEP,

INSA Lyon, Université Claude Bernard, Paris 8

- Institution culturelle : BnF

Page 65: Bibliothèques et crowdsourcing

Trois modules interconnectésMoteur autocontrôle

Editeur de correction

Réseau social

Diapo empruntée à I. Josse

Page 66: Bibliothèques et crowdsourcing

2012-2013 2013-2014 2014-2015

RECHERCHE / PROTOTYPE

Mener en parallèle recherche et expérimentation

66

EXPERIMENTATION

Expérimentation 3Observation continue des activités de la plateforme Réalisation d’une étude d’usage

Expérimentation 1En avril 2013 , expérimentation du 1er prototype de l’éditeur de correction

Expérimentation 2Le 19 juin à La BnF, expérimentation en réseau, réalisée simultanément à distance et à la BnF

Editeur de correction Module réseau social Ouverture de Correct

Diapo empruntée à I. Josse

Page 67: Bibliothèques et crowdsourcing

Ouverture de Correct le 24 novembre 2014

www.reseau-correct.fr Diapo empruntée à I. Josse

Page 68: Bibliothèques et crowdsourcing

Le cadre juridique

- Les métadonnées descriptives : open data (licence Etalab)

- Les documents numérisé et l’OCR : licence spécifique de Gallica (toutes réutilisations privées ou publiques sauf commerciales)

- Les données produites : entrent dans la licence Gallica (pas de mention des contributeurs)

Page 69: Bibliothèques et crowdsourcing

Recrutement et motivation des usagers

- La communauté des Gallicanautes : communication sur les réseaux sociaux et sur Gallica

- Choix des corpus :- Documents les plus consultés de Gallica

(ésotérisme, récits de voyages)- Usages constatés sur le web : romans

d’anticipation, gastronomie- Sujets « tous publics » : littérature

populaire, contes d’ici et d’ailleurs- Lien à l’actualité : Première guerre

mondiale

Page 70: Bibliothèques et crowdsourcing

Un pari : un projet de crowdsourcing appuyé sur un

réseau social- Miser sur l’entraide des usagers pour

organiser le travail de participation et assurer la qualité de la production

- Parier sur l’échange social comme levier de motivation

- Objectif : susciter l’appropriation de la plateforme par les usagers, passer de la participation à la collaboration

- L’exemple du groupe Lecteurs.com

Page 71: Bibliothèques et crowdsourcing

Résultats de l’étude d’usages de la plateforme Correct

(nov. 2014-jan.2015)

- Analyse des statistiques- Questionnaire en ligne- Focus groups- Recueil de carnets d’activité

Page 72: Bibliothèques et crowdsourcing

Quelques chiffres

369 inscrits en deux mois- pics liés aux actions de communication- 47% ont « décroché » en 48 heures

Page 73: Bibliothèques et crowdsourcing

3 701 pages corrigées sur un total de 16 805 pages (62 ouvrages proposés), soit environ 22% du nombre total des pages.

37 contributeurs (soit 8% des inscrits) ont assuré 63% des corrections totales dont 10 ont réalisés à eux-seuls 50% du total des corrections.

Quelques « super-contributeurs »

Page 74: Bibliothèques et crowdsourcing

Profils des contributeurs

- Bibliothécaires- Enseignants et chercheurs- Amateurs de culture, bibliophiles- Technophiles

Page 75: Bibliothèques et crowdsourcing

« C’est comme les mots croisés mais c’est utile »

- Mais des outils d’échanges et de collaboration peu utilisés : 75% des contributeurs n’ont jamais échangé avec d’autres.

- même si la correction est une activité solitaire, la présence des autres contributeurs sur la plateforme accroît la motivation.

« Je ne suis pas rentré en contact pour l’instant avec les autres utilisateurs de Correct mais cela m’intéresserait de le faire avec les personnes qui corrigent un document qui m’intéresse. »

Des interfaces agréables

Page 76: Bibliothèques et crowdsourcing

Motivation des usagers

- découvrir des documents (intérêt scientifique, curiosité),

- participer à l’amélioration de Gallica - contribuer de manière citoyenne à un projet de la BnF- envie de voir l’aboutissement des corrections sur un

document (satisfaction ou plaisir du travail fini)

Page 77: Bibliothèques et crowdsourcing
Page 78: Bibliothèques et crowdsourcing

Attention aux enjeux techniques ! 

• Prévoir la réintégration des données enrichies/corrigées

• Penser aux :– formats techniques– SI de l'institution– cycles de vie des objets numériques– coûts/gains– mesure de la qualité

Page 79: Bibliothèques et crowdsourcing

CC B

Y-NC

-SA

Joan

a Ha

rd, F

lickr

4

Contenus et données

Page 80: Bibliothèques et crowdsourcing

CC B

Y-SA

e30

00, F

lickr

Comment assurer la qualité des données produites ?

Page 81: Bibliothèques et crowdsourcing

DigitalKoot, correction collaborative d’OCR (Bibliothèque nationale de Finlande)

Des microtâches très encadrées

Page 82: Bibliothèques et crowdsourcing

S’assurer de la compétence des usagers

Examen de paléographie pour l’indexation collaborative aux AD Ain

Page 83: Bibliothèques et crowdsourcing

Evaluation sociale et validation par

des experts

Transcribe Bentham (University College London)

Page 84: Bibliothèques et crowdsourcing

Automatisation des vérifications

Old Weather (Archives nationales du Royaume-Uni)

Page 85: Bibliothèques et crowdsourcing

Miser sur l’encadrement et l’entraide des contributeurs

Plateforme Correct : activité de correction appuyée sur un réseau social

Page 86: Bibliothèques et crowdsourcing

Utilisation de référentiels

JocondeLab (Ministère de la Culture)

Page 87: Bibliothèques et crowdsourcing

CC B

Y Ro

bert

Cous

e-Ba

ker,

Flick

r

Quels lieux pour les projets de crowdsourcing ?

Page 88: Bibliothèques et crowdsourcing

History Pin (Archives nationales d’Australie)

Sur une plateforme extérieure

Page 89: Bibliothèques et crowdsourcing

Sur une plateforme dédiée

Le Wiki de la Grande Guerre (département des Yvelines)

Page 90: Bibliothèques et crowdsourcing

Au cœur du catalogue

Trove (Bibliothèque nationale d’Australie)

Page 91: Bibliothèques et crowdsourcing

CC

BY-

ND

rip

ples

tone

ga

rden

, Flic

kr

Quels réintégration des

données produites ?

Page 93: Bibliothèques et crowdsourcing

Afficher dans un catalogue des données

produites ailleurs

La Babelthèque dans le catalogue de la BM de Toulouse

Page 94: Bibliothèques et crowdsourcing

Questions juridiques

CC B

Y-SA

Mich

ael C

oghl

an, F

lickr

Page 96: Bibliothèques et crowdsourcing

Open data et culture

Page 97: Bibliothèques et crowdsourcing

Les licenses Creative Commons

Page 98: Bibliothèques et crowdsourcing

Proposer un cadre clair et explicite

Trove (Terms of use)

Page 99: Bibliothèques et crowdsourcing

Rendre aux usagers ce qui appartient aux usagers ?

Mémoire des hommes (Ministère de la Défense)

Page 100: Bibliothèques et crowdsourcing

Créditer les contributeurs

Annotations trouvées dans les registres

d’état-civil (AD Mayenne)

Page 101: Bibliothèques et crowdsourcing

Reconnaître les contributeurs

comme co-auteurs

Foldit : des contributeurs crédités comme auteurs des articles scientifiques

Page 102: Bibliothèques et crowdsourcing

5

CC B

Y M

arc

Corn

elis,

Flic

kr

Recruter et motiver les publics

Page 103: Bibliothèques et crowdsourcing

Atteindre la masse critique ?

CC B

Y-NC

-ND

Lulu

Witc

h, F

lickr

Page 104: Bibliothèques et crowdsourcing

La loi de participation :« 90-9-1 »

Et à l’heure du web social ?

Sour

ce: B

BC

Page 105: Bibliothèques et crowdsourcing

Choisir ses publics- Public local / national / international- Tous publics ou publics ciblés :

- Généalogistes ou érudits locaux (ex. indexation collaborative des documents nominatifs)

- Enfants, scolaires (ex. atelier Wikipedia)

- Professionnels du patrimoine- Non-voyants (ex. plateforme Correct)- Chercheurs, Digital humanities (ex.

Transcrire)

Page 106: Bibliothèques et crowdsourcing

Identifier les leviers de motivation des publics choisis

- Participation citoyenne- Intérêt scientifique- Curiosité technophile- Sentiment de communauté (ex.

Transcribe Bentham)- Interfaces agréables- Intense animation et médiation (on

aime être sollicité)- Mais aussi…

Page 107: Bibliothèques et crowdsourcing

Gamification

Metadatagames (Dartmouth College)

Page 108: Bibliothèques et crowdsourcing

Choix des corpus

Do it yourself history (Université de l’Iowa)

Page 109: Bibliothèques et crowdsourcing

Système de récompenses

ArcHIVE, transcription collaborative des inventaires des AN d’Australie

Page 110: Bibliothèques et crowdsourcing

Bibliographie sommaire E. Bouyé, « Le web collaboratif dans les services d’archives publics : un pari sur l’intelligence et la motivation des publics », La Gazette des Archives, n°227 (2012-3).B. W. Brumfield, « Control for Crowdsourced Transcription », Collaborative Manuscript Transcription, 2012. Construire des pratiques participatives dans les bibliothèques, dir. Raphaëlle Bats, Presses de l’ENSSIB, 2015A. Chardonnens, Collections iconographiques numérisées et crowdsourcing : Possibilités et limites de la co-création de métadonnées par le grand public au travers de trois études de cas, mémoire pour le diplôme de Master en Gestion culturelle, université libre de Bruxelles, 2015.D. Day, Enjeux, état des lieux et dynamiques de participation en bibliothèques, mémoire pour le diplôme de conservateur des bibliothèques, ENSSIB, 2014,A. Neroulidis, Le crowdsourcing appliqué aux archives numériques : concepts, pratiques et enjeux, mémoire pour le diplôme de master en sciences de l’information et des bibliothèques, ENSSIB, 2015.P. Moirez, « Archives participatives », dans Bibliothèques 2.0 à l’heure des médias sociaux, dir. M. Amar et V. Mesguich, 2012, p. 187-197.P. Moirez, « Bibliothèques, crowdsourcing, métadonnées sociales », BBF (sept. 2013).P. Moirez, J.-P. Moreux, I. Josse, Etat de l’art en matière de crowdsourcing dans Les bibliothèques numériques, 2013.K. Smith-Yoshimura, C. Shein, Social Metadata for Libraries, Archives, and Museums, OCLC, 2011-2012.K. Theimer, « The participatory archives », Archives Next, 2011.

Page 111: Bibliothèques et crowdsourcing

Merci de votre attention

CC B

Y-NC

Go

Esew

here

, flick

r

[email protected]@archives_masala

[email protected]