85
Web sémantique, web de données : et si on passait à la pratique ? Pierre Col Julien Homo @PierreCol @Julien_Homo

Web sémantique et Web de données, et si on passait à la pratique ?

  • Upload
    antidot

  • View
    2.105

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Web sémantique et Web de données, et si on passait à la pratique ?

Web sémantique, web de données : et si on passait à la pratique ?

Pierre Col Julien Homo@PierreCol @Julien_Homo

Page 2: Web sémantique et Web de données, et si on passait à la pratique ?

2

Pierre Col @PierreCol

Julien Homo @Julien_Homo

1978

1963

1983

1986

1996

2007

2010

2006

2009

2011

198

7

Page 3: Web sémantique et Web de données, et si on passait à la pratique ?

3

Web sémantique,web de données :de quoi parle-t-on ?

Page 4: Web sémantique et Web de données, et si on passait à la pratique ?

4

Le web sémantique, concrètementCertains en parlent…d’autres le font !

Page 5: Web sémantique et Web de données, et si on passait à la pratique ?

5

Le web sémantique, concrètement

Page 6: Web sémantique et Web de données, et si on passait à la pratique ?

6

Le web sémantique, concrètement

KnowledgeGraph

Page 7: Web sémantique et Web de données, et si on passait à la pratique ?

7

KnowledgeGraph

Le web sémantique, concrètement

Page 8: Web sémantique et Web de données, et si on passait à la pratique ?

8

KnowledgeGraph

Le web sémantique, concrètement

Page 9: Web sémantique et Web de données, et si on passait à la pratique ?

9

Le web sémantique, concrètement

KnowledgeGraph

Page 10: Web sémantique et Web de données, et si on passait à la pratique ?

10

Le web sémantique, concrètement

KnowledgeGraph

Page 11: Web sémantique et Web de données, et si on passait à la pratique ?

11

KnowledgeGraph

Le web sémantique, concrètement

Page 12: Web sémantique et Web de données, et si on passait à la pratique ?

12

Le web sémantique, concrètementKnowledgeGraph

Page 13: Web sémantique et Web de données, et si on passait à la pratique ?

13

Le web sémantique, concrètement

KnowledgeGraph

Page 14: Web sémantique et Web de données, et si on passait à la pratique ?

14

Tim Berners-Lee verbatim« The Semantic Web is a web of data,

in some ways like a global database »

« The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined

meaning, better enabling computers and people

to work in cooperation »

Page 15: Web sémantique et Web de données, et si on passait à la pratique ?

15

« Raw data now ! » février 2009

http://www.ted.com/talks/tim_berners_lee_on_the_next_web?language=fr

Page 16: Web sémantique et Web de données, et si on passait à la pratique ?

16

http://www.flickr.com/photos/jimgris/281139738/

L’idée : casser la vieille logique des silos de données cloisonnées…

Siège social d’Oracle, l’éditeur du SGBDR le plus utilisé dans le monde, dans la Silicon Valley

Page 17: Web sémantique et Web de données, et si on passait à la pratique ?

17

…pour partager la donnée structurée sur un espace décentralisé : le web

Un Web de documents

●Documents reliés par des liens●Pas de structuration sémantique●Pas de requêtes structurées

Page 18: Web sémantique et Web de données, et si on passait à la pratique ?

18

…pour partager la donnée structurée sur un espace décentralisé: le web

Puis un Web d’applications

●Données exposées à travers des API●API valables uniquement pour un silo●Pas d’interopérabilité entre les silos

Page 19: Web sémantique et Web de données, et si on passait à la pratique ?

19

…pour partager la donnée structurée sur un espace décentralisé : le web

Et maintenant un Web de données

●Web de données = espace unifié●Liens entre les données elles-mêmes●APIs remplacées par des standards ouverts

Page 20: Web sémantique et Web de données, et si on passait à la pratique ?

20

Web sémantique,web de données :quels standards aujourd’hui ?

Page 21: Web sémantique et Web de données, et si on passait à la pratique ?

21

Une condition nécessaire : assurer l’interopérabilité des données structurées

●Transport

Page 22: Web sémantique et Web de données, et si on passait à la pratique ?

22

Une condition nécessaire : assurer l’interopérabilité des données structurées

●Syntaxe

Page 23: Web sémantique et Web de données, et si on passait à la pratique ?

23

Une condition nécessaire : assurer l’interopérabilité des données structurées

●Sémantique

Page 24: Web sémantique et Web de données, et si on passait à la pratique ?

24

Un langage pour les machinesUne grammaire Le vocabulaire Des règles

d’écritureDes moyens

de communication

RDF RDFS / OWLOntologie

RDF/XMLN3, Turtle

RDFaHTTP

SPARQL

Page 25: Web sémantique et Web de données, et si on passait à la pratique ?

25

Standards : le layer cake aujourd’hui

Déjà normalisé ou en cours de normalisation au W3C

Page 26: Web sémantique et Web de données, et si on passait à la pratique ?

26

Le Linked Open Data Cloud - 2014

Page 27: Web sémantique et Web de données, et si on passait à la pratique ?

27

Web sémantique,web de données :levons le capot !

Page 28: Web sémantique et Web de données, et si on passait à la pratique ?

28

Contexte●Site portail

Page 29: Web sémantique et Web de données, et si on passait à la pratique ?

29

Contexte●Site portail

Page 30: Web sémantique et Web de données, et si on passait à la pratique ?

30

Contexte●Site portail

Page 31: Web sémantique et Web de données, et si on passait à la pratique ?

31

Problématique●Mesurer « la faisabilité technique de

réaliser un site portail basé sur les règles du web de données et du web sémantique »

Page 32: Web sémantique et Web de données, et si on passait à la pratique ?

32

Mais pourquoi recourir au Web Sémantique ?

●Agréger les données●Enrichir les données par des données

externes libre d’accès●Faciliter leur échange●Faciliter leur publication

Page 33: Web sémantique et Web de données, et si on passait à la pratique ?

33

Objectifs ●Offrir aux visiteurs une vision plus globale

des ressources disponibles

Page 34: Web sémantique et Web de données, et si on passait à la pratique ?

34

Objectifs ●Favoriser leur découverte par un effet de

sérendipité

Page 35: Web sémantique et Web de données, et si on passait à la pratique ?

35

Objectifs ●Enrichir l’expérience de navigation

Page 36: Web sémantique et Web de données, et si on passait à la pratique ?

36

Objectifs ●Mettre les données à la disposition de

tous

Page 37: Web sémantique et Web de données, et si on passait à la pratique ?

37

Par où commencer ?●Définir le périmètre de l’étude●Analyser les données●Réaliser un prototype

Page 38: Web sémantique et Web de données, et si on passait à la pratique ?

38

Quelles sont les sources disponibles ?

Page 39: Web sémantique et Web de données, et si on passait à la pratique ?

39

Comment accéder aux données ?●API intégrée au système de gestion de

bibliothèque

Requête SIGB Base de données Export XML

●Export au format XML

Page 40: Web sémantique et Web de données, et si on passait à la pratique ?

40

Quelles sont les données disponibles ?

Page 41: Web sémantique et Web de données, et si on passait à la pratique ?

41

Quelles sont les données disponibles ?

20 000 films

250 000 textes imprimés

2 500 ouvrages numériques

20 000 enregistrements musicaux

Page 42: Web sémantique et Web de données, et si on passait à la pratique ?

42

Comment sont structurées les données ?

Page 43: Web sémantique et Web de données, et si on passait à la pratique ?

43

Comment sont structurées les données ?

Propriétés

ID

Dénomination

Auteur

Lieu de création

Date de création

Dimensions

Catégorie matière

Catégorie technique

Mots-clés

Référence commerciale

Page 44: Web sémantique et Web de données, et si on passait à la pratique ?

44

Comment sont structurées les données ?

Propriétés

ID

Dénomination

Auteur

Lieu de création

Date de création

Dimensions

Catégorie matière

Catégorie technique

Mots-clés

Référence commerciale

Propriétés génériques d’une œuvre ?

Page 45: Web sémantique et Web de données, et si on passait à la pratique ?

45

Comment sont structurées les données ?

Propriétés

ID

Dénomination

Auteur

Lieu de création

Date de création

Dimensions

Catégorie matière

Catégorie technique

Mots-clés

Référence commerciale

Lien vers le Linked Open Data ?

Page 46: Web sémantique et Web de données, et si on passait à la pratique ?

46

Laisse Béton (Renaud)●Prenons un exemple !

Page 47: Web sémantique et Web de données, et si on passait à la pratique ?

47

Laisse Béton (Renaud)●Vu du catalogue Web (OPAC) …

Page 48: Web sémantique et Web de données, et si on passait à la pratique ?

48

Laisse Béton (Renaud)●… et du XML

Page 49: Web sémantique et Web de données, et si on passait à la pratique ?

49

Laisse Béton (Renaud)

●Il y a sûrement des choses à faire…

Propriétés ValeursID b18895888Dénomination Laisse BétonAuteur RenaudLieu de création -Date de création -Dimensions 1 disque compact (36 min)Catégorie matière -Catégorie technique -Mots-clés -Référence commerciale 0042282534828

Page 50: Web sémantique et Web de données, et si on passait à la pratique ?

50

…Et bien faisons les !●Réalisation d’un prototype

●Mesurer la faisabilité technique du projet sur un échantillon

●Montrer l’apport de l’Open Data

●Evaluer les difficultés

Page 51: Web sémantique et Web de données, et si on passait à la pratique ?

51

Mettre les données en communfilm01.avi “Livre A”

http://exemple.org/film/01 http://exemple.org/livre/A

Page 52: Web sémantique et Web de données, et si on passait à la pratique ?

52

Identifier les objets●Schéma arbitraire

●http://data.leschampslibres.org/

●Origine : numérotation arbitraire

Source Numéro Propriété IDBibliothèque de Rennes 1 Controlfield 001

http://data.leschampslibres.org/1/b18895888

Page 53: Web sémantique et Web de données, et si on passait à la pratique ?

53

Modéliser les objets

Modèle HADOCModèles “évènements” (LODE, CIDOC CRM, The Event Ontology…)

Page 54: Web sémantique et Web de données, et si on passait à la pratique ?

54

Laisse Béton (Renaud)

Page 55: Web sémantique et Web de données, et si on passait à la pratique ?

55

Relier les données à l’extérieur

●Oui mais dans quel but ?

Page 56: Web sémantique et Web de données, et si on passait à la pratique ?

56

Données VS Usages

Page 57: Web sémantique et Web de données, et si on passait à la pratique ?

57

Usages…●« Apporter à l’utilisateur des

compléments d’informations sur les objets culturels qu’il consulte sur le portail des Champs Libres »

Page 58: Web sémantique et Web de données, et si on passait à la pratique ?

58

… VS Données

PropriétésISBN

Référence commerciale

Nom et date de naissance de l’auteur

Noms de lieux

Page 59: Web sémantique et Web de données, et si on passait à la pratique ?

59

Sélectionner les sources externes

Page 60: Web sémantique et Web de données, et si on passait à la pratique ?

60

Graphe

Référence commerciale

Nom de l’auteur +

Date de naissanceNom de lieu

ISBN

ID

IDID

ID

Page 61: Web sémantique et Web de données, et si on passait à la pratique ?

61

Laisse Béton (Renaud)

Page 62: Web sémantique et Web de données, et si on passait à la pratique ?

62

Automatisons-le !

Aligner Annoter

Préparer les données

Localement

A distance

Récupérer les données externes

Interroger Interroger

Page 63: Web sémantique et Web de données, et si on passait à la pratique ?

63

Préparer les données : aligner

Nom Prénom Date de naissance

Hugo victor 26 février 1802

sartre jean paul 21/06/1905

http://catalogue.bnf.fr/ark:/12148/cb11907966z

Nom Prénom Date de naissance

Hugo Victor 1802-02-26

Victor 1802-02-26

Page 64: Web sémantique et Web de données, et si on passait à la pratique ?

64

Préparer les données : annoter

http://sws.geonames.org/2911298

Page 65: Web sémantique et Web de données, et si on passait à la pratique ?

65

Préparer les données●Idéalement

●Dumps RDF

●SPARQL Endpoint

●APIs Web RDF …

●Triplestore intermédiaire

Page 66: Web sémantique et Web de données, et si on passait à la pratique ?

66

Préparer les données●En réalité

●Dumps divers

●Pas de SPARQL Endpoint

●APIs Web diverses

●Conversion RDF

Triplestore

Page 67: Web sémantique et Web de données, et si on passait à la pratique ?

67

Récupérer les données externes●Requêtes SPARQL

●Triplestore intermédiaire

●SPARQL EndpointEnrichissements

Enrichissements

Page 68: Web sémantique et Web de données, et si on passait à la pratique ?

68

Récupérer les données externes●Requêtes SPARQL : exemples

http://catalogue.bnf.fr/ark:/12148/cb11907966z

Victor Hugo

1802-02-26

foaf:givenName foaf:name

db:birthDatehttp://catalogue.bnf.fr/ark:/12148/cb11907966z

Page 69: Web sémantique et Web de données, et si on passait à la pratique ?

69

Récupérer les données externes●Requêtes SPARQL : exemples

http://data.leschampslibres.org/1/b18895888

“0042282534828”

hadoc:isbn

“4.25 / 5” http://www.discogs.com/master/11710

http://www.wikidata.org/wiki/Q3216384

http://musicbrainz.org/release-group/374fd86d-838c-3d40-a2c8-680b800290e7

“0042282534828”

mb:barcode

owl:sameAsowl:sameAs

dcogs:rating

“4.25 / 5”

Page 70: Web sémantique et Web de données, et si on passait à la pratique ?

70

Récupérer les données externes●Autres : pas de RDF

●APIs Web

●Dumps (XML, CSV…)

●HTML

●…

Enrichissements

Page 71: Web sémantique et Web de données, et si on passait à la pratique ?

71

Récupérer les données externes●En réalité

●Architecture complexe

●A adapter selon les besoins

… …

Page 72: Web sémantique et Web de données, et si on passait à la pratique ?

72

Laisse béton (Renaud)Normalisation Triplestore intermédiaire Enrichissements RDF Enrichissements APIs

barcode ?

IDs Discogs Allmusic ?

Page 73: Web sémantique et Web de données, et si on passait à la pratique ?

73

Page 74: Web sémantique et Web de données, et si on passait à la pratique ?

74

Résultats

Page 75: Web sémantique et Web de données, et si on passait à la pratique ?

75

Outils

Page 76: Web sémantique et Web de données, et si on passait à la pratique ?

76

Outils●Convertir les données

Actions Outils

Aligner, annoter Antidot Information Factory, Gate, Python…

Créer des données RDF avec un éditeur

Morla, Top Braid composer, Editeur XML (Oxygen), Protégé

Transformer des données de XML vers RDF/XML

XSL, Python…

Transformer des entrées clés/valeurs en RDF

Google Refine

Transformer une base de données relationnelle en RDF

Db2triples, D2R server, …

Page 77: Web sémantique et Web de données, et si on passait à la pratique ?

77

Outils●Stocker les données dans un triplestore

Optimisation Outils

Mémoire Corese, Redstore

Triplestore natif Mulgara, AllegroGraph, BigOWLIM, 4store, Neo4j

BDR paramétrée Virtuoso, ARC, Oracle 11g, Sesame, 3store

Column store Cstore, Heart, BigData, Cloudera

Page 78: Web sémantique et Web de données, et si on passait à la pratique ?

78

Outils●Exploiter les données en RDF

Langages Outils

Java (triples) Jena, Sesame, Trialox SCB, RDF2Go

Java (ORM) Topaz, RDFReactor, So(m)mer, Elmo, jenabean

PHP RAP, ARC (généraliste)

C Redland

Python RDFlib

Ruby ActiveRDF

Scala Scardf

Page 79: Web sémantique et Web de données, et si on passait à la pratique ?

79

Laisse béton (Renaud)●Publication des données en RDF

Page 80: Web sémantique et Web de données, et si on passait à la pratique ?

80

Conclusion

Page 81: Web sémantique et Web de données, et si on passait à la pratique ?

81

Le web sémantique, ça marche !●Les géants mondiaux de l’Internet

avancent rapidement●De plus en plus d’organisations l’adoptent

pour des usages ciblés ●« Que puis-je faire pour le web

sémantique ? »●« Qu’est ce que le web sémantique

peut faire pour moi ? »

Page 82: Web sémantique et Web de données, et si on passait à la pratique ?

82

Le Web Sémantique, des atouts uniques●Disposer d’une quantité colossale de

jeux de données

●Accéder aux données de façon standardisée donc automatisable

●Les agréger pour servir tous types d’usages nouveaux

Page 83: Web sémantique et Web de données, et si on passait à la pratique ?

83

Le Web Sémantique, aller plus loin ?

Un livre dirigé parFabien Gandon, INRIA / W3C

EAN13 : 9782100572946

Page 84: Web sémantique et Web de données, et si on passait à la pratique ?

84

Le web sémantique : à vous de jouer !

WANTS YOU

Page 85: Web sémantique et Web de données, et si on passait à la pratique ?

85

Merci pour votre attention !

Des questions [email protected] @PierreCol

[email protected]@Julien_Homo

@AntidotNet

www.antidot.net