Transcript
Page 1: Wikimedia & open data. A love story

Wikimedia ♥ Open dataA Love Story

Pierre-Carl Langlais (Wikimédia France)Alexander Doria (Wikipédia)@Dorialexander (Twitter)Hotel Wikipédia (Rue89)

dimanche 16 mars 14

Page 2: Wikimedia & open data. A love story

La Galaxie wikimédia

dimanche 16 mars 14

Page 3: Wikimedia & open data. A love story

Une gestion collaborative

dimanche 16 mars 14

Page 4: Wikimedia & open data. A love story

Comment le web sémantique a failli devenir le web 2.0

The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation. The first steps in weaving the Semantic Web into the structure of the existing Web are already under way. In the near future, these developments will usher in significant new functionality as machines become much better able to process and "understand" the data that they merely display at present.

Tim Berners-Lee, The Semantic Web, 2001

dimanche 16 mars 14

Page 5: Wikimedia & open data. A love story

Une accélération récente

dimanche 16 mars 14

Page 6: Wikimedia & open data. A love story

L’émergence d’un écosystème de la donnée : le linked-data

dimanche 16 mars 14

Page 7: Wikimedia & open data. A love story

L’émergence d’un écosystème de la donnée : le linked-data

dimanche 16 mars 14

Page 8: Wikimedia & open data. A love story

L’open data, au service des communautés wikimédiennes

dimanche 16 mars 14

Page 9: Wikimedia & open data. A love story

Compléter les articles

Les données démographiques françaises sont automatisées grâce aux données ouvertes de l’INSEE

dimanche 16 mars 14

Page 10: Wikimedia & open data. A love story

Garantir la vérifiabilité

Un jeu de donnée de data.gouv cité comme référence dans l’article sur le « Musée de l’Orangerie »

dimanche 16 mars 14

Page 11: Wikimedia & open data. A love story

Encourager le libre accès

La bibliothèque Wikisource envisage d’héberger des références en libre accès

dimanche 16 mars 14

Page 12: Wikimedia & open data. A love story

L’apport des données wikimédiennes

dimanche 16 mars 14

Page 13: Wikimedia & open data. A love story

Une sécurité juridique

dimanche 16 mars 14

Page 14: Wikimedia & open data. A love story

Une sécurité juridique

dimanche 16 mars 14

Page 15: Wikimedia & open data. A love story

Une bonne indexation

Le code source wikimédien : un terrain de jeu idéal pour le parsing. Extrait du « Bastards Books of Ruby »

dimanche 16 mars 14

Page 16: Wikimedia & open data. A love story

Une couverture exhaustive

Classification du contenu de Wikipédia en anglais par Kittur & Chi (2009)

dimanche 16 mars 14

Page 17: Wikimedia & open data. A love story

Des informations fiables

Résumé de l’état de l’art par Piotr Konieczny : « Wikipedia works in practice, not in theory »

dimanche 16 mars 14

Page 18: Wikimedia & open data. A love story

Des utilisations croissantes

La plupart des 7000 articles de recherche consacrés à Wikipédia recensés par Nicolas Jullien (2012) utilisent

Wikipédia comme une source d’informationdimanche 16 mars 14

Page 19: Wikimedia & open data. A love story

Récupérer les données de Wikipédia : les intermédiaires

dimanche 16 mars 14

Page 20: Wikimedia & open data. A love story

Intermédiaires « simples » API, Dumps, etc.

dimanche 16 mars 14

Page 21: Wikimedia & open data. A love story

DBPedia

Un projet d’exploration des données wikipédiennes initiés par des universitaires allemands en 2007

dimanche 16 mars 14

Page 22: Wikimedia & open data. A love story

DBPedia

Le système d’extraction mis en œuvre par DBPedia : une sorte de parsing amélioré.

dimanche 16 mars 14

Page 23: Wikimedia & open data. A love story

DBPedia

Le résultat du parsingdimanche 16 mars 14

Page 24: Wikimedia & open data. A love story

DBPedia Spotlight

Une application permettant de lier rapidement les entités d’un texte à l’ontologie de DBPedia

dimanche 16 mars 14

Page 25: Wikimedia & open data. A love story

Semanticpedia

Une collaboration entre l’État français, Wikimédia France et l’Inria qui s’inscrit dans la continuité de DBPedia

dimanche 16 mars 14

Page 26: Wikimedia & open data. A love story

Semanticpedia

Plusieurs projets spécifiques sont envisagés à partir de la création de la DBPedia francophone

dimanche 16 mars 14

Page 27: Wikimedia & open data. A love story

Semanticpedia

Un exemple d’application emblématique : le Joconde lab

dimanche 16 mars 14

Page 28: Wikimedia & open data. A love story

Wikidata

Un projet Wikimédia autonome, qui vise à constituer une base de la connaissance libre

dimanche 16 mars 14

Page 29: Wikimedia & open data. A love story

Wikidata

Une coupure progressive avec Wikipédia : les imports automatiques de données de Wikipédia, sans source tierces, ne

sont pas recommandés…dimanche 16 mars 14

Page 30: Wikimedia & open data. A love story

Wikidata

Les données sont ajoutées dans une interface spécifique :un quintuplet sujet-prédicat-objet-qualificateur-références

dimanche 16 mars 14

Page 31: Wikimedia & open data. A love story

Un choix philosophique

A challenge is that the traditional « top-down » model of designing an ontology or schema before developing the data breaks down at the scale of the Web: both data and metadata must constantly evolve, and they must serve many different communities. Hence there has been a recent movement to build the Semantic Web grass-roots-style.Auer et alii, « DBPedia, a nucleus for a web of open data », 2007

dimanche 16 mars 14

Page 32: Wikimedia & open data. A love story

Des ontologies collaboratives

DBPedia inclut actuellement 529 classes et 2333 propriétés importées des infobox de Wikipédia

dimanche 16 mars 14

Page 33: Wikimedia & open data. A love story

Des ontologies collaboratives

L’ontologie de Wikidata donne lieu à un débat constant au sein de la communauté.

dimanche 16 mars 14

Page 34: Wikimedia & open data. A love story

Récupérer les données

DBPedia s’inscrit dans la continuité du Semantic Web du W3C : requêtes SPARQL et données RDF

dimanche 16 mars 14

Page 35: Wikimedia & open data. A love story

Récupérer les données

Wikidata s’appuie sur toute une série d’outils externes

dimanche 16 mars 14

Page 36: Wikimedia & open data. A love story

Perspectives

dimanche 16 mars 14