Wikimedia & open data. A love story

  • Published on
    06-Dec-2014

  • View
    511

  • Download
    1

Embed Size (px)

DESCRIPTION

Presentation for the 2014 edition of So Data, a French annual conference on data science. It adresses mostly the positive relationship between the Wikimedia projects and the semantic open data movement and provides a brief introduction to DBPedia, Semanticpedia and Wikidata.

Transcript

  • 1. Wikimedia Open data A Love Story Pierre-Carl Langlais (Wikimdia France) Alexander Doria (Wikipdia) @Dorialexander (Twitter) HotelWikipdia (Rue89) dimanche 16 mars 14
  • 2. La Galaxie wikimdia dimanche 16 mars 14
  • 3. Une gestion collaborative dimanche 16 mars 14
  • 4. Comment le web smantique a failli devenir le web 2.0 The SemanticWeb is not a separateWeb but an extension of the current one, in which information is given well-dened meaning, better enabling computers and people to work in cooperation.The rst steps in weaving the SemanticWeb into the structure of the existingWeb are already under way. In the near future, these developments will usher in signicant new functionality as machines become much better able to process and "understand" the data that they merely display at present. Tim Berners-Lee, The SemanticWeb, 2001 dimanche 16 mars 14
  • 5. Une acclration rcente dimanche 16 mars 14
  • 6. Lmergence dun cosystme de la donne : le linked-data dimanche 16 mars 14
  • 7. Lmergence dun cosystme de la donne : le linked-data dimanche 16 mars 14
  • 8. Lopen data, au service des communauts wikimdiennes dimanche 16 mars 14
  • 9. Complter les articles Les donnes dmographiques franaises sont automatises grce aux donnes ouvertes de lINSEE dimanche 16 mars 14
  • 10. Garantir la vriabilit Un jeu de donne de data.gouv cit comme rfrence dans larticle sur le Muse de lOrangerie dimanche 16 mars 14
  • 11. Encourager le libre accs La bibliothqueWikisource envisage dhberger des rfrences en libre accs dimanche 16 mars 14
  • 12. Lapport des donnes wikimdiennes dimanche 16 mars 14
  • 13. Une scurit juridique dimanche 16 mars 14
  • 14. Une scurit juridique dimanche 16 mars 14
  • 15. Une bonne indexation Le code source wikimdien : un terrain de jeu idal pour le parsing. Extrait du Bastards Books of Ruby dimanche 16 mars 14
  • 16. Une couverture exhaustive Classication du contenu deWikipdia en anglais par Kittur & Chi (2009) dimanche 16 mars 14
  • 17. Des informations ables Rsum de ltat de lart par Piotr Konieczny : Wikipedia works in practice, not in theory dimanche 16 mars 14
  • 18. Des utilisations croissantes La plupart des 7000 articles de recherche consacrs Wikipdia recenss par Nicolas Jullien (2012) utilisent Wikipdia comme une source dinformation dimanche 16 mars 14
  • 19. Rcuprer les donnes de Wikipdia : les intermdiaires dimanche 16 mars 14
  • 20. Intermdiaires simples API, Dumps, etc. dimanche 16 mars 14
  • 21. DBPedia Un projet dexploration des donnes wikipdiennes initis par des universitaires allemands en 2007 dimanche 16 mars 14
  • 22. DBPedia Le systme dextraction mis en uvre par DBPedia : une sorte de parsing amlior. dimanche 16 mars 14
  • 23. DBPedia Le rsultat du parsing dimanche 16 mars 14
  • 24. DBPedia Spotlight Une application permettant de lier rapidement les entits dun texte lontologie de DBPedia dimanche 16 mars 14
  • 25. Semanticpedia Une collaboration entre ltat franais,Wikimdia France et lInria qui sinscrit dans la continuit de DBPedia dimanche 16 mars 14
  • 26. Semanticpedia Plusieurs projets spciques sont envisags partir de la cration de la DBPedia francophone dimanche 16 mars 14
  • 27. Semanticpedia Un exemple dapplication emblmatique : le Joconde lab dimanche 16 mars 14
  • 28. Wikidata Un projetWikimdia autonome, qui vise constituer une base de la connaissance libre dimanche 16 mars 14
  • 29. Wikidata Une coupure progressive avecWikipdia : les imports automatiques de donnes deWikipdia, sans source tierces, ne sont pas recommands dimanche 16 mars 14
  • 30. Wikidata Les donnes sont ajoutes dans une interface spcique : un quintuplet sujet-prdicat-objet-qualicateur-rfrences dimanche 16 mars 14
  • 31. Un choix philosophique A challenge is that the traditional top-down model of designing an ontology or schema before developing the data breaks down at the scale of theWeb: both data and metadata must constantly evolve, and they must serve many different communities. Hence there has been a recent movement to build the SemanticWeb grass-roots-style. Auer et alii, DBPedia, a nucleus for a web of open data, 2007 dimanche 16 mars 14
  • 32. Des ontologies collaboratives DBPedia inclut actuellement 529 classes et 2333 proprits importes des infobox deWikipdia dimanche 16 mars 14
  • 33. Des ontologies collaboratives Lontologie deWikidata donne lieu un dbat constant au sein de la communaut. dimanche 16 mars 14
  • 34. Rcuprer les donnes DBPedia sinscrit dans la continuit du SemanticWeb duW3C : requtes SPARQL et donnes RDF dimanche 16 mars 14
  • 35. Rcuprer les donnes Wikidata sappuie sur toute une srie doutils externes dimanche 16 mars 14
  • 36. Perspectives dimanche 16 mars 14