Wikimedia ♥ Open dataA Love Story
Pierre-Carl Langlais (Wikimédia France)Alexander Doria (Wikipédia)@Dorialexander (Twitter)Hotel Wikipédia (Rue89)
dimanche 16 mars 14
La Galaxie wikimédia
dimanche 16 mars 14
Une gestion collaborative
dimanche 16 mars 14
Comment le web sémantique a failli devenir le web 2.0
The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation. The first steps in weaving the Semantic Web into the structure of the existing Web are already under way. In the near future, these developments will usher in significant new functionality as machines become much better able to process and "understand" the data that they merely display at present.
Tim Berners-Lee, The Semantic Web, 2001
dimanche 16 mars 14
Une accélération récente
dimanche 16 mars 14
L’émergence d’un écosystème de la donnée : le linked-data
dimanche 16 mars 14
L’émergence d’un écosystème de la donnée : le linked-data
dimanche 16 mars 14
L’open data, au service des communautés wikimédiennes
dimanche 16 mars 14
Compléter les articles
Les données démographiques françaises sont automatisées grâce aux données ouvertes de l’INSEE
dimanche 16 mars 14
Garantir la vérifiabilité
Un jeu de donnée de data.gouv cité comme référence dans l’article sur le « Musée de l’Orangerie »
dimanche 16 mars 14
Encourager le libre accès
La bibliothèque Wikisource envisage d’héberger des références en libre accès
dimanche 16 mars 14
L’apport des données wikimédiennes
dimanche 16 mars 14
Une sécurité juridique
dimanche 16 mars 14
Une sécurité juridique
dimanche 16 mars 14
Une bonne indexation
Le code source wikimédien : un terrain de jeu idéal pour le parsing. Extrait du « Bastards Books of Ruby »
dimanche 16 mars 14
Une couverture exhaustive
Classification du contenu de Wikipédia en anglais par Kittur & Chi (2009)
dimanche 16 mars 14
Des informations fiables
Résumé de l’état de l’art par Piotr Konieczny : « Wikipedia works in practice, not in theory »
dimanche 16 mars 14
Des utilisations croissantes
La plupart des 7000 articles de recherche consacrés à Wikipédia recensés par Nicolas Jullien (2012) utilisent
Wikipédia comme une source d’informationdimanche 16 mars 14
Récupérer les données de Wikipédia : les intermédiaires
dimanche 16 mars 14
Intermédiaires « simples » API, Dumps, etc.
dimanche 16 mars 14
DBPedia
Un projet d’exploration des données wikipédiennes initiés par des universitaires allemands en 2007
dimanche 16 mars 14
DBPedia
Le système d’extraction mis en œuvre par DBPedia : une sorte de parsing amélioré.
dimanche 16 mars 14
DBPedia
Le résultat du parsingdimanche 16 mars 14
DBPedia Spotlight
Une application permettant de lier rapidement les entités d’un texte à l’ontologie de DBPedia
dimanche 16 mars 14
Semanticpedia
Une collaboration entre l’État français, Wikimédia France et l’Inria qui s’inscrit dans la continuité de DBPedia
dimanche 16 mars 14
Semanticpedia
Plusieurs projets spécifiques sont envisagés à partir de la création de la DBPedia francophone
dimanche 16 mars 14
Semanticpedia
Un exemple d’application emblématique : le Joconde lab
dimanche 16 mars 14
Wikidata
Un projet Wikimédia autonome, qui vise à constituer une base de la connaissance libre
dimanche 16 mars 14
Wikidata
Une coupure progressive avec Wikipédia : les imports automatiques de données de Wikipédia, sans source tierces, ne
sont pas recommandés…dimanche 16 mars 14
Wikidata
Les données sont ajoutées dans une interface spécifique :un quintuplet sujet-prédicat-objet-qualificateur-références
dimanche 16 mars 14
Un choix philosophique
A challenge is that the traditional « top-down » model of designing an ontology or schema before developing the data breaks down at the scale of the Web: both data and metadata must constantly evolve, and they must serve many different communities. Hence there has been a recent movement to build the Semantic Web grass-roots-style.Auer et alii, « DBPedia, a nucleus for a web of open data », 2007
dimanche 16 mars 14
Des ontologies collaboratives
DBPedia inclut actuellement 529 classes et 2333 propriétés importées des infobox de Wikipédia
dimanche 16 mars 14
Des ontologies collaboratives
L’ontologie de Wikidata donne lieu à un débat constant au sein de la communauté.
dimanche 16 mars 14
Récupérer les données
DBPedia s’inscrit dans la continuité du Semantic Web du W3C : requêtes SPARQL et données RDF
dimanche 16 mars 14
Récupérer les données
Wikidata s’appuie sur toute une série d’outils externes
dimanche 16 mars 14
Perspectives
dimanche 16 mars 14
Recommended