22
1 Parc national des Cévennes Prénom Nom du rédacteur à modifier dans en-tête et pied de page Données ouvertes et biodiversité

Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

1

Parc national des CévennesPrénom Nom du rédacteur à modifier dans en-tête et pied de page

Données ouvertes et biodiversité

Page 2: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

2

Vers des données ouvertes

Open Data

Linked Open Data

Private Data

Page 3: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

3

Approche traditionnelle

Silo de données

Page 4: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

4

Silos de Données

occurrence

nomenclature

bibliographie

image

observateursgéographie

● Redondance des données (taxonomie, géographie, ...)● Nettoyage indépendant● Mise à jour manuelle

Les efforts ne sont pas partagés

occurrence

nomenclature

géographie

Structure 1

Structure 2

Page 5: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

5

Structuration propre

● Champs différents

● Différents nom pour le même champ / Même nom pour différent champs

● Différentes façon d’interpréter un champ

● Vocabulaires différents

Demande un effort de compréhension pour chaque source de données

Page 6: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

6

Vers des données liées

Page 7: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

7

Parc national des Cévennes

Données liées

occurrence

phylogénie

bibliographie

observateurs

physiologie

protéinegéographie nomenclature

image

Données liées :● éviter la redondance● facilité l’exploration et l’émergence de nouvelles

données

Page 8: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

8

Vers des données liées

● Utilisation de standards : > parler le même langage

> profiter de la réflexion de la communauté

> favoriser l’échange des données

« le Web sémantique fournit un modèle qui permet aux données d'être partagées et réutilisées entre plusieurs applications, entreprises et

groupes d'utilisateurs » W3C

Page 9: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

9

Structuration des données : Principes

● Triplet de données● Données sous forme de graph● Utilise des vocabulaires existants (ontologies)● Utiliser des adresses URI HTTP qui existent sur le Web

Page 10: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

10

Schtroumf à lunette a identifié une alouette

Page 11: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

11

Structuration des données

Schtroumf

http://fr.dbpedia.org/resource/Schtroumpf_à_Lunettes

Personfoaf:Person

rdf:type

Schtroumpf à Lunettes

Rdf:label

Alouettedes

Champs

dwc:identfication

Taxon Name

rdf:type

http://taxref.mnhn.fr/lod/name/3676

Alauda arvensis Linnaeus, 1758

skos:prefLabel

Page 12: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

12

Parc national des Cévennes

LOD

● 2 niveaux> Structuration sémantique des données

=> Utilisation de standards

> Lier les données

=> Utilisation de ressources existantes

Page 13: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

13

Parc national des Cévennes

LOD et biodiversité

Page 14: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

14

Parc national des Cévennes

Standards en biodiversité - Occurences

● Darwin-SW : DEE● OBOE ; PO, … : Détail des informations collectés

Page 15: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

15

Parc national des Cévennes

Mixer les standards

Page 16: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

16

Parc national des Cévennes

Standards en biodiversité - Taxonomie

● TaxonConcept, NCBI, ● Dbpedia…● Taxref-LD=> Jeux de données liés ouvre toutes les passerelles

http://lod-cloud.net/clouds/lod-cloud.svg

Page 17: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

17

Parc national des Cévennes

Alouette des champs

https://www.wikidata.org/wiki/Q25961http://eol.org/pages/916864

https://www.gbif.org/species/8077224

https://inpn.mnhn.fr/espece/cd_nom/3676

taxon

occurence

...

http://taxref.mnhn.fr/lod/name/3676

https://commons.wikimedia.org/wiki/File:Alauda_arvensis_2.jpg

Page 18: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

18

Parc national des Cévennes

Enrichissement : exemple taxonomique

● Utilisation de wikidata pour récupérer des médias sur les taxons

SELECT ?item ?image

WHERE { ?item wdt:P18 ?image. ?item wdt:P3186 '3676'

}

https://query.wikidata.org

Page 19: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

19

Parc national des Cévennes

Enrichissement : exemple taxonomique

● Exemple au PNC : Récupération de 6670 médias pour 4164 espèce sur 6680

https://github.com/PnX-SI/TaxHub/issues/150import_wikimedia_commons

Page 20: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

20

Parc national des Cévennes

Publication

● Publier son jeux de données en rdf => google refine● Sparql

> Requête de graph

> Attaque plusieurs jeux de données

Mon jeu de données → Taxref-LD → Dbpedia → UICN

Page 21: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

21

Parc national des Cévennes

Comment contribuer ?

● Microdata :> Insérer du sémantique dans les pages web

● Publier ses jeux de données> En RDF Darwin-SW avec Taref-LD

Page 22: Données ouvertes et biodiversité - GeoNature · Vers des données liées Utilisation de standards : > parler le même langage > profiter de la réflexion de la communauté > favoriser

22

Parc national des Cévennes

Conclusion

● Open data : > Il n’y a pas de petite contribution

> Nouveau usage

● LOD : > Pratique pour l’enrichissement de données

> Publication des données. Qui ?