View
1.238
Download
0
Category
Preview:
DESCRIPTION
Voici ma présentation pour la journée des doctorants de l'école doctorale ED MSTIC à l'Université Paris-Est Marne-la-Vallée. Elle présente le sujet de la qualité de données géographiques collaboratives (plus connu comme Volunteered Geographic Information). Je présente quelques extrait de mon état de l'art dans le cadre de ma première année de thèse à l'Institut Géographique National (IGN-France).
Citation preview
Qualité des données géographiques collaboratives
Thèse : un modèle d'opérations réconciliables pour l'acquisition distribuée de données géographiques
Carmen BrandoDirectrice : Bénédicte Bucher
Journée des doctorants ED MSTIC 2010Université Paris-Est Marne-la-Vallée
10 Juin
Institut Géographique National (IGN), FranceLaboratoire COGIT
1© IGN - 2010
© IGN - 2010(O’Reilly, 2007)Contenu généré par les utilisateurs
© IGN - 2010
Volunteered Geographic Information (VGI) : (Michael Goodchild, 2007)© IGN - 2010
Création de contenu spatial
Flickr
Wikipédia
Géolocalisation
5© IGN - 2010
Edition d’instances géographiques
Problématique
6© IGN - 2010 Généré par : http://www.wordle.net
Plan
• Qualité• du contenu généré par les utilisateurs (CGU)• du contenu spatial (CS)• des données géographiques collaboratives (DGC)
• Approche proposée• Conclusion et perspectives
7© IGN - 2010
Qualité du contenu généré par les utilisateurs (CGU) : Définition
• est associée à• si le contenu est utile ou pas aux besoins des utilisateurs :
fitness for use• confiance des utilisateurs au contenu : autorité du
fournisseur• Wikipédia : le meilleur exemple, mais…
• question de qualité : les utilisateurs sont anonymes• Wikis: l’édition de contenu est facile et rapide• Des éditeurs collaboratifs plus avancés assurent la cohérence
du contenu par la réconciliation des opérations concurrents• Ex : Google Wave
8© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
• Pendant l’édition : cohérence interne et citation des sources externes
Qualité du contenu généré par les utilisateurs (CGU) : comment l’améliorer ?
9© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Qualité du contenu généré par les utilisateurs (CGU) : comment l’améliorer ?
Résolution manuelle des conflits
10© IGN - 2010
Après l’édition : Détection de conflits / Réconciliation
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Qualité du contenu spatial (CS) : Définition
11
Monde réel
Représentation idéale (terrain nominal)
Spécifications*
© IGN - 2010
* La superficie des bâtiments est plus grande que 20m2
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Qualité du contenu spatial (CS) : Définition
BD TOPO ® - IGN
La connaissance associée à comment le monde est observé et comment il est modélisé dans la base de données
12
Spécifications des fournisseurs de données géographiques
© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Qualité du contenu spatial (CS) : Définition
13
Monde réel
Représentationidéale (terrain nominal)
Données produites +Métadonnées (Spécifications + Critères d’erreur)
Qualitéinterne
Spécifications*
Processus de production : erreurs**
Qualitéexterne
Données requise par les utilisateurs
* La superficie des bâtiments est plus grande que 20m2** Il y a eu des erreurs de saisie ou la réalité a évoluée
© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Qualité des données géographiques collaboratives (DGC)
• DGC pour actualiser les bases de données (BD) des fournisseurs de DG au travers d’alertes
• OpenStreet Map, influence importante sur comment le contenu spatial est produit et actualisé
• Puis après, DGC pour complémenter les BD des fournisseurs de DG en permettant l’édition de contenu (en plus des alertes)
(Budhathoki, 2008) (Elwood, 2008) (Antoniou, 2009)14
© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée : Spécifications pour les DGC ?
• Celles sont appropriées pour les fournisseurs de DG comme l’IGN
• et les néogéographes seront peu enthousiastes à travailler avec des spécifications…
15© IGN - 2010
© Scott Adams
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée : Spécifications pour les DGC ?
• Groupes d’intérêts spéciaux (Coote, 2008) ont• des besoins plus forts sur la qualité des données• des limitations de budget pour collecter, rédiger et
actualiser les spécifications• Un manque d’expertise sur des techniques de
modélisation pour assurer la cohérence de ces données• un intérêt d’accepter quelques règles pendant la
contribution
16
Yes We Can
© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée : Spécifications pour les DGC ?
Charte de directives
Tags ReferenceUsage standard des étiquettes
17© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée : Spécifications pour les DGC ?
• Ceci est fait par Keep Right!
http://keepright.ipax.at• Des contraintes d’intégrité prédéfinies sont vérifiées sur des données OSM
18© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée : Spécifications pour les DGC
• Assister les utilisateurs à la saisie des spécifications
• Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés :• Pour évaluer des contraintes d’intégrité• Pour réconcilier des éditions simultanées
19© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée : Saisie des spécifications
Taxonomie Géographique et schéma de
donnéesIGN
Catégories et infobox
Wikipédia
Saisie du schéma
Cecilia© Jorge Cham
Recherche dans un thesaurus (ex : WordNet Français)
Ex : eau, cours d’eau, fleuve, branche, ruisselet
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
liaison
Autorité
Enrichissementsémantique
Ex : création de la classe ruisseau
Approche proposée : Spécifications pour les DGC
• Assister les utilisateurs à la saisie des spécifications
• Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés :• Pour évaluer des contraintes d’intégrité• Pour réconcilier des éditions simultanées
21© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée :Contraintes d’intégrités
• Manque de cohérence géométrique entre le réseau hydrographique et les limites administratives
• Une contrainte d’intégrité indiquant la relation entre les deux les deux types pour assurer le partage de la géométrie
• Possible réparation: placer la limite administrative au milieu du fleuve
Données OpenStreetMap autour de Grenoble(Decembre 2009)
22© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée : Spécifications pour les DGC
• Assister les utilisateurs à la saisie des spécifications
• Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés :• Pour évaluer des contraintes d’intégrité• Pour réconcilier des éditions simultanées
23© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Approche proposée :Mécanisme de réconciliation
24
Tajel© Jorge Cham
© IGN - 2010
Cecilia© Jorge Cham
Changer le nom à ‘Avenue Bollée’
Ajouter un tronçon de route à ‘Rue de Paris’
Rue de Paris
??Spécification DGC :
« l’attribut nom d’une route est Independent de la géométrie »
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
Avenue Bollée
Conclusion & Perspectives
• Les données géographique collaboratives font référence à un nouveau paradigme pour produire du contenu spatial
• Une approche qui réconcilie la richesse de données géographiques collaboratives avec les exigences de qualité d’un fournisseur de données
• Tester cet approche dans la plateforme GeOxygene : http://oxygene-project.sourceforge.net
25© IGN - 2010
Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives
26© IGN - 2010
Merci de votre attention
Recommended