21
SKOS - Thesaurus Management System für kontrolliertes Vokabular Martin Schiegl OGD Konferenz, Wien 2011

Martin Schiegl - Thesaurus-Management und INSPIRE

Embed Size (px)

DESCRIPTION

Die Richtlinie INSPIRE (2007/2/EG) des Europäischen Parlaments und des Rates vom 14. März 2007 definiert die Schaffung einer Geodateninfrastruktur in der EU. Sie verpflichtet die Mitgliedsstaaten ihre bereits vorhandenen Geodatensätze und -dienste stufenweise interoperabel verfügbar zu machen. Damit soll die Entscheidungsfindung in Bezug auf politische Konzepte und Maßnahmen, die direkte oder indirekte Auswirkungen auf die Umwelt haben können, unterstützt werden. Die Geologische Bundesanstalt (GBA) ist als Institution des öffentlichen Sektors in den Themenbereich Geologie eingebunden. Ob und in welcher Form weitere der 34 Annexthemen – z. B. Mineralische Bodenschätze oder Gebiete mit naturbedingten Risiken – betroffen sind, muß noch geklärt werden. Das daraus folgende österreichische Geodaten-Infrastrukturgesetz (GeoDIG 2010) hat weitreichende Auswirkungen auf die Geologische Bundesanstalt und eröffnet gleichzeitig die Chance, an den neuesten europäischen und internationalen Entwicklungen bezüglich Harmonisierung, Standardisierung und Interoperabilität von Geodaten und Geodateninfrastrukturen teilzuhaben. Das bedeutet für die GBA auch, daß sie als Wissensorganisation für den Umgang mit Geodaten ein solideres Fundament schaffen muß. Geodaten, egal ob als GIS-Datensätze oder als Webservice sind heute als eigenständige Produkte mit spezifischer Anwendung und Kundenkreis zu verstehen, und ergänzen die traditionellen Kartendarstellungen. Rein textlich beschreibende Informationen, wie auf geologischen Karten werden erst in Kombination mit ihrer Namens- und Begriffsbildung für Geodatensätze verwendbar. Deshalb ist eine gemeinsame Wissensmodellierung mit internationalen Standards wie z.B. GeoSciML oder INSPIRE-Datenspezifikation notwendig. Mit einem gemeinsamen Begriffskonzept können in weiterer Folge auch alle Geodaten an der GBA strukturiert und vernetzt werden und interoperabel allen internen bzw. externen Usern zugänglich gemacht werden. Für diese „Datenharmonisierung“ sowie für den damit verbundenen Transfer von personengebundenem, fragmentiertem Wissen in explizites und damit kollektives Wissen der Organisation, wurde ein Thesaurus-Management-System zur Wissenrepräsentation angeschafft. Die Funktionen, die das Thesaurus-Management-System erfüllen soll, beinhalten den Aufbau eines kontrollierten Vokabulars (Namensräume zur Datenharmonisierung), und die Schaffung einer Art von Wissensdatenbank (auch Objektklassen und Datenkonzeptionen, mehrsprachige Definitionen). Durch den zukünftigen Einsatz semantischer Technologien stellt sich die GBA auch neuen Herausforderungen bei wissens- und kommunikationsintensiven Arbeitsprozessen, Retrieval-Prozessen oder auch Vernetzungs- und Integrationsvorgängen. Ein wichtiges Kriterium bei der Auswahl der Software war immer auch die Schaffung von Schnittstellen zur Vernetzung, Abfrage, und Kommunikation (z.B. RDF, SQL, ArcGIS, HTML). Die Herausforderungen bei der Umsetzung liegen einerseits im Bereich der technischen Implementation und in den Prozeßabläufen der Meinungsbildung auf Organisationsebene und andererseits bei der Entwicklung einer Strategie für Akzeptanz und langfristigen Erfolg.

Citation preview

Page 1: Martin Schiegl - Thesaurus-Management und INSPIRE

SKOS - Thesaurus Management System für kontrolliertes VokabularMartin Schiegl

OGD Konferenz, Wien 2011

Page 2: Martin Schiegl - Thesaurus-Management und INSPIRE

•kontrollierte Vokabulare verwalten•Thesaurus-Management-System

PoolParty•Semantic-Web-Funktionen•mehrsprachige Thesauri und kontrollierte Vokabulare• semantische Harmonisierung von Geodaten•Daten-Spezifikationen INSPIRE

OGD Konferenz, Wien 2011

Page 3: Martin Schiegl - Thesaurus-Management und INSPIRE

EU-Direktive INSPIRE, GeoDIG

OGD Konferenz, Wien 2011

•Metadaten•Interoperabilität von Geodaten-sätzen, -diensten•Netzdienste (Such-, Darstell. usw.)•Gemeins. Nutzung Daten/Service, Monitoring, Reporting

Annex III1 Statistische Einheiten2 Gebäude3 Boden4 Bodennutzung5 Gesundheit und Sicherheit6 Versorgungswirtschaft und staatliche Dienste7 Umweltüberwachung8 Produktions- und Industrieanlagen9 Landwirtschaftliche Anlagen und Aquakulturanlagen10 Verteilung der Bevölkerung — Demografie11 Bewirtschaftungsgebiete/Schutzgebiete/geregelte Gebiete und Berichterstattungseinheiten

12 Gebiete mit naturbedingten Risiken13 Atmosphärische Bedingungen14 Meteorologisch-geografische Kennwerte15 Ozeanografisch-geografische Kennwerte16 Meeresregionen17 Biogeografische Regionen18 Lebensräume und Biotope19 Verteilung der Arten20 Energiequellen

21 Mineral. Bodenschätze

Annex I1 Koordinatenreferenzsysteme2 Geografische Gittersysteme3 Geografische Bezeichnungen4 Verwaltungseinheiten5 Adressen6 Flurstücke/Grundstücke7 Verkehrsnetze8 Gewässernetz9 Schutzgebiete

Annex II1 Höhe2 Bodenbedeckung3 Orthofotografie

4 Geologie

Page 4: Martin Schiegl - Thesaurus-Management und INSPIRE

Motivation•Wissensmanagement auf Organisationsebene• INSPIRE semantische Datenharmonisierung•Erleichterung der praktische Arbeit mit Vokabularen•Sprachbarrieren ausräumen•Strukturbereinigung bei Client-Anwendungen•Geologen und Fachexperten motivieren

OGD Konferenz, Wien 2011

Page 5: Martin Schiegl - Thesaurus-Management und INSPIRE

semantic web• semantische Konzepte und Literale (Thesaurus, mehr

als eine Wortliste)•Speicherung in SKOS / RDF-Tripeln•veröffentlicht als Open Data im Web•Queries in SPARQL• linked data• identifiziert durch URIs

OGD Konferenz, Wien 2011

Page 6: Martin Schiegl - Thesaurus-Management und INSPIRE

Linked Open Data (Tim Berners-Lee)

★ Daten im Web verfügbar machen ★★ Daten strukturieren

★★★ keine proprietäre Formate★★★★ URL’s zur Identifizierung der Konzepte ★★★★★ eigene Daten mit fremden Daten

im Kontext verknüpfen

siehe -> http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/

OGD Konferenz, Wien 2011

Page 7: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Page 8: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Page 9: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Page 10: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Page 11: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Page 12: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Page 13: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Page 14: Martin Schiegl - Thesaurus-Management und INSPIRE

Thesaurus Applikationen•Website (HTML-, and WIKI-view)•SQL-export, aller Konzepte ID‘s und Definitionen für

ArcGIS

geplant•Beschlagwortung für CMS Suche•use cases for linked data (programmable web)

Page 15: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

wiki-view

Page 16: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

html-frontendhttp://resource.geolba.ac.at/lithology/48.html

Page 17: Martin Schiegl - Thesaurus-Management und INSPIRE

Struktur der kontrollierten VokabulareProjekte, Concept schemes (Mikrothesauri) und Top concepts

OGD Konferenz, Wien 2011

Geologische EinheitenLithostratigraphsche Einheiten (österr. Strat. Tabelle 2004)Lithodemische Einheiten (aus geologischen Karten)Lithogenetische Einheiten (aus geologischen Karten)

Tektonische EinheitenKlassifikation der lithotektonischen Einheiten Lithotektonische Einheiten (Deckensysteme)

Geologische Zeitskala ICS Int.Strat.Chart 2009 (Phanerozoic, Precambrian)Paratethys System (Paratethys - Badenium, Dacium, Egerium, etc.)Informelle Begriffe (Regionale Begriffe)

LithologieLithologie Thesaurus (Composite genesis, kristallines und sediment. Material)

CGI_Vocabulary 201012CGI_SimpleLithology, etc.

geplante Projekte: mineralische Rohstoffe, Naturgefahren

Page 18: Martin Schiegl - Thesaurus-Management und INSPIRE

OGD Konferenz, Wien 2011

Datenharmonisierung

strukturelleHarmonisierung

semantischeHarmonisierung

Page 19: Martin Schiegl - Thesaurus-Management und INSPIRE

Workflowthesaurus

editorial team

linking concepts

publish concepts

use concepts

generate new concepts

OGD Konferenz, Wien 2011

Zusammenhängedefinieren

verfügbar machenAuswahllisten für KartierungDatenharmonisierungBeschlagwortung CMSusw.

neue Konzepte,URI‘s undDefinitionen

Akzeptanz innerhalb derCommunity

Page 20: Martin Schiegl - Thesaurus-Management und INSPIRE

Resumee•geologische Begriffe im nationalen Kontext•Veröffentlichung mit Open Web Standards •Schnittstellen zur Vernetzung, Abfrage und

Kommunikation•Strategie für allgemeine Akzeptanz

Page 21: Martin Schiegl - Thesaurus-Management und INSPIRE

Links• GBA Thesaurus Wiki Frontend (beta)

http://resource.geolba.ac.at/PoolParty/wiki/GeologicTimeScalehttp://resource.geolba.ac.at/PoolParty/wiki/lithology

• Linked Data http://linkeddata.org/

• Dbpedia (Wikipedia) http://dbpedia.org/

• PoolParty http://poolparty.punkt.at/

• W3C SPARQL http://www.w3.org/TR/rdf sparql query/‐ ‐

• W3C SKOS http://www.w3.org/TR/skos primer/‐OGD Konferenz, Wien 2011