Upload
stefan-dietze
View
68
Download
0
Embed Size (px)
Citation preview
Linked Data für die semantische
Integration von VRE Daten
Stefan Dietze
L3S Research Center
- Herder Institut, 18.3.2015 -
18/03/15 1 Stefan Dietze
Aktuelle Anwendungsschwerpunkte
Anwendungs- & Forschungsdaten Architektur/Cultural Heritage
DURAARK und verwandte Initiativen
Daten für Bildung und Bildungsforschung:
W3C Community Group on Linked Open Education
LinkedUp / Data Catalog
Research areas
Web science, Information Retrieval, Semantic Web & Linked Data, data & knowledge integration
Anwendungsdomänen: TEL/Education, Web archiving, scientific data management
Einige Projekte
Introduction
http://www.l3s.de/
18/03/15 2
See also: http://purl.org/dietze
Stefan Dietze
Google Knowledge Graph
Strukturiertes Faktenwissen aus z.B. DBpedia, Freebase etc.
Repräsentiert im standardisierten, maschinen-lesbaren Format „RDF“ (Resource Description Framework)
dbp:United_States
http://dbpedia.org/resource/Cambridge_MA
dbp:W3C
country
cityOf
dbp:MIT
ru.dbp:Кембридж_(Массачусетс)
sameAs
headquarterOf
Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”
18/03/15 4 Stefan Dietze
Semantic Web/Linked Data
Gesamtheit “aller” RDF Datasets
Linked Data Prinzipien: RDF, SPARQL und URIs
Linked Data Cloud: vernetzter Graph aus offenen Web Daten (500+ Datasets and 100 Mrd RDF Statements)
dbp:United_States
http://dbpedia.org/resource/Cambridge_MA
dbp:W3C
country
cityOf
schema:City
typeOf
dbp:MIT
ru.dbp:Кембридж_(Массачусетс)
sameAs
headquarterOf
Semantic Web/Linked Data: Beispiel “Google Knowledge Graph”
18/03/15 5 Stefan Dietze
geonames:4931972
sameAs
Linked Data für Architektur/Cultural Heritage?
18/03/15 Stefan Dietze 6
RDF Vokabulare
Kontext/Hintergrundwissen:
Geodaten und Geokontext
Historie
Statistische Daten etc
Gadiraju, U., Kawase, R., Dietze, S., Extracting
Architectural Patterns from Web data, in Proceedings of
13th International Semantic Web Conference (ISWC2014),
Riva Del Garda, Italy, October 2014 [ Best ISWC2014
Poster Award ]
DURAARK Consortium
18/03/15 Stefan Dietze 7
http://www.duraark.eu
Goals
Semantische Anreicherung und Archivierung von Architekturdaten (3D Models, Metadata, relevante Web Daten/Linked Data)
“DURAARK: Durable Architectural Knowledge”in a
Herausforderungen
Diverse Stakeholder: Architekten, Cultural Heritage Experten/Forscher, Urban Planner
Diverse und “evolving” Daten: low-level Point Clouds & Legacy 3D Modelle, Building Information Models (BIM), abstraktere semantische Informationen & Vokabulare
Komplexe Kontextinformation zu: Infrastruktur, Historie, gesetzlichen Rahmenbedingungen, Umwelt, etc
Automatisierte “Semantische Anreicherung” von Architekturwissen: (Linked) Web Data zur Anreicherung, Verlinkung, Disambiguierung
Archivierung und temporale Analyse
Building Data Web Data and Vocabularies
“DURAARK: Durable Architectural Knowledge”in a
18/03/15 Stefan Dietze 8
DURAARK Ergebnisse: Daten & Interface
“DURAARK Workbench”
18/03/15 Stefan Dietze 9
“Semantic Digital Archive” (analog zu WissKI/Graph Database)
RDF Vokabulare (BuildM, IFCM etc)
“BuildM Schema”: RDF Vokabular (ähnlich CHML), aligned mit schema.org, FOAF, DBpedia ontology, Geonames
http://data.duraark.eu/sparql
http://data.duraark.eu/vocab/buildm
http://workbench.duraark.eu
DURAARK Ergebnisse: Methoden, Tools, Komponentenutshell
18/03/15 Stefan Dietze 10
Geometric Enrichment: Detection von Shapes und Structures
Point Clouds/CAD => IFC
Semantic Enrichment Methoden
Focused Crawling von Linked Data
Langzeitarchivierung
LinkedUp-Herausforderung: Suche nach Daten
Stefan Dietze 18/03/15
? ? ?
Domäne/Disziplin: Welche Datasets/Ressourcen nützlich für Thema XY (z.B. „Astronomy“) ?
Ressourcen Typen: Welche Datasets beinhalten statistische Daten, bibliogr. Ressourcen, AV Material, Publikationen?
Links: Welche Datasets/Ressourcen sind ähnlich?
Qualität: Aktualität, Dynamik, Erreichbarkeit, Korrektheit
11
http://www.linkedup-project.eu/
“LinkedUp Catalog”: Daten für Bildung & Bildungsforschung
Automatische Extraktion von Dataset Metadata
[WebSci2013, ESWC2013, ESWC2014]
Stefan Dietze 18/03/15 12
Dataset
Catalog/Registry
Kuratierung existierender Datasets (z.B. OER, bibliographische Daten, University Data)
Veröffentlichung neuer Linked Datasets mit Content Anbietern (z.B. Elsevier, ACM, SoLAR)
http://data.linkededucation.org/linkedup/catalog/
LinkedUp Catalog: umfangreichste Zusammenstellung von LD/Open Data für Bildung und Bildungsforschung (ca. 50 Datasets)
Automatisierte Anreicherung mit Hintergrundwissen & Links
The LinkedUp Data Catalogue: A Meta-Dataset of Linked
Datasets in the Education Domain, d'Aquin, M., Adamou, A.,
Dietze, S., Fetahu, B., Semantic Web Journal, under review.
.
LinkedUp Catalog: Federated Search, Automatische Annotationen in a nutshell
“Federated Queries” durch Schema Mappings
Automatisierte Kategorisierung & Metadaten („Topics“)
Stefan Dietze 18/03/15 13
http://data.linkededucation.org/linkedup/catalog/
Topics: DBpedia Kategorien
Beispiel “LAK Dataset”
Forschungsressourcen in Kooperation mit
Linked Data Corpus aller relevanten „Learning Analytics“ und „Educational Data Mining“ Publikationen (5 Jahre, relevante Journals & Konferenzen, ca. 800 Publikationen)
Metadaten und Voll-Text als Linked Data (direkte Verlinkung mit Forschungsdaten in Arbeit)
Genutzt in Vielzahl von Anwendungen; LAK Data Challenge: http://lak.linkededucation.org
Facilitating Scientometrics in Learning Analytics and Educational
Data Mining - the LAK Dataset, Taibi, D., Dietze, S., D’Aquin,
Semantic Web Journal (accepted with minor revisions), 2014.
Proceedings of the LAK Data Challenge 2014, held at the 4th
Conference on Learning Analytics and Knowledge (LAK2014), Eds.:
Drachsler, H., Dietze, S., d’Aquin, M., Herder, E., Taibi, D.,, CEUR
Workshop Proceedings, Vol. 1137, 2014.
18/03/15 Stefan Dietze
Journals &
conference
proceedings
RDF
„5-Star“ Linked Data
14
Zusammenfassung: Linked Data & VRE’s in a nutshell
Zusammenfassung
Linked Data/Semantic Web für Datenrepräsentation und Nutzung in VREs
Zahlreiche verwandte Tools (Text Mining, NER etc),
(Verlinkte) Vokabulare und Datasets, speziell für Forschungsinformationen und Domänenwissen
Beispiele: DURAARK Semantic Digital Archive (SDA), LAK Dataset, LinkedUp Data Catalog
Relevante Links – Linked Data in Architecture
DURAARK => http://duraark.eu
W3C Community Group on Linked Building Data => https://www.w3.org/community/lbd/
DURAARK „SDA“ => http://data.duraark.eu/sparql
Relevante Links – Linked Data (allgemein, Forschungsdaten/Bildung)
LinkedUp Data Catalog => http://data.linkededucation.org/linkedup/catalog/
W3C Community Group on Linked Data in Eductaion => https://www.w3.org/community/opened/
18/03/15 Stefan Dietze 15
16 Stefan Dietze 18/03/15
Vielen Dank für Ihre Aufmerksamkeit!
Weitere Links
http://purl.org/dietze
http://www.l3s.de
http://data.l3s.de