27
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David OA-Netzwerk - semantische Anreicherung und Vernetzung von wissenschaftlichen OA-Inhalten

Oan wisskom2012

Embed Size (px)

Citation preview

Page 1: Oan wisskom2012

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

OA-Netzwerk - semantische Anreicherung undVernetzung von wissenschaftlichen OA-Inhalten

Page 2: Oan wisskom2012

Initiiert durch Gefördert durch

Projektpartner

Page 3: Oan wisskom2012

Ziele

Förderung der Sichtbarkeit deutscher Repositorieninhalte (textbasierte)

Nationaler Aggregationsknoten (Infrastrukturaufbau)

Förderung des „DINI-Zertifikat für Dokumenten- und Publikationsservices“

Stärkung des Kooperationsnetzes aus OA-Projekten

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Page 4: Oan wisskom2012

Herausforderungen

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Steigerung der Anzahl DINI-zertifizierter Repositorien

Heterogenität der Metadaten (teilweise trotz DINI-Zertifikats)

Trainingsdaten für DDC-Klassifikation

flaches Metadatenformat Dublin Core

Page 5: Oan wisskom2012

Aktueller Schwerpunkt

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

semantische Anreicherung der Metadaten

Vernetzung mit externen Datenquellen im Sinne des Linked Data

Aggregation von Enhanced Publications

Page 6: Oan wisskom2012
Page 7: Oan wisskom2012
Page 8: Oan wisskom2012

Beispiel: Vernetzung mit der DNB ohne Personenidentifikator

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

1. Erzeugung eines RDF-Dumps mithilfe des D2R-Servers

2. Verwendung des DNB RDF-Dumps als externe Datenquelle

3. Einsatz des Kontextualisierungstools „SILK“

4. Nutzung des Vor- und Nachnamens als Matching-Kriterium

→ Erzeugung von 80.000 owl:sameAs Links von OAN zur DNB

Page 9: Oan wisskom2012

Beispiel: Vernetzung mit der DNB ohne Personenidentifikator

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Ergebnis: Personennamen-Matching nicht ausreichend

5. zusätzliches Titeldaten-Matching (2nd Level Comparison)

→ knapp 18.000 verifizierte Links jedoch auch jetzt keine 100% Bestätigung

Optional: weitere Felder in die Verifizierung einbeziehen

Page 10: Oan wisskom2012
Page 11: Oan wisskom2012
Page 12: Oan wisskom2012
Page 13: Oan wisskom2012
Page 14: Oan wisskom2012
Page 15: Oan wisskom2012
Page 16: Oan wisskom2012
Page 17: Oan wisskom2012
Page 18: Oan wisskom2012

Ergebnisse

Ausführliche Informationen und Ratgeber für angehende Repositorienbetreiber

Infrastruktur für Aggregationsknoten (Open Source)

Mehrwertdienste für Wissenschaftler (Rechercheplattform)

Mehrwertdienste für OA-Institutionen (Validator)

Offener Datenpool für Entwickler/OA-Projekte (REST-API, LOD)

Technische Dienste für spezifische Problemfelder (Metadatenanreicherung, Metadatengenerierung, semantische Vernetzung)

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Page 19: Oan wisskom2012

Zahlen, bitte!

Page 20: Oan wisskom2012

OAN-Datenraum

41 DINI-zertifizierte Repositorien

268.000 Datensätze

Volltextsuche über 160.000 OA-Publikationen

~ 35% des nationalen Datenraums (OAI-PMH) (basierend auf „2012 Census of Open Access Repositories in Germany“)

voraussichtliche Verdopplung des Datenraums bis zum Jahresende

Page 21: Oan wisskom2012
Page 22: Oan wisskom2012
Page 23: Oan wisskom2012
Page 24: Oan wisskom2012
Page 25: Oan wisskom2012
Page 26: Oan wisskom2012

Ausblick

Ausweitung des Datenraums

Sammeln von Kontextdaten zu Compound Objects

Identifikatoren für Autoren

Anbindung an höhere Datenquellen (Europeana, DDB, Bibliotheksverbünde)

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Page 27: Oan wisskom2012

Vielen Dank für die Aufmerksamkeit!

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David