Upload
ingwaz-lederer
View
115
Download
0
Embed Size (px)
Citation preview
Arbeitsstand und Arbeitsbedarf Bibliotheken
Arbeitsstand und Arbeitsbedarf Bibliotheken
Universitätsbibliothek
2
Arbeitsstand bezüglich…
• Datenlage
• CIDOC-CRM und FRBRoo
• Architektur und Infrastruktur
• Ausblick
Universitätsbibliothek
3 Universitätsbibliothek
Datenlage
• Keine echten Daten: Einbindung von Open Library Data
• Weg: MODS-Mapping + Konvertierung (Erstellung von Werkzeugen)
• Quellen:
Universitäts- und Stadtbibliothek Köln, British National Bibliography der British Library, Daten der UB Dortmund aus SwetsWise Journal Content, Katalogdaten von KOBV und BVB: B3Kat, Literaturdaten aus dem Gela-Projekt
• Veröffentlichung der Ergebnisse:
Lins, Maike; Becker, Hans-Georg: Open Data und Linked Data in einem Informationssystem für die Archäologie. In: Handbuch Linked Open Library Data / Pohl, Adrian; Danowski, Patrick [Hrsg.]. DeGruyter: 2012. (Hybride Publikation)
4 Universitätsbibliothek
CIDOC-CRM und FRBRoo
• Repräsentation der bibliographischen Metadaten mittels FRBRoo Arbeit abgeschlossen
• Veröffentlichung der Ergebnisse:
Becker, Hans-Georg: FRBR, Serials und CIDOC CRM - Modellierung von fortlaufenden Sammelwerken unter Verwendung von FRBRoo. In: Handbuch Linked Open Library Data / Pohl, Adrian; Danowski, Patrick [Hrsg.]. DeGruyter: 2012. (Hybride Publikation)
• Weiterentwicklung Konvertierungswerkzeuge parallele Verarbeitung: Konvertierung von 1,3 Millionen MODS-Datensätzen nach FRBRoo-RDF: < 3 Min. Ergebnis: 90 Millionen Tripel
5 Universitätsbibliothek
CIDOC-CRM und FRBRoo
• CRM-Export der Ripacandida-Daten:
Werkzeuge: STELLAR-Projekt der University of Glamorgan
• Anpassung:
Verkürzung der CRM-Pfade
Verbindung zu anderen Ontologien
(z. B. LIDO; ähnliches Verfahren bei FRBRoo-RDF mit RDA-Vokabular)
6
Architektur / Infrastruktur
• Bisher:Daten MODS Indexierung in Solr/Lucene nutzbar in Web-Anwendung (Django): Derzeit 26.989 Metadaten-Dokumente
• Neue Möglichkeit: Linked Media Framework
Universitätsbibliothek
7
Architektur / Infrastruktur
Linked Media Framework:
• Open Source• Speicherung von RDF-Daten in Tripeln: z.B. via cURL• Indexierung in Solr/Lucene mit geeigneter Abfragesprache:
Indexierung nach konfigurierbaren LDPath-DokumentenBsp.:
@prefix hg : <http://www.holygoat.co.uk/owl/redwood/0.1/tags/> ; title = rdfs:label :: xsd:string ; summary = rdfs:comment :: lmf:text ; tag = hg:taggedWithTag / hg:name :: xsd:string ; type = rdf:type :: xsd:anyURI ;
• Verwendete Technologien:PostgreSQL, Apache Tomcat, Solr/Lucene, Apache Stanbol, LDPath, SPARQL…
Universitätsbibliothek
8
Architektur / Infrastruktur
• Prototypische Instanz: http://lxsisis2.ub.tu-dortmund.de:8082/ArcheoInf/
• Daten: BNB, USB Köln, Swets, Projekt Gela, Funddaten Ripacandida;2.626.753 Tripel in 54.943 Dokumenten
• Sichtbarmachen der Suchergebnisse:Servlet: Kapselung der Solr/Lucene-Zugriffe, Umwandlung XML HTML per XSLT
• Prototypische Instanz: http://129.217.132.132:9000/search/?q=*%3A*
Universitätsbibliothek
9 Universitätsbibliothek
10
Ausblick/ Geplante Arbeitsschritte
Thesaurus:Thesaurus-Mapper:Umwandlung der Erschließungselemente aus Ripacandida-Funddaten in Thesaurus
Mapping zum ArcheoInf-Thesaurus
Technischer ArcheoInf-Thesaurus:Mapping der Thesaurus-Klassen auf Metadatenformat diese Anbindung wurde bisher
nicht thematisiert
Universitätsbibliothek
11
Ausblick/ Geplante Arbeitsschritte
Abstimmungsbedarf: Integration der Literatursuche in die Oberfläche des PrototypenZusammenarbeit mit DAI/ IANUS? PlenumAnschluss Forschungsdaten – bibliographische Daten
Universitätsbibliothek