Upload
infoclioch
View
1.100
Download
1
Tags:
Embed Size (px)
DESCRIPTION
Présentation de Lukas Rosenthaler (Image und Media Lab, Uni. Basel): "Rete Fontium - Ein neues web-basiertes Forschungswerkzeug für die Geisteswissenschaften", présentée lors du colloque infoclio.ch à Berne le 16 septembre 2010. "Rete Fontium" ist eine Web-2.0 Plattform, welche Werkzeuge zur wissenschaftlichen Bearbeitung von Digitalisaten und digitalen Quellen anbietet. Mit dem primären Werkzeug können beliebige Bild- und Textelemente miteinander verglichen, verknüpft und mit Annotationen versehen werden. Die dadurch entstehenden vernetzten Informationen können sowohl für eigene Publikationen als auch für weitere Forschung oder für die Lehre verwendet werden. ReteFontium baut dabei auf einer erweiterten Implementation des vom World Wide Web Consortiums (W3C) für das "semantic web" vorgeschlagenen Datenmodells (Resource Description Frameworkl) auf und erlaubt damit eine flexible, Quellen-zentrierte Datenmodellierung, mit der auch Quellen anderer Datenanbieter wie z.B. e-codices etc. eingebunden werden können. Damit wird in einer neuartigen Weise eine erweiterte Nutzung von online zur Verfügung gestellten Digitalisaten für Forschung und Lehre ermöglicht."
Citation preview
Rete Fontium
1
Ein Forschungswerkzeug für digitale Quellen
System for Annotation and Linkageof
Sources in Arts and Humanities
Thursday, September 16, 2010
Rete Fontium
1
Ein Forschungswerkzeug für digitale Quellen
SALSAHSystem for Annotation and Linkage
ofSources in Arts and Humanities
Thursday, September 16, 2010
•Viele “Quellen” sind heute digital verfügbar
•keine Möglichkeiten zur Interaktion
•“nur” passive Betrachtung
Ausgangslage
2
Thursday, September 16, 2010
Unbefriedigende Situation:
•keine Möglichkeiten zur Interaktion:
- Kommentieren (Annotation)
- Verknüpfung (Linkage)
- Kollaboration
3
Digitalisate enden in “Daten-Silos”
Thursday, September 16, 2010
Was wäre notwendig?
• Werkzeug zur wissenschaftlichen Bearbeitung von Digitalisaten und digitalen Quellen
• Vernetzung von internen und externen Quellen durch “rich links”
• Annotationen von Quellen und Digitalisaten(Kommentare, Bemerkungen etc.)
• Kollaboration: sharing / Experten-WiKi
• Transkriptionshilfe
4
Thursday, September 16, 2010
Lösungsvorschlag: SALSAH• eine Rich Internet Application mit folgenden Eigenschaften:
- Web 2.5 (geht weiter als kollaborative Applikationen, da Teile des semantischen Webs unterstützt werden können[z.B. Ontologien])
- Unterstützt gleichzeitig mehrere (viele) Forschungsprojekte (☞ Synergien)
- Daten können “privat” oder gemeinsam genutzt werden (feingliedrige Rechteverwaltung für Sichtung, Annotation, Metadaten [Ändern und hinzufügen] und neue Quellen)
- Quellen können von externen “Quellen-Provider” stammen (z.B. e-codices, DDS etc.)
5
Thursday, September 16, 2010
6
Server
Data provider 3Data
provider 2
Webbrowser
Repository for digital
representations
MySQL
Extended RDF-Database
PHP/Apache
JavaScript/jQuery
HTML5
Internet
Data provider 1
Webservices
Internet
Architektur von SALSAH
Thursday, September 16, 2010
1. The Server-Side
7
Thursday, September 16, 2010
Resource Description Framework (RDF)
•Daten werden als “Triplet” aus Subjekt, Prädikat und Objekt dargestellt
8
Dieses Buch hat den Titel “Das Narrenschiff”Dieses Buch hat den Autor “Sebstian Brant”
Dieses Buch hat die Transkription narrenschiff.xml
Thursday, September 16, 2010
RDF-Informationstripel
9
http://www.fruehdrucke.ch/narrenschiff.rb hat einen Titel mit dem
Wert “Das Narrenschiff”
SubjektPrädikatObjekt
http://www.salsah.org/narrenschiff.php
Das Narrenschiff
http://www.fruehdrucke.ch/predicates/title
Sebastian Brant
http://www.salsah.org/predicates/author
http://www.salsah.org/transcription/narrenschiff.xml
http://www.salsah.org/predicates/transcription
Thursday, September 16, 2010
Der Räuber
Roman
...
ist ein
Beschreibung
Scan#12456
Seite von
74Mikrogramm-#
...Beschreibung
ROI#14377
Teil von
[24,136] [511,384]Position
...Beschreibung
Link#47121
Heilanstalt Waldau
Gemälde
Adolf WöliAutor
...
ist ein
Beschreibung
zeigt auf
Anfang 1929 begab sich Walser, der schon seit einiger Zeit von Angstzuständen und Halluzinationen geplagt wurde, nach einem geistigen Zusammenbruch ...
Beschreibung
Scan#14088
...BeschreibungScan
mikrogramme/images/highres/12456.tifPfad
woeli/images/highres/14088.tifPfad
Robert Walser Autorzeigt auf
Kompliziertes Beispiel
10
Thursday, September 16, 2010
RDF-Standardregeln•Subjekt und Prädikat müssen global
eindeutig identifiziert sein (URI)
•Objektwerte sind entweder Text oder ein Verweis auf ein Subjekt (Verknüpfung)
•RDF ist unabhängig von der Darstellungsform:- XML
- Notation3
- ...11
Thursday, September 16, 2010
Vor-/Nachteile RDF+ geeignet zur Modellierung vernetzter
Strukturen
+ grosse Flexibilität und Anpassungsfähigkeit(keine Tabellen mit vordefinierten Felder)
• keine Regeln für Metadaten (Prädikate)
- wenig Werkzeuge vorhanden
- komplexe, neue Technologie
- Objektwerte sind immer Zeichenketten
(oder Verknüpfungen als URL/URI)
12
Thursday, September 16, 2010
•RDF wäre gut, wenn es
- strukturierte Daten erlauben würde (wie z.B. Datum mit Genauigkeit, Kalender etc.)
- Mechanismen für Benutzerrechte etc. hätte
- bessere Charakterisierung digitaler Objekte (nicht nur URL)
☞ in der Praxis ist “pures” RDF nicht anwendbar!
Schlussfolgerung
13
Thursday, September 16, 2010
Lösung: Erweiterung des Konzeptes von RDF
•strukturierte Daten erlauben
•Regeln für Subjekte und Prädikate
-Subjekt-Klassen mit vordefinierten Prädikaten
- einfache Datentypen für Prädikate
•Semantische Information
14
Thursday, September 16, 2010
•Subjekt:- welche Prädikate sollte das Subjekt wie
oft haben können/dürfen/müssen(1 mal, 0 mal, 1-n mal, 0-n mal)
- sollte ein “digitales Äquilvalent” (Digitalisat) existent sein?
•Prädikat:- welchen Datentyp soll das Prädikat haben
Text/Zahl/Datum/Verknüpfung/Zeit
Regeln:
15
Thursday, September 16, 2010
Beschreibung•Beschreibung•Benennung•Datentyp“Basler Frühdruck...”
SeiteBeschreibung (Semantik)
Benennung
(Seiten-)Beschreibung•Beschreibung•Benennung•Datentyp“Eyn Narren syner Kappen...”
teil_von•Beschreibung•Benennung•Datentypbuch_#465
(Seiten-)Bezeichnung•Beschreibung•Benennung•Datentyp176 recto
Digitalisatpage_0035.tif
SeiteBeschreibung (Semantik)
Benennung
(Seiten-)Beschreibung•Beschreibung•Benennung•Datentyp“Eyn Narren syner Kappen...”
teil_von•Beschreibung•Benennung•Datentypbuch_#465
(Seiten-)Bezeichnung•Beschreibung•Benennung•Datentyp176 recto
Digitalisatpage_0035.tif
SeiteBeschreibung (Semantik)
Benennung
(Seiten-)Beschreibung•Beschreibung•Benennung•Datentyp“Eyn Narren syner Kappen...”
teil_von•Beschreibung•Benennung•Datentypbuch_#465
(Seiten-)Bezeichnung•Beschreibung•Benennung•Datentyp176 recto
Digitalisatpage_0035.tif
In SALSAH sind Regeln für Subjekte, Prädikate & Objekte möglich:
16
BuchBeschreibung (Semantik)
Benennung
Titel•Beschreibung•Benennung•Datentyp“Narrenschiff”
Beschreibung•Beschreibung•Benennung•Datentyp“Basler Frühdruck...”
SeiteBeschreibung (Semantik)
Benennung
(Seiten-)Beschreibung•Beschreibung•Benennung•Datentyp“Eyn Narren syner Kappen...”
teil_von•Beschreibung•Benennung•Datentypbuch_#465
(Seiten-)Bezeichnung•Beschreibung•Benennung•Datentyp176 recto
Digitalisatpage_0035.tif
Thursday, September 16, 2010
Implementation “Server-Side”
17
Thursday, September 16, 2010
2. The Client-Side
18
Thursday, September 16, 2010
Mögliche Varianten• installierbares Programm (wie Google-
Earth)
+schnell & effizient
- Aufwand, Installationsprobleme (WinXY, Apple, LinuxZ,...)
• Webapplikation (wie http://maps.google.com)
+keine Installation, überall Verfügbar, wo Netz
- Effizenz, Browser-Hölle19
Thursday, September 16, 2010
19
Thursday, September 16, 2010
Design-Prinzipien
•Das GUI entscheidet, ob die Applikation zu Erfolg wird oder nicht!- Der Computer soll sich den Benutzern
(=GeisteswissenschftlerInnen) und deren Arbeitsweise anpassen, und nicht umgekehrt!
- Intuitive Benutzerführung☞ bekannte Paradigmen verwenden
☞Fenster-Technik und Desktop-Metapher
20
Thursday, September 16, 2010
Merkmale der SALSAH-Oberfläche
•Fenster & Schreibtisch-Metapher im Web-Browser
- direkter Online-Vergleich verschiedener Digitalisate/Metadatensätze
•Bildbetrachter mit intuitivem Zoom & Pan
- Detailansichten etc.
•Spezielle Viewer für Verbundobjekte (z.B. Bücher)
21
Thursday, September 16, 2010
22
Thursday, September 16, 2010
Besonderheiten (“Schmanckerl”)
• Lokale digitale Bilder: JPEG2000 ohne Qualitätsverlust (“lossless compression”)
• on-the-fly Rendering als JPEG mit variabler Auflösung und Qualität
23
Thursday, September 16, 2010
•Die (☹☠☢@☤)-ten Webrowser
•schnelle Entwicklung der Technologie (instabile “Standards”)
•Mangelhafte Werkzeuge(JS, HTML5 etc.)
Probleme:
24
Thursday, September 16, 2010
Fazit: SALSAH ist• ein Werkzeug (Tool-provider, nicht Data-
provider) zur wiss. Forschung mit digitalen Quellen (annotation & linkage)
• Die Quellen können extern (oder intern) gehalten werden (Webservices [SOAP])
• Erleichtert und fördert die Kollaboration zwischen Forschenden und Forschungsprojekten
• kann in der forschungsnahen Lehre eingesetzt werden (Seminare)
25
Thursday, September 16, 2010
Projekte, die mit SALSAH arbeiten werden:
• Basler Frühdrucke (Kunsthist. Seminar Uni Basel, Prof. B. Schellewald)
• e-codices (Uni Fribourg / Stiftsbibliothek St. Gallen, Prof. C. Flüeler)
• Anton Webern Gesamtausgabe (Musikwiss. Institut Uni Basel, Prof. M. Schmidt)
• Mikrofilmarchiv des Musikwiss. Institut (Mittelalter)
• Photoarchiv der Gesellschaft für Volkskunde, Seminar für. Volkskunde/Europäische. Ethnologie (Prof. W. Leimgruber)
• Potentiell: Homer Multitext Project, Center for Hellenic Studies, Washington DC (Harvard)
26
Thursday, September 16, 2010
Thursday, September 16, 2010
The End
Thursday, September 16, 2010