17
Anwendung semantischer Technologien Aufbau einer Wissensdatenbank mittels der Thesaurus-Management- Tools PoolParty und SKOS Shuttle. Stephan Boldt & Andrea Hahn

Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

  • Upload
    vonhi

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Anwendung semantischer Technologien Aufbau einer Wissensdatenbank mittels der Thesaurus-Management-Tools PoolParty und SKOS Shuttle.

Stephan Boldt & Andrea Hahn

Page 2: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 2/17 Anwendung semantischer Technologien

Inhaltsverzeichnis1 Motivation 4

2 Zielsetzung 6

3 Umsetzung 7

3.1 Aufbereitung und Erweiterung der bisherigen Basisdaten (Schlüsselworte) 7

3.2 Erstellung einer Stoppwortliste (Allgemein) 9

3.3 Erstellung einer Stoppwortliste (Metadaten) 9

3.4 Erstellung einer Metadatenliste 10

4 Vergleich der Thesaurus-Management-Tools 13

4.1 Import- Exportfunktion 13

4.2 Usability 14

4.3 Performanz 16

4.4 Fehleranfälligkeit 16

4.5 Support 17

5 Abschlussbetrachtung 17

Page 3: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 3/17 Anwendung semantischer Technologien

Abbildungsverzeichnis

Abbildung 1 Excel-Import in PoolParty (Auszug) 8 Abbildung 2 Baumstruktur der Schlüsselwortlisten in PoolParty 8 Abbildung 3 Übersicht der Stoppwortlisten in PoolParty 9 Abbildung 4 Übersicht der Stoppwortlisten in SKOS Shuttle 9 Abbildung 5 Übersicht Metadatenliste in PoolParty 10 Abbildung 6 Auszug Metadatenliste in SKOS Shuttle 11 Abbildung 7 Synonyme für Metadatum Anzahl der zugewiesenen ECTS Credits in PoolParty 11 Abbildung 8 Beschreibung für Metadatum Anzahl der zugewiesenen ECTS Credits in PoolParty 12 Abbildung 9 Synonyme für Metadatum Anzahl der zugewiesenen ECTS Credits in SKOS Shuttle 12 Abbildung 10 Beschreibung für Metadatum Anzahl der zugewiesenen ECTS Credits in SKOS Shuttle 12 Abbildung 11 Importfunktion in PoolParty 13 Abbildung 12 Importfunktion in SKOS Shuttle 13 Abbildung 13 Weboberfläche eines Projektes in PoolParty 14 Abbildung 14 Weboberfläche des Projektes in SKOS Shuttle 15 Abbildung 15 Warnhinweis Ladezeit in SKOS Shuttle 16

Page 4: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 4/17 Anwendung semantischer Technologien

1 Motivation Bereits heute ist es möglich, sich über bereitgestellte Internetpräsenzen der jeweiligen Hochschulen,

Informationen zu den dort angebotenen Studiengängen einzuholen. Verwendete Content-Management-

Systeme (CMS) der jeweiligen Hochschulen entscheiden hierbei oftmals über die Art und Aufbereitung

der abrufbaren Informationen. Eine einheitliche Darreichungsform der Informationen konnte sich mit

Blick auf Hochschulen in Deutschland und dem Europäischen Wirtschaftsraum bis heute nicht

durchsetzen. So gibt es derzeit verschiedene Ansätze, wie die Bereitstellung der Informationen zu

einzelnen Studiengängen an den einzelnen Hochschulen erfolgt. Etablierte Darreichungsformen sind

hierbei die Verwendung reiner Onlinekataloge für die jeweiligen Studiengänge, sowie einzelne

Modulkataloge, bei denen es vereinzelt möglich ist, die sichtbaren Informationen jeweils als PDF-

generierte Dokumente lokal auf dem eigenen Rechner abzuspeichern. Eine weitere etablierte Art der

Darreichungsform stellt seitens der Hochschulen, die reine Bereitstellung der Informationen zu

Studiengängen und Modulkatalogen gebündelt als reines PDF-Dokument dar, bei dem sämtliche Module

eines Studiengangs aufgeführt werden.

Verschiedene Informationsportale im Internet tragen diese inhaltlichen Informationen der Hochschulen

zusammen und ermöglichen es interessierten, angehenden Studenten, mittels verschiedener Filter, eine

Vorauswahl hinsichtlich verschiedener Kriterien wie Wahl des Bundeslandes, Verfügbarkeit von Bachelor

und Master Studiengängen am gleichen Standort etc. zu treffen. Die Filterung der verschiedenen

Studiengänge anhand möglicher Tätigkeitsfelder nach erfolgreichem Abschluss des Studiums, oder der

Einordnung eines Studiengangs einem bestimmten Fachrichtungsschwerpunkt, ist nach heutiger

Betrachtung der verschiedenen Informationsportale jedoch nicht möglich, da es derzeit keine einheitliche

Bereitstellung von Informationen seitens der Hochschulen gibt, welche Rückschlüsse auf die eindeutige

Ausrichtung eines möglichen Fachrichtungsschwerpunktes ermöglichen.

Eine erste Abhilfe stellt die Verständigung der Hochschulen hinsichtlich einer einheitlichen Datenstruktur

dar. Hierbei unterstützt das Europäische System zur Übertragung und Akkumulierung von Credits (ECTS)

als Instrument des Europäischen Hochschulraums (EHR) dabei, die Transparenz auf internationaler Ebene

zu erhöhen, indem es im Rahmen des ECTS-Guides unter anderem für Auszeichnungen von

Studiengängen oder Lerneinheiten/Module, Richtlinien für die Benennung von einzelnen Metadaten und

Beschreibung deren Inhalte vorgibt. Mit voranschreiten der Umsetzung der ECTS-Richtlinien zur

Auszeichnung von Studiengängen und Lerneinheiten/Module, seitens der Hochschulen, wird es

Informationsportalen künftig erleichtert, potenziellen Studierenden einen Vergleich von Studiengängen

verschiedener Hochschulen zu ermöglichen.

Page 5: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 5/17 Anwendung semantischer Technologien

Eine durchgeführte Stichprobe1 im Rahmen des Wahlpflichtmoduls Grundlagen semantischer Technologien im Master-Studiengang Wirtschaftsinformatik der Technischen Hochschule Brandenburg

ergab, dass bereits eine Vielzahl der dem Arbeitskreis Wirtschaftsinformatik (AKWI2) zugehörigen

Hochschulen, die Lerneinheiten inhaltlich weitestgehend den ECTS-Richtlinien entsprechend auszeichnen.

Auch wenn einzelne Hochschulen des AKWI derzeit noch Synonyme für die jeweiligen Metadaten

verwenden, ist eine Vergleichbarkeit hinsichtlich der Inhalte eines jeweiligen Metadatums bereits heute

möglich.

Im Rahmen der durchgeführten Stichprobe wurden zunächst sämtliche Synonyme zusammengetragen

und nach der prozentualen Häufigkeit sortiert. Weiterhin wurde eine inhaltliche Analyse von

Schlüsselwörtern für die Metadaten Modulbeschreibung, Lerninhalte und Literatur durchgeführt. Ziel war

es hierbei, einzelne Schlüsselwörter einem bestimmten Fachrichtungsschwerpunkt zuzuordnen. Für den

Studiengang Wirtschaftsinformatik Bachelor wurden die Fachrichtungsschwerpunkte Informatik, Wirtschaftsinformatik, Betriebswirtschaftslehre sowie Sonstige identifiziert. Eine inhaltliche Analyse der

Metadaten ermöglicht eine künftige Zuordnung der einzelnen Schlüsselwörter zu den jeweiligen

identifizierten Fachrichtungsschwerpunkten. Durch die Betrachtung aller Schlüsselwörter innerhalb eines

Moduls lässt sich das jeweils betrachtete Modul dann idealerweise einem der betrachteten

Fachrichtungsschwerpunkte zuordnen. Sämtliche ermittelten Daten ergeben dann zusammenfassend für

die Betrachtung aller Module eines Studiengangs eine Ausrichtung zu einem, oder mehreren

Fachrichtungsschwerpunkten.

Der Mehrwert dieser Betrachtung ergibt sich dann in der Möglichkeit der Informationsportale, diese

Informationen Dank der geltenden ECTS-Vorgaben für die Auszeichnung von Metadaten visuell

aufbereitet, den Interessenten zur Verfügung zu stellen und die Studiengänge der verschiedenen

Hochschulen nicht nur inhaltlich miteinander zu vergleichen, sondern dem Interessenten auch zusätzlich

den jeweiligen Fachrichtungsschwerpunkt eines jeweiligen Studiengangs mit anzugeben. Interessenten

für den Studiengang Wirtschaftsinformatik mit einer besonders hohen Affinität zur Informatik haben somit

künftig die Möglichkeit, in einem der existierenden Informationsportale gezielt nach einer passenden

1 Betrachtung von Wirtschaftsinformatik Bachelor-Studiengängen, AKWI zugehöriger Hochschulen. 2 Beim AKWI handelt es sich um den Dachverband der Fachbereiche mit deutschsprachigen Wirtschaftsinformatik Studiengängen

und/oder Studienschwerpunkten an Fachhochschulen. Er versteht sich als fachkompetenter und hochschulpolitischer Gesprächspartner bzw. Ansprechpartner in Bezug auf alle Probleme des Studiums der Wirtschaftsinformatik an den Hochschulen, Spezies Fachhochschulen, und der Wirtschaftsinformatik als anwendungsbezogene Wissenschaft, für Studienbewerber/Studenten, andere Vereinigungen im Hochschulbereich, Behörden/Ministerien, Wirtschaft und Öffentlichkeit, auch auf internationaler Ebene. (Quelle: www.AKWI.de; Zugegriffen am 06.02.2017)

Page 6: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 6/17 Anwendung semantischer Technologien

Hochschule zu suchen, welche nicht nur den gewünschten Studiengang anbietet, sondern bei der auch

der Fachrichtungsschwerpunkt der Informatik inhaltlich im Fokus steht.

2 Zielsetzung Im Rahmen des Wahlpflichtmoduls Anwendung semantischer Technologien soll mit Hilfe der

semantischen Thesaurus-Management-Tools PoolParty und SKOS Shuttle jeweils ein Thesaurus für

Modulkataloge von Hochschulen angelegt werden. Ziel hierbei ist zunächst der Aufbau einer

Wissensdatenbank für den Studiengang Wirtschaftsinformatik Bachelor. Mittels gezielter SPARQL-

Abfragen in Verbindung semantischer Technologien soll es künftig möglich sein, einzelne Modulkataloge

(Wirtschaftsinformatik Bachelor), inhaltlich analysieren zu können, um diese den verschiedenen

Fachrichtungsschwerpunkten zuzuordnen. Für den Studiengang Wirtschaftsinformatik Bachelor wurden

stellvertretend die Fachrichtungen Betriebswirtschaftslehre, Wirtschaft, Informatik sowie Sonstige identifiziert. Je nach Fachrichtungsschwerpunkt, lässt sich ein Modul stets einer dieser

Fachrichtungsschwerpunkte zuordnen, wobei im Bereich Sonstige alle Module eines Studiengangs

zugeordnet werden, welche den anderen Fachrichtungsschwerpunkten nicht zugeordnet werden

konnten. Dies gilt beispielsweise besonders für Module mit allgemeiner Mathematik, Englisch,

Praxissemester oder der Bachelorarbeit selbst, welche in den Modulkatalogen der jeweiligen Hochschulen

mit aufgeführt werden. Daraus ergibt sich dann für den Betrachter eine prozentuale

Schwerpunktverteilung des Studiengangs auf die entsprechenden Fachrichtungen.

Im Rahmen unserer Arbeit wird bei den Thesaurus-Management-Tools PoolParty und SKOS Shuttle jedoch nicht nur jeweils ein Thesaurus angelegt, sondern es erfolgt während der Realisierung der

Thesaurus-Erstellung, eine vergleichende Betrachtung der verwendeten Thesaurus-Management-Tools

hinsichtlich ihrer Eignung zur Erreichung der Zielvorgabe und Betrachtung des jeweiligen

Funktionsumfangs, um eine Aussage hinsichtlich ihrer Eignung für den Aufbau einer Wissensdatenbank

treffen zu können. Hierbei werden unter anderen die Handhabung/ Usability, mögliche Import- Export-

Möglichkeiten, Fehleranfälligkeit/ Bugs, Support geprüft, sowie die generelle Performanz der Tools im

Umgang mit größeren Datenbeständen betrachtet. Das Fazit im Rahmen der Dokumentation soll dann

die generelle Eignung der betrachteten Thesaurus-Management-Tools für den Aufbau einer

Wissensdatenbank behandeln.

Page 7: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 7/17 Anwendung semantischer Technologien

3 Umsetzung Im Rahmen der bisher ausgeführten Motivation, Zielstellung und der erarbeiteten Daten, welche im

Rahmen des Moduls Grundlagen semantischer Technologien zusammengetragen wurden, erfolgten nun

weitere Arbeitsschritte.

3.1 Aufbereitung und Erweiterung der bisherigen Basisdaten (Schlüsselworte) Im Rahmen des Moduls Grundlagen semantischer Technologien, wurden zunächst fünf Modulkataloge

von Hochschulen (dem Arbeitskreis Wirtschaftsinformatik (AKWI) zugehörig) inhaltlich analysiert und

Schlüsselwörter extrahiert, welche für eine künftige semantische Textanalyse dienen sollen. Bei der

Analyse wurden die kompletten Textinhalte der Modulkataloge betrachtet und einzelne Wörter

identifiziert, welche einen Rückschluss auf die zuvor identifizierten Fachrichtungsschwerpunkte zulassen.

Im Kontext semantischer Technologien, werden diese Wörter auch als Schlüsselwörter bezeichnet.

Der zuvor erarbeitete Datenbestand wurde zunächst durch die Analyse weiterer Modulkataloge von AKWI-

Hochschulen erweitert und setzt sich wie folgt zusammen.

• Schlüsselwörter der Wirtschaftsinformatik (Anzahl 1018)

• Schlüsselwörter der Informatik (Anzahl 934)

• Schlüsselwörter der Betriebswirtschaftslehre (Anzahl 582)

• Schlüsselwörter der Sonstige (Anzahl 107)

• Schlüsselwörter der Wirtschaftsinformatik & Informatik (Anzahl 383)

• Schlüsselwörter der Wirtschaftsinformatik & Betriebswirtschaftslehre (Anzahl 239)

• Schlüsselwörter der Informatik & Betriebswirtschaftslehre (Anzahl 51)

• Schlüsselwörter der Wirtschaftsinformatik, Informatik & Betriebswirtschaftslehre (Anzahl 36)

Page 8: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 8/17 Anwendung semantischer Technologien

Im weiteren Verlauf der Arbeit war es erforderlich, die Schlüsselwörter in Schlüsselwortlisten zu

überführen, um diese anschließend in den zu betrachtenden Thesaurus-Management-Tools PoolParty

und SKOS Shuttle einpflegen zu können. Für die umfangreiche Einpflege der Daten, wurden zunächst

die Import- und Exportfunktionen der betrachteten Thesaurus-Management-Tools herangezogen. Nach

umfangreicher Analyse der Exportmöglichkeiten war es möglich, die jeweiligen Schlüsselwortlisten mittels

eine Excel-Import-Funktion wie in Abbildung 1 Excel-Import in PoolParty (Auszug) ersichtlich, in beide

Tools einzupflegen.

Abbildung 1 Excel-Import in PoolParty (Auszug)

Abbildung 2 Baumstruktur der Schlüsselwortlisten in PoolParty

Page 9: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 9/17 Anwendung semantischer Technologien

3.2 Erstellung einer Stoppwortliste (Allgemein) Für die semantische Textanalyse von Modulkatalogen sind neben der Identifizierung von

Schlüsselwörtern, auch die Identifizierung von Stoppworten erforderlich. Stoppworte sind einzelne Worte

wie im, bei, als, ich, man, dann etc., welche für eine semantische Analyse von Texten keinen Mehrwert

bieten. Können diese Worte vor einer semantischen Textanalyse bereits herausgefiltert werden, wird die

eigentliche Textanalyse dadurch performanter. Im Internet kursieren verschiedene Stoppwortlisten, diese

müssen jedoch hinsichtlich ihrer Eignung für den jeweiligen Anwendungsfall stets angepasst werden. So

ergab es sich, dass für den speziellen Anwendungsfall der Textanalyse von Modulkatalogen, mehrere der

verfügbaren Stoppwortlisten analysiert, zu einer neuen Stoppwortliste überführt und durch Doubletten

bereinigt werden mussten. Für den deutschsprachigen Raum ergab dies somit einen Datenbestand von

1004 Stoppworten.

3.3 Erstellung einer Stoppwortliste (Metadaten) Wie bei der Erstellung einer allgemeinen Stoppwortliste, war es zudem erforderlich, speziell bei der

Betrachtung von Modulkatalogen eine weitere individuelle Stoppwortliste auf Basis der Modulkataloge zu

erstellen, um künftige Abfragen noch performanter zu ermöglichen. Hierbei wurden die Metadaten und

jeweiligen Inhalte der Modulkataloge hinsichtlich der Bereinigung von Stoppworten analysiert. Als

Ergebnis entstand so eine Liste von Stoppworten, welche speziell für eine semantische Analyse von

Modulkatalogen keinen Mehrwert bieten. Der Umfang beläuft sich auf 264 Stoppwörter.

Abbildung 3 Übersicht der Stoppwortlisten in PoolParty

Abbildung 4 Übersicht der Stoppwortlisten in SKOS Shuttle

Page 10: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 10/17 Anwendung semantischer Technologien

Wie in Abbildung 3 und Abbildung 4 ersichtlich, wurden bei der Einpflege der Stoppwortlisten, einzelne

Konzepte bzw. Concepts erstellt. Während in der deutschen Alltagssprache Konzepte einen vorläufigen,

nicht bis ins Detail ausgeführten Plan beschreiben, handelt es sich im Kontext semantischer Technologien

bei Konzepten bzw. Concepts um reine Begriffe, welche jeweils eine semantische Einheit darstellen.

3.4 Erstellung einer Metadatenliste Wie in Abbildung 5 und Abbildung 6 ersichtlich, wurden als nächstes die identifizierten Metadaten der

betrachteten Modulkataloge, welche bereits vom ECTS-Guide empfohlen werden, zusammengetragen

und in die Thesaurus-Management-Tools eingepflegt. Zusätzlich wurden je Metadatum die bei der

Analyse identifizierten Synonyme, siehe Abbildung 7 & 9 mit eingepflegt. Die Abbildungen 8 & 10 zeigen

die angelegte Beschreibung des Metadatums.

Abbildung 5 Übersicht Metadatenliste in PoolParty

Page 11: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 11/17 Anwendung semantischer Technologien

Abbildung 6 Auszug Metadatenliste in SKOS Shuttle

Abbildung 7 Synonyme für Metadatum Anzahl der zugewiesenen ECTS Credits in PoolParty

Page 12: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 12/17 Anwendung semantischer Technologien

Abbildung 8 Beschreibung für Metadatum Anzahl der zugewiesenen ECTS Credits in PoolParty

Abbildung 9 Synonyme für Metadatum Anzahl der zugewiesenen ECTS Credits in SKOS Shuttle

Abbildung 10 Beschreibung für Metadatum Anzahl der zugewiesenen ECTS Credits in SKOS Shuttle

Page 13: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 13/17 Anwendung semantischer Technologien

4 Vergleich der Thesaurus-Management-Tools Nach Implementierung der Datenbestände in den beiden Thesaurus-Management-Tools, erfolgte eine

vergleichende Betrachtung der Tools, sowie speziell der zur Verfügung stehenden Funktionalitäten.

Hierbei richteten wir unser Augenmerk auf die Bereiche Import- Export-Funktion, Usability, Performanz,

Fehleranfälligkeit und Support und betrachteten speziell nur die Funktionen, welche für eine Realisierung

des Zielvorhabens notwendig waren.

4.1 Import- Exportfunktion Wie in den Abbildung 11 und Abbildung 12 vergleichend dargestellt, verfügt PoolParty über eine

umfangreichere Möglichkeit der Importformate. Dies hat gegenüber SKOS Shuttle den Vorteil, dass bei

PoolParty auch Formate verwendet werden können, welche noch nicht über eine ausreichende bzw.

umfangreiche Marktdurchdringung verfügen. Drittanbieter für eine Transformation von Datensätzen

müssen bei der Verwendung von PoolParty daher nur seltener herangezogen werden.

Abbildung 11 Importfunktion in PoolParty

Abbildung 12 Importfunktion in SKOS Shuttle

Page 14: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 14/17 Anwendung semantischer Technologien

Als Import- Export-Format lag daher die Entscheidung nahe, das Format RDF/XML zu wählen, da dies

von beiden Tools genutzt konnte. Testweise wurden einzelne Konzepte jeweils mittels der Import- Export-

Funktion beider Tools überführt. Entsprechende Importassistenten prüften den jeweiligen Datensatz auf

Konsistenz, so dass mit geringem Nachbearbeitungsaufwand auch Datensätze mit bis zu 1000 Konzepten

importiert werden konnten.

4.2 Usability PoolParty verwendet, wie in Abbildung 5 ersichtlich, die typische Baumstruktur zur Anzeige der

jeweiligen Listen und gestaltet seine Bedienelemente selbsterklärend. Somit sind die jeweiligen

Funktionen schnell erkennbar und das Arbeiten mit dem Thesaurus-Management-Tool geht nach einer

kurzen Einarbeitungszeit leicht von der Hand.

Abbildung 13 Weboberfläche eines Projektes in PoolParty

Page 15: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 15/17 Anwendung semantischer Technologien

SKOS Shuttle verwendet wie in Abbildung 6 ersichtlich, nicht wie PoolParty als Darstellungsform der

Listen eine Baumstruktur, sondern stellt einzubindende Listen jeweils als separate Hierarchieebenen dar.

Dies erschwerte besonders in der Phase der Datensatzeinbindung die Übersichtlichkeit, da stets sämtliche

Hierarchieebenen durchlaufen werden mussten, um zu prüfen, ob einzelne Importe von Datensätzen wie

gewünscht realisiert werden konnten.

Abbildung 14 Weboberfläche des Projektes in SKOS Shuttle

Weiterhin war es besonders zu Beginn der Einarbeitungsphase schwierig, die jeweiligen

Navigationselemente zu verstehen, bzw. deren mögliche Funktion herauszufinden, da diese nicht mit

einer Bezeichnung versehen waren und nur über Anklicken des Elements seine jeweilige Funktion

offenbarte. Zwar verfügen sämtliche Navigationselemente über MouseOverEffects mit entsprechendem

Tooltip, jedoch erhält der Nutzer zusätzlich eine Animation, welche für den Nutzer selbst keinen Mehrwert

bietet.

Page 16: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 16/17 Anwendung semantischer Technologien

4.3 Performanz Während PoolParty bei der Anzeige größerer Datensätze keinerlei Probleme aufweist, warnt SKOS Shuttle mit einem Warnhinweis entsprechend vor, dass die Anzeige der einzelnen Begriffe eine längere

Ladezeit aufweisen kann. Bei einem Import oder Export erfolgt bei beiden Tools kein Hinweis auf eine

mögliche Ladezeit bei größeren Datensätzen und ist hinsichtlich der Performanz nur dadurch zu

unterscheiden, dass PoolParty dies schneller als SKOS Shuttle realisiert und daher performanter

einzustufen ist.

Abbildung 15 Warnhinweis Ladezeit in SKOS Shuttle

4.4 Fehleranfälligkeit

Sowohl PoolParty, als auch SKOS Shuttle zeigten während der Testphase unterschiedliche Fehler auf.

So existiert bei PoolParty keine Möglichkeit mit der vorhandenen Hochschullizenz alternative Namen mit

Quellen zu verlinken/ hinterlegen. Die Wiki-Abfrage ist leider nur auf Englisch, jedoch nicht auf Deutsch

verfügbar. Somit konnte diese leider im Rahmen unseres Projektes nicht verwendet werden. Als

langwierig gestaltete sich die Dateneinbindung bei der Zuordnung von Konzepten zu Überkonzepten für

den Fall, dass Begriffe in mehreren Säulen Anwendung finden. Bei der Einbindung wurden sämtliche

Konzepte in den Überkonzepten redundant angelegt. Hierbei handelt es sich aber nicht wie zunächst

gedacht um einen Fehler von PoolParty. Nach Anfrage beim Support hätten die Konzepte in anderer

Reihenfolge angelegt werden müssen um dieses zu umgehen. Das war jedoch auf den ersten Blick nicht

ersichtlich. SKOS Shuttle war im Rahmen der Dateneinbindung und Pflege der jeweiligen Datensätze

jedoch wiederholt fehleranfällig.

Page 17: Anwendung semantischer Technologien · Seite 2/17 Anwendung semantischer Technologien Inhaltsverzeichnis 1Motivation 4 2Zielsetzung 6 3Umsetzung 7 3.1Aufbereitung und Erweiterung

Seite 17/17 Anwendung semantischer Technologien

So war SKOS Shuttle mehrmals nicht erreichbar und konnte daher nicht zum geplanten Zeitpunkt

verwendet werden. Die Nutzung von Umlauten in Projektnamen führte bereits beim Anlegen eines

Projektes zu Fehlern. Weiterhin konnten bei einem Import von mehr als 1000 Begriffen seitens SKOS Shuttle nur 998 Begriffe importiert werden. Welche Begriffe fehlten, wurde uns jedoch nicht vom

Management-Tool mitgeteilt. Ein Testexport im Turtle-Format konnte seitens SKOS Shuttle nicht ohne

Fehler realisiert werden und so war es nicht möglich, den Datensatz in einem anderen Management-Tool

ohne vorherige Nacharbeit des Datensatzes wieder zu importieren. Dies ist besonders herausfordernd,

da bereits die Import-Formate von SKOS Shuttle gegenüber PoolParty begrenzt sind und sich durch

Fehler bei Exporten nochmals eingrenzen und hier ggf. noch verstärkter auf Drittanbieter zur

Transformation des Datensatzes zurückgegriffen werden muss.

4.5 Support Zu jeder Zeit erhielten wir zeitnahen Support bei offenen Fragen hinsichtlich Fehlern oder beim Umgang

mit den jeweiligen Thesaurus-Management-Tools. Besonders der Entwickler von SKOS Shuttle reagierte

oftmals in Echtzeit bei Problemen und konnte innerhalb weniger Stunden oder am Folgetag bereits eine

Lösung offerieren. Auch ein telefonischer Kontakt und die Möglichkeit der Kontaktaufnahme auf Deutsch

oder die Möglichkeit einer geplanten Skype-Konferenz sind hier positiv zu erwähnen. Aber auch von

PoolParty stand ein direkter Ansprechpartner zur Verfügung. Der Support konnte hier auf Deutsch

angeschrieben werden, die Antwort erfolgte jedoch auf Englisch. Auch die kürze der Bearbeitungszeit

durch den Support soll hier positiv Erwähnung finden.

5 Abschlussbetrachtung Sowohl PoolParty als auch SKOS Shuttle eigenen sich dazu, ein Thesaurus anzulegen und durch

Begriffe oder eine Ontologie zu erweitern. Mittels SPARQL-Abfragen ist es möglich, auf die Daten

zuzugreifen und unter Verwendung weiterer semantischer Technologien, Modulkataloge von Hochschulen

zu analysieren. PoolParty scheint gegenüber SKOS Shuttle das ausgereiftere Tool am Markt zu sein

und wirkte während der Testzeit einfacher in der Handhabung. Auch graphisch ist es aufgrund der

Baumstruktur einfacher aufgebaut und instinktiver bedienbar. Jedoch wurde während der Testzeit seitens

des Entwicklers von SKOS Shuttle fortwährend an der Beseitigung von auftretenden Fehlern gearbeitet,

welche durch uns gemeldet wurden und unterliegt daher einem ständigen Verbesserungs- und

Weiterentwicklungsprozess. Anwendbar und von großem Funktionsumfang sind beide Tools.

Abschließend betrachtet wirkt die graphische Oberfläche von SKOS Shuttle verspielter und farbenfroher.