Upload
wolfgang-reinhardt
View
1.537
Download
0
Embed Size (px)
DESCRIPTION
Citation preview
Expertenfindung in komplexen Informationssystemen - Ein Metrik-basierter Ansatz
Wolfgang ReinhardtAlexander BoschmannAndreas KohringChristian Meier
Universität Paderborn, Institut für InformatikFachgruppe Didaktik der Informatik
Die MoKEx Projektgruppenserie
• MoKEx Projektgruppenserie
• langjähriges, interdisziplinäres Forschungsprojekt, Auszeichnung durch IFIP [HMR07]
• Kooperation zwischen deutschen und schweizer Studenten (Informatik, Wirtschaftsinformatik)
• Beteiligung von Firmenpartnern
• Anforderungen von Firmenpartnern, Kombination mit Forschungsthemen
• Entwicklung von Lösungsansätzen und Softwareprototypen
2
Die MoKEx Projektgruppenserie
• generelle Fragestellungen: betrieblicher Softwareeinsatz im Kontext von E-Learning und Wissensmanagement & mobile Szenarien
• Bereitstellung kontextualisierter und individualisierter Informationen
• automatische Aufwertung verteilt gespeicherter Daten durch automatische Metadatenanreicherung
• lose Kopplung bestehender Softwaresysteme und Verknüpfung über KnowledgeBus-Architektur
• Entwicklung des Single Point of Information Konzepts zur Zentrierung von Such- und Auffindeprozessen
3
Spezifische Zielsetzung
• Wiederverwendung früherer Softwarekomponenten zur automatischen Gewinnung inhalts- und objektbeschreibender Metadaten [RMS08]
• Ableitung von Mitarbeiter-Expertise und Visualisierung von Experten
• Anreicherung von Suchtreffern um grafische Darstellung von zugehörigen Experten und verwandten Themen
• Entwicklung eines flexiblen Analysesystems, dass Nutzeraktionen bewertet, speichert und zur Visualisierung bereitstellt
• Integration der Expertenvisualsierung in einer persönlichen Arbeitsumgebung
• Konzentration auf Daten aus E-Mails und Wikis
4
Wissen(-smanagement)
• Wissen und dessen (vermeintliches) Management gewinnt Einfluss als Produktionsfaktor
• Wissensmanagement nach Nonaka und Takeushi [TN04]:
• „process of continuously creating new knowledge, disseminating it widely through the organization, and embodying it quickly in new products/services, technologies and systems“
• YOU CANNOT STORE KNOWLEDGE [Non01]
• IT-Heterogenität kostet Organisationen Zeit und Geld durch lange Suchprozess nach den richtigen Daten [IB07]
5
Expertensuche und -findung
• fehlende Transparenz von Mitarbeiterkompetenzen wird oft als Defizit heutiger IT-Systeme angesehen [FK01]
• Yellow-Pages-Systeme speicherten Expertise pro Mitarbeiter
• Datenbasis veraltet schnell
• Ackerman‘s Answer Garden [Ack94] als eines der ersten Expertenfinder-systeme mit aktualisierenden Profilen
• bisher kaum Berücksichtigung des Benutzer- oder Artefaktkontexts
6
Graph-basierte Expertenvisualiserung
• Visualisierung sog. Knowledge Entities [Tr05] und semantische Verknüpfung
• processes / activities
• documents
• individuals
• topics
• Verwendung von Knoten, Kanten und Graphalgorithmen zur Visualisierung
• Beantwortung der Fragen „Wer kennt wen?“ und „Wer arbeitet woran?“
7
Graph-basierte Expertenvisualiserung, Beispiele
• Meyer & Spiekermann: skillMap [MS06]
• Verknüpfung von Graphen aus Mitarbeitern mit Fachwissensgebieten
• Aussagen über spezielles Expertenwissen
• Fujitsu: KnowWho [ITK03]
• Visualisierung gewonnener Daten aus Terminplänen
• statische Graphen mit Person zentriert in der Mitte
• Sugiyama stellt Best Practices zur Erzeugung benutzerfreundlicher Graphen vor [Su02]
8
Datenschutz, Ergebnisse des Tests
• Datenschutz kann zum Problem werden
• BVG 1983
• Unterscheidung in privat, geschäftlich und vertraulich
• Tests beim Anwendungspartner in der Schweiz zeigte keine solchen Bedenken auf
9
Single Point of Information
FLEX
AJAX
FLEX?
AJAX?
Web 2.0?
Web 2.0
WWW
- Alle Benutzer suchen und organisieren sehr ähnliche Informationen - Austausch der Informationen zwischen den Autoren schwierig
10
Motivation
FLEX?
AJAX?
Web 2.0?
WWW
DMS
SPI
- Alle Informationen liegen an einem
Ort, weniger Redundanz
- Gemeinsamer Zugriff
SPI: Single Point of InformationSPI: Single Point of InformationDMS: Document Management System
11
MoKEx Architektur
MetaXsA MeduSA
KNS
DMS
SPI Benutzer-verwaltung
WWW
SPI: Single Point of InformationDMS: Document Management SystemSPI: Single Point of InformationDMS: Document Management SystemMetaXsA: Metadatenextraktion und semantische Analyse
SPI: Single Point of InformationDMS: Document Management SystemMetaXsA: Metadatenextraktion und semantische AnalyseMeduSA: Ablage der Metadaten und Semantik
SPI: Single Point of InformationDMS: Document Management SystemMetaXsA: Metadatenextraktion und semantische AnalyseMeduSA: Ablage der Metadaten und SemantikBenutzerverwaltung: Informationen zu Benutzern
SPI: Single Point of InformationDMS: Document Management SystemMetaXsA: Metadatenextraktion und semantische AnalyseMeduSA: Ablage der Metadaten und SemantikBenutzerverwaltung: Informationen zu BenutzernKNS: Zentrale Kommunikation und Workflow-Management
12
E-Mail und Wiki Anbindung
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
SPIWWW
E-Mail-Server
- Erfassen von E-Mails
- Erfassen von Wiki Artikeln
Wiki-Server
Metadata
13
Expertenfindung
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
SPI
Wiki-Server
E-Mail-Server
RaMBo
Rating
120+ 14
134
Experten?
Verwandte Keywords?
14
Unser Ansatz zur Expertenfindung
• RaMBo (Rating Module and Behavior observation) als Komponente in Gesamtarchitektur des Projekts
• Kommunikation über Webservices
• Metadatenobjekt wird übergeben
• Daraus Aufbau von Bewertungsrelationen in Datenbank
15
Metadatengewinnung
• Komponente MetaXsA (Metadaten EXtraktion und semantische Analyse)
• Eingabe: Dokumente, E-Mails, Wiki-Artikel
• Ermittlung von Metadaten und semantischen Informationen, z.B.
• Autor/Sender, Empfänger
• Keywords, Taxonomien (Kategorien), u.v.m.
• Ausgabe: Metadatenobjekt im XML-Format nach dem LOM Standard [LOM02]
Metadata
16
Expertenfindung
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
SPI
Wiki-Server
E-Mail-Server
RaMBo
Rating
120+ 14
134
WWW
Metadata
TextMetadata
17
Bewertungsrelationen
• Zum Bewerten der Benutzeraktionen werden verschiedene Relationen eingesetzt
• Relationen sollen in verschiedenen Kombinationen Beziehungen zwischen Benutzern, Keywords und Unternehmenskontext herstellen
• Bewertungsrelationen teilen sich in zwei Gruppen:
• Erfassen der Häufigkeit des gemeinsamen Auftretens
• Gewichtete Bewertung mit Hilfe einer Punkte-Metrik
18
Relationen
• Keyword x Keyword x Zähler
• Keyword x Taxonomie x Zähler
• Taxonomie x Taxonomie x Zähler
• Benutzer x Keyword x Bewertung
• Benutzer x Taxonomie x Bewertung
• Benutzer x Quelle x Bewertung
• Benutzer A x Benutzer B x Keyword x Quelle x Bewertung
• Benutzer A x Benutzer B x Taxonomie x Quelle x Bewertung
Häufigkeit des gemeinsamen Auftretens
Bewertung mit Hilfe einer Punkte-Metrik
19
• Treffen von Aussagen über Expertise von Benutzern durch punkte- und faktorenbasierte Metrik
• Benutzeraktionen mit verschiedenen Datenquellen berücksichtigt
• Benutzeraktionen: erstellen, bearbeiten, lesen und suchen
• unterstützte Datenquellen: Dokumente, Wiki-Artikel, Suche, E-Mail
• Bewertung = Punktwert für Aktion x Gewichtung für Quelle und Aktion
Punkte-Metrik
{ {beliebige Zahl Zahl zwischen 0 und 1
20
Punkte-Metrik
• Bewertung = Punktwert für Aktion x Gewichtung für Quelle und Aktion
• Konfiguration des Prototyps im Einsatz:
suchen 1
lesen
editieren
erstellen
10
75
250
suchen lesen editieren erstellen
Dokument
Wiki
Suche
E-Mail TO
1 1 1 1
0,8 0,8 0,8 0,8
0,2 0 0 0
0,4 0 0 0,4
0 0,4 0 0,4
{ {
beliebige Zahl Zahl zwischen 0 und 1
21
Implementierung
• Java
• Stored Procedures
• SQL
22
• Szenario: Eine E-Mail ohne Anhang
• Ein Sender, Zwei Empfänger
• 10 Keywords, 2 Taxonomien
Performance
• Keyword x Keyword x Zähler
• Keyword x Taxonomie x Zähler
• Taxonomie x Taxonomie x Zähler
• Benutzer x Keyword x Bewertung
• Benutzer x Taxonomie x Bewertung
• Benutzer x Quelle x Bewertung
• Benutzer A x Benutzer B x Keyword x Quelle x Bewertung
• Benutzer A x Benutzer B x Taxonomie x Quelle x Bewertung
10 x 10
10 x 2
2 x 2
3 x 10
3 x 2
3 x 1
(3 x 3) x (10 x 1)
(3 x 3) x (2 x 1)
= 100
= 20
= 4
= 30
= 6
= 3
= 90
= 18
∑ =271
23
• Statistik bei 1001 Mails auf Mailserver:
• Annahmen:
• Es kann daher bedient werden:
Performance
Dauer ca. 30 Stunden
Calls
Zeit pro Call
Durchschnittsdauer
Calls pro Mail
659978
165ms
ca. 1:47min
645
Dauer Nachtsitzung 14 Stunden
durch. Calldauer
durch. Calls
LOMs pro Nacht
165ms
645
474
Benutzer 20
E-Mails pro Benutzer
durch. Mails pro Tag
max. Mails pro Tag u. Benutzer
max. Mails pro Stunde
15
300
24
34
24
Berechnung der Bewertungspunkte
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
SPI
Wiki-Server
E-Mail-Server
RaMBo
Rating
120+ 14
134
Metadata
RaMBo
Rating
120+ 14
134
Metadata
Keywords: Web 2.0, FLEX
Absender: Klaus
Empfänger: Johannes
Benutzer Keyword Rating
Klaus Web 2.0 100
Klaus FLEX 100
Johannes Web 2.0 4
Johannes FLEX 4
Benutzer Benutzer Keyword Rating
Klaus Johannes Web 2.0 100
Klaus Johannes FLEX 100
Keyword Keyword Zähler
Web 2.0 FLEX 1
suchen 1
lesen
editieren
erstellen
10
75
250
suchen lesen editieren erstellen
Dokument
Wiki
Suche
E-Mail TO
1 1 1 1
0,8 0,8 0,8 0,8
0,2 0 0 0
0,4 0 0 0,4
0 0,4 0 0,4
Relationen:Benutzer - Keyword - RatingBenutzer - Benutzer - Keyword - RatingKeyword - Keyword - Zählerusw.
25
Expertenfindung
Motivation - Mokex III - Mokex IV - Demo - Technik - Ausblick
Experten und
verwandte Begriffe
zu Web 2.0?
SPI
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
Wiki-Server
E-Mail-Server
RaMBo
Rating
120+ 14
134
Web 2.0
Metadata
26
Erstellen der Experten- und Keywordnetze
SPI
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
Wiki-Server
E-Mail-Server
RaMBo
Rating
120+ 14
134
RaMBo
Rating
120+ 14
134Web 2.0
Benutzer Keyword Rating
Klaus Web 2.0 100
Klaus FLEX 100
Johannes Web 2.0 4
Johannes FLEX 4
Robin Web 2.0 50
Robin AJAX 50
Benutzer Benutzer Keyword Rating
Klaus Johannes Web 2.0 100
Klaus Johannes FLEX 100
Klaus Robin Web 2.0 50
Klaus Robin AJAX 50
Keyword Keyword Zähler
Web 2.0 FLEX 1
Web 2.0 AJAX 4
FLEX AJAX 6
Experten für Web 2.0
Verwandte Keywords für Web 2.0
Klaus
Johannes Robin
Expertennetz Keywordnetz
KWeb 2.0
KFLEX
KAJAX
27
Experten und
verwandte Begriffe
zu Web 2.0?
Expertenfindung
SPI
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
Wiki-Server
E-Mail-Server
RaMBo
Rating
120+ 14
134
Klaus
Johannes Robin
Expertennetz
KAJAX
KWeb 2.0
KFLEX
Keywordnetz
28
Screenshots
Motivation - Mokex III - Mokex IV - Demo - Technik - Ausblick
Screenshots
SPI
MetaXsA MeduSA
KNSBenutzer-verwaltung
DMS
Wiki-Server
E-Mail-Server
RaMBo
Rating
120+ 14
134
29
Suchen
30
Suchergebnisdarstellung
31
Keywordnetz
32
Expertennetz
33
Zusammenfassung und Ausblick
• Prototyp RaMBo im Kontext eines komplexen Informationssystems zur Unterstützung des betrieblichen Wissensmanagement und E-Learning eingesetzt
• Hauptaufgabe: aus objekt- und inhaltsbeschreibenden Metadaten zu Informationsobjekten die Expertise von Benutzern extrahieren und visualisieren
• Evaluation zeigte:
• derzeitige Visualisierung entspricht noch nicht den Erwartungen der Benutzer
• Enorme Datenmenge erfordert intelligentes Scheduling
• Datenschutz kritisch
• Entwicklung der Netze zwischen speichern, um Entwicklungen zu visualisieren
34
Vielen Dank für Ihre Aufmerksamkeit!
35
Literatur
• Ack94
• FK01
• HMR07
• IB07
• ITK03
• LOM02
• MS06
• Non01
• RMS08
• Su02
• Tn04
• Tr05
36