Upload
rainer-ritter
View
221
Download
2
Embed Size (px)
Citation preview
Betriebs-systeme
und Verteilte Systeme
Description LogicsMarc Holger Uhlmann
SeminarvortragPaderborn, 15. Dezember 2004
Projektgruppe Peer-2-Peer basierte Suche nach Web-Diensten
2
Agenda
Motivation und Grundlagen
Die Basis Description Logic FL-0
Syntax
Semantik
Erweiterungen (Dialekte)
Von der Description Logic zum DL-Reasoner Terminologien
Assertions
Inferenz
Grundlegende Konzepte von Inferenzalgorithmen Structural Subsumption Algorithmen
Tableau-based Subsumption Algorithmen
3
Motivation für Description Logics
Ursprünge der Forschung: Künstliche Intelligenz (KI)
Formalismen
zur formalen Repräsentation von Domänenwissen über einen Ausschnitt der Welt
für ein effizientes Handling des Domänenwissens
zum expliziten Folgern impliziten Wissens
Motivation: Nutzen dieses Wissens
diverse Anwendungsgebiete→ Semantic Web
Für unsere Projektgruppe: Einsatz von Wissen für die Suche nach Webservices
„Die KI ist der Zweig der Informatik, der sich mit symbolischen Methoden der Lösung von Problemen beschäftigt“ [Kurzweil]
4
Ziel: Description Logics für die Projektgruppe
Repräsentation von Wissen über Hardware, Software und Kompatibilitäten
Effizientes Ableiten von expliziten Informationen aus implizitem Wissen
Wissensbasis
allgemeingültigesWissen
konkretes Situationswissen
Inferenzsystem
Benutzerschnittstelle
5
Einordnung von Description Logics
Prädikatenlogik erster Stufe: Argumente von Prädikaten ausschließlich Objektvariablen
Grund für eine neue Syntax: → variablenfreie Darstellung ist übersichtlicher und für die zu
modellierenden Problembereiche adäquater
Prädikatenlogik erster Stufe (FOL)
DL
Unäre PrädikateVater(x)
Binäre PrädikatehatKind(x,y)
Beschränkungauf 1 freie Variable → Einfachere Syntax
transitive Rollenbeschreibungen
6
Grundlegende syntaktische Bausteine
Atomare Konzepte (unäre Prädikate) entsprechen Klassen (Objektorientierung) bzw.
Mengen von ObjektenBeispiele
Männlich ≡ {x | männlich(x)} Person ≡ {x | Person(x)}
Atomare Rollen (binäre Prädikate, Relationen) Beschreibung der Beziehung zwischen genau zwei Konzepten
Beispiele: hatKind ≡ {(x,y) | hatKind(x,y)}
Individuen (Konstanten) Repräsentation genau einer Entität innerhalb eines Konzeptes
7
Syntax:Sei A ein atomares Konzept und R eine Rolle, so sind Konzeptbeschreibungen für C,D in FL-
0:
C, D A | primitives Konzept T | universelles Konzept
| bottom KonzeptC ⊓ D | Schnitt R.C | Wertbeschränkung
Beispiele:Informatiker ⊓ Weiblich (Eine Frau, die Informatik
studiert)
Mann ⊓ hatKind.Informatiker (Ein Mann der nur Informatiker
als Kinder hat)
Eine erste Description Language FL-0
8
Semantik:Interpretation I= (, ∙) nichtleeren Menge ∙Mapping-Funktion: C → C für alle Konzepte C
R → R x für alle Rollen R
TI =
=
(C ⊓ D) = CD
( R.C) = {a | (b: (a,b) R → b C)}
FL-0: Basis für alle Description Logic Sprachen.
FL-0 einfach, aber relativ geringe Ausdrucksfähigkeit
Adäquate Erweiterungen für die jeweilige Domäne (z.B. PG P2P) Kompromiss zwischen (notwendiger) Ausdrucksfähigkeit und
Komplexität des Schlußfolgerungsprozesses.
Eine erste Description Language FL-0
9
Erweiterungen von FL-0
FL- : Erweiterung um begrenzte Existenzquantifizierung
( R.) = {a | b: (a,b) R}
AL : Erweiterung um atomare Negation( A) = \
AL U : Erweiterung um die Vereinigung von Konzepten(C ⊔ D)= C D
AL E : Erweiterung um komplette Existenzquantifizierung( R.C) = {a | b: (a,b) Rb C}
AL N: Erweiterung um unqualifizierte Anzahlsbeschränkungen(≤ n R) = {a | b|(a,b) R≤ n}(≥ n R) = {a | b|(a,b) R≥ n}(= n R) = {a | b|(a,b) R= n}
AL C: Erweiterung um Negation für beliebige Konzepte( C) = \ C
10
noch mehr Erweiterungen…
AL O: Erweiterung um die Aufnahme von Individuen I (Nominale) in Konzepten I = I und |(I)| = 1
AL H: Erweiterung um Rollenhierarchien(R ⊑ S)=RS
AL I: Erweiterung um inverse Rollen (R)={(a,b) x | (b,a) R}
AL Q: Erweiterung um qualifizierte Anzahlsbeschränkungen(≤ n R.C) = {a | b|(a,b) Rb C≤ n}(≥ n R.C) = {a | b|(a,b) Rb C≥ n}(= n R.C) = {a | b|(a,b) Rb C= n}
S: AL: Erweiterung um transitive RollenbeschreibungenR R+ : wenn (a,b) R und (b,c) R → (a,c) R
Notation: AL [U] [E] [N] [C] [O] [H] [I] [Q] [F]
S[H] [I] [Q] [F]
11
Ziel: Verwendung eines DL-Systems für PG
Wissensbasis K=(T,A)
allgemeingültigesWissen
konkretes Situationswissen
Inferenzsystem
Benutzerschnittstelle
T Boxallgemeingültiges
Wissen
A Boxkonkretes
Situationswissen
12
TBox: Terminologien
Terminologische Axiome:Machen Aussagen wie Konzepte miteinander in Verbindung stehen: C ≡ D (Äquivalenzen)
Definitionen: Äquivalenzen mit atomaren Konzept auf der linken Seite (symbolische Namen) Beispiel: Mann ≡ Person ⊓ Frau
C D (Inklusionen)⊑Beispiel: Frau ⊑ Person
Terminologie (TBOX): Eine endliche Menge von Definitionen und Inklusionen
Zyklische Defintion:Eine Definition, die definiertes in der Definition verwendetBinärbaum = Baum ⊓ ≤ 2 hatNachfolger ⊓ hatNachfolger.Binärbaum
13
Definitionen, …
Normalisierung einer generalisierten Terminologie:
Für alle Inklusionen mit C ⊑ D:→ Ersetze C ⊑ D durch C ≡ C* ⊓ D
Damit repräsentiert C* den Unterschied von C zu D
Eine Interpretation I erfüllt eine Äquivalenz mit C ≡ D genau dann, wenn C = D
Eine Interpretation I erfüllt eine Inklusion mit C ⊑ D genau dann, wenn C D
Modell einer Terminologie (TBox) T: Interpretation I ist genau dann ein Modell, wenn I alle Axiome der Terminologie T erfüllt.
14
Beispielhafte TBox & Expandierung
Frau Person⊑oder
Frau ≡ Person ⊓ Weiblich Mann ≡ Person ⊓ Frau Mutter ≡ Frau ⊓ hatKind.Person Vater ≡ Mann ⊓ hatKind.Person Elternteil ≡ Mutter ⊔ Vater Großmutter ≡ Mutter ⊓ hatKind.Elternteil
Frau ≡ Person Weiblich⊓ Mann ≡ Person ⊓ (Person ⊓ Weiblich) …
Expansionen können exponentiell groß werden und sind ausschließlich bei azyklischen Terminologien berechenbar
15
ABox: Assertions
Spiegeln das konkrete Situationswissen (world description) Arten von Assertions:
a, b, c: Namen von Individuen, C: Konzept, R: Rolle:
Concept Assertion C(a): a gehöhrt zu (der Interpretation von) C
Role Assertion R(b, c): c ist Rollenfüller der Rolle R für b
Beispiele:Mutter(Elfriede) Elfriede ist eine MutterFrau(Bettina) Bettina ist eine FrauhatKind(Elfriede, Bettina) Bettina ist das Kind von Elfriede
Assertions in der ABox sind syntaktische Konstrukte→ Erweiterung der Semantik um Interpretationen von Individuen
16
ABox: Semantik für Individuen
Erweiterung der Interpretation I = (, ∙)mit∙ : Funktion: a → a für alle Individuen a.
a b→a b: unique name assumption (UNA) Eine Interpretation I erfüllt die
Concept Assertion C(a) genau dann, wenn a C
Role Assertion R(b,c) genau dann, wenn (b,c R
Modell einer ABox A: Interpretation I genau dann, wenn I alle Assertions einer ABox A erfüllt.
(Wdh.)Modell einer Terminologie (TBox) T: Interpretation I genau dann, wenn I alle Axiome der Terminologie T erfüllt.
Modell einer ABox A bezüglich einer TBox T:Interpretation I, genau dann wenn I ein Modell der ABox A und gleichzeitig der TBox T ist.
17
Der Weg zur Inferenz (1)
Woran sind wir bezüglich Konzepten interessiert? Erfüllbarkeit (satisfiability):
Ein Konzept C ist erfüllbar bezüglich einer TBox T wenn es ein Modell I von T gibt, so dass C nicht leer ist. (I ist Modell von C)
Inklusion (subsumption):Ein Konzept C wird von einem Konzept D bezüglich einer TBox T inkludiert wenn C D für jedes Modell I von T. (C ⊑T D)
Äquivalenz (equivalence):Zwei Konzepte C und D sind bezüglich einer TBox T äquivalent wenn C Dfür jedes Modell I von T. ((C ≡ T D) )
Disjunktheit (disjointness):Zwei Konzepte C und D sind disjunkt bezüglich einer TBox T wenn CD= für jedes Modell I von T.
Alle Aussagen können auf Inklusion, Erfüllbarkeit bzw. Konsistenz reduziert werden:→ 1 Algorithmus zur Beantwortung aller Fragestellungen
18
Der Weg zur Inferenz (2)
Woran sind wir bezüglich Assertions interessiert? Konstistenz einer ABox A (bezüglich einer TBox T)
Es existiert eine Interpretation I, die Modell für A (und T) ist
Instance-CheckEine ABox A zieht eine assertion C(a)nach sich (A ⊨ C(a) ), wenn jede Interpretation, die A erfüllt auch C(a) erfüllt. A ⊨ C(a) genau dann, wenn A { C(a)} konsistent ist.
Retrieval-ProblemFinde alle Individuen a für eine ABox A und ein Konzept C mit:A ⊨ C(a)
Realization-Problem (Dual zum Retrieval-Problem)Welches Konzept C realisiert für ein gegebenes Individuum a den Schluß: A ⊨ C(a), es gibt kein D mit (D ⊑ C und A ⊨ D(a) )
Erfüllbarkeit eines Konzeptes C:C erfüllbar genau dann, wenn {C(a)} konsistent (a beliebig)
19
Open-World-Assumption(1): Ödipus
Informationen in einer ABox sind grundsätzlich unvollständig→ Vorsicht beim Inferenzprozess und bei der Entwicklung derWissensbasis (Knowledge Engineering)
Ödipus
Iokaste
Polyneikes
Thersandros
≡ hatKind
Die Wahrheit
hatKind(Iokaste, Ödipus)hatKind(Ödipus, Polyneikes)hatKind(Iokaste, Polyneikes)hatKind(Polyneikes, Thersandros)
VaterMörder(Ödipus)VaterMörder(Thersandros)
Die Fakten
Hat Iokaste ein Kind, das ein Vatermörder ist; dessen Kind jedoch kein Vatermörder ist?
A (⊨ hatKind(VaterMörder ⊓ hatKind. VaterMörder)) (Iokaste)?
Die Frage
20
Open-World-Assumption (2): Inferenz
Ödipus
Iokaste
Polyneikes
Thersandros
≡ hatKind
Interpretation I1
Ödipus
Iokaste
Polyneikes
Thersandros
≡ hatKind
Interpretation I2
Sowohl in der Interpretation I1 als auch in der Interpretation I2
hat Iokaste ein Kind das ein Vatermörder ist; dessen Kinde jedoch kein Vatermörder ist.
→ A (⊨ hatKind(VaterMörder ⊓ hatKind.VaterMörder)) (Iokaste)?
21
Structural Subsumption Algorithmen
Reduktion auf Inklusion
C ist unerfüllbar C ⊑
C ≡ D C D und D C ⊑ ⊑ CD= (C ⊓ D) ⊑
Idee:
Test auf Inklusion von Konzepten
Algorithmen zum Vergleich syntaktischer Strukturen
Schwächen
unvollständig: Es werden Inklusionen übersehen
keine Unterstützung von Negation, Disjunktion und kompletter Existenzquantifizierung → Ausdrucksfähigkeit begrenzt
erlauben keine zyklischen Terminologien
→ Entwicklung einer effizienteren Strategie
22
Tableau-based Subsumption Algorithmen (1)
Keine direkte Prüfung auf Inklusion: sondern Reduzierung von Inklusion auf Erfüllbarkeit:
C ⊑ D genau dann, wenn C ⊓ D unerfüllbar
Idee: Wenn (C ⊓ D) unerfüllbar → C ⊑ D Finden einer Interpretation I mit (C ⊓ D) Lösung entspricht der eines Constraintproblems
23
Tableau-based Subsumption Algorithmen (2)
Vorgehen
leere ABox A
Initialisierung von A mit A:={(C ⊓ D)(x)}
Sukzessive Anwendung von konsistenzerhaltenden Transformationsregeln:→ Menge von ABoxes S:={A1,…, Ak}
Die initialisierte ABox ist konsistent genau dann wenn mindestens eine ABox Ai (mit 1≤ i ≤ k ) konsistent ist.
Lösung von ausdrucksstarken DL-Dialekt erfordert (theoretisch) exponentiellen Zeitaufwand
Optimierungen von Tableau-Based Algorithmen: → In der Praxis sehr effizient
Einsatz in derzeitigen DL-Reasoner (Racer, Fact)
24
Fazit
Description Logics: neue effiziente Form der Wissensrepräsentation
Die Basis Description Logic FL-0
Syntax
Semantik
Erweiterungen (Dialekte)
→ gute Skalierbarkeit durch Anpassung der Ausdrucksfähigkeit
Von der Description Logic zum DL-Reasoner Terminologien, Assertions & Inferenz
Tableau-based Subsumption Algorithms Effizientes Reasoning für Description Logics
State-of-the-Art in aktuellen Reasonern
25
Ausblick für die Projektgruppe P2P
Evaluierung über den Einsatz von Description Logics
Identifikation von allgemeingültigem Wissen
Entscheidung für einen Dialekt
Überführung des Wissens in eine Terminologie
Entscheidung für einen DL-Reasoner
Einbindung von Terminologien in den DL-Reasoner
Prototypische Realisierung mit konkretem Situationswissen
Wissensbasis K=(T,A, R)
allgemeingültigesWissen
konkretes Situationswissen
Inferenzsystem
Benutzerschnittstelle
26
Fragen & Diskussion
Vielen Dank für Eure Aufmerksamkeit !
27
Ursprünge von Description Logics (DL)
Repräsentation von Wissen in Form von:
Objektklassen (Konzepten)
Beziehungen zwischen diesen Objektklassen (Rollen)
Semantische Netzwerke, frame-based systems, KL-ONE
Mann Frau
Vater Mutter
Person
hatKind
Elternteilbeispielhaftes semantisches Netzwerk
28
b a c k u p – f o l i e n
Trigger Rules als Ergänzung der TBox Komplexität für das Reasoning von Dialekten
OWL DL → Martin Steinhoffs Seminarvortrag (T8: OWL) Ian Horrocks „DAML+OIL: A Description Logic for the
Semantic Web“
29
Trigger Rules
Zusätzlich zu Terminlogien (TBox) und Weltbeschreibungen (ABox) Seien C, D Konzepte:
C D„Wenn ein Individuum eine Instanz eines Konzeptes C istdann ist es auch eine Instanz des Konzeptes D“
Erweiterungen der Knowledge Base zu K = (T,A,R) Trigger Rules sind eng zu Inklusionen C D verwandt, aber:⊑
C D D C
Notation: C D K C D⊑K realisiert Beschränkung auf gültige Instanzen der ABox oder solche die durch ABox und TBox impliziert werden.
→ Durch diese Beschränkung wirkt sich das Inklusionsaxiom nicht auf Erfüllbarkeit und Inklusionsbeziehungen zwischen Konzepten aus.
30
Komplexität für Inferenzprozesse
nach F. M. Donini et al: "The Complexity of Concept Languages“
31
Algorithmen
Daten Daten
Wissen
Inferenz
32
Wissensbasis
allgemeingültigesWissen
konkretes Situationswissen
Inferenzsystem
Benutzerschnittstelle
33
Prädikatenlogik erster Stufe (FOL)
DL
Unäre PrädikateVater(x)
Binäre PrädikatehatKind(x,y)
Beschränkungauf 1 freie Variable
transitive Rollenbeschreibungen