55
Internet Semantyczny Logika opisowa Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki 2012

Logika opisowa - merlin.phys.uni.lodz.plmerlin.phys.uni.lodz.pl/MSkulimowski/sw/InternetSemantyczny5.pdf · Pełna kwantyfikacja egzystencjalna oznaczana jest literą E. Marcin Skulimowski,

Embed Size (px)

Citation preview

Internet Semantyczny

Logika opisowa

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Ontologie

Definicja Grubera:

Ontologia to formalna specyfikacja konceptualizacji pewnego obszaru wiedzy czy opisu elementów rzeczywistości.

W Internecie Semantycznym językiem służącym do zapisu ontologii jest OWL (Ontology Web Language)

Teoretyczną bazę dla języka OWL stanowi logika opisowa (Description Logic)

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

W logice opisowej (DL) ontologia (a raczej baza wiedzy) dzieli się na dwie części: terminologię (TBox) i opis świata (zbiór asercji - ABox).

Logika opisowa

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Koncepty

Elementarnymi opisami w logice opisowej są koncepty atomowe (atomic concepts) i relacje atomowe (atomic roles).

Koncepty złożone budowane są za pomocą tzw. konstruktorów.

Literami A i B będziemy oznaczali koncepty atomowe.

Literami C i D będziemy oznaczali koncepty złożone.

Literami R i S będziemy oznaczali relacje atomowe.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Język AL

Języki opisowe różnią się dostępnymi konstruktorami.

Minimalnym językiem mającym praktyczne zastosowanie jest język AL (Attributive Language).

W języku AL koncepty złożone budowane są za pomocą następujących reguł syntaktycznych:

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Język AL - przykład

Załóżmy, że Person i Female są konceptami atomowymi.

Ponadto niech hasChild będzie relacją atomową.

Wówczas w języku AL możemy zdefiniować koncepty złożone:

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Język AL - semantyka

W celu zdefiniowania formalnej semantyki języka AL rozważmy tzw. interpretację.

Interpretacja I składa się z niepustego zbioru I oraz funkcji przypisującej:

• każdemu konceptowi atomowemu A zbiór AII.

• każdej relacji atomowej R relację binarną RIII.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Język AL - interpretacja

Interpretacja jest zwykle rozszerzana na koncepty złożone w następujący sposób:

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Język AL - interpretacja

Mówimy, że dwa koncepty C i D są równoważne jeżeli

CI=DI

dla każdej interpretacji I.

Równoważność konceptów C i D zapisujemy następująco: CD

Przykład

Łatwo pokazać, że koncepty

są równoważne. Marcin Skulimowski, Wydział Fizyki i

Informatyki Stosowanej, Uniwersytet Łódzki 2012

Rodzina języków AL

Wzbogacając język AL o kolejne konstruktory możemy uzyskać inne języki.

• Suma konceptów C i D oznaczona jest przez

i interpretowana następująco:

Suma konceptów oznaczana jest literą U.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Rodzina języków AL

• Pełna kwantyfikacja egzystencjalna oznaczona jest przez

i interpretowana następująco:

Pełna kwantyfikacja egzystencjalna oznaczana jest literą E.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Rodzina języków AL

• Ograniczenia liczbowe oznaczone są przez

i interpretowane następująco:

Ograniczenia liczbowe oznaczane są literą N.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Rodzina języków AL

• Negacja dowolnego konceptu C znaczona jest przez

i interpretowana następująco:

Negacja dowolnego konceptu oznaczana jest literą C.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Rodzina języków AL

Wykorzystując wprowadzone powyżej dodatkowe konstruktory możemy zdefiniować następujący koncept złożony:

Przykład

(osoby posiadające co najwyżej jedno dziecko lub więcej niż trójkę dzieci z których jedno jest kobietą)

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Rodzina języków AL

Dowolny język z rodziny AL określamy następująco:

gdzie obecność danej litery związana jest z obecnością w języku odpowiedniego konstruktora.

Okazuje się, że nie wszystkie uzyskane w ten sposób

języki są między sobą różne.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Rodzina języków AL

Można pokazać, że:

Zatem suma i pełna egzystencjalna kwantyfikacja może być określona przy pomocy negacji.

Przeciwnie za pomocą sumy i pełnej egzystencjalnej kwantyfikacji może określić negację.

Przyjmujemy zatem, że suma i pełna egzystencjalna kwantyfikacja może być określona przy pomocy negacji i odwrotnie.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

DL - FOL

Semantyka konceptów pozwala interpretować logikę opisową (DL) jako fragment logiki pierwszego rzędu (FOL).

Każdy koncept C może być rozumiany jako formuła FOL:

Dla każdej interpretacji I zbiór elementów I spełniających C(x) jest równy CI.

z jedną zmienną wolną (free) x.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

DL - FOL

Koncept atomowy A odpowiada formule FOL:

Kwantyfikacji egzystencjalnej i ogólnej w DL odpowiadają następujące formuły w FOL:

Przecięciu, sumie i negacji w DL odpowiadają w FOL odpowiednio: koniunkcja, alternatywa i negacja.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

DL - FOL

Ograniczeniom liczbowym odpowiadają formuły:

(zapis w języku DL jest oczywiście bardziej zwarty).

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Terminologia

Aksjomaty terminologiczne opisują jak powiązane są między sobą koncepty (i relacje) i mają postać inkluzji lub równości

gdzie C i D są konceptami (R i S relacjami).

Semantyka aksjomatów jest określona następująco:

Interpretacja I spełnia

jeżeli odpowiednio

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Terminologia

Jeżeli interpretacja I spełnia aksjomat (aksjomaty) wówczas mówimy, że jest modelem aksjomatu (aksjomatów).

Dwa aksjomaty są równoważne jeżeli posiadają te same modele.

Równość (aksjomat) w przypadku której po lewej stronie znaku występuje koncept atomowy nazywamy definicją.

Za pomocą definicji możemy wprowadzać nazwy (symboliczne) dla złożonych opisów.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Terminologia

Przykładowe definicje:

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Terminologia

Skończony zbiór definicji nazywamy terminologią (TBox) jeżeli każda nazwa symboliczna jest zdefiniowana co najwyżej jeden raz.

Innymi słowy dla każdego konceptu atomowego istnieje co najwyżej jedna definicja w której koncept ten występuje po lewej stronie.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Terminologia

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Opis świata

Opis świata (ABox) przyporządkowuje elementy uniwersum (indywidua) poszczególnym konceptom i pokazuje powiązania pomiędzy indywiduami za pomocą relacji.

Niektóre z konceptów wykorzystanych w opisie świata mogą być zdefiniowane w terminologii.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Opis świata

Indywidua oznaczamy małymi literami a, b, c.

Używając koncepty C i relacje R możemy w opisie świata umieszczać następujące asercje:

- asercja koncepcyjna - „a należy do (interpretacji) C”.

- asercja relacyjna - „b jest w relacji R z c”.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Opis świata

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Opis świata

Interpretację terminologii możemy rozszerzyć na opis świata.

Zakładamy, że interpretacja I sładająca się z niepustego zbioru I przypisuje elementy zbioru I indywiduom tzn:

a przypisuje element aII.

Zakładamy, że indywiduom o różnych nazwach

przypisywane są różne elementy (UAN - unique name assumption).

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Opis świata

Mówimy, że interpretacja I spełnia asercje koncepcyjną:

jeżeli:

Mówimy, że interpretacja I spełnia asercje relacyjną:

jeżeli:

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Pytanie 1

Jaki jest związek terminologii (Tbox) i opisów świata (ABox) z poznanymi językami RDF i OWL?

OWL

opisy zasobów w RDF

TBox

ABox

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Pytanie 2

Jakie konstruktory są potrzebne do zbudowania języka OWL DL?

…czyli jakim językiem logicznym jest OWL DL?

OWL SHOIN(D)

Język ten jest bardziej złożony niż języki przez nas poznane.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Nasza ontologia

Jakiego języka logiki wymaga nasza ontologia związana z książkami?

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Nasza ontologia

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Nasza ontologia

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Nasza ontologia

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Nasza ontologia

Ekspresyjność naszej ontologii:

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Wnioskowanie

Systemy reprezentacji wiedzy oparte na logice opisowej umożliwiają wnioskowanie.

Baza wiedzy składająca się z TBox i ABox posiada semantykę, dzięki której równoważna jest zbiorowi aksjomatów w logice pierwszego rzędu.

W konsekwencji baza ta zawiera pewną wiedzę niejawną (implicite knowledge), która dzięki wnioskowaniu może się stać wiedzą jawną (explicite knowledge).

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Wnioskowanie

TBox

ABox

Grandmother(Mary) Marcin Skulimowski, Wydział Fizyki i

Informatyki Stosowanej, Uniwersytet Łódzki 2012

Wnioskowanie

Niech T będzie pewną terminologią (TBox).

Spełnialność (satisfability) Koncept C jest spełnialny (ze względu na T) jeżeli istnieje model I terminologii T taki, że zbiór CI jest niepusty.

Zawieranie (subsumption) Koncept C jest zawarty w koncepcie D jeżeli CIDI dla każdego modelu I terminologii T. Zapisujemy:

lub

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Wnioskowanie

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Wnioskowanie

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Wnioskowanie

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Wnioskowanie

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Wnioskowanie

Równoważność (equivalence) Dwa koncepty C i D są równoważne jeżeli CI=DI dla każdego modelu I terminologii T. Zapisujemy:

lub

Rozłączność (disjointness) Dwa koncepty C i D są rozłączne jeżeli CIDI= dla każdego modelu I terminologii T.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Redukcja do zawierania

Dla konceptów C i D mamy:

• Koncept C jest niespełnialny C jest zawarty w .

• Koncepty C i D są równoważne C jest zawarty w D i D jest zawarty w C.

• Koncepty C i D są rozłączne CD jest zawarty w .

Większość istniejących systemów DL dostarcza operator oraz koncept niespełnialny . W konsekwencji systemy pozwalające sprawdzić zawieranie mogą przeprowadzić wszystkie powyższe wnioskowania.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Redukcja do spełnialności

Dla konceptów C i D mamy:

• Koncept C jest zawarty w D CD jest niespełnialny.

• Koncepty C i D są równoważne CD oraz CD są niespełnialne.

• Koncepty C i D są rozłączne CD jest niespełnialny.

Jeżeli dodatkowo system dostarcza operatora negacji () wówczas wymienione wnioskowania mogą być zredukowane do spełnialności.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Semantyka zamknięta vs. otwarta

Analogia między bazami danych i bazami wiedzy opartymi na DL:

Schemat bazy danych

TBox

Instancja bazy danych

ABox

Istnieje jednak istotna różnica między semantykami instancji bazy danych i ABox!

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Semantyka zamknięta vs. otwarta

Brak informacji w instancji bazy danych interpretowany jest jako informacja negatywna. Brak informacji w Abox interpretowany jest jako brak wiedzy.

Przykład

DB

Peter ma tylko jedno dziecko!

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Semantyka zamknięta vs. otwarta

Przykład (cd)

ABox

Peter ma dziecko o imieniu Harry!

Instancja bazy danych reprezentuje jedną interpretacje schematu bazy. Abox reprezentuje wiele różnych interpretacji (wszystkie swoje modele).

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Semantyka zamknięta vs. otwarta

Według mitu Edyp został wyrzucony z domu w niemowlęctwie, ponieważ prorok ogłosił, że Edyp popełni ojcobójstwo i ożeni się z matką. Przygarnęli go pasterze. Po jakimś czasie Edyp powraca, zabija ojca i poślubia Jokastę, nie wiedząc o swoim pochodzeniu. Z tego związku rodzą się dwaj synowie: Polinik i Eteokles , oraz dwie córki: Antygona i Ismena. Kiedy wieszcz Tejrezjasz wyjawia obojgu prawdę, Jokasta popełnia samobójstwo, a Edyp wykłuwa sobie oczy i opuszcza miasto.

Przykład

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Semantyka zamknięta vs. otwarta

Rozważmy następujący ABox:

(Jokasta, Edyp, Polinik, Tejrezjasz)

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Semantyka zamknięta vs. otwarta

Załóżmy, że interesuje nas odpowiedź na następujące pytanie:

Czy Jokasta ma dziecko, które jest patrycjuszem i samo posiada dziecko nie będące patrycjuszem?

Formalnie:

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Semantyka zamknięta vs. otwarta

Rozwiązanie 1 (semantyka zamknięta)

Edyp jest patrycjuszem. Edyp posiada jedno dziecko (Polinik) Nie wiemy czy Polinik jest patrycjuszem.

Dzieckiem Jokasy jest Edyp.

Edyp nie jest dzieckiem o które nam chodzi.

Nie wiemy czy Polinik jest patrycjuszem. Dzieckiem Jokasy jest Polinik.

Polinik nie jest dzieckiem o które nam chodzi.

Odpowiedź na pytanie jest zatem negatywna. Marcin Skulimowski, Wydział Fizyki i

Informatyki Stosowanej, Uniwersytet Łódzki 2012

Semantyka zamknięta vs. otwarta

Rozwiązanie 2 (semantyka otwarta)

Wszystkie modele naszego ABox mogą być podzielone na dwie grupy:

A. Modele w których Polinik nie jest patrycjuszem.

W modelach z grupy A to Edyp jest dzieckiem o które chodzi w pytaniu.

Odpowiedź na pytanie jest zatem pozytywna.

B. Modele w których Polinik jest patrycjuszem.

W modelach z grupy B to Polinik jest dzieckiem o które chodzi w pytaniu.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012

Open World Assumption

Nie możemy założyć, że coś nie istnieje (nie jest prawdą) dopóki nie jest wprost stwierdzone że to coś nie istnieje (nie jest prawdą)!

W Internecie Semantycznym obowiązuje następująca zasada:

Powyższa zasada ma istotne konsekwencje dla działania resonerów przetwarzających ontologie.

Marcin Skulimowski, Wydział Fizyki i Informatyki Stosowanej, Uniwersytet Łódzki

2012