67
Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool University

Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Онтологии и Представление Знаний

Борис Конев

Department of Computer Science

Liverpool University

Page 2: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Знание – сила

Умные машины должны обладать знанием

• Обработка естественных языков

• Компьютерное зрение

• Решение задач

Знания должны быть

• Адекватными

• Представленными в машинной форме

• Возможность рассуждать и порождать

новые знания

Онтологии и представление знаний, 2010 2

Page 3: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Неявное и явное представление знаний

Что есть знание?

• “Встроенное знание”

– Стратегии

– Эвристики

• “Явное знание”

– Правила / инструкции

Если дымно и жарко надо тушить пожар

– Классификация

Дуб это дерево

– Знания о знаниях

Я знаю, что ты знаешь, что я знаю ...

– …

Онтологии и представление знаний, 2010 3

Page 4: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Умные цитаты

‘… problem solving power exhibited … is primarily a consequence of the specialist

knowledge employed by the agent and only very secondarily related to … a power

of the inference method employed’

(Feigenbaum 1977)

‘The idea of explicit representations of knowledge, manipulated by general purpose

inference algorithms, dates back to the philosopher Leibniz, who envisioned a cal-

culus of propositions that exceed in its scope and power the differential calculus he

has developed’

(Brachman, Levesque and Reiter 1991)

Онтологии и представление знаний, 2010 4

Page 5: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Нельзя объять необъятное

Разные цели требуют разные формализмы

• Системы продукций (правил)

• Семантические сети и фреймы

• Логика

• Экспертные системы

Aim low!(Лучше синица в руке...)

Онтологии и представление знаний, 2010 5

Page 6: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Представление знаний для доступа и обмена информацией

Наша цель:

• Общий язык

• Общее понимание терминов

Онтологии и представление знаний, 2010 6

Page 7: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Семантическая Всемирная Паутина (Semantic Web)

Мы пользуемся Синтаксической Всемирной Паутиной

@@

@@

@@R

��

��ресурс

��

��ресурс

��

��ресурс

��

��ресурс

��

��ресурс

AAAAU

HHHHHHHj

�����*

@@

@@

@R��������

6

��������9

href

href href

href

href

href

href

Онтологии и представление знаний, 2010 7

Page 8: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Синтаксическая Всемирная Паутина...

Компьютеры предоставляют информацию (просто),

а люди собирают и интерпретируют (сложно).

• Электронные библиотеки

Страницы, объединенные ссылками

• Базы данных

Доступ к данным через веб-страницу

• Мультимедиа

Интернет-радио.

• Системы наименования

уникальный идентификатор

Онтологии и представление знаний, 2010 8

Page 9: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что нам нужно?

• Сложные запросы, требующие доступа к неявным знаниям

Найти информацию о “животных, которые пользуются эхолокацией но не

являются дельфинами или летучими мышами”

Онтологии и представление знаний, 2010 9

Page 10: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что нам нужно?

• Сложные запросы, требующие доступа к неявным знаниям

Найти информацию о “животных, которые пользуются эхолокацией но не

являются дельфинами или летучими мышами”

(Обыкновенная сипуха)

Онтологии и представление знаний, 2010 9

Page 11: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что нам нужно?

• Сложные запросы, требующие доступа к неявным знаниям

Найти информацию о “животных, которые пользуются эхолокацией но не

являются дельфинами или летучими мышами”

(Обыкновенная сипуха)

• Поиск информации в хранилищах данных

Как проехать?

Цены на товары и услуги

Результаты экспериментов

Онтологии и представление знаний, 2010 9

Page 12: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что нам нужно?

• Сложные запросы, требующие доступа к неявным знаниям

Найти информацию о “животных, которые пользуются эхолокацией но не

являются дельфинами или летучими мышами”

(Обыкновенная сипуха)

• Поиск информации в хранилищах данных

Как проехать?

Цены на товары и услуги

Результаты экспериментов

• Поиск и использование “интернет-сервисов”

Визуализация взаимодействия белков

Онтологии и представление знаний, 2010 9

Page 13: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что нам нужно?

• Сложные запросы, требующие доступа к неявным знаниям

Найти информацию о “животных, которые пользуются эхолокацией но не

являются дельфинами или летучими мышами”

(Обыкновенная сипуха)

• Поиск информации в хранилищах данных

Как проехать?

Цены на товары и услуги

Результаты экспериментов

• Поиск и использование “интернет-сервисов”

Визуализация взаимодействия белков

• Передача сложных задач “агентам”

Купить путевку в теплые края, не очень далеко, где говорят по-русски

Онтологии и представление знаний, 2010 9

Page 14: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

В чем проблема?

Типичная веб-страница

• Разметка:

– как отрисовывать (размер

и цвет шрифтов)

– Гиперссылки на

родственные страницы

• Семантическое содержание

доступно людям но не

компьютерам...

Онтологии и представление знаний, 2010 10

Page 15: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что видим мы...

WWW2007

The sixteenth International World Wide Web Conference

May 8–12, 2007

Banff, Alberta, Canada

Preliminary Call for Papers

The International World Wide Web Conference Committee (IW3C2) cordially invites you to participate in

the 16th International World Wide Web Conference (WWW2007) to be held on May 8-12, 2007 in Banff,

Canada.

The first WWW conference was held in 1994 at CERN, where the Web was born. Since then, the conference

series has become the premier venue for academics and industry to present, demonstrate, and discuss

the latest ideas about the Web.

WWW2007 will be held in Banff, Alberta, Canada at the world-famous Fairmont Banff Springs Hotel. The

technical program for the five-day conference will include refereed paper presentations, plenary sessions,

panels, and poster sessions, as well as tutorials, workshops, and special sessions for Web developers,

historians, and visionaries.

Онтологии и представление знаний, 2010 11

Page 16: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что видят машины...

WWW2007

The sixteenth International World Wide Web Conference

May 8--12, 2007

Banff, Alberta, Canada

Preliminary Call for Papers

The International World Wide Web Conference Committee (IW3C2)cordially invites you to participate in the 16th InternationalWorld Wide Web Conference (WWW2007) to be held on May 8-12, 2007 inBanff, Canada.

The first WWW conference was held in 1994 at CERN, where the Web was

born. Since then, the conference series has become the premier

venue for academics and industry to present, demonstrate, and dis-

cuss the latest ideas about the Web. WWW2007 will be held in Banff,

Alberta, Canada at the world-famous Fairmont Banff Springs Hotel.

The technical program for the five-day conference will include ref-

ereed paper presentations, plenary sessions, panels, and poster

sessions, as well as tutorials, workshops, and special sessions

for Web developers, historians, and visionaries.

Онтологии и представление знаний, 2010 12

Page 17: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Решение: XML разметка?

<name>WWW2007

The sixteenth International World Wide Web Conference</name><date>May 8–12, 2007</date><location>Banff, Alberta, Canada</location><slogan>Preliminary Call for Papers</slogan>

<announcement>The International World Wide Web Conference Committee (IW3C2) cordially invites

you to participate in the 16th International World Wide Web Conference (WWW2007) to be held on May

8-12, 2007 in Banff, Canada.</announcement>

<statement>The first WWW conference was held in 1994 at CERN, where the Web was born. Since

then, the conference series has become the premier venue for academics and industry to present, demon-

strate, and discuss the latest ideas about the Web. WWW2007 will be held in Banff, Alberta, Canada at

the world-famous Fairmont Banff Springs Hotel. The technical program for the five-day conference will

include refereed paper presentations, plenary sessions, panels, and poster sessions, as well as tutorials,

workshops, and special sessions for Web developers, historians,

and visionaries.</statement>

Онтологии и представление знаний, 2010 13

Page 18: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Есть ли разница с...

<name>WWW2007

The sixteenth International World Wide Web Conference</name>

<date>May 8--12, 2007</date>

<location>Banff, Alberta, Canada</location>

<slogan>Preliminary Call for Papers</slogan>

<announcement>The International World Wide Web Conference Committee

(IW3C2) cordially invites you to participate in the 16th Interna-

tional World Wide Web Conference (WWW2007) to be held on May 8-12,

2007 in Banff, Canada.</announcement>

<statement>The first WWW conference was held in 1994 at CERN, where

the Web was born. Since then, the conference series has become the

premier venue for academics and industry to present, demonstrate,

and discuss the latest ideas about the Web. WWW2007 will be held in

Banff, Alberta, Canada at the world-famous Fairmont Banff Springs

Hotel... </statement>

Онтологии и представление знаний, 2010 14

Page 19: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Машины понимают только...

<name>WWW2007

The sixteenth International World Wide Web Conference</name>

<date>May 8--12, 2007</date>

<location>Banff, Alberta, Canada</location>

<slogan>Preliminary Call for Papers</slogan>

<announcement>The International World Wide Web Conference Com-

mittee (IW3C2) cordially invites you to participate in the 16th

International World Wide Web Conference (WWW2007) to be held on May

8-12, 2007 in Banff, Canada.</announcement>

<statement>The first WWW conference was held in 1994 at CERN, where

the Web was born. Since then, the conference series has become the

premier venue for academics and industry to present, demonstrate,

and discuss the latest ideas about the Web. WWW2007 will be held in

Banff, Alberta, Canada at the world-famous Fairmont Banff Springs

Hotel... </statement>

Онтологии и представление знаний, 2010 15

Page 20: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Требуется явно задать семантику

Соглашение о значении тегов

Использовать Онтологии чтобы описать теги

• Онтологии определяют словарь терминов

• Новые термины могут быть определены как комбинации старых

Онтологии и представление знаний, 2010 16

Page 21: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Опасайтесь преждевременных выводов

• Суета вокруг Семантической Паутины предполагает

Семантика + Web = ИИ

Онтологии и представление знаний, 2010 17

Page 22: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Опасайтесь преждевременных выводов

• Суета вокруг Семантической Паутины предполагает

Семантика + Web = ИИ

• Более реалистичный сценарий

Семантика + Web + ИИ = лучшая Web

Онтологии и представление знаний, 2010 17

Page 23: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Онтологии: происхождение и история

Онтология в Философии

oντoλoγiα раздел философии, изучающий бытие

• Наука бытия (Аристотель, Метафизика, IV, 1)

• Попытка ответить на вопросы

– Что характеризует бытие?

– Что есть?

• Классификация бытия

– Как классифицировать то, что есть?

Онтологии и представление знаний, 2010 18

Page 24: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Онтология в философии

• Что существует?

• Что значит, что “что-то существует”?

• Существуют ли абстрактные вещи?

• Что такое объект?

Ontology in Philosophy

In philosophy, ontology is the study of being or existence.

It aims to find out what entities and types of entities exist:

• What exists?

• Is existence a property?

• What is an object?

• Do non-physical(abstract) objects exist?

• How thingsshould be classified?

Aristotle’s ontology:

Semantic Web 2009 (1) http://www.dcs.bbk.ac.uk/~michael/sw/sw.html 28

Онтологии и представление знаний, 2010 19

Page 25: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Онтологии в информатике

“An explicit specification of a conceptualization”

“Явная спецификация концептуализации”[Tom Gruber 1993]

абстрактная модель

какой-то области

6

– классы/концепции/понятия

– свойства и атрибуты классов

– свойства свойств

– экземпляры

6

Онтология задает

– Общий язык

– Общее понимание

Онтологии и представление знаний, 2010 20

Page 26: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Таксономия

Таксономия учение о принципе и практике классификаций.Происходит от греческого ταξις (‘порядок’) и νoµoς (‘закон’ или ‘наука’)

• Классификация Линнея(Карл Линней, 1707–1778)

Службы каталогов

• Yahoo! Web Directory (http://dir.yahoo.com/)

• Open Directory Project 590,000 категорий (http://dmoz.org/)

• Каталог интернет-магазина

Онтологии и представление знаний, 2010 21

Page 27: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Почти философия

• CYC, онтология верхнего уровня (проект начат в 1994)

http://www.opencyc.org/

самая большая и полная база знаний в мире

Онтологии и представление знаний, 2010 22

Page 28: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

e-Science

• GO: http://www.geneontology.org/,

• MGED: http://mged.sourceforge.net/ontologies/MGEDontology.php, …

Онтологии и представление знаний, 2010 23

Page 29: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Медицина

• Snomed, NCI, Galen и FMA

(полу-) автоматическое ведение медицинских записей

Разные термины могут обозначать одно и то же: ‘стенокардия’ и ‘грудная жаба’

Онтологии и представление знаний, 2010 24

Page 30: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Каталогизация информации

• UN-FAO, NASA, Ordnance Survey, General Motors, Lockheed Martin, …

Онтологии и представление знаний, 2010 25

Page 31: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Структура онтологий

Обычно онтологии имеют две части:

• Названия важных понятий (теги)

– Слон

– Травоядное

– Взрослый_Слон

• Информацию/знание о домене

– Взрослый_Слон весит по крайней мере 2 тонны

– Слон бывает либо Африканский_Слон либо Индийский_Слон

Онтологии и представление знаний, 2010 26

Page 32: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Что будет дальше?

• Формализмы построения онтологий и терминологий

• Логический анализ

• Баланс между выразительной силой и вычислительной сложностью

• Применения к био- и медицинской информатике

Онтологии и представление знаний, 2010 27

Page 33: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Онтологии и Представление Знаний

Борис Конев

Department of Computer Science

Liverpool University

Page 34: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Язык представления онтологий

Должен иметь

• четкий синтаксис

машина будет читать

• формальную семантику

точное понимание, возможность автоматического анализа

• эффективный автоматический анализ

• достаточную выразительную силу

Онтологии и представление знаний, 2010 29

Page 35: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Структурные объекты

• Куиллиан (1966, ’68) — семантические сети

• Минский (1974) — фреймы

• Чень (1976) — ER-диаграммы

Онтологии и представление знаний, 2010 30

Page 36: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Пример: анализ ER-диаграмм

..Студенты

.ISA

.disjoint

.Ф-т информатики .Биолого-почвенный ф-т

.ISA

.disjoint

.Практики .Теоретики

.ISA

.Биологи .Почвенники

Онтологии и представление знаний, 2010 31

Page 37: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Пример: анализ ER-диаграмм

..Студенты

.ISA

.disjoint

.Ф-т информатики .Биолого-почвенный ф-т

.ISA

.disjoint

.Практики .Теоретики

.ISA

.Биологи .Почвенники

Онтологии и представление знаний, 2010 32

Page 38: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Пример: анализ ER-диаграмм

..Студенты

.ISA

.disjoint

.Ф-т информатики .Биолого-почвенный ф-т

.ISA

.disjoint

.Практики .Теоретики

.ISA

.Биологи .Почвенники

Информатики ≡ практики

Онтологии и представление знаний, 2010 33

Page 39: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Не все так просто

• Собаки кусают почтальонов

..кусает.Собака.*

.Почтальона.*

• Все собаки кусают одного почтальона

..кусает.Собака.*

.Почтальона.1

• Одна собака кусает всех почтальонов

..кусает.Собака.1

.Почтальона.*

Анализ становится все сложнее...

Онтологии и представление знаний, 2010 34

Page 40: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Логика предикатов спешит на помощь

• Собаки (все) кусают почтальонов (всех)

∀x, y(dog(x) ∧ postman(y) ⇒ bites(x, y))

• Все собаки кусают одного почтальона

∃y(postman(y) ∧ ∀x(dog(x) ⇒ bites(x, y))))

• Одна собака кусает всех почтальонов

∃x(dog(x) ∧ ∀x(postman(x) ⇒ bites(x, y))))

• …

Онтологии и представление знаний, 2010 35

Page 41: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Тут бы нам и разойтись, но...

• Логика предикатов слишком сложная, не визуализируется...

(пользователи!)

• Структура может запутаться

∃y(postman(y) ∧ ∀x(dog(x) ⇒ bites(x, y))))

∃x(dog(x) ∧ ∀x(postman(x) ⇒ bites(x, y))))

• Логика предикатов неразрешима

• Не все (даже разрешимые) свойства можно выразить в логике первого порядка

(транзитивное замыкание)

Онтологии и представление знаний, 2010 36

Page 42: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Языки представления онтологий

Слабые языке:

• ER-модели, UML-диаграммы.

• RDFS the Resource Description Framework, with schema vocabulary.

– Рекомендован W3C 1999, 2004.

Более выразительные языки

• Дескрипционные логики, OWL (Web Ontology Language)

– Рекомендован W3C 2004, 2009.

• Правила (RuleML, LP, Prolog);

• Графы концепций;

• Предикатная логика.

Онтологии и представление знаний, 2010 37

Page 43: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDF — модель представления данных

RDF означает Resource Description Framework

(Схема Описания Ресурсов) http://www.w3.org/RDF/

• Ресурсы идентифицируются при помощи ссылок (URI)

• Утверждения описывают свойства ресурсов при помощи троек вида

.

.

субъект.

.

объект-свойство

Онтологии и представление знаний, 2010 38

Page 44: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDF — модель представления данных

RDF означает Resource Description Framework

(Схема Описания Ресурсов) http://www.w3.org/RDF/

• Ресурсы идентифицируются при помощи ссылок (URI)

• Утверждения описывают свойства ресурсов при помощи троек вида

.

.

субъект.

.

объект-свойство

6ресурс(URI)

книга

издатель

место

человек

Онтологии и представление знаний, 2010 38

Page 45: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDF — модель представления данных

RDF означает Resource Description Framework

(Схема Описания Ресурсов) http://www.w3.org/RDF/

• Ресурсы идентифицируются при помощи ссылок (URI)

• Утверждения описывают свойства ресурсов при помощи троек вида

.

.

субъект.

.

объект-свойство

6ресурс(URI)

книга

издатель

место

человек

6

свойство(URI)

написана

название

Онтологии и представление знаний, 2010 38

Page 46: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDF — модель представления данных

RDF означает Resource Description Framework

(Схема Описания Ресурсов) http://www.w3.org/RDF/

• Ресурсы идентифицируются при помощи ссылок (URI)

• Утверждения описывают свойства ресурсов при помощи троек вида

.

.

субъект.

.

объект-свойство

6ресурс(URI)

книга

издатель

место

человек

6

свойство(URI)

написана

название

6значение(константа или URI)

Онтологии и представление знаний, 2010 38

Page 47: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDF — модель представления данных

RDF означает Resource Description Framework

(Схема Описания Ресурсов) http://www.w3.org/RDF/

• Ресурсы идентифицируются при помощи ссылок (URI)

• Утверждения описывают свойства ресурсов при помощи троек вида

.

.

субъект.

.

объект-свойство

6ресурс(URI)

книга

издатель

место

человек

6

свойство(URI)

написана

название

6значение(константа или URI)

• Сами свойства идентифицируются ссылками и, поэтому, являются ресурсами

Онтологии и представление знаний, 2010 38

Page 48: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDF и представление графами

(1) Тройки ‘⟨ subject, predicate, object ⟩’

⟨kr, name, “Онтологии и представление знаний”⟩⟨kr, isTaughtBy, BK⟩⟨kr, homepage, http://logic.pdmi.ras.ru/csclub/courses/ontology⟩⟨BK, name, “Борис Конев”⟩

Онтологии и представление знаний, 2010 39

Page 49: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDF и представление графами

(1) Тройки ‘⟨ subject, predicate, object ⟩’

⟨kr, name, “Онтологии и представление знаний”⟩⟨kr, isTaughtBy, BK⟩⟨kr, homepage, http://logic.pdmi.ras.ru/csclub/courses/ontology⟩⟨BK, name, “Борис Конев”⟩

(2) Граф

.

.

kr.

.

BK

“Онтологии и представление знаний”“Борис Конев”

.

.

http://logic.pdmi.ras.ru/csclub/courses/ontology

@@

@Rhomepage

-isTaughtBy�

���name

6name

Онтологии и представление знаний, 2010 39

Page 50: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Проблема троек

• В RDF используются только бинарные отношения:

Что делать с

referee(X, Y, Z): ‘X — судья в игре между Y и Z’?

Онтологии и представление знаний, 2010 40

Page 51: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Проблема троек

• В RDF используются только бинарные отношения:

Что делать с

referee(X, Y, Z): ‘X — судья в игре между Y и Z’?

Возможное решение: ввести анонимный ресурс

.

.

X.

.

.

.

Y

.

.

Z

-referee �������:player1

XXXXXXXzplayer2

<rdf:Description rdf:ID=′′X′′><referee>

<rdf:Description><player1 rdf:resource=′′#Y′′/><player2 rdf:resource=′′#Z′′/>

</rdf:Description></referee>

</rdf:Description>

Онтологии и представление знаний, 2010 40

Page 52: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Синтаксис RDF

На основе XML:

• Каждый тэг description описывает ресурс

• Каждый вложенный элемент или атрибут является свойством ресурса

<rdf:Description rdf:about=′′#kr′′>

<csclub:isTaughtBy rdf:resource=′′#BK′′/>

<csclub:name>Онтологии и представление знаний</csclub:name>

<csclub:homepage rdf:resource=′′http://logic.pdmi.ras.ru/csclub/courses/ontology′′/>

</rdf:Description>

<rdf:Description rdf:about=′′#BK′′>

<csclub:name>Борис Конев</csclub:name>

</rdf:Description>

Онтологии и представление знаний, 2010 41

Page 53: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDFS — схема RDF

• RDF предоставляет возможность описать свойства ресурсов, но не позволяет выразить

отношения между свойствами и классами ресурсов, такие, например, как subClassOf

или rdf:type

– интерпретируются как произвольное бинарное отношение

Онтологии и представление знаний, 2010 42

Page 54: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

RDFS — схема RDF

• RDF предоставляет возможность описать свойства ресурсов, но не позволяет выразить

отношения между свойствами и классами ресурсов, такие, например, как subClassOf

или rdf:type

– интерпретируются как произвольное бинарное отношение

• RDFS (RDF Scheme) придает семантику таким отношениям

– ⟨Person, subClassOf, Animal⟩ (все) люди — животные

– ⟨Person, type, Class⟩ Person это класс (множество) объектов

– ⟨isTaughtBy, type, Property⟩ isTaughtBy это свойство

– ⟨isTaughtBy, range, Person⟩ тот, кто учит — человек

– ...

Онтологии и представление знаний, 2010 42

Page 55: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Трудности с семантикой RDFS

• Нет различий между классами и индивидуумами

⟨Species, type, Class⟩⟨Lyon, type, Species⟩⟨Leo, type, Lion⟩

• У свойств могут быть свойства

⟨hasDaughter, type, familyProperty⟩

• “Зарезервированные слова” можно переопределять

⟨type, range, Class⟩⟨Property, type, Class⟩⟨Class, type, Class⟩

Привет, Бертранд Рассел...

“Нестандартная” семантика

Онтологии и представление знаний, 2010 43

Page 56: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Семантика RDF

Семантика RDF задается при помощи RDF Model Theory;

см. http://www.w3.org/TR/rdf-mt/

• V — множество имен (ссылки и константы), входящих в RDF-тройки

• RDF-интерпретация V задается:

– IR, непустое множество ресурсов (домен)

Онтологии и представление знаний, 2010 44

Page 57: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Семантика RDF

Семантика RDF задается при помощи RDF Model Theory;

см. http://www.w3.org/TR/rdf-mt/

• V — множество имен (ссылки и константы), входящих в RDF-тройки

• RDF-интерпретация V задается:

– IR, непустое множество ресурсов (домен)

– IP ⊆ IR, множество свойств (каждое свойство — ресурс)

(символ v ∈ V является ресурсом т. и т.т. IS(v) ∈ IP )

Онтологии и представление знаний, 2010 44

Page 58: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Семантика RDF

Семантика RDF задается при помощи RDF Model Theory;

см. http://www.w3.org/TR/rdf-mt/

• V — множество имен (ссылки и константы), входящих в RDF-тройки

• RDF-интерпретация V задается:

– IR, непустое множество ресурсов (домен)

– IP ⊆ IR, множество свойств (каждое свойство — ресурс)

(символ v ∈ V является ресурсом т. и т.т. IS(v) ∈ IP )

– IS: V → IR, интерпретация ресурсов(с каждым элементом V ассоциирован ресурс)

Онтологии и представление знаний, 2010 44

Page 59: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Семантика RDF

Семантика RDF задается при помощи RDF Model Theory;

см. http://www.w3.org/TR/rdf-mt/

• V — множество имен (ссылки и константы), входящих в RDF-тройки

• RDF-интерпретация V задается:

– IR, непустое множество ресурсов (домен)

– IP ⊆ IR, множество свойств (каждое свойство — ресурс)

(символ v ∈ V является ресурсом т. и т.т. IS(v) ∈ IP )

– IS: V → IR, интерпретация ресурсов(с каждым элементом V ассоциирован ресурс)

– IEXT : IP → 2IR×IR, интерпретация свойств(свойства — бинарные отношения, т.е., подмножества IR × IR)

Онтологии и представление знаний, 2010 44

Page 60: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Семантика RDF

Семантика RDF задается при помощи RDF Model Theory;

см. http://www.w3.org/TR/rdf-mt/

• V — множество имен (ссылки и константы), входящих в RDF-тройки

• RDF-интерпретация V задается:

– IR, непустое множество ресурсов (домен)

– IP ⊆ IR, множество свойств (каждое свойство — ресурс)

(символ v ∈ V является ресурсом т. и т.т. IS(v) ∈ IP )

– IS: V → IR, интерпретация ресурсов(с каждым элементом V ассоциирован ресурс)

– IEXT : IP → 2IR×IR, интерпретация свойств(свойства — бинарные отношения, т.е., подмножества IR × IR)

Тройка ⟨s, p, o⟩ истинна в I т. и т.т.

s, p, o ∈ V , IS(p) ∈ IP и (IS(s), IS(o)) ∈ IEXT (IS(p))

Онтологии и представление знаний, 2010 44

Page 61: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Пример

Построим интерпретацию, в которой следующий RDF-граф истинен

.

.

kr.

.

BK

“Онтологии и представление знаний”“Борис Конев”

.

.

http://logic.pdmi.ras.ru/csclub/courses/ontology

@@

@Rhomepage

-isTaughtBy�

���name

6name

Онтологии и представление знаний, 2010 45

Page 62: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Пример

Построим интерпретацию, в которой следующий RDF-граф истинен

.

.

kr.

.

BK

“Онтологии и представление знаний”“Борис Конев”

.

.

http://logic.pdmi.ras.ru/csclub/courses/ontology

@@

@Rhomepage

-isTaughtBy�

���name

6name

5 6

9

4

3

1 1

78

IR = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} and IP = {1, 2, 3, 4}

IS(name) = 1, IS(isTaughtBy) = 3, IS(homepage) = 4, IS(kr) = 5,

IS(BK) = 6, IS(http://logic.pdmi.ras.ru/csclub/courses/ontology) = 9,

IS(“Онтологии и представление знаний”) = 7, IS(“Борис Конев”) = 8

IEXT (1) = {(5, 7), (6, 8)}, IEXT (3) = {(5, 6)}, IEXT (4) = {(5, 9)}

Онтологии и представление знаний, 2010 45

Page 63: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Проблемы с RDFS

• RDFS не достаточно выразителен

– Нет локализованных ограничений на домен и множество значений

(множество значений свойства hasChild является людьми, когда применяется к человеку и

слонами когда применяется к слонам)

Онтологии и представление знаний, 2010 46

Page 64: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Проблемы с RDFS

• RDFS не достаточно выразителен

– Нет локализованных ограничений на домен и множество значений

(множество значений свойства hasChild является людьми, когда применяется к человеку и

слонами когда применяется к слонам)

– Нет ограничений на существование и мощность

(у всех людей есть мать, которая тоже человек,

у матери-героини больше двух детей)

Онтологии и представление знаний, 2010 46

Page 65: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Проблемы с RDFS

• RDFS не достаточно выразителен

– Нет локализованных ограничений на домен и множество значений

(множество значений свойства hasChild является людьми, когда применяется к человеку и

слонами когда применяется к слонам)

– Нет ограничений на существование и мощность

(у всех людей есть мать, которая тоже человек,

у матери-героини больше двух детей)

– Не определяются транзитивные, обратные или симметричные свойства

(свойство isPartOf транзитивное,

свойство hasPart обратно isPartOf

свойство touches симметрично)

Онтологии и представление знаний, 2010 46

Page 66: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Проблемы с RDFS

• RDFS не достаточно выразителен

– Нет локализованных ограничений на домен и множество значений

(множество значений свойства hasChild является людьми, когда применяется к человеку и

слонами когда применяется к слонам)

– Нет ограничений на существование и мощность

(у всех людей есть мать, которая тоже человек,

у матери-героини больше двух детей)

– Не определяются транзитивные, обратные или симметричные свойства

(свойство isPartOf транзитивное,

свойство hasPart обратно isPartOf

свойство touches симметрично)

– ...

Онтологии и представление знаний, 2010 46

Page 67: Department of Computer Science Liverpool University · Онтологии и Представление Знаний Борис Конев Department of Computer Science Liverpool

Проблемы с RDFS

• RDFS не достаточно выразителен

– Нет локализованных ограничений на домен и множество значений

(множество значений свойства hasChild является людьми, когда применяется к человеку и

слонами когда применяется к слонам)

– Нет ограничений на существование и мощность

(у всех людей есть мать, которая тоже человек,

у матери-героини больше двух детей)

– Не определяются транзитивные, обратные или симметричные свойства

(свойство isPartOf транзитивное,

свойство hasPart обратно isPartOf

свойство touches симметрично)

– ...

• Трудности с логическим анализом

– Нет средств, поддерживающих нестандартную семантику

– Структурные алгоритмы

Онтологии и представление знаний, 2010 46