39
Cztery Wykłady Słupskie

Four Slupsk Lectures. II. Semantic Web

Embed Size (px)

Citation preview

Cztery Wykłady Słupskie

Czym jest w istocie Sztuczna

Inteligencja?

http://ml.ms/slupskAI

Ewolucja Internetu

Co to jestBitcoin

i Blockchain?

Czym jest „Cyfrowość”

(Digital)?

Ewolucja Internetu

Plan wykładu

Ewolucja sieci WEB

SIEĆ WEB MA TYLKO (AŻ ?) 10224 DNI (28 LAT) SWOJEJ HISTORII.

Print – 206,700 days*

Newspapers – 168,000 days

Radio – 35,140 days

TV – 28,100 days

Inne media:

*1450 –Gutenberg’s Bible

1605 – Relation aller Fürnemmen und gedenckwürdigen Historien by Johann Carolus (Strasbourg)

https://en.wikipedia.org/wiki/Johann_Carolus

1920 (August 31) – by station 8MK in Detroit, Michigan

1939 (September)– experimental TV broadcasting by RCA

Source of the picture: Brad Acker Post at: https://plus.google.com/+BradAcker/posts/aB7zmFrmDz7

NARODZINY – MARCH 1989

„Information Management: A Proposal”

PIERWSZY SERWER SIECI WEB – DECEMBER 1990

http://info.cern.ch (CERN)

WEB 1.0 — WEB OF DOCUMENTSHYPERLINKED WEBSITES

WEB 2.0 — READ-WRITE WEB SOCIAL MEDIA, WEB APIS

WEB 3.0 — WEB OF DATA SEMANTIC WEB (INCL. LINKED DATA) = WEB FULL OF MEANING

* I consider the publication of Tim Berners-Lee „Information Management: A Proposal” as the birthday of the Web

1989-2000 - SIEĆ DOKUMENTÓW POWIĄZANYCH HYPERLINKAMI

2000-2010 - SIEĆ SIECI SPOŁECZNOŚCIOWYCH

2003-2010 – THE WEB OF APIs

2010-2020(?) - LINKED DATA WEB, SEMANTIC WEB

Link

Link

Link

Link

Link

Link

Link

Link

LinkLink

Resource

Resource

Resource

Resource

Resource

Resource

Resource

Resource

hasPeople

humanResources

hasServices

hasProducts

hasPeople

hasPeople

hasProduct

hasProduct

colleaguecolleague

Organization

HR

Services

Products

People

People

Product

Product

Sir Tim Berners-Lee

Seminal article: „Semantic Web” Scientific American - May 2001 with James Handler and Ora Lassila

Linked Open Data - 5 STAR Open Datahttp://5stardata.info/en/

The Next Webhttp://www.ted.com/talks/tim_berners_lee_on_the_next_web

Co jest nie tak z dzisiejszą siecią?

The WEB is BIG*

“Between the birth of the world and 2003, there were five exabytes of information created. We [now] create five exabytes every two days. See why it’s so painful to operate in information markets?”

Eric Schmidt, CEO, Google, 2010

*Not a bad thing in itself The problem is we no longer know how to explore/use it!

31EB

44EB

59EB

77EB

94EB

110EB

2011 2012 2013 2014 2015 2016

Exabytes per MonthSource: Cisco VNI Global Forecast,2011-2016

The WEB is TOO BIG to KNOW

„... the Net can scale that large only because it doesn’t have edges within which knowledge has to squeeze. No edges mean no shape. And no shape means that networked knowledge lacks what we have long taken to be essential to the structure of knowledge: a foundation.”

„On the Net, every fact has an equal and opposite reaction”

David Weinberger „Too Big to Know – Rethinking Knowledge Now That the Facts Aren't the Facts, Experts Are Everywhere, and the Smartest Person in the Room Is the Room”

Zbyt wielki aby go znać – Przemyśleć Wiedzę – Zrozumieć że fakty niesą faktami, eksperci są wszędzie a najzdolniejszą osobą na Sali jest sama Sala.

Web 2.0dwells in isolated Silos

Web APIsdwell in isolated Silostoo

Sieć Pełna Znaczeń

PODSTAWY SIECI PEŁNEJ ZNACZEŃ

Pojęcie „Semantic” w „Semantic Web” wskazuje na ZNACZENIE danych, a nie na ich składnię,

język lub formę zapisu.

„Semantic Web to informacja aktywna (actionable Information), będącą ewolucją

wcześniejszych danych statycznych (...)” (N.Shadbolt,W.Hall,T.Berners-Lee)

Semantic Web to reprezentacja uogólnionych RZECZY (obiektów oraz konceptów) i ich

własności w sieci Web, a nie tylko dokumentów.

JAK REPREZENTUJEMY RZECZY (OBIEKTY I KONCEPCJE) W SIECI PEŁNEJ ZNACZEŃ?

W sieci Semantycznej reprezentujemy OBIEKTY ŚWIATA RZECZYWISTEGOza pomocą „atomowej” (niepodzielnej) struktury danych: TRÓJKI (TRIPLE)

W ten sposób możemy kreować logiczne I strukturalne relacje pomiędzy trójkami, budować

taksonomie, słowniki i ostatecznie “rozumować” na dużych strukturach danych.

:RenaultClioSport :VIN_Number „ VF1CRCJ0H42590904”

Na przykład:

Resource Description Framework

hasEngine :2.0_litre_straight_4

Trójki przechowujemy w różnych formatach które mają wspólny model danych: RDF.

„RDF jest tym dla RZECZY czym HTML dla DOKUMENTÓW”

Subject Predicate Object

Thing Property Value

Podmiot Orzeczenie Dopełnienie

JAK IDENTYFIKUJEMY RZECZYW SIECI PEŁNEJ ZNACZEŃ?

W celu jednoznacznej identyfikacji rzeczy (obiektów oraz konceptów) oraz ich własności,

Sieć Pełna Znaczeń używa identyfikatorów URI — Universal Resource Identifiers – będących

generalizacją zwykłych adresów sieci Web!

Renault Clio VIN Number „ VF1CRCJ0H42590904”

http://www.renault.co.uk/cars/model/new-clio/product.aspx

http://purl.org/vso/ns#VIN A number

N.Shadbolt,W.Hall,T.Berners-Lee

RDF - PRZYKŁAD mSys

cart

p1

gc:contains

gc:usesType

A1gc:isPositionFor

gc:Point

rdf:type

0.06968 1.299703 0.021584gc:hasXValue

gc:hasYValuegc:hasZValue

p2

A2gc:isPositionFor

rdf:type

1.000204 1.658998 0.011623gc:hasXValue

gc:hasYValuegc:hasZValue

p9

A7gc:isPositionFor

1.000204 1.658998 0.01162361gc:hasVectorValue

.

rdf:type

gc:MolecularSystemrdf:type

gc:CartesianCoordinatesrdf:tpye

Przykład: Chemical Semantics

NATURA POWIĄZAŃ (LINKS) W SIECI PEŁNEJ ZNACZEŃ

Semantic Web wiąże RZECZY, a nie tylko dokumenty

Powiązania w Semantic Web można kategoryzować: RDF pozwala na jawną deklarację typu

powiązań

Store 1 Store 2

COMPANY

gr:Offering

gr:Offering

gr:availableAtOrFrom

gr:hasPOS

gr:offers

gr:hasPOS

gr:offers

gr:availableAtOrFrom

GGG – term coined by Tim Berners Lee in 2007

Organization

HR

Services

Products

People

People

Product

Product

hasPeople

humanResource

s

hasServic

es

hasProducts

hasPeople

hasPeople

hasProdu

ct

hasProdu

ct

colleaguecolleague

Ooops… sorry, but it’s

BIG

NIEKTÓRE ISTNIEJĄCE WIELKIE GRAFY SEMANTYCZNE

169,772,511 facts

SIEĆ TO NIE WSZYSTKO …

Store 1 Store 2

COMPANY

gr:Offering

gr:Offering

gr:availableAtOrFrom

gr:hasPOS

gr:offers

gr:hasPOS

gr:offers

gr:availableAtOrFrom

?Typy i własności opisywane są w ontologiach

Gdzie definiujemy klasy i ich własności dla obiektówopisywanych w grafach semantycznych ?

ZNACZENIE ONTOLOGIIW SIECIACH SEMANTYCZNYCH

“W filozofii, ontologia jest teorią o naturze istnienia (realnego lub możliwego), oraz o typach rzeczy istniejących – ontologia jako dyscyplina filozoficzna zajmuje się studiami nad takimi teoriami.

Naukowcy zajmujący się Sztuczną Inteligencją oraz siecią Web adoptowali to pojęciedo własnego żargonu – dla nich Ontologia jest dokumentem lub plikiem jaki formalnie definiuje relacje pomiędzy terminami.

Najczęściej występującymi rodzajami ontologii w sieci Web są taksonomie uzupełnione o zestaw reguł wnioskowania”

Tim Berners-Lee, James Hendler and Ora Lassila “The Semantic Web”

PRAKTYCZNE ONTOLOGIE

Prof. Martin Hepp o praktycznych ontologiach:

Zapewniają wspólny system typów użyteczny w różnych, nawet odrębnych systemach

Poprawiają rzetelność informacji o typach obiektów jednostkowych

Dostarczają reguł, które opisują dorozumiane (implicit) fakty i pozwalają na ich podstawie

wnioskować jawne fakty

GDZIE MOŻNA DZIŚ „WIDZIEĆ” SEMANTIC WEB?

Knowledge Graphzbudowany na bazie

Freebase

Schema.orgnajważniejszy słownik

(niemal ontologia )

w sieci Web

GDZIE MOŻNA DZIŚ „WIDZIEĆ”SEMANTIC WEB?

http://geneontology.org

http://purl.org/gc

http://chemicalsemantics.com

GDZIE MOŻNA DZIŚ „WIDZIEĆ”SEMANTIC WEB?

Microsoft Cortana

Używa SATORI

– repozytorium grafowego

zaimplementowanego

z użyciem Semantycznej Bazy

Microsoft TRINITY.

https://www.microsoft.com/en-us/research/project/trinity/

Podobnych technologii używa Apple Siri, Google Now oraz Amazon Alexa

May 13, 2015

– official introduction

of Automotive extension

to schema.org

Collaborative project

of Hepp Research GmbH, MakoLab SA

and many other individuals.

Nowe rodzaje danych mogą być teraz

publikowane w sieci dzięki

auto.schema.org

Zobacz: carinsearch.org

fibo.schema.org (w trakcie publikacji)

jest rozszerzeniem słownika schema.org

opartym o największą globalną

ontologię Finansową: FIBO (Financial

Industry Business Ontology)

Collaborative project

of an international group of individuals

lead by MakoLab SA.

Visual for Human Web Media (HTML)http://lei.info/5493001KJTIIGC8Y1R12

http://lei.info

5493001KJTIIGC8Y1R12 http://lei.info/5493001KJTIIGC8Y1R12

Visual for Human

Web Media (HTML)

Data for Machine

consumption (RDF)

Picture for Paper Media

(QR-Code)

Create URI

LEI.INFOi

http://lei.info/5493001KJTIIGC8Y1R12

Data for Machine consumption

The data can be returned

in multiple formats:

rdf+xml

x-turtle

n-triples

Trig

rdf+n3

n-quads

ld+json

owl+xml

turtle

trix

n3

text/plain

x-nquads

http://lei.info/5493001KJTIIGC8Y1R12

https://logd.tw.rpi.edu/