59
Linked Open Data 박진호([email protected]) 국립공원 관리공단 | 2015.09.02. 국립공원관리공단 교육자료

Linked Open Data

Embed Size (px)

Citation preview

Page 1: Linked Open Data

Linked Open Data 박진호([email protected])

국립공원 관리공단 | 2015.09.02.

국립공원관리공단 교육자료

Page 2: Linked Open Data

2

크고어려운개념

쉽게이해하기

Page 3: Linked Open Data

3

Semantic Web Linked Open Data

시맨틱 웹은 현재 웹이 확장된 형태로, 잘 정의된 의미를 정보에 부여함

으로써 사람과 컴퓨터의 협업을 보다 원활하게 할 수 있도록 하는 것이다

(Berners-Lee, T. 2001).

Page 4: Linked Open Data

4

Linked Open Data Semantic Web

• 만약, 웹에 표현되어 있는 정보들이 담겨있는 데이터베이스(구조화된 데이터)를

웹에서 활용할 수 있다면 즉, 웹을 모두가 함께 사용할 수 있는 데이터베이

스처럼 만든다면 사람이 읽고 이해하는 정보를 기계(컴퓨터)가 자동으로 처리

하는 것이 가능함.

Page 5: Linked Open Data

5

지금도 불편한 게 없는데,웹(인터넷)에 뭘 또 만든다고?뭐라고?

Page 6: Linked Open Data

6

[이미지 출처: http://www.skirtcollective.com/11-types-of-digital-insurance-we-need/]

지금도충분하다.

Page 7: Linked Open Data

7

Linked Open Data Semantic Web

• 만약, 웹에 표현되어 있는 정보들이 담겨있는 데이터베이스(구조화된 데이터)를

웹에서 활용할 수 있다면 즉, 웹을 모두가 함께 사용할 수 있는 데이터베

이스처럼 만든다면 사람이 읽고 이해하는 정보를 기계(컴퓨터)

가 자동으로 처리하는 것이 가능함.

Page 8: Linked Open Data

8

Linked Open Data Semantic Web

• 현재의 문서 중심의 웹을 데이터 중심의 웹으로(Web of Data).

• 현재의 웹도 존재하고 데이터를 기반으로 한 새로운 층(data layer), 데이터를

중심으로 한 새로운 웹의 모습.

Page 9: Linked Open Data

9

WEB?

Page 10: Linked Open Data

10

DocumentsHTML

------------------------------------------------------------------------------------------

Page 11: Linked Open Data

11

Documents------------------------------------------------------------------------------------------

HTML URL

Page 12: Linked Open Data

12

DocumentsHTML URL Link

Page 13: Linked Open Data

13

Web of Documentshttp://ko.wikipedia.org/wiki/사랑 URI

HTML문서

Hyperlink

Page 14: Linked Open Data

14

Web of Documents국립공원 설명하고 있는 또 다른 문서로 연결

자연환경을 설명하는 또 다른 문서로 연결

Page 15: Linked Open Data

15

Linked Open Data Semantic Web

• 현재의 문서 중심의 웹을 데이터 중심의 웹으로(Web of Data).

• 현재의 웹도 존재하고 데이터를 기반으로 한 새로운 층(data layer), 데이터를

중심으로한 새로운 웹의 모습.

Page 16: Linked Open Data

16

Linked Open Data

field value

제목 국립공원관리공단

위도 37. 37.546975

경도 126.953738

주요기능과역할

자연생태계와 자연, 문화관광…

기관연혁 1987.07.01.

… …

… …

사람이 보는 최종 형태(비구조) 기계가처리(비구조) 원천데이터(DBMS, 구조적데이터)

Page 17: Linked Open Data

17

field value

제목 국립공원관리공단

위도 37. 37.546975

경도 126.953738

주요기능과역할

자연생태계와 자연, 문화관광…

기관연혁 1987.07.01.

… …

… …

이런 구조화된데이터들이많아진다면?

Page 18: Linked Open Data

업무지시

18

국가별 국립공원 현황 자료 보고

Page 19: Linked Open Data

업무지시

19

국가별 국립공원 현황 자료 보고

Page 20: Linked Open Data

20

문서 형태의 정보도 중요하지만특정 문제 해결을 위해서는구조화된, 정리된 데이터가 필요문서 보다 할 수 있는 일이 많음

Page 21: Linked Open Data

LOD의 플랫폼은 웹

21

데이터 중심의 새로운 웹을 “Web of Data”

• LOD의플랫폼은웹이고현재웹의핵심개념과기술요소(Hypertext, HTML, HTTP, URI)를그대로사용함.

• LOD에서는잘정리된문서형의정보(document)를웹에발행하고활용하는대신, 특정개념(예, 사랑)이나개체에

대한구조화된정보를발행함.

• 이개념과관련된다른개념(예, 사랑과관련된모성애, 우정등)과연결하여데이터를좀더명확하게하게하고

풍부하게함.

• 문서가아닌데이터를표현하고연결하기위해서LOD에서는Hypertext, HTML 대신데이터간의연결을위한새로운

표현방식과연결방식을활용하며, 기계처리가가능하도록RDF로표현되는새로운정보표현방식을활용함.

Page 22: Linked Open Data

22

문서가포함하는수많은개념들

Page 23: Linked Open Data

23

http://dbpedia.org/page/Seoul

주어부

술어부

목적어부

Page 24: Linked Open Data

24

Web of Data

Page 25: Linked Open Data

25

Web of Data

서울 Data

공식명칭: 서울특별시국가: 대한민국관련산: 북한산, 관악산, 도봉산, 불암산, 인능산관련강: 한강지형: 분지

대한민국 Data

수도: 서울특별시면적: 100,210km² 인구: 50,912,264명통화: 원

서울데이터가 포함하고 있는 내용중 대한민국 데이터로 이동

용어집

공식명칭: 공식명칭은 ‘도시’특정 도시를칭하는 명칭 중 약자 혹은 별명등을 제외하고 행정구역을 표현하는 해당 국가의 공식명식 전체를 표현하기 위한 용어임

온톨로지(도시_City)

유형: 도시는 Class정의: 일정한 지역의 정치ㆍ경제ㆍ문화의 중심이 되는, 사람이 많이 사는지역.동일개념 온톨로지: http://schema.org/CityCity를 활용할 수 있는 영역: 국가(나라)City가 활용할 수 있는 범위: 인구, 별명, 관련산

서울 데이터를 설명하고있는 공식명칭, 국가, 관련산, 관련강, 지형 등용어에 대한 설명

서울은 도시의 한 유형으로도시를 정의하고도시가 갖는 값의 범위등을 명확히 하는온톨로지

Page 26: Linked Open Data

26

뭔가복잡하다

왜?사람의 이해와기계처리

Page 27: Linked Open Data

27

Linked Open Data Semantic Web

• 만약, 웹에 표현되어 있는 정보들이 담겨있는 데이터베이스(구조화된 데이터)를

웹에서 활용할 수 있다면 즉, 웹을 모두가 함께 사용할 수 있는 데이터베

이스처럼 만든다면 사람이 읽고 이해하는 정보를 기계(컴퓨터)

가 자동으로 처리하는 것이 가능함.

Page 28: Linked Open Data

28

자동으로처리한다?

사람처럼?

Page 29: Linked Open Data

29

우리는 소통이가능한가요?

Page 30: Linked Open Data

사람의 소통 방식

30

같은 언어 사용

같은 문화 공유

같은 개념 인지

구문(Syntax), 의미(Semantics), 화용(Pragmatics)

Page 31: Linked Open Data

지금까지 웹의 소통 방식

31

같은 언어 사용

구문(Syntax)

WWW

Page 32: Linked Open Data

Semantic Web(Linked Data)

32

같은 언어 사용

구문(Syntax), 의미(Semantics)

같은 개념 인지

• 표준적인 구문을 사용하고,• 개념, 대상을 정의하고 체계화하고(구조화), 비교/분류하기(동

일한 것, 비슷한 것, 다른 것, 어딘가에 속하고, 무언가를 가지고있고 등)

Page 33: Linked Open Data

OL: On-Line [온라인 상에서 활용 가능한 상태]

RE: machine Readable [기계가 읽을 수 있는 상태]

OF: Open Format [개방형 데이터 형태]

URI: URI로 개체를 식별함

LD: Linked Data

Five Star Open Data

33

Page 34: Linked Open Data

Five Star Open Data

34

★ 단계(OL: On-Line) ★★ 단계(OL, RE: machine REadable)

Page 35: Linked Open Data

Five Star Open Data

35

★★★ 단계(OL, RE, OF: Open Format)

Page 36: Linked Open Data

Five Star Open Data

36

★★★★ 단계(OL, RE, OF: Open Format, URI)

-----------------------------------------------------------------<h1 property="dcterms:title">서울 기온 예보</h1><div id="data" about="#Seoul" typeof="meteo:Place">----------------------------------------------------------------------------------------------------------------------------------<tr rel="meteo:forecast" resource="#forecast20120205">

<td><div about="#forecast20120205">

<span property="meteo:predicted" content="2012-02-05T00:00:00Z“datatype="xsd:dateTime">2012년 2월 5일 일요일</span>

</div></td><td rel="meteo:temperature">

<div about="#temp20120205"><span property="meteo:celsius" datatype="xsd:decimal">-4</span>

</div></td>

</tr>-----------------------------------------------------------------

Page 37: Linked Open Data

Five Star Open Data

37

★★★★★ 단계(OL, RE, OF: Open Format, URI, LD: Linked Data)

-----------------------------------------------------------------<h1 property="dcterms:title">서울 기온 예보</h1>

<div id="data" about="#Seoul" typeof="meteo:Place"><span rel="owl:sameAs" resource="http://dbpedia.org/resource/Seoul"></span>

-----------------------------------------------------------------

-----------------------------------------------------------------<div about="#temp">최저

<a rel="rdfs:seeAlso" href="http://ko.wikipedia.org/wiki/기온" resource="http://dbpedia.org/resource/Temperature">기온</a>(<span rel="owl:sameAs“ resource="http://dbpedia.org/resource/Celsius">&deg;C</span>)</div>`-----------------------------------------------------------------

Page 38: Linked Open Data

Five Star Open Data

38

5개 별점의 의미

• 이미 많은 정보관리기관이나 일반적인 웹사이트에서 정보를 공개하고 공유하는 방식은 단계 수준의 1개 ~ 3개 별점에 해당.

• 이런 유형의 데이터는 새로운 애플리케이션 혹은 서비스, 비즈니스 모델 창출을 위해서 원 데이터의 가공과정제 등에 많은 노력을 기울여야 함.

• 또한 서로 다른 정보원으로부터 동일 개체 식별에 많은 기술적, 비용적 노력을 필요로 함.

Page 39: Linked Open Data

39

Page 40: Linked Open Data

40

누군가는 원칙과 표준을 만들어가고

누군가는 데이터 플랫폼을 구축하고

누군가는 데이터를 출판하고(Publishing)

누군가는 이 데이터들을 활용하고

언젠가는 LOD를 위한, LOD를 활용한 새로운서비스들이 만들어질 것이고

Page 41: Linked Open Data

41

datadatadatadatadatadatadatadatadatadatadatadatadata

datadatadatadatadatadatadatadatadatadatadatadatadata

datadatadatadatadatadatadatadatadatadatadatadatadata

datadatadatadatadatadatadatadatadatadatadatadatadata

datadatadatadatadatadatadatadatadatadatadatadatadata

datadatadatadatadatadatadatadatadatadatadatadatadata

data로 만들어진

data를 연료로쓰는

이 도로는 어떻게 만들어야하는가?

이 도로에 들어가는 data는 어떻게 만들고 활용할 수 있는가?

무엇이 여기를 달리는 것이 가장 효과적인가?

무엇이 여기를 달리게 할 것인가?

넓어지고 많아지면

Page 42: Linked Open Data

42

돌아보기 (Web of Documents)

Resource

Resource

Resource

Resource

Resource

Resource

Resource

링크

링크 링크

링크

링크링크

링크

Resource

Resource

Resource

Resource

Resource

링크

링크

링크

링크

링크

링크

링크

Page 43: Linked Open Data

43

돌아보기 (Web of Data)

Linked Data

박진호

Director

LiST

[email protected]

dc:creator dc:publisher

p:email

o:workplace

p:title

www.listinc.kr

o:homepage

Page 44: Linked Open Data

44

[출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]

structured

unstructured

Page 45: Linked Open Data

45

어떻게 표현하는가?

Page 46: Linked Open Data

• Resource Description Framework

• 웹 상의 자원을 기술하기 위한 W3C 표준

- Resource: URI를 갖는 모든 것

- Description: 자원(resource)들의 속성, 특성, 관계 기술

- Framework: 위의 것들을 기술하기 위한 모델, 언어, 문법

• RDF는 컴퓨터 애플리케이션이 정보를 읽고 이해할 수 있도록 하기 위한 표준 방법

• RDF로 기술된 것은 웹에서 보여주기 위함은 아님

46

RDF

Page 47: Linked Open Data

• RDF는 SPO, 주어(Subject)/술어(Predicate)/목적어(Object)로 구성됨

• “인간에 대한 예의” 의 “작가”는 “공지영”이다.

• “http://www.amazon.com/Human-Decency-Jiyoung-

Gong/dp/8988095928” has a creator whose value is

“http://en.wikipedia.org/wiki/Gong_Ji-young”

47

RDF 모델

주어(Subject) 술어(Predicate) 목적어(Object)

Page 48: Linked Open Data

48

RDF 모델

“http://www.amazon.com/Human-Decency-Jiyoung-

Gong/dp/8988095928”

has a creator

whose value is “http://en.wikipedia.org/wiki/Gong_Ji-

young”.

주어(Subject)

술어(Predicate)

목적어(Object)

Page 49: Linked Open Data

49

RDF Graph Model

주어(Subject)

목적어(Object)

술어(Predicate)

Page 50: Linked Open Data

50

RDF Graph Model

http://www.amazon.com/Human-Decency-Jiyoung-Gong/dp/8988095928

Gong Ji-young

http://purl.org/dc/terms/creator

Page 51: Linked Open Data

51

RDF Graph Model

http://www.amazon.com/Human-Decency-Jiyoung-

Gong/dp/8988095928

http://purl.org/dc/terms/creator

http://en.wikipedia.org/wiki/Gong_Ji-young

1963-present

http://dbpedia.org/property/period

Jimoondang

http://purl.org/dc/terms/publisher

Gong Ji-young

http://dbpedia.org/property/name

Page 52: Linked Open Data

52

RDF.XML로 표현

<RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”

xmlns:dc=http://purl.org/dc/terms/

xmlns:dbpprop="http://dbpedia.org/property/" >

<Description about=“http://www.amazon.com/Human-Decency-Jiyoung-

Gong/dp/8988095928”>

<dc:publisher>Jimoondang</dc:publisher>

<dc:creator rdf:resource=“http://en.wikipedia.org/wiki/Gong_Ji-young”/>

</Description>

<Description about=“http://en.wikipedia.org/wiki/Gong_Ji-young”>

<dbpprop:name>Gong Ji-young</dbpprop:name>

<dbpprop:period>1963-present</dbpprop:period >

</Description>

</RDF>

Page 53: Linked Open Data

53

명확한가?충분한가?

우리는 충분히대화가 가능한가?

Page 54: Linked Open Data

54

인간에 대한 예의

공지영작가(writtenBy)

소설(Class), 책 작가(Class), 사람

Type Type

Page 55: Linked Open Data

55

Ontology

• 철학 : 존재론(存在論), 존재학(存在學)

- Onto(being) + logos(word)

- 세상의 구성요소에 대한 명확한 이해를 연구

• 언어학 : An ontology is a specification of a conceptualization.

- 개념(화)의 명시적 명세, 시소러스의 확장 개념

• 컴퓨터, 웹 분야

- an ontology is an explicit formal specification of a shared conceptualization(Gruber, 1993)

- An ontology provides a shared vocabulary, which can be used to model a domain — that is, the

type of objects and/or concepts that exist, and their properties and relations.(Arvidsson, 2008)

- 공유된 개념의 명시적 형식(?)

Page 56: Linked Open Data

56

Ontology

• an ontology is an explicit formal specification of a shared conceptualization

- shared conceptualization: 인간과 컴퓨터가 공유하는 개념화

- Explicit Formal: 기계가 읽을 수 있는 형식으로 상세하게 개념, 개념간의 관계 등을 표현

- 개념화

• 우리 눈에 보이는 사물 혹은 추상적인 것들을 구체적인 집합으로 만듦

- SUV, 덤프트럭, 세단 = 탈것(Vehicle)

- 남자, 여자 = 사람

- 라이언헤드, 롭드와프, 더치 = 토끼

Page 57: Linked Open Data

57

인간에 대한예의

공지영isWrittenBy

소설 소설가

type type

문학인문학

subClassOfsubClassOf

RDF

RDFS

isWrittenBy

domain

시인

subClassOf

range

Page 58: Linked Open Data

58

복잡한 게 아닙니다. 기계가 이해할 수 있다(No)사람과 기계가 같이 이해할 수 있는 공유의 장!기계가 이해할 수 있다는 것은 사실,좀 더 엄격하고, 정확하고, 명확한 규칙과 정의를 공유하는 것.

Page 59: Linked Open Data

59

감사합니다.

주식회사리스트150-040 서울특별시영등포구버드나루로19길3 양용빌딩9층사업개발본부박진호02-2632-5134 | [email protected]

Q&A