Upload
jinho-park
View
743
Download
0
Embed Size (px)
Citation preview
2
크고어려운개념
쉽게이해하기
3
Semantic Web Linked Open Data
시맨틱 웹은 현재 웹이 확장된 형태로, 잘 정의된 의미를 정보에 부여함
으로써 사람과 컴퓨터의 협업을 보다 원활하게 할 수 있도록 하는 것이다
(Berners-Lee, T. 2001).
4
Linked Open Data Semantic Web
• 만약, 웹에 표현되어 있는 정보들이 담겨있는 데이터베이스(구조화된 데이터)를
웹에서 활용할 수 있다면 즉, 웹을 모두가 함께 사용할 수 있는 데이터베이
스처럼 만든다면 사람이 읽고 이해하는 정보를 기계(컴퓨터)가 자동으로 처리
하는 것이 가능함.
5
지금도 불편한 게 없는데,웹(인터넷)에 뭘 또 만든다고?뭐라고?
6
[이미지 출처: http://www.skirtcollective.com/11-types-of-digital-insurance-we-need/]
지금도충분하다.
7
Linked Open Data Semantic Web
• 만약, 웹에 표현되어 있는 정보들이 담겨있는 데이터베이스(구조화된 데이터)를
웹에서 활용할 수 있다면 즉, 웹을 모두가 함께 사용할 수 있는 데이터베
이스처럼 만든다면 사람이 읽고 이해하는 정보를 기계(컴퓨터)
가 자동으로 처리하는 것이 가능함.
8
Linked Open Data Semantic Web
• 현재의 문서 중심의 웹을 데이터 중심의 웹으로(Web of Data).
• 현재의 웹도 존재하고 데이터를 기반으로 한 새로운 층(data layer), 데이터를
중심으로 한 새로운 웹의 모습.
9
WEB?
10
DocumentsHTML
------------------------------------------------------------------------------------------
11
Documents------------------------------------------------------------------------------------------
HTML URL
12
DocumentsHTML URL Link
13
Web of Documentshttp://ko.wikipedia.org/wiki/사랑 URI
HTML문서
Hyperlink
14
Web of Documents국립공원 설명하고 있는 또 다른 문서로 연결
자연환경을 설명하는 또 다른 문서로 연결
15
Linked Open Data Semantic Web
• 현재의 문서 중심의 웹을 데이터 중심의 웹으로(Web of Data).
• 현재의 웹도 존재하고 데이터를 기반으로 한 새로운 층(data layer), 데이터를
중심으로한 새로운 웹의 모습.
16
Linked Open Data
field value
제목 국립공원관리공단
위도 37. 37.546975
경도 126.953738
주요기능과역할
자연생태계와 자연, 문화관광…
기관연혁 1987.07.01.
… …
… …
사람이 보는 최종 형태(비구조) 기계가처리(비구조) 원천데이터(DBMS, 구조적데이터)
17
field value
제목 국립공원관리공단
위도 37. 37.546975
경도 126.953738
주요기능과역할
자연생태계와 자연, 문화관광…
기관연혁 1987.07.01.
… …
… …
이런 구조화된데이터들이많아진다면?
업무지시
18
국가별 국립공원 현황 자료 보고
업무지시
19
국가별 국립공원 현황 자료 보고
20
문서 형태의 정보도 중요하지만특정 문제 해결을 위해서는구조화된, 정리된 데이터가 필요문서 보다 할 수 있는 일이 많음
LOD의 플랫폼은 웹
21
데이터 중심의 새로운 웹을 “Web of Data”
• LOD의플랫폼은웹이고현재웹의핵심개념과기술요소(Hypertext, HTML, HTTP, URI)를그대로사용함.
• LOD에서는잘정리된문서형의정보(document)를웹에발행하고활용하는대신, 특정개념(예, 사랑)이나개체에
대한구조화된정보를발행함.
• 이개념과관련된다른개념(예, 사랑과관련된모성애, 우정등)과연결하여데이터를좀더명확하게하게하고
풍부하게함.
• 문서가아닌데이터를표현하고연결하기위해서LOD에서는Hypertext, HTML 대신데이터간의연결을위한새로운
표현방식과연결방식을활용하며, 기계처리가가능하도록RDF로표현되는새로운정보표현방식을활용함.
22
문서가포함하는수많은개념들
23
http://dbpedia.org/page/Seoul
주어부
술어부
목적어부
24
Web of Data
25
Web of Data
서울 Data
공식명칭: 서울특별시국가: 대한민국관련산: 북한산, 관악산, 도봉산, 불암산, 인능산관련강: 한강지형: 분지
대한민국 Data
수도: 서울특별시면적: 100,210km² 인구: 50,912,264명통화: 원
서울데이터가 포함하고 있는 내용중 대한민국 데이터로 이동
용어집
공식명칭: 공식명칭은 ‘도시’특정 도시를칭하는 명칭 중 약자 혹은 별명등을 제외하고 행정구역을 표현하는 해당 국가의 공식명식 전체를 표현하기 위한 용어임
온톨로지(도시_City)
유형: 도시는 Class정의: 일정한 지역의 정치ㆍ경제ㆍ문화의 중심이 되는, 사람이 많이 사는지역.동일개념 온톨로지: http://schema.org/CityCity를 활용할 수 있는 영역: 국가(나라)City가 활용할 수 있는 범위: 인구, 별명, 관련산
서울 데이터를 설명하고있는 공식명칭, 국가, 관련산, 관련강, 지형 등용어에 대한 설명
서울은 도시의 한 유형으로도시를 정의하고도시가 갖는 값의 범위등을 명확히 하는온톨로지
26
뭔가복잡하다
왜?사람의 이해와기계처리
27
Linked Open Data Semantic Web
• 만약, 웹에 표현되어 있는 정보들이 담겨있는 데이터베이스(구조화된 데이터)를
웹에서 활용할 수 있다면 즉, 웹을 모두가 함께 사용할 수 있는 데이터베
이스처럼 만든다면 사람이 읽고 이해하는 정보를 기계(컴퓨터)
가 자동으로 처리하는 것이 가능함.
28
자동으로처리한다?
사람처럼?
29
우리는 소통이가능한가요?
사람의 소통 방식
30
같은 언어 사용
같은 문화 공유
같은 개념 인지
구문(Syntax), 의미(Semantics), 화용(Pragmatics)
지금까지 웹의 소통 방식
31
같은 언어 사용
구문(Syntax)
WWW
Semantic Web(Linked Data)
32
같은 언어 사용
구문(Syntax), 의미(Semantics)
같은 개념 인지
• 표준적인 구문을 사용하고,• 개념, 대상을 정의하고 체계화하고(구조화), 비교/분류하기(동
일한 것, 비슷한 것, 다른 것, 어딘가에 속하고, 무언가를 가지고있고 등)
OL: On-Line [온라인 상에서 활용 가능한 상태]
RE: machine Readable [기계가 읽을 수 있는 상태]
OF: Open Format [개방형 데이터 형태]
URI: URI로 개체를 식별함
LD: Linked Data
Five Star Open Data
33
Five Star Open Data
34
★ 단계(OL: On-Line) ★★ 단계(OL, RE: machine REadable)
Five Star Open Data
35
★★★ 단계(OL, RE, OF: Open Format)
Five Star Open Data
36
★★★★ 단계(OL, RE, OF: Open Format, URI)
-----------------------------------------------------------------<h1 property="dcterms:title">서울 기온 예보</h1><div id="data" about="#Seoul" typeof="meteo:Place">----------------------------------------------------------------------------------------------------------------------------------<tr rel="meteo:forecast" resource="#forecast20120205">
<td><div about="#forecast20120205">
<span property="meteo:predicted" content="2012-02-05T00:00:00Z“datatype="xsd:dateTime">2012년 2월 5일 일요일</span>
</div></td><td rel="meteo:temperature">
<div about="#temp20120205"><span property="meteo:celsius" datatype="xsd:decimal">-4</span>
</div></td>
</tr>-----------------------------------------------------------------
Five Star Open Data
37
★★★★★ 단계(OL, RE, OF: Open Format, URI, LD: Linked Data)
-----------------------------------------------------------------<h1 property="dcterms:title">서울 기온 예보</h1>
<div id="data" about="#Seoul" typeof="meteo:Place"><span rel="owl:sameAs" resource="http://dbpedia.org/resource/Seoul"></span>
-----------------------------------------------------------------
-----------------------------------------------------------------<div about="#temp">최저
<a rel="rdfs:seeAlso" href="http://ko.wikipedia.org/wiki/기온" resource="http://dbpedia.org/resource/Temperature">기온</a>(<span rel="owl:sameAs“ resource="http://dbpedia.org/resource/Celsius">°C</span>)</div>`-----------------------------------------------------------------
Five Star Open Data
38
5개 별점의 의미
• 이미 많은 정보관리기관이나 일반적인 웹사이트에서 정보를 공개하고 공유하는 방식은 단계 수준의 1개 ~ 3개 별점에 해당.
• 이런 유형의 데이터는 새로운 애플리케이션 혹은 서비스, 비즈니스 모델 창출을 위해서 원 데이터의 가공과정제 등에 많은 노력을 기울여야 함.
• 또한 서로 다른 정보원으로부터 동일 개체 식별에 많은 기술적, 비용적 노력을 필요로 함.
39
40
누군가는 원칙과 표준을 만들어가고
누군가는 데이터 플랫폼을 구축하고
누군가는 데이터를 출판하고(Publishing)
누군가는 이 데이터들을 활용하고
언젠가는 LOD를 위한, LOD를 활용한 새로운서비스들이 만들어질 것이고
41
datadatadatadatadatadatadatadatadatadatadatadatadata
datadatadatadatadatadatadatadatadatadatadatadatadata
datadatadatadatadatadatadatadatadatadatadatadatadata
datadatadatadatadatadatadatadatadatadatadatadatadata
datadatadatadatadatadatadatadatadatadatadatadatadata
datadatadatadatadatadatadatadatadatadatadatadatadata
data로 만들어진
data를 연료로쓰는
이 도로는 어떻게 만들어야하는가?
이 도로에 들어가는 data는 어떻게 만들고 활용할 수 있는가?
무엇이 여기를 달리는 것이 가장 효과적인가?
무엇이 여기를 달리게 할 것인가?
넓어지고 많아지면
42
돌아보기 (Web of Documents)
Resource
Resource
Resource
Resource
Resource
Resource
Resource
링크
링크 링크
링크
링크링크
링크
Resource
Resource
Resource
Resource
Resource
링크
링크
링크
링크
링크
링크
링크
43
돌아보기 (Web of Data)
Linked Data
박진호
Director
LiST
dc:creator dc:publisher
p:email
o:workplace
p:title
www.listinc.kr
o:homepage
44
[출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]
structured
unstructured
45
어떻게 표현하는가?
• Resource Description Framework
• 웹 상의 자원을 기술하기 위한 W3C 표준
- Resource: URI를 갖는 모든 것
- Description: 자원(resource)들의 속성, 특성, 관계 기술
- Framework: 위의 것들을 기술하기 위한 모델, 언어, 문법
• RDF는 컴퓨터 애플리케이션이 정보를 읽고 이해할 수 있도록 하기 위한 표준 방법
• RDF로 기술된 것은 웹에서 보여주기 위함은 아님
46
RDF
• RDF는 SPO, 주어(Subject)/술어(Predicate)/목적어(Object)로 구성됨
• “인간에 대한 예의” 의 “작가”는 “공지영”이다.
• “http://www.amazon.com/Human-Decency-Jiyoung-
Gong/dp/8988095928” has a creator whose value is
“http://en.wikipedia.org/wiki/Gong_Ji-young”
47
RDF 모델
주어(Subject) 술어(Predicate) 목적어(Object)
48
RDF 모델
“http://www.amazon.com/Human-Decency-Jiyoung-
Gong/dp/8988095928”
has a creator
whose value is “http://en.wikipedia.org/wiki/Gong_Ji-
young”.
주어(Subject)
술어(Predicate)
목적어(Object)
49
RDF Graph Model
주어(Subject)
목적어(Object)
술어(Predicate)
50
RDF Graph Model
http://www.amazon.com/Human-Decency-Jiyoung-Gong/dp/8988095928
Gong Ji-young
http://purl.org/dc/terms/creator
51
RDF Graph Model
http://www.amazon.com/Human-Decency-Jiyoung-
Gong/dp/8988095928
http://purl.org/dc/terms/creator
http://en.wikipedia.org/wiki/Gong_Ji-young
1963-present
http://dbpedia.org/property/period
Jimoondang
http://purl.org/dc/terms/publisher
Gong Ji-young
http://dbpedia.org/property/name
52
RDF.XML로 표현
<RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:dc=http://purl.org/dc/terms/
xmlns:dbpprop="http://dbpedia.org/property/" >
<Description about=“http://www.amazon.com/Human-Decency-Jiyoung-
Gong/dp/8988095928”>
<dc:publisher>Jimoondang</dc:publisher>
<dc:creator rdf:resource=“http://en.wikipedia.org/wiki/Gong_Ji-young”/>
</Description>
<Description about=“http://en.wikipedia.org/wiki/Gong_Ji-young”>
<dbpprop:name>Gong Ji-young</dbpprop:name>
<dbpprop:period>1963-present</dbpprop:period >
</Description>
</RDF>
53
명확한가?충분한가?
우리는 충분히대화가 가능한가?
54
인간에 대한 예의
공지영작가(writtenBy)
소설(Class), 책 작가(Class), 사람
Type Type
55
Ontology
• 철학 : 존재론(存在論), 존재학(存在學)
- Onto(being) + logos(word)
- 세상의 구성요소에 대한 명확한 이해를 연구
• 언어학 : An ontology is a specification of a conceptualization.
- 개념(화)의 명시적 명세, 시소러스의 확장 개념
• 컴퓨터, 웹 분야
- an ontology is an explicit formal specification of a shared conceptualization(Gruber, 1993)
- An ontology provides a shared vocabulary, which can be used to model a domain — that is, the
type of objects and/or concepts that exist, and their properties and relations.(Arvidsson, 2008)
- 공유된 개념의 명시적 형식(?)
56
Ontology
• an ontology is an explicit formal specification of a shared conceptualization
- shared conceptualization: 인간과 컴퓨터가 공유하는 개념화
- Explicit Formal: 기계가 읽을 수 있는 형식으로 상세하게 개념, 개념간의 관계 등을 표현
- 개념화
• 우리 눈에 보이는 사물 혹은 추상적인 것들을 구체적인 집합으로 만듦
- SUV, 덤프트럭, 세단 = 탈것(Vehicle)
- 남자, 여자 = 사람
- 라이언헤드, 롭드와프, 더치 = 토끼
57
인간에 대한예의
공지영isWrittenBy
소설 소설가
type type
문학인문학
subClassOfsubClassOf
RDF
RDFS
isWrittenBy
domain
시인
subClassOf
range
58
복잡한 게 아닙니다. 기계가 이해할 수 있다(No)사람과 기계가 같이 이해할 수 있는 공유의 장!기계가 이해할 수 있다는 것은 사실,좀 더 엄격하고, 정확하고, 명확한 규칙과 정의를 공유하는 것.