Upload
jinho-park
View
508
Download
6
Embed Size (px)
DESCRIPTION
2013년 3월 29일 대전시청. 공공정보보활용전략세미나 발표자료.
Citation preview
공공정보 활용 사업화 전략 세미나 - 대전
1
국가서지정보 Open Public Data Platform 구축2013.3.29. 국립중앙도서관 박진호 전문연구관 ([email protected])
공공정보 활용 사업화 전략 세미나 - 대전
3
우리가 공유하고 있는 것 . 한국어 ?
공공정보 활용 사업화 전략 세미나 - 대전
4
사과
ap-ple
상징 , Symbol
공공정보 활용 사업화 전략 세미나 - 대전
5
쌍떡잎식물 장미목 장미과 낙엽교목 식물인 사과나무의 열매 .[ 출처 ] 사과 | 두산백과
붉은 색에 둥근 모양을 갖고 있고 움푹 들어간 꼭지를 가지고 있는 과일
색 모양 분류
누군가 사과를 바라보는 시각
공공정보 활용 사업화 전략 세미나 - 대전
6
도서관 데이터 (Library Data)
• 표제 / 책임표시사항 : 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음
• 발행사항 파주 : 사계절출판사 , 2011• 형태사항 346 p. : 천연색삽화 ;23 cm• 표준번호 / 부호 ISBN: 978-89-5828-534-2
03100 • 분류기호 : 한국십진분류법 -> 104
한국십진분류법 -> 001.3 듀이십진분류법 -> 102 듀이십진분류법 -> 001.3
• 주제명 : 철학 에세이 [ 哲學 --] 인문 과학 [ 人文科學 ]
공공정보 활용 사업화 전략 세미나 - 대전
7
• 표제 / 책임표시사항 : 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음• 발행사항 파주 : 사계절출판사 , 2011• 형태사항 346 p. : 천연색삽화 ;23 cm• 표준번호 / 부호 ISBN: 978-89-5828-534-2 03100 • 분류기호 : 한국십진분류법 -> 104 한국십진분류법 -> 001.3 듀이십진분류법
-> 102 듀이십진분류법 -> 001.3• 주제명 : 철학 에세이 [ 哲學 --] 인문 과학 [ 人文科學 ]
서지 정보 / 데이터
저자명 정보 / 데이터
주제명 정보 / 데이터
도서관 데이터 (Library Data) 는
공공정보 활용 사업화 전략 세미나 - 대전
8
서지 정보 / 데이터 저자명 정보 / 데이터주제명 정보 / 데이터
객체 , 서브젝트 ,
개념
도서관 데이터 (Library Data) 를 공공정보로 개방한다는 것은
속성
제목저자
출판사발행년
용어상위어하위어
이름생몰년연락처
특정 객체 , 개념과 속성과 속성이 갖는 값 ( 강신주 , 철학 ) 을
누구나 이해할 수 있는 형태로 공개해서 활용할 수 있도록 해주는 것
공공정보 활용 사업화 전략 세미나 - 대전
9
공공정보 , 데이터 활용 ?
공공정보 개방 ?
공공정보 활용 사업화 전략 세미나 - 대전
11
Check Point1. 여러분 입장에서 공공정보를 개방하고 있다는 곳에서
• 어떤 객체 , 개념을 가지고 있는 지 알 수 있는가 ?
• 그 객체 , 개념을 어떤 속성으로 관리하고 개방하고 있는지 알
수
있는가 ?
• 개방하고 있는 정보가 정말 가지고 있는 모든 것인가 ?
• 범용적인 , 혹은 내가 놀고 있는 플랫폼에서 활용 가능한가 ?(
표준 )
• 나도 ( 개발능력이 없는 ) 활용할 수 있는 플랫폼인가 ?
• 나에게 어떤 노력을 기울이고 있는가 ?
공공정보 활용 사업화 전략 세미나 - 대전
12
공공정보로서 서지정보의 가치
공공정보 활용 사업화 전략 세미나 - 대전
13
공공정보로서 서지정보의 가치
인류의 지식
문자의 역사
인류의 기록
공공정보 활용 사업화 전략 세미나 - 대전
14
현재까지 국립중앙도서관의 데이터 공개
MARC, OAI, Open API
공공정보 활용 사업화 전략 세미나 - 대전
15
국가서지기반 데이터 플랫폼 구축
• 문서 중심의 현재 웹 생태계에 RDF 기반의 데이터 플랫폼을
구축
하고 사람들이 활용할 수 있도록 하는 활동
• 데이터 변환 : MARC2RDF
• 데이터 플랫폼 구축 : 데이터 검색 , 다운로드 등
• 데이터 활용 교육 (Data Literacy) 및 해커톤
공공정보 활용 사업화 전략 세미나 - 대전
16
"The Semantic Web is an extension of the current web
in which information is given well-defined mean-ing, better enabling computers and people to work in coop-
eration."
Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001
아직까지 웹의 문서들은 HTML 로 작성 , HTML 은 문법으로 숨겨진 의미 (Meaning, Semantics) 를 표현하지는 못함
만약 컴퓨터가 , 우리처럼 Meaning 을 이해할 수 있다면 , 우리 ( 사람 ) 의 정보검색 ( 탐색 ) 은 더 풍요로워질 것임
공공정보 활용 사업화 전략 세미나 - 대전
18
[ 출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]
struc-tured
unstruc-tured
Wikipedia Vs Dbpediahttp://en.wikipedia.org/wiki/Samul_nori
http://dbpedia.org/page/Samul_nori
공공정보 활용 사업화 전략 세미나 - 대전
22
인간에 대한 예의 공지영
isWrittenBy
소설
type
문학
subClassOf
소설가
type
문학인
subClassOf
시인
subClassOf
isWrittenBy
domain
range
공공정보 활용 사업화 전략 세미나 - 대전
23
British Library Data Model - Book
공공정보 활용 사업화 전략 세미나 - 대전
24
BIBFramework
공공정보 활용 사업화 전략 세미나 - 대전
25
BIBFramework
공공정보 활용 사업화 전략 세미나 - 대전
26
BIBFramework
공공정보 활용 사업화 전략 세미나 - 대전
27
공공정보 활용 사업화 전략 세미나 - 대전
28
도서관 데이터 플랫폼 구축의 특징
• 개념적 접근과 기술적 접근이 동시에 진행
• 개념적 접근 = FRBR, RDA, BIBFRAME
• 단순히 가지고 있는 데이터를 표준언어 , 프로토콜에
맞추어 개방하는 것이 아니라 ‘책’ ‘서지’라는 객체가 갖는
데이터모델로 접근
공공정보 활용 사업화 전략 세미나 - 대전
29
FRBR
공공정보 활용 사업화 전략 세미나 - 대전
30
http://dbpedia.org/page/Gwanghwamun
http://ja.dbpedia.org/resource/ 光化門
http://ko.dbpedia.org/resource/ 광화문
http://fr.dbpedia.org/resource/Gwanghwamun
http://es.dbpedia.org/resource/Gwanghwamun
freebase: 광화문
핵심연구과제 : URI 정합성 연구
공공정보 활용 사업화 전략 세미나 - 대전
31
핵심연구과제 : URI 정합성 연구
공공정보 활용 사업화 전략 세미나 - 대전
32
ISNI
ISNI
ISNI
ISNI
ISBN
ISAN
ISRC
created-by/creates
ISTCRole: Creator/Author
Role: Adaptor
Role: Performer
Role: Contributor
wri
tten
-by
perf
orm
ed
-by
perf
orm
ed
-by
adapted-by/adapts
performed-by/performs
contributed-by/contributes
abstraction-of/manifestation
contained-in/contains
abstraction-of/performance
핵심연구과제 : URI 정합성 연구
공공정보 활용 사업화 전략 세미나 - 대전
33
ISNI
ISAN
ISWC
ISRCISTC
ISBN
ISSN IPI
IDA
CSI
ISAN
IPI
VIAF
IPDA
핵심연구과제 : URI 정합성 연구
공공정보 활용 사업화 전략 세미나 - 대전
34
국립중앙도서관 데이터 플랫폼 구축의 기본 원칙
• Open 이 먼저• 국립도서관의 데이터는 기본적으로 누구나 자유롭게 활용할 수
있는 공공데이터 (Public Data)
• 어떤 형태 , 방식으로든 Open
• Open 하되 되도록이면 개방형 표준을 활용• Linked Data Principle 준수
• Information Ecosystem 에 기여• Web 은 가장 보편화되고 일반적인 Platform 이자 Ecosys-
tem
• Linked data 로 얻는 이득보다 글로벌 데이터베이스 (Web) 세계에 기여한다는 마음이 우선• 개방으로 직접적으로 얻을 수 있는 이득 보다 우리의 데이터가 살아서 누군가에게 새로운 “가능성”을 열어 줄 수 있음을 우선 고려
공공정보 활용 사업화 전략 세미나 - 대전
35
국립중앙도서관 데이터 플랫폼 구축의 기본 원칙
• 이용자를 생산자로• 단순한 데이터의 개방과 서비스를 넘어 , 데이터를 만들고
자유롭게 활용할 수 있는 Data Literacy 교육
• 도서관 데이터의 시각화가 아니라 ‘이용자’가 갖고 있는 데이터의 조합과 시각화
공공정보 활용 사업화 전략 세미나 - 대전
36
국립중앙도서관 Data Platform
서지 MARC
저자명 전거 MARC
주제명 DB
디지털서지 (XML) 기타 ( 웹 등 )
구조화된 데이터 비구조화 데이터
RDB API RDF filesRDF Store
국립중앙도서관 데이터 플랫폼
공공정보 활용 사업화 전략 세미나 - 대전
37
국립중앙도서관 Data Platform
MARC
OAIOpen API
RDFODat
aJA-
SONXML
FOAF, FRBR, SKOS, SIOC, DC, MODS, PREMIS, BibFrame, EDM…
국립중앙도서관 데이터 플랫폼
• 원하는 데이터를 원하는 형태로 , 원하는 Vocabulary/Data Model 로 활용할 수 있도록
공공정보 활용 사업화 전략 세미나 - 대전
38
기술적 배경 지식 없이 자유롭게 자신의
데이터와 조합하고 Publishing 할 수 있도록
http://www.viewshare.org
국립중앙도서관 데이터 플랫폼
공공정보 활용 사업화 전략 세미나 - 대전
39
1
2
3
4
국립중앙도서관 데이터 플랫폼
공공정보 활용 사업화 전략 세미나 - 대전
40
조합 ? Mash-Up?
내 Data
Know-What
Know-How
Know-Where
Know-Why
Know-Who
Know-When
+ ?
공공정보 활용 사업화 전략 세미나 - 대전
41
조합 ? Mash-Up?
Context
공공정보 활용 사업화 전략 세미나 - 대전
42
내가 활용하고 싶은 객체의 속성은 무엇인가 ?내가 표현하고 싶은 객체의 속성은 무엇인가 ?다른 사람들은 어떻게 부르고 어떻게 표현하는가 ?
공공정보 활용 사업화 전략 세미나 - 대전
43
내가 활용하고 싶은 객체의 속성은 무엇인가 ?내가 표현하고 싶은 객체의 속성은 무엇인가 ?다른 사람들은 어떻게 부르고 어떻게 표현하는가 ?
공공정보 활용 사업화 전략 세미나 - 대전
44
Check Point2. 시맨틱 웹 공공정보 활용에 대한 정확한 시선 필요
• 개방된 공공정보를 활용하면
• 누구나 ‘서울버스’ 앱을 만들 수 있다 ?
• 1 인 기업 , 수익창출 소위 대박의 주인공이 될 수 있다 ?
• 개방만 되면 당장 새로운 세상이 열릴 것이다 ?
• 데이터 서비스 플랫폼에서 누구나 유익한 정보를 얻을 수 있다 ?
• ‘ 내’가 주인공이 되는 정보 세상이 열릴 것이다 ?
공공정보 활용 사업화 전략 세미나 - 대전
45
서지정보의 미래 : 구조화된 데이터
• 국립도서관의 중요한 역할
• 국립도서관은 정보를 영구보존 합니다 .
책 , 전자책 , CD, DVD, Web Site, Digital File
이 전자책의 제목은 , 저자는 , 출판년도는 , 출판사는 , 주제분야
는 ..
어떤 SW 로 만들어졌고 , 어떤 OS 에서 돌아가고 ,
그 SW 의
업데이트는 언제 이루어졌고 ...
어디에 위치해있고 , 현재 상태는 어떠하고 ...
공공정보 활용 사업화 전략 세미나 - 대전
46
서지정보의 미래 : 구조화된 데이터
• 도서관이 바라보는 전자책
정보객체(Information Object)
Epub 해석규칙(Epub
Reader)
001011100000111101111110110101010110
표현정보 데이터 객체
공공정보 활용 사업화 전략 세미나 - 대전
47
서지정보의 미래 : 구조화된 데이터
• Epub, Microsoft 2007 이상• 구조화된 형태로 (XML) 표준 메타데이터를 활용 (DublinCore 등 )
하여
플랫폼 , 애플리케이션 독립적으로 활용이 가능한 디지털 정보 객체
공공정보 활용 사업화 전략 세미나 - 대전
48
참고자료
• http://www.flickr.com/photos/taylorsloan/5539665800• http://www.flickr.com/photos/shareconference/5422273956• http://www.flickr.com/photos/eole/2349202525• http://www.flickr.com/photos/gingerkitty/906756839• http://www.flickr.com/photos/charlestilford/2552654321/• http://www.flickr.com/photos/robgallop/514764284• http://www.parentsociety.com/parenting/7-things-parents-say-youll-say-
them-too/
이미지 출처
박진호 , [email protected]
• Kevin Ford, LC’s Bibliographic Framework Initiative: An Updatehttp://3windmills.com/kefo-swib12-bfi/kefo-swib12.pdf
• Sam Oh. 2011. Invited Speech - ISO/TC46 & ISO/IEC JTC1/SC34. 『 LaRC 2011 』 , June 10-11, 2011. [Seoul, Korea : Seoul Olympic Park-tel] www.istandard.or.kr/_custom/ksa/download.jsp?file_id=16779
• 박진호 . ISO Identifier & UCI. 『국가디지털콘텐츠식별체계 (UCI) 세미나 및 활용전략 발표회』 , 2012.10.31. [ 서울 , 한국저작권위원회 ]