13
WiseKB, WiseQA, Exobrain Big Data Understanding-based Self-Learning Knowledge Base and Reasoning Technology 빅데이터 이해기반 자가학습형 지식베이스 및 추론 기술 개발

Summit2013 choi - wise kb-introd

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Summit2013   choi - wise kb-introd

WiseKB, WiseQA, Exobrain

Big Data Understanding-based Self-LearningKnowledge Base and Reason ing Techno logy빅데이터 이해기반 자가학습형 지식베이스 및 추론 기술 개발

Page 2: Summit2013   choi - wise kb-introd

2/57

빅데이터와인공지능기반의 지능형서비스 플랫폼의글로벌경쟁 가속 전망

연구개발 필요성

지능진화형 SW기술은미래 창조경제창출을위한국가 주도형전략

기술로높은시장성장과고용창출이기대되는차세대성장동력임

H/W, System OS, S/W Service Platform Big Data + AI

Graph SearchGoogle Brain

Siri

Page 3: Summit2013   choi - wise kb-introd

3/103

인간처럼 스스로 학습하고 사고하여 새로운 지식을 축적하고, 자연어 질의응답을 통해 전문분야 지식을 제공하는

지능진화형 SW 플랫폼 기술 개발

삼성과 애플의 특허소송에 따른 향후 삼성의 수익구조 변화

는?

향후 5년간 9% 고성장 예상

최신 경제 동향 정보

특허소송 정보

* 전문직종(경영, 법률, 특허, 의료 등)에 취업 가능 인공지능 초고도화 기술 확보

경제지식 특허지식법률지식

연구목표

Page 4: Summit2013   choi - wise kb-introd

4/10

세부과제 구성

고난이도 질문 의도파악

고신뢰 정답 추론(High Confidence)

분석/추론/예측형Wise QA

자연어 문장심층 이해

(Deep NLP)자가 학습형지식베이스자가학습 및

고속 추론 엔진

-자가학습/검증-고속 하이브리드 추론

지식협업

도메인 지식협업(지식 합성/협업/생성)

기기간 협업(자율, 분산 플래닝)

Symbolic Approach

Non-symbolic Approach

Common Sense, Domain, Personal KB

Page 5: Summit2013   choi - wise kb-introd

5/57

질의 응답 시나리오

이 사람은 중등 교사인 어머니와 재혼한 군인 아버지 사이에서

한국 전쟁 중 차녀로 태어났다. 경상도가 고향으로 광복절에

어머니를 잃었으며 올해 환갑을 맞이한 이 사람은 누구인가?

기존 검색 시스템? 엑소브레인?

Q

A. 박근혜

박정희? 전두환?

노태우? 김근태?

이근안? 김형욱?

함동정월? 한용운?

허준? 임관숙?

황석영? ???

키워드기반 검색으로답을 찾을수 없음

Page 6: Summit2013   choi - wise kb-introd

6/57

박근혜

육영수박정희

아버지 어머니

남편

아내

군인

대통령직업

직업

1974.8.15

육영재단

이사장

사망일

직업

대구

출생지

소속

새누리당

코어지식

지식학습과 하이브리드(복합) 추론

클래스타입(X) = 사람

직업(X.아버지) = 군인

직업(X.어머니) = 중등교사

재혼(X.아버지, X.어머니)

사망일(X.어머니) = 광복절

나이(X) = 61

고향(X) = 경상도

형제순(X) = 차녀

이 사람은 중등 교사인 어머니와

재혼한 군인 아버지 사이에서

한국 전쟁 중 차녀로 태어났다.

경상도가 고향으로 광복절에

어머니를 잃었으며 올해 환갑을

맞이한 이 사람은 누구인가?

1세부

대한민국

최고수반

김호남

이혼

옥천여중

교사

1952.2.2

출생일박재옥

승려

직업

중학교딸단순질의

(그래프매칭)고아라,전재호,한준위…

복합추론

시맨틱추론

시간추론

공간추론

불확실확률추론

박근혜(90%)

고아라(10%)

전재호(5%)

파편화된 지식의

학습과 통합

Page 7: Summit2013   choi - wise kb-introd

Candid

ate

reposito

ry

Webpages

Graphgenerator

Pattern Learner

Knowledgebase

NLP(ETRI)

Seed Knowledge

규칙/제약

메타 지식 제공

신규메타지식추가

Exte

rnal R

eso

urce

Inte

rface

Semantic Integrity Evaluation

Quality Assessment

Knowledge Consolidation

Documents

DocumentsDocuments

Validated KnowledgeRepository

Web Service,

LOD

External Structured

Data

Hum

an F

eedback

(Cro

wdso

urcin

g)

SNS

Knowledge base Wrapper (WP4)

WP6 구조, 외부연계

Knowledgebase

자가 지식베이스 확장

Hybrid 추론 (WP5)

KnowledgeBase

(WP4)

Knowledge ValidatorLearning by Reading

Meta지식베이스

1차년도 개발 범위

Predicate Learner

Semi-Structured Data Learner (SSDL)

Temporal, Spatial Learner

Concept Finder

Page 8: Summit2013   choi - wise kb-introd

Goal

Page 9: Summit2013   choi - wise kb-introd

Phase 1 Goal

Page 10: Summit2013   choi - wise kb-introd

Phase 1 Scenario

Page 11: Summit2013   choi - wise kb-introd

EU-FP7 LOD2 Project Overview . Page 11 http://lod2.eu

Creating Knowledge out of Interlinked Data

The emerging Web of Data achievements and challenges

Consortium

Universität Leipzig (Coordinator)

Centrum Wiskunde & Informatica

National University of Ireland in Galway

Freie Universität Berlin

OpenLink Software

Semantic Web Company

TenForce

Exalead

Wolters Kluwer Deutschland

Open Knowledge Foundation

Zemanta, UEP, I2G, IMP

KAIST

Project Instrument: Large-scale Integrating Project

Objective: Intelligent Information Management

Call: FP7-ICT-2009-5

Duration: 09/2010 – 08/2014

14 Partners from 11 European

Countries + 1 from Korea

Page 12: Summit2013   choi - wise kb-introd

Key-Sun Choi• CS Department Head, KAIST (2006-2011)

• Semantic Web Research Center, Director (2006 ~)

• KORTERM: Korea Terminology Research Center for Language and Knowledge Engineering (1998-2007)

• ISO/TC37/SC4 secretary (Language Resource Management) (2002-)

• KAIST Grand Research Achievement Award (1998)

• Co-Organizer, Dagstuhl Seminar on Multilingual Semantic Web (Sep., 2012)

• President (2009-2010), AFNLP (Asia Federation of NLP)

• ISWC 2007, Program co-chair

• Global WordNet 2006, Organizer

• Research Projects:

– http://lod2.eu/ partner (EU FP7)

– Natural Language Processing Hub for Korean: Hannanum (sourceforge), …

– Mobile AI

– Medical Linked Open Data

– DBPedia Korea and Synchronization

• LOD summer school 2012: http://semanticweb.kaist.ac.kr/2012lodsummer/

• http://corenet.kaist.ac.kr/

• http://semanticweb.kaist.ac.kr/

• http://kschoi.kaist.ac.kr/

[email protected] 12

Page 13: Summit2013   choi - wise kb-introd

Big data for Thinking/Feeling

Data intensive innovation

Th

ink

ing

/ f

ee

lin

g t

he

ory

Computational

Creativity

Automatic Theorem

Proving

Wikipedia

Web Search

Linked Data

?

13