26
쇄 : 2012년 8월 행 : 2012년 8월 발행처 : 한국인터넷진흥원 (KISA, Korea Inetrnet & Security Agency) 소 : 서울시 송파구 가락동 79-3 대동빌딩 화 : 02-405-6324 작 : (주)드림이노플래너스 (02-2276-0811) 본 보고서의 판권은 한국인터넷 진흥원이 소유하고 있으며, 당 진흥원의 허가 없이 무단 전재 및 복사를 금합니다. 미국 정부의 빅데이터 R&D 전략 3 VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용 고시 32 미국 FTC, 페이스북의 개인정보보호 의무 명시 34 호주, 개인정보보호법 개정안 국회 상정 36 일본 총무성, ‘스마트폰 프라이버시 이니셔티브’ 공표 38 중동·아프리카 및 아태지역 SNS 성장세 주목 40 애플, 최대 경쟁사 구글 견제 위한 ‘脫 구글’ 행보 본격화 43 인터넷 법제 동향 47

미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

인 쇄 : 2012년 8월

발 행 : 2012년 8월

발행처 : 한국인터넷진흥원

(KISA, Korea Inetrnet & Security Agency)

주 소 : 서울시 송파구 가락동 79-3 대동빌딩

전 화 : 02-405-6324

제 작 : (주)드림이노플래너스 (02-2276-0811)

본 보고서의 판권은 한국인터넷 진흥원이 소유하고 있으며,

당 진흥원의 허가 없이 무단 전재 및 복사를 금합니다.

미국 정부의 빅데이터 R&D 전략 3

VoLTE(Voice over LTE) 27

미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용 고시 32

미국 FTC, 페이스북의 개인정보보호 의무 명시 34

호주, 개인정보보호법 개정안 국회 상정 36

일본 총무성, ‘스마트폰 프라이버시 이니셔티브’ 공표 38

중동·아프리카 및 아태지역 SNS 성장세 주목 40

애플, 최대 경쟁사 구글 견제 위한 ‘脫 구글’ 행보 본격화 43

인터넷 법제 동향 47

Page 2: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용
Page 3: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

※ Net Focus의 내용은 집필자 개인의 견해로서 한국인터넷진흥원의 공식입장과는 무관합니다.

미국 정부의 빅데이터 R&D 전략정책연구실 정책기획팀 이응용 책임연구원([email protected])

빅데이터의 주요 특징

미국 정부의 빅데이터 R&D 이니셔티브 추진

부처별 빅데이터 R&D 이니셔티브 추진 동향

시장 평가 및 의의

I.

II.

III.

IV.

Page 4: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

S U M M A R Y

Ⅰ. 빅데이터의 주요 특징

● 빅데이터(BigData)란기존의수집·저장·분석·관리역량을넘어서는대량의정형또는비정형

데이터셋(Dataset)을의미

- 모바일단말기와소셜미디어이용증가등에힘입어글로벌데이터발생량이폭발적으로

증가하면서빅데이터가부각

- 최근대규모의다양한데이터로부터경제적가치를추출할수있는기술로그의미가확장

- 데이터분석및처리기술발전으로대규모데이터분석을통한생산성향상및경쟁력제고가

가능해지면서더욱주목

Ⅱ. 미국 정부의 빅데이터 R&D 이니셔티브 추진

● 미국정부는‘빅데이터R&D이니셔티브’를통해본격적인빅데이터활성화전략구사(’12.3.28)

- 방대하게축적된디지털데이터에대한접근및수집·관리에필요한기술및방법전반에

대한발전추진

● 백악관산하과학기술정책실(OSTP)이‘빅데이터R&D이니셔티브’를주도적으로추진

- OSTP는빅데이터고위운영그룹(BDSSG)을중심으로‘빅데이터R&D이니셔티브’대상

프로젝트를선정·개발하고투자규모결정

● 현재6개연방부처및기관이‘빅데이터R&D이니셔티브’에참여

- 국립과학재단(NSF),국립보건원(NIH),국방부(DoD),방위고등연구계획국(DARPA),에너지부

(DoE),미국지질조사원(USGS)등이참여중

● ‘빅데이터R&D이니셔티브’에는총2억달러의예산이투입될예정

- 이는미국연방정부의범부처ITR&D프로그램인NITRD의’12년전체예산인37억3,940만

달러의5%에해당하는수치

Page 5: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

미국 정부의 빅데이터 R&D 전략

S U M M A R Y

Ⅲ. 부처별 빅데이터 R&D 이니셔티브 추진 동향

● 국립과학재단(NSF)은 빅데이터관련연구투자등데이터로부터지식을도출해내는새로운

방법론을고안하기위한장기전략수행

- 빅데이터전문인력양성,클라우드등데이터접근법개발에1,000만달러를투입할계획

● 국립보건원(NIH)은세포,분자,화학,의학,건강,질병등의데이터개발및관리에투자를

진행할예정

● 국방부는이미군사관련빅데이터프로젝트에연간2억5,000만달러를배정하는등적극적인

빅데이터투자추진

- 국방부는전투능력을배가시키기위한빅데이터기술연구에주력

● 방위고등연구계획국은대용량데이터분석을위한컴퓨팅기술과SW개발을위한 ‘XDATA’

프로젝트에4년간매년2,500만달러지원예정

● 에너지부(DoE)는데이터분석및시각화연구소‘SDAVI’설립을위해2,500만달러를투입할예정

● 미국지질조사원(USGS)은 ‘존웰시파월분석및통합센터’를지원하며, ‘지구시스템과학

분야’에빅데이터를활용할계획

Ⅳ. 시장 평가 및 의의

● 미국은‘빅데이터R&D이니셔티브’추진을통해빅데이터원천기술개발,빅데이터분석에기반한

공공서비스개선도모

- 정부주도의빅데이터활성화정책추진으로일자리창출및예산절감

● 다수부처의빅데이터관련사업추진에따른중복우려도등장

- 유사프로젝트의분산추진으로정책관련자가혼란을느끼고있으며,예산낭비가능성도

지적되고있음

Page 6: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

■ 빅데이터의 출현

● 빅데이터(Big Data)란 기존 데이터베이스 관리 도구가 수집·저장·분석·관리할 수 있는 범위를

넘어서는 데이터셋(Dataset)을 의미1)

- 최근에는 대규모의 다양한 데이터로부터 경제적으로 필요한 가치를 추출할 수 있도록

디자인된 차세대 기술과 아키텍처로 의미가 확장

● 모바일 단말기의 대중화, 음악·동영상 등 대용량 콘텐츠의 소비 확산과 소셜미디어 이용 증가

등으로 데이터 발생 규모가 빠르게 증가

- ’05년 발생한 글로벌 데이터 규모는 130엑사바이트(Exabyte)2)에 불과했지만 ’15년에는

7,910엑사바이트까지 증가할 전망

I 빅데이터의 주요 특징

[그림 1] 글로벌 데이터 발생 규모 증가 추이(’05 ~ ’15)

※자료:IDC(’11)

1)McKinsey(’11),BigData:Thenextfrontierforinnovation,competition,andproductivity

2)1엑사바이트=100만테라바이트

Page 7: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

미국 정부의 빅데이터 R&D 전략

● 특히 모바일 단말기의 확산으로 개인 차원에서 점차 많은 데이터를 발신 및 수신하게 되면서

데이터의 발생 규모가 방대해져 가고 있음

- 일반 피처폰에 국한됐던 모바일 단말기가 스마트폰, 태블릿 PC 등으로 다양화 되면서 데이터

발생량이 폭발적으로 증가

- 네트워크 장비 업체 시스코(Cisco)에 따르면, ’11년부터 ’16년 까지 모바일 데이터 트래픽이 연

평균 78%씩 성장할 것으로 전망

- ’16년 발생되는 모바일 트래픽 규모는 10.8엑사바이트에 이를 전망

● 소셜미디어의 대중화와 사물지능통신(M2M)의 저변 확대 역시 빅데이터 시대를 선도

- 소비자가 자신의 일상을 디지털 기록으로 남길 수 있게 되면서 다양한 형태의 데이터들이 축적

- 투자은행 JMP 시큐리티(JMP Securities)의 2011년 자료에 의하면 매 1분마다 트윗 3만

4,000건, 페이스북 콘텐츠 24만 건이 신규로 창출

- 사물지능통신(M2M) 센서 등의 대중화로 이용자의 의도와는 상관없이 인프라 자체가 다량의

데이터를 직접 생성하는 경우도 증가3)

[그림 2] 일반 피처폰 대비 단말별 모바일 트래픽 유발 수준(좌) 및 모바일 데이터 트래픽 증가량 전망

※자료:Cisco(’12)

3)컨설팅업체맥킨지(McKinsey)는’15년까지사물지능통신센서를탑재한디바이스가매년30%이상증가전망

Page 8: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

■ 빅데이터의 특징

● 빅데이터는 거대한 데이터 양(volume), 빠른 데이터 유통 및 이용 속도(velocity), 데이터 다양성

(variety)을 특징으로 함

- 빅데이터는 단순히 저장되는 물리적인 크기 뿐만 아니라 개념적인 범위까지 대규모인

데이터를 의미

- 빅데이터는 실시간으로 생산되며 유통 속도 또한 매우 빠르다는 특징을 보임

- 빅데이터는 기존의 구조화된 정형 데이터 뿐만 아니라 텍스트, 사진, 동영상 등 비정형

데이터까지 포함

[그림 3] 빅데이터의 3대 특징

※자료:스트라베이스(’12)

■ 빅데이터의 주목 요인

● 민간 영역은 물론 공공 영역에 이르기까지 빅데이터에 대한 관심이 증폭되고 있음

- 과거와 달리 대규모 데이터에서 특징과 패턴을 추출하는 분석기술과 다양한 데이터를 기존의

특징·패턴과 조합하는 기술이 발전

- 데이터를 활용한 미래 예측 기술이 한층 정교해졌으며4) 이를 통한 생산성 향상 및 경쟁력

제고가 가능해짐

4)데이터 분석 업체 크림슨 헥사곤(Crimson Hexagon)의 창업자인 하버드 대학의 사회과학 교수 게리 킹(Gary King)은

“우리는 (빅데이터를 통해) 사회의 변화를 실시간으로 파악할 수 있을 뿐만 아니라 과거에는 불가능했던 즉각적인 의사

결정마저가능해졌다”며,“(빅데이터로인해)사회는격변하고있다”고언급

Page 9: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

미국 정부의 빅데이터 R&D 전략

● 컨설팅 업체 맥킨지(McKinsey)는 빅데이터를 활용할 경우 대부분의 산업에서 생산성 향상

효과가 나타날 것으로 기대

[표 1] 빅데이터 적용을 통한 산업별 생산성 향상 효과

빅데이터 활용 가능성

이미강력한생산성향상효과를얻고있음

빅데이터활용가능성이가장높음

일부생산성증대효과기대가능

생산성증대를막는구조적요인이존재

데이터활용및접근이제한적

대표산업

컴퓨터,전자제품,정보통신

금융,보험,정부분야등

건설,교육,엔터테인먼트등

제조,운수,물류등

소매,전력등

분류

ClusterA

ClusterB

ClusterC

ClusterD

ClusterE

● 英 시장조사업체 경제산업연구센터(CEBR5)) 역시 빅데이터의 경제적 효과가 상당할 것으로 분석

- 빅데이터가 영국 산업에 미칠 경제적 효과가 ’12년부터 ’17년까지 5년 간 총 2,160억 파운드

(한화 약 395조원)에 달할 것으로 전망

- 구체적으로 ▲新 사업 창출 ▲사업 효율성 제고 ▲사업 혁신 등 3大 영역에서 영국 산업에

이점을 제공할 것으로 분석

- 특히, 사업 효율성 제고 영역의 기여도가 가장 높을 것으로 예상

[표 2] 빅데이터로 인한 영국 경제 유발 효과 추정치

2012~2017

149,471

24,062

42,430

215,964

경제적 효과

사업효율성제고

사업혁신

新사업창출

합계

2011

17,379

2,865

4,843

25,087

● 공공부문에서도 국가보안, 치안·위험관리, 공공 정보 공유·활용 등에 빅데이터를 활용할 경우

막대한 예산절감 효과를 유발할 것으로 기대

- 영국의 싱크 탱크 그룹 팔러시 익스체인지(Policy Exchange)는 빅데이터 활용을 통한 정부

예산 절감 가능성을 제기

- 영국 정부가 빅데이터를 적절히 분석·활용할 경우 한 해에만 최소 160억 파운드에서 최대

330억 파운드의 예산 절감이 가능할 것으로 예상

- 일례로 정부 조직 운영 최적화를 통해 최대 220억 파운드의 예산을 절약할 수 있다고 주장

- 세금 오납 및 조세 포탈 감소와 세원 확대를 통해 약 110억 파운드의 추가 세수를 확보할 수

있다고 진단

5)CenterforEconomicandBusinessResearch

(단위:백만파운드)

※출처:McKinsey(2011)

※출처:CEBR(2012)

Page 10: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

10

[그림 4] 빅데이터 활용을 통해 기대되는 영국 정부의 부문별 예산 절감액

※출처:PolicyExchange(’12)

● 이에 따라 각국 정부 차원에서도 다양한 빅데이터 활용 전략을 구사하기 위해 노력하고 있음

- 싱가포르 정부는 빅데이터 분석을 기반으로 국가 위협 요인에 대한 평가와 환경 변화를

탐지하는 국가위험관리시스템(RAHS6))을 구축

- 일본 정부는 건설성, 통산성, 운수성, 우정성, 경찰청 등 5개 부처 협력을 기반으로 지능형

교통 정보 시스템을 마련

- 한국의 국민권익위원회도 연간 약 300만 건에 달하는 민원을 분석하기 위한 ‘민원동향분석

시스템’을 구축

[그림 5] 일본의 지능형 교통정보 시스템(좌)과 싱가포르의 RAHS(우) 추진 사례

※출처:방송통신위원회(’12)

지진으로부터3주경과한’11년4월7일시점의센다이시주변 주행실적을 표시한 그림으로, 확대해서 볼 경우통행하고싶은도로의통행여부를확인가능

3월12일이후차량주행이확인된도로

최근3일간주행이확인된도로

6)RiskAssessment&HorizonScanning

운영 효율성 개선

10억

파운

드/연

세금 오납 감소

9

2

1

6

2

13

17

16

세수확대 총계

Page 11: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

11

미국 정부의 빅데이터 R&D 전략

■ 개요

● 빅데이터를 활용한 생산성 향상 및 혁신 창출 가능성이 확인되면서 미국 정부는 ‘빅데이터 R&D

이니셔티브(Big Data Research and Development Initiative)’ 발표(’12. 3. 29)

- ‘빅데이터 R&D 이니셔티브’는 방대한 디지털 데이터에 대한 접근 및 수집·관리에 필요한

기술 및 수단 개선을 목표로 하고 있음

- 빅데이터 관련 기술의 발전, 관련 인력의 확충, 혁신 프로세스의 가속화 등을 추진

II 미국 정부의 빅데이터 R&D 이니셔티브 추진

[그림 6] 미국 ‘빅데이터 R&D 이니셔티브’의 세부 목표

※자료:OSTP(’12.3),스트라베이스재구성

Page 12: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

12

● 존 P. 홀드런(John P. Holdren) 미국 과학기술정책실장은 ‘빅데이터 R&D 이니셔티브’를 통해

빅데이터 산업 전반이 활성화될 것으로 기대

- 미국 정부 주도의 빅데이터 진흥 정책을 통해 시장 확대, 인력 확충, 기술 요소 개발 등이

이루어질 전망

- ‘빅데이터 R&D 이니셔티브’가 민간 부문의 빅데이터 산업을 활성화시키기 위한 촉매 역할을

할 것으로 기대

- 美 정부가 IT R&D 전략을 통해 슈퍼컴퓨팅 및 인터넷을 발전시켰듯이 다양한 분야의 빅데이터

관련 기술 발전이 촉진될 전망

■ 추진 체계

● 美 대통령 과학기술자문위원회(PCAST7))가 ’11년 연방 정부 수준에서의 빅데이터 관련 기술

투자 필요성을 대통령에게 건의

● 이에 백악관 산하 과학기술정책실(OSTP8)) 주도로 ‘빅데이터 R&D 이니셔티브’ 추진 결정

● 과학기술정책실은 NITRD9) 프로그램의 일환으로 빅데이터 고위 운영 그룹(BDSSG10)) 구성

- 과학기술정책실은 빅데이터 고위 운영 그룹을 중심으로 ‘빅데이터 R&D 이니셔티브’ 대상

프로젝트를 선정·개발하고 투자규모 결정

● 현재 6개 연방 부처 및 기관이 ‘빅데이터 R&D 이니셔티브’에 참여

- 국립과학재단, 국립보건원, 국방부, 국방부 산하 방위고등연구계획국, 에너지부, 미국지질

조사원 등이 프로젝트를 진행 중11)

7) President’sCouncilofAdvisorsonScienceandTechnology

8)OfficeofScienceandTechnologyPolicy

9) Federal Networking and IT R&D의약자. 2002년부터추진되고있는연방정부차원의범부처 IT R&D프로그램으로

대규모네트워크,고성능컴퓨팅시스템,소프트웨어,정보관리등기술분야의연구개발은물론신기술이사회와경제및

노동에미치는영향등을분석하는등다양한연구영역이상호유기적으로연계되어진행되고있음

10)빅데이터 고위 운영 그룹(Big Data Senior Steering Group; BDSSG)은 빅데이터에 기반을 둔 과학 기술의 발전 촉진,

빅데이터를다루기위한국가적요구와관련기관의미션발굴,연방정부의데이터관리지원,데이터과학발전을위한

인력 및 인프라 개발 등을 주요 목표로 상정하고 있으며, 구체적으로 ▲ 데이터의 수집·저장·보존·관리·분석·

공유와 관련된 핵심 기술의 최신성 유지 ▲ 빅데이터 관련 부처 간 연계 프로젝트로 얻을 수 있는 편익을 분석하고

실현가능한협업프로젝트를개발및제안하는것을주요기능으로제시하고있음

11)향후미국항공우주국(National Aeronautics andSpaceAdministration;NASA),미국해양대기관리처(NationalOceanic and

AtmosphericAdministration;NOAA)등도구체적인연구계획을수립해‘빅데이터R&D이니셔티브’참여예정

Page 13: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

13

미국 정부의 빅데이터 R&D 전략

[그림 7] 미국 ‘빅데이터 R&D 이니셔티브’ 참여 기관

■ 예산 현황

● 현재 ‘빅데이터 R&D 이니셔티브’에 참여 중인 6개 기관의 ’12년 총 R&D 예산은 1,286억 9,100만

달러에 달함

- 그 중 0.1%인 2억 달러가 ‘빅데이터 R&D 이니셔티브’에 투입될 예정

- 이는 NITRD 전체 예산인 37억 3,940만 달러의 5%에 해당하는 수치

● ‘빅데이터 R&D 이니셔티브’에 참여 중인 주요 기관의 R&D 예산이 확대됨에 따라 향후 빅데이터

관련 연구·개발이 더욱 활발해질 전망

- 국립과학재단의 경우 ’13년 R&D 예산이 전년 대비 74억 달러, 에너지부의 경우 약 8억 8,000만

달러 증가할 것으로 예상

※자료:OSTP(’12.3)

Page 14: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

1�

■ 국립과학재단(NSF)

● 국립과학재단은 국립보건원과 공동으로 빅데이터 과학 및 공학 향상을 위한 기술개발 추진 중

- 대규모의 분산된 데이터를 분석해서 유용한 정보를 추출·시각화 하는 데 요구되는 핵심적인

기술 수단 개발에 초점

- 해당 기술은 과학 및 엔지니어링을 비롯, 의학 분야까지 폭넓은 범위에서 혁신 인프라로

활용될 예정

● 데이터 과학 및 공학 연구와 교육 기능을 향상시키기 위해 활동 포트폴리오 ‘CIF21’ 구성

- 데이터 수집 및 분석용 컴퓨팅 시설, 데이터 시각화 및 모델링 등 과학 및 공학 분야에서

혁신을 주도할 수 있는 연구 인프라를 개발

- 국립과학재단의 통합인재양성프로그램인 ‘IGERT12)’와 연계해 빅데이터 연구인력 육성

● 인문사회과학, 물리학 등 다양한 분야에서의 빅데이터 적용을 장려하기 위한 프로그램 운영

- ‘DID13)’를 통해 디지털 서적이나 신문, 웹 서치 데이터, 음성 기록 등 다양한 종류의 대규모

데이터를 활용할 수 있는 인문학 연구방법 개발

- 영국 합동정보시스템위원회 및 캐나다의 인문사회과학 연구위원회와 공동으로 인문학

빅데이터 해석 관련 공모전 개최

- 물리학 데이터를 활용한 연구자들 간 공동 실험을 지원하는 ‘DASPOS’ 운영

- 대규모 천문학 데이터셋의 해석 및 의미 추출 방법을 개발하고, 연구자 간 상호 협력 네트워크

구성을 촉진하기 위해 ‘TCAN’ 프로그램 제공

● 대학과의 연계 및 지원 프로그램을 통해 대용량 데이터의 저장 및 활용방안 연구

- 천문학, 컴퓨터 과학, 신경과학 관련 데이터 저장 및 분석방법을 연구하는 캘리포니아

주립대의 연구사업 지원

- 빅데이터를 활용한 교육·학습 효과 극대화 방안 연구를 위해 각 대학에 학제 간 참여가

이루어지는 ‘아이디어 연구소(Ideas Lab)’ 설립 유도

● 대학과의 연계 및 지원 프로그램을 통해 대용량 데이터의 저장 및 활용방안 연구

- 천문학, 컴퓨터 과학, 신경과학 관련 데이터 저장 및 분석방법을 연구하는 캘리포니아

주립대의 연구사업 지원

III 부처별 빅데이터 R&D 이니셔티브 추진 동향

12) IntegrativeGraduateEducationandResearchTraineeship

13) DiggingintoDataChallenge

Page 15: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

1�

미국 정부의 빅데이터 R&D 전략

[그림 8] 국립과학재단이 운영 중인 DID(Digging into Data Challenge) 홈페이지

※자료:www.diggingintodata.org

- 빅데이터를 활용한 교육·학습 효과 극대화 방안 연구를 위해 각 대학에 학제 간 참여가

이루어지는 ‘아이디어 연구소(Ideas Lab)’ 설립 유도

● 빅데이터 관련 기본 연구에 관한 펀딩을 비롯, 데이터로부터 지식을 도출해내는 새로운 방법론을

고안하기 위한 전략 수행

- 캘리포니아 대학교의 ‘컴퓨팅 탐험대(Expeditions in Computing)’ 프로젝트14)에 1,000만 달러

지원 예정

- 복잡한 데이터의 도표화 또는 시각화를 연구하는 학부생들의 훈련 프로그램에 200만 달러

지원 예정

- 통계 및 생물학 연구자 그룹이 단백질 구조 및 생물학적 경로를 밝혀내도록 140만 달러를

지원할 계획

- 지구 과학과 관련된 데이터의 접근·분석·공유를 가능하게 하는 ‘어스큐브(EarthCube)’

시스템에도 보조금을 지급할 예정

14) 기계학습(machinelearning),클라우드컴퓨팅,크라우드소싱(crowdsourcing)등의데이터를정보로변환하기위한통합

접근법을연구하기위한프로젝트

Page 16: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

1�

■ 국립보건원(NIH)

● ‘신경 과학 청사진(Neuroscience Blueprint)’ 프로젝트의 일환으로 신경 과학 관련 데이터

수집·접근성 개선에 대한 연구개발 수행

- 전 세계 신경 과학 연구 데이터에 대한 검색을 용이하게 하기 위해 웹기반 포털 ‘NIF’ 구축

- 뇌신경 활동 경로와 기능에 관한 대량의 데이터를 수집하고 이를 도식화하기 위해 ‘휴먼

커넥톰 프로젝트(The NIH Human Connectome Project)’ 진행

[그림 9] 웹을 통해 공개되고 있는 휴먼 커넥톰 프로젝트의 결과물

※자료:www.humanconnectomeproject.org

● 국립보건원 산하 국립생체공학연구소(NIBIB15))는 생리학 관련 빅데이터에 대한 사용자 접근성

개선에 초점을 맞추고 있음

- 다양한 생리학 현상과 관련된 대용량의 데이터를 저장하기 위한 스토리지 서비스 ‘피지오

뱅크(PhysioBank)’ 운영

※ ‘피지오뱅크’데이터는‘피지오넷(PhysioNet)’을통해웹상에서쉽게활용가능,매달4만5,000명의방문자들이

4테라바이트에달하는자료를검색·활용하고있음

15) NationalInstituteofBiomedicalImagingandBioengineering

Page 17: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

1�

미국 정부의 빅데이터 R&D 전략

- 뇌신경 촬영 이미지 데이터셋에 대한 사용자 접근성 향상과 연구자 간 상호 정보 교류 및

공유 촉진을 위해 ‘NITRC16)’ 사이트17) 운영

- 뇌신경 촬영 오픈 소스 툴킷 ‘XNAT18)’를 워싱턴 대학과 공동으로 개발

※‘XNAT’를공개함으로써뇌신경이미지데이터에대한축적및관리를용이하게함

● 국립보건원 산하 국립암연구소(NCI)는 암 관련 데이터의 저장 및 공유 방법을 연구하고 있음

- 의료 이미지 및 영상 데이터 공유 플랫폼인 ‘TCIA’를 개발하여 의사들의 암 치료와 연구

지원 및 환자들의 암 발견 가능성 향상

- ’14년까지 유전자 분석 기술을 응용, 대규모의 암 세포 관련 데이터를 축적하기 위해 ‘TCGA’

프로젝트 운영

● 국립보건원 산하 국립심장폐혈액연구소(NHLBI)는 의료 데이터의 저장·통합·분석 활동 지원

- 심혈관 관련 공동 연구를 지원하기 위해 데이터 공유 및 분석 툴인 ‘CVRG’를 제공

- 보안이 요구되는 개인 진료 관련 데이터의 저장 및 공유·분석을 지원하기 위한 종합플랫폼

‘iDASH’ 제공

[그림 10] 심장 해부학에 활용되는 CVRG의 작동 프로세스

※자료:www.cvrgrid.org

16)TheNeuroimagingInformaticsToolsandResourceClearinghouse

17) NITRC에는뇌신경촬영소프트웨어도구및데이터셋450종이등록되어있으며2007년운영이시작된이래3,010만건의

조회수를기록하고있음

18) TheExtensibleNeuroimagingArchiveToolkit

Page 18: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

1�

● 국립보건원 산하 종합의학연구소(NIGMS)는 ‘단백질 데이터 은행’을 통해 전 세계 고분자 단백질

구조 관련 데이터 저장 및 유통 촉진19)

- 현재 ‘단백질 데이터 은행’에 8,000여 개의 단백질 구조 데이터 저장

- 매달 1테라바이트 규모의 단백질 데이터 축적 등 활발한 사용20)

[그림 11] 미국·영국·일본이 공동 운영 중인 단백질 데이터 은행 웹 사이트

※자료:www.wwpdb.org

● 그 외에도 국립보건원은 ‘1000 Genomes Project’를 통해 해독된 약 200테라바이트의 인체 유전자

데이터 공개

- 클라우드 서비스인 아마존 웹 서비스를 통해 누구나 데이터에 접근할 수 있도록 공개

● 향후 국립보건원은 국립과학재단과 공동으로 신경계 구조와 관련된 빅데이터 핵심 기술 연구를

수행할 예정

- 데이터의 추출·가시화·분석·관리와 관련된 기술 연구를 위해 ‘CRCNS’ 프로그램 운영 계획

19) ‘단백질데이터은행’은미국국립보건원을필두로에너지부와국립과학재단은물론영국및일본의생물정보학연구기관과

함께운영하고있음

20) ‘단백질데이터은행’에는매달140개국21만1,000여명의사용자들이방문하고있음

Page 19: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

1�

미국 정부의 빅데이터 R&D 전략

■ 국방부(DoD)

● 국방부는 이미 군사 관련 빅데이터 프로젝트에 연간 2억 5,000만 달러 투입

- 향후 ‘빅데이터 R&D 이니셔티브’ 전략의 일환으로 관련 신규 프로그램에 6,000만 달러를

추가로 지원할 예정

● 국방부는 전투원 및 군 분석가의 전투 수행 능력을 배가시키기 위한 빅데이터 기술 연구에 주력

- 대용량 데이터를 활용한 자율 의사결정시스템 구축 및 상황인식능력 개선을 위해 ‘의사 결정을

위한 데이터’ 프로젝트 수행 예정

- 전 세계 다양한 언어와 문자로부터 정보를 추출·분석하는 능력을 100배 이상 향상시키겠다는

목표도 수립

- 기타 빅데이터 관련 기술 혁신을 촉진시키기 위해 막대한 상금을 내건 연구 경진 대회도

개최할 예정

■ 방위고등연구계획국(DARPA)

● 국방부 산하 방위고등연구계획국은 대용량 데이터에서 특정 정보만을 탐지하는 기술 개발에

초점을 둔 ‘ADAMS21)’ 프로젝트를 ’11년부터 추진 중

- 총 3,500만 달러의 예산이 투입된 ‘ADAMS’는 일상적으로 발생하는 다양한 데이터 속에서

국방 위협 요소22)를 발견·감시할 수 있는 시스템

- 군사 네트워크 내부의 데이터를 감시하고 사이버 공격을 사전에 차단하기 위한 ‘CINDER

(Cyber-Insider Threat)’ 프로그램 운영

● 데이터 암호화와 관련된 프로그래밍 언어를 개발하기 위해 ‘PROCEED23)’ 프로젝트 운영

- 별도의 해독 절차 없이 암호화된 데이터를 그대로 사용할 수 있도록 함으로써 적국의 해킹

시도를 사전에 차단

● 자연어로 구성된 텍스트를 해독하고 이를 토대로 의미 기반의 결과를 제시하는 ‘기계 독해(The

Machine Reading)’ 프로그램도 진행

- ’12년 말을 목표로 관련 연구 개발 사업 진행 중

- ‘기계 독해’ 프로그램 개발이 완료시 언어 데이터 이해 기술 개발에 큰 도움이 될 전망

21) TheAnomalyDetectionatMultipleScales

22) 군인들의건강이상,내부기밀문서의무단공유행위등

23) ProgrammingComputationonEncryptedData

Page 20: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

20

● 영상 데이터 처리 기술을 발전시키기 위한 프로젝트 진행 중

- ‘마음의 눈(The Mind’s Eye)’ 프로그램을 통해 입력된 영상정보를 기초로 관련 정보 추론 및

내러티브를 창출해 내는 기술 개발

- 방대한 군사 동영상 콘텐츠를 빠른 속도로 검색·분석할 수 있도록 돕는 ‘VIRAT24)’도 고안

[그림 12] VIRAT의 작동 과정

※자료:DARPA

● 방위고등연구계획국은 향후 4년간 매년 2,500만 달러씩을 지원하여 빅데이터 분석 기술 및 SW

개발 프로젝트인 ‘XDATA’ 추진

- 분산되어 있는 불완전한 데이터를 처리하는 포괄적인 알고리즘 개발을 중점적으로 추진

- 범주 데이터, 메타 데이터 등 준정형 데이터와 텍스트, 문서 등 비정형 데이터 등 모두에

대한 분석

- 대용량 데이터를 처리하기 위한 소프트웨어 개발 환경을 유연화하기 위해 오픈소스

소프트웨어 툴킷도 제공

24) VideoandImageRetrievalandAnalysisTool

Page 21: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

21

미국 정부의 빅데이터 R&D 전략

■ 에너지부(DoE)

● 에너지부는 생물 및 환경 연구 프로그램(BER25))과 대기 방사선 측정(ARM26)) 연구시설을 통해

대기현상 데이터를 연구자들에게 제공 중

- 해당 데이터베이스는 연간 100개 이상의 연구 논문에서 활용되는 등 에너지 관련 주요 연구

인프라로써 적극 활용 중

● 에너지부는 개방형 데이터베이스 ‘KBase’도 운영 중

- 미생물학·식물학 등과 관련된 연구 데이터를 제공해 줄 뿐만 아니라 연구 설계에 따른 향후

결과 예측치까지 제시

[그림 13] KBase의 사용자 인터페이스 구성

● 에너지부 산하의 고등과학 컴퓨터 연구소는 대용량 데이터의 관리 및 접근·보존·시각화·

분석 등과 관련된 기술을 개발 중

- IBM과 공동으로 대규모의 데이터 관리를 위한 고성능 스토리지 시스템 SW 개발

- 스트리밍 데이터의 실시간 분석 기법, 비선형 데이터27)에 대한 통계 분석 기법 등 고안

- 대용량 데이터의 탐색·활용에 관한 연구자 간 협력체계인 ‘차세대 네트워킹 프로그램(HPSS28))’

제공

※자료:DoE

25) TheBiologicalandEnvironmentalResearchProgram

26) AtmosphericRadiationMeasurement

27) 요소간상호관계가불규칙한데이터셋을의미

28) HighPerformanceStorageSystem

Page 22: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

22

[그림 14] HPSS의 작동 개념

※자료:IBM

● 에너지부 소속 기초 에너지 과학 사무소 역시 대용량 데이터 관리 및 분석에 관한 연구시설 지원

- ‘ADARA29)’ 프로젝트를 통해 중성자 관련 연구에서 발생하는 대용량 데이터의 실시간 수집

및 분석시스템 제공

● 에너지부 산하 융합 에너지 과학 사무소는 고등 과학 컴퓨터 연구 사무소와의 협력 프로그램을

통해 빅데이터 관련 기술개발 추진

- 융합 에너지 관련 데이터 연산 및 분석 작업을 공동으로 진행

- 데이터 입출력 시스템과 시각화 기술은 유럽 융합에너지 전문가로부터도 큰 관심을 받고 있음

● 에너지부 산하 핵물리학 연구소는 7개 국가의 연구 시설과 2개 대학에서 발생시키는 중요 실험

결과 데이터를 관리

- 연관성 있는 실험 결과를 상호 분석해 교차 확인(cross-check)을 실시함으로써 보다 정확한

결과치가 제시될 수 있도록 지원

● 에너지부 소속 과학기술정보국은 과학기술 정보 관련 글로벌 컨소시엄인 ‘데이터사이트(Data-

Cite)’의 핵심 멤버로도 활약 중

- 과학기술정보국은 ‘데이터사이트’를 통해 데이터의 활용 및 효율적 재사용과 검증 방법에

관한 정책 수립에 주도적으로 참여

29) AcceleratingDataAcquisition,ReductionandAnalysis

Page 23: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

23

미국 정부의 빅데이터 R&D 전략

● 향후 에너지부는 2,500만 달러의 예산을 투입해 ‘확장형 데이터 관리·분석 및 시각화 연구소

(SDAVI30))’를 설립할 계획

- 에너지부는 해당 연구소를 통해 내부 슈퍼컴퓨터에 저장되어 있는 데이터를 관리하고 시각화

할 수 있는 툴을 개발할 예정

- 에너지부 산하 로렌스 버클리 국립연구소의 주도 하에 6개의 국립 연구소와 7개 대학의

전문가들이 연구소 설립에 참여할 예정

■ 미국지질조사원(USGS)

● 미국지질조사원은 지구 시스템 과학 분야에 빅데이터를 활용 예정

- 1927년 이후의 심해 어류, 무척추 생물에 관한 조사결과 데이터 등을 활용해 해양 생태계

재정의 추진

- 지난 10년간 수집된 수은(水銀) 수치 데이터31) 및 원격 감지 센서를 통해 추가 확보한 관련

데이터를 통합해 위험요소를 사전에 감지

- 지구 단층 정보 및 지진 발생 정보가 저장되어 있는 ‘GEM32)’ 데이터에 기초, 지진 위협 감지

모델 개선 및 기존 데이터 보강

● 미국지질조사원은 ‘존 웰시 파월 분석 및 통합 센터’를 통해 지구 과학의 혁신을 도모할 계획

- 대용량 데이터를 의미 있는 정보로 전환하기 위한 최첨단 컴퓨팅 기능과 협력 도구 등을

공급하며 심층 분석을 위한 연구장소 제공

- 기후 변화나 지진 발생률, 생태계 지표 등에 대한 이해증진 기대

30) ScalableDataManagement,AnalysisandVisualization

31) 미국서북부지역및캐나다와멕시코지역토양의수은수치데이터를수집

32) GlobalEarthquakeModel

Page 24: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

2�

● 미국은 ‘빅데이터 R&D 이니셔티브’를 통해 빅데이터 원천기술 개발, 빅데이터 기반의 실질적인

공공서비스 개선이 기대됨

- 빅데이터 기술과 서비스 개발시 관련 인력양성을 병행하기 위해 대학 및 연구 커뮤니티와

공동연구 실시

- 지구과학, 수학, 공학, 의학·생물학 등 빅데이터 기반의 다학제간 연구개발 적극 지원

● 미국 정부 주도의 빅데이터 활성화 정책 추진으로 일자리 창출 및 예산 절감 효과 기대

- 맥킨지는 미국 정부가 빅데이터 활용을 통해 보건 분야에서만 연간 3,300억 달러 상당의

가치 창출 추정

- ’18년까지 14 ~ 19만 명의 전문 데이터 분석 인력수요 발생 전망

- 데이터 관리자에 대한 수요 역시 150만 명에 달할 것으로 예상

● 미국 정부의 직접적 빅데이터 산업육성은 고무적이지만, 다부처의 독자적 사업 추진에 따른

중복 우려도 제기

- IT 전문 매체 인포메이션위크는 정부의 빅데이터 관련 프로젝트의 지나친 분산에 따라 예산

낭비 가능성 제기

- 빅데이터 정책의 성공적 추진을 위해 부처 간 공조가 긴요하지만, 현재 부처간 협력이 미흡

● 정부의 빅데이터 활성화 정책을 성공적으로 추진하기 위해 데이터센터 강화 필요성 제기

- ‘빅데이터 R&D 이니셔티브’에서 빅데이터 산업의 핵심기반인 데이터센터 계획에 대한

언급이 부재

- ‘연방 데이터센터 강화’ 계획의 안착 여부가 빅데이터 전략의 성공 여부에도 영향을 미칠 전망

※ 현재미국정부는’15년까지총50억달러의비용절감을목표로전국데이터센터를통합하는‘연방데이터센터

강화’계획추진중

IV 시장 평가 및 의의

Page 25: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용

2�

미국 정부의 빅데이터 R&D 전략

R E F E R E N C E

● CCCBlog,ObamaAdministrationUnveils$200MBigDataR&DInitiative,2012.3.29

● CEBR,Dataequity:Unlockingthevalueofbigdata,2012.4

● ComputerWeekly,“Whitehallcouldsave£33bnwithbigdataanalytics,saysPolicyExchange”,2012.7.3

● Computing.co.uk,Report:Bigdatatoadd£216bntotheUKeconomy,2012.4.5

● GCN,WhiteHouselaunches$200M‘BigDataR&D’initiative,2012.3.29

● GEN,PresidentBarackObama’sAdministrationLaunchesBigDataInitiativewith$200M,

2012.4.26

● IBM,HighPerformanceStorageSystemOverview,2009

● IDC,2011DigitalUniverseStudy:ExtractingValuefromChaos,2011.6

● Informationweek,BigDataInitiativeOrBigGovernmentBoondoggle?,2012.4.2

● Informationweek,WhiteHouseShares$200MillionBigDataPlan,2012.3.29

● McKinsey,Bigdata:Thenextfrontierforinnovation,competition,andproductivity,2012.6

● NITRD,FederalNetworkingandInformationTechnologyR&DProgram:BigDataSeniorSteeringGroup,

2012.4.13

● NITRD,NetworkingandInformationTechnologyResearchandDevelopmentProgram:Supplementto

thePresident’sBudgetFY2013,2012.2

● OSTP, “Obama Administration unveils “Big Data” Initiative: Announces $200 million in new R&D

Investments”,2012.3.29

● OSTP,FactSheet:BigDataAcrosstheFederalGovernment,2012.3.29

● OSTP, Obama Administration Unveils “Big Data” Initiative: Announces $200 Million in New R&D

Investments,2012.3.29

● PolicyExchange,“TheBigDataOpportunity-Makinggovernmentfaster,smarterandmorepersonal”,

2012.7.3

● TDWIResearch,BigDataAnalytic,2011.9.14

● TheGuardian,“Betteruseofpublicdatacouldsavegovernment£33bn”,2012.7.3

● WashingtonPost,“‘Bigdata’fromsocialmedia,elsewhereonlineredefinestrend-watching”,

2012.6.7

● IDCKorea,빅데이터분석:CIO를위한미래지향적아키텍처,기술그리고로드맵,2011.11

● 방송통신위원회,방통위,빅데이터서비스활성화적극나선다,2012.6.21

● 방송통신해외정보시스템,美행정부,‘빅데이터R&D이니셔티브’발표,2012.4.5

● 스트라베이스,빅데이터시장활성화를위한韓·美·日정책비교,2012.7.11

● 스트라베이스,주요국의빅데이터(BigData)공공부문(공공정보공개,R&D,공공서비스)활용사례,

2012.5.31

● 한미과학협력센터,미국립연구재단(NSF)의주요연구지원프로그램,2012.4

Page 26: 미국 정부의 빅데이터 R&D 전략 VoLTE(Voice over LTE) · 2013-06-10 · VoLTE(Voice over LTE) 27 미국 FTC, 아동 온라인 사생활 보호 법안(COPPA) 수정 내용