59

20100407 이규철 digital archiving

Embed Size (px)

DESCRIPTION

Digital Archiving

Citation preview

Page 1: 20100407 이규철 digital archiving
Page 2: 20100407 이규철 digital archiving

2

I. 전자기록물이란 ?

II. 영구보존

III. 정부 전자기록물 관리

IV. 새로운 전자기록물

V. 새로운 보존환경 인프라

Page 3: 20100407 이규철 digital archiving

3

전자기록물의 정의

전자기록물의 요구사항

전자기록물의 종류

전자기록물의 기술발전 추이

전자기록관리 도전과제들

Page 4: 20100407 이규철 digital archiving

4

전자기록물의 정의

법 률법 률

공공기록물관리에관한법률 제 20 조 1 항

『 컴퓨터 등의 정보처리장치에 의하여 생산 · 관리되는 기록정보 자료 』

공공기록물관리에관한법률 동 시행령 제 2 조 ( 정의 )

『 전자기록물이라 함은 정보처리능력을 가진 장치에 의하여 전자적인 형태로 작성하여 송신 · 수신 또는 저장되는 기록정보자료 』

컴퓨터 등 전자적 처리 장치를 사용하여 생성 · 획득 · 이용 · 관리되는 기록 .

디지털 형태로 존재한다는 의미에서 “ 디지털 기록” 이라고도 함

학술적 정의 ( 용어사전 )학술적 정의 ( 용어사전 )

Page 5: 20100407 이규철 digital archiving

5

• CFR : the code of federal regulations

• U.S.C : United States Code

36 CFR Chapter XII, subchapter B-Records Management, part 1234 –

Electronic Records Management

컴퓨터 만이 처리할 수 있고 , 44 U.S.C. 3301 의 연방기록물 정의를 만족하는 형식으로 기록된 모든 정보

미국 국립기록청 (NARA)미국 국립기록청 (NARA)

기록물은 물리적 형식이나 특성에 관계없이 연방정부 기관들이 연방법률에 따라 또는 공무수행과 관련하여 작성하거나 또는 접수한 문서 , 그리고 연방정부의 조직 , 기능 , 정책 , 의사결정 , 업무절차 , 운영 , 기타 활동들의 증거로서 또는 데이터의 정보로서의 가치 때문에 당해 기관이나 법적 계승기관에 의해 보존되고 있는 모든 도서 , 문서 ( 서류 ), 지도 , 사진 , 기계판독자료 , 기타 다큐멘터리 자료들을 포함한다 .

44 U.S.C. Chapter 33, 3301. Definition of records44 U.S.C. Chapter 33, 3301. Definition of records

전자기록물의 정의 ( 계속 )

Page 6: 20100407 이규철 digital archiving

6

• 진본성 (Authenticity)– 진본성의 요건

• 원래 의도했던 대로 기록물로서 성립된 것임이 증명될 수 있음 • 절차상 적법한 사람이 생산 및 접수• 의도된 시간에 생산 , 접수

– 진본성의 보장– 기록물 생산자 승인 및 식별 보장– 기록물에 대한 보안 및 업무절차 성문화

• 기록물의 무단 수정 금지 보장

• 신뢰성 (reliability) – 업무 활동 사실을 완전하고 정확하게 기록– 향후의 업무와 활동의 과정에서 의존할 수 있는 기록

전자기록물의 요구사항 -ISO 15489(&23081)

Page 7: 20100407 이규철 digital archiving

7

• 무결성 (integrity) – 기록이 완전하고 변경되지 않은 것– 기록 수정 시의 정책과 업무절차 필요– 기록물의 무단 변경에 대한 추적 가능

• 가용성 (usability) – 기록물의 소장 위치가 검색 , 제시 , 해석될 수 있는 것– 기록물의 메타데이터가 해당 기록물과 관련 업무나 활동을 이해하는데

필요한 정보를 제공

전자기록물의 요구사항 ( 계속 )

Page 8: 20100407 이규철 digital archiving

8

• 사무용 전자파일들

-.hwp, .doc, .ppt, .xls ..

• 종이문서의 스캔 파일

• 웹 기록물

• 행정정보 데이터셋 (DB)

• 디지털 사진 , 위성사진파일

• 디지털 비디오 , 오디오

• 멀티미디어 , 애니메이션

• 지리공간데이터 (GIS)

• 3D 그래픽 , 홀로그램 등

전자기록물의 종류

Page 9: 20100407 이규철 digital archiving

9

1980 년대 이전 1990 ~ 2010 년대 2010 년대 이후

•종이문서•도면•시청각물•행정박물

전자 종이CD / DVDMF / 영화 필름 서버 / 스토리지

기록물

기록매체

종 이

사진 필름 하드디스크 USB

전자문서 디지털 시청각물 3D 지리정보 3D 홀로그램

MRAM

??

전자기록물의 기술발전 추이

E - KOREA U - KOREA

Page 10: 20100407 이규철 digital archiving

10

전자기록관리 도전과제들

사무용 오피스 문서 , 웹기록물 , 데이터베이스 , GIS, CAD/CAM 등 다양한 전자기록물의 보존 · 활용 문제

다양성다양성

계층 구조로 복잡하게 구성되어 있는 데이터 ( 예 , 지리공간데이터 ) 에 대한 보존 · 활용 문제계층 구조로 복잡하게 구성되어 있는 데이터 ( 예 , 지리공간데이터 ) 에 대한 보존 · 활용 문제

복잡성복잡성

급격한 기술 발전으로 H/W, S/W 의 생명주기가 짧아 발생하는 구형화 문제급격한 기술 발전으로 H/W, S/W 의 생명주기가 짧아 발생하는 구형화 문제

구형화구형화

사무환경 변화에 따라 급격히 증가하고 있는 대량 , 대용량의 각종 전자기록들을 처리하기 위한 인프라 문제대량 ·대용량대량 ·대용량

다양한 시스템에서 생산되는 기록물의 진본성 , 무결성 , 신뢰성 , 이용가능성 등 기록속성의 장기 유지 문제다양한 시스템에서 생산되는 기록물의 진본성 , 무결성 , 신뢰성 , 이용가능성 등 기록속성의 장기 유지 문제

기록속성유지기록속성유지

Page 11: 20100407 이규철 digital archiving

11

영구보존 개념

디지털 보존 접근 방법들

전자기록물 보존 원리

OAIS

Page 12: 20100407 이규철 digital archiving

12

• 기계가 읽을 수 있는 컴퓨터 파일의 사용할 수 있는 기간을 연장하고 , 무용화 되는 것을 막기 위해 고안된 다양한 행위

• 비트 스트림 (Bit Stream) 의 영구 유지

• 파일의 내용에 대한 지속적인 접근성 제공

영구보존 (Permanent Preservation) 개념

Page 13: 20100407 이규철 digital archiving

13

• 기능– Viability

• 비트 스트림 유지 : 저장 미디어로부터 정보를 읽어 올 수 있음을 의미

– Renderability• 인간 사용자에게 보여질 수 있거나 컴퓨터에 의해 처리될 수 있는 폼으로

비트 스트림을 변환할 수 있는 가능성

– Understandability• 사용자에 의해 해석되고 이해 될 수 있도록 충분한 정보를 제공

• 비트 스트림과 컨텐츠 , 폼 , 스타일 , 모양 , 기능성을 보존

영구보존 ( 계속 )

Page 14: 20100407 이규철 digital archiving

14

• 종이기록물– 특정 시간에 한 장소에서만 접근 가능– 기록물 보존 = 기록 개체 ( 기록 재료 : 종이 ) 의 보존– 기록의 열람을 원하는 경우 직접 접근– 원본성 (originality) 존재

• 전자기록물– 기술 (technology) 를 통해 접근

• 열람을 위해 하드웨어와 소프트웨어로 조합된 도구 사용– 전자 기록물 = 기술 + 데이터 ≠ 물리적 개체– 열람 가능한 기록물 = 원본 복사본 (original copy)– 원본성 (originality) 부재

전자기록물의 기본 특성

Page 15: 20100407 이규철 digital archiving

15

• 프로세스 (process)– 원시자료로부터 의미를 표현하기 위해 요구되는 기술 (technology)

• 전자기록물의 원시자료는 데이터 파일

전자기록물의 실행 모델

원시자료 (source)

프로세스 (process)

실행 (performance)

열람자(researcher)

데이터 파일 (data file)

H/W & S/W화면 표시

(rendering on screen)

열람자(researcher)

실행모델 : 원시자료(source)-프로세스(process) 컴포넌트

실행모델 : 디지털 기록물

Page 16: 20100407 이규철 digital archiving

16

• 전자기록물 보존 업무– 원시자료와 프로세스의 보존– 요청 시 원시자료와 프로세스가 실행될 수 있도록 하는 것

• 보존의 현실성– 원시자료의 보존은 가능– 프로세스의 보존은 비현실적

• IT 의 역동적 발전• 기술 (technology) 의 생명주기가 점점 짧아짐

– 저장매체의 급격한 퇴화• 디스크 , 테이프 , 카트리지 등• 짧은 수명 : 매체 재수록 (refreshment) 전략으로 극복

• 실행모델의 시사점– 진본성을 가진 기록물의 실행을 위해 소스와 프로세스 모두 원본성을

가질 필요는 없다 .– 실행의 필수 부분들이 복제 된다면 소스와 프로세스는 대체 가능

디지털 보존의 문제들

Page 17: 20100407 이규철 digital archiving

17

• 마이그레이션 (migration)– 하나의 데이터 포맷 (format) 으로부터 다른 데이터 포맷으로 변환하는

것• 예 : MS 워드 2007 버전에서 Adobe 사의 PDF 로의 변환

– 일반적으로 소프트웨어가 구형화될 때 디지털 기록물의 접근가능성을 보장하는 방법으로 이용

– 실행모델에서 원시 자료 객체를 쓸모 없는 구형 데이터 포맷 (format)으로부터 현재의 데이터 포맷으로 변환하는 것

• 현재의 프로세스 ( 하드웨어 및 소프트웨어 결합체 ) 가 새로운 원시자료를 표현

– 디지털 객체의 일부 속성은 마이그레이션 과정에서 소실될 수 있음• 마이그레이션 이후의 실행은 예전과 동일하지 않을 수 있음• 데이터 손실 정도에 영향을 주는 요소

– 보존처리 횟수 , 선택한 마이그레이션 방법 , 새로운 데이터 포맷 , 사람의 개입 정도 , 마이그레이션 이후 기술 ( 記述 ) 작업

디지털 보존 접근 방법들

Page 18: 20100407 이규철 digital archiving

18

• 원시 자료 객체를 원래 (original) 데이터 포맷으로 보존– 프로세스의 일부 또는 모두를 현재 사용하는 컴퓨터에서 재현

• 기록물의‘외형과 느낌 (look and feel)' 보존– 원래 (original) 프로세스의 기능을 올바르게 재생산하는 것만이 최선의

방법– 기록물의 내용 , 실질적인 외형 ( 표현모습 ) 을 모두 유지

• 단점– 사용자들이 적절한 에뮬레이션 환경에 접속하지 못하는 경우 접근이

어려움– 기록물 열람자가 기록물이 생산된 시기의 컴퓨팅 환경을 배워야 함 .

• 예 : 2050 년에 살고 있는 기록물 열람자가 1990 년대 초에 생산된 기록물을 열람하기 위해서는 DOS 의 시스템 명령어를 익혀야 함

• 에뮬레이션 (emulation) : 마이그레이션 (migration)= “외형과 느낌 (Look and Feel)”중시 : “ 실제 내용(Content)”중시

에뮬레이션 (emulation)

Page 19: 20100407 이규철 digital archiving

19

• 기록물이 의미를 유지하는데 필요로 하는 “필수적인 보존 특성”

• 예– 워드프로세스 문서 = 원문 내용 (textual content) + 문서 형태

정보 ( 글꼴 , 색상 , 문서 레이아웃 등 )– 본질 (essence)

• 원문 내용 (textual content)• 업무 활동의 법적 증거 제공

• 실행 특성을 모두를 보존할 경우– 기록물 영구 보존 의미에 부합하지 않는 요소들을 보존하는데 많은

비용을 요구

• 기록물의 의미를 유지하는데 필수적인 본질 (essence) 결정– 본질을 보존하는데 중점을 둬야 함

본질 (essence) 의 개념

Page 20: 20100407 이규철 digital archiving

20

• 디지털 보존프로그램은 전자기록물을 생산한 애플리케이션 , 시스템 , 저장포맷 등에 관계없이 보존할 수 있어야 함– 전자기록물의 영구보존 가치

• 생산 , 사용했던 맥락 (context) 보존• 최고의 기록관리 : 영구보존 자료를 보다 쉽게 확인토록 해주는 것• 디지털 보존프로그램이 포괄적이기 위해서는 , 모든 환경으로부터

이관되는 기록물을 보존할 수 있어야 함 .

• 디지털 보존프로그램은 전자기록물의 본질 (essence) 을 결정 , 보존하여야 하며 , 언제든지 필수 실행요소들을 재생산해야 함

전자기록물 보존 원리 (principles)

Page 21: 20100407 이규철 digital archiving

21

• 디지털 보존프로그램은 비 -독점기술을 기반으로 하여야 함– 독점 데이터포맷은 전자기록물의 장기보존 및 접근용으로는 부적절– 독점 포맷으로 구성된 전자기록물에 대한 열람은 궁극적으로

지적재산권 소유자의 권한

• 기록물의 무결성에 대한 위험을 줄이기 위하여 , 보존프로그램은 각 전자기록물에 적용하는 보존처리의 횟수를 최소화해야 함– 높은 적용비용– 기록물 무결성에 잠재적인 위협

• 디지털 보존프로그램은 기록물 열람자들의 접근방법을 강제하지 않아야 함– 기록물이 어떤 컴퓨터 플랫폼을 통해서도 접근할 수 있어야 함

전자기록물 보존 원리 ( 계속 )

Page 22: 20100407 이규철 digital archiving

22

• 전자 정보 영구보존을 위하여 개발된 보존 시스템에 대한 권고사항– 정보 (Information) 의 정의– 정보를 정보 패키지 (Information Package) 로 표현– OAIS 에서의 단계별에 따른 각각의 정보패키지 정의– OAIS 에서의 기능적 모델 제시– 보존전략 제시

• Open– 공개용으로 어느 기관이나 사람들이 사용할 수 있는 참조 모델 표준

• Archival Information System– 정보를 생산 , 보존 , 전달하는 신뢰할 수 있는 하드웨어 ,소프트웨어 ,

사람

ISO 14721 : OAIS(Open Archival Information System)

Page 23: 20100407 이규철 digital archiving

23

• National Space Science Data Center– NASA 의 첫 번째 디지털 아카이브

• Consultative Committee for Space Data Systems– 국제적 항공 우주 기관

• 아카이브 표준을 ISO 로 제안– 항공 우주와 관련된 데이터 제안– 디지털 데이터를 장기 보존하는 방법 제안

OAIS 개발 기관

Page 24: 20100407 이규철 digital archiving

24

• 정보의 정의– 교환할 수 있는 모든 유형의 지식– 표현 정보를 사용하여 해석한 데이터

정보 객체의 정의

Page 25: 20100407 이규철 digital archiving

25

정보 패키지

정보 패키지 구성 내용정보 (CI)

내용 정보 자체 내용정보 생산 이유 다른 내용정보객체와의 관계 정보 포함

보존설명정보 (PDI) 내용정보의 식별자

패키징정보 내용정보와 보존설명정보를 하나의 묶음으로 보호

패키지 설명정보 (DI) 내용정보를 가진 패키지를 검색할 때 이용

Page 26: 20100407 이규철 digital archiving

26

• 정보 패키지 종류– 제공 정보 패키지 (SIP)

• 생산자와 OAIS 사이의 협의• 생산자가 OAIS 에게 보내는 정보

– 영구 보존 정보 패키지 (AIP)• 보존하기 위한 정보 패키지• 내용 정보와 PDI 로 구성

– 보급 정보 패키지 (DIP)• 하나 이상의 AIP 전체나 일부분을 포함• OAIS 가 열람 요청자에게 보내는 정보

• 정보 패키지를 3가지로 나눈 이유– 생산자가 제공하는 표현 정보가 OAIS 의 보존요구를 충족시키지 못하는 경우 발생– 생산자가 제공하는 표현 정보의 구성이 OAIS 의 것과 다른 경우 발생– 열람요청자에게 OAIS 에서 영구 보존하는 모든 정보를 제공할 필요가 없기 때문에

정보 패키지 [ 계속 ]

Page 27: 20100407 이규철 digital archiving

27

단계별 정보 패키지의 흐름

Page 28: 20100407 이규철 digital archiving

28

Archival Information Package

Page 29: 20100407 이규철 digital archiving

29

OAIS 기능적 모델

Page 30: 20100407 이규철 digital archiving

30

OAIS 기능적 요소

• 흡수– 제공정보패키지 (SIPs) 를 받아서 처리하는 기능을 제공

• 보존– 영구보존정보패키지 (AIPs) 의 저장 , 유지 , 검색을 위한 기능 및 서비스를 제공

• 데이터 관리– 보존 정보를 확인– 아카이브를 운영하는데 필요한 모든 행정정보를 유지하고 이에 접근하는 서비스와

기능 수행• 운영

– 아카이브 시스템의 전반적인 운영 담당• 보존 계획

– OAIS 전체를 모니터링 및 장기 보존을 위한 계획 및 방법을 제시• 접근

– OAIS 에서 저장하고 있는 정보의 가용성 , 위치 , 설명 정보 , 존재 여부를 결정하여 열람 요청자에게 제공

Page 31: 20100407 이규철 digital archiving

31

보존 계획

• 보존 계획의 핵심 기능 2 가지– 보존전략과 표준을 개발– 패키지 디자인과 마이그레이션 계획 개발

• 보존 대상– 내용정보 , 보존설명정보 , 패키지 정보 , 보존 정보 패키지

• OAIS 에서 취하는 마이그레이션 의 유형– 갱신 (Refreshment) : 보존저장 객체의 모든 H/W 나 S/W 를 다른 것으로 대체– 복제 (Replication) : 정보패키지를 같거나 다른 매체로 복제– 재패키징 (Repackaging)

• 내용정보 , 보존 설명 정보의 비트들이 한 CD 내에서 3개의 다른 파일에 담겨 있는 경우

• 3개의 파일 내용을 새로운 디렉토리와 다른 파일로 이전• 패키지 정보가 변하게 됨

– 변환 (Transformation)• 내용정보나 보존 설명 정보의 변화가 필요한 경우

Page 32: 20100407 이규철 digital archiving

32

보존 메타데이터 종류

• 기술적 메타데이터– 보존 전략을 제공하기 위한 H/W 와 S/W 의 환경에 관한 기술 정보를

기록

• 권한 관리 메타데이터– 기록물의 권한 및 협약 사항들을 기록

• 지적 보전 메타데이터– 무결성과 진본성을 보존하기 위해

• 자원 발견 메타데이터

Page 33: 20100407 이규철 digital archiving

33

추진 현황

전자기록관리 체계 개념도

기록관리 시스템 구축

기반 시스템 구축

서비스 시스템 구축

Page 34: 20100407 이규철 digital archiving

34

추진 현황

기록관리 시스템 영구보존기반 시스템 서비스 시스템년도

기록관리시스템 고도화

중앙영구기록관리시스템 고도화

기록관리시스템 중앙부처 확산

기록관리시스템 지방자치단체 시범구축

기록관리시스템 개발

중앙영구기록관리시스템 개발

20092009

20082008

20072007

20062006 보존포맷변환시스템 개발

전자서명장기검증 시스템 개발

나라기록포털시스템 개발

나라기록통합검색 시스템 개발

MDR 체계 구축

UCI 체계 구축

Page 35: 20100407 이규철 digital archiving

35

전자기록관리 체계 개념도

기록관리체계

통합정보공개시스템

공개행정정보 제공

헌법기관기록관리시스템

지방기록관리시스템

나라기록포털

기록 콘텐츠 제공

나라기록통합검색

기록물 목록정보 제공

보존포맷시스템

문서 /장기포맷 관리

정부기능분류시스템

전자서명 장기검증

서명검증정보 관리

비전자 등

통합 온 -나라시스템

과제 /문서관리카드 등

전자문서시스템

결제 /시행 /접수문서 등

MDR

메타데이터 관리

UCI

식별체계 관리

기록관리시스템

•업무 /기록분류 체계 관리•전자 /비전자관리•기록물평가•기록물이관

중앙영구기록관리시스템

•범정부 업무 /기록분류관리

•장기 전자 /비전자 관리

•매체수록 · 영구보존

Page 36: 20100407 이규철 digital archiving

36

기록관리 시스템 구축

국제표준에 따라 업무 기반의 전자기록관리체계를 표준화 · 시스템화

기록관리 전 과정을 온라인 처리하여 기록물의 무결성 및 진본성 보장

업무와 분리된 기록분류체계를 개선하여 , 업무기반의 기능분류체계 (BRM) 를 적용함 으로써 업무과정에 기반한 기록생산 및 통합관리 가능

과거 종이문서 기반의 자료관시스템을 개선하여 의사결정 과정 및 업무처리 전 과정의 전자기록을 보존 · 관리할 수 있는 시스템

국제표준에 따라 다양한 기록물의 통합관리를 위한 프로세스 및 시스템 적용

통합 기록관리체계 구축통합 관리 프로세스통합 관리 프로세스

수집관리

등록관리

보존관리

기술 · 재분류

열람 · 활용

중앙영구기록관리시스템

시청각기록물

일반기록물

해외기록물

정부간행물

행정박물

총독부기록물

Page 37: 20100407 이규철 digital archiving

37

업무관리시스템과 기록관리시스템 연계도

Page 38: 20100407 이규철 digital archiving

38

기록관리시스템과 영구기록관리시스템간 연계도

Page 39: 20100407 이규철 digital archiving

39

영구보존 기반시스템 구축

전자기록 무결성의 장기검증 위해 인증서폐기목록 및 타임스탬프 확인으로 장기검증

법령상의 기록관리 4대 속성을 기술적으로 구현한 장기보존포맷

문서보존포맷 (PDF/A-1)

PDF/A-1

ISO 19005-1 준수

장기보존포맷 (XML)

ISO 14721 준수

기록물건

PDF/A-1PDF/A-1PDF/A-1

+

메타데이터

서명 인증 정보

문서보존포맷 변환

장기보존포맷변환

전자 공문서

시점확인 처리11

11

유효성 검증11

22

장기검증 처리11

33

기록관리 시스템 (RMS/CAMS)

개인키

인증서

전자서명생성 및 검증

장기검증 API

장기검증요청

시점확인요청

전자서명요청

전자서명검증요청

장기검증 API

장기검증요청

시점확인요청

전자서명요청

전자서명검증요청

인증서 등록

검증데이터 생성 /검증

인증서 폐기목록 관리

TSA 정보 / 감사기록 관리감사기록 관리

원문내용증명시스템

통합전자서명관리 시스템

장기검증시스템

WORM스토리지

DB

HSM장비

전자서명 장기검증 시스템

Page 40: 20100407 이규철 digital archiving

40

영구보존 기반시스템 구축 ( 계속 )

MetaData Registry (MDR)

메타데이터의 생성 , 등록 , 관리를 지원함으로써 시스템 또는 조직간의 정보공유 지원

데이터 사용자가 데이터의 의미 , 표현 , 식별 등에 대하여 쉽게 이해할 수 있도록 함

메타데이터의 재사용 , 표준체계 수립

ISO/IEC JTC1 : ISO 11179, 19763, 20944, XMDR

Universal/Ubiquitous Content Identifier (UCI)

각 분야별 식별체계간의 연계와 상호 운용을 위해 개발된 식별체계

UCI

구문구조

메타데이터

운영절차

시스템 구현중앙영구기록관리시스템

전자서명 장기검증시스템

기록관리시스템

나라기록포털

나라기록통합검색

대통령기록관리시스템

Page 41: 20100407 이규철 digital archiving

41

장기보존포맷

기록물철장기보존포맷

기록물철

기록물분철

기록물건

문서(본문/첨부)

잠김인증정보

잠김인증정보

전자기록철

객체객체 메타데이터

객체 내용

기록물건

기록물건 메타데이터

문서 1…

문서 메타데이터

인코딩

인코딩메타데이터

문서 데이터

… 문서 n

문서 메타데이터

인코딩

인코딩메타데이터

문서 데이터

인증정보

객체객체 메타데이터

객체 내용

기록물철

기록물철메타데이터

기록물분철메타데이터

인증정보

기록물건 장기보존포맷

기록물철장기보존포맷

기록물철

기록물분철

기록물건

문서(본문/첨부)

잠김인증정보

잠김인증정보

전자기록철

객체객체 메타데이터

객체 내용

기록물건

기록물건 메타데이터

문서 1…

문서 메타데이터

인코딩

인코딩메타데이터

문서 데이터

… 문서 n

문서 메타데이터

인코딩

인코딩메타데이터

문서 데이터

인증정보

객체객체 메타데이터

객체 내용

기록물철

기록물철메타데이터

기록물분철메타데이터

인증정보

기록물건 장기보존포맷

Page 42: 20100407 이규철 digital archiving

42

진본성 보장을 위한 메타데이터

• 기록물 생산자 식별 보장– 기록물 생산자 식별을 위해 개인이나 기관의 ID 를 기록하도록 한다 .– 관련 메타데이터 : 행위자 -> 개인 ID/ 기관 ID

• 기록물 생산자 승인– 기록물과 관련한 모든 행위자의 서명정보를 담도록 하고 있다 .– 관련 메타데이터 : 인증정보

• 기록물의 무단 수정 금지 보장– 관련법규와 수정자의 정보를 기록하게 함으로써 무단 수정을 금지한

다 .– 관련 메타데이터 : 관리정보 -> 수정정보

Page 43: 20100407 이규철 digital archiving

43

신뢰성을 위한 메타데이터

• 업무 활동 사실을 완전하고 정확하게 기록– 기록의 생명주기 전 과정에 일어나는 모든 행위를 기록하도록 하고

있다 .– 관련 메타데이터 : 생산정보 , 보존정보 , 인수인계정보 , 관리정보 ,

사용정보

• 향후의 업무와 활동의 과정에서 의존할 수 있는 기록– 업무분류와의 연관성 정보를 기록할 수 있도록 하고 있다 .– 관련 메타데이터 : 분류정보 , 과제관리카드 , 문서관리카드

Page 44: 20100407 이규철 digital archiving

44

무결성을 위한 메타데이터

• 기록이 완전하고 변경되지 않은 것– 한번 생성된 객체는 수정될 수 없으며 , 수정된 내용은 양파형 객체로

생성된다 . 또한 , 기록에 관한 모든 사건의 행위자의 인증정보를 기록하도록 한다 .

– 양파형 객체 구조– 관련 메타데이터 : 인증정보

• 기록 수정 시의 정책과 업무절차 필요– 관련법규와 수정자의 정보를 기록하게 함으로써 무단 수정을 금지한

다 .– 관련 메타데이터 : 관리정보 -> 수정정보

• 기록물의 무단 변경에 대한 추적 가능

Page 45: 20100407 이규철 digital archiving

45

가용성을 위한 메타데이터

• 기록물의 소장 위치가 검색 , 제시 , 해석될 수 있는 것– 기록물 자체에 대한 정보를 기록할 수 있도록 하고 있으며 , 검색어 ,

표제 등을 제공한다 .– 관련 메타데이터 : 고유식별자 , 표제 , 상세정보 -> 요약정보 ,

보존정보 -> 보존장소 /보존위치

• 기록물의 메타데이터가 해당 기록물과 관련 업무나 활동을 이해하는데 필요한 정보를 제공– 기록물과 관계된 업무와의 관계성을 기록하도록 하고 있다 .– 관련 메타데이터 : 분류정보 , 과제관리카드 , 문서관리카드

Page 46: 20100407 이규철 digital archiving

46

서비스 시스템 구축

국가기록물 통합검색체계 및 기반 마련기록정보 활용을 위한 사용자 중심의 기록정보 통합 검색서비스

주요기록 대상 기획 콘텐츠 발굴 · 개발 , 고객층별 특성을 고려한 고객중심의 콘텐츠 서비스 제공

CAMSCAMS

일반기록물시청각기록물정부간행물해외기록물

국무회의록 등

컬렉션서비스 콘텐츠 서비스

온라인신청서비스 온라인발급서비스

통합검색 연계검색공개기록물서비스 컴포넌트모델 구축

주제콘텐츠 구축 토픽 /컬렉션 구축

Page 47: 20100407 이규철 digital archiving

47

웹 기록물

데이터베이스

지리공간데이터

CAD/CAM

기타 전자기록물

고려사항

Page 48: 20100407 이규철 digital archiving

48

웹 기록물

정 의정 의 공공기관에서 운영 · 관리하는 홈페이지 등 웹사이트에 포함된 모든 형태의 기록정보와 관련 문서 , 매뉴얼 등을 말함

보존 방안보존 방안

공공 Web

Access

생성

소멸

Archiving

Format

현재 Data ( 접근 )

Old Data

※ 소멸되기 전 웹 기록물을 자동 수집하여 보존포맷 변환을

통해 보존 · 서비스

웹기록 자동수집기

자동수집

대 상대 상

콘텐츠

CSS

플래쉬

자바 스크립트

메타정보

HTML

AJAX

통계정보

해외 사례해외 사례

PANDORA

미국 의회도서관미국 의회도서관

국제 프로그램국제 프로그램

호주호주

영국 TNA영국 TNA UK Government Web Archive

MINERVA

IIPC, Internet Archive

IIPC : International Internet Preservation Consortium

Page 49: 20100407 이규철 digital archiving

49

데이터베이스

보존 방안보존 방안

정 의정 의 특정한 업무 목적을 위해 생산 관리되고 , 여러 컴퓨터 시스템을 통해 접근 활용할 수 있는 데이터들의 집합

모 습모 습

사용자사용자사용자

시스템 시스템 시스템

데이터베이스관리시스템 (DBMS)

인사 조직시스템

사용자

도움말

권한메뉴

오류인사 근태

급여상훈

※ DBMS (DataBase Management System) : Oracle, DB2, MS SQL Server, Sybase 등

Oracle DB2 Informix

MySqlSQL-Server

Sybase

MS access

MigrationMigration

ArchiveDatabase

Archiving Storage

포맷 변환포맷 변환

콘텐츠

Page 50: 20100407 이규철 digital archiving

50

지리공간데이터 (Geospatial data)

정 의정 의 지형 , 지질 , 강 , 도로 , 임야 , 도시 , 상하수도 , 행정구역 , 인구밀도 등을 나타내는 공간 데이터들

보존 방안보존 방안

지도 /도면

지리공간정보

속성정보

통계정보

포맷 변환포맷 변환

모 습모 습

도로도로

원격감지이미지원격감지이미지

토지 이용도토지 이용도

인구밀도인구밀도

행정구역행정구역

수송경로수송경로

강강

지리 ,지질 등지리 ,지질 등

데이터 계층

정형화된 정보 제공

다양한 정보 제공

정보 접근의 용이성

장기 보존의 확보

Page 51: 20100407 이규철 digital archiving

51

CAD/CAM

정 의정 의건축 , 기계 , 부품 등의 도면과 같은 기술적인 그림을 컴퓨터를 이용하여 설계한 데이터 , 이를 이용하여 가공 및 생산을 자동화 처리

보존 방안보존 방안모 습모 습

포맷 변환포맷 변환

건축 CAD

기계 CAD

패턴 CAD

OR CAD

.dwg .prt

.igs

.stl

.cgr

.hcg

.dwg

.vps

전자 CAD

지도 CAD

Auto CAD

캠 CAD

ArchiveDatabase

Archiving Storage

Page 52: 20100407 이규철 digital archiving

52

기타 전자기록물

위성사진 위성지도 애니메이션

3D 그래픽 홀로그램 다양한 전자기록

Page 53: 20100407 이규철 digital archiving

53

고려사항

대량 , 대용량 데이터의 분산처리 및 신속한 검색 제공분산처리분산처리

효과적 전자기록관리를 위한 업무기능 자동화효과적 전자기록관리를 위한 업무기능 자동화자동처리자동처리

다양한 전자기록을 수용할 수 있는 전체적인 인프라 구성다양한 전자기록을 수용할 수 있는 전체적인 인프라 구성기반 인프라기반 인프라

다양한 서비스를 신속 ·편리하게 제공할 수 있는 웹 서비스서비스서비스

전자기록의 재난대비 및 복구체계 구축전자기록의 재난대비 및 복구체계 구축재난대비재난대비

기술발전에 따른 다양한 환경하에서 대량 , 대용량으로 생산되는전자기록의 수집 · 보존 · 활용을 위한 발전 방향은 ?

기술발전에 따른 다양한 환경하에서 대량 , 대용량으로 생산되는전자기록의 수집 · 보존 · 활용을 위한 발전 방향은 ?

Page 54: 20100407 이규철 digital archiving

54

클라우드 컴퓨팅

자동처리 기반으로서 DFR

Semantic Web

재난복구 체계

Page 55: 20100407 이규철 digital archiving

55

클라우드 컴퓨팅

구 성

애플리케이션 , 서버 , 스토리지 , OS, 데이터 등 IT 자원을 가상화 기술로 통합하여 필요한 자원을 원하는 시점에 원하는 만큼 골라서 사용

특 징• IT 자원의 효율적 활용을

통해 경제성 극대화

• 시스템과 데이터의 다중화 를 통해 안정성 확보

• 분산파일 시스템 기반의 유연한 확장성

• 복잡한 설치과정이 필요 없는 편리성

• 다양한 인터페이스를 통해 서비스의 이용

• 보안의 중요성을 강화

라우팅

무선망

유선망

스토리지

컨텐츠

소프트웨어

컴퓨팅 파워

Page 56: 20100407 이규철 digital archiving

56

자동처리 기반으로서 DFR

구 성

다양한 디지털 포맷 및 애플리케이션에 대한 기술정보를 지능적으로 제공하고 , 자동화 처리

특 성• 파일 포맷 자동 인식

• 파일 포맷에 따른 데이터 안전성 자동 검증

• 디지털 객체 텍스트 추출

• 메타데이터 자동 추출

• Preservation Engine 에 자동 연결

포맷식별•디 지 털 객 체 가 어 떤 객 체 인 지 확인하는 식별정보 제공

포맷검증•특정 포맷을 적용 한 디지털 객체가 해 당 포 맷 에 서 정 의 된 규 칙 을 따르는지 확인하여 그 검 증 결 과 를 반환

포맷특성•디 지 털 객 체 의 중요한 메타데이터 및 관 련 정 보 인 특성 정보를 제공

텍스트추출•특 정 포 맷 을 따 르 는 디 지 털 객 체 의 내 용 을 추출하여 제공

포맷배포•특정 디지털 객체 에 대 한 접 근 을 위해 필요한 소프 트 웨 어 정 보 를 제공

소프트웨어정보•해당 소프트웨어의 정보를 나타내는 객체를 반환

•기 술 정 보 은 행 에 새 로 운 소프트웨어 정보를 추가

파일포맷정보•해 당 파 일 포맷의 정 보 를 나타내는 객체를 반환

•기술정보은행에 새로운 파일 포맷 정보를 추가

Page 57: 20100407 이규철 digital archiving

57

Semantic Web

구 조

사용자가 필요로 하는 정보를 컴퓨터가 웹 정보의 의미를 이해하고 의미에 따라 선택적으로 정보를 획득 , 통합 , 가공할 수 있는 환경을 제공할 수 있는 웹

특 성• 웹 리소스에 대해 의미

정보를 연계

• 온톨로지 기반 정보의 재 활용

• XML 언어를 이용한 데이터의 상호 통합 가능

• 의미 기반 정보 검색 서비스 기반 제공

Page 58: 20100407 이규철 digital archiving

58

DR

구 성

재난에 대비한 백업 및 분산체계 마련 , 보존 및 복구 인프라 구축 , 비상대응 조직 및 절차 수립을 통해 재난관리체계

특 성• 자연재해 , 인재 , 기술적

원인 등의 재해 발생 위험 증가에 따른 재난대비

• 예방 , 대비 , 대응 , 복구 등 재난단계별 대응체계 구축

• 메뉴얼화된 모의훈련으로 재난 시 손실 최소화

• 재해시 데이터 손실을 최소화 시키는 실시간 동기화

• 매체를 3 벌 복제 후 분산 보관

네트워크 전환

재해복구센터인프라 가동

복제회선

DB APP WAS

WEB순으로 가동

재해복구센터

1 2

4 재해복구체계

서비스제공 불가

사용자

재해발생업무서비스중단

재해발생업무서비스중단

주센터

서비스 재개 확인

주센터담당자

서비스제공

3

주센터 재해 발생 재해복구센터 복구 환경 가동

재해복구시스템 가동업무 점검 후 서비스 재개

Page 59: 20100407 이규철 digital archiving

59