17
ÚSTAV INFORMAČNÍCH STUDIÍ A KNIHOVNICTVÍ FF UK V PRAZE Jan Hutař Úvod do ochrany digitálních dat Verze 1.0 Praha Listopad 2008

Jan Hutař Úvod do ochrany digitálních dat

Embed Size (px)

Citation preview

Page 1: Jan Hutař Úvod do ochrany digitálních dat

UacuteSTAV INFORMAČNIacuteCH STUDIIacute A KNIHOVNICTVIacute FF UK V PRAZE

Jan Hutař

Uacutevod do ochrany digitaacutelniacutech dat

Verze 10

Praha

Listopad 2008

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 2

1 UacuteVOD

Vyacuteznam digitaacutelniacutech informaciacute je v dnešniacute době těžko přehleacutednutelnyacute a setkaacutevaacuteme se s niacutem všichni v různyacutech oborech Digitaacutelniacute prostřediacute a informace se již daacutevno rozšiacuteřily do oblastiacute akademickyacutech průmyslovyacutech vlaacutedniacute administrativy a samozřejmě takeacute do domaacutecnostiacute Velkeacute množstviacute informaciacute v digitaacutelniacute podobě jako např text obrazoveacute informace audio video weboveacute straacutenky počiacutetačoveacute programy databaacuteze je vytvaacuteřena sdiacutelena a využiacutevaacutena za různyacutech podmiacutenek pro nesmiacuterneacute množstviacute uacutečelů Toto rozličneacute využitiacute digitaacutelniacute technologie spočiacutevaacute na vyacutehodaacutech s niacute spojenyacutech např na možnostech vyhledaacutevaacuteniacute sdiacuteleniacute možnosti perfektniacute duplikace a takeacute na interoperabilitě

Růst vyacutepočetniacute siacutely a propustnosti siacutetiacute vede k neustaacuteleacutemu naacuterůstu využitiacute digitaacutelniacutech informaciacute S touto skutečnostiacute se pojiacute dalšiacute a to ta že mnoho organizaciacute ktereacute těchto digitaacutelniacutech informaciacute již delšiacute dobu využiacutevajiacute se nyniacute dostaacutevaacute do situace kdy musiacute chtě nechtě přistoupit k nějakyacutem bdquoarchivniacutemldquo opatřeniacutem Ochraacutenit a zachovat digitaacutelniacute data v dlouhodobeacutem horizontu je ovšem daleko těžšiacute než např v přiacutepadě papiacuteru Je to daacuteno i tiacutem že hardware a software se staacutevajiacute zastaralyacutemi během let (někdy i měsiacuteců)dagger

Nejviacutece patrneacute je to na oblasti digital preservation (ochrany digitaacutelniacutech objektůDagger) - zajištěniacute dlouhodobeacute životnosti informaciacute v digitaacutelniacute formě Možnosti a schopnosti vytvaacuteřet a využiacutevat digitaacutelniacute informace se neustaacutele rozviacutejejiacute ovšem zajistit dlouhodobou ochranu těchto informaciacute bylo a je velmi zdlouhaveacute a naacuteročneacute Tento probleacutem začal byacutet bolestivyacutem miacutestem před relativně kraacutetkou dobou kdy se ochrana digitaacutelniacutech materiaacutelů stala naleacutehavou a zaacutevaznou jako naacutesledek křehkosti uacuteložnyacutech digitaacutelniacutech meacutediiacute jakož i rapidniacuteho zastaraacutevaacuteniacute uacuteložnyacutech a zobrazovaciacutech prostřediacute Všudypřiacutetomnost otaacutezek ohledně digital preservation zatiacutem vytvaacuteřiacute obecneacute zaacuteklady pro mezioborovyacute dialog a spolupraacuteci pro lepšiacute odpovědi na všechny vyacutezvy tohoto probleacutemu

Pro zajiacutemavost uvedu jednu z mnoha definic bdquodigital preservationldquo Vznikla v roce 2007 v raacutemci pracovniacute skupiny Americkeacute asociace knihoven kteraacute publikovala tři definice kraacutetkou středně dlouhou a dlouhou Středniacute definicesect

bdquoDigital preservation spočiacutevaacute v kombinaci plaacutenů strategiiacute a opatřeniacute pro zajištěniacute přiacutestupu k reformaacutetovaneacutemu a digitaacutelně vznikleacutemu digitaacutelniacutemu obsahu bez ohledu na probleacutemy spojeneacute s nestaacutelostiacute meacutediiacute a technologickyacutemi změnami Ciacutelem digital preservation je přesneacute zobrazeniacute autentickeacuteho obsahu v jakeacutemkoliv časoveacutem horizontu od jeho vznikuldquo

Podobnou definiciacute může byacutet tato od HM Gladneyho kteryacute řiacutekaacute že digital preservation je bdquoorganizovaneacute opatřeniacute k zajištěniacute dlouhodobeacute použitelnosti digitaacutelniacutech objektů zaacutesadniacute je že digitaacutelniacute objekty nebudou nikdy ztraceny nebo poškozeny jsou důvěryhodneacute je možneacute je vždy najiacutet rozumět jim a to i přes probleacutemy zastaraacutevaacuteniacute technologiiacuteldquo

Naleacutehavost a potřeba k podniknutiacute prvniacutech kroků ochrannyacutech opatřeniacute k zajištěniacute dlouhodobeacute životnosti digitaacutelniacuteho materiaacutelu zasaacutehla všechny instituce (podniky meacutedia vlaacutedniacute uacuteřady apod) i jednotlivce (např fotografoveacute) Mnoho vyacuteznamnyacutech organizaciacute si neuvědomuje vyacuteznam archivniacute funkce v raacutemci svyacutech mandaacutetů Velmi pozitivniacute je že jakeacutekoliv uacutesiliacute přijiacutet s nějakyacutem řešeniacutem v raacutemci jedneacute komunity maacute velmi často efekt mexickeacute vlny na komunity z relativně jineacute oblastidaggerdagger

Praacutevě takovou aktivniacute komunitou a oblastiacute kde vznikaacute velkeacute množstviacute digitaacutelniacutech dat a kde se diacuteky tomu dostaacutevaacute ke slovu ochrana digitaacutelniacutech dat je oblast tzv paměťovyacutech instituciacute Knihovny muzea i archivy vytvaacuteřejiacute velkeacute množstviacute digitaacutelniacutech objektů (dokumentů) v naacutekladnyacutech digitalizačniacutech projektech a uvědomujiacute si že takto vznikleacute digitaacutelniacute objekty je nutneacute bezpečně uložit ochraňovat je a zajistit jejich dostupnost i v dlouhodobeacutem časoveacutem horizontu

LAVOIE Brian F The Open Archival Information System Reference Model s 1

dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Dagger budu v dokumentu použiacutevat daacutele anglickyacute vyacuteraz Digital preservation pro jeho jednoznačnost a jednoduchost sect American Library Asociation Definitions of Digital Preservation GLADNEY Henry M Preserving digital information Berlin Springer 2007 s 270 daggerdagger LAVOIE Brian F The Open Archival Information System Reference Model s 1

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 3

2 DIGITAacuteLNIacute REPOZITAacuteŘ

Digitaacutelniacute repozitaacuteř je v podstatě informačniacute systeacutem Maacute všechny čaacutestipodsysteacutemy ktereacute takovyacute informačniacute systeacutem vytvaacuteřejiacute

minus systeacutem vytvaacuteřeniacute informaciacute (dodavatel tvůrce)

minus systeacutem zprostředkovaacuteniacute informaciacute (repozitaacuteř samotnyacute)

minus a systeacutem využiacutevaacuteniacute informaciacute (uživatel jinyacute repozitaacuteř instituce samotnaacute)

Na digitaacutelniacute repozitaacuteř se lze takeacute diacutevat jako na informačniacute pramen kteryacutem bezpochyby takeacute je Dokumenty v něm jsou elektronickeacutedigitaacutelniacute a v hmotneacute podobě neexistujiacute dajiacute se přenaacutešet po siacuteti nebo pokud se uložiacute na nějakeacute paměťoveacute meacutedium a dajiacute se zobrazovat což je asi jedinaacute forma zpřiacutestupněniacute uživateli

21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY

Obecně řečeno digitaacutelniacute repozitaacuteř maacute za ciacutel sbiacuterat uchovaacutevat (kraacutetkodobě nebo i dlouhodobě) a zpřiacutestupňovat informace ktereacute jsou do něj uklaacutedaacuteny ať již automaticky nebo ručně S obecnou definiciacute digitaacutelniacuteho repozitaacuteře to neniacute tak jednoznačneacute repozitaacuteřů existuje několik druhů ktereacute se lišiacute nejen svou politikou (strategiiacute) ale hlavniacutem důvodem odlišnosti je že zaacutevisiacute na potřebaacutech organizace kteraacute je provozuje Takovou organizaciacute může byacutet např univerzita knihovna archiacutev vyacutezkumnyacute uacutestav apod

Pro ilustraci ciacutelem určiteacuteho repozitaacuteře může byacutet uchovaacutevat informace a poskytovat je ve srozumitelneacute podobě uživatelům zatiacutemco ciacutelem jineacuteho repozitaacuteře je takeacute uchovaacutevat informace ke kteryacutem ale neposkytuje vůbec žaacutednyacute přiacutestup (někdy je označovaacuten jako bdquodark archiveldquo) Lze tedy řiacuteci že určujiacuteciacute společnou vlastnostiacute jakeacutehokoliv repozitaacuteře je informace uložit tedy uchovat což je jeho nejpodstatnějšiacute uacutekol

Jako takovaacute obecnaacute definice by se tedy dala použiacutet např tato ldquomiacutesto na ktereacute lze uložit různeacute digitaacutelniacute materiaacutely a ktereacute maacute přidanyacute smysl v tom co uklaacutedaacute a k jakeacutemu uacutečelu je provozovaacutenordquo

Je velmi důležiteacute si uvědomit že digitaacutelniacute repozitaacuteř neniacute jen několik kusů hardwaru kteryacute spolu funguje podle nějakeacuteho zadaacuteniacute ale že nediacutelnou součaacutestiacute digitaacutelniacuteho repozitaacuteře je i organizace kteraacute ho spravuje se všemi svyacutemi slabinami a silnyacutemi straacutenkami Od teacuteto organizace se odviacutejiacute to jak repozitaacuteř funguje v jakyacutech podmiacutenkaacutech apod Repozitaacuteř je tak spolehlivyacute jak silnaacute a spolehlivaacute je organizace kteraacute repozitaacuteř pro sveacute uacutečely provozuje

Repozitaacuteř může miacutet několik naacutesledujiacuteciacutech charakteristik

minus v repozitaacuteři je uložen nějakyacute obsah ndash může byacutet uložen buď autorem toho obsahu nebo vlastniacutekem nebo v jejich jmeacuteně

minus architektura repozitaacuteře zahrnuje spraacutevu jak obsahu tak i metadat

minus repozitaacuteř poskytuje alespoň zaacutekladniacute služby (uložit vyhledat poskytovat dokumenty)

minus repozitaacuteř musiacute byacutet udržitelnyacute a důvěryhodnyacute ve smyslu že je velmi dobře podporovaacuten a spravovaacuten (viz daacutele v textu)

22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM

Uacutesiliacute vyvinout archivniacute standardy pro dlouhodobeacute uklaacutedaacuteniacute dat vzniklo na zaacutekladě potřeby vyacutevoje datoveacuteho standardu pro podporu vesmiacuterneacuteho vyacutezkumu a uloženiacute vědeckyacutech dat Bylo zadaacuteno jako potřeba International Organization for Standardization (ISO) konkreacutetněji Consultative Committee for Space Data Systems (CCSDS) což je orgaacuten pro mezinaacuterodniacute spolupraacuteci vesmiacuternyacutech agentur Na začaacutetku teacuteto snahy navrhlo CCSDS referenčniacute model kteryacute měl ukotvit terminologii a koncepty pro popis a porovnaacuteniacute datovyacutech modelů a archivniacutech architektur popsat podstatneacute entity a

CARPENTER Leona Repositories in Context UKOLN 2005

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 4

vztahy mezi nimi v archivniacutem prostřediacute vysvětlit kliacutečoveacute funkce a informačniacute komponenty archivniacuteho systeacutemu a nakonec měl posloužit jako raacutemec pro dalšiacute aktivitu Vše se povedlo včetně podpory dalšiacutech aktivit

Praacutece CCSDS vyuacutestila v květnu 1999 ve vydaacuteniacute referenčniacuteho modelu OAIS Referenčniacute model je koncepčniacute raacutemec pro jakyacutekoliv archivniacute systeacutem věnovanyacute probleacutemu ochrany a spraacutevy přiacutestupu k digitaacutelniacutem informaciacutem v dlouhodobeacutem horizontu Popisuje prostřediacute ve ktereacutem digitaacutelniacute archiv (repozitaacuteř) siacutedliacute jeho funkčniacute komponenty a informačniacute infrastrukturu podporujiacuteciacute všechny procesy archivu Referenčniacute model podstoupil review jako doporučeniacute pro normu ISO ale hlavně rozšiacuteřil se daleko mimo komunitu vesmiacuternyacutech vyacutezkumů do knihoven a ostatniacutech paměťovyacutech vlaacutedniacutech instituciacute i do soukromeacuteho sektoru Upravenaacute verze modelu byla publikovaacutena v r 2001

Referenčniacute model OAIS se ukaacutezal jako velmi životaschopnyacute a je dnes široce implementovaacuten a využiacutevaacuten Je ideaacutelniacute svou obecnostiacute a tiacutem tedy i možnostiacute implementace Celyacute raacutemec v podstatě popisuje entity a procesy ktereacute by měl repozitaacuteř zahrnovat a dělat s tiacutem že určiteacute čaacutesti tohoto raacutemce mohou ve skutečneacutem repozitaacuteři chybět

Je ovšem nutneacute si uvědomit že referenčniacute model OAIS představuje obecnyacute (high level) popis typů informaciacute vytvaacuteřenyacutech a spravovanyacutech funkčniacutemi komponenty celeacuteho archivniacuteho systeacutemu a nezabyacutevaacute se konkreacutetniacutemi typy digitaacutelniacutech objektů ktereacute se spravujiacute v archivu ani specifikaciacute technologiedagger použiteacute v archivu aby se dosaacutehlo ciacutele tj ochrany a uacutedržby přiacutestupu k digitaacutelniacutem objektům v dlouhodobeacutem horizontu Model jako takovyacute je použitelnyacute pro všechny datoveacute archivy a ty organizace naklaacutedajiacuteciacute s informacemi ktereacute mohou potřebovat dlouhodobou ochranu

Referenčniacute model odraacutežiacute zaměřeniacute na digitaacutelniacute informace ať již na primaacuterniacute podobu archivovaneacute informace a takeacute na informace podpůrneacute pro digitaacutelniacute nebo fyzickeacute archivovaneacute materiaacutely Nicmeacuteně model lze aplikovat in na ne-digitaacutelniacute informace (např fyzickeacute předměty) ovšem ochrana a architektura takovyacutech informaciacute neniacute rozebraacutena do detailu Referenčniacute model mjDagger

minus poskytuje raacutemec pro pochopeniacute a zvyacutešeniacute povědomiacute o archivniacutech konceptech potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute a přiacutestup k nim

minus poskytuje koncept potřebnyacute pro nearchivniacute instituce k tomu aby byly užitečnyacutemi uacutečastniacuteky v procesech ochrany

minus poskytuje raacutemec včetně terminologie a konceptů pro popis a porovnaacuteniacute architektur a procesů již existujiacuteciacutech i budouciacutech archivů

minus poskytuje raacutemec pro popis a porovnaacuteniacute různyacutech strategiiacute a technik dlouhodobeacute ochrany

minus poskytuje zaacuteklad pro porovnaacuteniacute datovyacutech modelů digitaacutelniacutech informaciacute ochraňovanyacutech v archivech a takeacute pro diskuzi o tom jak se mohou datoveacute modely a zaacutesadniacute informace během doby měnit

minus poskytuje zaacuteklad kteryacute může byacutet rozšiacuteřen dalšiacutem uacutesiliacutem tak aby pokryl dlouhodobou ochranu informaciacute ktereacute nejsou v digitaacutelniacute formě (např fyzickaacute meacutedia a fyzickeacute vzorky)

minus daacute zaacuteklad rozpoznaacuteniacute a vytvaacuteřeniacute s OAIS souvisejiacuteciacutech standardům

221 Referenčniacute model OAIS a OAIS archiv (repozitaacuteř)

Referenčniacute model se zabyacutevaacute celou škaacutelou ochrannyacutech funkciacute archivniacutech informaciacute včetně sběru (ingest) archivniacuteho uloženiacute data managementu přiacutestupu a rozšiřovaacuteniacute informaciacute Zabyacutevaacute se rovněž migraciacute digitaacutelniacutech informaciacute na novaacute meacutedia a formy data modelem použityacutem na reprezentaci informaciacute roliacute softwaru v ochraně informaciacute a vyacuteměnou digitaacutelniacutech informaciacute mezi archivy Určuje zaacuteroveň jak interniacute tak externiacute pracovniacute prostřediacute archivniacutech funkciacute a určuje takeacute mnoho obecnyacutech služeb těchto prostřediacute Poskytuje takeacute různeacute přiacuteklady a best practice doporučeniacute Definuje takeacute minimaacutelniacute sadu odpovědnostiacute pro archivrepozitaacuteř aby mohl byacutet nazyacutevaacuten OAIS archivem

Preservation Metadata and the OAIS Information Model s 5

dagger tj neniacute to naacutevod na implementaci určityacutech technologiiacute

Dagger CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 5

OAIS je archiv sestaacutevajiacuteciacute z organizace lidiacute a systeacutemů kteřiacute přijali odpovědnost za ochranu informaciacute a jejich zpřiacutestupněniacute určiteacute komunitě To představuje určiteacute odpovědnosti definovaneacute v raacutemci OAIS a ktereacute dovolujiacute takovyacute OAIS archiv odlišovat od ostatniacutech systeacutemů popisovanyacutech slovem bdquoarchivldquo

Hlavniacute koncept referenčniacuteho modelu vychaacuteziacute praacutevě ze zkratky OAIS Vyacuteraz open odkazuje na skutečnost že referenčniacute model byl vytvořen a volně publikovaacuten na veřejnyacutech foacuterech na kteryacutech mohl kdokoliv zainteresovanyacute participovat Pozor - slovo nenaznačuje že přiacutestup do archivu je neomezenyacute Archival information system je bdquoorganizace lidiacute a systeacutemů (hardware software) kteřiacute vzali za svou odpovědnost ochraacutenit informace a zpřiacutestupnit je pro určitou komunituldquo

Tato definice zdůrazňuje dvě primaacuterniacute funkce archivniacutech repozitaacuteřů za prveacute ochraacutenit informaci tj zajistit jejiacute dlouhodobou odolnost za druheacute poskytnout přiacutestup k archivovaneacute informaci v zaacutevislosti na potřebaacutech uživatelů nebo komunity Tato definice je podpořena vyacutečtem naacuteroků ktereacute musiacute archiv OAIS typu splňovat OAIS musiacute obzvlaacuteště

minus vyjednaacutevat a ziacuteskaacutevat informace od producentů informaciacute

minus zajistit dostatečnou kontrolu informaciacute aby se splnily podmiacutenky dlouhodobeacute ochrany

minus vymezit hlediska využitiacute uživatelskou komunitou

minus zajistit aby byly chraacuteněneacute informace nezaacutevisle srozumitelneacute uživatelům v tom smyslu že je možneacute informaci rozumět a vniacutemat bez využitiacute asistence producenta teacuteto informace

minus dodržovat strategii a procedury a tiacutem zajistit to že informace je ochraacuteněna proti všem nepředviacutedatelnostem je možneacute rozšiřovat autentickeacute kopie informace v originaacutelniacute formě nebo ve formě kteraacute na tu původniacute odkazuje

minus zpřiacutestupnit chraacuteněneacute informace uživatelskeacute komunitě

Spravovaneacute informace jsou považovaacuteny za hodneacute k dlouhodobeacutemu uchovaacuteniacute jakkoliv samo OAIS neniacute permanentniacute Termiacuten bdquodlouhodobyacuteldquo označuje časovyacute uacutesek dost dlouhyacute na to abychom uvažovali o jeho dopadu na změny technologiiacute podpory formaacutetů novyacutech i staryacutech novyacutech meacutediiacute a takeacute o změnaacutech ciacuteloveacute komunity bdquoDlouhodobostldquo se může nepředviacutedatelně prodlužovat

222 OAIS ndash informačniacute baliacutečky ndash Information Package (IP)

Repozitaacuteř odpoviacutedajiacuteciacute OAIS pracuje s několika typy tzv informačniacutech baliacutečků ktereacute model OAIS definuje Ty mohou ideaacutelně obsahovat informace o sveacutem obsahu a samozřejmě k nim informace podpůrneacute Jsou to SIP AIP a DIP ndash podrobněji viz niacuteže v textu teacuteto čaacutesti

Informace o obsahu

minus je sama o sobě srozumitelnaacute určiteacute komunitě tj informace je v podobě souboru

minus může byacutet i fyzickyacutem objektem

minus potřebuje Reprezentaci informace aby dala smysl sledu bitů v souboru

Podpůrneacute informace tj to

minus jak vlastně vznikla Informace o obsahu

minus jak souvisiacute s ostatniacutemi informacemi

minus jak je zajištěna jejiacute integrita

minus takteacutež maacute tzv Reprezentaci informace (viz kapitola 23)

LAVOIE Brian F The Open Archival Information System Reference Model s 3

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 6

Submission Information Package - SIP

minus je předmětem vyjednaacutevaacuteniacute mezi producentem (tvůrcem informaciacute) a OAISrepozitaacuteřem

minus je zasiacutelaacuten producentem (dodavatelem) do OAISrepozitaacuteře

Archival Information Package - AIP

minus baliacuteček informaciacute použiacutevanyacute pro vlastniacute archivaci digitaacutelniacutech objektů

minus obsahuje kompletniacute sadu Popisneacute ochranneacute informace (Preservation Description Information - PDI) pro obsahoveacute informace

Dissemination Information Package - DIP

minus obsahuje čaacutest nebo všechny čaacutesti jednoho nebo viacutece AIP

minus OAISrepozitaacuteř je rozšiřuje uživatelům z konkreacutetniacute komunity (tj je to vlastně to co se dostane z repozitaacuteře uživatelům)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 7

223 Shrnutiacute aneb co je vlastně referenčniacute model

Raacutemec

minus pro pochopeniacute podstatnyacutech vztahů mezi entitami určiteacuteho prostřediacute a

minus pro vyacutevoj důslednyacutech standardů nebo specifikaciacute toto prostřediacute podporujiacuteciacutech

minus pro pochopeniacute a aplikaci konceptu potřebneacuteho pro dlouhodobou ochranu digitaacutelniacutech informaciacute

minus pro pochopeniacute a implementaci konceptů potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute

Referenčniacute model

minus je založen na maleacutem počtu jednotnyacutech konceptů

minus je abstrakciacute kliacutečovyacutech konceptů jejich vztahů a jejich prostřediacute jak mezi sebou tak vůči okolniacutemu prostřediacute

minus může byacutet využit jako zaacuteklad pro vzdělaacutevaacuteniacute a vysvětlovaacuteniacute standardů pro laiky (ne-specialisty)

Zajiacutemavostiacute je že raacutemec do jisteacute miacutery odpoviacutedaacute koloběhu kteryacute se provaacutediacute s klasickyacutemi dokumenty v knihovnaacutech nebo archivech Je tady jistaacute analogie mezi uloženiacutem a zpřiacutestupněniacutem klasickyacutech dokumentů a dokumentů digitaacutelniacutech Digitaacutelniacute je ovšem složitějšiacute a mnohem zranitelnějšiacutedagger

23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger

Informace je vždy vyjaacutedřena (tj reprezentovaacutena) pomociacute nějakeacuteho typu dat Data interpretovanaacute pomociacute sveacute bdquoReprezentace informaceldquo daacutevajiacute vzniknout informaciacutem (informačniacutemu objektu) Ochrana bdquoInformačniacuteho objektuldquo vyžaduje jasnou identifikaci a pochopeniacute datoveacuteho objektu a s niacutem spojeneacute bdquoReprezentace informaceldquo

Referenčniacute model OAIS je znaacutezorněn na obraacutezku niacuteže V kontextu OAIS může informace existovat ve dvou formaacutech ndash buď jako fyzickyacute objekt (tj např papiacuterovyacute dokument vzorek půdy) nebo jako digitaacutelniacute objekt (např PDF soubor TIFF soubor) Tyto dva druhy ndash fyzickyacute a digitaacutelniacute ndash jsou obecně znaacutemy jako tzv Datoveacute objekty Takovyacute datovyacute objekt může nabyacutevat různyacutech forem ať je to materiaacutel kteryacute je ciacutelem ochrany nebo metadata asociovanaacute s archivniacutem digitaacutelniacutem objektemsect

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

dagger STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online]

Dagger SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

sect Preservation Metadata and the OAIS Information Model s 5

Datovyacute objekt Reprezentace informace

Informačniacute objekt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 2: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 2

1 UacuteVOD

Vyacuteznam digitaacutelniacutech informaciacute je v dnešniacute době těžko přehleacutednutelnyacute a setkaacutevaacuteme se s niacutem všichni v různyacutech oborech Digitaacutelniacute prostřediacute a informace se již daacutevno rozšiacuteřily do oblastiacute akademickyacutech průmyslovyacutech vlaacutedniacute administrativy a samozřejmě takeacute do domaacutecnostiacute Velkeacute množstviacute informaciacute v digitaacutelniacute podobě jako např text obrazoveacute informace audio video weboveacute straacutenky počiacutetačoveacute programy databaacuteze je vytvaacuteřena sdiacutelena a využiacutevaacutena za různyacutech podmiacutenek pro nesmiacuterneacute množstviacute uacutečelů Toto rozličneacute využitiacute digitaacutelniacute technologie spočiacutevaacute na vyacutehodaacutech s niacute spojenyacutech např na možnostech vyhledaacutevaacuteniacute sdiacuteleniacute možnosti perfektniacute duplikace a takeacute na interoperabilitě

Růst vyacutepočetniacute siacutely a propustnosti siacutetiacute vede k neustaacuteleacutemu naacuterůstu využitiacute digitaacutelniacutech informaciacute S touto skutečnostiacute se pojiacute dalšiacute a to ta že mnoho organizaciacute ktereacute těchto digitaacutelniacutech informaciacute již delšiacute dobu využiacutevajiacute se nyniacute dostaacutevaacute do situace kdy musiacute chtě nechtě přistoupit k nějakyacutem bdquoarchivniacutemldquo opatřeniacutem Ochraacutenit a zachovat digitaacutelniacute data v dlouhodobeacutem horizontu je ovšem daleko těžšiacute než např v přiacutepadě papiacuteru Je to daacuteno i tiacutem že hardware a software se staacutevajiacute zastaralyacutemi během let (někdy i měsiacuteců)dagger

Nejviacutece patrneacute je to na oblasti digital preservation (ochrany digitaacutelniacutech objektůDagger) - zajištěniacute dlouhodobeacute životnosti informaciacute v digitaacutelniacute formě Možnosti a schopnosti vytvaacuteřet a využiacutevat digitaacutelniacute informace se neustaacutele rozviacutejejiacute ovšem zajistit dlouhodobou ochranu těchto informaciacute bylo a je velmi zdlouhaveacute a naacuteročneacute Tento probleacutem začal byacutet bolestivyacutem miacutestem před relativně kraacutetkou dobou kdy se ochrana digitaacutelniacutech materiaacutelů stala naleacutehavou a zaacutevaznou jako naacutesledek křehkosti uacuteložnyacutech digitaacutelniacutech meacutediiacute jakož i rapidniacuteho zastaraacutevaacuteniacute uacuteložnyacutech a zobrazovaciacutech prostřediacute Všudypřiacutetomnost otaacutezek ohledně digital preservation zatiacutem vytvaacuteřiacute obecneacute zaacuteklady pro mezioborovyacute dialog a spolupraacuteci pro lepšiacute odpovědi na všechny vyacutezvy tohoto probleacutemu

Pro zajiacutemavost uvedu jednu z mnoha definic bdquodigital preservationldquo Vznikla v roce 2007 v raacutemci pracovniacute skupiny Americkeacute asociace knihoven kteraacute publikovala tři definice kraacutetkou středně dlouhou a dlouhou Středniacute definicesect

bdquoDigital preservation spočiacutevaacute v kombinaci plaacutenů strategiiacute a opatřeniacute pro zajištěniacute přiacutestupu k reformaacutetovaneacutemu a digitaacutelně vznikleacutemu digitaacutelniacutemu obsahu bez ohledu na probleacutemy spojeneacute s nestaacutelostiacute meacutediiacute a technologickyacutemi změnami Ciacutelem digital preservation je přesneacute zobrazeniacute autentickeacuteho obsahu v jakeacutemkoliv časoveacutem horizontu od jeho vznikuldquo

Podobnou definiciacute může byacutet tato od HM Gladneyho kteryacute řiacutekaacute že digital preservation je bdquoorganizovaneacute opatřeniacute k zajištěniacute dlouhodobeacute použitelnosti digitaacutelniacutech objektů zaacutesadniacute je že digitaacutelniacute objekty nebudou nikdy ztraceny nebo poškozeny jsou důvěryhodneacute je možneacute je vždy najiacutet rozumět jim a to i přes probleacutemy zastaraacutevaacuteniacute technologiiacuteldquo

Naleacutehavost a potřeba k podniknutiacute prvniacutech kroků ochrannyacutech opatřeniacute k zajištěniacute dlouhodobeacute životnosti digitaacutelniacuteho materiaacutelu zasaacutehla všechny instituce (podniky meacutedia vlaacutedniacute uacuteřady apod) i jednotlivce (např fotografoveacute) Mnoho vyacuteznamnyacutech organizaciacute si neuvědomuje vyacuteznam archivniacute funkce v raacutemci svyacutech mandaacutetů Velmi pozitivniacute je že jakeacutekoliv uacutesiliacute přijiacutet s nějakyacutem řešeniacutem v raacutemci jedneacute komunity maacute velmi často efekt mexickeacute vlny na komunity z relativně jineacute oblastidaggerdagger

Praacutevě takovou aktivniacute komunitou a oblastiacute kde vznikaacute velkeacute množstviacute digitaacutelniacutech dat a kde se diacuteky tomu dostaacutevaacute ke slovu ochrana digitaacutelniacutech dat je oblast tzv paměťovyacutech instituciacute Knihovny muzea i archivy vytvaacuteřejiacute velkeacute množstviacute digitaacutelniacutech objektů (dokumentů) v naacutekladnyacutech digitalizačniacutech projektech a uvědomujiacute si že takto vznikleacute digitaacutelniacute objekty je nutneacute bezpečně uložit ochraňovat je a zajistit jejich dostupnost i v dlouhodobeacutem časoveacutem horizontu

LAVOIE Brian F The Open Archival Information System Reference Model s 1

dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Dagger budu v dokumentu použiacutevat daacutele anglickyacute vyacuteraz Digital preservation pro jeho jednoznačnost a jednoduchost sect American Library Asociation Definitions of Digital Preservation GLADNEY Henry M Preserving digital information Berlin Springer 2007 s 270 daggerdagger LAVOIE Brian F The Open Archival Information System Reference Model s 1

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 3

2 DIGITAacuteLNIacute REPOZITAacuteŘ

Digitaacutelniacute repozitaacuteř je v podstatě informačniacute systeacutem Maacute všechny čaacutestipodsysteacutemy ktereacute takovyacute informačniacute systeacutem vytvaacuteřejiacute

minus systeacutem vytvaacuteřeniacute informaciacute (dodavatel tvůrce)

minus systeacutem zprostředkovaacuteniacute informaciacute (repozitaacuteř samotnyacute)

minus a systeacutem využiacutevaacuteniacute informaciacute (uživatel jinyacute repozitaacuteř instituce samotnaacute)

Na digitaacutelniacute repozitaacuteř se lze takeacute diacutevat jako na informačniacute pramen kteryacutem bezpochyby takeacute je Dokumenty v něm jsou elektronickeacutedigitaacutelniacute a v hmotneacute podobě neexistujiacute dajiacute se přenaacutešet po siacuteti nebo pokud se uložiacute na nějakeacute paměťoveacute meacutedium a dajiacute se zobrazovat což je asi jedinaacute forma zpřiacutestupněniacute uživateli

21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY

Obecně řečeno digitaacutelniacute repozitaacuteř maacute za ciacutel sbiacuterat uchovaacutevat (kraacutetkodobě nebo i dlouhodobě) a zpřiacutestupňovat informace ktereacute jsou do něj uklaacutedaacuteny ať již automaticky nebo ručně S obecnou definiciacute digitaacutelniacuteho repozitaacuteře to neniacute tak jednoznačneacute repozitaacuteřů existuje několik druhů ktereacute se lišiacute nejen svou politikou (strategiiacute) ale hlavniacutem důvodem odlišnosti je že zaacutevisiacute na potřebaacutech organizace kteraacute je provozuje Takovou organizaciacute může byacutet např univerzita knihovna archiacutev vyacutezkumnyacute uacutestav apod

Pro ilustraci ciacutelem určiteacuteho repozitaacuteře může byacutet uchovaacutevat informace a poskytovat je ve srozumitelneacute podobě uživatelům zatiacutemco ciacutelem jineacuteho repozitaacuteře je takeacute uchovaacutevat informace ke kteryacutem ale neposkytuje vůbec žaacutednyacute přiacutestup (někdy je označovaacuten jako bdquodark archiveldquo) Lze tedy řiacuteci že určujiacuteciacute společnou vlastnostiacute jakeacutehokoliv repozitaacuteře je informace uložit tedy uchovat což je jeho nejpodstatnějšiacute uacutekol

Jako takovaacute obecnaacute definice by se tedy dala použiacutet např tato ldquomiacutesto na ktereacute lze uložit různeacute digitaacutelniacute materiaacutely a ktereacute maacute přidanyacute smysl v tom co uklaacutedaacute a k jakeacutemu uacutečelu je provozovaacutenordquo

Je velmi důležiteacute si uvědomit že digitaacutelniacute repozitaacuteř neniacute jen několik kusů hardwaru kteryacute spolu funguje podle nějakeacuteho zadaacuteniacute ale že nediacutelnou součaacutestiacute digitaacutelniacuteho repozitaacuteře je i organizace kteraacute ho spravuje se všemi svyacutemi slabinami a silnyacutemi straacutenkami Od teacuteto organizace se odviacutejiacute to jak repozitaacuteř funguje v jakyacutech podmiacutenkaacutech apod Repozitaacuteř je tak spolehlivyacute jak silnaacute a spolehlivaacute je organizace kteraacute repozitaacuteř pro sveacute uacutečely provozuje

Repozitaacuteř může miacutet několik naacutesledujiacuteciacutech charakteristik

minus v repozitaacuteři je uložen nějakyacute obsah ndash může byacutet uložen buď autorem toho obsahu nebo vlastniacutekem nebo v jejich jmeacuteně

minus architektura repozitaacuteře zahrnuje spraacutevu jak obsahu tak i metadat

minus repozitaacuteř poskytuje alespoň zaacutekladniacute služby (uložit vyhledat poskytovat dokumenty)

minus repozitaacuteř musiacute byacutet udržitelnyacute a důvěryhodnyacute ve smyslu že je velmi dobře podporovaacuten a spravovaacuten (viz daacutele v textu)

22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM

Uacutesiliacute vyvinout archivniacute standardy pro dlouhodobeacute uklaacutedaacuteniacute dat vzniklo na zaacutekladě potřeby vyacutevoje datoveacuteho standardu pro podporu vesmiacuterneacuteho vyacutezkumu a uloženiacute vědeckyacutech dat Bylo zadaacuteno jako potřeba International Organization for Standardization (ISO) konkreacutetněji Consultative Committee for Space Data Systems (CCSDS) což je orgaacuten pro mezinaacuterodniacute spolupraacuteci vesmiacuternyacutech agentur Na začaacutetku teacuteto snahy navrhlo CCSDS referenčniacute model kteryacute měl ukotvit terminologii a koncepty pro popis a porovnaacuteniacute datovyacutech modelů a archivniacutech architektur popsat podstatneacute entity a

CARPENTER Leona Repositories in Context UKOLN 2005

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 4

vztahy mezi nimi v archivniacutem prostřediacute vysvětlit kliacutečoveacute funkce a informačniacute komponenty archivniacuteho systeacutemu a nakonec měl posloužit jako raacutemec pro dalšiacute aktivitu Vše se povedlo včetně podpory dalšiacutech aktivit

Praacutece CCSDS vyuacutestila v květnu 1999 ve vydaacuteniacute referenčniacuteho modelu OAIS Referenčniacute model je koncepčniacute raacutemec pro jakyacutekoliv archivniacute systeacutem věnovanyacute probleacutemu ochrany a spraacutevy přiacutestupu k digitaacutelniacutem informaciacutem v dlouhodobeacutem horizontu Popisuje prostřediacute ve ktereacutem digitaacutelniacute archiv (repozitaacuteř) siacutedliacute jeho funkčniacute komponenty a informačniacute infrastrukturu podporujiacuteciacute všechny procesy archivu Referenčniacute model podstoupil review jako doporučeniacute pro normu ISO ale hlavně rozšiacuteřil se daleko mimo komunitu vesmiacuternyacutech vyacutezkumů do knihoven a ostatniacutech paměťovyacutech vlaacutedniacutech instituciacute i do soukromeacuteho sektoru Upravenaacute verze modelu byla publikovaacutena v r 2001

Referenčniacute model OAIS se ukaacutezal jako velmi životaschopnyacute a je dnes široce implementovaacuten a využiacutevaacuten Je ideaacutelniacute svou obecnostiacute a tiacutem tedy i možnostiacute implementace Celyacute raacutemec v podstatě popisuje entity a procesy ktereacute by měl repozitaacuteř zahrnovat a dělat s tiacutem že určiteacute čaacutesti tohoto raacutemce mohou ve skutečneacutem repozitaacuteři chybět

Je ovšem nutneacute si uvědomit že referenčniacute model OAIS představuje obecnyacute (high level) popis typů informaciacute vytvaacuteřenyacutech a spravovanyacutech funkčniacutemi komponenty celeacuteho archivniacuteho systeacutemu a nezabyacutevaacute se konkreacutetniacutemi typy digitaacutelniacutech objektů ktereacute se spravujiacute v archivu ani specifikaciacute technologiedagger použiteacute v archivu aby se dosaacutehlo ciacutele tj ochrany a uacutedržby přiacutestupu k digitaacutelniacutem objektům v dlouhodobeacutem horizontu Model jako takovyacute je použitelnyacute pro všechny datoveacute archivy a ty organizace naklaacutedajiacuteciacute s informacemi ktereacute mohou potřebovat dlouhodobou ochranu

Referenčniacute model odraacutežiacute zaměřeniacute na digitaacutelniacute informace ať již na primaacuterniacute podobu archivovaneacute informace a takeacute na informace podpůrneacute pro digitaacutelniacute nebo fyzickeacute archivovaneacute materiaacutely Nicmeacuteně model lze aplikovat in na ne-digitaacutelniacute informace (např fyzickeacute předměty) ovšem ochrana a architektura takovyacutech informaciacute neniacute rozebraacutena do detailu Referenčniacute model mjDagger

minus poskytuje raacutemec pro pochopeniacute a zvyacutešeniacute povědomiacute o archivniacutech konceptech potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute a přiacutestup k nim

minus poskytuje koncept potřebnyacute pro nearchivniacute instituce k tomu aby byly užitečnyacutemi uacutečastniacuteky v procesech ochrany

minus poskytuje raacutemec včetně terminologie a konceptů pro popis a porovnaacuteniacute architektur a procesů již existujiacuteciacutech i budouciacutech archivů

minus poskytuje raacutemec pro popis a porovnaacuteniacute různyacutech strategiiacute a technik dlouhodobeacute ochrany

minus poskytuje zaacuteklad pro porovnaacuteniacute datovyacutech modelů digitaacutelniacutech informaciacute ochraňovanyacutech v archivech a takeacute pro diskuzi o tom jak se mohou datoveacute modely a zaacutesadniacute informace během doby měnit

minus poskytuje zaacuteklad kteryacute může byacutet rozšiacuteřen dalšiacutem uacutesiliacutem tak aby pokryl dlouhodobou ochranu informaciacute ktereacute nejsou v digitaacutelniacute formě (např fyzickaacute meacutedia a fyzickeacute vzorky)

minus daacute zaacuteklad rozpoznaacuteniacute a vytvaacuteřeniacute s OAIS souvisejiacuteciacutech standardům

221 Referenčniacute model OAIS a OAIS archiv (repozitaacuteř)

Referenčniacute model se zabyacutevaacute celou škaacutelou ochrannyacutech funkciacute archivniacutech informaciacute včetně sběru (ingest) archivniacuteho uloženiacute data managementu přiacutestupu a rozšiřovaacuteniacute informaciacute Zabyacutevaacute se rovněž migraciacute digitaacutelniacutech informaciacute na novaacute meacutedia a formy data modelem použityacutem na reprezentaci informaciacute roliacute softwaru v ochraně informaciacute a vyacuteměnou digitaacutelniacutech informaciacute mezi archivy Určuje zaacuteroveň jak interniacute tak externiacute pracovniacute prostřediacute archivniacutech funkciacute a určuje takeacute mnoho obecnyacutech služeb těchto prostřediacute Poskytuje takeacute různeacute přiacuteklady a best practice doporučeniacute Definuje takeacute minimaacutelniacute sadu odpovědnostiacute pro archivrepozitaacuteř aby mohl byacutet nazyacutevaacuten OAIS archivem

Preservation Metadata and the OAIS Information Model s 5

dagger tj neniacute to naacutevod na implementaci určityacutech technologiiacute

Dagger CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 5

OAIS je archiv sestaacutevajiacuteciacute z organizace lidiacute a systeacutemů kteřiacute přijali odpovědnost za ochranu informaciacute a jejich zpřiacutestupněniacute určiteacute komunitě To představuje určiteacute odpovědnosti definovaneacute v raacutemci OAIS a ktereacute dovolujiacute takovyacute OAIS archiv odlišovat od ostatniacutech systeacutemů popisovanyacutech slovem bdquoarchivldquo

Hlavniacute koncept referenčniacuteho modelu vychaacuteziacute praacutevě ze zkratky OAIS Vyacuteraz open odkazuje na skutečnost že referenčniacute model byl vytvořen a volně publikovaacuten na veřejnyacutech foacuterech na kteryacutech mohl kdokoliv zainteresovanyacute participovat Pozor - slovo nenaznačuje že přiacutestup do archivu je neomezenyacute Archival information system je bdquoorganizace lidiacute a systeacutemů (hardware software) kteřiacute vzali za svou odpovědnost ochraacutenit informace a zpřiacutestupnit je pro určitou komunituldquo

Tato definice zdůrazňuje dvě primaacuterniacute funkce archivniacutech repozitaacuteřů za prveacute ochraacutenit informaci tj zajistit jejiacute dlouhodobou odolnost za druheacute poskytnout přiacutestup k archivovaneacute informaci v zaacutevislosti na potřebaacutech uživatelů nebo komunity Tato definice je podpořena vyacutečtem naacuteroků ktereacute musiacute archiv OAIS typu splňovat OAIS musiacute obzvlaacuteště

minus vyjednaacutevat a ziacuteskaacutevat informace od producentů informaciacute

minus zajistit dostatečnou kontrolu informaciacute aby se splnily podmiacutenky dlouhodobeacute ochrany

minus vymezit hlediska využitiacute uživatelskou komunitou

minus zajistit aby byly chraacuteněneacute informace nezaacutevisle srozumitelneacute uživatelům v tom smyslu že je možneacute informaci rozumět a vniacutemat bez využitiacute asistence producenta teacuteto informace

minus dodržovat strategii a procedury a tiacutem zajistit to že informace je ochraacuteněna proti všem nepředviacutedatelnostem je možneacute rozšiřovat autentickeacute kopie informace v originaacutelniacute formě nebo ve formě kteraacute na tu původniacute odkazuje

minus zpřiacutestupnit chraacuteněneacute informace uživatelskeacute komunitě

Spravovaneacute informace jsou považovaacuteny za hodneacute k dlouhodobeacutemu uchovaacuteniacute jakkoliv samo OAIS neniacute permanentniacute Termiacuten bdquodlouhodobyacuteldquo označuje časovyacute uacutesek dost dlouhyacute na to abychom uvažovali o jeho dopadu na změny technologiiacute podpory formaacutetů novyacutech i staryacutech novyacutech meacutediiacute a takeacute o změnaacutech ciacuteloveacute komunity bdquoDlouhodobostldquo se může nepředviacutedatelně prodlužovat

222 OAIS ndash informačniacute baliacutečky ndash Information Package (IP)

Repozitaacuteř odpoviacutedajiacuteciacute OAIS pracuje s několika typy tzv informačniacutech baliacutečků ktereacute model OAIS definuje Ty mohou ideaacutelně obsahovat informace o sveacutem obsahu a samozřejmě k nim informace podpůrneacute Jsou to SIP AIP a DIP ndash podrobněji viz niacuteže v textu teacuteto čaacutesti

Informace o obsahu

minus je sama o sobě srozumitelnaacute určiteacute komunitě tj informace je v podobě souboru

minus může byacutet i fyzickyacutem objektem

minus potřebuje Reprezentaci informace aby dala smysl sledu bitů v souboru

Podpůrneacute informace tj to

minus jak vlastně vznikla Informace o obsahu

minus jak souvisiacute s ostatniacutemi informacemi

minus jak je zajištěna jejiacute integrita

minus takteacutež maacute tzv Reprezentaci informace (viz kapitola 23)

LAVOIE Brian F The Open Archival Information System Reference Model s 3

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 6

Submission Information Package - SIP

minus je předmětem vyjednaacutevaacuteniacute mezi producentem (tvůrcem informaciacute) a OAISrepozitaacuteřem

minus je zasiacutelaacuten producentem (dodavatelem) do OAISrepozitaacuteře

Archival Information Package - AIP

minus baliacuteček informaciacute použiacutevanyacute pro vlastniacute archivaci digitaacutelniacutech objektů

minus obsahuje kompletniacute sadu Popisneacute ochranneacute informace (Preservation Description Information - PDI) pro obsahoveacute informace

Dissemination Information Package - DIP

minus obsahuje čaacutest nebo všechny čaacutesti jednoho nebo viacutece AIP

minus OAISrepozitaacuteř je rozšiřuje uživatelům z konkreacutetniacute komunity (tj je to vlastně to co se dostane z repozitaacuteře uživatelům)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 7

223 Shrnutiacute aneb co je vlastně referenčniacute model

Raacutemec

minus pro pochopeniacute podstatnyacutech vztahů mezi entitami určiteacuteho prostřediacute a

minus pro vyacutevoj důslednyacutech standardů nebo specifikaciacute toto prostřediacute podporujiacuteciacutech

minus pro pochopeniacute a aplikaci konceptu potřebneacuteho pro dlouhodobou ochranu digitaacutelniacutech informaciacute

minus pro pochopeniacute a implementaci konceptů potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute

Referenčniacute model

minus je založen na maleacutem počtu jednotnyacutech konceptů

minus je abstrakciacute kliacutečovyacutech konceptů jejich vztahů a jejich prostřediacute jak mezi sebou tak vůči okolniacutemu prostřediacute

minus může byacutet využit jako zaacuteklad pro vzdělaacutevaacuteniacute a vysvětlovaacuteniacute standardů pro laiky (ne-specialisty)

Zajiacutemavostiacute je že raacutemec do jisteacute miacutery odpoviacutedaacute koloběhu kteryacute se provaacutediacute s klasickyacutemi dokumenty v knihovnaacutech nebo archivech Je tady jistaacute analogie mezi uloženiacutem a zpřiacutestupněniacutem klasickyacutech dokumentů a dokumentů digitaacutelniacutech Digitaacutelniacute je ovšem složitějšiacute a mnohem zranitelnějšiacutedagger

23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger

Informace je vždy vyjaacutedřena (tj reprezentovaacutena) pomociacute nějakeacuteho typu dat Data interpretovanaacute pomociacute sveacute bdquoReprezentace informaceldquo daacutevajiacute vzniknout informaciacutem (informačniacutemu objektu) Ochrana bdquoInformačniacuteho objektuldquo vyžaduje jasnou identifikaci a pochopeniacute datoveacuteho objektu a s niacutem spojeneacute bdquoReprezentace informaceldquo

Referenčniacute model OAIS je znaacutezorněn na obraacutezku niacuteže V kontextu OAIS může informace existovat ve dvou formaacutech ndash buď jako fyzickyacute objekt (tj např papiacuterovyacute dokument vzorek půdy) nebo jako digitaacutelniacute objekt (např PDF soubor TIFF soubor) Tyto dva druhy ndash fyzickyacute a digitaacutelniacute ndash jsou obecně znaacutemy jako tzv Datoveacute objekty Takovyacute datovyacute objekt může nabyacutevat různyacutech forem ať je to materiaacutel kteryacute je ciacutelem ochrany nebo metadata asociovanaacute s archivniacutem digitaacutelniacutem objektemsect

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

dagger STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online]

Dagger SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

sect Preservation Metadata and the OAIS Information Model s 5

Datovyacute objekt Reprezentace informace

Informačniacute objekt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 3: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 3

2 DIGITAacuteLNIacute REPOZITAacuteŘ

Digitaacutelniacute repozitaacuteř je v podstatě informačniacute systeacutem Maacute všechny čaacutestipodsysteacutemy ktereacute takovyacute informačniacute systeacutem vytvaacuteřejiacute

minus systeacutem vytvaacuteřeniacute informaciacute (dodavatel tvůrce)

minus systeacutem zprostředkovaacuteniacute informaciacute (repozitaacuteř samotnyacute)

minus a systeacutem využiacutevaacuteniacute informaciacute (uživatel jinyacute repozitaacuteř instituce samotnaacute)

Na digitaacutelniacute repozitaacuteř se lze takeacute diacutevat jako na informačniacute pramen kteryacutem bezpochyby takeacute je Dokumenty v něm jsou elektronickeacutedigitaacutelniacute a v hmotneacute podobě neexistujiacute dajiacute se přenaacutešet po siacuteti nebo pokud se uložiacute na nějakeacute paměťoveacute meacutedium a dajiacute se zobrazovat což je asi jedinaacute forma zpřiacutestupněniacute uživateli

21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY

Obecně řečeno digitaacutelniacute repozitaacuteř maacute za ciacutel sbiacuterat uchovaacutevat (kraacutetkodobě nebo i dlouhodobě) a zpřiacutestupňovat informace ktereacute jsou do něj uklaacutedaacuteny ať již automaticky nebo ručně S obecnou definiciacute digitaacutelniacuteho repozitaacuteře to neniacute tak jednoznačneacute repozitaacuteřů existuje několik druhů ktereacute se lišiacute nejen svou politikou (strategiiacute) ale hlavniacutem důvodem odlišnosti je že zaacutevisiacute na potřebaacutech organizace kteraacute je provozuje Takovou organizaciacute může byacutet např univerzita knihovna archiacutev vyacutezkumnyacute uacutestav apod

Pro ilustraci ciacutelem určiteacuteho repozitaacuteře může byacutet uchovaacutevat informace a poskytovat je ve srozumitelneacute podobě uživatelům zatiacutemco ciacutelem jineacuteho repozitaacuteře je takeacute uchovaacutevat informace ke kteryacutem ale neposkytuje vůbec žaacutednyacute přiacutestup (někdy je označovaacuten jako bdquodark archiveldquo) Lze tedy řiacuteci že určujiacuteciacute společnou vlastnostiacute jakeacutehokoliv repozitaacuteře je informace uložit tedy uchovat což je jeho nejpodstatnějšiacute uacutekol

Jako takovaacute obecnaacute definice by se tedy dala použiacutet např tato ldquomiacutesto na ktereacute lze uložit různeacute digitaacutelniacute materiaacutely a ktereacute maacute přidanyacute smysl v tom co uklaacutedaacute a k jakeacutemu uacutečelu je provozovaacutenordquo

Je velmi důležiteacute si uvědomit že digitaacutelniacute repozitaacuteř neniacute jen několik kusů hardwaru kteryacute spolu funguje podle nějakeacuteho zadaacuteniacute ale že nediacutelnou součaacutestiacute digitaacutelniacuteho repozitaacuteře je i organizace kteraacute ho spravuje se všemi svyacutemi slabinami a silnyacutemi straacutenkami Od teacuteto organizace se odviacutejiacute to jak repozitaacuteř funguje v jakyacutech podmiacutenkaacutech apod Repozitaacuteř je tak spolehlivyacute jak silnaacute a spolehlivaacute je organizace kteraacute repozitaacuteř pro sveacute uacutečely provozuje

Repozitaacuteř může miacutet několik naacutesledujiacuteciacutech charakteristik

minus v repozitaacuteři je uložen nějakyacute obsah ndash může byacutet uložen buď autorem toho obsahu nebo vlastniacutekem nebo v jejich jmeacuteně

minus architektura repozitaacuteře zahrnuje spraacutevu jak obsahu tak i metadat

minus repozitaacuteř poskytuje alespoň zaacutekladniacute služby (uložit vyhledat poskytovat dokumenty)

minus repozitaacuteř musiacute byacutet udržitelnyacute a důvěryhodnyacute ve smyslu že je velmi dobře podporovaacuten a spravovaacuten (viz daacutele v textu)

22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM

Uacutesiliacute vyvinout archivniacute standardy pro dlouhodobeacute uklaacutedaacuteniacute dat vzniklo na zaacutekladě potřeby vyacutevoje datoveacuteho standardu pro podporu vesmiacuterneacuteho vyacutezkumu a uloženiacute vědeckyacutech dat Bylo zadaacuteno jako potřeba International Organization for Standardization (ISO) konkreacutetněji Consultative Committee for Space Data Systems (CCSDS) což je orgaacuten pro mezinaacuterodniacute spolupraacuteci vesmiacuternyacutech agentur Na začaacutetku teacuteto snahy navrhlo CCSDS referenčniacute model kteryacute měl ukotvit terminologii a koncepty pro popis a porovnaacuteniacute datovyacutech modelů a archivniacutech architektur popsat podstatneacute entity a

CARPENTER Leona Repositories in Context UKOLN 2005

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 4

vztahy mezi nimi v archivniacutem prostřediacute vysvětlit kliacutečoveacute funkce a informačniacute komponenty archivniacuteho systeacutemu a nakonec měl posloužit jako raacutemec pro dalšiacute aktivitu Vše se povedlo včetně podpory dalšiacutech aktivit

Praacutece CCSDS vyuacutestila v květnu 1999 ve vydaacuteniacute referenčniacuteho modelu OAIS Referenčniacute model je koncepčniacute raacutemec pro jakyacutekoliv archivniacute systeacutem věnovanyacute probleacutemu ochrany a spraacutevy přiacutestupu k digitaacutelniacutem informaciacutem v dlouhodobeacutem horizontu Popisuje prostřediacute ve ktereacutem digitaacutelniacute archiv (repozitaacuteř) siacutedliacute jeho funkčniacute komponenty a informačniacute infrastrukturu podporujiacuteciacute všechny procesy archivu Referenčniacute model podstoupil review jako doporučeniacute pro normu ISO ale hlavně rozšiacuteřil se daleko mimo komunitu vesmiacuternyacutech vyacutezkumů do knihoven a ostatniacutech paměťovyacutech vlaacutedniacutech instituciacute i do soukromeacuteho sektoru Upravenaacute verze modelu byla publikovaacutena v r 2001

Referenčniacute model OAIS se ukaacutezal jako velmi životaschopnyacute a je dnes široce implementovaacuten a využiacutevaacuten Je ideaacutelniacute svou obecnostiacute a tiacutem tedy i možnostiacute implementace Celyacute raacutemec v podstatě popisuje entity a procesy ktereacute by měl repozitaacuteř zahrnovat a dělat s tiacutem že určiteacute čaacutesti tohoto raacutemce mohou ve skutečneacutem repozitaacuteři chybět

Je ovšem nutneacute si uvědomit že referenčniacute model OAIS představuje obecnyacute (high level) popis typů informaciacute vytvaacuteřenyacutech a spravovanyacutech funkčniacutemi komponenty celeacuteho archivniacuteho systeacutemu a nezabyacutevaacute se konkreacutetniacutemi typy digitaacutelniacutech objektů ktereacute se spravujiacute v archivu ani specifikaciacute technologiedagger použiteacute v archivu aby se dosaacutehlo ciacutele tj ochrany a uacutedržby přiacutestupu k digitaacutelniacutem objektům v dlouhodobeacutem horizontu Model jako takovyacute je použitelnyacute pro všechny datoveacute archivy a ty organizace naklaacutedajiacuteciacute s informacemi ktereacute mohou potřebovat dlouhodobou ochranu

Referenčniacute model odraacutežiacute zaměřeniacute na digitaacutelniacute informace ať již na primaacuterniacute podobu archivovaneacute informace a takeacute na informace podpůrneacute pro digitaacutelniacute nebo fyzickeacute archivovaneacute materiaacutely Nicmeacuteně model lze aplikovat in na ne-digitaacutelniacute informace (např fyzickeacute předměty) ovšem ochrana a architektura takovyacutech informaciacute neniacute rozebraacutena do detailu Referenčniacute model mjDagger

minus poskytuje raacutemec pro pochopeniacute a zvyacutešeniacute povědomiacute o archivniacutech konceptech potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute a přiacutestup k nim

minus poskytuje koncept potřebnyacute pro nearchivniacute instituce k tomu aby byly užitečnyacutemi uacutečastniacuteky v procesech ochrany

minus poskytuje raacutemec včetně terminologie a konceptů pro popis a porovnaacuteniacute architektur a procesů již existujiacuteciacutech i budouciacutech archivů

minus poskytuje raacutemec pro popis a porovnaacuteniacute různyacutech strategiiacute a technik dlouhodobeacute ochrany

minus poskytuje zaacuteklad pro porovnaacuteniacute datovyacutech modelů digitaacutelniacutech informaciacute ochraňovanyacutech v archivech a takeacute pro diskuzi o tom jak se mohou datoveacute modely a zaacutesadniacute informace během doby měnit

minus poskytuje zaacuteklad kteryacute může byacutet rozšiacuteřen dalšiacutem uacutesiliacutem tak aby pokryl dlouhodobou ochranu informaciacute ktereacute nejsou v digitaacutelniacute formě (např fyzickaacute meacutedia a fyzickeacute vzorky)

minus daacute zaacuteklad rozpoznaacuteniacute a vytvaacuteřeniacute s OAIS souvisejiacuteciacutech standardům

221 Referenčniacute model OAIS a OAIS archiv (repozitaacuteř)

Referenčniacute model se zabyacutevaacute celou škaacutelou ochrannyacutech funkciacute archivniacutech informaciacute včetně sběru (ingest) archivniacuteho uloženiacute data managementu přiacutestupu a rozšiřovaacuteniacute informaciacute Zabyacutevaacute se rovněž migraciacute digitaacutelniacutech informaciacute na novaacute meacutedia a formy data modelem použityacutem na reprezentaci informaciacute roliacute softwaru v ochraně informaciacute a vyacuteměnou digitaacutelniacutech informaciacute mezi archivy Určuje zaacuteroveň jak interniacute tak externiacute pracovniacute prostřediacute archivniacutech funkciacute a určuje takeacute mnoho obecnyacutech služeb těchto prostřediacute Poskytuje takeacute různeacute přiacuteklady a best practice doporučeniacute Definuje takeacute minimaacutelniacute sadu odpovědnostiacute pro archivrepozitaacuteř aby mohl byacutet nazyacutevaacuten OAIS archivem

Preservation Metadata and the OAIS Information Model s 5

dagger tj neniacute to naacutevod na implementaci určityacutech technologiiacute

Dagger CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 5

OAIS je archiv sestaacutevajiacuteciacute z organizace lidiacute a systeacutemů kteřiacute přijali odpovědnost za ochranu informaciacute a jejich zpřiacutestupněniacute určiteacute komunitě To představuje určiteacute odpovědnosti definovaneacute v raacutemci OAIS a ktereacute dovolujiacute takovyacute OAIS archiv odlišovat od ostatniacutech systeacutemů popisovanyacutech slovem bdquoarchivldquo

Hlavniacute koncept referenčniacuteho modelu vychaacuteziacute praacutevě ze zkratky OAIS Vyacuteraz open odkazuje na skutečnost že referenčniacute model byl vytvořen a volně publikovaacuten na veřejnyacutech foacuterech na kteryacutech mohl kdokoliv zainteresovanyacute participovat Pozor - slovo nenaznačuje že přiacutestup do archivu je neomezenyacute Archival information system je bdquoorganizace lidiacute a systeacutemů (hardware software) kteřiacute vzali za svou odpovědnost ochraacutenit informace a zpřiacutestupnit je pro určitou komunituldquo

Tato definice zdůrazňuje dvě primaacuterniacute funkce archivniacutech repozitaacuteřů za prveacute ochraacutenit informaci tj zajistit jejiacute dlouhodobou odolnost za druheacute poskytnout přiacutestup k archivovaneacute informaci v zaacutevislosti na potřebaacutech uživatelů nebo komunity Tato definice je podpořena vyacutečtem naacuteroků ktereacute musiacute archiv OAIS typu splňovat OAIS musiacute obzvlaacuteště

minus vyjednaacutevat a ziacuteskaacutevat informace od producentů informaciacute

minus zajistit dostatečnou kontrolu informaciacute aby se splnily podmiacutenky dlouhodobeacute ochrany

minus vymezit hlediska využitiacute uživatelskou komunitou

minus zajistit aby byly chraacuteněneacute informace nezaacutevisle srozumitelneacute uživatelům v tom smyslu že je možneacute informaci rozumět a vniacutemat bez využitiacute asistence producenta teacuteto informace

minus dodržovat strategii a procedury a tiacutem zajistit to že informace je ochraacuteněna proti všem nepředviacutedatelnostem je možneacute rozšiřovat autentickeacute kopie informace v originaacutelniacute formě nebo ve formě kteraacute na tu původniacute odkazuje

minus zpřiacutestupnit chraacuteněneacute informace uživatelskeacute komunitě

Spravovaneacute informace jsou považovaacuteny za hodneacute k dlouhodobeacutemu uchovaacuteniacute jakkoliv samo OAIS neniacute permanentniacute Termiacuten bdquodlouhodobyacuteldquo označuje časovyacute uacutesek dost dlouhyacute na to abychom uvažovali o jeho dopadu na změny technologiiacute podpory formaacutetů novyacutech i staryacutech novyacutech meacutediiacute a takeacute o změnaacutech ciacuteloveacute komunity bdquoDlouhodobostldquo se může nepředviacutedatelně prodlužovat

222 OAIS ndash informačniacute baliacutečky ndash Information Package (IP)

Repozitaacuteř odpoviacutedajiacuteciacute OAIS pracuje s několika typy tzv informačniacutech baliacutečků ktereacute model OAIS definuje Ty mohou ideaacutelně obsahovat informace o sveacutem obsahu a samozřejmě k nim informace podpůrneacute Jsou to SIP AIP a DIP ndash podrobněji viz niacuteže v textu teacuteto čaacutesti

Informace o obsahu

minus je sama o sobě srozumitelnaacute určiteacute komunitě tj informace je v podobě souboru

minus může byacutet i fyzickyacutem objektem

minus potřebuje Reprezentaci informace aby dala smysl sledu bitů v souboru

Podpůrneacute informace tj to

minus jak vlastně vznikla Informace o obsahu

minus jak souvisiacute s ostatniacutemi informacemi

minus jak je zajištěna jejiacute integrita

minus takteacutež maacute tzv Reprezentaci informace (viz kapitola 23)

LAVOIE Brian F The Open Archival Information System Reference Model s 3

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 6

Submission Information Package - SIP

minus je předmětem vyjednaacutevaacuteniacute mezi producentem (tvůrcem informaciacute) a OAISrepozitaacuteřem

minus je zasiacutelaacuten producentem (dodavatelem) do OAISrepozitaacuteře

Archival Information Package - AIP

minus baliacuteček informaciacute použiacutevanyacute pro vlastniacute archivaci digitaacutelniacutech objektů

minus obsahuje kompletniacute sadu Popisneacute ochranneacute informace (Preservation Description Information - PDI) pro obsahoveacute informace

Dissemination Information Package - DIP

minus obsahuje čaacutest nebo všechny čaacutesti jednoho nebo viacutece AIP

minus OAISrepozitaacuteř je rozšiřuje uživatelům z konkreacutetniacute komunity (tj je to vlastně to co se dostane z repozitaacuteře uživatelům)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 7

223 Shrnutiacute aneb co je vlastně referenčniacute model

Raacutemec

minus pro pochopeniacute podstatnyacutech vztahů mezi entitami určiteacuteho prostřediacute a

minus pro vyacutevoj důslednyacutech standardů nebo specifikaciacute toto prostřediacute podporujiacuteciacutech

minus pro pochopeniacute a aplikaci konceptu potřebneacuteho pro dlouhodobou ochranu digitaacutelniacutech informaciacute

minus pro pochopeniacute a implementaci konceptů potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute

Referenčniacute model

minus je založen na maleacutem počtu jednotnyacutech konceptů

minus je abstrakciacute kliacutečovyacutech konceptů jejich vztahů a jejich prostřediacute jak mezi sebou tak vůči okolniacutemu prostřediacute

minus může byacutet využit jako zaacuteklad pro vzdělaacutevaacuteniacute a vysvětlovaacuteniacute standardů pro laiky (ne-specialisty)

Zajiacutemavostiacute je že raacutemec do jisteacute miacutery odpoviacutedaacute koloběhu kteryacute se provaacutediacute s klasickyacutemi dokumenty v knihovnaacutech nebo archivech Je tady jistaacute analogie mezi uloženiacutem a zpřiacutestupněniacutem klasickyacutech dokumentů a dokumentů digitaacutelniacutech Digitaacutelniacute je ovšem složitějšiacute a mnohem zranitelnějšiacutedagger

23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger

Informace je vždy vyjaacutedřena (tj reprezentovaacutena) pomociacute nějakeacuteho typu dat Data interpretovanaacute pomociacute sveacute bdquoReprezentace informaceldquo daacutevajiacute vzniknout informaciacutem (informačniacutemu objektu) Ochrana bdquoInformačniacuteho objektuldquo vyžaduje jasnou identifikaci a pochopeniacute datoveacuteho objektu a s niacutem spojeneacute bdquoReprezentace informaceldquo

Referenčniacute model OAIS je znaacutezorněn na obraacutezku niacuteže V kontextu OAIS může informace existovat ve dvou formaacutech ndash buď jako fyzickyacute objekt (tj např papiacuterovyacute dokument vzorek půdy) nebo jako digitaacutelniacute objekt (např PDF soubor TIFF soubor) Tyto dva druhy ndash fyzickyacute a digitaacutelniacute ndash jsou obecně znaacutemy jako tzv Datoveacute objekty Takovyacute datovyacute objekt může nabyacutevat různyacutech forem ať je to materiaacutel kteryacute je ciacutelem ochrany nebo metadata asociovanaacute s archivniacutem digitaacutelniacutem objektemsect

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

dagger STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online]

Dagger SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

sect Preservation Metadata and the OAIS Information Model s 5

Datovyacute objekt Reprezentace informace

Informačniacute objekt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 4: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 4

vztahy mezi nimi v archivniacutem prostřediacute vysvětlit kliacutečoveacute funkce a informačniacute komponenty archivniacuteho systeacutemu a nakonec měl posloužit jako raacutemec pro dalšiacute aktivitu Vše se povedlo včetně podpory dalšiacutech aktivit

Praacutece CCSDS vyuacutestila v květnu 1999 ve vydaacuteniacute referenčniacuteho modelu OAIS Referenčniacute model je koncepčniacute raacutemec pro jakyacutekoliv archivniacute systeacutem věnovanyacute probleacutemu ochrany a spraacutevy přiacutestupu k digitaacutelniacutem informaciacutem v dlouhodobeacutem horizontu Popisuje prostřediacute ve ktereacutem digitaacutelniacute archiv (repozitaacuteř) siacutedliacute jeho funkčniacute komponenty a informačniacute infrastrukturu podporujiacuteciacute všechny procesy archivu Referenčniacute model podstoupil review jako doporučeniacute pro normu ISO ale hlavně rozšiacuteřil se daleko mimo komunitu vesmiacuternyacutech vyacutezkumů do knihoven a ostatniacutech paměťovyacutech vlaacutedniacutech instituciacute i do soukromeacuteho sektoru Upravenaacute verze modelu byla publikovaacutena v r 2001

Referenčniacute model OAIS se ukaacutezal jako velmi životaschopnyacute a je dnes široce implementovaacuten a využiacutevaacuten Je ideaacutelniacute svou obecnostiacute a tiacutem tedy i možnostiacute implementace Celyacute raacutemec v podstatě popisuje entity a procesy ktereacute by měl repozitaacuteř zahrnovat a dělat s tiacutem že určiteacute čaacutesti tohoto raacutemce mohou ve skutečneacutem repozitaacuteři chybět

Je ovšem nutneacute si uvědomit že referenčniacute model OAIS představuje obecnyacute (high level) popis typů informaciacute vytvaacuteřenyacutech a spravovanyacutech funkčniacutemi komponenty celeacuteho archivniacuteho systeacutemu a nezabyacutevaacute se konkreacutetniacutemi typy digitaacutelniacutech objektů ktereacute se spravujiacute v archivu ani specifikaciacute technologiedagger použiteacute v archivu aby se dosaacutehlo ciacutele tj ochrany a uacutedržby přiacutestupu k digitaacutelniacutem objektům v dlouhodobeacutem horizontu Model jako takovyacute je použitelnyacute pro všechny datoveacute archivy a ty organizace naklaacutedajiacuteciacute s informacemi ktereacute mohou potřebovat dlouhodobou ochranu

Referenčniacute model odraacutežiacute zaměřeniacute na digitaacutelniacute informace ať již na primaacuterniacute podobu archivovaneacute informace a takeacute na informace podpůrneacute pro digitaacutelniacute nebo fyzickeacute archivovaneacute materiaacutely Nicmeacuteně model lze aplikovat in na ne-digitaacutelniacute informace (např fyzickeacute předměty) ovšem ochrana a architektura takovyacutech informaciacute neniacute rozebraacutena do detailu Referenčniacute model mjDagger

minus poskytuje raacutemec pro pochopeniacute a zvyacutešeniacute povědomiacute o archivniacutech konceptech potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute a přiacutestup k nim

minus poskytuje koncept potřebnyacute pro nearchivniacute instituce k tomu aby byly užitečnyacutemi uacutečastniacuteky v procesech ochrany

minus poskytuje raacutemec včetně terminologie a konceptů pro popis a porovnaacuteniacute architektur a procesů již existujiacuteciacutech i budouciacutech archivů

minus poskytuje raacutemec pro popis a porovnaacuteniacute různyacutech strategiiacute a technik dlouhodobeacute ochrany

minus poskytuje zaacuteklad pro porovnaacuteniacute datovyacutech modelů digitaacutelniacutech informaciacute ochraňovanyacutech v archivech a takeacute pro diskuzi o tom jak se mohou datoveacute modely a zaacutesadniacute informace během doby měnit

minus poskytuje zaacuteklad kteryacute může byacutet rozšiacuteřen dalšiacutem uacutesiliacutem tak aby pokryl dlouhodobou ochranu informaciacute ktereacute nejsou v digitaacutelniacute formě (např fyzickaacute meacutedia a fyzickeacute vzorky)

minus daacute zaacuteklad rozpoznaacuteniacute a vytvaacuteřeniacute s OAIS souvisejiacuteciacutech standardům

221 Referenčniacute model OAIS a OAIS archiv (repozitaacuteř)

Referenčniacute model se zabyacutevaacute celou škaacutelou ochrannyacutech funkciacute archivniacutech informaciacute včetně sběru (ingest) archivniacuteho uloženiacute data managementu přiacutestupu a rozšiřovaacuteniacute informaciacute Zabyacutevaacute se rovněž migraciacute digitaacutelniacutech informaciacute na novaacute meacutedia a formy data modelem použityacutem na reprezentaci informaciacute roliacute softwaru v ochraně informaciacute a vyacuteměnou digitaacutelniacutech informaciacute mezi archivy Určuje zaacuteroveň jak interniacute tak externiacute pracovniacute prostřediacute archivniacutech funkciacute a určuje takeacute mnoho obecnyacutech služeb těchto prostřediacute Poskytuje takeacute různeacute přiacuteklady a best practice doporučeniacute Definuje takeacute minimaacutelniacute sadu odpovědnostiacute pro archivrepozitaacuteř aby mohl byacutet nazyacutevaacuten OAIS archivem

Preservation Metadata and the OAIS Information Model s 5

dagger tj neniacute to naacutevod na implementaci určityacutech technologiiacute

Dagger CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 5

OAIS je archiv sestaacutevajiacuteciacute z organizace lidiacute a systeacutemů kteřiacute přijali odpovědnost za ochranu informaciacute a jejich zpřiacutestupněniacute určiteacute komunitě To představuje určiteacute odpovědnosti definovaneacute v raacutemci OAIS a ktereacute dovolujiacute takovyacute OAIS archiv odlišovat od ostatniacutech systeacutemů popisovanyacutech slovem bdquoarchivldquo

Hlavniacute koncept referenčniacuteho modelu vychaacuteziacute praacutevě ze zkratky OAIS Vyacuteraz open odkazuje na skutečnost že referenčniacute model byl vytvořen a volně publikovaacuten na veřejnyacutech foacuterech na kteryacutech mohl kdokoliv zainteresovanyacute participovat Pozor - slovo nenaznačuje že přiacutestup do archivu je neomezenyacute Archival information system je bdquoorganizace lidiacute a systeacutemů (hardware software) kteřiacute vzali za svou odpovědnost ochraacutenit informace a zpřiacutestupnit je pro určitou komunituldquo

Tato definice zdůrazňuje dvě primaacuterniacute funkce archivniacutech repozitaacuteřů za prveacute ochraacutenit informaci tj zajistit jejiacute dlouhodobou odolnost za druheacute poskytnout přiacutestup k archivovaneacute informaci v zaacutevislosti na potřebaacutech uživatelů nebo komunity Tato definice je podpořena vyacutečtem naacuteroků ktereacute musiacute archiv OAIS typu splňovat OAIS musiacute obzvlaacuteště

minus vyjednaacutevat a ziacuteskaacutevat informace od producentů informaciacute

minus zajistit dostatečnou kontrolu informaciacute aby se splnily podmiacutenky dlouhodobeacute ochrany

minus vymezit hlediska využitiacute uživatelskou komunitou

minus zajistit aby byly chraacuteněneacute informace nezaacutevisle srozumitelneacute uživatelům v tom smyslu že je možneacute informaci rozumět a vniacutemat bez využitiacute asistence producenta teacuteto informace

minus dodržovat strategii a procedury a tiacutem zajistit to že informace je ochraacuteněna proti všem nepředviacutedatelnostem je možneacute rozšiřovat autentickeacute kopie informace v originaacutelniacute formě nebo ve formě kteraacute na tu původniacute odkazuje

minus zpřiacutestupnit chraacuteněneacute informace uživatelskeacute komunitě

Spravovaneacute informace jsou považovaacuteny za hodneacute k dlouhodobeacutemu uchovaacuteniacute jakkoliv samo OAIS neniacute permanentniacute Termiacuten bdquodlouhodobyacuteldquo označuje časovyacute uacutesek dost dlouhyacute na to abychom uvažovali o jeho dopadu na změny technologiiacute podpory formaacutetů novyacutech i staryacutech novyacutech meacutediiacute a takeacute o změnaacutech ciacuteloveacute komunity bdquoDlouhodobostldquo se může nepředviacutedatelně prodlužovat

222 OAIS ndash informačniacute baliacutečky ndash Information Package (IP)

Repozitaacuteř odpoviacutedajiacuteciacute OAIS pracuje s několika typy tzv informačniacutech baliacutečků ktereacute model OAIS definuje Ty mohou ideaacutelně obsahovat informace o sveacutem obsahu a samozřejmě k nim informace podpůrneacute Jsou to SIP AIP a DIP ndash podrobněji viz niacuteže v textu teacuteto čaacutesti

Informace o obsahu

minus je sama o sobě srozumitelnaacute určiteacute komunitě tj informace je v podobě souboru

minus může byacutet i fyzickyacutem objektem

minus potřebuje Reprezentaci informace aby dala smysl sledu bitů v souboru

Podpůrneacute informace tj to

minus jak vlastně vznikla Informace o obsahu

minus jak souvisiacute s ostatniacutemi informacemi

minus jak je zajištěna jejiacute integrita

minus takteacutež maacute tzv Reprezentaci informace (viz kapitola 23)

LAVOIE Brian F The Open Archival Information System Reference Model s 3

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 6

Submission Information Package - SIP

minus je předmětem vyjednaacutevaacuteniacute mezi producentem (tvůrcem informaciacute) a OAISrepozitaacuteřem

minus je zasiacutelaacuten producentem (dodavatelem) do OAISrepozitaacuteře

Archival Information Package - AIP

minus baliacuteček informaciacute použiacutevanyacute pro vlastniacute archivaci digitaacutelniacutech objektů

minus obsahuje kompletniacute sadu Popisneacute ochranneacute informace (Preservation Description Information - PDI) pro obsahoveacute informace

Dissemination Information Package - DIP

minus obsahuje čaacutest nebo všechny čaacutesti jednoho nebo viacutece AIP

minus OAISrepozitaacuteř je rozšiřuje uživatelům z konkreacutetniacute komunity (tj je to vlastně to co se dostane z repozitaacuteře uživatelům)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 7

223 Shrnutiacute aneb co je vlastně referenčniacute model

Raacutemec

minus pro pochopeniacute podstatnyacutech vztahů mezi entitami určiteacuteho prostřediacute a

minus pro vyacutevoj důslednyacutech standardů nebo specifikaciacute toto prostřediacute podporujiacuteciacutech

minus pro pochopeniacute a aplikaci konceptu potřebneacuteho pro dlouhodobou ochranu digitaacutelniacutech informaciacute

minus pro pochopeniacute a implementaci konceptů potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute

Referenčniacute model

minus je založen na maleacutem počtu jednotnyacutech konceptů

minus je abstrakciacute kliacutečovyacutech konceptů jejich vztahů a jejich prostřediacute jak mezi sebou tak vůči okolniacutemu prostřediacute

minus může byacutet využit jako zaacuteklad pro vzdělaacutevaacuteniacute a vysvětlovaacuteniacute standardů pro laiky (ne-specialisty)

Zajiacutemavostiacute je že raacutemec do jisteacute miacutery odpoviacutedaacute koloběhu kteryacute se provaacutediacute s klasickyacutemi dokumenty v knihovnaacutech nebo archivech Je tady jistaacute analogie mezi uloženiacutem a zpřiacutestupněniacutem klasickyacutech dokumentů a dokumentů digitaacutelniacutech Digitaacutelniacute je ovšem složitějšiacute a mnohem zranitelnějšiacutedagger

23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger

Informace je vždy vyjaacutedřena (tj reprezentovaacutena) pomociacute nějakeacuteho typu dat Data interpretovanaacute pomociacute sveacute bdquoReprezentace informaceldquo daacutevajiacute vzniknout informaciacutem (informačniacutemu objektu) Ochrana bdquoInformačniacuteho objektuldquo vyžaduje jasnou identifikaci a pochopeniacute datoveacuteho objektu a s niacutem spojeneacute bdquoReprezentace informaceldquo

Referenčniacute model OAIS je znaacutezorněn na obraacutezku niacuteže V kontextu OAIS může informace existovat ve dvou formaacutech ndash buď jako fyzickyacute objekt (tj např papiacuterovyacute dokument vzorek půdy) nebo jako digitaacutelniacute objekt (např PDF soubor TIFF soubor) Tyto dva druhy ndash fyzickyacute a digitaacutelniacute ndash jsou obecně znaacutemy jako tzv Datoveacute objekty Takovyacute datovyacute objekt může nabyacutevat různyacutech forem ať je to materiaacutel kteryacute je ciacutelem ochrany nebo metadata asociovanaacute s archivniacutem digitaacutelniacutem objektemsect

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

dagger STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online]

Dagger SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

sect Preservation Metadata and the OAIS Information Model s 5

Datovyacute objekt Reprezentace informace

Informačniacute objekt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 5: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 5

OAIS je archiv sestaacutevajiacuteciacute z organizace lidiacute a systeacutemů kteřiacute přijali odpovědnost za ochranu informaciacute a jejich zpřiacutestupněniacute určiteacute komunitě To představuje určiteacute odpovědnosti definovaneacute v raacutemci OAIS a ktereacute dovolujiacute takovyacute OAIS archiv odlišovat od ostatniacutech systeacutemů popisovanyacutech slovem bdquoarchivldquo

Hlavniacute koncept referenčniacuteho modelu vychaacuteziacute praacutevě ze zkratky OAIS Vyacuteraz open odkazuje na skutečnost že referenčniacute model byl vytvořen a volně publikovaacuten na veřejnyacutech foacuterech na kteryacutech mohl kdokoliv zainteresovanyacute participovat Pozor - slovo nenaznačuje že přiacutestup do archivu je neomezenyacute Archival information system je bdquoorganizace lidiacute a systeacutemů (hardware software) kteřiacute vzali za svou odpovědnost ochraacutenit informace a zpřiacutestupnit je pro určitou komunituldquo

Tato definice zdůrazňuje dvě primaacuterniacute funkce archivniacutech repozitaacuteřů za prveacute ochraacutenit informaci tj zajistit jejiacute dlouhodobou odolnost za druheacute poskytnout přiacutestup k archivovaneacute informaci v zaacutevislosti na potřebaacutech uživatelů nebo komunity Tato definice je podpořena vyacutečtem naacuteroků ktereacute musiacute archiv OAIS typu splňovat OAIS musiacute obzvlaacuteště

minus vyjednaacutevat a ziacuteskaacutevat informace od producentů informaciacute

minus zajistit dostatečnou kontrolu informaciacute aby se splnily podmiacutenky dlouhodobeacute ochrany

minus vymezit hlediska využitiacute uživatelskou komunitou

minus zajistit aby byly chraacuteněneacute informace nezaacutevisle srozumitelneacute uživatelům v tom smyslu že je možneacute informaci rozumět a vniacutemat bez využitiacute asistence producenta teacuteto informace

minus dodržovat strategii a procedury a tiacutem zajistit to že informace je ochraacuteněna proti všem nepředviacutedatelnostem je možneacute rozšiřovat autentickeacute kopie informace v originaacutelniacute formě nebo ve formě kteraacute na tu původniacute odkazuje

minus zpřiacutestupnit chraacuteněneacute informace uživatelskeacute komunitě

Spravovaneacute informace jsou považovaacuteny za hodneacute k dlouhodobeacutemu uchovaacuteniacute jakkoliv samo OAIS neniacute permanentniacute Termiacuten bdquodlouhodobyacuteldquo označuje časovyacute uacutesek dost dlouhyacute na to abychom uvažovali o jeho dopadu na změny technologiiacute podpory formaacutetů novyacutech i staryacutech novyacutech meacutediiacute a takeacute o změnaacutech ciacuteloveacute komunity bdquoDlouhodobostldquo se může nepředviacutedatelně prodlužovat

222 OAIS ndash informačniacute baliacutečky ndash Information Package (IP)

Repozitaacuteř odpoviacutedajiacuteciacute OAIS pracuje s několika typy tzv informačniacutech baliacutečků ktereacute model OAIS definuje Ty mohou ideaacutelně obsahovat informace o sveacutem obsahu a samozřejmě k nim informace podpůrneacute Jsou to SIP AIP a DIP ndash podrobněji viz niacuteže v textu teacuteto čaacutesti

Informace o obsahu

minus je sama o sobě srozumitelnaacute určiteacute komunitě tj informace je v podobě souboru

minus může byacutet i fyzickyacutem objektem

minus potřebuje Reprezentaci informace aby dala smysl sledu bitů v souboru

Podpůrneacute informace tj to

minus jak vlastně vznikla Informace o obsahu

minus jak souvisiacute s ostatniacutemi informacemi

minus jak je zajištěna jejiacute integrita

minus takteacutež maacute tzv Reprezentaci informace (viz kapitola 23)

LAVOIE Brian F The Open Archival Information System Reference Model s 3

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 6

Submission Information Package - SIP

minus je předmětem vyjednaacutevaacuteniacute mezi producentem (tvůrcem informaciacute) a OAISrepozitaacuteřem

minus je zasiacutelaacuten producentem (dodavatelem) do OAISrepozitaacuteře

Archival Information Package - AIP

minus baliacuteček informaciacute použiacutevanyacute pro vlastniacute archivaci digitaacutelniacutech objektů

minus obsahuje kompletniacute sadu Popisneacute ochranneacute informace (Preservation Description Information - PDI) pro obsahoveacute informace

Dissemination Information Package - DIP

minus obsahuje čaacutest nebo všechny čaacutesti jednoho nebo viacutece AIP

minus OAISrepozitaacuteř je rozšiřuje uživatelům z konkreacutetniacute komunity (tj je to vlastně to co se dostane z repozitaacuteře uživatelům)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 7

223 Shrnutiacute aneb co je vlastně referenčniacute model

Raacutemec

minus pro pochopeniacute podstatnyacutech vztahů mezi entitami určiteacuteho prostřediacute a

minus pro vyacutevoj důslednyacutech standardů nebo specifikaciacute toto prostřediacute podporujiacuteciacutech

minus pro pochopeniacute a aplikaci konceptu potřebneacuteho pro dlouhodobou ochranu digitaacutelniacutech informaciacute

minus pro pochopeniacute a implementaci konceptů potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute

Referenčniacute model

minus je založen na maleacutem počtu jednotnyacutech konceptů

minus je abstrakciacute kliacutečovyacutech konceptů jejich vztahů a jejich prostřediacute jak mezi sebou tak vůči okolniacutemu prostřediacute

minus může byacutet využit jako zaacuteklad pro vzdělaacutevaacuteniacute a vysvětlovaacuteniacute standardů pro laiky (ne-specialisty)

Zajiacutemavostiacute je že raacutemec do jisteacute miacutery odpoviacutedaacute koloběhu kteryacute se provaacutediacute s klasickyacutemi dokumenty v knihovnaacutech nebo archivech Je tady jistaacute analogie mezi uloženiacutem a zpřiacutestupněniacutem klasickyacutech dokumentů a dokumentů digitaacutelniacutech Digitaacutelniacute je ovšem složitějšiacute a mnohem zranitelnějšiacutedagger

23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger

Informace je vždy vyjaacutedřena (tj reprezentovaacutena) pomociacute nějakeacuteho typu dat Data interpretovanaacute pomociacute sveacute bdquoReprezentace informaceldquo daacutevajiacute vzniknout informaciacutem (informačniacutemu objektu) Ochrana bdquoInformačniacuteho objektuldquo vyžaduje jasnou identifikaci a pochopeniacute datoveacuteho objektu a s niacutem spojeneacute bdquoReprezentace informaceldquo

Referenčniacute model OAIS je znaacutezorněn na obraacutezku niacuteže V kontextu OAIS může informace existovat ve dvou formaacutech ndash buď jako fyzickyacute objekt (tj např papiacuterovyacute dokument vzorek půdy) nebo jako digitaacutelniacute objekt (např PDF soubor TIFF soubor) Tyto dva druhy ndash fyzickyacute a digitaacutelniacute ndash jsou obecně znaacutemy jako tzv Datoveacute objekty Takovyacute datovyacute objekt může nabyacutevat různyacutech forem ať je to materiaacutel kteryacute je ciacutelem ochrany nebo metadata asociovanaacute s archivniacutem digitaacutelniacutem objektemsect

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

dagger STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online]

Dagger SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

sect Preservation Metadata and the OAIS Information Model s 5

Datovyacute objekt Reprezentace informace

Informačniacute objekt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 6: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 6

Submission Information Package - SIP

minus je předmětem vyjednaacutevaacuteniacute mezi producentem (tvůrcem informaciacute) a OAISrepozitaacuteřem

minus je zasiacutelaacuten producentem (dodavatelem) do OAISrepozitaacuteře

Archival Information Package - AIP

minus baliacuteček informaciacute použiacutevanyacute pro vlastniacute archivaci digitaacutelniacutech objektů

minus obsahuje kompletniacute sadu Popisneacute ochranneacute informace (Preservation Description Information - PDI) pro obsahoveacute informace

Dissemination Information Package - DIP

minus obsahuje čaacutest nebo všechny čaacutesti jednoho nebo viacutece AIP

minus OAISrepozitaacuteř je rozšiřuje uživatelům z konkreacutetniacute komunity (tj je to vlastně to co se dostane z repozitaacuteře uživatelům)

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 7

223 Shrnutiacute aneb co je vlastně referenčniacute model

Raacutemec

minus pro pochopeniacute podstatnyacutech vztahů mezi entitami určiteacuteho prostřediacute a

minus pro vyacutevoj důslednyacutech standardů nebo specifikaciacute toto prostřediacute podporujiacuteciacutech

minus pro pochopeniacute a aplikaci konceptu potřebneacuteho pro dlouhodobou ochranu digitaacutelniacutech informaciacute

minus pro pochopeniacute a implementaci konceptů potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute

Referenčniacute model

minus je založen na maleacutem počtu jednotnyacutech konceptů

minus je abstrakciacute kliacutečovyacutech konceptů jejich vztahů a jejich prostřediacute jak mezi sebou tak vůči okolniacutemu prostřediacute

minus může byacutet využit jako zaacuteklad pro vzdělaacutevaacuteniacute a vysvětlovaacuteniacute standardů pro laiky (ne-specialisty)

Zajiacutemavostiacute je že raacutemec do jisteacute miacutery odpoviacutedaacute koloběhu kteryacute se provaacutediacute s klasickyacutemi dokumenty v knihovnaacutech nebo archivech Je tady jistaacute analogie mezi uloženiacutem a zpřiacutestupněniacutem klasickyacutech dokumentů a dokumentů digitaacutelniacutech Digitaacutelniacute je ovšem složitějšiacute a mnohem zranitelnějšiacutedagger

23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger

Informace je vždy vyjaacutedřena (tj reprezentovaacutena) pomociacute nějakeacuteho typu dat Data interpretovanaacute pomociacute sveacute bdquoReprezentace informaceldquo daacutevajiacute vzniknout informaciacutem (informačniacutemu objektu) Ochrana bdquoInformačniacuteho objektuldquo vyžaduje jasnou identifikaci a pochopeniacute datoveacuteho objektu a s niacutem spojeneacute bdquoReprezentace informaceldquo

Referenčniacute model OAIS je znaacutezorněn na obraacutezku niacuteže V kontextu OAIS může informace existovat ve dvou formaacutech ndash buď jako fyzickyacute objekt (tj např papiacuterovyacute dokument vzorek půdy) nebo jako digitaacutelniacute objekt (např PDF soubor TIFF soubor) Tyto dva druhy ndash fyzickyacute a digitaacutelniacute ndash jsou obecně znaacutemy jako tzv Datoveacute objekty Takovyacute datovyacute objekt může nabyacutevat různyacutech forem ať je to materiaacutel kteryacute je ciacutelem ochrany nebo metadata asociovanaacute s archivniacutem digitaacutelniacutem objektemsect

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

dagger STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online]

Dagger SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

sect Preservation Metadata and the OAIS Information Model s 5

Datovyacute objekt Reprezentace informace

Informačniacute objekt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 7: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 7

223 Shrnutiacute aneb co je vlastně referenčniacute model

Raacutemec

minus pro pochopeniacute podstatnyacutech vztahů mezi entitami určiteacuteho prostřediacute a

minus pro vyacutevoj důslednyacutech standardů nebo specifikaciacute toto prostřediacute podporujiacuteciacutech

minus pro pochopeniacute a aplikaci konceptu potřebneacuteho pro dlouhodobou ochranu digitaacutelniacutech informaciacute

minus pro pochopeniacute a implementaci konceptů potřebnyacutech pro dlouhodobou ochranu digitaacutelniacutech informaciacute

Referenčniacute model

minus je založen na maleacutem počtu jednotnyacutech konceptů

minus je abstrakciacute kliacutečovyacutech konceptů jejich vztahů a jejich prostřediacute jak mezi sebou tak vůči okolniacutemu prostřediacute

minus může byacutet využit jako zaacuteklad pro vzdělaacutevaacuteniacute a vysvětlovaacuteniacute standardů pro laiky (ne-specialisty)

Zajiacutemavostiacute je že raacutemec do jisteacute miacutery odpoviacutedaacute koloběhu kteryacute se provaacutediacute s klasickyacutemi dokumenty v knihovnaacutech nebo archivech Je tady jistaacute analogie mezi uloženiacutem a zpřiacutestupněniacutem klasickyacutech dokumentů a dokumentů digitaacutelniacutech Digitaacutelniacute je ovšem složitějšiacute a mnohem zranitelnějšiacutedagger

23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger

Informace je vždy vyjaacutedřena (tj reprezentovaacutena) pomociacute nějakeacuteho typu dat Data interpretovanaacute pomociacute sveacute bdquoReprezentace informaceldquo daacutevajiacute vzniknout informaciacutem (informačniacutemu objektu) Ochrana bdquoInformačniacuteho objektuldquo vyžaduje jasnou identifikaci a pochopeniacute datoveacuteho objektu a s niacutem spojeneacute bdquoReprezentace informaceldquo

Referenčniacute model OAIS je znaacutezorněn na obraacutezku niacuteže V kontextu OAIS může informace existovat ve dvou formaacutech ndash buď jako fyzickyacute objekt (tj např papiacuterovyacute dokument vzorek půdy) nebo jako digitaacutelniacute objekt (např PDF soubor TIFF soubor) Tyto dva druhy ndash fyzickyacute a digitaacutelniacute ndash jsou obecně znaacutemy jako tzv Datoveacute objekty Takovyacute datovyacute objekt může nabyacutevat různyacutech forem ať je to materiaacutel kteryacute je ciacutelem ochrany nebo metadata asociovanaacute s archivniacutem digitaacutelniacutem objektemsect

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

dagger STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online]

Dagger SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

sect Preservation Metadata and the OAIS Information Model s 5

Datovyacute objekt Reprezentace informace

Informačniacute objekt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 8: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 8

24 K PŘIPOMENUTIacute

minus OAIS je pouze konceptuaacutelniacute model a NE model architektury konkreacutetniacuteho systeacutemu

minus Funkce popsaneacuteho OAIS referenčniacuteho modelu nemusiacute nutně odpoviacutedat funkčniacutem modulům systeacutemu kteryacute maacute odpoviacutedat modelu OAIS

minus Funkčnost konkreacutetniacuteho digitaacutelniacuteho repozitaacuteře může byacutet daleko viacutece omezenaacute než je vyjaacutedřeno v referenčniacutem modelu OAIS

SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 9: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 9

3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ

S pokračujiacuteciacutem vyacutevojem a již běžnyacutem využiacutevaacuteniacutem repozitaacuteřů se začalo mluvit o tzv důvěryhodnyacutech repozitaacuteřiacutech Co vlastně maacute označovat slovo bdquodůvěryhodnyacuteldquo Označuje schopnost repozitaacuteře zachovat digitaacutelniacute dokumenty v dlouhodobeacutem horizontu přiacutestupneacute a použitelneacute Tedy repozitaacuteř musiacute byacutet navenek důvěryhodnyacute což se netyacutekaacute pouze technickeacuteho řešeniacute praacutevě naopak Jde o to jak je zajištěna organizace ve ktereacute je repozitaacuteř provozovaacuten (např financovaacuteniacute personaacutelně odborneacute zabezpečeniacute status organizace mandaacutet apod)

V raacutemci repozitaacuteře se většinou počiacutetaacute s tiacutem že informace na něm budou uloženy velmi dlouho přičemž budou staacutele v použitelneacute tedy čitelneacute podobě kteraacute se daacute nabiacutednout uživatelům Tohle platiacute hlavně pro tzv certifikovaneacute důvěryhodneacute repozitaacuteře Vyhovět jednomu z hlavniacutech ne-li hlavniacutemu ciacuteli certifikovanyacutech důvěryhodnyacutech repozitaacuteřů neniacute v době překotneacuteho vyacutevoje technologiiacute vůbec jednoducheacute Technologie se vyviacutejiacute obrovskyacutem tempem což přinaacutešiacute nejen zastaraacutevaacuteniacute hardwaru ale hlavě zastaraacutevaacuteniacute softwaru Je skoro jisteacute že formaacutety jakyacutechkoliv digitaacutelniacutech dokumentů (text obraz video audio) ktereacute jsou dnes rozšiacuteřeny a obecně využiacutevaacuteny (doc pdf mp3 avi jpg apod) budou v bliacutezkeacute budoucnosti nahrazeny jinyacutemi lepšiacutemi a později bude miacutet celaacute společnost seriozniacute probleacutem digitaacutelniacute dokumenty ve staryacutech formaacutetech vůbec použiacutet (přečiacutest přehraacutet upravit nebo i otevřiacutet)

Nemluviacuteme zde o něčem co se teprve stane ale o něčem co se již dlouhou dobu děje K takoveacute markantniacute proměně softwaru již došlo i napřiacuteklad v oblasti textovyacutech editorů Kdo si dnes vzpomene na textovyacute editor AmiPro běžiacuteciacute na počiacutetačiacutech Amiga ještě před naacutestupem Microsoft Office a jeho Wordu To sameacute se tyacutekaacute obrazovyacutech digitaacutelniacutech dokumentů ktereacute prochaacutezejiacute ještě bouřlivějšiacutem vyacutevojem kteryacute žene kupředu snaha o co největšiacute komprimaci při co nejlepšiacutem zachovaacuteniacute kvality

V tomto smyslu se na probleacutem zastaraacutevaacuteniacute softwaru a hardwaru můžeme diacutevat jako na jednu z forem technickeacute informačniacute barieacutery kteraacute ohrožuje velkou čaacutest našich digitaacutelniacutech dějin Viacuteme že uacuteroveň celeacute společnosti zaacutevisiacute na uacuterovni a dostupnosti informaciacutedagger

Novou a prozatiacutem maacutelo prozkoumanou a zdokumentovanou oblastiacute je plaacutenovaacuteniacute ochrany digitaacutelniacutech dokumentů s ohledem na rychlyacute proces staacuternutiacute a změn vlastniacutech dokumentů (nutnost včasneacute migrace) i hardware a software pro jejich zpřiacutestupněniacute (nutnost včasneacute emulace v přiacutepadě potřeby zachovaacuteniacute nejen obsahu ale i nosiče a celkoveacuteho prostřediacute) Degradace papiacuterovyacutech nosičů informaciacute je pomalaacute a snadno zjistitelnaacute ztraacutety v digitaacutelniacutem světě jsou naopak rychleacute nevratneacute a ne vždy snadno a včas zachytitelneacute Proto je v posledniacute době v mezinaacuterodniacutem kontextu věnovaacutena staacutele většiacute pozornost důvěryhodnyacutem digitaacutelniacutem repozitaacuteřůmDagger

31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect

Jakeacute druhy probleacutemů vlastně mohou nastat v přiacutepadě že se digitaacutelniacute objekty budou uchovaacutevat např několik desiacutetek nebo i set let

Pokud bychom chtěli jiacutet do extreacutemu v oblasti hardwaru můžeme za takovou změnu považovat naacutehradu děrnyacutech štiacutetků za magnetickeacute paacutesky posleacuteze za pevneacute paměti optickeacute disky apod Co si kdo dnes počne s děrnyacutemi štiacutetky kdyby z nich chtěl interpretovat nějakou informaci Nemusiacuteme ani chodit tak daleko do minulosti probleacutemem se mohou přeci ukaacutezat i obyčejneacute diskety ktereacute jsme před několika lety použiacutevali denně a ktereacute jsou dnes vytlačeny flashovyacutemi paměťmi a na prodaacutevanyacutech noteboociacutech a počiacutetačiacutech disketovaacute mechanika zcela chybiacute

dagger KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy s 17

Dagger STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87 sect GIARETTA David ISOCCSDS Open Archival Information System (OAIS) hellip

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 10: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 10

1 Archivovanaacute informace musiacute byacutet použitelnaacute uživateli kteřiacute jsou vzdaacuteleni v čase prostoru a nemajiacute podporu producenta teacute informace

minus Může se staacutet že producent informace již neexistuje v tom přiacutepadě nemůže odpovědět na žaacutedneacute otaacutezky Jedineacute co maacuteme je digitaacutelniacute objekt a jeho popis (metadata)

minus Software na ktereacutem byla informace (digitaacutelniacute objekt) vytvořena již nemusiacute byacutet podporovaacuten Může se tedy staacutet že informace zaznamenaneacute tiacutemto softwarem jsou zcela nedostupneacute (nikdo např neznaacute koacutedovaacuteniacute pro jejich využitiacute a dokumentace se během let ztratila) Uživatel nemusiacute byacutet schopen ani rozeznat zda digitaacutelniacute objekt je text obraz či zvuk

2 Uživatelskaacute komunita se bude během doby měnit

minus Novaacute komunita nebude znaacutet pozadiacute konkreacutetniacutech informaciacute (vznik software hardware uacutečel hellip)

minus Novaacute komunita může použiacutevat naprosto odlišneacute pracovniacute prostřediacute

minus Může chtiacutet kombinovat informace z mnoha zdrojů

3 Repozitaacuteř se bude měnit během doby

minus Může dojiacutet k migraciacutem na noveacute technologie což vždy souvisiacute s reorganizaciacute informaciacute v repozitaacuteři a ta zase s možnyacutemi změnami ve vztaziacutech mezi informacemi

Může takeacute dojiacutet k migraci do jinyacutech instituciacute tj možneacute změny v managementu datoveacute struktuře i formaacutetu souborů

32 EMULACE A MIGRACE

V raacutemci (nejen) certifikovanyacutech důvěryhodnyacutech repozitaacuteřů by systeacutem repozitaacuteře saacutem od sebe měl poznat kdy kteryacute formaacutet digitaacutelniacutech objektů zastaraacutevaacute a proveacutest např jeho emulaci nebo migraci Samozřejmě to systeacutem neudělaacute saacutem od sebe ale na zaacutekladě určityacutech informaciacute (metadat) a na zaacutekladě spolupraacutece s externiacutemi registry formaacutetů (např PRONOM nebo GDFRdagger) Digitaacutelniacute dokumenty obsahujiacute maximaacutelniacute množstviacute metadat již při sveacutem vstupu do repozitaacuteře (tj poskytne je původce digitaacutelniacuteho objektu) Existujiacute i naacutestroje ktereacute automaticky z digitaacutelniacutech objektů při jejich vstupu do repozitaacuteře potřebnaacute metadata vytvořiacute (většinou technickaacute metadata) Jedniacutem z naacutestrojů je např znaacutemyacute JHOVEDagger

Pod pojmem emulace se rozumiacute uměleacute bdquonapodobeniacuteldquo softwaroveacuteho a hardwaroveacuteho prostřediacute ktereacute bylo typickeacute nebo nutneacute pro prohliacuteženiacute digitaacutelniacuteho objektu v době jeho vzniku Přiacutekladem může byacutet emulačniacute software kteryacute dokaacuteže napodobit hardwaroveacute vybaveniacute počiacutetače z roku 1995 a zaacuteroveň v raacutemci tohoto emulaacutetoru spustit software z teacute doby (např MS Windows 95) Nepopiratelnou vyacutehodou tohoto přiacutestupu je že můžeme digitaacutelniacute objekt v repozitaacuteři uloženyacute v jeho původniacute podobě a nemusiacuteme ho jednou za čas transformovat do staacutele novyacutech a novyacutech formaacutetů Nevyacutehodou naopak je že emulačniacute software staacutele neniacute vyvinut natolik aby tento přiacutestup poskytoval zaacuteruku že digitaacutelniacute objekty opravdu bude možneacute kdykoliv zpřiacutestupnit v jejich původniacutem prostřediacute Naviacutec emulačniacute software čeliacute stejneacutemu probleacutemu v horizontu několika let bude saacutem potřebovat dalšiacute emulaacutetor aby bylo možneacute původniacute emulaacutetor spustit Přiacutekladem emulačniacuteho softwaru pro potřeby digital preservation je např DIOSCURIsect vyvinutyacute ve spolupraacuteci nizozemskeacute naacuterodniacute knihovny a naacuterodniacuteho archivu

Migrace je druhou metodou aplikovanou v raacutemci ochrany digitaacutelniacutech objektů Je to přiacutestup kteryacute reflektuje neustaacutelyacute vyacutevoj formaacutetů a migruje ve vhodnyacute okamžik všechna data v konkreacutetniacutem formaacutetu uloženaacute v repozitaacuteři do formaacutetu novějšiacuteho kteryacute je v tom okamžiku aktuaacutelniacute Ciacutelem je zamezit tomu že budou v repozitaacuteři uložena data ve formaacutetu kteryacute už nemaacute podporu aktuaacutelniacutech softwarovyacutech aplikaciacute a neniacute tedy možneacute objekt zobrazit Přiacutekladem budiž převod textoveacuteho

httpwwwnationalarchivesgovukpronom dagger httpwwwgdfrinfo Dagger httphulharvardedujhove sect httpdioscurisourceforgenet

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 11: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 11

dokumentu vytvořeneacuteho ve stareacutem textoveacutem procesoru AmiPro s koncovkou sam např do PDF nebo do jinyacutech v současnosti podporovanyacutech formaacutetů Vyacutehodou migrace je že v přiacutepadě že uživatel chce uloženyacute digitaacutelniacute objekt použiacutet (zobrazit spustit apod) ten je v podstatě připraven k tomu byacutet spuštěn v aktuaacutelniacutech verziacutech běžneacuteho softwaru na počiacutetači uživatele Nevyacutehodou je že velmi často se migraciacute ztraacuteciacute čaacutest původniacuteho objektu (ne informace ale typicky např čaacutest formaacutetovaacuteniacute) Digitaacutelniacute objekt kteryacute dostane budouciacute uživatel nemusiacute byacutet zcela totožnyacute s objektem původniacutem

Zatiacutemco u klasickyacutech dokumentů je relativně snadneacute zajistit jejich autenticitu a jejich ohroženiacute lze zjistit pouhyacutem okem při prohliacutedce skladiště u digitaacutelniacutech dokumentů je obojiacute podstatně složitějšiacute stejně jako jejich zajištěniacute proti neopraacutevněneacutemu užitiacute Spraacuteva vlastniacutech digitaacutelniacutech dokumentů i souvisejiacuteciacutech metadat je složityacute a permanentniacute proces

33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Maacuteme-li hledat odpověď na otaacutezku proč je vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře finančně i personaacutelně tak naacuteročneacute že překračuje možnosti jednotlivyacutech instituciacute je třeba pochopit jeho zaacutekladniacute funkce V uacuteplnosti je mapuje (a do detailů rozviacutejiacute) referenčniacute model OAIS Digitaacutelniacute repozitaacuteř je definovaacuteno jako organizace kteraacute uchovaacutevaacute informace s ciacutelem jejich zpřiacutestupněniacute a využitiacute Nejde tedy o prostyacute sklad digitaacutelniacutech informaciacute ale o komplex funkciacute podobnyacute funkciacutem klasickeacute knihovny kteraacute ziacuteskaacutevaacute (přijiacutemaacute) dokumenty od jejich producentů zajišťuje jejich popis uloženiacute a spraacutevu ve skladišti a jejich zpřiacutestupněniacute uživatelům kteřiacute si mohou informace o dokumentech vyhledat prostřednictviacutem katalogů nebo portaacutelů a naacutesledně si je v knihovně vypůjčit

Digitaacutelniacute repozitaacuteř rovněž přijiacutemaacute dokumenty (digitaacutelniacute) od producentů zpravidla včetně dohodnutyacutech metadat (soubor informaciacute pro dodaacutevaacuteniacute) tzv SIP baliacuteček (viz text vyacuteše) Vyacutesledkem kontroly digitaacutelniacutech dokumentů a přiacuteslušnyacutech metadat a obohaceniacute metadat (zde nehovořiacuteme jen o metadatech popisnyacutech ale i administrativniacutech technickyacutech a ochrannyacutech) je soubor informaciacute pro archivaci ndash AIP baliacuteček při požadavku na zpřiacutestupněniacute informaciacute z repozitaacuteře je generovaacuten soubor informaciacute pro šiacuteřeniacute ndash DIP baliacuteček

34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE

Kriteria hodnoceniacute důvěryhodnosti digitaacutelniacuteho repozitaacuteře byla původně obsažena ve dvou zaacutekladniacutech materiaacutelech

bull Trusted Digital Repositories Attributes and Responsibilities (RLG OCLC 2002)

bull Trustworthy Repositories Audit amp Certification Criteria and Checklist (OCLC CRL 2007)

Staršiacute z obou dokumentů vydanyacute v roce 2002 definuje obecneacute vlastnosti důvěryhodneacuteho repozitaacuteře takto naacutesledovně gt důvěryhodnyacute repozitaacuteř musiacute

minus Přijmout odpovědnost za dlouhodobou peacuteči o svěřeneacute digitaacutelniacute dokumenty a za jejich zpřiacutestupněniacute současnyacutem i budouciacutem uživatelům

minus Organizačně zajistit dlouhodobou životnost nejen pro vlastniacute repozitaacuteř ale i pro svěřeneacute digitaacutelniacute informace

minus Prokaacutezat finančniacute zajištěniacute v současnosti i trvale udržitelnyacute rozvoj

minus Navrhnout systeacutem pro spraacutevu digitaacutelniacuteho repozitaacuteře v souladu s obecně platnyacutemi konvencemi a standardy v zaacutejmu zaručeniacute trvaleacute spraacutevy zpřiacutestupněniacute a zabezpečeniacute uloženyacutech digitaacutelniacutech dokumentů

minus Stanovit metodiku hodnoceniacute důvěryhodnosti systeacutemu

minus Jasně a srozumitelně prezentovat svoji odpovědnost za dlouhodobou ochranu a zpřiacutestupněniacute dokumentů uživatelům i subjektům ktereacute sveacute dokumenty v repozitaacuteři deponujiacute

minus Disponovat strategiiacute pracovniacutemi postupy a službami ktereacute umožňujiacute snadneacute hodnoceniacute a měřeniacute

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 12: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 12

Navazujiacuteciacute dokument Trustworthy Repositories Audit amp Certification Criteria and Checklist již představuje velmi detailniacute a propracovanyacute systeacutem kriteriiacute pro hodnoceniacute důvěryhodneacuteho repozitaacuteře ktereacute se rozpadaacute do třiacute hlavniacutech sekciacute

a) Organizace (řiacutezeniacute struktura udržitelnost finance)

b) Spraacuteva digitaacutelniacutech objektů

c) Technologie technickaacute infrastruktura bezpečnost

V jednotlivyacutech sekciacutech jsou sledovaacuteny okruhy v jejichž raacutemci je třeba zodpovědět poměrně konkreacutetniacute otaacutezky Z uvedeneacuteho vyacutečtu je zřejmeacute že pro vybudovaacuteniacute a provoz důvěryhodneacuteho repozitaacuteře zdaleka nestačiacute zakoupeniacute draheacuteho technickeacuteho a programoveacuteho vybaveniacute praacutevě naopak Jednaacute se o složityacute a dlouhodobyacute proces kteryacute musiacute byacutet řaacutedně zakotven ve strategickyacutech prioritaacutech i organizačniacute struktuře instituce kteraacute aspiruje na vybudovaacuteniacute a provoz důvěryhodneacuteho digitaacutelniacuteho repozitaacuteře Musiacute byacutet adekvaacutetně finančně a personaacutelně zajištěn nejen pro dobu vzniku repozitaacuteře a po kraacutetkou dobu po něm ale dlouhodobě Tvorba a provoz důvěryhodnyacutech digitaacutelniacutech repozitaacuteřů jsou po všech straacutenkaacutech natolik naleacutehaveacute a zaacuteroveň naacuteročneacute že přesahujiacute možnosti i těch největšiacutech instituciacute Proto se jednaacute o velkou vyacutezvu ke spolupraacuteci paměťovyacutech a vědeckovyacutezkumnyacutech instituciacute v naacuterodniacutem i mezinaacuterodniacutem kontextu

35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ

1) DRAMBORA (Digital Repository Audit Method Based on Risk Assessmentdagger)

l vytvořena ve spolupraacuteci Digital Curation Centre (DCC) a DigitalPreservationEurope (DPE)

l společneacute body s TRAC a Nestor (viz niacuteže)

l nemaacute za ciacutel udělit někomu certifikaacutet jde jen o naacutestroj pro samostatnyacute audit kteryacute si provede sama instituce

l v přiacutepadě zaacutejmu pak lze proveacutest naacuteslednou certifikaci zvenčiacute (např TRAC)

2) Trustworthy Repositories Audit amp Certification Criteria and Checklist (TRAC)Dagger

l zdůrazňuje best practice kriteacuteria pro důvěryhodneacute repozitaacuteře ve třech různyacutech oblastech

l bere OAIS za sveacute vyacutechodisko a vztažnyacute bod pro uacutespěšneacute porovnaacutevaacuteniacute

l aspiruje na to staacutet se standardem

l klade důraz na proces certifikace

l certifikace probiacutehaacute na objednaacutevku třetiacute nezaacutevislou stranou (auditorem)

l proces je placenyacute ndash zatiacutem probiacutehaacute pouze v USA

l ideaacutelniacute je navaacutezat na self audit (DRAMBORA)

STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů s 87

dagger httpwwwrepositoryauditeu

Dagger httpwwwcrleduPDFtracpdf

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 13: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 13

3) NESTOR Criteria Catalogue

l obsahuje 14 kriteacuteriiacute doplněnyacutech detailniacutem vysvětleniacutem a konkreacutetniacutemi přiacuteklady

l děliacute celou problematiku do skupin

minus organizačniacute raacutemec

minus object management

minus infrastruktura a zabezpečeniacute

l odraacutežiacute německyacute kontext (praacutevniacute finančniacute apod)

4) International Audit and Certification Birds of a Feather Groupdagger

l mezinaacuterodniacute snaha o vytvořeniacute ISO standardu podle ktereacuteho by se v budoucnu provaacuteděl kompletniacute audit a certifikace repozitaacuteře

l berou v potaz existujiacuteciacute naacutestroje (viz nahoře) a snažiacute se je racionalizovat do jednoho dokumentu nebo souboru propojenyacutech dokumentů (vytvaacuteřejiacute různaacute srovnaacuteniacute crosswalks apod)

l jsou otevřeniacute všem zaacutejemcům každyacute se může zuacutečastnit

Na zaacutekladě těchto naacutestrojů lze definovat deset zaacutekladniacutech principů důvěryhodnosti ktereacute jsou jakyacutemsi jejich průnikem Mohou byacutet prvotniacutem vyacutechodiskem jakyacutemsi bdquosamoodhademldquo předtiacutem než se opravdu přistoupiacute k serioacutezniacutemu auditu nebo procesu certifikaceDagger Těchto deset bodů můžeme považovat za desatero jakeacutehokoliv repozitaacuteře ktereacute chce byacutet považovaacuteno za důvěryhodneacute (jaro 2007) Takovyacute archiv

1 se musiacute zavaacutezat k neustaacuteleacutemu opatrovaacuteniacutespraacutevě digitaacutelniacutech objektů pro určitou ciacutelovou komunitu

2 musiacute prokaacutezat svou životaschopnostzpůsobilost (včetně financovaacuteniacute personaacutelniacutech otaacutezek struktury procesů) aby dostaacutel stanoveneacutemu zaacutevazku

3 musiacute si osvojit a dodržovat potřebnaacute smluvniacute a zaacutekonnaacute praacuteva a dostaacutet všem z nich plynouciacutem zaacutevazkům

4 musiacute miacutet efektivniacute a dostačujiacuteciacute raacutemcovou strategii

5 ziacuteskaacutevaacute a uklaacutedaacute digitaacutelniacute objekty na zaacutekladě stanovenyacutech kriteacuteriiacute ktereacute odpoviacutedajiacute ciacutelům a schopnostem instituce

6 neustaacutele udržujezajišťuje integritu autenticitu a využitelnost digitaacutelniacutech objektů ktereacute trvale uchovaacutevaacute

7 vytvaacuteřiacute a uchovaacutevaacute potřebnaacute metadata o udaacutelostech souvisejiacuteciacutech s uloženyacutemi digitaacutelniacutemi objekty v průběhu jejich uchovaacuteniacute jako i metadata o samotneacutem vytvořeniacute digitaacutelniacutech objektů podmiacutenkaacutech zpřiacutestupněniacute a kontextu využitiacute digitaacutelniacutech objektů

8 naplnit nezbytneacute požadavky na zpřiacutestupněniacute objektů ven z repozitaacuteře určiteacute komunitě

9 musiacute miacutet strategii pro plaacutenovaacuteniacute ochrany a souvisejiacuteciacutech procesů včetně zaacutechrannyacutech praciacute

10 musiacute miacutet technickou infrastrukturu adekvaacutetniacute pro uacutečel neustaacuteleacute uacutedržby a zajištěniacute digitaacutelniacutech objektů

httpedochu-berlindeseriesnestor-materialien8PDF8pdf

dagger wwwdigitalrepositoryauditandcertificationorg

Dagger Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 14: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 14

Pakliže je repozitaacuteř schopen

1) rozpoznat a priorizovat hrozby ktereacute ohrožujiacute jejich aktivity

2) vypořaacutedat se s hrozbami tak aby sniacutežily možnost jejich vyacuteskytu

3) stanovit nepředviacutedatelneacute udaacutelosti aby se sniacutežil efekt hrozby kterou představujiacute

je velmi pravděpodobně připraven obdržet status důvěryhodnosti

Důvěryhodnost je kliacutečovou vlastnostiacute kterou musiacute certifikovanyacute repozitaacuteř demonstrovat Digital preservation je v podstatě uvědomovaacuteniacute si organizačniacutech proceduraacutelniacutech technologickyacutech a jinyacutech nejistot a jejich přeměna zvladatelnaacute (řešitelnaacute) rizika Pro ziacuteskaacuteniacute takoveacute důvěryhodnosti maacute praacutevě napomoci nezaacutevislyacute audit

351 Kontext existujiacuteciacutech standardů

Všechny snahy o standardizaci procesu certifikace repozitaacuteřů berou v potaz již existujiacuteciacute standardy

l ISO 9000 (Quality assurance)

l ISO 17799 amp 27001 (Information security)

l ISO 15489 (Institutional Records Management)

l ISO 14721 (Reference Model for an Open Archival Information systeacutem)

l COBIT 41

36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA

Online naacutestroj DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) vznikl ve spolupraacuteci DCCdagger a projektu DPEDagger DRAMBORA nevznikla jako dalšiacute certifikačniacute naacutestroj ale jako naacutestroj kteryacute maacute pomoci instituci kteraacute plaacutenuje certifikaci sveacuteho repozitaacuteře Pomoci tiacutem že si instituce provede tzv self audit Může to udělat pracovniacutek teacute instituce musiacute ovšem byacutet s DRAMBOROU seznaacutemen Tento bdquosamoodhadldquo může do velkeacute miacutery sniacutežit naacuteklady na naacuteslednou externiacute certifikaci kteraacute je placenaacute (např pro TRAC se hovořiacute o desiacutetkaacutech tisiacutec dolarů) a takeacute což je hlavniacute ji může vyacuteznamně urychlit DRAMBORA je od jara 2008 dostupnaacute v podobě interaktivniacuteho naacutestroje kteryacute je přiacutestupnyacute online a umožniacute projiacutet všemi kroky auditu uklaacutedat hodnoty a vytvořit hodnoceniacutesect

DRAMBORA je myšlena jako naacutestroj pomociacute ktereacuteho může auditor odhadnout možnosti repozitaacuteře identifikovat jeho slabeacute straacutenky a rozpoznat jeho straacutenky silneacute Toto je důležiteacute zvlaacuteště v situaci kdy se o repozitaacuteřiacutech velmi mluviacute spousta instituciacute si je zřizuje ovšem zaacuteroveň jsou nynějšiacute repozitaacuteře a jejich vyacutevoj měřeno z hlediska lidskeacuteho věku někde před pubertou DRAMBORA je strukturovaacutena jako možnaacute odpověď nebo pomůcka pro dalšiacute vyacutevoj repozitaacuteřů a hlavně pro jejich funkčnost v nedalekeacute i dalekeacute budoucnosti Soustřeďuje se na nich velkaacute čaacutest našeho současneacuteho věděniacute je tedy nezbytně nutneacute toto věděniacute zachovat

361 Struktura celeacuteho procesu auditu

DRAMBORA maacute 6 faacuteziacute

1 identifikace vyacutechodisek (status kontext organizaceinstituce apod)

2 identifikace strategie a regulačniacuteho raacutemce (koncepce legislativa apod)

httpwwwrepositoryauditeu dagger httpwwwdccacuk Dagger httpwwwdigitalpreservationeuropeeu sect httpwwwrepositoryauditeu

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 15: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 15

3 identifikace aktivit a prostředků

4 identifikace hrozeb souvisejiacuteciacutech s aktivitami a prostředky

5 vyhodnoceniacute hrozeb

6 zvlaacutednutiacute hrozeb

Vyacutehoda naacutestroje DRAMBORA je i v tom že se audit může po určiteacute době opakovat To je velmi dobreacute v tom přiacutepadě že instituce si udělaacute prvniacute audit sveacuteho repozitaacuteře odhaliacute jeho slabiny ohodnotiacute hrozby jejich možneacute naacutesledky a přijme opatřeniacute typu bdquozlepšit to a ono do dvou měsiacutecůldquo a poteacute za ty dva měsiacutece může nechat repozitaacuteř projiacutet znovu celyacutem procesem a vyacutesledky obou auditů porovnat

362 Vyacutestup z celeacuteho DRAMBORA auditu a jeho vyacutehody

Vyacutestupem je mimo jineacute zvyacutešenaacute znalost o chodu repozitaacuteře struktuře procesů v něm daacutele seznam hrozeb ktereacute repozitaacuteři hroziacute Zaacuteležiacute na auditorovi jak podrobnyacute tento seznam bude a takeacute na instituci jak kvalitniacute podklady a podporu auditorovi poskytne což může ovlivnit jeho pochopeniacute celeacuteho chodu repozitaacuteře potažmo instituce

Provozovatel repozitaacuteře ziacuteskaacute ucelenyacute pohled na všechny procesy ktereacute majiacute s repozitaacuteřem souvislost a to ve formě bodovyacutech skoacutere Ukaacutežiacute se tak silneacute a naopak nejslabšiacute oblasti ktereacute mohou znamenat hrozbu Někdy vyacutesledky mohou byacutet překvapiveacute velmi často se za nejrizikovějšiacute oblast považujiacute technologie ovšem daleko většiacute riziko může byacutet v nedostatečně zvlaacutednuteacutem a nejisteacutem financovaacuteniacute repozitaacuteře nebo instituce kteraacute jej provozuje nebo takeacute např v personaacutelniacutech otaacutezkaacutech (nedostatek odborniacuteků diacuteky niacutezkyacutem platům apod) To jsou věci ktereacute mohou potenciaacutelně ochromit chod celeacuteho systeacutemu stejně fataacutelně jako technickaacute zaacutevada

Vyacutestupem ale bude takeacute připravenost na kompletniacute externiacute audit (certifikaci) Důvodem proč by instituce mohla chtiacutet dělat interniacute audit může byacutet i pouheacute ověřeniacute zda všechny procesy a celkovaacute strategie jsou nastaveny dobře a systeacutem pracuje optimaacutelně

4 ZAacuteVĚR

Jak je patrneacute z textu je problematika uchovaacutevaacuteniacute a s tiacutem spojeneacute ochrany digitaacutelniacutech informaciacute velmi aktuaacutelniacute a živaacute Je to zapřiacutečiněno mj i tiacutem že instituce již čeliacute probleacutemům vyplyacutevajiacuteciacutem z použiacutevaacuteniacute digitaacutelniacutech informaciacute (objektů) Paradoxniacute je že většina uživatelů těchto informaciacute v digitaacutelniacute podobě vidiacute pouze jejich vyacutehody a nemaacute tušeniacute o vznikajiacuteciacutech hrozbaacutech a komplikaciacutech Alarmujiacuteciacute je že se podobně chovajiacute i někteřiacute producenti i instituce ktereacute digitaacutelniacute informace použiacutevajiacute To by se mělo diacuteky naacutestrojům koncepciacutem nebo i auditům velmi rychle změnit Můžeme řiacuteci že dnes se přesouvaacute těžiště od problematiky bdquojak vytvaacuteřet digitaacutelniacute informaceldquo ke stupni bdquojak digitaacutelniacute informace uchovaacutevat v dlouhodobeacutem časoveacutem horizontuldquo

Že jde o problematiku dneška doklaacutedaacute stoupajiacuteciacute počet naacuterodniacutech i mezinaacuterodniacutech aktivit konferenciacute odbornyacutech publikaciacute apod Může naacutes těšit že Českaacute republika neniacute tentokraacutet pozadu a je od počaacutetku součaacutestiacute těchto snah

5 POUŽITAacute LITERATURA

1 American Library Asociation Definitions of Digital Preservation [online] Washington American Library Asociation c2008 September 11 2008 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwalaorgalamgrpsdivsalctsresourcespreservdefdigpres0408cfmgt

2 CARPENTER Leona Repositories in Context Digital Repositories as components of an integrated infrastructure for education [online] UKOLN 2005 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwukolnacukeventsdelos-rep-workshoppresentationscarpenterpptgt

3 Catalogue of Criteria for Trusted Digital Repositories Version 1 Goettingen Nestor Working Group 2006 48 s Přiacutestup z WWW lthttpedochu-berlindeseriesnestor-materialien8PDF8pdfgt

4 CCSDS 6500-B-1 Reference Model for an Open Archival Information System (OAIS) Blue Book Issue 1 January 2002 148 s Přiacutestup z WWW lthttpnostgsfcnasagovwwwclassicdocumentspdfCCSDS-6500-B-1pdfgt

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 16: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 16

5 Digital Curation Centre and DigitalPreservationEurope DCC and DPE Repository Audit Method Based on Risk Assesment v 10 Glasgow DPE 2007 Přiacutestup z WWW lthttpwwwrepositoryauditeugt

6 GIARETTA David ISOCCSDS Open Archival Information System (OAIS) Reference Model [online] [sl] [sn] [sa] [cit 2007-11-18] Přiacutestup z WWW lthttpwwwsstdrlacukccsdsp2isoasbnsc97oais1OAIS1PPTgt

7 KOumlNIGOVAacute Marie Vybraneacute kapitoly z informačniacute vědy In Informačniacute studia a knihovnictviacute v elektronickyacutech textech [elektronickyacute zdroj] I Praha UISK 2002

8 LAVOIE Brian F The Open Archival Information System Reference Model Introductory Guide DPC and OCLC Online January 2004 20 s DPC Technology Watch Series Report 04-01 Přiacutestup z WWW lthttpwwwdpconlineorgdocslavoie_OAISpdfgt

9 The Orange Book Management of Risk - Principles and Concepts Norwich HM Treasury 2004 58 s Přiacutestupneacute z WWW lthttpwwwhm-treasurygovukmediaFE660FE66035B-BCDC-D4B3-11057A7707D2521Fpdfgt

10 Preservation Metadata and the OAIS Information Model A Metadata Framework to Support the Preservation of Digital Objects A Report by The OCLCRLG Working Group on Preservation Metadata OCLC 2002 54 s Přiacutestup z WWW lthttpwwwoclcorgresearchprojectspmwgpm_frameworkpdfgt

11 SAWYER Don REICH Lou ISO ldquoReference Model For an Open Archival Information System (OAIS)rdquo [online] Tutorial Presentation Library of Congress June 13 2003 [cit 2007-11-18] Přiacutestup z WWW lthttpnostgsfcnasagovisoaspresentationsoais_tutorial_200306pptgt

12 STOKLASOVAacute Bohdana Dlouhodobeacute uchovaacutevaacuteniacute dokumentů v českyacutech knihovnaacutech [online] ISSS 2007 Hradec Kraacuteloveacute 24 2007 [cit 2007-11-18] Přiacutestup z WWW lthttpwwwndkczpublikaceisss-2007nkcrstoklasovapptgt

13 STOKLASOVAacute Bohdana HUTAŘ Jan Noveacute směry v dlouhodobeacutem uchovaacutevaacuteniacute dokumentů v mezinaacuterodniacutem kontextu In Automatizace knihovnickyacutech procesů 11 Liberec 16-1752007 Praha ČVUT 2007 136 s ISBN 978-80-01-03691-4

14 Trustworthy Repositories Audit amp Certification Criteria and Checklist Dublin OH OCLC CRL 2007 94 s Přiacutestup z WWW lt httpwwwcrleduPDFtracpdfgt

6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY

- DigitalPreservationEurope

httpwwwdigitalpreservationeuropeeuregistries

- CASPAR

Cultural Artistic and Scientific knowledge for Preservation Access and Retrieval httpwwwcasparpreserveseu

- Planets

Preservation and Long-term Access through Networked Services httpplanets-projecteu

- Nestor

httpnestorsubuni-goettingende

- DCC

Digital Curation Centre httpwwwdccacuk

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY
Page 17: Jan Hutař Úvod do ochrany digitálních dat

Jan Hutař Uacutevod do ochrany diditaacutelniacutech dat 17

- DPC

Digital Preservation Coalition httpwwwdpconlineorg

Slovniacutek terminologie httpwwwdpconlineorggraphicsintrodefinitionshtml

- DRAMBORA

Digital Repository Audit Method Based on Risk Assessment httpwwwrepositoryauditeu

- NDIIPP

National Digital Information Infrastructure and Preservation Program httpwwwdigitalpreservationgov

- NDK

Naacuterodniacute digitaacutelniacute knihovna httpwwwndkcz

  • 1 UacuteVOD
  • 2 DIGITAacuteLNIacute REPOZITAacuteŘ
    • 21 DEFINICE DIGITAacuteLNIacuteHO REPOZITAacuteŘE A JEHO TYPY
    • 22 REFERENČNIacute MODEL OAIS - OPEN ARCHIVAL INFORMATION SYSTEM
    • 23 POJETIacute INFORMACE V REFERENČNIacuteM RAacuteMCI OAISDagger
    • 24 K PŘIPOMENUTIacute
      • 3 CERTIFIKOVANYacute DŮVĚRYHODNYacute DIGITAacuteLNIacute REPOZITAacuteŘ
        • 31 PROBLEacuteMY S DLOUHODOBOU ARCHIVACIacute DIGITAacuteLNIacuteCH OBJEKTŮsect
        • 32 EMULACE A MIGRACE
        • 33 ZAacuteKLADNIacute FUNKCE DŮVĚRYHODNEacuteHO DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 34 KRITERIA HODNOCENIacute DŮVĚRYHODNOSTI DIGITAacuteLNIacuteHO REPOZITAacuteŘE
        • 35 SOUČASNEacute NAacuteSTROJE NA CERTIFIKACI A AUDIT DŮVĚRYHODNYacuteCH DIGITAacuteLNIacuteCH REPOZITAacuteŘŮ
        • 36 SELF AUDIT POMOCIacute NAacuteSTROJE DRAMBORA
          • 4 ZAacuteVĚR
          • 5 POUŽITAacute LITERATURA
          • 6 RELEVANTNIacute PROJEKTY A JEJICH WEBOVEacute STRAacuteNKY