2
brieng paper Problémy ochrany digitálnych audiovizuálnych dokumentov V európskych AV zbierkach (v archívoch alebo iných inštitúciach) je podľa odhadov okolo 50 miliónov hodín zvukových dokumentov, filmov a videa, prevážne v analógových formátoch. Kvôli zhoršovaniu kvality médií a zastarávaniu formátov je dnes ohrozených asi 70 percent týchto dokumentov a do 30 rokov budú ohrozené všetky. Veľké digitalizačné programy už začali; odhaduje sa, že v poslednom desaťročí sa v Európe zdigitalizovalo okolo 10 miliónov AV materiálu. A zatiaľčo sa správci AV zbierok snažili rýchlo vymeniť pásky a gramofónové platne za počítačové súbory, aby zachránili obsah, okolitý svet si začal uvedomovať, že vyvstáva nový problém: dlhodobá ochrana digitálnych dát. Technické problémy spojené so správou a prevádzkou rozsiahlych digitálnych súborov je možné riešiť pomocou nástrojov digitálnych knižníc. O súbory sa ale musíme starať. Je potrebné ich pomenúvať, presúvať do nových úložišť (a často!), kopírovať za účelmi sprístupňovania, zakódovávať podľa meniacich sa podmienok zverejňovania a kontrolovať z hľadiska platnosti (validity). Digitálne objekty musia mať metadáta. Tie možno získať katalogizáciou alebo automatickým zberom (metadáta sú potrebné k zabezpečeniu globálnej dostupnosti digitálnych objektov v štandardizovaných systémoch). Akonáhle zbierky dosiahnu určitej veľkosti, je prakticky nemožné ich udržiavať manuálne. Pre automatické vytváranie, údržbu a správu prístupových oprávnení veľkých zbierok digitálnych objektov sú k dispozícii nástroje technológií digitálnych knižníc, ku ktorým existuje množstvo materiálov. Dva svety: Technológie digitálnych knižníc sa najviac rozšírili v akademickom svete. AV zbierky sa však vo veľkej miere nachádzajú mimo túto sféru. Najčastejšími držiteľmi AV obsahu sú televízni a rozhlasoví vysielatelia. Veľké zbierky sa nachádzajú i v múzeach filmu či podobných kultúrnych inšitúciach (jednou z najväčších filmových zbierok v Spojenom kráľovstve je "Imperial War Museum"). Vysielatielia sú rôznorodí, avšak ich počítačoví a technickí experti, ako aj manažment rozhodujúci o technologických otázkach a zabezpečujúci financie nevie nič o akademických knižniciach a technológiach digitálnych knižníc. Pre dlhodobú ochranu AV súborov je predovšetkým potrebné poznať, používať a rozumieť dostupným nástrojom pre správu digitálnych knižníc, ktoré dokážu štruktúrovane organizovať súbory. Za druhé je potrebné si uvedomiť, že digitálne knižnice sú nástrojmi pre správu digitálnych objektov (t.j. zabezpečujú, aby súbory boli dostupné a nestratili sa), ale neriešia problém dlhodobej ochrany týchto objektov. Zastarávaním digitálnych súborov sa zaoberajú technológie dlhodobej ochrany digitálnych dokumentov. Súbory v zastaralých formátoch je možné previesť do nových štandardov a formátov; funkčnosť zastaralých softvérových a hardvérových technológií je možné predĺžiť emuláciou. Boli vypracované kritéria hodnotenia spoľahlivosti digitálnych repozitárov i obecná metodika dlhodobej ochrany digitálnych dát (OAIS). V IT oddeleniach správy AV zbierok ťažko nájdeme niekoho, kto počul o modeli OAIS. To do značnej miery sťažuje financovanie a implementáciu ochrany digitálnych AV dokumentov. Našťastie je tu európsky projekt MEMORIES, ktorý prispôsobuje model OAIS a podobné techniky špecifickému prostrediu AV zbierok. Za tretie je potrebné si uvedomiť, že špecifické požiadavky na prácu s AV súbormi nie sú plne podporované technológiami digitálnych knižníc a nástrojmi na ochranu digitálnych dokumentov, ako je ďalej v texte podrobnejšie uvedené. Dlhodobá ochrana digitálneho audiovizuálneho obsahu Audiovizuálne (AV) záznamy 20. storočia sú ohrozené a ich digitalizácia je riešením, ktoré so sebou prináša nový problém: ako dlhodobo chrániť digitálne AV dokumenty. Súčasné technológie totiž neponúkajú adekvátne riešenie ochrany súborov s AV obsahom. Je síce možné sa inšpirovať príkladmi dobrej praxe v oblasti dlhodobej ochrany digitálnych dát, ale je potrebné si uvedomiť tri veci: 1, AV zbierky by mali využívať súčasné technológie pre digitálne knižnice a ochranu digitálnych dokumentov; 2, technológie podporujúce multimédiá je potrebné ďalej vylepšovať; 3, technológie skladovania dát a informačných technológií vo všeobecnosti by mali časom lepšie vyhovovať nárokom AV súborov.

Dlhodobá ochrana digitálnehoaudiovizuálneho obsahu

Embed Size (px)

DESCRIPTION

Audiovizuálne (AV) záznamy 20. storočia sú ohrozené a ich digitalizácia je riešením, ktoré so sebou prináša nový problém: ako dlhodobo chrániť digitálne AV dokumenty. Súčasné technológie totiž neponúkajú adekvátne riešenie ochrany súborov s AV obsahom. Je síce možné sa inšpirovať príkladmi dobrej praxe v oblasti dlhodobej ochrany digitálnych dát, ale je potrebné si uvedomiť tri veci: 1, AV zbierky by mali využívať súčasné technológie pre digitálne knižnice a ochranu digitálnych dokumentov; 2, technológie podporujúce multimédiá je potrebné ďalej vylepšovať; 3, technológie skladovania dát a informačných technológií vo všeobecnosti by mali časom lepšie vyhovovať nárokom AV súborov.

Citation preview

Page 1: Dlhodobá ochrana digitálnehoaudiovizuálneho obsahu

briefing paper

Problémy ochrany digitálnych audiovizuálnych dokumentov V európskych AV zbierkach (v archívoch alebo iných inštitúciach) je podľa odhadov okolo 50 miliónov hodín zvukových dokumentov, filmov a videa, prevážne v analógových formátoch. Kvôli zhoršovaniu kvality médií a zastarávaniu formátov je dnes ohrozených asi 70 percent týchto dokumentov a do 30 rokov budú ohrozené všetky. Veľké digitalizačné programy už začali; odhaduje sa, že v poslednom desaťročí sa v Európe zdigitalizovalo okolo 10 miliónov AV materiálu. A zatiaľčo sa správci AV zbierok snažili rýchlo vymeniť pásky a gramofónové platne za počítačové súbory, aby zachránili obsah, okolitý svet si začal uvedomovať, že vyvstáva nový problém: dlhodobá ochrana digitálnych dát. Technické problémy spojené so správou a prevádzkou rozsiahlych digitálnych súborov je možné riešiť pomocou nástrojov digitálnych knižníc. O súbory sa ale musíme starať. Je potrebné ich pomenúvať, presúvať do nových úložišť (a často!), kopírovať za účelmi sprístupňovania, zakódovávať podľa meniacich sa podmienok zverejňovania a kontrolovať z hľadiska platnosti (validity). Digitálne objekty musia mať metadáta. Tie možno získať katalogizáciou alebo automatickým zberom (metadáta sú potrebné k zabezpečeniu globálnej dostupnosti digitálnych objektov v štandardizovaných systémoch). Akonáhle zbierky dosiahnu určitej veľkosti, je prakticky nemožné ich udržiavať manuálne. Pre automatické vytváranie, údržbu a správu prístupových oprávnení veľkých zbierok digitálnych objektov sú k dispozícii nástroje technológií digitálnych knižníc, ku ktorým existuje množstvo materiálov. Dva svety: Technológie digitálnych knižníc sa najviac rozšírili v akademickom svete. AV zbierky sa však vo veľkej miere nachádzajú mimo túto sféru. Najčastejšími držiteľmi AV obsahu sú televízni a rozhlasoví vysielatelia. Veľké zbierky sa nachádzajú i v múzeach filmu či podobných kultúrnych inšitúciach (jednou z najväčších filmových zbierok v Spojenom kráľovstve je "Imperial War Museum"). Vysielatielia sú rôznorodí, avšak ich počítačoví a technickí experti, ako aj manažment rozhodujúci o technologických otázkach a zabezpečujúci financie nevie nič o akademických knižniciach a technológiach digitálnych knižníc. Pre dlhodobú ochranu AV súborov je predovšetkým potrebné poznať, používať a rozumieť dostupným nástrojom pre správu digitálnych knižníc, ktoré dokážu štruktúrovane organizovať súbory. Za druhé je potrebné si uvedomiť, že digitálne knižnice sú nástrojmi pre správu digitálnych objektov (t.j. zabezpečujú, aby súbory boli dostupné a nestratili sa), ale neriešia problém dlhodobej ochrany týchto objektov. Zastarávaním digitálnych súborov sa zaoberajú technológie dlhodobej ochrany digitálnych dokumentov. Súbory v zastaralých formátoch je možné previesť do nových štandardov a formátov; funkčnosť zastaralých softvérových a hardvérových technológií je možné predĺžiť emuláciou. Boli vypracované kritéria hodnotenia spoľahlivosti digitálnych repozitárov i obecná metodika dlhodobej ochrany digitálnych dát (OAIS). V IT oddeleniach správy AV zbierok ťažko nájdeme niekoho, kto počul o modeli OAIS. To do značnej miery sťažuje financovanie a implementáciu ochrany digitálnych AV dokumentov. Našťastie je tu európsky projekt MEMORIES, ktorý prispôsobuje model OAIS a podobné techniky špecifickému prostrediu AV zbierok. Za tretie je potrebné si uvedomiť, že špecifické požiadavky na prácu s AV súbormi nie sú plne podporované technológiami digitálnych knižníc a nástrojmi na ochranu digitálnych dokumentov, ako je ďalej v texte podrobnejšie uvedené.

Dlhodobá ochrana digitálneho audiovizuálneho obsahu Audiovizuálne (AV) záznamy 20. storočia sú ohrozené a ich digitalizácia je riešením, ktoré so sebou prináša nový problém: ako dlhodobo chrániť digitálne AV dokumenty. Súčasné technológie totiž neponúkajú adekvátne riešenie ochrany súborov s AV obsahom. Je síce možné sa inšpirovať príkladmi dobrej praxe v oblasti dlhodobej ochrany digitálnych dát, ale je potrebné si uvedomiť tri veci: 1, AV zbierky by mali využívať súčasné technológie pre digitálne knižnice a ochranu digitálnych dokumentov; 2, technológie podporujúce multimédiá je potrebné ďalej vylepšovať; 3, technológie skladovania dát a informačných technológií vo všeobecnosti by mali časom lepšie vyhovovať nárokom AV súborov.

Page 2: Dlhodobá ochrana digitálnehoaudiovizuálneho obsahu

Autor: Micha Richard Wright, Research and Innovation, BBC, [email protected] Preklad: Andrea Fojtů, Ústav výpočetní techniky UK (ÚVT UK)

brie

fing

pap

er

Špecifické problémy digitálnych audiovizuálnych dát a súborov Vzhľadom k uvedenej existencii "dvoch svetov" nie sú profesionálne vysielacie formáty (MXF) obvykle podporované nástrojmi ochrany digitálnych dokumentov a príslušnými riešeniami digitálnych knižníc. Ostatné "štandardné" formáty sú lepšie podporované, no i tak mnohé z nich (napr. AVI, WMV) sú proprietárnymi formátmi, ktoré sami o sebe predstavujú problém s uchovávaním. Ďalšie problémy sa týkajú konkrétneho obsahu súborov: Väčšina AV súborov je komprimovaná. To, čo sa stratilo z "pôvodnej kvality"

počas kompresie, bude už navždy stratené. Procesy ochrany by mali dbať na zachovanie čo najvyššej kvality. Ide o vlastnosť, ktorú bude potrebné definovať a implementovať do súčasných technológií.

Obsah viazaný na časové rozloženie potrebuje nástroje s časovou dimenziou (katalogizácia, navigácia, editácia).

AV súbory predstavujú komplexné súbory. Koncept "obalu" (wrapper) bol vyvinutý práve na rozpoznanie komplexnosti typického AV súboru: mnohonásobné signály, zložitejšie typy metadát - včítane tých časopriestorových (titulky) a číselných (časový kód).

Uchovávanie AV dát sa týka mnohých typov súborov: bezstratovo a stratovo kódovaných, rôznych foriem proxy prístupu (podpora prístupu v rôznych formátoch, napr. Real, Windows Media, MPEG, AVI, QuickTime, Flash), súborov v r_ôznych fázach editácie a nových kombinácií. Uchovávanie sa týka tiež celej škály právnych aspektov: mnoho zainteresovaných strán i správcov zbierok, nejednotnosť noriem v rôznych krajinách. Je teda nutné uchovávať komplexné informácie o AV - signál, metadáta a pridružené právne dáta.

. Prístup V knižniciach existuje tradícia jednotného prístupu; súborné katalógy založené na štandardizovaných metadátach sprístupňujú "akúkoľvek knihu odkiaľkoľvek". Avšak mnoho AV zbierok je tradične uzatvorených alebo prístupných len odborníkom či za obchodnými účelmi. Digitálne knižnice pokračujú v tradícii rozšíreného a jednotného prístupu, často na národnej a medzinárodnej úrovni, podobne ako v prípade Európskej digitálnej knižnice (EDL). Aby mohli byť AV zbierky prístupné prostredníctvom veľkých projektov typu EDL, nevyhnutne potrebujú technológie digitálnych knižníc. Na druhej strane musia tieto digitálne knižnice vynaložiť viac úsilia k pochopeniu vyššie uvedených problémov digitálnych audiovizuálnych dát a súborov. Digitálne knižnice potrebujú najmä nástroje na časovo štruktúrovaný prístup ako k AV signálu, tak i ku metadátam (napr. rozsah práv v rámci jediného AV súboru sa môže každú minútu meniť). Držiteľmi väčšiny AV obsahu sú inštitúcie, ktoré v minulosti nespolupracovali so žiadnymi knižnicami a ktoré m_ožu preferovať obmedzený prístup ku "svojmu" obsahu. Marketing, ochrana značky a právne otázky bránia vytvoreniu "Európskeho audiovizuálneho portálu". EDL možno nikdy nebude obsahovať záznam vysielania BBC.

Čo robiť Aj napriek vyššie uvedeným problémom je možné stanoviť niekoľko základných odporúčaní pre uchovávanie AV obsahu: Uchovávajte artefakt: uchovávajte "originál", aj keď je v komprimovanej

podobe. Uchovávajte bity, nech sa deje čokoľvek. AV obsah má jednu výhodu: existuje v relatívne v malom množstve formátov. Do budúcna môžu existovať technológie pre prehrávanie bitov.

Dekódujte AV obsah do nekomprimovanej podoby a aj uchovávajte ho v nekomprimovanej forme (zároveň s originálom). V prípade videa je to náročná požiadavka (100GB/hodina na TV obraz o 625 riadkoch), no úložné zariadenia sú v súčasnosti veľmi lacné.

Vylepšite metadáta. Nestačí len zaznamenať príponu súborov (napr. wav, avi). Existuje viac ako 50 registrovaných viariant kódovania v rámci definície formátu wav. Koncovku mpg používajú formáty MPEG-1 a MPEG-2. V ideálnom prípade bude k dispozícii nástroj pre extrakciu metadát.

Nie ste sami: používajte registre formátov súborov, softvérové repozitáre, nástroje na emuláciu a smernice pre uchovávanie (uvedené v citovaných odkazoch).

Referencie a ďalšie informácie Prieskumy súčasného stavu v oblasti AV zbierok:

PRESTO: http://presto.joanneum.ac.at PrestoSPACE: http://www.prestospace.eu

TAPE: http://www.tape-online.net/survey.html http://www.tapeonline.

net/docs/audiovisual_research_collections.pdf

Všeobecné rady pre dlhodobé uchovávanie: http://www.bbcarchive.org.uk/

http://digitalpreservation.ssl.co.uk/

Zoznam nástrojov na dlhodobú ochranu: http://twiki.dcc.rl.ac.uk/bin/view/Main/

DevelopmentToolList JHOVE: http://hul.harvard.edu/jhove/

DROID: http://droid.sourceforge.net/wiki/index.php/

Úvod do PRONOM:

http://www.nationalarchives.gov.uk/pronom

Extraktor metadát Národnej knižnice Nového Zélandu:

http://meta-extractor.sourceforge.net/ OAI: http://www.openarchives.org/OAI/

openarchivesprotocol.html

OAIS: http://www.dpconline.org/docs/lavoie_OAIS.pdf

Migrácia

http://www.library.cornell.edu/iris/migration/

Emulácia http://www.dlib.org/dlib/october00/granger/

10granger.html

Referenčná príručka kritérií hodnotenia repozitárov

http://journals.tdl.org/jodi/article/view/199/180

Projekty a iniciatívy MEMORIES:

http://www.memories-project.eu/ European Digital Library:

http://www.europeana.eu/

Formáty MXF:

http://www.digitalpreservation.gov/formats/fdd/ fdd000013.shtml

WAV format specification: http://www.digitalpreservation.gov/formats/fdd/

fdd000001.shtml

Prezentácie Video Formatting and Preservation, Carl

Fleischhauer, NDIIPP DLF Forum, Philadelphia, 6 November 2007

http://www.diglib.org/forums/fall2007/presentations/ Fleischhauer.pdf