28
Modul 3: Služby Ochrana knihovních fondů – Digitalizace a dlouhodobá ochrana digitálních dokumentů Tento projekt je financován z Evropského sociálního fondu prostřednictvím Operačního programu Lidské zdroje a zaměstnanost a ze státního rozpočtu ČR. Název projektu: Zvýšení adaptability zaměstnanců organizací působících v sekci kultura Název kurzu: Seminář pro knihovníky a informační pracovníky – Inovační knihovnický kurz

Digitalizace a dlouhodobá ochrana digitálních dokumentů

Embed Size (px)

DESCRIPTION

Digitalizace, digitální dokument Digitalizační workflow, Formáty dat a metadat, identifikátory, Problematika dlouhodobého uchování digitálních dokumentů

Citation preview

Page 1: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Modul 3: SlužbyOchrana knihovních fondů

– Digitalizace a dlouhodobá ochrana digitálních dokumentů

Tento projekt je financován z Evropského sociálního fondu prostřednictvím Operačního programu Lidské zdroje a zaměstnanost a ze státního rozpočtu ČR.

Název projektu: Zvýšení adaptability zaměstnanců organizací působících v sekci kulturaNázev kurzu: Seminář pro knihovníky a informační pracovníky –

Inovační knihovnický kurz

Page 2: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Digitalizace a dlouhodobá ochrana digitálních dokumentů

Mgr. Pavla ŠvástováMoravská zemská knihovna

25.5.2011 Inovační knihovnický kurz, Brno

Page 3: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Obsah

● Digitalizace, digitální dokument● Digitalizační workflow● Formáty dat a metadat, identifikátory● Problematika dlouhodobého uchování

digitálních dokumentů

Page 4: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Digitalizace

● převod fyzického dokumentu do digitální podoby

● jedna z metod ochrany knihovního fondu● cesta ke zpřístupnění kulturního dědictví

široké veřejnosti● projekty v ČR

○ VISK6 Manuscriptorium a VISK7 Kramerius○ Národní digitální knihovna, Norské fondy○ Europeana Travel, GoogleBooks○ WebArchiv

Page 5: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

http://www.manuscriptorium.com

Page 6: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

http://kramerius.nkp.cz

Page 7: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

http://kramerius4.mzk.cz

Page 8: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

http://www.europeana.eu

Page 9: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

http://books.google.com/books

Page 10: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Vlastnosti digitálního dokumentu

● čím se liší od fyzického dokumentu?● obsahové vlastnosti jsou stejné!● formální vlastnosti se liší! ● digitální forma uložení – bit stream● nezávislost na nosiči● pro jeho zpracování a zobrazení potřebujeme počítač● lze donekonečna kopírovat beze změny kvality

(vznikají další originály)● nové vlastnosti? lepší prohledávání, možnosti

popisu...

Page 11: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Co vzít v potaz, než začnu digitalizovat?

● co chci digitalizovat?○ knihy, periodika, diplomové práce, grafiky, mapy, 3D

objekty, obrazy, zvuk, video● proč chci digitalizovat?

○ archivace a zpřístupnění poškozených nebo vzácných dokumentů, nedostupných nebo hodně využívaných dokumentů...

● jak chci digitalizovat?● náklady na digitalizaci, výrobu metadat,

archivaci, nákup HW a SW

Page 12: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

● neustálý vývoj hardware○ počítat s novými typy zařízení (e-readery,

SmartPhone, tablety apod.)○ ceny jdou dolů

● neustálý vývoj software○ používat pouze rozšířené a standardizované formáty

dat a metadat○ hlídat zastarávájící data

● ?

Co vzít v potaz, než začnu digitalizovat?

Page 13: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Digitalizační workflow

Page 14: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Digitalizační workflow

● proces výroby digitálního dokumentu, jeho zpracování, archivace a zpřístupnění

● příprava dokumentů ● skenování● úprava obrazu● výroba metadat a OCR● archivace● zpřístupnění

Page 15: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Příprava dokumentů před skenováním

● vyhledání nejkvalitnější předlohy● kompletace dokumentu (periodika)● katalogizace a přidělení identifikátorů● restaurování poškozených dokumentů● analýza stavu dokumentu, vybrání vhodné

techniky skenování● příprava pracoviště (optimální a rovnoměrné

nasvícení)

Page 16: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Skenování aneb jak vyrobit obrázky?

● černobílé? škála šedi? barva?● rozlišení (300-600 DPI)● velikost obrázku (MB)● (stránka monografie A5 x nejkvalitněji

naskenovaná mapa)● v jakém formátu uložit dokument? které

formáty se hodí pro dlouhodobou ochranu? (tiff, jp2, jpg, djvu)

● kompletnost dokumentu (kontrola kvality)● systém ukládání (adresářová struktura)

Page 17: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Zpracování obrazu

● ořez● narovnání● barevná škála a kalibrace● výroba náhledů z originálního obrázku● konverze do různých formátů (z tiff do jp2)

Page 18: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Výroba OCR

● optical character recognition● převod obrazového textu do počítačem

čitelné podoby● FineReader● kvalita OCR● opravy OCR?

○ kolaborativni opravy (Národní australská knihovna), http://trove.nla.gov.au/newspaper

○ projekt IMPACT, http://www.impact-project.eu/

Page 19: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Jak obrázky popsat aneb výroba metadat

● identifikátory○ čísla z knihovního katalogu = provázání s fyzickou

jednotkou (systémové číslo, signatura, čárový kód, ČNB, evidenční číslo)

○ identifikace celého dokumentu, ročníku novin, kapitoly knihy, každé stránky

● metadata○ data, která uchovávájí informace o vzniku dokumentu,

o jeho vlastnostech, struktuře atd.

Page 20: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Metadata I.

● deskriptivní (=popisná)○ obdobná těm z knihovního katalogu (autor, název...)○ jediné popisují obsah dokumentu○ MODS, DC, MARCXML

● strukturální○ jak je dokument poskládán? ○ jak jdou stránky po sobě? jaká jsou jejich fyzická a

logická čísla?○ periodikum-ročník-číslo-článek○ provázání různých kvalit téhož obrázku○ METS, FOXML

Page 21: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Metadata II.

● technická● jaká je kvalita a velikost obrázků● na jakém přístroji byly obrázky vyrobeny?● kdy byly snímky pořízeny● formát obrázků● MIX, ALTO

● administrativní● kdo je vlastníkem dokumentu?● komu je možné dokument zpřístupnit a za jakých

podmínek?● zaznamenán životní cyklus dokumentu● PREMIS

Page 22: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Zpřístupnění digitálních dokumentů

● vystavení dokumentů online ○ v digitální knihovně ke čtení○ ke stažení (e-books)○ uložení na digitální nosič

● myslet na autorský zákon!● uživatelská přívětivost prostředí● dáváme dokumentům přidanou hodnotu (2.0

služby)

Page 23: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Archivace digitálních dokumentů

● archivuje se nejlepší kvalita obrázku a veškerá příslušející metadata

● uložení na disky (operativnější a rychlejší) nebo na pásky (pomalejší, ale bezpečnější)

● zálohování!● kontrola přístupů● LTP systémy

Page 24: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

● dlouhodobá?○ 5 let? 100 let? trvale?○ účel – dokdy má dokument význam pro uživatele○ počítat s neustálým vývojem software a hardware○ sledovat formáty dat a metadat○ dodržovat kompatibilitu

● neustálé sledování trendů vývoje informačních technologií a budování strategií, které se se změnami dokáží vyrovnat

Dlohodobá ochrana digitálních dat???

Page 25: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

● co chráníme? ○ informaci, vložené finance, kulturní dědictví...○ ochrana bit streamu X ochrana logiky dokumentu

● proč?○ srozumitelnost○ použitelnost○ vyhledatelnost○ dostupnost v budoucnu

● jak?○ potřebujeme plán!○ vše evidovat, ukládat kontrolní součy apod.○ dodržovat standardy, OAIS

Dlohodobá ochrana digitálních dat???

Page 26: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Dlohodobá ochrana digitálních dat

● identifikace (co to je za formát?) a validace (opravdu je to ten formát) – jsou všechny soubory standardní?

● kontrolní součty (při přesunech a kopírování)● kapacita – máme místo na discích na archivní

data, data pro zpřístupnění a jejich zálohy?● standardy, standardy, standardy!● odhad risků – které formáty souborů

zastarávají a jak je transformovat?● zobrazení – jak zobrazím, otevřu soubor v

určitém formátu

Page 27: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna

Dlohodobá ochrana digitálních dat

● LTP systémy – softwarová ochrana● bezpečná úložiště – hardwarová ochrana

● open source nástroje:○ RODA, ARCHIVEMATICA, AIDA, MOPSEUS

● komerční řešení○ Rosseta (ExLibris), SDB (Tessela),...

Page 28: Digitalizace a dlouhodobá ochrana digitálních dokumentů

Moravská zemská knihovna v Brněwww.mzk.cz

Děkuji za pozornost

Pavla Švástová[email protected]