26
PDF(/A): een introductie 16 en 23 maart 2009 Stadsarchief Door: Robèrt Gillesse

Introductie PDF(/A) voor Stadsarchief Amsterdam

Embed Size (px)

Citation preview

Page 1: Introductie PDF(/A) voor Stadsarchief Amsterdam

PDF(/A): een introductie16 en 23 maart 2009

Stadsarchief

Door: Robèrt Gillesse

Page 2: Introductie PDF(/A) voor Stadsarchief Amsterdam

Doel van deze cursus

Inzicht geven in het PDF(/A) formaat Zelf een PDF/A kunnen herkennen en

maken

Page 3: Introductie PDF(/A) voor Stadsarchief Amsterdam

Opzet van deze cursus

Wettelijk kader Wat is een PDF en een PDF/A? Hoe te lezen, herkennen, maken? Beperkingen en problemen PDF(/A) Beveiliging en digitale handtekening Toekomst PDF(/A) Oefening: herkennen en maken PDF/A

Page 4: Introductie PDF(/A) voor Stadsarchief Amsterdam

Wettelijk kader Artikel 25 van concept (2008) van de nieuwe ministeriële

regeling Geordende en toegankelijke staat archiefbescheiden : 1. Digitale archiefbescheiden worden, uiterlijk op het tijdstip

van overbrenging, opgeslagen in een gevalideerd en volledig gedocumenteerd open standaard formaat, tenzij dit redelijkerwijs niet van de zorgdrager kan worden verlangd. Alsdan vindt met de beheerder van de voor overbrenging aangewezen archiefbewaarplaats overleg plaats over een alternatief bestandsformaat. 2. Gebruikmaking van encryptietechniek is niet toegestaan. 3. Gebruikmaking van compressietechniek is slechts

toegestaan, voor zover daarbij geen informatieverlies ontstaat.

Page 5: Introductie PDF(/A) voor Stadsarchief Amsterdam

Actieplan Nederland Open in Verbinding NOiV (EZ)Overheidsstreven gebruik open

standaarden Van dit actieplan beveelt actielijn 6 ODF

aan voor reviseerbare documentenNaar aanleiding van deze actielijn heeft

het Forum Standaardisatie PDF/A-1a geselecteerd als formaat voor niet reviseerbare, te archiveren documenten

Page 6: Introductie PDF(/A) voor Stadsarchief Amsterdam

Wat is een PDF?Een uitwisselbestand voor niet-

reviseerbare documenten Reviseerbare documenten: ODF, DOCStamt uit 1992 Ontwikkeld vanuit postscript door AdobePDF 1.7 sinds begin 2008 een ISO normDus niet langer eigendom AdobeAchterwaartse comptabiliteit: een PDF

uit 1993 is nog zonder problemen leesbaar

Page 7: Introductie PDF(/A) voor Stadsarchief Amsterdam

Mogelijkheden PDFMogelijkheden PDF inmiddels enorm

uitgebreid:Soorten documenten (office, cad, 3d, digitaal geboren, gescand)NavigatieInteractiviteit (multi media, formulieren) en JavascriptLagen en transparantieBeveiliging en authenticatieOpname andere bestanden binnen 1 PDF

Page 8: Introductie PDF(/A) voor Stadsarchief Amsterdam

PDF op basis digitaal geboren document

Digitaal geboren (bv Ms Word .doc) document wordt “bevroren” Inhoud, opmaak en functionaliteit zoveel

mogelijk bewaardEventueel voorzien van extra

functionaliteit (navigatie, beveiliging)

Page 9: Introductie PDF(/A) voor Stadsarchief Amsterdam

PDF op basis gescande documenten

Gescande documenten kunnen worden opgeslagen als losse afbeeldingen (Archiefbank) maar ook als PDFVoordelen: één bestand ipv talloze

afbeeldingen, volgorde vastgelegd, OCR kan in PDF worden opgenomenNadelen: verhoogde complexiteit, PDF

op basis afbeeldingen kan heel zwaar worden, “bevroren” staat probleem wanneer er fouten zijn gemaakt

Page 10: Introductie PDF(/A) voor Stadsarchief Amsterdam

Subsets PDF

PDF kent meerdere “subsets”, m.a.w. gespecialiseerde PDF’s: PDF/X (drukwerk)PDF/E (engineering)PDF/A (archivering)

Page 11: Introductie PDF(/A) voor Stadsarchief Amsterdam

Idee achter PDF/A

Onafhankelijkheid van hard- en software

Self-contained (bevat alle bronnen voor betrouwbare weergave)

Zelfbeschrijvend

Page 12: Introductie PDF(/A) voor Stadsarchief Amsterdam

Voorbeeld ingesloten fontsZie in Acrobat:documenteigenschappen

Page 13: Introductie PDF(/A) voor Stadsarchief Amsterdam

Twee “conformance levels” PDF/A

PDF/A-1a: Voldoet aan volledige eisen van de standaard. Logische structuur (koppen, paragrafen etc) van tekst zijn bewaard. Ook wel ‘tagged PDF’. Elk karakter verwijzing naar Unicode.

PDF/A-1b: Voldoet aan minimale eisen van de standaard. Correcte weergave, maar geen onderliggende structuur.

Page 14: Introductie PDF(/A) voor Stadsarchief Amsterdam

Voorbeeld PDF/A-1a:documentstructuurZie in Acrobat:Linkermenu tagsof codes

Page 15: Introductie PDF(/A) voor Stadsarchief Amsterdam

Restricties PDF/A t.o.v. reguliere PDFGeen multimedia (audio, video, 3D)Geen ingebedde bestandenGeen transparantie of lagenBeperkte kleurruimtesGeen beveiliging en encryptieGeen externe referenties naar benodigde

viewersoftware of fonts Geen interactiviteit (‘Form Fields’,

Javascript)Geen LZW en JPEG 2000 compressie

Page 16: Introductie PDF(/A) voor Stadsarchief Amsterdam

Maken van een PDF/ASoftware nodig die PDF/A kan maken:

vaak is de creatie van PDF/A een optieHet creëren van een PDF/A kan op

verschillende manierenDesktop: via printfunctie of via applicatieVia Adobe Acrobat of een vergelijkbare

tool. PDF’s dan ook in batches te maken.Op een server

Page 17: Introductie PDF(/A) voor Stadsarchief Amsterdam

Maken van een PDF/A via de printopdracht. Op deze manier gecreëerde bestanden zijn altijd PDF/A-1b.

Maken van een PDF-A via Adobe Maker in MsWord. Op deze manier gecreërde PDF/A’s zijn PDF/A-1a.

Page 18: Introductie PDF(/A) voor Stadsarchief Amsterdam

Hoe een PDF/A te herkennen

Geen aparte extensie: gewoon .pdfGeen rechter muisknop / eigenschappenNiet in Adobe ReaderWel in Adobe Acrobat (vanaf versie 7):

blauwe balk en PreflightVia “ingest” software die

bestandsformaten kunnen herkennen: JHOVE

Page 19: Introductie PDF(/A) voor Stadsarchief Amsterdam

Controle na migratie naar PDF/A

Let op inhoud en opmaak goed is overgekomen. In uitzonderlijke gevallen gaat dit niet

goed. Let op regeleindes, vreemde tekens, tabellen, kolommen etcEventueel te testen met complex

opgemaakte bestanden (‘torture’ files)

Page 20: Introductie PDF(/A) voor Stadsarchief Amsterdam

Problemen en beperkingen PDF/A

Grootste probleem op dit moment is het ontbreken van eenheid aan welke technische eisen een PDF/A precies moet voldoenValidatie: Ene tool is strenger dan de

andereConversie PDF naar PDF/A ook

problematischBestaande PDF collecties als zodanig

opslaan

Page 21: Introductie PDF(/A) voor Stadsarchief Amsterdam

Beveiliging PDF(/A)

Uitgebreide set aan mogelijkheden voor beveiliging (DRM) In PDF kan beduidend meer dan PDF/APrint en of kopieer beveiliging (PDF)Encryptie en wachtwoordbeveiliging

(PDF)Digitale handtekening (PDF/A)

Page 22: Introductie PDF(/A) voor Stadsarchief Amsterdam

Voorbeeld beveiligingin PDF PDF/A-1aZie in Acrobat:documenteigenschappen

Page 23: Introductie PDF(/A) voor Stadsarchief Amsterdam

Voorbeeld digitale handtekening

Page 24: Introductie PDF(/A) voor Stadsarchief Amsterdam

Toekomst PDF(/A)

Nu versie PDF/A-12010 versie PDF/A-2 (ISO 19005-2):Gebaseerd op PDF versie 1.6Transparantie en lagenJPEG2000Geen 3D en multimedia (PDF/A-3)

Software: Hopelijk verbetering van validatieVerwachting: PDF een archief standaard

waar PDF/A niet kan voldoen

Page 25: Introductie PDF(/A) voor Stadsarchief Amsterdam

Food for thought

Misschien is het beter PDF/A conversie gecontroleerd – bijv via DMS - te laten plaatsvinden ipv via desktop applicaties.Gebruik goede toolsVoer controle uit na conversieHet herkennen van een PDF/A is

moeizaamHet belang van goed en

gestandaardiseerd opgemaakte documenten is groot

Page 26: Introductie PDF(/A) voor Stadsarchief Amsterdam

Verder lezen PDF/A Competence Centre: http://pdfa.org/ PDF naar PDF/A conversie: Franks L.Walker ea, PDF File Migration

To PDF/A: Technical Considerations IS&T Conference 2007. http://lhncbc.nlm.nih.gov/lhc/docs/published/2007/pub2007020.pdf Advies Forum Standaardisatie betreffende PDF/A:

http://www.forumstandaardisatie.nl/fileadmin/OVOS/2_Expertadvies_PDFA-1_v1.0.PDF Advies hoe een goed archiefdocument aan te maken: Judith Rog,

PDF Guidelines, Recommendations for the creation of PDF files for long-term preservation and access (2007). http://www.kb.nl/hrd/dd/dd_links_en_publicaties/PDF_Guidelines.pdf

Binnenkort te publiceren door Stadsarchief Amsterdam: Richtlijn standaard bestandsformaten voor tekstdocumenten Aanbevelingen migratie tekstdocumenten naar PDF/A