Upload
alva
View
68
Download
0
Embed Size (px)
DESCRIPTION
TEI Header. Mats Dahlström Digitalisering av kulturarvet Januari 2008. Metadata. Data om data // information om dokumentet bibliografiska data Metadata för samlingar av dokument ett dokument ett dokumentsegment. Metadata / typ. Beskrivande metadata Strukturella metadata - PowerPoint PPT Presentation
Citation preview
TEI Header
Mats DahlströmDigitalisering av kulturarvet
Januari 2008
Metadata
• Data om data // information om dokumentet bibliografiska data
• Metadata för – samlingar av dokument– ett dokument– ett dokumentsegment
Metadata / typ
1. Beskrivande metadata2. Strukturella metadata 3. Administrativa metadata4. Rättshanteringsmetadata 5. Arkivaliska metadata
Metadata / funktion• Dokumentation• Bibliografisk kontroll:
– Identifiering och (fr.a. maskinell) återvinning av resurser
– Organisering av resurser• Interoperabilitet mellan system• Rättigheter• Bruksinformation• Information till sökmaskiner• Stöd för arkivering och bevarande
Läs ”Minerva” om metadata!
Metadata / digitala objekt
• Synliga / dolda metadata• Inbäddade / externa• “Tryckta” standarder: behov av
metadaformat anpassade till digitala objekt• Flera försök att göra beskrivningen
standardiserad, enhetlig, maskinläsbar (Dublin Core, PICS, TEI Header, RDF)
• Dåligt stöd för metadata i SGML och HTML
<teiHeader>• Syftar till att ge en beskrivning av framför
allt den elektroniska resursen men också av dess källor
• Kraftfull och detaljrik, genom en stor uppsättning av både element och attribut
• Obligatoriska respektive valfria element• Kap. 5 i Guidelines – kap. 20 i TEI Lite• Kap 6 i övn.mtrl, inklusive figur 6.1 + bilaga
D
… men <front> då, med dess <docTitle> <docAuthor>
etc?
4 sektioner i TEI Header
<teiHeader><fileDesc> ... </fileDesc>
<encodingDesc>...</encodingDesc>
<profileDesc> ...</profileDesc>
<revisionDesc> ... </revisionDesc>
</teiHeader>
4 sektioner i TEI Header
•File description•Encoding description•Profile description•Revision description
<fileDesc>• Obligatoriskt• Full bibliografisk information om den
elektroniska filen och dess källa/or• Obligatoriska barnelement:
– <titleStmt>– <publicationStmt>– <sourceDesc>
• Valfria barnelement
<fileDesc>/<titleStmt>• Obligatoriskt• Identifierar den elektroniska filen, inte dess
källa/or• Obligatoriskt barnelement:
– <title>
• Valfria barnelement, t.ex.:– <author> [dvs till verket, av vilket den
elektroniska filen är en version]– <editionStmt> [dvs om den elektroniska
utgåvan]– <respStmt> [dvs för den elektroniska utgåvan]
<titleStmt><title>Author To Her Book: An Electronic Edition</title><author>
<name reg="Bradstreet, Anne">Anne Bradstreet</name><date>1612-1672</date>
</author><respStmt>
<resp>Header creation by <name>Ralph Bauer</name></resp><resp>Encoded by <name>Ann
Hanlon</name></resp></respStmt>
</titleStmt>
<fileDesc>/<publicationStmt>
• Obligatoriskt element• Obligatoriskt innehåll: antingen en
beskrivning av resursen eller minst ngt av barnelementen:– <publisher> [förlag, organisation]– <distributor> [individ(er), sällskap etc]– <authority>
• Annat:– <availability>– <address>
<fileDesc>/<sourceDesc>
• Obligatoriskt• Identifierar källan/orna till den elektroniska
filen• Innehåller antingen beskrivning i text (<p>)
eller ett el flera av barnelementen:– <bibl> [dvs till verket, av vilket den
elektroniska filen är en version]– <biblFull>– <listBibl>
• Ingen ”källa”?
<sourceDesc>
<p>No source: created in machine-readable form.</p>
</sourceDesc>
<sourceDesc>
<bibl>The Works of Anne Bradstreet in Prose and Verse. Edited by John Harvard Ellis. (Charlestown: A. E. Cutter, 1867)</bibl>
</sourceDesc>
<fileDesc>/ <sourceDesc> / <biblFull>
• Innehåller en egen lite full genomgång av TEI:s file description, men alltså denna gång för källresursen
4 sektioner i TEI Header
•File description•Encoding description•Profile description•Revision description
<encodingDesc>
• Dokumenterar (val i) arbetet med den elektroniska texten och dess kod, t.ex.– <editorialDecl> (t.ex. normalisering
av stavning, typ av rättelser införda) – <tagsDecl> (t.ex. märkfrekvenser)– <refsDecl> (t.ex. den princip som valts
för kapitelnumrering etc)– <classDecl> (t.ex. ett klassif.schema)
4 sektioner i TEI Header
•File description•Encoding description•Profile description•Revision description
<profileDesc>
• 3 valbara barnelement:– <creation> (högst en) – <langUsage>– <textClass> (enligt <classDecl>)
med barnelement, t.ex.:•<keywords>•<classCode scheme”…”>
4 sektioner i TEI Header
•File description•Encoding description•Profile description•Revision description
<revisionDesc>
• En ”logg” för uppdateringar, revisioner och andra ändringar som har gjorts med den elektroniska resursen.
• Innehåller ett eller flera <change>. Varje <change> har:
• <date>• <respStmt> (ett eller flera)• <item> (textbeskrivning av vad som
gjorts)
<revisionDesc><change>
<date>1996-11-19</date><respStmt><resp>xxx</resp><name>ASM</name></respStmt><item>Header Edited</item>
</change><change>
<date>unknown</date><respSstmt><resp>xxx</resp><name>JPW</name></respStmt><item>Basic Tei Lite
tagging</item></change>
</revisionDesc>
TEI Headers kan …
• Utgöra egna XML-dokument• Vara kraftfulla metadataresurser• Översättas (t.ex. via XSLT) till
andra metadatascheman, t.ex. Dublin Core eller MARC 21– Cf ”arkiv” – ”leverans”