26
TEI Header Mats Dahlström Digitalisering av kulturarvet Januari 2008

TEI Header

  • Upload
    alva

  • View
    68

  • Download
    0

Embed Size (px)

DESCRIPTION

TEI Header. Mats Dahlström Digitalisering av kulturarvet Januari 2008. Metadata. Data om data // information om dokumentet  bibliografiska data Metadata för samlingar av dokument ett dokument ett dokumentsegment. Metadata / typ. Beskrivande metadata Strukturella metadata - PowerPoint PPT Presentation

Citation preview

Page 1: TEI Header

TEI Header

Mats DahlströmDigitalisering av kulturarvet

Januari 2008

Page 2: TEI Header

Metadata

• Data om data // information om dokumentet bibliografiska data

• Metadata för – samlingar av dokument– ett dokument– ett dokumentsegment

Page 3: TEI Header

Metadata / typ

1. Beskrivande metadata2. Strukturella metadata 3. Administrativa metadata4. Rättshanteringsmetadata 5. Arkivaliska metadata

Page 4: TEI Header

Metadata / funktion• Dokumentation• Bibliografisk kontroll:

– Identifiering och (fr.a. maskinell) återvinning av resurser

– Organisering av resurser• Interoperabilitet mellan system• Rättigheter• Bruksinformation• Information till sökmaskiner• Stöd för arkivering och bevarande

Läs ”Minerva” om metadata!

Page 5: TEI Header

Metadata / digitala objekt

• Synliga / dolda metadata• Inbäddade / externa• “Tryckta” standarder: behov av

metadaformat anpassade till digitala objekt• Flera försök att göra beskrivningen

standardiserad, enhetlig, maskinläsbar (Dublin Core, PICS, TEI Header, RDF)

• Dåligt stöd för metadata i SGML och HTML

Page 6: TEI Header
Page 7: TEI Header

<teiHeader>• Syftar till att ge en beskrivning av framför

allt den elektroniska resursen men också av dess källor

• Kraftfull och detaljrik, genom en stor uppsättning av både element och attribut

• Obligatoriska respektive valfria element• Kap. 5 i Guidelines – kap. 20 i TEI Lite• Kap 6 i övn.mtrl, inklusive figur 6.1 + bilaga

D

Page 8: TEI Header

… men <front> då, med dess <docTitle> <docAuthor>

etc?

Page 9: TEI Header

4 sektioner i TEI Header

<teiHeader><fileDesc> ... </fileDesc>

<encodingDesc>...</encodingDesc>

<profileDesc> ...</profileDesc>

<revisionDesc> ... </revisionDesc>

</teiHeader>

Page 10: TEI Header

4 sektioner i TEI Header

•File description•Encoding description•Profile description•Revision description

Page 11: TEI Header

<fileDesc>• Obligatoriskt• Full bibliografisk information om den

elektroniska filen och dess källa/or• Obligatoriska barnelement:

– <titleStmt>– <publicationStmt>– <sourceDesc>

• Valfria barnelement

Page 12: TEI Header

<fileDesc>/<titleStmt>• Obligatoriskt• Identifierar den elektroniska filen, inte dess

källa/or• Obligatoriskt barnelement:

– <title>

• Valfria barnelement, t.ex.:– <author> [dvs till verket, av vilket den

elektroniska filen är en version]– <editionStmt> [dvs om den elektroniska

utgåvan]– <respStmt> [dvs för den elektroniska utgåvan]

Page 13: TEI Header

<titleStmt><title>Author To Her Book: An Electronic Edition</title><author>

<name reg="Bradstreet, Anne">Anne Bradstreet</name><date>1612-1672</date>

</author><respStmt>

<resp>Header creation by <name>Ralph Bauer</name></resp><resp>Encoded by <name>Ann

Hanlon</name></resp></respStmt>

</titleStmt>

Page 14: TEI Header

<fileDesc>/<publicationStmt>

• Obligatoriskt element• Obligatoriskt innehåll: antingen en

beskrivning av resursen eller minst ngt av barnelementen:– <publisher> [förlag, organisation]– <distributor> [individ(er), sällskap etc]– <authority>

• Annat:– <availability>– <address>

Page 15: TEI Header

<fileDesc>/<sourceDesc>

• Obligatoriskt• Identifierar källan/orna till den elektroniska

filen• Innehåller antingen beskrivning i text (<p>)

eller ett el flera av barnelementen:– <bibl> [dvs till verket, av vilket den

elektroniska filen är en version]– <biblFull>– <listBibl>

• Ingen ”källa”?

Page 16: TEI Header

<sourceDesc>

<p>No source: created in machine-readable form.</p>

</sourceDesc>

Page 17: TEI Header

<sourceDesc>

<bibl>The Works of Anne Bradstreet in Prose and Verse. Edited by John Harvard Ellis. (Charlestown: A. E. Cutter, 1867)</bibl>

</sourceDesc>

Page 18: TEI Header

<fileDesc>/ <sourceDesc> / <biblFull>

• Innehåller en egen lite full genomgång av TEI:s file description, men alltså denna gång för källresursen

Page 19: TEI Header

4 sektioner i TEI Header

•File description•Encoding description•Profile description•Revision description

Page 20: TEI Header

<encodingDesc>

• Dokumenterar (val i) arbetet med den elektroniska texten och dess kod, t.ex.– <editorialDecl> (t.ex. normalisering

av stavning, typ av rättelser införda) – <tagsDecl> (t.ex. märkfrekvenser)– <refsDecl> (t.ex. den princip som valts

för kapitelnumrering etc)– <classDecl> (t.ex. ett klassif.schema)

Page 21: TEI Header

4 sektioner i TEI Header

•File description•Encoding description•Profile description•Revision description

Page 22: TEI Header

<profileDesc>

• 3 valbara barnelement:– <creation> (högst en) – <langUsage>– <textClass> (enligt <classDecl>)

med barnelement, t.ex.:•<keywords>•<classCode scheme”…”>

Page 23: TEI Header

4 sektioner i TEI Header

•File description•Encoding description•Profile description•Revision description

Page 24: TEI Header

<revisionDesc>

• En ”logg” för uppdateringar, revisioner och andra ändringar som har gjorts med den elektroniska resursen.

• Innehåller ett eller flera <change>. Varje <change> har:

• <date>• <respStmt> (ett eller flera)• <item> (textbeskrivning av vad som

gjorts)

Page 25: TEI Header

<revisionDesc><change>

<date>1996-11-19</date><respStmt><resp>xxx</resp><name>ASM</name></respStmt><item>Header Edited</item>

</change><change>

<date>unknown</date><respSstmt><resp>xxx</resp><name>JPW</name></respStmt><item>Basic Tei Lite

tagging</item></change>

</revisionDesc>

Page 26: TEI Header

TEI Headers kan …

• Utgöra egna XML-dokument• Vara kraftfulla metadataresurser• Översättas (t.ex. via XSLT) till

andra metadatascheman, t.ex. Dublin Core eller MARC 21– Cf ”arkiv” – ”leverans”