Travel Europeana
Suomen Vanhat Matkailukirjat
KansalliskirjastoTiina Ison, pääsunnittelija - [email protected]
Konservointi ja Digittointikeskus
Giuseppe Acerbi
Travels through Sweden, Finland and Lappland
to the North Cape in the years
1798 and 1799
Jäsennys
1. Kansalliskirjaston digtioitnipolitiikka 2010
2. Kansalliskirjasaton aineistojen käyttöönsaattaminen
3. Travel Europeana digtitointi hanke 2008-2010
4. Kansalliskirjaston aineisto – Vanhat Matkailukirjat
5. Kansalliskirjaston digitointiprosessit ja metadata
6. Digitointiprosessit ja kehityskokeiluja..
1. Kansalliskirjaston digitointipolitiikka 2010
Kansalliskirjaston strategisen tavoitteena on saattaa kulttuuriperintöaineisto laajaan verkkojakeluun edistäen mm :
•Aineistojen mahdollisimman vapaan tutkimus-, opetus- ja kansalaiskäytön
•Digitoitujen aineistojen luotettavuuden ja autenttisuuden turvaamisen
•Digitoitujen aineistojen pysyvän ja kestävän saatavuuden, haettavuuden ja käytettävyyden
•Digitoitujen aineistojen laaja verkkojakelu
Kansalliskirjasto luo uusia prosesseja ja toimintamalleja....
•perinteisen analogisen aineiston hallinnoimisen ja säilyttämisen rinnalle digitaalisen aineiston tuottamiseen, käyttöön saattamiseen ja pitkäaikaissäilytykseen.
….kansalliskirjaston digitoitavia aineistoja
• Aikakausilehdet
• Historialliset sanomalehdet
• Monografiat (mm Pelasta Kirja)
• Pergamentit
• Turun Väitöskirjat
• Äänitteet (C-kasettia)
• Peinpainatteeta
• Travel Europeana (100 teosta Europeanaan 2010)
……digitointipolitiikan operationalisointi
• Autenttisuus – lähdeaineistoa vastaava korvike (ID’t, seuranta).
• Tunnistettavissa Kansalliskirjaston tuottamaksi - tuottajan maine
• massa- ja erikoisdigitiointiprosessit – ylläpito ja kehittäminen
• digitoinnin- ja jälkikäsittelyn tuotannon hallinnointi (eri linjat)
• provenienssitietojen keruu, liittäminen ja tallennus (METS/PREMIS) – fyysinen ja digitaalinen provenienssi
• METS profiilit eri aineistoille(monografiat) kuvaileva, rakenteellinen ja hallinnollinen metadata (määritys, metatyöryhmät)
• rakenteistamisen laatutasot ja mittarit (osakohteet)
• kahden tietueen malli, minimiluettelointi, luetteloinnin rikastaminen
• PAS kelpoisia säilytyspakettien tuottaminen• yksilölliset tunnisteet, tekijänoikeus metadata sekä käyttöoikeus
…….digitoinnin tietotuotteet
Kansalliskirjatonlinjaa digitointipolitiikassa tietotuotteita digitointituotannon tuottamina:
• Digitoidut aineistot
• Rakenteistetut aineistot sekä osakohteet
• Yhteisöllinen rikastaminen
• Digitoidut kokoelmat tutkimuskäyttöön
• Digitoitujen aineistojen metadata ja rikastaminen
• Digitoitujen aineistojen pitkäaikaissäilytys
2. Kansalliskirjaston digitoitujen aineistojen käyttöönsaattaminen
Kansalliskirjaston tavoitteena on tuottaa dataa standardi- sekä vaihtokelpoisessa muodossa jota voidaan saattaa käyttöön mahdollisimman laajaan jakeluun
Digitointituotannon taustajärjestelmät (Kansalliskirjaston digitoinitikeskus) tuottavaen digitoituja aineistoja joita voidaan saattaa käyttöön sekä:
Digitool (50 Travel Eu teosta Kansalliskirjston Digitool Monogratiat) KDK Europeana (Marraksuu 2010) WDL Kulttuuri Sampo ?
Yksi aineisto, maksimi saatavuus, haettavuus ja käytettävyys.
3. Travel Europeana digitointi hanke 2009-2010
Päätävoite: digitoida matkailuun ja turismiin liittyvää aineistoa ja saattaa käyttöön Europeaanan kautta.
Hanke rahoitus: European Commission: ‘Digital Libraries’ of the eContentplus Programme
Hanketta tukevat: EDL Foundation, CENL - The Conference of European National Librarians - ja LIBER - Association of European Research Libraries
Hankkeen aloitus 1st Toukokuuta 2009. Hanke on 2-vuotinen. Hankeen tavoitteen on 1 miljoonaa objektia. Hankkeen tavoitteita on lisäksi. ‘luoda malliesimerkkejä digitoinnin ‘best
practice’ prosesseista sekä syventää LIBER ja CENL (tutkimuskirjastojen) tukea Europeanalle.
....travel Europeana hankkeeseen osallistuvat
National Library of Estonia Coordinator Austrian National LibraryEDL FoundationEremo srlLund University LibraryMoravian Library in BrnoNational Library of FinlandNational Library of LatviaNational Library of Poland National and University Library of Slovenia
Kriittinen massa digitoituja aneistoja...
National Library of The NetherlandsNational Library of WalesTrinity College LibrarySlovak National LibraryGoettingen State and University LibraryUniversity College LondonUniversity of InnsbruckUniversity Library of RegensburgUniversity and National Library of Debrecen
WP 3: UCL London – LIBER organisaationiden aggregaatti. Digitool – ESE – Europeana. Paul Eyers.
4. Kansalliskirjaston Travel EU matkailuaineisto
Kansalliskirjaston aineisto on n 100 matkailuun liittyvää teosta, suomalaisten julkaisemaa tai keskittyy Suomeen ja etenkin Lappiin.
Materiaali on kansainvälisesti kiinnostavaa sisältäen ensimmäisiä matkakertomuksia Suomesta 1600–1800-luvuilta enimmäkseen Ruotsin vallan ajalta. kirjoja ja niihin liittyviä (avokkaita) kuvia, kuvauksia ja karttoja. ....Tekijänoikeusvapaata.
Matkailukirjat: monikielisiä kokteksti versioita - eri versiot, painokset mm Acerbi ja Topelius (suomi, ruotsi, saksa, englanti, venäjä, ranska).
Kokotekstit mielenkiintoisia myös ontologisoinnin kannalta koska sisältävät paikannimiä eri kielillä sekä historiallisessa kontekstissa.
.... matkailu aineisto esimerkkinä Acerbi
Jos mun tuttuni tulisi, (goethe käänsi 1810)
Ennen nähtyni näkyisi,Sille kättä käppäjäisin,Vaikk ois käärme kämmenpäässä,Sille suuta suikkajaisin,Vaikk ois suu suden veressä,Siitä kaulahan kapuisin,Vaikk ois kalma kaulan päällä,Vielä vierehen kävisin,Vaikk ois vierus verta täynnä.
1799 Acerbi Grand Tour
Kuvaukset ja Kuvitukset
Globaali toursimsi
Kulttuurimatkailijat
Kartat, reitit, paikannimet...
Konteksti (i was here 1799 :)
5. Kansalliskirjaston taustajärjestelmä: digitointiprosessitDigitoinnin tuotantoprosessin EXPORT tiedostot sisältävät
- :JPEG2000, lossless, PDF, OCR TXT, ALTO XML, METSXML ja MARCXML.
METS export paketit laadittu monographioille määrittäen yhteensopivat standardit ja OAI-PMH vaihtokelpoisuuden
-- kuvailevaa, hallinnollista, rakenteellista sekä pitkäaikaista metadatalle. - Mets Rights kehitystyö aloitettu (käyttö-näyttörajoitteet)
….travel europeana projektin hallinnointi
…METS profiilit: metadatan liittääminen
• 1. Kuvaileva metadata (Travel Eu:ssa kehitetty)• luetteloiinti – Fennica (suomalaisille)
• ISBD (International Standard Bibliographic Description) sääntöjä ’for older monographic resources’. Luotu tietue joka toiimii globaalilla tasolla
• asiasanat ja YSO (englanti)
• Abstrakti (englanti)
• Povenienssi tiedot lisätty (alkuperä)
• 2. Tekninen metadata
• 3. Hallinnollinen metadata (tunnisteet)
• 4. Rakenteellinen metadata (osakohteet)
• Europeana Semantic Elements (Europeana Semantic Model) ? DC ?
….digitointiin liittyviä haasteita – Wanha teksti
Vanhat kirjainmuodot ongelma OCR:lle,vanhat nimimuodot
Teemojen ja relaatioiden tunnistaminen edellyttää automatisoinnin ja asiantuntijatyön yhdistämistä
Mahdollisia ratkaisuja:
Ohjelmistojen luominen jälkikäsittelynautomatisoimiseksi ja manuaalisenjälkikäsittelyn helpottamiseksi.
Ontologioiden ja valmiiden aihesanastojenhyödyntäminen
6. Digitointiprosessit ja kehityskokeilua …Acerbia prototyyppi kokeilua…
(Mika Nyman & Eeva Murotmaa) Tuottaa lisäarvoa massadigitoituun aineistoon
Verkkojulkaisemisen mahdollistaminen
Menetelmien kehittäminen ja prototyypin toteutus
TEI:n ja kieliteknologian käyttömahdollisuuksien selvittely
Sisällön muokkaaminen soveltuvaksi jakeluun semanttisessa webissä
……käytettyjä menetelmiä
Lähtökohtana OCR-digitointiprosessissaautomaattisesti syntyneet Alto-tiedostot
Välineiden luominen OCR-korjailua varten:– virheiden silmämääräinen tunnistaminen ja korjailu automaattisesti luodusta konkordanssista– Alto-tiedostojen automaattinen korjailu
Tunnistamisen kohteita:nimetyt entiteetit, teemat, suhteet
Sisällönkuvailun välineitä:Outline of Cultural Materials, CIDOC CRM
…..Acerbi Projektin toteutuksen viitekehys
Tallenne Acerbin teosTarkoitteet Henkilöt, Paikat, TeematMetadataskeema TEIKäsitemallit CIDOC CRM, FRBR, FRAD, FRSADLuettelointisääntö RDAAiheauktoriteetti OCM
……TEI:n käyttö Acerbi-hankkeessa
Automaattisesti muodostetut TEI-dokumentit
Jokaisella sivulla ja sanalla oma tunniste
Mahdollisuus viitata mihin tahansa sanaantai sanojen yhdistelmään (segmenttiin)
Sanoihin tai segmentteihin voidaan viitatatekstin ulkopuolelle sijoittuvista annotaatioista
Annotaatiot voivat viitata ristikkäisiinsegmentteihin
Annotaatiot voivat muodostaa erilaisiatemaattisia kokonaisuuksia (esim. luonnon-kuvaukset, kansanelämä, mineraalit, kasvit)
TEI=
TextEncodingInitiative
Kansalliskirjaston digitointi keskus (Mikkeli)