Sanja Halling Standarder och aggregering NM 2012 01-15

Preview:

DESCRIPTION

 

Citation preview

Workshop om digitalisering Sanja Halling

Digisam – Samordningssekretariatet för digitalisering, digitalt bevarande och digitalt tillgängliggörande av kulturarvet

Nationalmuseum, den 15 januari 2013

Tillämpat digitalt kulturarv –digitala utställningar

Överkurs eller rimligt krav?• traditionella funktioner för tillgängliggörandet av

information har ändrats• nya metoder, verktyg och teknik• teoretiska och praktiska verktyg samt insikt om

förändringarna • robusta digitala infrastrukturer• chansen att föra samman kulturarv som har

splittrats genom olika typer av kategoriseringar och pröva nya tekniker och metoder

= Digitala utställningar, tematiska och med pedagogiskt uppbyggt innehåll, digitala rundvandringar

Digitala/Virtuella utställningar • verktyg för att visa kulturarv och presentera samlingar

• digitala berättelser genom effektiv grafisk design och användning av flera medier

• kan gå bortom fysiska gränser – når bredare publik, även flerspråkiga användare– samverkan med turistsektorn = nya användare

• interaktion med användare möjlig, t ex UGC.

• teknik som ett medel att berika innehållet, så att det kulturella budskapet har företräde framför användning av själva tekniken– system som möjliggör att berika online-innehåll och tjänster över tid.– digitala infrastrukturer erbjuder hög kapacitet och tjänster som

institutionerna inte har råd med internt - potentialen i samarbetet.

En samling av digitala objekt utgör inte en digital utställning. Det är endast när objekten är noggrant utvalda för att illustrera ett ämne, och knyts samman till en berättelse som det blir en utställning, "innehållet i ett sammanhang."

En arbetsgrupp om virtuella utställningar inom ramen för Linked Heritage-projektet kommer att undersöka hur man kan förbättra kvaliteten på metadatai virtuella utställningar.

Kan digitala museer eller digitala bibliotek anses vara digitala

utställningar?

Vad vet vi om våra användare?• Digitala webbutställningar har inte experter eller

redan etablerade besökare som målgrupp utan en publik som är större och mer heterogen

• Virtuella utställningar kan också ses av personer med funktionsnedsättningar som inte har möjlighet att besöka den fysiska utställningen.

• En möjlig världspublik!

Ett europeiskt perspektiv

http://www.europeana.eu/portal/

Bakgrund

http://www.minervaeurope.org/

http://www.athenaeurope.org

• ATHENA-projektet (2008-2011) utvecklade LIDO-standard och Athena Ingestion Server and Mapping Tool (MINT).

http://www.linkedheritage.org/

ATHENA PLUS, Access to cultural heritage networks for Europeana

• De viktigaste mål för projektet är att:– tillföra kulturarvsportalen Europeana stora mängder

nytt material från både offentlig och privat sektor– förbättra sökning, åtkomst och återanvändning av

innehållet i Europeana, förbättra hantering av flerspråkiga terminologier

– experimentera med att berika metadata och återanvända den anpassad till användarnas olika behov (turister, skolor, forskare).

• 41 partners (21 länder): kompetenscentra, ministerier, kulturarvsinstitutioner, bibliotek, arkiv, museer, forskningscentra, universitet m m.

• 3,8 millioner metadataposter) från mer än 540 kulturarvsinstitutioner (mer än 80% museer).

DC-NET: Projektet hade som mål att främja den digitala infrastrukturen för att ge tillgång till

forskningsinformation från kulturarvssektorn inom EU – sektorsövergripande samverkan. INDICATE: internationellt samarbete, fallstudier, piloter.DCH-RP: (Digital Cultural Heritage Roadmap for Preservation) syftar till att producera och validera en

”Roadmap for Preservation”, som beskriver på vilket sätt man bör gå tillväga för att bevara det digitala kulturarvet genom en samlad e-infrastruktur.

Priorities and

programming

Support and demonstrati

on

Roadmap for preservation

Best practices och rekommendationerNyskapande tjänster och verktyg som stödjer tillhandahållandet

av det digitala kulturarvet.

DC-NET: services priority ordering for Content Providers

1. Long-term preservation2. Persistent identifiers3. Interoperability and Aggregation4. Advanced search5. Data resource set-up6. User authentication and access control7. IPR and digital rights management

http://www.indicate-project.eu/

• INDICATE (International Network for a Digital Cultural Heritage e-Infrastructure) is an European Union FP7 project which aims to establish a network of common interest made up of experts and researchers in the field of e-infrastructures and digital cultural heritage at Euro Mediterranean level.

• Through the network, the participants can share experience, promote standards and guidelines, seek harmonisation of best practice and policy.

• http://exhibitions.europeana.eu/

• http://www.lascaux.culture.fr/?lng=en

• http://www.v-must.net/V-MusT is a EU FP7-funded network of excellence that aims to provide the heritage sector with the tools and support to develop virtual museums that are educational, enjoyable, long-lasting and easy to maintain

Beskrivning av digital informationMetadatastandarder

Metadatastandarder

CC BY-NC

http://xkcd.com/927/

Hur skapas metadata?Vanligtvis sker skapandet av metadata i institutionernas

egna verksamhetssystem.

Samlingsdata består ofta av: – Information som registreras och hanteras i verksamheten, t ex

förvärv, lån, rättigheter, m m – Föremålsbeskrivningar, t ex: typ, titel, material, dimensioner, m m– Händelser kring föremålet, t ex uppkomst, utgrävningsdata, m m– Personer, organisationer och platser (ofta relaterade till

händelser)

Nyckelbegrepp för samlingsmetadata i dessa system är:– Hög granularitet – Specifika system (interna eller anpassningar av standarder)

• Institutionsspecifika• Domänspecifika• Landsspecifika

– Bevarandeaspekten

Museisystem

Olika slags musiesystem för förvaltning av samlingar: Primus, MuseumPlus, Carlotta, Sofie, Collective Access, TMS, egenutvecklade system, m m

Nya funktionella och tekniska krav på system, bl a stöd för vedertagna standarder

• Collections Trust CMS Software Survey 2012-2013http://www.collectionslink.org.uk/softwaresurvey

Metadatastandarder• Det finns en mängd olika typer av metadatastandarder som används av kulturarvsinstitutioner. De kan klassificeras i:

– Describing standards (beskrivande standarder, baseras på Dublin Core), ursprungligen för webbresurser (dokument). De som använder Dublin Core använder ofta också andra standarder vilket innebär att Dublin Core i praktiken ofta fungerar som en sekundär standard.

– Information schemes (metadata): domänspecifika; för museer, bibliotek, arkiv, m m.

– Tekniska standarder av teknisk, icke-beskrivande karaktär, några konceptuella

– ”Harvesting-schema”-standarder. I museisektorn är LIDO ledande ”skörd-schema”, medan bilden är mer varierad i biblioteks- och arkivsektorn.

Beskrivande standarderDomänspecifika:

Arkiv: EAD och ISAD (G) används båda, men är inte lämpliga för data från de andra sektorerna.

Bibliotek: Olika specifikationer för MARC, liksom MODS. RDA (Resource Description and Access) modellen för att hantera semantisk webb och länkade databehov.

Museer: Ett antal beskrivande metadata standarder används bl a: CDWA, LIDO, museumdat, Object ID, VRA och SPECTRUM (SPECTRUM är både en beskrivande standard och en processuell standard.

LIDO byggdes på CDWA, museumdat och SPECTRUM . Därför kan man säga att dessa tre standarder är kompatibla med och kan presenteras i LIDO.

LIDO är en tillämpning av CIDOC CRM som är den enda ISO-certifierade standarden för kulturarvsdata. CIDOC CRM är också en konceptuell modell.

Inom museisektorn finns det idag en stor variation i användningen av metadatastandarder. Oavsett vilken standard som finns i systemet kan museernas metadata oftast aggregeras i LIDO.

Konceptuella standarder:Museer:• CIDOC CRM CIDOC Conceptual Reference Model (CRM) antogs

formellt som en internationell standard (ISO-standard) antogs formellt den 12 september 2006.

Bibliotek:• FRBR FRBR Functional Requirements for bibliographic records:

Mycket arbete har redan gjorts för att harmonisera de båda modellerna, och de relevanta begreppen från FRBR-modellen integrerades i CIDOC CRM-modellen. En liknande insats pågår inom och i dialog med arkivsektorn. CIDOC CRM kan ses som den ledande konceptuella referensmodellen för kulturarvet.

Tekniska standarder (icke-beskrivande):

• METS, en teknisk, icke-beskrivande modell som återspeglar strukturen av ett digitalt objekt. Den används ofta i kombination med andra modeller.

• Det gäller att säkra att både kunna förstå och återsöka informationen, idag och i framtiden. För det behövs kunskap om innehållet, i form av tekniska metadata, men också om struktur och kontext, ”paket” med metadata som beskriver både hur informationen ska läsas och hur den tekniska miljön som den skapades i såg ut, dvs man säkrar äkthetsbevarande och bevarande av kontext.

Aggregering och interoperabilitet

Hur tillgängliggörs metadata?

Metadata i webbformat – via söktjänster, som t ex Kringla och Europeana

– http://www.kringla.nu/kringla/– http://www.europeana.eu/portal/– http://www.theeuropeanlibrary.org/tel4/– http://www.archivesportaleurope.eu/Portal/index.action

• I söktjänsterna samsöks information från flera olika ABM-institutioner

• Metadatat som presenteras i söktjänsterna är aggregerat dvs söktjänsten visar en begränsad uppsättning metadataelement som är en delmängd av datat som finns i institutionernas verksamhetssystem.

• Vilka metadatastandard borde användas?

Aggregering

• Här är målet att kombinera datakällor.

• Vid sammanföring ingår ocksåaspekter av immateriella rättigheter - licensavtal.

K-SAMSÖK

NAD

LIBRIS

SOFIE

Linked Heritage

ATHENA

Europeana Fashion

CARARE

DINA

GBIF-SE

AB

Linked Heritage

CARARE

Linked Heritage

Europeana Fashion

CARARE

Linked Heritage

ATHENA

Europeana Fashion

CARARE

Linked Heritage

ATHENA

Europeana Fashion

CARARE

Linked Heritage

EU Screen

Europeana Fashion

CARARE

Linked Heritage

Europeana Fashion

Europeana Fashion

CARARECARARE

Linked HeritageLinked Heritage

Open Up

APEx

TEL

Lifewatch.eu

Svenska Lifewatch

Baltic Diversity

SND

Interoperabilitet• strategiskt viktigt, även om svårt att uppnå.

• goda framsteg har gjorts inom vissa områden (t ex den ökade tillgången av RDF-baserade länkade data samt CIDOC-CRM och LIDO) men det återstår en hel del arbete

• e-infrastrukturer tillhandahåller tjänster somkan övervinna tidigare kritiska frågor som skalbarhet och komplexitet.

• Tekniskt utmanande med betydande insatser och investeringar.

• Oftast inga generella lösningar

• När interoperabilitet har uppnåtts kan det stödja aggregering,

• Europeana

• DEA

• CC0

• Metadata - data

• Digitalisering och aggregeringKulturarvsinstitutioner/myndigheter (nationella

insatser och EU-finansierade projekt)

• Infrastrukturens utvecklingIT och e-infrastrukturleverantörer tillsammans med användargrupper

• Nya tjänster, nya produkterKreativa industrin + kulturinstitutioner

Europa

Avancerad sökning

• Metadatastandarder är av avgörande betydelse för att få fram relevanta sökresultat och tillhandahålla en god service för användarna.

• Avancerad sökning är en viktig tjänst för användning av dataresurser.

• Används främst av slutanvändare.

Beständiga identifikatorer

Museets samlingar består framför allt av fysiska objekt

Digitala objekt med beskrivande metadata tillgängliggör information om de fysiska objekten.

• Ofta finns det flera digitala objekt kopplade till samma fysiska objekt, t ex:– olika fotografier av objektet– 3D-modeller– Rekonstruktioner– AV-material, m m

• Olika metadata för olika målgrupper: forskare, allmänheten, flerspråkig information.

• Det finns inga formella internationella standarder för beständiga identifierare för samlingar imuseer.

• I Storbritannien används ofta MDA-koder på delar av samlingar, men det är sällsynt.

Alla dessa objekt, fysiska och digitala, och kopplingar mellan dem måste hanteras.Beständiga Identifikatorer (PID – Persistent identifers) har en viktig roll som en länkande mekanism mellan fysiska och digitala objekt.

• Föremålsposter som består av flera objekt, hanteras ofta (men inte alltid) som ett enda föremålsnummer. Därför är det möjligt att använda samma standard (URI: er) för att definiera och hantera PID för sådana poster.

• Trasiga länkar och innehåll som flyttats runt på grund av ombyggnad av webbsidan, etc är ett akut problem som påverkar alla portaler och söktjänster.

• Forskning och utveckling sker redan i detta område, och ett eller flera av de befintliga systemen skulle kunna användas med få anpassningar.

• Ett PID register är en tjänst som med fördel skulle kunna centraliseras eller molnbaseras, digitala infrastrukturer har mycket att erbjuda här.

• Kraven varierar inte mycket från ett initiativ till ett annat - detta är en tjänst användbar för de flesta

Semantiska webben och LOD (Länkad Öppen Data)

• Publicering av digitala filer på Internet innebär inte automatiskt att materialet är fritt för användning och återanvändning.

• Öppen data är licensierad för fri användning, i maskinläsbara format, med öppna standarder, och helst som länkad/länkbar data.

För att se till att information om ett objekt, relaterad information och dess digitala kopior kan vara beständigt relaterade till varandra vid olika tidpunkteroch från olika platser är det nödvändigt attanvänder ”persistent identifiers" (PID).

Europeanas video om LOD

• http://pro.europeana.eu/linked-open-data

• Cambridge ..filmen LOD

• http://www.cambridgesemantics.com/sv/semantic-university/introduction-to-linked-data

Tack för er uppmärksamhet!