Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Digital Repository Infrastructure Vision for European Research
PRÍRUČKA DRIVER 2.0Odporúčania pre poskytovateľov obsahu – zdieľanie textových zdrojov prostredníctvom
protokolu OAI-PMH
Univerzitná knižnica v Bratislave2011
Anglický názov originálu: DRIVER Guidelines 2.0 Guidelines for content providers – Exposing
textual resources with OAI-PMH
Preklad: Mgr. Martina Kapustíková
Odborná revízia prekladu a zostavenie Glosára: Ing. Danica Zendulková
2
Univerzitná knižnica v Bratislave, 2011
3
Abstrakt
Pre komunikáciu vo všeobecnosti je dôležité, aby osoba B porozumela, čo vraví osoba A.
Aby sme dosiahli toto porozumenie, potrebujeme spoločný základ, primárnu slovnú zásobu,
vďaka ktorej si uvedomíme význam vecí. Od tohto momentu môžeme začať uvažovať. Aby
sme podporili vedeckú komunikáciu používaním repozitárov, musia repozitáre „hovoriť
rovnakým jazykom“, a preto je nevyhnutné vytvoriť spoločný základ.
„Spoločný základ“ v technickom jazyku znamená, že zaistíme „interoperabilitu“.
Interoperabilitu môžeme spravovať na rôznych úrovniach. V tejto práci sa snažíme dosiahnuť
interoperabilitu na dvoch úrovniach, syntaktickej (používaním protokolu OAI-PMH a OAI_DC)
a sémantickej (používaním slovníkov).
Interoperabilita je schopnosť informačného systému používať informácie a funkcie iného systému používaním spoločných štandardov. (pozn.prekl.)
4
Obsah
Úvod........................................................................................................................................11
Poďakovanie (verzia 1.0).....................................................................................................11
Poďakovanie (verzia 2.0).....................................................................................................11
Editori...............................................................................................................................11
Experti a recenzenti..........................................................................................................11
O projekte DRIVER..............................................................................................................13
Projekt DRIVER................................................................................................................13
DRIVER ako údajová infraštruktúra..................................................................................13
Informačný priestor DRIVER............................................................................................13
Očakávania..........................................................................................................................14
Čo očakávajú výskumníci.................................................................................................14
Úplný text..........................................................................................................................14
Ďalší vývoj........................................................................................................................14
O príručke DRIVER..............................................................................................................15
Určenie.............................................................................................................................15
Kompatibilita (validácia)....................................................................................................15
Nekompatibilita.................................................................................................................15
Poskytovanie podpory......................................................................................................16
Pôsobnosť odporúčaní DRIVER.......................................................................................16
Ďalšie zdroje.....................................................................................................................18
Prehľad nastavení DRIVER.................................................................................................20
5
ČASŤ A – Textové zdroje.................................................................................................20
ČASŤ B - Metaúdaje.........................................................................................................21
ČASŤ C – Zavedenie OAI-PMH.......................................................................................22
Novinky....................................................................................................................................23
Kapitola 1: Použitie OAI-PMH..............................................................................................23
Pomenúvanie množín DRIVER........................................................................................23
Veľkosť zberného súboru.................................................................................................23
Životnosť pri obnovení tokenu..........................................................................................23
Stratégia vymazania záznamov........................................................................................24
Kapitola 2: Použitie metaúdajov OAI_DC............................................................................24
Identifikátor.......................................................................................................................24
Dátum...............................................................................................................................25
Práva................................................................................................................................25
Jazyk................................................................................................................................25
Autor.................................................................................................................................26
Zdroj.................................................................................................................................27
Typ....................................................................................................................................27
Formát..............................................................................................................................28
Kapitola 3: Použitie osvedčených postupov pre OAI_DC....................................................28
Mapovanie typov DRIVER................................................................................................28
Mapovanie verzií DRIVER................................................................................................28
Použitie OAI_DC v kvalifikačných prácach......................................................................28
DC:SOURCE a DC:RELATION........................................................................................29
6
Kapitola 4: Balenie (wrapping) zloženého objektu...............................................................29
Kapitola 5: Použitie slovníkov a sémantiky..........................................................................32
Kapitola 6: Príloha Použitie značiek kvality..........................................................................33
Kapitola 7: Príloha Použitie trvalých identifikátorov.............................................................33
Kapitola 8: Príloha Výmena informácií o štatistikách používania........................................34
Kapitola 9: Príloha Použitie práv duševného vlastníctva.....................................................34
Použitie OAI-PMH....................................................................................................................35
Úvod.....................................................................................................................................35
Poznámka.........................................................................................................................35
Poďakovanie.....................................................................................................................35
Zdrojový materiál..............................................................................................................35
Definície a koncepty: položka, záznam a jedinečný identifikátor.........................................36
Položka a záznam............................................................................................................36
Identifikátor.......................................................................................................................36
Pomenúvanie MetadataPrefix..............................................................................................37
Dokument DIDL................................................................................................................37
Označenie dátumu...............................................................................................................37
Syntax označovania dátumu................................................................................................38
Vymazanie záznamov..........................................................................................................39
Obnovenie tokenu................................................................................................................40
Objem zbieraných údajov.....................................................................................................41
Pomenúvanie množín DRIVER............................................................................................41
Definície obsahu množiny DRIVER.....................................................................................42
7
Umiestnenie množín............................................................................................................43
adminEmail pre nahlásenie chybného prihlásenia...............................................................43
Popisné provenienčné informácie........................................................................................44
Deklarácia prvkov prefix a menný priestor...........................................................................45
Validácia xml........................................................................................................................48
Komunikácia pri úpravách repozitára...................................................................................49
Použitie metaúdajov OAI_DC..................................................................................................50
Poďakovanie........................................................................................................................50
Definície...............................................................................................................................50
Úvodné poznámky...............................................................................................................51
Rozsah použitia................................................................................................................51
Minimálne požiadavky......................................................................................................51
Odporúčania.....................................................................................................................52
Prvky: krátky popis...............................................................................................................54
Nekvalifikovaný DC: oai_dc..............................................................................................54
Prvky: komplexný popis........................................................................................................56
Názov...............................................................................................................................56
Autor.................................................................................................................................57
Predmet............................................................................................................................58
Popis.................................................................................................................................60
Vydavateľ..........................................................................................................................60
Spolupracovník.................................................................................................................61
Dátum...............................................................................................................................62
8
Typ....................................................................................................................................64
Formát..............................................................................................................................66
Identifikátor.......................................................................................................................68
Zdroj.................................................................................................................................69
Jazyk................................................................................................................................70
Vzťah................................................................................................................................71
Dosah...............................................................................................................................72
Práva................................................................................................................................73
Cieľová skupina................................................................................................................75
Použitie osvedčených postupov pre OAI_DC..........................................................................76
Mapovnie typov DRIVER.....................................................................................................76
Typy DRIVER verzia 1.1 v porovnaní s verziou 2.0.........................................................76
Slovník typov e-print pre DRIVER vo verzii 2.0................................................................77
Mapovanie verzií DRIVER...................................................................................................79
Typy verzií e-print v porovnaní s verziami v príručke DRIVER 2.0...................................79
Štandardné verzie v porovnaní s typmi verzií v DRIVER 2.0...........................................79
Verzie novinových článkov (Journal Article Versions JAV), mapovanie verzie
technických pracovných skupín do verzií DRIVER 2.0...................................................80
Použitie OAI_DC v kvalifikačných prácach..........................................................................81
Príklad..............................................................................................................................81
DC:SOURCE a citačné informácie.......................................................................................82
DC:RELATION a prepojenie súvisiacich objektov...............................................................83
Použitie MPEG-21 DIDL (xml-úložisko) – Balenie (wrapping) zloženého objektu...................84
9
Úvod a cieľ...........................................................................................................................84
Informácie o pozadí špecifikácie..........................................................................................84
Odpoveď OAI vo vzťahu k dokumentu DIDL........................................................................85
DIDL ako nástroj balenia (wrapper).....................................................................................86
Kmeňový prvok: Identifikačný príznak dokumentu DIDL..................................................87
Prvky deskriptorov Item (dobrovoľné)..............................................................................88
Descriptor Statement: Item 'Identifier' (stav deskriptora: položka 'Identifikátor')..............89
Deskriptor Statement: Item 'modified' (stav deskriptora: položka ‘zmenený‘).........89
Deskriptor Statement: Item ’ObjectType’ (stav deskriptora: položka ‘TypPredmetu’)..........................................................................................................................................90
Zložený prvok: Vyjadrenie komplexnej práce...................................................................91
ObjectType: Metadata Item..............................................................................................94
ObjectType: Object Item...................................................................................................95
ObjectType: Mimostránková položka...............................................................................97
Príklad: DIDL vložený do OAI-PMH.....................................................................................98
Použitie slovníkov a sémantiky..............................................................................................106
info:eu-repo – Menný priestor pre pridelenie URI schémam a identifikátorom, ktoré ho
nemajú pridelené................................................................................................................106
Identifikácia autora.............................................................................................................106
Formát DAI.....................................................................................................................106
Trvácnosť DAI................................................................................................................107
Predmetová klasifikácia.....................................................................................................107
Slovník typov publikovania.................................................................................................109
10
Slovník verzií......................................................................................................................113
Kódovacie schémy.............................................................................................................114
Prílohy: Ciele do budúcnosti..................................................................................................116
Príloha: Použitie značiek kvality............................................................................................117
Príloha: Použitie trvalých identifikátorov................................................................................118
Implementačný plán používania trvalých identifikátorov URN:NBN................................120
Príloha: Výmena informácií o štatistikách používania...........................................................123
PIRUS: Vydavateľské štatistiky a štatistiky o používaní inštitucionálnych repozitárov.....123
Štatistiky OA.......................................................................................................................123
Predbežné výsledky projektu Štatistík OA.........................................................................124
Ciele Štatistík OA...........................................................................................................124
Informácie potrebné na vytvorenie COUNTER, LogEc a IFABC.....................................124
Doplnkové informácie, ktoré súhlasia s kontextovými objektmi OpenURL....................126
Dodatočné návrhy..........................................................................................................126
Tabuľka štandardov webového používania...................................................................127
Príloha: Použitie práv duševného vlastníctva (IPR)..............................................................128
Glosár....................................................................................................................................130
11
Úvod
Poďakovanie (verzia 1.0)
Poďakovanie patrí Martinovi Feijenovi, Mauricemu Vanderfeestenovi, Wolframovi
Horstmannovi, Friedrichovi Summannovi, Murielovi Foulonneauovi, Karen Van
Godtsenhovenovej, Patrickovi Hochstenbachovi, Paolovi Manghimu a Billovi Hubbardovi.
Poďakovanie (verzia 2.0)
Vytvorenie príručky pre rozhranie DRIVER 2.0 záviselo od expertízy mnohých ľudí. Všetci
z nižšie spomenutých spolupracovníkov sú experti a správcovia repozitárov. Spojili svoje sily,
aby dosiahli interoperabilitu v takej podobe, aby sa dala prakticky implementovať. Uvedení
spolupracovníci sa preto k projektu DRIVER 2.0 hlásia a naďalej ho podporujú.
Editori
• Maurice Vanderfeesten, (SURFfoundation, Holandsko)
• Friedrich Summann, (University Bielefeld, Nemecko)
• Martin Slabbertje, (Utrecht University, Holandsko)
Experti a recenzenti
• Stefania Biagioni, (CNR, Taliansko)
• Paolo Manghi, (CNR, Taliansko)
• Maria Bruna Baldacci, (CNR, Taliansko)
• Friedrich Summann, (University Bielefeld, Nemecko)
• Martin Slabbertje, (Utrecht University, Holandsko)
• Thomas Place, (Tilburg University, Holandsko)
12
• Benoit Pauwels, (Universite Libre de Bruxelles, Belgicko)
• Patrick Hochstenbach, (Ghent University, Belgicko)
• Karen van Godtsenhoven, (Ghent University, Belgicko)
• Niamh Brennan, (Trinity College Dublin, Írsko)
• Phil Cross, (Projekt Institute and the Intute Repository Search, Spojené
kráľovstvo)
• Mikael Karstensen Elbæk, (Danish Technical University (DTU), Dánsko)
• Maurice Vanderfeesten, (SURFfoundation, Holandsko)
• Susanne Dobratz, (Humboldt University, Berlín, Nemecko)
• Frank Scholze, (Stuttgart University Library, Nemecko)
• Wolfram Horstmann, (University Bielefeld, Nemecko)
• Barbara Levergood, (University Goettingen, projekt CACAO)
• Eloy Rodrigues, (Universidade do Minho, Portugalsko)
• Arjan Hoogenaar, (KNAW, Holandsko)
• Armand Guicherit, (KNAW, Holandsko)
• Ruud Bronmans, (KNAW, Holandsko)
• Jos Odekerken, (University of Maastricht, Holandsko)
• Alenka Kavcic-Colic, (Library Research Centre at National and University
Library, Slovinsko)
• Myriam Bastin, (University of Luik, Belgicko)
• Birgit Schmidt, (University of Goettingen, Nemecko)
13
O projekte DRIVER
Projekt DRIVER
Projekt DRIVER – infraštruktúru digitálnych repozitárov pre európsky výskum (Digital
Repository Infrastructure Vision for European Research) – riadi komunita financovaná
Európskou komisiou, ktorá zabezpečuje organizačný a technický rámec pre celoeurópsku
údajovú vrstvu umožňujúcu pokročilé používanie obsahových zdrojov (content resources) vo
výskume a vyššom vzdelaní.
DRIVER opisuje servisnú a údajovú infraštruktúru. Obe sa zameriavajú na to, aby
organizovali existujúce zdroje a služby repozitárov.
DRIVER ako údajová infraštruktúra
Údajová infraštruktúra je založená na lokálne umiestnených zdrojoch, ako sú napríklad
vedecké publikácie zozbierané v digitálnych repozitároch rôznych inštitúcií a výskumných
organizácií. Program DRIVER tieto zdroje zozbiera a zjednotí na európskej úrovni. Aby sme
dosiahli čo najvyššiu úroveň harmonizácie, DRIVER poskytne všetky dostupné prostriedky
na to, aby databázu zjednotil, validoval (overil). Rešpektuje pôvod zdrojov tým, že im „pridelí
väzbu“ na miestny repozitár. DRIVER okrem toho presmeruje požiadavku na sprístupnenie
do lokálneho repozitára v prípade, že je v ňom zdroj stiahnutý namiesto toho, aby ho sám
poskytol. DRIVER sprístupní údaje v repozitári všetkým partnerom v sieti poskytovateľov
obsahu DRIVER, aby ich mohli prostredníctvom OAI-PMH používať.
Informačný priestor DRIVER
Prvotná fáza projektu DRIVER položila základný kameň, aby mohla vzniknúť obsiahla a
ambiciózna európska infraštruktúra digitálnych repozitárov. Digitálne repozitáre majú
množstvo variantov podľa krajín, zdrojov (napríklad textové súbory, údaje alebo multimédia),
používajú sa rôzne technologické platformy, rôzne stratégie spracovania metaúdajov
a podobne. Nachádza sa tu však i spoločný základ: najčastejší formát zdroja, ktorý poskytujú
digitálne repozitáre je text a najzaužívanejší spôsob, ako sa dostať k týmto textovým zdrojom
je použitie protokolu otvorených archívov pre zber metaúdajov (Open-Archives-Initiative
14
Protocol for Metadata-Harvesting, OAI-PMH). Preto sa súčasná fáza vývoja DRIVER
zameriava na textové zdroje, ktoré môžu byť zbierané pomocou protokolu OAI-PMH.
Očakávania
Čo očakávajú výskumníci
Výskumníci a ostatní používatelia digitálnych informačných systémov majú od poskytovania
digitálneho obsahu veľké očakávania. Prístup k údajom by mal byť rýchly, priamy (iba
prostredníctvom zopár klikov) a univerzálny. Súčasný stav v oblasti digitálnych repozitárov
nespĺňa celkom tieto očakávania. Zatiaľ čo vznikli mnohé hodnotné služby, umožňujúce
vyhľadávať bibliografické záznamy (metaúdaje), ich zdroj je niekedy skrytý za stránkami,
vyžadujúcimi proces autorizácie, často nie je kompletný, alebo vôbec nie je dostupný.
Optimálna vedecká komunikácia si vyžaduje, aby bol zdroj dostupný na jeden klik.
Okrem toho, jednoduchý prístup ku kompletným textom a metaúdajom uľahčuje strojové
využívanie obsahu. Ani zozbierané bibliografické záznamy, ani úplný text sami osebe
neumožňujú rozvoj integrovaných pokročilých služieb, ako sú predmetové vyhľadávanie
skombinované s možnosťou prehliadať si klasifikácie, citačné analýzy a podobne, ale túto
službu umožní len kombinácia oboch prístupov.
Úplný text
Najväčšou výzvou v rámci skúšobnej prevádzky rozhrania DRIVER bolo zabezpečiť priamy
prístup k plnotextovým zdrojom. Kým spolupracovníci projektu DRIVER vynaložili veľké úsilie,
aby si s touto výzvou poradili z technologického hľadiska spracovávaním získaných údajov,
servery s digitálnymi repozitármi môžu lokálne podporiť projekt DRIVER tak, že poskytnú
obsah špecifickým spôsobom. Táto príručka ponúka miestnym poskytovateľom obsahu
návod, ako majú obsah sprístupňovať.
Ďalší vývoj
Získavanie úplných textov spolu s bibliografickými údajmi je základný a nevyhnutný krok k
rozsiahlym informačným službám založeným na digitálnych repozitároch. Ďalšie verzie
príručky DRIVER, ktoré sa budú venovať aktivitám DRIVER II, sa zamerajú na iné typy
15
informácií, akými sú napríklad primárne údaje alebo multimédia, ako aj komplexnejšie
informačné objekty vytvorené z viacerých zdrojov.
O príručke DRIVER
Určenie
Príručka DRIVER poskytne manažérom novovytváraných repozitárov návod na spravovanie
miestnych repozitárov a manažérom už existujúcich repozitárov poradí kroky, ktoré povedú
ku skvalitneniu služieb. Vývojárom repozitárových platforiem navrhne, aké funkcie pridať
v ďalších verziách.
Kompatibilita (validácia)
DRIVER v blízkej budúcnosti ponúkne lokálnym repozitárom prostriedky na to, aby si mohli
overiť úroveň zhody s odporúčaniami prostredníctvom webového rozhrania1. Okrem toho
ponúkne aj podporu pomocou internetu (pozri časť Poskytovanie podpory). Ak poskytovatelia
obsahu splnia povinné parametre z príručky DRIVER, repozitár získa štatút overeného
poskytovateľa pre DRIVER. Ak sú splnené odporúčané parametre, repozitár získa štatút
perspektívneho poskytovateľa obsahu pre DRIVER. Kompatibilné repozitáre DRIVER môžu
používať údaje zo systému DRIVER na vybudovanie lokálnych služieb. Stávajú sa súčasťou
siete poskytovateľov obsahu DRIVER.
Nekompatibilita
V prípade, že repozitár nespĺňa všetky povinné alebo odporúčané parametre z príručky
DRIVER, nemusí to znamenať, že obsah repozitára sa nezozbiera a nespracuje systémom
DRIVER. Ale vzhľadom na špecifické služby ponúkané pomocou infraštruktúry DRIVER sa
môže stať, že obsah takéhoto repozitára sa nebude dať sprístupniť. Napríklad vyhľadávacie
rozhranie zobrazujúce iba záznamy s úplným textom, nedokáže spracovať obsah repozitára,
obsahujúceho iba záznamy o metaúdajoch. Rovnako to platí aj vtedy, keď sú úplne texty v
repozitári prístupné len po autorizácii. Príručka DRIVER by mala uľahčiť rozlišovanie medzi
1 O validácii vo verzii 1.0 pozri: h tt p : //va l i d a t o r. d r iv e r . r e s e a r c h - i n f r as t ru c t u r e s . e u/
16
týmito dvomi typmi záznamov. Neprikazuje však, ktorý záznam by mal byť uložený
v lokálnom repozitári.
Poskytovanie podpory
Spoločenstvo DRIVER ponúka lokálnym repozitárom individuálnu podporu pri implementácii
odporúčaní DRIVER. Podporu možno poskytnúť buď cez internet2, alebo prijať iné riešenie,
ktoré možno realizovať pomocou centrálneho spracovania údajov3. Avšak trvalo udržateľná,
transparentná a dostupná cesta k zdokonaleniu služieb vedie cestou lokálnych repozitárov.
Pôsobnosť odporúčaní DRIVER
Sú odporúčania DRIVER štandardom?
Nie. Napriek tomu, že používanie štandardov – napríklad protokolu OAI-PMH – poskytuje
spoľahlivý základ na vybudovanie siete ako je DRIVER, požadujú sa stále nové odporučenia
DRIVER. Hlavným dôvodom je, že štandardy nechávajú priestor pre lokálnu interpretáciu
a implementáciu – bez toho by nemohli existovať. Táto voľnosť sa však stáva prekážkou pri
dosahovaní vysokokvalitných služieb v prípade, že sa spájajú viaceré druhy štandardov.
Sú odporúčania DRIVER porovnateľné s katalogizačnými pravidlami?
Nie. Odporúčania sú nástrojom, ako „preložiť“ (prekonvertovať) metaúdaje použité
v lokálnom repozitári do štandardu metaúdajov Dublin Core, ktoré používa DRIVER.
Odporúčania nie sú návodom na vkladanie metaúdajov do vášho repozitára.
Obsahujú odporúčania DRIVER návod na stanovenie úrovne kvality zdroja?
Nie. Odporúčania vám nepovedia, ktorý zdroj je na požadovanej vedeckej úrovni, a ktorý
nie. Predpokladáme, že táto selekcia prebehla na úrovni inštitúcie spravujúcej repozitár a
kvalita zdroja, ktorý repozitár zdieľa, je dostatočná.
Ktoré sú hlavné časti odporúčaní DRIVER?
Odporúčania DRIVER sa zameriavajú na päť oblastí: zber údajov, metaúdaje,
implementácia protokolu OAI-PMH, osvedčené postupy, slovníky a sémantiku.
2 Webová stránka podpory pre systém DRIVER: h tt p: //www. dr iv e r - s u pp o r t . eu 3 Pozri dokument „Tipy pri implementácii odporúčaní DRIVER“, http://www .dri v er -
s up po rt. eu/ do cume nts/ Advi ce_fo r_i mp le menta tio n_of_ the_ DR IVE R_g ui de li nes .p df
17
• Používanie množín (sets) je pri zbere údajov do repozitára povinné v prípade,
že definujú zbierku úplných textov. Ak sú všetky zdroje v repozitári textového
charakteru a neobsahujú iba metaúdaje, ale aj úplné texty a všetky zdroje sú
dostupné bez autorizácie, používanie množín na ich označenie je dobrovoľné.
• Zaviedli sa niektoré povinné a niektoré odporúčané parametre, aby sa podarilo
vyriešiť problémy vyplývajúce z rôznych implementácií protokolu OAI-PMH
v lokálnych repozitároch.
• Zaviedli sa niektoré povinné a niektoré odporúčané parametre týkajúce sa
metaúdajov, aby sa vylúčili sémantické nedostatky vyplývajúce z rôznych
interpretácií štandardov DUBLIN CORE.
Kto je v pozadí odporúčaní DRIVER?
Príručku DRIVER vytvorili odborníci, ktorí majú dlhoročné skúsenosti s budovaním a správou
podobných sietí prepojených repozitárov, ako sú HAL vo Francúzsku, DARE v
Holandsku, DINI v Nemecku, SHERPA vo Veľkej Británii. Pri svojej práci využili aj
odborné znalosti takých skúsených poskytovateľov služieb, ako sú BASE a komunitné
organizácie, napríklad OAI Best-Practice group.
Aké textové zdroje poznáme?
Súčasná etapa vývoja systému DRIVER sa zameriava na textové zdroje. Ako pracovnú
definíciu používame:
• Textovými zdrojmi sú vedecké články, doktorandské kvalifikačné práce,
pracovné dokumenty, e-knihy a podobné výstupy z vedeckých výskumných
aktivít.
• Otvoreným prístupom (Open Access) je bezplatný prístup, prístup bez licencie,
bez potreby prístupového hesla a bez technickej prístupovej kontroly cez IP
adresu.
Mnohé repozitáre zvyknú uchovávať rôzne typy zdrojov, napríklad články, e-knihy, fotografie,
videá, databázy a výučbové materiály. Tieto zdroje obsahujú metaúdajový záznam, ktorý ich
opisuje. Sú zvyčajne v digitálnej podobe (ale nie vždy). Digitálne súbory sú väčšinou uložené
v databáze, ktorá je súčasťou repozitára (ale nie vždy). V rámci DRIVER sa snažíme vytvoriť
18
podmnožinu širokej škály zdrojov v európskych repozitároch: zameriavame sa textové zdroje
v digitálnej podobe s otvoreným prístupom.
Výskumy ukazujú, že pri takomto postupe pokryjeme viac ako 80% všetkých dostupných
zdrojov. Preto sa v popise informačného priestoru DRIVER hovorí v prvom rade o textových
zdrojoch (pozri s. 14). Neznamená to však, že váš repozitár nesmie obsahovať iné materiály
alebo položky v nedigitálnej podobe. Toto odporučenie vyjadruje, že DRIVER sa zameriava na
textové položky. Kompletný zoznam textových zdrojov je prezentovaný v prvku dc:type v texte o metaúdajoch v kapitole Používanie slovníkov a sémantiky, časť Slovník typov
publikovania. O implementácii dc:type pozri kapitolu Používanie metaúdajov OAI_DC, časť
Typ. Viac o súčasných druhoch mapovania sa dozvieme v časti Mapovanie typov DRIVER v
kapitole Použitie osvedčených postupov pre OAI_DC.
Čo sú množiny (sets)?
Množiny sú štandardnou súčasťou protokolu OAI-PMH a používajú sa na identifikáciu
(filtrovanie) určitých častí repozitára. Keď váš repozitár obsahuje i netextové položky,
nedigitálne položky, položky s obmedzeným prístupom alebo iba metaúdaje, môžete použiť
množiny. Umožnia oddelenie (odfiltrovanie) týchto položiek z obsahu lokálneho repozitára,
„ponúkanému“ systému DRIVER.
Ďalšie zdroje
Čo treba ešte zvážiť?
Príručka DRIVER bola vytvorená na základe už existujúcich zdrojov. Veľká pozornosť sa
venovala tomu, aby sa predišlo neštandardným riešeniam. Možno konštatovať, že príručka
DRIVER využíva praktickú skúsenosť a celosvetovo existujúce odporučenia.
• DRIVER bol navrhnutý na základe už vytvorenej, funkčnej, rozšírenej siete
poskytovateľov obsahu, najmä podľa DARE v Holandsku. Odporučenia DARE
slúžili ako vzor pre systém DRIVER. DRIVER od svojho vzniku začal využívať
odporúčania DARE a obohatil ich o osvedčené postupy od manažérov
repozitárov a expertov z celej Európy. Príručka DRIVER vychádza z týchto
dokumentov:
19
O Dokument Andyho Powella, Michaela Daya and Petera Cliffa z
UKOLNu, Bathskej Univerzity: „Používanie jednoduchého Dublin Core
na opísanie softvéru e-print (SIMPLE DUBLIN CORE TO DESCRIBE
EPRINTS)“, Verzia 1.2. V minulosti bola upravená podľa špecifických
požiadaviek programu DARE známym aj pod názvom „DRIVER Použitie
Dublin Core“, Verzia 2, November 2006. Príručka sa pričinením
manažérov repozitárov rozšírila na Príručku DRIVER 2.0 – pozri kapitolu
Používanie metaúdajov OAI_DC;
o Protokol otvorených archívov pre zber metaúdajov, verzia 2.0, ktorý si
DARE takisto prispôsobil pre svoje potreby, je dostupný ako „DRIVER,
používanie odporúčaní OAI-PMH“, Verzia 2, December 2006, sa
rozšírila v Príručke DRIVER 2.0 s pomocou správcov repozitárov – pozri
kapitolu Použitie OAI-PMH;
o Certifikáty DINI „Dokumentačné a publikačné služby 2007“, Verzia 2,
September 20064, poskytujú informácie o tom, čo treba vziať do úvahy pri
prevádzkovaní repozitára. Keďže DRIVER vníma repozitáre z pohľadu
zberu údajov, jeho odporúčania sa nevenujú všetkým aspektom
opísaným v certifikáte DINI. Certifikát DINI sa zameriava na lokálne
spravovanie repozitára všeobecne. DRIVER vychádza z predpokladu, že
kritériá certifikátu DINI sú zohľadnené už v prevádzke samotného
repozitára;
o Dokument „Využitie MODS pre inštitučné repozitáre“5 vytvorila expertná
skupina z programu SURFshare a použil sa v holandských repozitároch.
Tieto odporúčania ponúkajú praktický zoznam typov publikovania,
ktoré zabezpečujú vyššiu interoperabilitu. Typy publikovania sú
založené na štandarde dc.type. Zoznam typov publikovania vznikol
kombináciou dokumentu „DARE použitie DC“ a typov publikovania z
repozitára e-print použitých v akademickom informačnom systéme
METIS v rámci Holandského informačného systému o vede (Current
Research Information System, CRIS);
4 http://www. di ni. de/ do cu ments/ di ni -z ertifi ka t2007 -en .pdf 5 h tt p s : //www . s ur fg r o e p e n . nl /si t e s/oai/ m e t a d a t a/ S h a red % 20 D o c u m e n t s/Us e % 20of % 20 MODS% 20f o r
% 20i n s t i t u t io n a l % 20 rep o s i t o r i e s - v er sio n % 201 .d o c
20
o Version Identification Framework6 poskytol jednoduchú a praktickú
taxonómiu7 pre články z vedeckých časopisov a podobne. Taxonómia
priniesla nové spôsoby opisu typov publikovania vo vedeckej činnosti.
Existuje pracovné riešenie, ktoré naraz vyrieši viaceré problémy?
Áno. Pozri kapitolu Použitie MPEG-21 DIDL (xml-úložisko) – Balenie (wrapping) zloženého
objektu – nástroj balenia (wrapper): vytvorenie xml reprezentácie zdrojových údajov. V rámci
programu SURF DARE sa ukázala ako užitočná implementácia „úložiska XML“ pre
každý zdroj, ktorý umožňuje zbieranie zdrojov v rámci OAI-PMH, poskytuje jedinečný
o d k a z n a z d r o j (bez opustenia stránky), podporuje indexovanie celého textu a
umožňuje sp r í s tupne nie súborných dokumentov skladajúcich sa z viacerých PDF
súborov. Úložisko XML je založené na deklaračnom jazyku digitálnych prvkov DIDL (Digital
Item Declaration Language, MPEG21-DIDL)8. Boli vyvinuté aj iné riešenia založené na DIDL
(napr. aDORe9, profily METS10) a ďalšie, ktoré sa zverejnia v budúcnosti (napr. OAI-ORE11).
Prehľad nastavení DRIVER
Nasledujúci sumár obsahuje základné nastavenia DRIVER zohľadňujúce štandardné témy
v oblasti textových zdrojov, použitia metaúdajov a implementácie protokolu OAI-PMH.
Podrobnejší opis sa nachádza v nasledujúcich kapitolách.
ČASŤ A – Textové zdroje
Povinné:
• Repozitár obsahuje digitálne textové zdroje (pozri vysvetlenie Aké textové
zdroje poznáme? na strane 17);
• Textové zdroje sú v obľúbených a často používaných formátoch (PDF, TXT,
RTF, DOC, TeX a pod.);
6 h tt p : //www .l s e. a c .u k / l i b r a r y / vif/F r a m e wo r k / E ss e n t ia l / t axo n o m i e s .h t m l 7 h tt p : //www .l s e. a c .u k / l i b r a r y /v er sio n s / 8 h tt p : //x m l . c ov erp ag e s . o r g/ m pe g21 -d i d l . h t m l 9 h tt p : //af r i c a n . l a n l. gov/a DO Re / p r o j e ct s/a d o re A r c h i v e / 10 h tt p : //www .l o c . gov/s t a nd a rd s/ m e t s/ m e t s -pr ofil e s. h tml 11 http ://www .o pe na rc hiv es .o rg/o re/
21
• Textové zdroje sú dostupné priamo z repozitára ktorýmkoľvek používateľom na
celom svete bez obmedzení, ako sú autorizácia a poplatky (Open Access) ;
• Textové zdroje sú opísané prostredníctvom metaúdajových záznamov;
• Metaúdaje a textové zdroje sú navzájom prepojené takým spôsobom, že
koncový používateľ získa prístup k textovému zdroju cez identifikátor (zvyčajne
URL) v metaúdajovom zázname;
• URL adresa zdroja, ktorá už raz bola zakódovaná do metaúdajového záznamu
je permanentne dostupná, nemení sa a nepriraďuje inému zdroju;
• Jedinečný identifikátor označuje metaúdajový záznam a textový zdroj (bez
ukazovateľov na externé systémy, ako sú národné knižničné systémy alebo
vydavateľ).
Odporúčané:
• Transparentné overovanie integrity textových zdrojov;
• Posudzovanie kvality (vedeckého obsahu) textových zdrojov sa týka textových
zdrojov, ktoré sú zahrnuté v ročných vedeckých správach a pod.;
• URL textového zdroja zakódovaný v metaúdajovom zázname je založený na
trvalej identifikačnej schéme ako DOIs, URNs, ARKs;
• Používanie DIDL XML-úložiska na zdieľanie textových zdrojov (kapitola
Použitie MPEG-21 DIDL (úložisko-xml) – Balenie (wrapping) zloženého
objektu).
ČASŤ B - Metaúdaje
Povinné:
• Metaúdaje sú štruktúrované ako nekvalifikovaný Dublin Core (ISO
15836:2003);
• Individuálne prvky DC musia byť použité v súlade s kapitolou Použitie
metaúdajov OAI_DC na strane 49.
22
Odporúčané:
• Odporúča sa použitie metaúdajov, ktoré sú štruktúrované podľa
komplexnejších schém, ako sú kvalifikovaný Dublin Core alebo MODS.
(Príručky k týmto komplexným schémam budú zahrnuté v ďalších verziách
príručky DRIVER12);
• Odporúčaný jazyk je angličtina;
• Odporúčaný jazyk pre abstrakt v článku (použitie abstraktu je dobrovoľné) je
angličtina.
ČASŤ C – Zavedenie OAI-PMH
Povinné:
• Repozitár musí byť kompatibilný s OAI-2.0 a musí vyhovovať špecifikáciám v
kapitole Použitie OAI-PMH na strane 35;
• Existencia identifikátora repozitára a používanie identifikačnej schémy OAI;
• Ak (a iba v tomto prípade) repozitár obsahuje iné zdroje ako tie, ktoré sú
povinné podľa kapitoly ČASŤ A – Textové zdroje, množina OAI (set)
identifikuje zbierku digitálnych textových zdrojov dostupných bez obmedzení
(Open Access) (pozri kapitoly Pomenúvanie množín DRIVER, Definície
obsahu množiny DRIVER a Umiestnenie množín na stranách 43 – 44).
Odporúčané:
• Umožnenie zmeny základného URL;
• Úplnosť v identifikačnej odpovedi (identify response) pri overovaní totožnosti,
vrátane použitia voliteľného opisného zápisu (Description Statement);
• Použitie konštantnej alebo prechodnej vymazávacej stratégie;
• Použitie takej veľkosti súboru, ktorá zodpovedá dĺžke platnosti tokenu.
12 12 Ukážka štandardov MODS h tt p s : / /www . s ur fg r o e p e n . nl /si t e s/oai/ m e t a d a t a/ S h a red % 20 D o c u m e n t s/Us e % 20of % 20 MODS% 20f o r%20i ns ti tutio na l%20 repo s i to ri es -v ersio n%201 .do c
23
Novinky
Kapitola 1: Použitie OAI-PMH
Pomenúvanie množín DRIVER
Pre detailnejšie informácie o odporúčanom pomenúvaní množín pri podzbierkach „otvorený
prístup“ a „oneskorený prístup“ pozri Pomenúvanie množín DRIVER na strane 41.
Vysvetlenie: P re hybridné repozitáre so zmiešanými zdrojmi obsahujúcimi iba metaúdaje
a metaúdaje s úplnými textami je odporúčané použitie množín DRIVER so záznamami,
ktoré obsahujú úplné neobmedzene dostupné texty. Takisto by súbory DRIVER nemali
obsahovať záznamy s oneskoreným prístupom, pretože koncový používateľ očakáva, že
získa materiál s otvoreným prístupom.
Odporúčania DRIVER pre množiny eTheses (elektronické kvalifikačné práce) nesmú byť
odlišné.
Vysvetlenie: Odporúčania DRIVER sú určené väčšej komunite. Zozbieraným
kvalifikačným prácam by sa mali venovať pojmy použité v časti Slovník typov
publikovania.
Veľkosť zberného súboru
Odporúča sa zvýšenie odporúčanej veľkosti dávkového súboru zo 100 – 200 záznamov
v jednej dávke na 100 – 500 záznamov. Pozri Objem zbieraných údajov na strane 41.
Vysvetlenie: Zo skúseností vieme, že problémy s prerušením komunikácie v OAI ListRecords
sa vyskytujú iba zriedkavo. Najvyšší počet záznamov získaných pri jednej odpovedi bol
doteraz okolo 6 500 záznamov. Pozitívne dôsledky veľkého zberného súboru sú, že proces
zberu je veľmi rýchly, a tak majú tieto repozitáre veľkú priechodnosť.
Životnosť pri obnovení tokenu
Životnosť tokenov definuje, ako dlho je token (blok textu) platný od vytvorenia.
24
Dôkladnejšie vysvetlenie pozri Obnovenie tokenu na strane 40.
Vysvetlenie: Medzi životnosťou, objemom pretečených údajov a priechodnosťou je určitý
vzťah. Ak je priechodnosť malá a objem pretečených údajov nízky, životnosť obnovovaného
tokenu by sa mala predĺžiť. Na druhej strane sa môže stať, že sa opakovane naimportuje iba
prvý zberný súbor.
Stratégia vymazania záznamov
Text príručky DRIVER vysvetľuje, prečo je dočasná/trvalá stratégia výhodná pre repozitár,
ale aj pre poskytovateľov služby.
Vysvetlenie: Výhodou pre repozitár v prípade, že si uchováva údaje o vymazaní záznamov
je, že poskytovateľ služby nezobrazí záznamy, ktoré už v repozitári nie sú dostupné. Okrem
toho, táto stratégia umožňuje zberateľom zdrojov vyhnúť sa opätovnému načítaniu celého
repozitára, čím zefektívňuje proces zberu údajov. Pozri Vymazanie záznamov na strane 39.
Kapitola 2: Použitie metaúdajov OAI_DC
Identifikátor
Ako si poradiť s inými identifikátormi, ktoré sú v repozitári? Sú identifikátory OAI povolené?
Na čo by mal identifikátor smerovať? Ako by mal byť označený?
Vysvetlenie: Identifikácia zdroja sa rozšírila. Repozitár môže použiť akýkoľvek identifikátor,
ktorý je nevyhnutný na určenie zdroja. Na druhej strane sa tu musí vyskytovať aspoň
jeden premenný identifikátor, ktorý poukáže na externú stránku obsahujúcu úplný
dokument, alebo ktorá na tento dokument naviguje.
V prípade výskytu viac ako jedného premenného identifikátora, poskytovateľ služby použije,
podľa preddefinovaných nastavení, prvý premenný identifikátor v zozname, ku ktorému
koncového používateľa naviguje. Pozri Identifikátor na strane 68.
25
Dátum
Čo urobíme v prípade, že dátum odporúčaný v príručke DRIVER (dátum vytvorenia) nie je
v repozitári dostupný?
Príručka DRIVER uvádza: „Použitie prvku DC ‘dátum’ pre hodnotu [po prenesení”:> date
Published“. Uprednostňovaný je dátum zverejnenia, pretože je pre koncového používateľa
najužitočnejší. V prípade, že nie je možné použiť dátum zverejnenia, treba použiť akýkoľvek
iný dátum. Je lepšie použiť akýkoľvek dátum, ako nepoužiť dátum vôbec. Pozri Dátum na
strane 62.
Vysvetlenie: Nastali dve zmeny:
1. Dátum vytvorenia sa zmenil na dátum zverejnenia; tento dátum je pre
koncového používateľa najužitočnejší.
2. V prípade, že ho nie je možné použiť, treba použiť zodpovedajúci iný dátum; je
lepšie použiť akýkoľvek dátum, ako nepoužiť dátum vôbec!
Čo urobiť s viacnásobnými dátovými poľami?
V prípade OAI-DC používajte iba jedno dátové pole, pokiaľ možno dátum zverejnenia.
Vysvetlenie: Viac ako jedno pole s označením dátumu spôsobuje zmätok, keďže v
jednoduchom DC nie je možné zadávať kvalifikátory. Poskytovateľ služby použije podľa
nastavenia prvý dátum v zozname na spracovávanie, indexovanie a prezentáciu.
Pozri Dátum na strane 62.
Práva
Vysvetlenie: Ako používať pole dc:rights, pozri Práva na strane 73.
Jazyk
Kódovacie odporúčania sa zmenili na ISO 639-3. ISO 639-1 a -2 sú naďalej povolené, keďže
môžu byť správne skonvertované.
26
Vysvetlenie: Pri kódovaní v ISO 639-3 je možné použiť oveľa viac jazykov ako v ISO 639-
1, dokonca aj historické a vnútroregionálne jazyky. Takto sa jednoduchšie vysvetľujú určité
publikácie. ISO 639-2 má dva kódovacie typy (b a t), ktoré nie sú jednoznačné, keď sú
použité v OAI-DC. ISO 639-2 ani neposkytuje možnosť použiť príznak, ktorý by určil, ktorá
z týchto dvoch kódovacích schém bola použitá.
Pozri Jazyk na strane 70.
Autor
Systém DRIVER stanovuje: „Keď je pri uvedení autora dostupné krstné meno aj celé meno,
používa sa toto formátovanie: <dc:creator> Janssen, J. (John)</dc: creator >“
KOMENTÁR: Čo v kontexte tohto príkazu znamená, že sú obe dostupné?
Zmenené úplné meno a krstné meno na prvé meno.
Vysvetlenie: Odporúča sa používať štandardizovaný štýl písania mien, takže pokiaľ je to
možné, použite štýl, ktorý uvádza vydavateľ. Keď sa tento štýl nedá použiť, použite štýl
zapisovania bibliografie podľa APA ako v referenčnom zozname (ak sa tento štýl dá použiť).
Ak sú obe mená k dispozícii, prvé, aj krstné meno (ktoré sa vzťahuje na prvé meno), použite
formátovanie, v ktorom je prvé meno napísané v zakrivených hranatých zátvorkách po mene
v štýle APA. Potom by syntax mala vyzerať nasledovne: {priezvisko}, {prvé meno} ({krstné
meno}).
Napríklad:
• John Kennedy zapíšeme ako: Kennedy, J. (John),
• John F. Kennedy zapíšeme ako: Kennedy, J. F. (John),
• John Fitzgerald Kennedy zapíšeme ako: Kennedy, J. F. (John, Fitzgerald),
• a J. F. Kennedy zapíšeme ako: Kennedy, J. F., pretože úplné prvé meno
nebolo dostupné.
Pozri Autor na strane 57.
27
Zdroj
Nefunkčný odkaz uvedený v Príručke pre kódovanie informácií o bibliografických citáciách v
Dublin Core Metadata. http://epub.mimas.ac.uk/DC/dc-citation-guidelines/ sa zmenil na:
http://dublincore.org/documents/dc-citation-guidelines/
Typ
Zmena slovníka
Kvôli pretrvávajúcemu zmätku v rámci medzinárodného spoločenstva repozitárov v pojmoch
pre typy publikovania, experti na príručku DRIVER vyvinuli dva oddelené slovníky. Jeden
vysvetľuje odhalený typ publikovania a druhý verzie použité vo vedeckej komunikácii.
Možno ich pridať k typom publikovania, aby sme išli ešte viac do hĺbky, a tak ešte detailnejšie
objasnili možnosti zverejnenia.
Typy publikovania sú dobre premyslené typy, ktoré neobjasňujú typ dokumentu, ale spôsob
zverejnenia. Tieto typy zverejnenia sa bežne používajú pri vedeckých postupoch. Podmienky
sú zvolené tak, aby vytvorili rovnováhu medzi príliš špecifickým (takým, ktoré sa vzťahuje iba
na jednu vedeckú komunitu), a nie príliš všeobecným.
Iný aspekt, ktorý chýbal, je menný priestor, ktorý vytvára úroveň autority kontrolovaného
slovníka. Identifikátor typu publikovania URI info:eu-repo menný priestor (namespace) bol
predstaviteľmi rozhrania schválený, aby slúžil na tento účel.
Pomocou týchto kritérií sa vytvorila slovná zásoba DRIVER pre typy publikovania.
Pozri Slovník typov publikovania na strane 109.
Pre typy verzií pozri Slovník vezií na strane 113.
Diskusia o terminológii
Aký je rozdiel medzi konferenčnou správou a konferenčnou prednáškou?
Vysvetlenie: Rozdiely sa zotreli zavedením všeobecnejšieho pojmu „Konferenčný objekt“.
Výstupy verejného projektu máp prechádzajú do sekcie Externá vedecká práca, technická
správa do sekcie Výskumná práca a úvodníky do Článku?
28
Vysvetlenie: Uskutočnili sa konverzie. Pozri Mapovanie typov DRIVER na str. 78. Opis
terminológie je k dispozícii.
Formát
Vysvetlenie: Obmedzuje sa zoznam formátov. Tento zoznam je iba podzoznam všetkých
bežných formátov, ktoré sa môžu použiť v tomto type polí. Pridali sme formát Open
Document Text: vnd.oasis.opendocument.text.
Podrobnejší zoznam sa nachádza na stránke http :// www . i a n a . o rg/ ass ig nm e nts / m e d i a - typ e s/ .
Pozri Formát na strane 66.
Kapitola 3: Použitie osvedčených postupov pre OAI_DC
Mapovanie typov DRIVER
Vysvetlenie: Ako priradiť [x] Lokálne kategórie do kategórie [y] DRIVER.
Pozri Mapovanie typov DRIVER na str. 78.
Mapovanie verzií DRIVER
Vysvetlenie: Ako používať rôzne stavy/verzie publikácií a ako priradiť [x] Lokálne kategórie
do kategórie [y] DRIVER (version).
Pozri Mapovanie verzií DRIVER na strane 79.
Použitie OAI_DC v kvalifikačných prácach
Vysvetlenie: Ako používať OAI_DC v kvalifikačných a dizertačných prácach bez toho, aby
sa stratil princíp interoperability.
Pozri Použitie OAI_DC v kvalifikačných prácach na strane 81.
29
DC:SOURCE a DC:RELATION
Vysvetlenie: Ako používať polia DC:source a dc:relation s ohľadom na vedeckú komunikáciu
a repozitáre.
Pozri DC:SOURCE a c i t ačné informácie na strane 82 a DC:RELATION a prepojenie
súvisiacich objektov na strane 83.
Kapitola 4: Balenie (wrapping) zloženého objektu
Nastalo zopár dôležitých zmien:
• nesprávne umiestnenie DIDL schémy, nemožné overenie,
• zmena v odkaze na štandard menného priestoru info:eu-repo,
• zmeny sú takisto ilustrované na príklade,
• zmeny umožňujúce, aby bol systém v budúcnosti schopný presunúť
idenntifikátory autorov.
Pridaný menný priestor a zmeny v overovaní umiestnenia menného priestoru
<didl:DIDL xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:diext="http://library.lanl.gov/2004-04/STB-RL/DIEXT" xmlns:dii="urn:mpeg:mpeg 21:2002:01-DII-NS" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" urn:mpeg:mpeg21:2002:02-DIDL-NS http://purl.lanl.gov/STB-
RL/schemas/2004-08/DIDL.xsd urn:mpeg:mpeg21:2002:01-DII-NS
http://purl.lanl.gov/STB-RL/schemas/2003-09/DII.xsd
http://library.lanl.gov/2004-04/STB-RL/DIEXT
http://purl.lanl.gov/STB-RL/schemas/2004-04/DIEXT.xsd">
sa zmení na:
30
<didl:DIDL xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" xmlns:dip="urn:mpeg:mpeg21:2005:01-DIP-NS" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" urn:mpeg:mpeg21:2002:02-DIDL-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/did/didl.xsd urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dii/dii.xsd urn:mpeg:mpeg21:2005:01-DIP-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dip/dip.xsd">
Zmeny prvku Container, aby sa vytvorila lepšia sémantická interpretácia
<didl:DIDL><didl:Container> <didl:Item>…</didl:Item> <didl:Item>…</didl:Item> <didl:Item>…</didl:Item> </didl:Container> </didl:DIDL>
sa zmení na:
<didl:DIDL> <didl:Item> <didl:Item>…</didl:Item> <didl:Item>…</didl:Item> <didl:Item>…/didl:Item> </didl:Item> </didl:DIDL>
Zmeny deklarácie typu objektu pre zbieranú položku
31
<didl:Descriptor><didl:Statement imeType="text/plain">metadata</didl:Statement> </didl:Descriptor>
sa zmení na:
<didl:Descriptor> <!-- ObjectType of Item --> <didl:Statement mimeType="application/xml"> <dip:ObjectType>info:eu-repo/semantics/descriptiveMetadata</dip:ObjectType> </didl:Statement> </didl:Descriptor>
• 'object' sa zmení na 'objectFile'
• 'Jump-off-Page’ sa stane 'humanStartPage'
Textový dohovor je camelCase, ktorý začína malými kapitálkami.
Použitie trvalých identifikátorov v DIDL
Táto časť vysvetľuje pozíciu trvalých identifikátorov a „umiestnenie, ktoré treba použiť pre
rozlišovacie mechanizmy“.
Na vrchnú úroveň p rvku položky (Item Element) je nevyhnutné pridať prvok
komponentu/zdroja (Component/Resource Element), ktorý odkazuje na premennú URL tohto
DIDL dokumentu bez prvkov OAI-PMH.
Ak tento proces nie je možné uskutočniť hneď, potom treba použiť URL z Human Start Page.
<didl:DIDL>
<didl:Item> <didl:Descriptor> <didl:Statement mimeType="application/xml"> <dii:Identifier>urn:NBN:nl:ui:10-1705/6748398729821</dii:Identifier>
32
</didl:Statement> </didl:Descriptor> ... <didl:Component> <!-- Actual resource of Item --> <didl:Resource mimeType="application/xml" ref="http://localhost/xmlContainer-v2.3.xml"/> </didl:Component>
<didl:Item>...</didl:Item> <didl:Item>...</didl:Item> <didl:Item>...</didl:Item>
</didl:Item> </didl:DIDL>
Generický metadataPrefix v OAI-PMH
Táto časť vysvetľuje prečo sa používa skutočný DIDL a nie odvodená schéma.
<request metadataPrefix="dare_didl"
sa zmení na:
<request metadataPrefix="didl"
Kapitola 5: Použitie slovníkov a sémantiky
Vytvorili sa dva slovníky, ktoré odstránia nejednoznačnosť v konceptoch a pojmoch vo
vedeckej komunikácii v Európe.
Vyriešili sa ďalšie problémy:
• Typ dokumentu: Označovanie verzií pred tlačou (preprint) a po tlači (postprint).
• Typ dokumentu: Aký je rozdiel medzi dokumentmi „externá výskumná správa“
a „interná správa“?
33
• Zdokonalený slovník typov dokumentu.
• Otázka, či by mala byť kapitola knihy (bookChapter) v slovníku info:eu-repo
všeobecnejšia kvôli zlepšeniu interpretácie, či by sa mala zmeniť na
kombináciu pojmov, napr. kapitola a časť z? Odpoveď: NIE.
• Označovanie verzií časopisov – vylepšený model.
Pridala sa kapitola o použití klasifikačných informácií.
Odporúča sa poskytnúť informáciu o používaní klasifikácií v repozitári v identifikačnej
odpovedi (Identify response) a preniesť klasifikáciu do prvku URI použitím autoritatívneho
menného priestoru. Ak sa nepoužíva žiadna špecifická klasifikačná schéma, DRIVER
odporúča Deweyov desatinný systém.
Pozri Použitie slovníkov a sémantiky na strane 106.
Kapitola 6: Príloha Použitie značiek kvality
Pozri prílohu Použitie značiek kvality na strane 117 pre úvodný dokument.
Príručka DRIVER 2.0 poskytuje základné informácie o dôležitosti kvality a interoperability.
Značky kvality sa používajú na uistenie, že takéto repozitáre sú stabilné a spoľahlivé
a pretrvajú dlhšie ako podvodné zdroje a majú aj archívnu funkciu na dlhodobé uchovanie
dokumentov.
Príkladmi značiek kvality môžu byť Data Seal of Approval a Certifikát DINI.
Kapitola 7: Príloha Použitie trvalých identifikátorov
Pozri prílohu Použitie trvalých identifikátorov na strane 118 pre úvodný dokument.
Trvalé identifikátory pre webové zdroje sú nevyhnutné, aby bolo možné vytvoriť stabilnú
a spoľahlivú infraštruktúru. Toto sa netýka iba technických detailov, ale najmä dohôd na
organizačnej úrovni.
34
Príručka DRIVER môže poskytnúť manažérom repozitárov zopár odporúčaní v oblasti
implementácie. Základ tvorí Správa o trvalých identifikátoroch projektu PILIN (R epo r t on
Persistent I dentifiers of the PI L IN pro j e c t )..
Vytvoril sa aj implementačný plán.
Kapitola 8: Príloha Výmena informácií o štatistikách používania
Pozri prílohu Výmena informácií o štatistikách používania na strane 123 pre úvodný
dokument.
Aby sa dala rozpoznať hodnota dokumentov Open Access a aby ste mohli poskytnúť extra
služby vaším autorom, repozitáre by mali zvážiť vytváranie štatistík využívania.
Na túto problematiku budú zamerané dva projekty, ktoré pomôžu vytvoriť príručku na výmenu
štatistík využívania: P IRU S a O A - Stat i s t ik .
Kapitola 9: Príloha Použitie práv duševného vlastníctva
Pozri prílohu Použitie práv duševného vlastníctva (IPR) na strane 128 pre úvodný dokument.
Táto časť sa týka dôležitej otázky práv použitia a práv uchovania. Tieto opatrenia sa musia
zaviezť do praxe. Príručka DRIVER poskytuje informácie o tom, ako by malo byť použitie
práv a prístup k právam zobrazené a naformátované v metaúdajoch.
35
Použitie OAI-PMH
Úvod
Táto kapitola vysvetľuje, ako používať OAI-PMH, aby repozitáre a poskytovatelia služby mohli
bezproblémovo spolupracovať na vytváraní interoperability na úrovni protokolu.
Poznámka
Čo sa týka príkladov použitých pre DIDL: Nepoužívajte ich doslovne! Pre dôsledné použitie
dokumentu DIDL si treba naštudovať aktuálnu verziu špecifikácie dokumentov DIDL.
Uvedený dokument popiera všetky príklady DIDL, ktoré sú tu spomenuté.
Poďakovanie
Tento dokument sa z veľkej časti zakladá na diskusii medzi manažérmi repozitárov
a predstaviteľmi SURF. Navzájom si vymenili nápady a skúsenosti, aby vytvorili odporúčania
DRIVER v podobe, v akej sú predstavené v tomto dokumente.
Zdrojový materiál
Príručka DRIVER vychádza z protokolu otvorených archívov pre zber metaúdajov,
protokolárna verzia 2.0. (Open Archives Initiative Protocol for Metadata Harvesting, Protocol
version 2.0) a naň sa i odvolávajú.
Pozri: http :// w w w . op e n a r c h ive s . o rg/O A I / op e na r ch ive sp r oto c o l . htm l
V príručke DRIVER je poradie prezentácie rovnaké ako v spise protokolu. V prípade potreby
sa tento text cituje. Ak bol text protokolu upravený, napríklad sa použilo hrubé písmo na
zvýraznenie určitých častí textu, je táto skutočnosť naznačená v zátvorke.
36
Definície a koncepty: položka, záznam a jedinečný identifikátor
Položka a záznam
Je dôležité rozlišovať medzi položkou a záznamom. Protokol uvádza: „...Položka je
z pojmového hľadiska úložisko, ktoré obsahuje alebo dynamicky generuje metaúdaje
o jednom zdroji vo viacerých formátoch, z ktorých každý môže byť zozbieraný ako záznam
pomocou OAI-PMH... Záznamom rozumieme metaúdaje vyjadrené v jednotnom formáte.
Záznam je vrátený v podobe toku bajtov zakódovaných v XML ako odpoveď na žiadosť OAI-
PMH o metaúdaje z položky...“ [MF dodal polotučné písmo].
V rámci DRIVER sa odporúča vytvárať tok údajov zakódovaných v XML podľa špecifikácií
úložiska XML. Tieto špecifikácie sú uvedené nižšie.
Identifikátor
Jedinečný identifikátor definuje položku v rámci repozitára. Nemýľte si tento druh
identifikátora s prvkom dc:identifier v Dublin Core. Identifikátor OAI má odlišnú funkciu:
používa sa na extrahovanie metaúdajov, zatiaľ čo identifikátor DC sa používa na
extrahovanie zdroja. Schematicky:
37
Záznam s metadátami
zakódovanými v XML,
napr. v jednoduchom DC
Dodávateľ dát A Dodávateľ dát B
Mimo
repozitára
Vo vnútri
repozitára
Položka s jedinečným identifikátorom
Záznam s metadátami
zakódovanými v XML,
napr. v MARC-21
Pomenúvanie MetadataPrefix
Pozri: http :// www . op e n a r c h ive s . o rg/O A I / op e na r c h iv e sp r oto c o l . htm l# M e tad a t a N am e spa c es
OAI-PMH podporuje sprístupňovanie záznamov z repozitáru v rozličných metaúdajových
formátoch. Požiadavka ListMetadataFormats poskytuje ako odpoveď zoznam všetkých
metaúdajových formátov. Argumenty metadataPrefix sa používajú v požiadavkách
ListRecords, ListIdentifiers a GetRecord na získanie záznamu alebo záhlavia
záznamu, ktoré obsahuje metaúdaje vo formáte špecifikovanom metadataPrefix. S ohľadom
na interoperabilitu musia repozitáre bezpodmienečne používať Dublin Core. Z tohto dôvodu si
protokol vyhradzuje metadataPrefix ‘oai_dc’, a URL metaúdajovej schémy pre
nekvalifikovaný Dublin Core je: http://www.openarchives.org/OAI/2.0/oai_dc.xsd. URL
zodpovedajúceho menného priestoru XML je: http://www. open arc hives.org/OAI /2. 0/oai_dc /.
Dokument DIDL
DRIVER podporuje implementáciu metadataPrefix ‘oai_dc’ a metadataPrefix ‘didl’.
Každý repozitár DRIVER, ktorý používa úložisko XML musí podporovať metaúdajovú
schému ‘didl’. Špecifikácie ‘didl’ úložiska XML možno nájsť v kapitole Použitie MPEG-21
DIDL (xml-úložisko) – Balenie (wrapping) zloženého objektu na strane 84.
<OAI-PMH ...> <...> <record> <metadata> <didl:DIDL> <didl:Item>...</didl:Item>
Označenie dátumu
Podľa protokolu, každý záznam musí obsahovať hlavičku s označením dátumu „dátum
vytvorenia, úpravy alebo vymazania záznamu za účelom výberového zberu údajov “.
Protokol vysvetľuje výberový zber údajov takto:
• „..úprava – odpoveď musí obsahovať záznam zodpovedajúci argumentu
metadataPrefix, ktorý sa zmenil v intervale argumentov from a until;
38
• vytvorenie – odpoveď musí obsahovať záznam zodpovedajúci argumentu
metadataPrefix, ktorý bol v repozitári sprístupnený v intervale argumentov
from a until;
• vymazanie – v závislosti od úrovne, na ktorej repozitár zachováva údaj
o vymazaní záznamov, odpoveď môže obsahovať záhlavie záznamu
zodpovedajúce argumentu metadataPrefix, ktorý bol odstránený z repozitára
v intervale argumentov from a until. Stav vymazania je označený príznakom
stavu v prvku záhlavia a záznam zároveň neobsahuje žiadne metaúdaje...“
Je veľmi dôležité dbať na uvedenie dátumu podľa špecifikácií protokolu, ako je spomenuté
vyššie. Skúsenosti nás naučili, že mnohé chyby v zbere údajov, ktoré sa vyskytli v
prírastkovom zbere, majú pôvod v zle udanom dátume.
Syntax označovania dátumu
Pozri: http :// w ww . o p e na r c h ive s . o rg/O A I / op e na r c h ive sp r oto c o l. htm l# Dat e sta m p,
http :// www . op e n a r c h ive s . o rg/O A I / op e na r c h iv e sp r oto c o l . htm l# Dat es a
http://www. w3.org/TR /N OTE- datetime
Hodnota označenia dátumu musí byť aj v žiadosti, aj v odpovedi v súlade s špecifikáciami
UTC v danom dokumente. DRIVER podporuje použitie doplnkových prvkov, ktoré zahŕňajú
časové údaje vo formáte RRRR-MM-DDThh:mm:ssZ.
Takáto hodnota je v súlade so špecifikáciami udávania dátumu podľa UTC, ktoré sú opísané
v dokumente OAI-PMH. Dátum musí byť kódovaný podľa ISO8601 a vyjadrený v UTC.
<OAI-PMH ...><...>
<GetRecord><record><header>
<datestamp>2001-12-14T12:01:45Z</datestamp>
Repozitár, ktorý podporuje zadávanie dátumu vo formáte RRRR-MM-DDThh:mm:ssZ by mal
túto skutočnosť naznačiť pri idetifikačnej odpovedi.
39
<OAI-PMH ...><...><Identify>
<granularity>YYYY-MM-DDThh:mm:ssZ</granularity> <...>
Vymazanie záznamov
Pozri: http :// w w w . op e n a r c h ive s . o rg/O A I / op e na r ch ive sp r oto c o l . htm l# D e l e t e d R e c o r ds
Ak záznam už nie je dostupný, považuje sa za vymazaný. Repozitár musí deklarovať jednu
z troch úrovní podpory pre vymazané záznamy v prvku deletedRecord v identifikačnej
odpovedi:
• žiaden – repozitár nezachováva údaje o vymazaných záznamoch. Repozitár,
ktorý vyhlási tento stupeň podpory nemusí uvádzať vymazané záznamy
v žiadnej odpovedi;
• trvalý – repozitár zachováva informácie o vymazaných záznamoch bez
časového obmedzenia. Repozitár, ktorý vyhlási tento stupeň podpory musí
natrvalo zachovávať všetky údaje o vymazaných záznamoch a tiež zobrazovať
ich stav;
• dočasný – repozitár nezaručuje, že zoznam vymazaných záznamov je
kompletný. Repozitár, ktorý poskytuje tento stupeň podpory, môže
k záznamom uviezť stav – vymazaný.
Odporúčania DRIVER vyžadujú, aby repozitáre DRIVER používali možnosť „dočasne“
(‘transient’), ale takisto môžu poskytnúť možnosť „trvalo“ (’persistent’). Takáto
podpora pomáha dodávateľom údajov ľahšie identifikovať vymazané záznamy.
V prípade, že repozitár uchováva informácie o vymazaných záznamoch je výhodou, ak
poskytovateľ služby nezobrazí záznamy, ktoré už v repozitári nie sú dostupné. Okrem toho,
táto stratégia umožňuje dodávateľom údajov vyhnúť sa znovunačítavaniu celého repozitára,
čím sa proces zberu údajov stáva efektívnejším.
40
Použitie označenia dočasný: Ak sa záznam vymaže, repozitár musí označovať túto
skutočnosť aspoň mesiac. Počas tohto obdobia už väčšina dodávateľov údajov prírastkovo
obnovila svoje databázy (bez nutnosti úplného načítania).
V prípade, že repozitár vedie údaje o vymazaných záznamoch, označenie dátumu pri
položkách, ktoré boli vymazané, musí byť dátum a čas, kedy bol záznam vymazaný.
Odpoveď na požiadavku (dotaz) GetRecord a ListRecords o vymazaný záznam musí vtedy
obsahovať h la v i čku s príznakom status=“deleted“. Počas prírastkového zberu údajov sa
potom odhalia vymazané záznamy z repozitárov, ktoré ich evidujú.
Obnovenie tokenu
Pozri: http :// w w w . op e na r c h ive s . o rg/O A I / o p e na r c h ive sp r oto c o l . htm l# I d e mpot e n c y
Repozitáre, ktoré zaviedli obnovenie tokenov (resumptionTokens) to musia urobiť
spôsobom, ktorý umožňuje dodávateľom údajov doplniť sériu požiadaviek tak, aby získali
zoznam s najaktuálnejším obnovením tokenu. Účelom tohto kroku je umožniť dodávateľom
obnovu zo siete, vyhnúť sa iným chybám, ktoré by spôsobili, že sa sekvencia požiadaviek
zoznamu musí opätovne spustiť.
Protokol nespomína životnosť tokenu. Životnosť tokenu je čas, počas ktorého repozitár
uchováva token v pamäti, spolu s informáciou o jeho obnovení. Keď je životnosť tokenu príliš
krátka, repozitár neposkytuje dodávateľovi údajov primeraný čas, aby dokončil zber. Ak
nastane takáto situácia, repozitár už viac nie je v súlade s protokolom – pozri uvedené vyššie:
„tak to musí urobiť spôsobom, ktorý dodávateľovi umožní obnoviť...“
Osvedčený postup: primeraný čas, počas ktorého by mal byť token zachovaný, je aspoň
dvadsaťštyri (24) hodín. Toto nastavenie závisí od veľkosti repozitára a rýchlosti nahrávacieho
procesu. Životnosť obnovenia tokenu by mala byť dostatočná na to, aby ním v tomto časovom
úseku pretiekol žiadaný objem údajov.
Popri optimálnej životnosti obnovenia tokenu musíme dbať i na optimálny objem zbieraných
údajov v rámci jednej dávky – pozri časť Objem zb ieraných údajov .
Ďalším aspektom použitia obnovenia tokenu je voliteľný atribút completeListSize. Tento
atribút by mal poskytnúť celkovú veľkosť dokumentov z odpovede. Táto informácia môže byť
využitá počas zberného procesu a z kontrolných dôvodov môže byť porovnaná s veľkosťou
41
výsledku (napríklad: je zber dokončený, alebo sa prerušil?). Okrem toho, táto informácia
môže byť užitočná pre proces zberu tým, že pomôže odhadnúť čas potrebný na zber.
Obnovenie tokenu v odpovedi v OAI by malo vyzerať takto (atribúty expirationDate,
completeListSize a cursor sú dobrovoľné):
<resumptionToken expirationDate="2008-07-14T23:00:24Z"completeListSize="983" cursor="0">514284267</resumptionToken>
Objem zbieraných údajov
Objem zbieraných údajov je počet záznamov, ktoré repozitár doručí zbernému modulu za
jedno obnovenie tokenu a určí koľko požiadaviek sa už vykonalo.
V súlade s dohodou musia repozitáre DRIVER nastaviť objem toku údajov medzi 100 a 500
záznamov.
Ak všetky repozitáre DRIVER použijú tento objem údajov, umožnia udržiavať optimálny
výkon.
Pomenúvanie množín DRIVER
Pozri: http :// w w w . op e n a r c h ive s . o rg/O A I / op e na r ch ive sp r oto c o l . htm l# S et
OAI-PMH dokument uvádza: Repozitáre môžu usporiadať položky do množín. Usporiadanie
množín môže byť jednotné, tzn. jednoduchý zoznam, alebo hierarchické.
Hybridné repozitáre DRIVER, ktoré obsahujú iba metaúdaje alebo metaúdaje a zdroje
s úplnými textami, musia podporovať aspoň jednu množinu DRIVER. Množina DRIVER je
jednotná a nemá hierarchickú štruktúru. Obsah množiny DRIVER má Open Access a voľne dostupné zdroje. Zdroje s pozdržaným alebo neumožneným prístupom sa nesmú nachádzať
v tomto zozname, aby sa predišlo nejasnostiam na strane koncových používateľov.
Nasledujúca tabuľka predstavuje uprednostňované pomenúvanie množín (setName)
a špecifikáciu množín (setSpec), ktoré môžu byť použité na vytvorenie množiny DRIVER.
42
setName setSpec *Množina DRIVER Open Access Driver
*Zberný modul používa iba žiadosť „ setSpec“ aby vykonal selektívny zber. Písmená musia
byť kapitálky.
Definície obsahu množiny DRIVER
Špecifický obsah množiny ‘driver’ určuje lokálny repozitár. Repozitár DRIVER, ktorý používa
tento druh množín musí pri vkladaní záznamu do množiny dodržiavať nasledujúce
pravidlá:
• Množina DRIVER obsahuje záznamy, ktoré musia obsahovať digitálne textové
zdroje s neobmedzeným prístupom:
o musia obsahovať úplné texty, nielen metaúdaje,
o obsah je voľne prístupný,
o obsah nie je za firewallom,
o obsah je prístupný aj mimo fyzických priestorov repozitára,
o obsah sa nenachádza na spoplatnených stránkach.
Nasledujúci obrázok ukazuje, že možno umiestniť jeden záznam do rôznych množín.
Záznamy, označené na obrázku modrou bodkou, sa nachádzajú i v množine ‘driver’. Dva
záznamy sa nachádzajú vo všetkých troch množinách – v množine biochémie, neurofyziky
a driver. Prvé dve sú množiny, ktoré označujú predmet, množina driver označuje typ
(neobmedzený prístup). Záhlavie záznamu alebo neobsahuje nijaké, alebo obsahuje viac
špecifikácií setSpec. Záznam OAI môže vyzerať napríklad takto:
<record> <header>
<identifier>oai:repository:it/0112017</identifier> <datestamp>2002-02-28</datestamp> <setSpec>biochemistry</setSpec> <setSpec>neurophysics</setSpec><setSpec>driver</setSpec>
43
</header><metadata>
<oai_dc:dc xmlns:oai_dc="http ....</record>
Ilustrácia:
Záznamy v množine DRIVER
Všetky záznamy v miestnom repozitári
Záznamy v množine biochémia
Záznamyv množine neurofyzika
Umiestnenie množín
Množiny DRIVER a ostatné množiny môžu byť umiestnené na rôznych miestach/URL.
adminEmail pre nahlásenie chybného prihlásenia
Pozri: http :// w w w . o p e na r c h ive s . o rg/O A I / op e na r c h ive sp r oto c o l. htm l# I d e nt ify
Repozitár musí v identifikačnej žiadosti poskytnúť e-mailovú adresu administrátora.
V blízkej budúcnosti chceme dosiahnuť, aby zberné moduly poslali okamžitú odpoveď
administrátorom repozitárov a informovali ich o chybách, ktoré tento repozitár DRIVER
vytvára. Pozri nasledujúcu tabuľku príkladov identifikačných odpovedí, ktoré zahŕňajú e-
mailovú adresu administrátora.
44
<OAI-PMH ...> <...> <Identify> <adminEmail>[email protected]</adminEmail> <adminEmail>[email protected]</adminEmail> <...>
Použitie e-mailovej adresy administrátora (adminEmail) v požiadavke Identify je
povinné a jej použitie je naznačené i v protokole OAI-PMH. Pozri nasledujúci text:
„Sloveso Identify sa používa na získanie informácie o repozitári.“ „Odpoveď musí zahŕňať
jednu alebo viac príkladov nasledujúceho prvku:
• adminEmail: e-mailová adresa administrátora repozitára.“
Popisné provenienčné informácie
Úložisko popisu pri identifikačnej odpovedi sa môže použiť na poskytnutie doplnkových
informácií o repozitári. Poskytovateľ služby môže tieto služby vyhľadať a tak zlepšiť
spracovávanie údajov a poskytovanie služieb založených na metaúdajoch a ich kvalite.
Osvedčený postup: Využite toto úložisko na detailné popísanie maximálneho množstva
bežných informácií o repozitári a pridajte príklady. Tento postup zahŕňa použitie
klasifikačných schém (v akom formáte a v akom prvku), použité slovníky (typ, jazyk),
stratégie a informácie o pozadí repozitára.
Kým sa identifikačná odpoveď zaoberá úrovňou repozitáru, úroveň záznamu môže
obsahovať doplnkové informácie o prvku about. Aby sa poskytovateľom služby umožnilo
sprístupniť zozbieraný materiál, môže sa použiť subprvok provenance.
Osvedčený postup: Použite prvok provenance v tagu metaúdajov about, aby sa prepojil
s pôvodným doručiteľom dokumentu.
<about> <provenance xmlns=http://www.openarchives.org/OAI/2.0/provenance xmlns:xsi=http://www.w3.org/2001/XMLSchema-instance xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/provenanc
45
e
http://www.openarchives.org/OAI/2.0/provenance.xsd"> <originDescription harvestDate="2002-02-02T14:10:02Z" altered="true"> <baseURL>http://the.oa.org</baseURL> <identifier>oai:r2.org:klik001</identifier> <datestamp>2002-01-01</datestamp>
<metadataNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadataNamespace> <originDescription harvestDate="2002-01-01T11:10:01Z" altered="false"> <baseURL>http://some.oa.org</baseURL> <identifier>oai:r2.org:klik001</identifier> <datestamp>2001-01-01</datestamp> <metadataNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadataNamespace> </originDescription> </originDescription> </provenance> </about>
Deklarácia prvkov prefix a menný priestor
Pozri: http://ww w. opena rc hives. org/OAI /openarchivesprotoc ol. html#R ec ord
Deklarácie menného priestoru použitého v rámci časti metaúdajov, z ktorého každý má prefix
xmlns. Deklarácie menného priestoru v rámci metaúdajovej časti spadajú do dvoch kategórií:
• špecifický menný priestor/y metaúdajového formátu – každá časť metaúdajov
musí obsahovať jeden alebo viac príznakov s prefixom xmlns, ktoré definujú
zhodu medzi metaúdajovou formátovou predponou – napr. didl –
a menným priestorom URI (ako ho definuje XML špecifikácia menného
priestoru) daného formátu metaúdajov. Niektoré metaúdajové formáty
využívajú príznaky rozličných menných priestorov a vyžadujú atribúty
s viacnásobnými xmlns predponami. V nasledujúcom príklade zobrazené ako
‘XML validácia’ sa nachádzajú vyhlásenia oboch oai_dc aj dc;
• menný priestor schémy xml – každá časť metaúdajov musí obsahovať
46
príznak xmlns:xsi, ktorého hodnota vždy musí byť URI zobrazené v príklade,
ktorý je mennou schémou URI pre schému XML; sxi:schemaLocation –
hodnota ktorej je pár: „URI, URL“; prvý je URI menného priestoru (ako ho
definuje XML špecifikácia menného priestoru) metaúdajov, ktoré nasledujú
v tejto časti a druhý je URL XML schémy pre overenie metaúdajov.
Odporúča sa použiť prefixy a menné priestory tak, že tieto entity by mali byť deklarované na
prvom prvku daného menného priestoru. Takto sa predíde „prevádzkovým ťažkostiam“, ako
ich popisuje http :// www . w 3. o rg/ T R / R E C - x m l - nam e s /# ns - us i n g.
„Použitie prefixov môže viezť k prevádzkovým ťažkostiam v prípade, že atribút vyhlásenia
menného priestoru nie je viazaný priamo na entitu XML dokumentu, ale poskytuje sa cez
preddefinovaný atribút deklarovaný v externej entite.“
Príklad odporúčaného použitia prefixov a menných priestorov.
<OAI-PMHxmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="
http://www.openarchives.org/OAI/2.0/http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"
><...><metadata>
<didl:DIDLxmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" xmlns:dcterms="http://purl.org/dc/terms/"xsi:schemaLocation="
urn:mpeg:mpeg21:2002:02-DIDL-NS http://standards.iso.org/.../didl.xsd urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/.../dii.xsd"
><...>
</didl:DID></metadata></...>
<OAI-PMH>
47
Iná situácia nastáva, ak je napríklad DIDL dokument považovaný za autonómnu entitu,
ktorá môže existovať mimo záznamu OAI. K eď vytvárame výstrižok z tohto DIDL dokumentu,
mal by byť validovaný samotným validátorom XML. To znamená, že nepotrebuje texty
vyhlásení menného priestoru, ktoré boli ponechané v OAI-PMH xml.
Podľa vyhlásenia v tom istom dokumente http://www . w3.org/T R / R EC - xml - names/#ns - using ) ,
v súlade s DRIVER je možnosť deklarovať prefixy a menný priestor v predchádzajúcich
verziách dokumentu.
„Ak nie je prefix menného priestoru xml alebo xmlns, m u s í byť uvedený v atribúte
vyhlásenia menného priestoru buď v úvodnom príznaku (start-tag) prvku, pri ktorom sa
používa prefix, alebo v prvku predchodcovi (t. j. v prvku, v obsahu ktorého sa vyskytuje
prefixové označenie).“
Príklady nepovinného použitia prefixov a menných priestorov:
<OAI-PMH xmlns=http://www.openarchives.org/OAI/2.0/ xmlns:xsi=http://www.w3.org/2001/XMLSchema-instance xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" xmlns:dcterms=http://purl.org/dc/terms/ xsi:schemaLocation=" http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd urn:mpeg:mpeg21:2002:02-DIDL-NS http://standards.iso.org/.../didl.xsd urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/.../dii.xsd "> <...> <metadata> <didl:DIDL> <...> </didl:DIDL> </metadata> </...> <OAI-PMH>
48
Validácia xml
Kód XML, ktorý poskytuje repozitár, sa bude automaticky validovať počas registračného
procesu repozitára DRIVER a procesu zberu údajov. Repozitár DRIVER musí poskytnúť
overený kód XML, ktorý je v súlade so všetkými používanými schémami XML (OAI-PMH,
DIDL, oai-dc atď.).
Kontrola sa uskutočňuje pomocou validátora XML (napríklad pomocou softvéru altova:
www . a l to v a .c o m ) uložením výstupu z repozitára vo formáte dokumentu xml a jeho
následným otvorením v overovacom softvéri.
Aby bolo možné XML dokument skontrolovať, musí byť vo vnútri dokumentu použité
umiestnenie schémy, podľa ktorej sa uskutoční validácia: xsi:schemaLocation(s).
Pre schému <OAI-PMH> použite:
<OAI-PMH xmlns=http://www.openarchives.org/OAI/2.0/ xmlns:xsi=http://www.w3.org/2001/XMLSchema-instance
xsi:schemaLocation=" http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
Pre schému <oai_dc:dc> použite:
<oai_dc:dc xmlns:oai_dc=http://www.openarchives.org/OAI/2.0/oai_dc/ xmlns:dc=http://purl.org/dc/elements/1.1/ xsi:schemaLocation=" http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/simpledc20021212.xsd" >
49
Pre schému <didl:DIDL> použite:
<didl:DIDL xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dcterms=http://purl.org/dc/terms/ xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" xmlns:dip="urn:mpeg:mpeg21:2005:01-DIP-NS" xmlns:xsi=http://www.w3.org/2001/XMLSchema-instance xsi:schemaLocation=" urn:mpeg:mpeg21:2002:02-DIDL-NShttp://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/did/didl.xsd urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG- 21_schema_files/dii/dii.xsd urn:mpeg:mpeg21:2005:01-DIP-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG- 21_schema_files/dip/dip.xsd">
Pre iné schémy použite rovnaký princíp; zachovávajte metaúdaje nezávislé od protokolu
OAI-PMH.
Komunikácia pri úpravách repozitára
Úpravy baseURL, setSpec, metadataPrefix alebo schémy metaúdajov
Keď repozitár DRIVER zmení buď baseURL, setSpec, metadataPrefix, alebo schémy
metaúdajov a tým ovplyvní obeh obsahu DRIVER, musí administrátor daného repozitára
o tejto skutočnosti informovať správcu DRIVER a predovšetkým administrátora zberu údajov
v DRIVER (h tt p: // h e l pd e sk .d ri v e r.r e s e arc h -i n frastr u ct u r e s . e u/ ) .
50
Použitie metaúdajov OAI_DC
Táto kapitola opisuje spôsob, akým si DRIVER predstavuje interoperabilitu vo vedeckej
komunikácii, to znamená využívanie metaúdajov záznamov založené na definovaných
štandardov.
Poďakovanie
Tento dokument sa z veľkej časti zakladá na odporúčaniach, ako používať nekvalifikovaný
(jednoduchý) štandard metaúdajov Dublin Core, ktorý je popísaný v dokumente: USING
SIMPLE DUBLIN CORE TO DESCRIBE EPRINTS Version 1.2 (Použitie jednoduchého DC
na opis softvéru e-print Verzia 1.2), vytvorenom Andym Powellom, Michaelom Dayom a
Petrom Cliffom z UKOLNu, University of Bath.
Pozri: http://ww w. intute . ac .uk/public ations/eprints- uk/simpledc - guideli nes.html
So svojimi spolupracovníkmi doplnili do príručky DRIVER ďalšie informácie, opisy,
vysvetlenia, komentáre, návody na použitie a osvedčené postupy s cieľom dosiahnuť
syntaktickú a sémantickú interoperabilitu, ktorá bude vyhovovať väčšine európskych
repozitárov.
Definície
„Inštitucionálny repozitár je systém, skladajúci sa z hardvéru, softvéru, údajov a procedúr,
ktorý obsahuje digitálne zdroje reprezentujúce ľubovoľný vedecký výstup...”
„...digitálne zdroje = akýkoľvek tok bitov, nezávislý od obsahu alebo formátu, ktorý oprávnená
osoba označila za vedecký výstup...”
V rámci tohto dokumentu používame slovo „zdroj“, aby sme popísali príklady vedeckých
výstupov a slovo „objekt“, ktorý sa vzťahuje na tok digitálnych bitov.
Keď používame slovo „žiadosť“ máme na mysli: „1. niečo vyžadované, potrebu. 2. niečo, čo
je špecifikované ako povinné.13“
13 Compact Oxford Dictionary of Current English, tretie vydanie
51
Keď používame slovo „odporúčanie“, máme na mysli: „1. zvážiť schválenie, keďže je daný
aspekt vhodný na určitý účel alebo úlohu. 2. poradiť ako vhodný postup. 3. urobiť
zaujímavým alebo žiaducim.13“
Úvodné poznámky
Rozsah použitia
Príručka DRIVER je napísaná tak, aby v prvom rade umožnila výmenu metaúdajov medzi
poskytovateľmi obsahu a službami DRIVER v súlade s definíciami DCMI pre nekvalifikovaný
(jednoduchý) Dublin Core, ako je uvedené v špecifikáciách OAI-PMH.14 V princípe
odporúčania DRIVER popisujú konverziu (mapovanie) funkcií z vnútorného formátu do
nekvalifikovaného (jednoduchého) DC, aby sa tak podporil zber údajov. Nie sú určené na
použitie ako katalogizačné inštrukcie.
Pri práci podľa príručky DRIVER musia manažéri repozitárov prijať skutočnosť, že nie všetko
sa dá vyjadriť pomocou nekvalifikovaného DC, preto sa tieto odporučenia zameriavajú na
najdôležitejšie informácie z perspektívy koncového používateľa, ktorý nie je knihovník.
Minimálne požiadavky
• Metaúdaje sú štruktúrované ako nekvalifikovaný Dublin Core (ISO
15836:2003).
• Jednotlivé prvky DC sa používajú v súlade s príručkou, pozri prílohu.
• Použitie kódovania Unicode je povinné.
• Hodnoty (t. j. súčasný obsah) prvkov DC uvedených nižšie nesmú
obsahovať značky HTML (alebo XML). Môžu obsahovať príkazy LaTeX, ale
neexistuje mechanizmus, ktorý by explicitne prikazoval použitie LaTeX.
14 Špecifikácie OAI-PMH „S ohľadom na interoperabilitu musia repozitáre bezpodmienečne používať DublinCore.“ http://www.openarchives.org/OAI/openarchivesprotocol.html#MetadataNamespaces
52
Odporúčania
• Znázorniť metaúdaje v podrobnejšej štruktúre, akou je napríklad kvalifikovaný
Dublin Core alebo MODS. (Bude doplnené v budúcnosti v dodatkoch k
príručke DRIVER).
• Odporúčania k metaúdajom DRIVER sa vzťahujú na metaúdaje iba ako na
výmenný formát. Nekódujú napevno odporúčania z príručky DRIVER, ani
nepoužívajú funkcie medzi lokálne implementovanými podrobnými
metaúdajovými štruktúrami a odporúčaniami DRIVER.
• Odporúčaný jazyk pre popisné informácie je angličtina, aby si koncový
používateľ mohol prezrieť prínosné dokumenty, ktoré sú štandardne „uzavreté“
v národnom kontexte.
Vydania a rozdiel v intelektuálnom obsahu
Ak je intelektuálny obsah rovnaký, na rôzne vyjadrenia digitálneho objektu (napríklad na
postscript a pdf verziu) by sa použil iba jeden metaúdajový záznam.
Keď je intelektuálny obsah rozdielny, štandardne sa vytvára nový metaúdajový záznam. Tento
jav nastáva napríklad, ak vyjde nové „vydanie“ so zmenami v intelektuálnom obsahu. Vtedy sa
odporúča zaužívaný postup – použiť prvok, ktorý prepojí aktuálnejšiu verziu s tou staršou.
Klasifikačné schémy a stratégie recenzovania
V niektorých prípadoch môžu zberné moduly alebo poskytovatelia služby využiť doplnkovú
informáciu o lokálnych stratégiách recenzovania, o použití prvkov metaúdajov dc:subject a
dc:type v lokálnych klasifikačných schémach alebo o regulovanom slovníku kľúčových slov.
Poskytovateľ obsahu štandardne sprostredkúva takýto typ informácií prostredníctvom
‘Identifikačnej žiadosti’ na úrovni inštitucionálneho repozitára (IR); nie na úrovni metaúdajov.
Pozri napríklad: 3. Príručka pre voliteľné úložiská na http :// www . op e na r c h iv e s .
o rg/O A I /2 . 0/g u i d eli n e s . ht m a http://arXiv . org/oai2?verb= I dentify ako príklady osvedčených
postupov. Na úrovni prvku dc môžeme tento krok vykonať pridaním URI k pojmu.
V prípade klasifikačných schém, ktoré ešte nemajú menný priestor, môže byť dodanie sub-
menného priestoru k mennému priestoru info-uri užitočné (pozri www . info - uri . info ) .
Zjednodušovanie a kvalifikátory
53
Niekoľko slov o použití spresnenia (kvalifikátorov): Pri konverzii do nekvalifikovaného
DC sa poskytovateľ obsahu musí rozhodovať o vypustení „nadbytočných potrieb“, ak je
interný formát „bohatší“ ako nekvalifikovaný DC. To znamená, že počas konverzie sa všetky
spresnenia jednoducho vypustia (zjednodušovací princíp DCMI). Dôsledkom
zjednodušovacieho princípu je preddefinovaný jednoduchý formát prvku, t. j. bez spresnenia.
Napríklad, keď interný formát rozlišuje medzí titulom a podtitulom, v DC sa daná schéma
zobrazí nasledovne:
Interný formát245 $aMain title$sSub-title
Kvalifikovaný DC<dc:title>Main title</dc:title><dcterms:alternative>Sub- title</dcterms:alternative>
Nekvalifikovaný DC<dc:title>Main title:Sub-title </dc:title>
Preddefinované výklady prvkov dc
V rámci DRIVER sú nasledujúce hodnoty vybrané ako predvolené (default) hodnoty pre
oai_dc:
dc:description -> default “abstract”
dc:date -> default “published”
dc:audience -> default “education level”
Znamená to, že prvok dátum sa vždy týka dátumu uverejnenia atď. Všetkým poskytovateľom
obsahu sa odporúča poskytnúť túto informáciu externým zberným modulom ako jednu
z informácií o ich repozitári (pri identifikačnej odpovedi v OAI-PMH).
Tabuľka 1: Príklad oboznámenia poskytovateľov služieb o predvolenom výklade polí s prvkami dc
<OAI-PMH>
54
<Identify> <description> <eprints> <metadataPolicy> oai_dc:dc:description(default “abstract”); oai_dc:dc:date(default “published”); oai_dc:dc:audience(default “education level”); </metadataPolicy> </eprints> </description> </Identify> </OAI-PMH>
Prvky: krátky popis
V rámci DRIVER použitie prvkov je:
• povinné (M) = prvok musí byť vždy zaznamenaný v metaúdajovom zázname.
Prázdne prvky nie sú povolené;
• povinné v prípade použiteľnosti (MA) = keď sa dá prvok získať, musí byť
zobrazený v metaúdajovom zázname;
• odporúčané (R) = použitie prvku sa odporúča;
• dobrovoľné (O) = nezáleží na tom, či je prvok použitý alebo nie.
Stav odporúčané slúži najmä na to, aby povzbudil používateľov vložiť nejaké prvky, keď
vytvárajú metadátový záznam a tým zlepšili služby.
Nekvalifikovaný DC: oai_dc
Základný prvok Stav Kódovacia schéma
Title (Názov) M Žiadna, voľný text
Creator (Autor) M APA štýl písania bibliografických záznamov ako v referenčnom zozname. Syntax: priezvisko, krstné meno (prvé meno)
55
[http ://e n . w i k i p e d i a . o r g/ w i k i/ Apa _ s ty le# R efere n c e_li s t ] .
Subject (Predmet) MA Výber kľúčových slov a klasifikácií môže byť voľný text(najlepšie v angličtine) a určený schémou URI(najlepšie štandardne info:eu-repo/classification).
Description (Popis) MA Žiadna, voľný text. Odporúča sa zahrnúť abstrakt v angličtine. „ A b s trakt“ je predvolený výklad pre hodnotu dc:description.
Publisher (Vydavateľ) R Žiadna
Contributor (Spolupracovník)
O APA štýl písania bibliografických záznamov ako v referenčnom zozname. Syntax: priezvisko, krstné meno (prvé meno) [http ://e n . w i k i p e d i a . o r g/ w i k i/ Apa _ s ty le# R efere n c e_li s t ] .
Date (Dátum) M Dátum | ISO 8601 W3C-DTF – „ Zverejnené“ je predvolená hodnota pre dc:date.
Type (Typ) M Typ uverejnenia a typ verzie môže byť voľný text (najlepšie v angličtine) a určený schémou URI (najlepšie štandardne info:eu-repo/semantics).
Format (Formát) R Registrovaný zoznam internetových typov nosičov IANA (typy MIME)[http :// www . i ana . o rg/ a ss ig nm e nts / m e d i a - typ e s / ] .
Identifier (Identifikátor)
M URI schéma, prepojená s trvalým identifikátorom (URN, Handle, DOI), úplný dokument alebo úvodná stránka.
Source (Zdroj) O P r í r u č k a pre kódovanie bibliografických citačných informácií v metaúdajach Dublin Core [http :// dub li n c o re . o r g / do c um e nts / d c - c i tat i on - g u i d eli n e s / ] ako v dcterms:bibliographicCitation.
Language (Jazyk) R ISO 639-3
Relation (Vzťah) O Žiadna
Voverage (Dosah) O „Obdobie“ je predvolený výklad hodnoty dc:coverage.Kódovacia schéma:DCMI Period [http :// dub li n c o re . o rg/ do c um e nts /2000/07/28 / d c m i - p eri od/ ] . Pre viaceré kódovacie schémy pozri piatu kapitolu Použitie slovníkov a sémantiky.
Rights (Práva) R Žiadna
Audience O Žiadna, „Stupeň vzdelania“ je predvolená hodnota pre
56
(Cieľová skupina) dc:audience.
Ak vo výklade prvkov oai_dc nie sú spomenuté žiadne preddefinované hodnoty
v uvedenej tabuľke, popíšte špecifické použitie prvku oai_dc v Identifikačnej časti vášho
repozitára. Pozri napr. kapitolu 3. Odporúčania pre doplnkové úložiská na
http://www.openarchives.org/OAI/2.0/guidelines.htm a: http://arXiv.org/oai2?verb=Identify
Prvky: komplexný popis
V nasledujúcej tabuľke sa nachádza komplexný popis prvkov.
Definície DCMI pochádzajú z dokumentu smerníc DCMI „ Použitie Dublin Core – Prvky“.
Pozri http://dublincore.org/documents/usageguide/elements.shtml
Názov
Názov prvku Title (Názov)
DefiníciaDCMI
Názov daný zdroju. Štandardne je názov meno, pod ktorým je zdroj formálne známy.
Použitie Povinné
Inštrukcie na použitie Zachovajte originálne znenie, poradie a hláskovanie zdrojového názvu. Iba vlastné mená napíšte veľkými písmenami. Interpunkcia nemusí byť v zhode s originálom. Podtitul by mal byť oddelený od hlavného názvu dvojbodkou. Tieto inštrukcie smerujú k t itul:podtitul (t. j. bez medzery). V prípade potreby zopakujte tento postup pre viac názvov.
Nemýľte si s Nie je dostupné.
Príklady <dc:title>Main title:Sub-title </dc:title><dc:title>Dewey Classificatie in Archief systemen:DeweyClassification in Archival systems</dc:title>
57
<dc:title>Preliminary studies for the "Philosophical Investigations", generally known as the blue and brown books </dc:title>
Autor
Názov prvku Creator (Autor)
Definícia DCMI Subjekt, ktorý je primárne zodpovedný za vytvorenie obsahu zdroja.Štandardne by sa meno autora malo použiť na určenie tohto subjektu.
Použitie Povinné
Inštrukcie na použitie
Príklady autora zahŕňajú osoby, organizácie alebo služby. V prípade potreby zopakujte tento prvok pre viacerých autorov.Použite invertované meno tak, aby jeho syntax bola nasledovná: „priezvisko“, „krstné meno“ („prvé meno“), „predpona“, napríklad Jan Hubert de Smit sa zmení na<dc:creator> Smit, J.H.(John) de</dc:creator>V rámci nekvalifikovaného DC sa odporúča použiť štandardizovaný štýl zapisovania mien alebo štýl zápisu, ktorý použil vydavateľ, ak je takýto štýl dostupný. Ak tento štýl nie je dostupný, použite kódovanie, štýl písania bibliografických záznamov APA ako v referenčnom zozname (AP A b i b li o gr aph ic w ri t i ng sty l e as in a refere n c e li st ), v prípade že sa dá použiť (mimo nekvalifikovaného DC sú dostupné presnejšie a štruktúrovanejšie metódy formátovania).Ak sú dostupné obe mená, aj krstné aj prvé meno, použite nasledujúce formátovanie:<dc:creator> Janssen, J. (John)</dc:creator>Všeobecnejšie prípony (ml., star., atď.) by mali nasledovať za priezviskom. Ak nie ste si istý, ponechajte meno v pôvodnom tvare, nevymieňajte poradie. Vynechajte tituly (napr „dr.“, „Ing.“ atď.).Napríklad: „Dr. John H. de Smit Jr.“ sa zmení na<dc:creator> Smit Jr., J.H. (John) de </dc:creator>V prípade názvu organizácie, ktorá jasne zahŕňa organizačnú hierarchiu, uveďte súčasti hierarchie od najvyšších po najnižšie a oddeľte ich bodkou. Napríklad:<dc:creator> Utrechtská Univerzita. Katedra informačných vied </dc:creator>Ak nie je jasné, či je v tejto inštitúcii hierarchia, alebo nie je možné
58
rozpoznať, ktorá je vyššia a ktorá nižšia zložka, ponechajte meno autora ako je uvedené v zdrojovom materiáli. Iba uveďte organizáciu v tomto prvku, aby ste naznačili autorstvo inštitúcie, a nemýlili si ho s autorstvom jednotlivca. Zahrnutie záhlavia osobného a inštitucionálneho mena zo zoznamov inštitúcií vytvoreného v súlade s miestnymi alebo národnými zložkami tezaurov je dobrovoľné.Odporúča sa označiť tezaurus s URI pre poskytovateľov služby, aby rozpoznali schému tezauru. Napríklad:<dc:creator> urn:NationalOrgThesaurus:nl/234 </dc:creator>
V prípade menšej zodpovednosti, inej ako je autorstvo, použite dc:contributor. Ak je povaha zodpovednosti nejasná, osvedčený postup je použiť dc:publisher pre organizácie a dc:creator pre jednotlivcov.
Nemýľte si s • Spolupracovník (pozri tiež Inštrukcie na použitie vyššie).• Vydavateľ.
Prvok DC ‘autor’ popisuje meno/(á) autora/(ov) zdroja, ako je uvedené v zdroji, kým prvok DC ‘spolupracovník’ popisuje vedca/(cov), ktorý prispeli k danému vedeckému výstupu, ale nie ako hlavný autor, ani ako (komerčný) vydavateľ.
Príklady <dc:creator>Evans, R.J.</dc:creator> (autor)<dc:creator>Walker Jnr., John</dc:creator><dc:creator>International Human Genome SequencingConsortium</dc:creator><dc:creator>Loughborough University. Department of ComputerScience</dc:creator>
Predmet
Názov prvku Subject (Predmet)
DefiníciaDCMI
Téma zdroja. Predmet bude štandardne vyjadrený ako kľúčové slová, kľúčové frázy alebo klasifikačné kódy, ktoré popisujú intelektuálny obsah zdroja.
Použitie Povinné v prípade použiteľnosti.
Inštrukcie V prvku DC predmet sú možné dva typy hodnôt: kľúčové slovo alebo
59
na použitie klasifikácia. Keď sú dostupné oba údaje, použite oddelený výskyt tohto prvku.Použite prvý výskyt DC prvku ‘predmet’ pre kľúčové slovo čitateľné „ľudským jazykom“.Vo všeobecnosti si zvoľte najpríznačnejšie alebo najšpecifickejšie slová za kľúčové slová, vyhnite sa tým, ktoré opisujú určitý zdroj príliš všeobecne. Ak je predmet zdroja osoba alebo inštitúcia, použite rovnakú formu mena ako by ste použili, keby osoba alebo inštitúcia boli autorom, ale neopakujte meno v prvku dc:creator.V prípade kľúčových slov/kľúčových fráz, ktoré nie sú riadené slovníkom alebo tezaurom, zadajte buď viacnásobné pojmy s použitím bodkočiarky, ktorá oddelí každé slovo/frázu, alebo zopakujte prvok pre každý pojem. Čo sa týka použitia veľkých písmen v kľúčových slovách, nekladú sa žiadne špeciálne požiadavky, keďže sa odporúča vnútorná konzistencia (v rámci archívu). Ak sú pojmy prebraté zo štandardnej klasifikačnej schémy: u l o ž te každý pojem v oddelenom prvku. Zadajte celý popis predmetu podľa relevantnej schémy. Použite rovnaké písmená (veľké/malé) a interpunkciu, aké sú použité v originálnej schéme.V prípade klasifikačných schém alebo regulovaných slovníkov sa odporúča použiť URI, najmä ak sú použité kodifikačné schémy DDC alebo UDC. Poskytovateľ služby ľahšie rozpozná kódovacie schémy, keď je v schéme uvedený URI cez autority menného priestoru. Ak je klasifikačná schéma kodifikovaná, použite čitateľný text kódu, najlepšie v angličtine, priamo pod kodifikovaným prvkom. Napríklad:<dc:subject>info:eu-repo/classification/ddc/641</dc:subject><dc:subject>Anatomy</dc:subject>Ak nie je použitá žiadna špecifická klasifikačná schéma, odporúčame Deweyovu desatinnú sústavu (DDC). Prvých 1000 pojmov sa volá Sumár Deweyovej desatinnej sústavy a môžete si ho stiahnuť na:http://www.oclc.org/dewey/resources/summaries/,ak sa zhoduje s nasledujúcimi pojmami a podmienkami:ht tp :// www . o c l c. o rg/r e s e a r c h /re s e a r c hwo r ks / dd c / t er ms . ht m
Nemýľte si s • TypPrvok DC ‘predmet’ popisuje tému/(y) zdroja; prvok DC ‘typ’ popisuje druh výstupu / typ publikovania, ktorý zdroj reprezentuje.
Schéma Viac o predmetovej klasifikácii, pozri v časti Predmetová klasifikácia na strane 107 v kapitole Použitie slovníkov a sémantiky.
Príklady <dc:subject>polar oceanography; boundary current; mass transport; watermasses; halocline; mesoscale
60
eddies</dc:subject><dc:subject>Germany--History--1933-1945</dc:subject><dc:subject>info:eu-repo/classification/ddc/641</dc:subject><dc:subject>Anatomy</dc:subject>
Popis
Názov prvku Description (Popis)
Definícia DCMI
Popis obsahu zdroja. Popis môže obsahovať: abstrakt, obsah, odkaz na grafické zobrazenie obsahu alebo textový popis obsahu a pod.
Použitie Povinné v prípade použiteľnosti.
Inštrukcie na použitie
Tento prvok sa používa na textové popísanie obsahu. Keď sa zdroj skladá z viacerých oddelených súborov, nepoužívajte dc:description, aby ste mohli uviesť URL týchto súborov.
Predvolené = abstrakt
Nemýľte si s (nie je dostupné)
Príklady <dc:description>Foreword [by] Hazel Anderson; Introduction; The scientific heresy: transformation of a society; Consciousness as causal reality [etc]</dc:description><dc:description>A number of problems in quantum state and system identification are addressed. </dc:description>
Vydavateľ
Názov prvku Publisher (Vydavateľ)
Definícia DCMI Subjekt zodpovedný za zverejnenie zdroja. Prík lady vydavateľa zahŕňajú osobu, organizáciu alebo službu. Štandardne by sa malo na označenie tohto subjektu použiť meno vydavateľa.
Použitie Povinné v prípade použiteľnosti.
Inštrukcie (Komerčný alebo nekomerčný) vydavateľ zdroja; nie (pod)inštitúcia, s
61
na použitie ktorou je autor prepojený. Vydavateľ sa používa iba v bibliografickom/funkčnom zmysle, nie v zmysle organizačnom. Používajte iba celé meno daného (komerčného) vydavateľa, nie názov organizácie alebo inštitútu, ktoré sú inak [v širšom zmysle] prepojené s autorom. V prípade univerzitných publikácií, uveďte za názov univerzity názov fa-kulty/výskumného tímu alebo školy. V prípade názvu organizácie, ktorá jasne zahŕňa organizačnú hierarchiu, uveďte súčasti hierarchie od naj-vyšších po najnižšie a oddeľte ich bodkou. Ak nie je jasné, či je v tejto inštitúcii hierarchia, alebo nie je možné rozpoznať, ktorá je vyššia a ktorá nižšia zložka, ponechajte názvy tak, ako sú uvedené v e-print.Použitie názvu vydavateľa zo zoznamu inštitúcií vytvorenom v súlade s miestnym alebo národným tezaurom je dobrovoľné.
Nemýľte si s • Spolupracovníci• Autor
Vo väčšine prípadov nie sú vydavateľ a autor tá istá osoba.
Príklady <dc:publisher>Loughborough University. Department ofComputer Science</dc:publisher><dc:publisher>University of Cambridge. Department of EarthSciences</dc:publisher><dc:publisher>University of Oxford. Museum of the History of Science</dc:publisher><dc:publisher>University of Reading. Rural HistoryCentre</dc:publisher><dc:publisher>University of Exeter. Institute of Cornish Studies</dc:publisher><dc:publisher>European BioinformaticsInstitute</dc:publisher><dc:publisher>John Wiley & Sons, Inc. (US)</dc:publisher>
Spolupracovník
Názov prvku Contributor (Spolupracovník)
Definícia DCMI Subjekt zodpovedný za prispievanie k obsahu zdroja. Príkladom spolupracovníka môže byť osoba, organizácia alebo služba. Meno spolupracovníka by štandardne malo vyjadrovať tento subjekt.
Použitie Dobrovoľné
62
Inštrukcie na použitie
Príkladmi spolupracovníkov sú: konzultant, redaktor, technik či pracovník zberu údajov.Vlastné mená sa uvádzajú: pozri inštrukcie v časti Autor. Školiteľ, t. j. profesor dohliadajúci na študentovu prácu počas písania doktorandskej kvalifikačnej práce, sa považuje za prispievateľa k dizertačnej práci, čo vyplýva z úlohy školiteľa/skúšajúceho. V menej rozvinutom nekvalifikovanom DC je ťažké presne vyjadriť všetky úlohy v rozličnom kontexte. V dizertačnej práci (PhD.) sú kľúčové osoby autor a školiteľ. Do celkového procesu, ktorý vedie k získaniu titulu PhD., sú zahrnuté aj iné osoby a úlohy, ako sú členovia komisie či konferencier, ale v nekvalifikovanom DC ich musíme obetovať.V prípade organizácie: pozri postup v časti Autor. Zahrnutie záhlavia osobného a inštitucionálneho mena zo zoznamov inštitúcií vytvoreného v súlade s miestnymi alebo národnými zložkami tezaurov je dobrovoľné.
Nemýľte si s • Autor• Vydavateľ
Prvok DC „ spolupracovník“ popisuje vedca/(ov), ktorý/í prispel/i k danému výstupu, nie však ako hlavný autor, ani ako (komerčný) vydavateľ.
Príklady <dc:contributor>Sulston, John E.</dc:contributor><dc:contributor>Evans, R. J.</dc:contributor><dc:contributor>International Human Genome SequencingConsortium</dc:contributor><dc:contributor>Loughborough University. Department of Computer Science</dc:contributor>
Dátum
Názov prvku Date (Dátum)
DefiníciaDCMI
Dátum sa spája s určitou udalosťou v životnom cykle zdroja. Dátum sa štandardne spája s vytvorením dostupnosti zdroja. Odporúča sa zakódovať dátum v hodnote, ktorú určuje profil ISO 8601 [W3CDTF] nasledovne: RRRR-MM- DD.
Použitie Povinné
Inštrukcie na použitie
Dátum by mal byť zakódovaný v súlade s pravidlami W3C pre dátumy a časy:Úplný dátum:
63
RRR-MM-DD (napr. 1997-07-16),pričom:– YYYY [štvorciferný rok] je povinný,– MM [tvojciferný mesiac (01=január,atď.)] je voliteľný,– DD [tvojciferný deň v mesiaci (od 01 do 31)] je voliteľný.Pole s jedným dátumom – dátum zverejnenia:Repozitárové systémy obsahujú často viac než jeden dátumový záznam, ktorý slúži na rôzne účely: dátum vytvorenia, zverejnenia, pozmenenia, propagovania atď. Nekvalifikovaný DC nie je schopný vyjadriť všetky tieto dátumy a z perspektívy koncového používateľa je mätúce dostať viac ako jeden dátum od poskytovateľa služby. Poskytovateľ služby by sa mal rozhodnúť, ktoré údajové pole si zvolí. Z pohľadu koncového používateľa je najlogickejšie a najzmysluplnejšie získať dátum zverejnenia, a preto tento dátum uprednostňujeme.Aby sa zmenšila nejednoznačnosť kvôli mnohým poliam s dátumami bez kvalifikátorov, odporúčame znížiť počet polí a poskytovateľovi služby udať iba najzmysluplnejší dátum. Vo väčšine prípadov je to dátum publikácie. V iných prípadoch je to dátum udelenia titulu PhD. Dátum zverejnenia nie je dostupný:Ak nie je dátum zverejnenia známy, použite akýkoľvek iný dátum. Je lepšie použiť akýkoľvek dátum, ako žiadny dátum.Dodatky k udaniu dátumu:Dodatky ako „čas Zulu“ by nemali byť súčasťou metaúdajov.Nejasné dátumy: Pre nejasné dátumy použite logický rok tak, aby najviac zodpovedalo danému obdobiu, napr. „1650“ namiesto „17. storočie“.Aby ste mohli presnejšie vyjadriť dočasné obdobie, použite dc:coverage field. Dočasné obdobie môže byť vyjadrené štandardne, ak je presne uvedené (pozri Dosah), v prípade, že je neisté, môže sa vyjadriť voľne textovým vyjadrením. Poskytovateľ služby je schopný roztriediť dátumy založené na štandardoch ako sú W3CDTF. Keďže neexistuje žiaden štandard pre nejasné dátumy, alebo pre pojmy ako sú „renesancia“ či „17. storočie“, tieto údaje sa jednoducho nezobrazia vo vyhľadávacích výsledkoch založených na dátume.
Nemýľte si s –
Schémy ISO 8601 [W3CDTF] http :// www . w 3. o rg/Q A / T i p s /i so - date
Príklady <dc:date>2000-12-25</dc:date><dc:date>1978-02</dc:date><dc:date>1650</dc:date>
64
Typ
Názov prvku Type (Typ)
DefiníciaDCMI
Typ výstupu, ktorý zdroj predstavuje. V prvku DC ‘typ’ sa popisuje druh rozširovania zdroja alebo intelektuálny a/alebo obsahový typ zdroja. Používa sa, aby užívatelia pochopili, na aký typ zdroja sa pozerajú, či ide o knihu alebo o článok, či bol dokument napísaný na interné alebo externé účely.
Použitie Prvok DC ‘typ’ má tri účely použitia:
1. Povinný – typ publikovania (riadený): označiť typ publikovania, ktorý je založený na riadenej slovnej zásobe typov publikovania DRIVER;
2. Dobrovoľný – typ publikovania (voľný): naznačiť typ publikovania, ktorý je založený na slovnej zásobe lokálneho repozitára;
3. Odporúčaný – verzia (riadená): naznačiť stav počas publikačného procesu.
Inštrukcie na použitie
1. Typ publikovania (riadené):
Prvý typ použitia DC prvku 'typ' je povinný a používa sa na označenie typu výstupu v súlade so slovníkom typov DRIVER. Použite presné označenie podľa nižšie uvedeného zoznamu. Pojmy sú detailne vysvetlené v kapitole o slovníkoch a sémantike. Info:eu-repo je menný priestor, v ktorom sú registrované typy publikovania DRIVER:
• info:eu-repo/semantics/article (pre článok)• info:eu-repo/semantics/bachelorThesis (pre Bc. kvalifikačnú prácu)• info:eu-repo/semantics/masterThesis (pre Mgr. kvalifikačnú prácu)• info:eu-repo/semantics/doctoralThesis (pre doktorandskú prácu)• info:eu-repo/semantics/book (pre knihu)• info:eu-repo/semantics/bookPart (pre časť knihy)• info:eu-repo/semantics/review (pre recenziu)• info:eu-repo/semantics/conferenceObject (pre konferenčný
predmet)• info:eu-repo/semantics/lecture (pre prednášku)• info:eu-repo/semantics/workingPaper (pre vedeckú prácu)
65
• info:eu-repo/semantics/preprint (pre nevydanú vedeckú prácu)• info:eu-repo/semantics/report (pre správu)• info:eu-repo/semantics/annotation (pre komentár)• info:eu-repo/semantics/contributionToPeriodical (pre príspevok do
časopisu)• info:eu-repo/semantics/patent (pre patent)• info:eu-repo/semantics/other (pre iné)
2. Typ publikovania (voľný text):
Druhý typ použitia prvku DC 'typ' je dobrovoľný a používa sa na bližšie určenie výstupu.
3. Verzia (riadená):
Tretí typ použitia prvku DC 'typ' sa odporúča a používa sa na označenie verzie výstupu v súlade so slovníkom verzií v DRIVER.
Použite presné označenie podľa nižšie uvedeného zoznamu. Bližšie informácie o verziách pozri na: http :// www . l s e. a c . uk /l i b r a r y /ver s i ons/ .
• info:eu-repo/semantics/draft (pre koncept)• info:eu-repo/semantics/submittedVersion (pre odovzdanú verziu)• info:eu-repo/semantics/acceptedVersion (pre prijatú verziu)• info:eu-repo/semantics/publishedVersion (pre vydanú verziu)• info:eu-repo/semantics/updatedVersion (pre prepracovanú verziu)
Mapovanie a spätná transformabilita:
Pre mapovanie typov DRIVER pozri Príručku DRIVER 1.0 – časť DRIVER-TYPE.
Nemýľte si s • Formát
Prvok DC ‘typ’ popisuje ten typ výstupu, ktorý zdroj reprezentuje. Prvok DC ‘formát’ popisuje typ média tohto zdroja.
Schémy Typy publikovania: pozri časť Slovník typov publikovania na strane 109 v kapitole Použitie slovníkov a sémantiky.
Verzie slovníkov: Pozri časť Slovník verzií na strane 113 v kapitole Použitie slovníkov a sémantiky.
66
Mapovanie: pozri časť Mapovanie typov DRIVER na strane 76 v kapitole Použitie osvedčených postupov pre OAI_DC.
Príklady <dc:type>info:eu-repo/semantics/article</dc:type><dc:type>info:eu-repo/semantics/publishedVersion</dc:type>
alebo
<dc:type>info:eu-repo/semantics/other</dc:type> <!--1--><dc:type>image</dc:type><!--2--> <dc:type>info:eu-repo/semantics/updatedVersion</dc:type> <!--3-->
Formát
Názov prvku Format (Formát)
Definícia DCMI
Existuje fyzická alebo digitálna interpretácia zdroja. Formát môže štandardne zahŕňať typy médií alebo parametre zdroja. Formát sa môže použiť na špecifikovanie softvéru, hardvéru či iného vybavenia, ktoré je potrebné na zobrazenie zdroja alebo prácu s ním. Príklady rozmerov zdroja sú veľkosť a trvanie. Odporúča sa zvoliť si hodnotu z riadeného slovníka (napríklad: Zoznam typov internetových médií [Multipurpose Internet Mail Extensions, MIME], ktoré určujú formáty médií v počítači).
Použitie Odporúčané
Inštrukcie na použitie
Vzhľadom na osvedčený postup, IANA registrovala zoznam typov internetových médií (MIME typy), z ktorého si treba zvoliť vhodné označenie. Nasleduje úplný zoznam tejto schémy. Nižšie sú uvedené i príklady zoznamu z IANA MIME typov:
Typ Podtyp
text • plain (jednoduchý)• richtext (RTF)• enriched (obohatený)• tab-separated-values (TSV)• html• sgml• xml
67
použitie • octet-stream• postscript• rtf• applefile• mac-binhex40• wordperfect5.1• pdf• vnd.oasis.opendocument.text• zip• macwriteii• msword• sgml• ms-excel• ms-powerpoint• ms-project• ms-works• xhtml+xml• xml
obrázok • jpeg• gif• tiff• png• jpeg2000• sid
audio • wav• mp3• quicktime
video • mpeg1• mpeg2• mpeg3• avi
Ak jeden špecifický zdroj (príklad výstupu) má viac ako jeden hmotný formát (napr. postscript a pdf), ktoré sú uložené ako rôzne súbory, všetky formáty musia byť spomenuté v prvku DC ‘formát’, napríklad:• <dc:format>application /pdf</dc:format>• <dc:format> application/postscript</dc:format>• <dc:format> application/vnd.oasis.opendocument.text</dc:format>
Nemýľte si s • Type
68
• IdentifierPrvok DC ‘formát’ popisuje typy médií zdroja. Prvok DC ‘typ’ popisuje druh výstupu, ktorý zdroj reprezentuje. Dc:identifier sa používa na vyjadrenie materializácie digitálnych zdrojov.
Schémy IANA registrovaný zoznam typov internetových médií (MIME typy) - http :// www . i a n a . o rg/ ass ig nm e nts / m e d i a - typ e s/
Príklady <dc:format>video/quicktime</dc:format><dc:format>application/pdf</dc:format><dc:format>application/xml</dc:format><dc:format>application/xhtml+xml</dc:format><dc:format>application/html</dc:format><dc:format>application/vnd.oasis.opendocument.text</dc:format>
Identifikátor
Názov prvku Identifier (Identifikátor)
Definícia DCMI Jednoznačný odkaz na zdroj v rámci daného kontextu.
Použitie Povinné
Inštrukcie na použitie
Odporúča sa identifikovať zdroj pomocou textového reťazca alebo čísla, ktoré sú v zhode s formálnym identifikačným systémom. Príklady formálnych identifikačných systémov zahŕňajú identifikátory (Uniform Resource Identifier, URI), (Uniform Resource Locator, URL), d igitálneho identifikátora predmetu (Digital Object Identifier, DOI) a štandardovU R N : N BN). Osvedčený postup:Použite stabilné URL,
• uveďte všetky identifikátory, ktoré sa o publikácii dajú zistiť (URL, DOI, U R N : N B N , ISBN, ISSN atď.),• uveďte „najvhodnejší“ identifikátor vo forme URL na začiatok
zoznamu identifikátorov. Takmer v každom prípade bude práve tento identifikátor použitý poskytovateľom služby, aby umožnil koncovému používateľovi sa s ním prepojiť. Tento identifikátor môže byť odkaz na stránku, ktorý nás k zdroju navedie, alebo priamy odkaz na súbor. Takisto to môže byť priama URL alebo presmerovanie URL, ako napríklad PURL, HANDLE či iný medzinárodný rozlišovací mechanizmus.
69
Nemýľte si s • dc:relation (Použite dc:relation, ak chcete vytvoriť prepojenie medzi dvomi verziami zdroja.)
• dc:relation (Použite dc:relation na bibliografickú citáciu originálneho zdroja.)
Príklady Identifikátory sú roztriedené v prípade, že je URL uvedený prvý. URL sa považuje za „najvhodnejší“ a použije sa napr. v DRIVER, aby umožnil koncovému používateľovi presmerovať sa priamo naň. V tomto prípade nás rukoväť presmeruje priamo na správnu stránku, mimo danej stránky. Externá stránka je vhodný spôsob odkazovania. Koncový používateľ má možnosť získať viac informácií o objekte, ktorý našiel, vidí detailnejší kontext a môže využiť i ďalšie služby, ktoré ponúka lokálny repozitár.
<oai_dc:dc> ... <dc:identifier>http://hdl.handle.net/1234/5628 </dc:identifier><dc:identifier>http://arno.unimaas.nl/show.cgi?fid=5628 </dc:identifier> <dc:identifier>http://n2t.info/urn:nbn:nl:ui:14-
123456789</dc:identifier> <dc:identifier>urn:nbn:nl:ui:13-123456789</dc:identifier> <dc:identifier>urn:isbn:123456789</dc:identifier> <dc:identifier>info:doi:10-123456789</dc:identifier> ... </oai_dc:dc>
Zdroj
Názov prvku Source (Zdroj)
Definícia DCMI Odkaz na zdroj, z ktorého pochádza daný materiál.
Použitie Dobrovoľné
Inštrukcie na použitie Buď celý, alebo iba časť prezentovaného materiálu pochádza zo zdrojového materiálu. Odporúča sa odkázať na zdroj pomocou textového reťazca alebo čísla, ktoré sú v zhode s formálnym identifikačným systémom.Osvedčený postup: Použite iba v prípade, že je daný materiál
70
výsledkom digitalizácie negiditálneho originálu. V opačnom prípade použite prvok ‘relation’. Môžete pridať nepovinné metaúdaje o súčasnom umiestnení a referenčnom čísle digitalizovanej publikácie. Pozri príručku pre kódovanie bibliografických citačných informácií v metaúdajoch Dublin Core ([http :// dub li n c o re . o rg / do c um e nts / d c - c i tat i on - g u i d eli n e s / ] ).
Nemýľte si s • dc:relaton• dc:identifier
Príklady <dc:source>Ecology Letters (1461023X) vol.4
(2001)</dc:source>
<dc:source>ISSN: 0928-0987</dc:source>
Jazyk
Názov prvku Language (Jazyk)
Definícia DCMI Jazyk intelektuálneho obsahu zdroja.
Použitie Odporúčané
Inštrukcie na použitie Špecifický zdroj (súčasť výstupu) je napísaný buď v jednom, alebo vo viacerých „ľudských jazykoch“. V takýchto prípadoch sú všetky použité jazyky uvedené v prvku DC ‘jazyk’. Ak je špecifický zdroj (súčasť výstupu) napísaný v jednom jazyku a preložený do iných jazykov, každý preklad musí mať vlastný záznam.
Odporúčané: ISO 639-x, pričom x môže byť 1, 2 alebo 3.
Osvedčený postup: Používame ISO 639-3 a tým nasledujeme:
http :// www . s il . o rg/ I S O639 - 3/ c od e s . asp ]
V prípadoch, kde treba zadať viaceré jazyky, zopakujte tento prvok.
Ak ISO 639-2 a 639-1 vystačia pre obsah repozitára, môžu sa použiť alternatívne. V prípade špecifického mapovania sa môže zapísať v priebehu zberného procesu.
Nemýľte si s • Kódy štátov ISO 3166-1
71
http :// www . i so . o rg/i s o / c ount r y _ c od e s /i so _31 6 6_ c od e_li sts/ e n gli sh _ c ount r y _ nam e s _ and _ c od e_ele m e nts . ht m
Schémy ISO 639-3 http :// www . s il . o rg/ I S O639 - 3 / c od e s . asp
Príklady <dc:language>eng</dc:language>
<dc:language>deu</dc:language>
<dc:language>nld</dc:language>
<dc:language>nld/dut</dc:language>
<dc:language>dut</dc:language>
<dc:language>nl</dc:language>
Vzťah
Názov prvku Relation (Vzťah)
Definícia DCMI Odkaz na súvisiace zdroje.
Použitie Dobrovoľné
Inštrukcie na použitie Odporúča sa odkázať na zdroj pomocou textového reťazca alebo čísla, ktoré sú v zhode s formálnym identifikačným systémom. Prvok DC ‘relation’ sa môže použiť, aby naznačil rôzne druhy vzťahov medzi viacerými metaúdajovými záznamami. Ak sú vzťahy medzi metaúdajovými záznamami zrejmé, používa sa tento prvok na rozlíšenie verzií (autorská verzia a vydaná verzia, preprint, postprint, atď.):
• Metaúdajový záznam tvorí celok.• Rôzne prezentácie jedného a toho istého zdroja (súčasť
výstupu, ktorý môže byť popísaný presne s rovnakými bibliografickými metaúdajmi, až na prvok DC ‘format‘) sú prepojené jediným metaúdajovým záznamom použitím prvku dc:relation.
Iné zmeny v metaúdajoch, ako sú zmeny iba v prvku DC ‘format‘, vedú k vytvoreniu nového metaúdajového záznamu tejto novej prezentácie výstupu, ktorý spĺňa všetky požiadavky formulované v tomto dokumente a má hodnotu v prvku DC ‘relation’.
72
Nemýľte si s dc:identifier a dc:source
Príklady <dc:relation>http://hdl.handle.net/10 </dc:relation>Hodnota dc:relation je identifikátorom iného dokumentu.
Spájanie dvoch dokumentov:---Dokument A:---<dc:type>info:eu-repo/semantics/submittedVersion</dc:type><dc:identifier> http://hdl.handle.net/10</dc:identifier><dc:relation>http://hdl.handle.net/20</dc:relation>
---Dokument B:---<dc:type>info:eu-repo/semantics/acceptedVersion</dc:type><dc:identifier> http://hdl.handle.net/20</dc:identifier><dc:relation>http://hdl.handle.net/10</dc:relation>
Dosah
Názov prvku Coverage (Dosah)
Definícia DCMI Dosah obsahu zdroja. Dosah štandardne zahŕňa priestorové umiestnenie (názov miesta alebo zemepisné súradnice), časové obdobie (označenie obdobia, dátumu alebo časového rozpätia) alebo súdnu právomoc (ako napríklad správne pomenované subjekty).
Použitie Dobrovoľné
Inštrukcie na použitie Odporúča sa zvoliť si hodnotu z riadeného slovníka (napríklad Getty Thesaurus zemepisných názvov alebo TGN) namiesto číselného identifikátora v prípadoch, keď je vhodnejšie použiť zemepisný názov a použiť napríklad súbor súradníc alebo časového rozpätia. V prípade potreby zopakujte tento prvok, aby ste zakódovali viaceré zemepisné polohy alebo časové obdobia.
73
Nemýľte si s -
Schémy • ISO 3166 [http :// www . i so .c h/i so /e n / p r ods -
s ervi c e s /i so 3166 ma /02i s o - 316 6 -c od e - li sts /i nd ex. htm l ]
• Box [http :// dub li n c o re . o rg/ do c um e nts / d c m i- bo x / ]
• TGN [http :// www . ge tt y .e du /re s e a r c h / too l s /v ocabu l a r y / t g n / ]
• DCMI Period
[http :// dub li n c o re . o rg/ do c um e nts /2000/07/28 / d c m i - p eri od/ ]
Príklady Priestorový príklad: ISO 3166<dc:coverage>NL</dc:coverage>Priestorový príklad: BOX<dc:coverage> name=Western Australia; northlimit=-13.5; southlimit=-35.5; westlimit=112.5; eastlimit=129</dc:coverage>
Poznámka k BOX: Syntax použitá v tomto prípade je provizórna, a v súčasnosti sa posudzuje ako súčasť práce na odporúčaniach koordinovanej syntaxe pre HTML, XML a RDF pod názvom DCMI. Tieto odporúčania, ako aj drobné redakčné úpravy, sa v tomto dokumente objavia v blízkej budúcnosti. Kódovacia schéma point: http :// dub li n c o re . o rg/ do c um e nts / d c m i- po i nt /
Práva
Názov prvku Rights (Práva)
Definícia DCMI Informácie o právach viažucich sa k dokumentu.
Použitie Odporúčané
Inštrukcie na použitie Štandardne bude prvok „práva“ obsahovať vyhlásenie o správe práv pri prístupe k zdroju alebo odkaz na službu, ktorá tieto informácie poskytuje. Informácia o právach často zahŕňa práva duševného vlastníctva (Intellectual Property Rights, IPR), autorské právo a ďalšie
74
vlastnícke práva.Odporúča sa odkazovať na práva v prípade, že sú práva opätovného použitia zdroja koncovému používateľovi jednoznačne vysvetlené pomocou URL. Napríklad organizácia Creative Commons vytvorila URI pre ich rôzne licencie v rôznych súdnych právomociach. Tento postup sa môže použiť na vytvorenie strojovo čitateľných používateľských licencií.
Nemýľte si s -
Príklady <dc:rights>(c) University of Bath, 2003</dc:rights><dc:rights>(c) Andrew Smith, 2003</dc:rights>
Používanie právnych služieb Creative Commons oveľa jasnejšie vysvetľuje koncovým používateľom používanie práv. Bližšie informácie na: U se o f I nt elle c tual P r op er t y R ig ht s (Použitie práv duševného vlastníctva).V tomto prípade sa Andrew Smith odvoláva na: http :// c re at ive c ommons . o rg/li c e ns e s / b y - sa /2 . 0/ uk /
<!-- príklad 1 --><dc:rights>http://creativecommons.org/licenses/by- sa/2.0/uk/</dc:rights>URL poskytuje umiestnenie, kde je možné prečítať si licenciu. S licenciami creative common sa dá rozpoznať licencia v samotnom názve URL. Za použitie takéhoto smerovania licencie na URL hovorí i fakt, že je strojovo čitateľná.
<!-- príklad 2 --><dc:rights>cc-by-sa, Andrew Smith</dc:rights>
Licencia cc-by-sa poskytuje licenčný typ v širšom zmysle. Názov je meno osoby alebo názov objektu, na ktoré sa práva vzťahujú.
<!-- example 3 --><dc:rights>cc-by-sa, info:eu-repo/dai/nl/344568</dc:rights>
alebo
<dc:rights>cc-by-nc-sa, urn:isni:234562-2</dc:rights>
Takisto sa na celosvetovo jednoznačné určenie osoby alebo organizácie môže použiť digitálny identifikátor autora (Digital Author
75
Identifier, DAI) alebo m edzinárodný štandardný identifikátor mien (Internetional Standard Name Identifier, ISNI) a aj ich mená sa môžu prepojiť s patričnými právami.
Cieľová skupina
Názov prvku Audience (Cieľová skupina)
Definícia DCMI Skupina subjektov, pre ktorú je zdroj určený alebo môže byť pre ňu vhodný.
Použitie Dobrovoľné
Inštrukcie na použitie Skupinu subjektov môže určiť autor, vydavateľ alebo tretia strana. Stránka amerického ministerstva školstva, referenčná stránka metaúdajov, uvádza nasledujúce príklady cieľových skupín:http :// www . e d . g o v/ a d m i n /refere n c e/i nd ex .j s p :
• Administrátori• Komunity • Radcovia• Žiadatelia a poberatelia federálnych fondov• Knihovníci• Médiá zaoberajúce sa správami• Iní• Rodičia a rodiny• Tvorcovia stratégií• Výskumníci• Pracovníci škôl• Poskytovatelia finančnej podpory študentom• Študenti• Učitelia
Nemýľte si s •
Príklady <dc:audience>Researchers</dc:audience> <dc:audience>Students</dc:audience>
76
Použitie osvedčených postupov pre OAI_DC
Táto kapitola sa venuje obvyklým problémom, s ktorými sa administrátori repozitárov
stretávajú pri inštalácii repozitára. Opisované postupy nie sú povinné, ale ponúkajú najlepšie
riešenia bežných problémov. Ponúkané riešenia sa zakladajú na osvedčených postupoch
tých administrátorov repozitárov, ktorí sa už s takýmto druhom problémov v minulosti
zaoberali. Hlavný dôraz sa kladie na interoperabiliu a jednoduchosť implementácie
s ohľadom na životný cyklus vedeckej komunikácie.
Mapovnie typov DRIVER
Ide o mapovanie iných typov publikovania v porovnaní s tými, ktoré sú dostupné v časti
Slovník typov publikovnia na strane 109 v kapitole Použitie slovníkov a sémantiky. V tejto
časti možno nájsť presné a detailné definície pojmov, ktoré sa používajú v danom slovníku
s cieľom vytvoriť štandardnú funkciu.
Typy DRIVER verzia 1.1 v porovnaní s verziou 2.0
Nasleduje porovnanie typov použitých v príručke DRIVER vo verzii 1.1. s typmi použitými vo
verzii 2.0.
DRIVER typ 1.0 sa migruje do DRIVER typ 2.0
Článok >> Article
Bakalárska práca >> bachelorThesis
Magisterská práca >> masterThesis
Doktorandská práca >> doctoralThesis
Kniha >> book
Časť knihy alebo kapitola knihy >> bookPart
Nedostupné vo verzii DRIVER 1.1! >> Review (recenzia)
Konferenčná prednáška >> conferenceObject
77
Konferenčná správa >> conferenceObject
Prednáška >> lecture
Výskumný dokument >> preprint alebo workingPaper (pracovný dokument)
Externá výskumná správa >> Report (správa)
Interná správa >> report
Nedostupné vo verzii DRIVER 1.1! >> Annotation (anotácia)
Príspevok do novín alebo týždenníka >> contributionToPeriodical
Informačný bulletin >> contributionToPeriodical
Nedostupné vo verzii DRIVER 1.1! >> patent
Nedostupné vo verzii DRIVER 1.1! >> Other (iné)
Slovník typov e-print pre DRIVER vo verzii 2.0
Nasleduje mapovanie typov dokumentu použitých v slovníku e-print v porovnaní s typmi
použitými vo verzii 2.0.
Ako vyjadriť článok s dvomi súbormi objektu, keď jedna verzia je „prijatá“ a druhá
„zverejnená“?
Slovník typov e-print sa migruje do DRIVER typ 2.0 DRIVERudeľovanie verzií
JournalArticle >> Article (článok) akceptovaný /zverejnený /aktulizovaný
JournalItem >> Article (článok) akceptovaný /zverejnený /aktulizovaný
Submitted JournalArticle
>> Preprint aleboworkingPaper (pracovný
odovzdaný
78
dokument)
Thesis Kvalifikačná práca (širší zmysel)
>> bachelorThesis
Thesis (širší zmysel) >> masterThesis
Thesis (širší zmysel) >> doctoralThesis
Book (kniha) >> book
BookItem >> bookPart
BookReview >> Review (recenzia)
ConferencePaper >> conferenceObject
ConferenceItem >> conferenceObject
ConferencePoster >> conferenceObject
nedostupné v slovnej zásobe e-print
>> lecture
WorkingPaper >> workingPaper (pracovný dokument)
ScholarlyText (vedecký text)
>> iné ??? (k druhovým)
Report (širší zmysel) >> Report (správa)
nedostupné v slovnej zásobe e-print
>> Annotation (anotácia)
NewsItem >> contributionToPeriodical (príspevok do časopisu )
Patent >> patent
nedostupné v slovnej zásobe e-print
>> iné
Viac informácií o slovníkoch typov e-print nájdete na: http://purl.org/eprint/ t ype/
79
Mapovanie verzií DRIVER
Nižšie je uvedené mapovanie verzií v príručke DRIVER v porovnaní so schémami
prideľovania verzií vo svete knižníc a repozitárov. Viac informácií sa o verziách DRIVER
nachádza v časti Slovník verzií na strane 113 v kapitole Použitie slovníkov a sémantiky.
Typy verzií e-print v porovnaní s verziami v príručke DRIVER 2.0
Nižšie je uvedené mapovanie verzií v príručke DRIVER 2.0 v porovnaní s e-print.
Verzia e-print sa migruje do verzie DRIVER 2.0
non-peer reviewed >> draft (koncept)
non-peer reviewed >> submittedVersion (odovzdaná verzia)
peer reviewed >> acceptedVersion (prijatá verzia)
peer reviewed >> publishedVersion (publikovaná verzia)
peer reviewed >> updatedVersion (aktualizovaná verzia)
Štandardné verzie v porovnaní s typmi verzií v DRIVER 2.0
Nižšie sú uvedené prepisy funkcií schém prideľovania verzií v príručke DRIVER v porovnaní
so schémami prideľovania verzií v štandardnom vedeckom žargóne.
Tradičné verzie sa migruje do verzie DRIVER 2.0
Working Paper (pracovný dokument)
>> draft (koncept)
Pre Print (verzia pred tlačou)
>> submittedVersion (odovzdaná verzia)
Post Print (verzia po tlači) >> acceptedVersion (prijatá verzia)
80
Journal article (článok do časopisu)
>> publishedVersion (publikovaná verzia)
Reprint (opakovaná tlač) >> updatedVersion (aktualizovaná verzia)
Verzie novinových článkov (Journal Article Versions JAV), mapovanie verzie technických pracovných skupín do verzií DRIVER 2.0
Tieto odporúčania ponúkajú jednoduchý, praktický spôsob, ako opísať verzie vedeckých
článkov do časopisov, ktoré sa štandardne vyskytujú on-line pred, počas a po oficiálnom
vydaní časopisu. Odporúčané pojmy a definície verzií pre články do časopisov definujú
články do časopisov na siedmich úrovniach.
JAV sa migruje do verzie DRIVER 2.0
Author`s Original (Autorský originál)
>> draft (koncept)
Submitted manuscript Under Review (Odovzdaný rukopis v recenzii)
>> submittedVersion (odovzdaná verzia)
Accepted Manuscript (Prijatý rukopis)
>> acceptedVersion (prijatá verzia)
Proof (Kontrola) >> acceptedVersion (prijatá verzia)
Version of Record (Verzia záznamu)
>> publishedVersion (publikovaná verzia)
Corrected Version of Record (Opravená verzia záznamu)
>> publishedVersion (publikovaná verzia)
Enhanced Version of Record (Rozšírená verzia záznamu)
>> updatedVersion (aktualizovaná verzia)
Viac informácií o JAV nájdete na: http://www . niso . org/publi c ations/rp/ R P - 8 - 2008.pdf
81
Použitie OAI_DC v kvalifikačných prácach
Nasledujúce odporúčania sa zakladajú na štúdii „P O R TÁ L PRE D OKTORANDSKÉ E -
PRÁCE V EURÓPE ; Získané poznatky z projektu Demonstrator “
Táto štúdia sa zameriava na generické odborné komunikačné služby, ktoré zbierajú OAI_DC.
Pre špecifický kontext služieb e-theses odporúčame použiť popri OAI_DC aj iné
metaúdajové schémy, ktoré zohľadňujú všetky aspekty e-theses.
Štandardný postup pri použití OAI_DC dc:type s obsahom „info:eu repo/semantics/doctoralThesis“ je, že sa kladie veľký dôraz na nasledujúce aspekty:
• dc:date musí vždy obsahovať dátum zverejnenia (nie dátum obhajoby.
Dátum obhajoby je užitočný v špecifickom kontexte služieb e-theses).
• Použite iba jedno dátumové pole. Viac dátumových polí bude pôsobiť mätúco,
keďže DC nemá priestor, aby špecifikoval iné typy dátumov.
• dc:contributor musí vždy obsahovať meno školiteľa. (Označenie
spolupracovníka názvom iných úloh bude pôsobiť mätúco. DC nemá priestor,
aby špecifikoval iné úlohy spolupracovníka.)
• Ostatné polia by mali dôsledne dodržiavať odporúčania DRIVER. Všimnite si
pole dc:language, ktoré je zvyčajne zakódované v ISO639-3. Takisto si
všimnite, že dc:identifier je iba jedno pole, ktoré obsahuje URL, ktorý odkazuje
na úplný text kvalifikačnej práce alebo na stránku s neobmedzeným prístupom
k úplnému textu tohto dokumentu. Pole dc:date musí byť vo formáte ISO8601
(RRRR-MM-DD). Polia dc:creator a dc:contributor sú formátované v štýle
„priezvisko, krstné meno“.
Príklad
V tejto časti vám ponúkame príklad pre elektronickú kvalifikačnú prácu. V tomto prípade ide o
habilitačnú prácu nemeckého typu na získanie titulu profesor. Ide o akademickú prácu, ktorá
má v Nemecku ešte vyššie postavenie ako PhD. (doktorandská kvalifikačná práca).
V príručke DRIVER podporujeme iba pojmy, ktoré uznáva Bolonský dohovor, aby manažér
repozitáru mohol použiť pravidlo „všetko rovnocenné a hodnotené vyššie ako doktorandská
82
práca spadá do kategórie doctoralThesis“. V tejto príručke je povolené použiť dodatočnú
informáciu „habilitácia“, aby sa zachovali miestne úrovne.
Bližšie informácie o terminológii týkajúcej sa úrovne diplomových prác nájdete na:
http://en . wikiped i a . org/wiki/Dip l om
XML, ktoré sa používa môže vyzerať nasledovne (komentáre medzi <!-- a --> by nemali byť
mimo XML, ale mali by slúžiť ako pomoc pri čítaní.):
<oai_dc:dc >
<dc:title>Mixing Oil and Water : </dc:title>
<dc:creator>Stage, Jesper</dc:creator> <!-- The Author -->
<dc:date>2003-12-02</dc:date> <!-- The Published Date, one data field
-->
<dc:contributor>Crane, Walter</dc:contributor> <!-- The Supervisor -->
<dc:type>info:eu-repo/semantics/doctoralThesis</dc:type> <!-- DRIVER
type 2.0 for Doctoral thesis, used for interoperability -->
<dc:type>habilitation</dc:type> <!-- Local specific term. In Germany
Habilitation is the thesis a Professor has to write -->
<dc:type>info:eu-repo/semantics/publishedVersion</dc:type> <!--
Optional, the status of the work -->
<dc:identifier>http://some.url.to/the_jump-off_page.html </dc:identifier>
...
</oai_dc:dc>
DC:SOURCE a citačné informácie
Použite pole DC:SOURCE na vloženie informácie, ktorá slúži na to, aby sme správne citovali
vyhľadaný záznam. Ak je to možné, použite APA štýl písania záznamov.
Napríklad:
<dc:source>Ecology Letters (1461023X), vol.4 (2001)</dc:source>
83
DC:RELATION a prepojenie súvisiacich objektov
Pole DC:RELATION sa môže štandardne použiť na popísanie vzťahov k iným realizáciám
alebo verziám dokumentu.
Napríklad: vydaná verzia a autorská verzia článku – môžeme na ne navzájom odkázať
použitím „najvhodnejšieho“ identifikátora, ktorý je premenný (URL). Napríklad:
Tento záznam s ID 1111, je práca, ktorá bola odovzdaná na recenzovanie (peer review). Táto práca súvisí so skontrolovaným článkom s ID 2222.
<oai_dc:dc ><de:identifier>http://hdl.handle.net/1234/1111</dc:identifier><dc:type>info:eu-repo/semantics/paper</dc:type><dc:type>info:eu-repo/semantics/submittedVersion</dc:type><dc:relation>http://hdl.handle.net/1234/2222</dc:relation>
</oai_dc:dc>
Nižšie uvedený metaúdajový záznam opisuje záznam článku s ID 2222.Tento článok sa viaže na odovzdaný dokument.
<oai_dc:dc ><de:identifier>http://hdl.handle.net/1234/2222</dc:identifier><dc:type>info:eu-repo/semantics/article</dc:type><dc:type>info:eu-repo/semantics/publishedVersion</dc:type><dc:relation>http://hdl.handle.net/1234/1111</dc:relation>
</oai_dc:dc>
84
Použitie MPEG-21 DIDL (xml-úložisko) – Balenie (wrapping) zloženého objektu
Úvod a cieľ
Tento dokument je doplnok k už existujúcim dokumentom špecifikujúcim DIDL pre repozitáre.
Používajú ho holandské univerzity, Holandská národná knižnica Koninklijke Bibliotheek a
NARCIS. Cieľom tohto dokumentu je umožniť jednoznačné používanie DIDL pomocou
opísania:
1. vlastností rôznych častí „metaúdajov“, „objektov“ a „stránok, na ktoré nás
navedie pôvodná stránka“,
2. čo znamená identifikácia,
3. čo znamená zmena dátumu.
Keď sa postup aplikuje správne, uvedená špecifikácia vytvorí platný záznam XML MPEG-21
DIDL pre použitie s odpoveďami OAI-PMH. Špecifikácia dokumentov DIDL sa zakladá na
rozhodnutiach, ktoré sa navrhli na začiatku vývoja tohto XML formátu, aby bolo možné
používať MPEG-21 DIDL. N ávrh bol hrubým náčrtom multimediálneho kontajnera, ktorý mal
priestor pre metaúdajové zdroje, predmety, externé stránky. Táto špecifikácia ponúka jeho
detailnejšie spracovanie.
Informácie o pozadí špecifikácie
Úložisko DIDL XML bolo pôvodne vyvinuté v rámci SURF programu DARE ako prvá
implementácia MPEG-21 DIDL. Princípom v pozadí tohto vývoja bolo:
• riešenie pre zdroje zbierajúce dokumenty pomocou OAI-PMH, pre prenos
digitálnych zdrojov (PDF atď.) z miestneho repozitára do národnej knižnice, aby
bolo možné zahrnúť zdroje do systému E-Depot na dlhodobé uschovanie;
• riešenie pre zdroje zbierajúce dokumenty pomocou OAI-PMH, pre prenos
digitálnych zdrojov (PDF atď.) z miestneho repozitára k poskytovateľovi služby
(napr. vyhľadávací portál, ktorý zobrazí zoznam úplných textov dokumentov);
85
• (čiastočné) riešenie pre reprezentáciu komplexných dokumentov; spočiatku so
zameraním na kvalifikačné práce, ktoré sú zložené z viacerých súborov
digitálnych zdrojov;
• riešenie pre mätúce použitie dc:identifier v prípade odkazu na takzvanú
stránku jump-off (JOP), ktorá nám otvorí dokument na novej stránke. Mnohé
repozitáre umiestňujú odkaz na JOP do dc:identifier namiesto vytvorenia
priameho odkazu k digitálnemu súboru zdroja.
Úložisko DIDL XML sa používa v rámci DARE od leta 2006. Jedným z výsledkov je, že
obsah holandských repozitárov je teraz súčasťou E-Depot Holandskej národnej knižnice
Koninklijke Bibliotheek.
Odpoveď OAI vo vzťahu k dokumentu DIDL
Dokument DIDL je súčasťou odpovede OAI-PMH. Dokument DIDL sa vráti v rámci
záznamu OAI, keď sa didl použije ako hodnota metadataPrefix. Toto umožní repozitáru
generovať nižšie uvedený špeciálny formát DIDL. V rámci štruktúry OAI XML, DIDL sa
nachádza v prvku metaúdajov. Pozri:
<OAI-PMH ...>...<request ... metadataPrefix="didl_document">...<record><header>...</header><metadata>
<didl:DIDLxmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" xmlns:dip="urn:mpeg:mpeg21:2005:01-DIP-NS" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="
urn:mpeg:mpeg21:2002:02-DIDL-NShttp://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/did/didl.xsd urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dii/dii.xsd urn:mpeg:mpeg21:2005:01-DIP-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dip/dip.xsd">
86
...</didl:DIDL>
</metadata><about>...</about>
</record>...
</OAI-PMH>
Poznámky:
1. Nezabudnite uviesť tag (návestie) DIDL v odpovedi OAI-PMH.
2. Na tomto mieste deklarujte menné priestory didl , dii, dip a dcterms, v
označení tagu DIDL. Tieto menné priestory sú potrebné v celom DIDL
dokumente. Nevytvárajte tieto menné priestory v tagu <OAI-PMH>, pretože
princípom DIDL dokumentu je, že môže existovať mimo kontextu OAI-PMH ako
nezávislá jednotka.
3. Prvok about je v OAI-PMH voliteľný.
DIDL ako nástroj balenia (wrapper)
Úložisko DIDL XML – ako ho definuje DRIVER – je dokument s jedným prvkom Item na
najvyššej úrovni. Item obsahuje viaceré dcérske prvky prvku Item. Tieto dcérske prvky sa
objavujú v troch rôznych typoch. V guľatých zátvorkách je zobrazený počet prvkov XML v
množine:
87
<metadata>
<didl:DIDL ...>
<didl:Item>
<didl:Item>...</didl:Item>
<didl:Item>...</didl:Item>
<didl:Item>...</didl:Item>
</didl:Item>
</didl:DIDL>
</metadata>
Kmeňový prvok: Identifikačný príznak dokumentu DIDL
Kmeňový prvok DIDL obsahuje jeden príznak, a to DIDLDokumentID. Tento
príznak poskytuje informáciu o Identifikátore nástroja balenia DIDL ako samostatnej
jednotke. Tento identifikátor neidentifikuje intelektuálne dielo, ale sériové bajty DIDL XML.
<didl:DIDL DIDLDocumentId="urn:nbn:nl:ui:10-15290" <!-- Identification --> ... > ... </didl:DIDL>
Príznak DIDLDokumentID obsahuje ID nástroja balenia DIDL. Môže byť rovnaký ako
identifikátor OAI, ktorý používame na získanie záznamu. Nástroj balenia DIDL sa môže
použiť ako samostatná jednotka mimo kontext OAI-PMH, preto DIDL nie je to isté ako
záznam OAI. Vyžaduje sa, aby sa v budúcnosti digitálnym objektom pridelili trvalé
identifikátory (povinné pre projekt OAI-ORE). Knižniciam sa odporúča používať urn:nbn:{kód
krajiny}:{isil kód knižnice}15- {objekt id}. {objekt id} by mohlo byť číslo databázy. Odporúča
sa uložiť toto číslo v samostatnom poli a negenerovať ho automaticky z ID databázy pretože
15 ISO/NP 15511: Medzinárodný štandardný identifikátor knižníc a súvisiacich organizácií (International Standard Identifier for Libraries and Related Organizations (ISIL) http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=52666
88
Item[1..1]
Item[1..∞] (of type 1 metadata)
Item[1..∞] (of type 2 objectFile)
Item[0..1] (of type 3 start page)
DIDL[1..1]
obnovenia databázy v budúcnosti zmenia toto číslo, a tak sa stratí jeho trvalá identifikačná
hodnota.
Poznámky
1. Tento DIDLDocumentId má v prvom rade odlišný identifikátor ako identifikátor
OAI pre tento záznam. Princípom je, že dokument DIDL je samostatná jednotka,
ktorá môže existovať oddelene a mimo záznamu OAI. Hoci, na uľahčenie
prevádzkovej implementácie je povolené použiť ten identifikátor, ktorý sa používa
pre záznam OAI v prípade, že oba – aj záznam OAI, aj dokument DIDL – sú
neodstrániteľne prepojené.
Prvky deskriptorov Item (dobrovoľné)
Prvok Item môže DOBROVOĽNE obsahovať dva alebo tri prvky Descriptor-a. Jeden prvok
Descriptor-a popisuje zmenu dátumu Item. Aby bolo možné porovnať podobné
zozbierané Item v deň zmeny, musíme pridať identifikátor.
Príklad prvej úrovne:
<didl:DIDL ...> <didl:Item> <didl:Descriptor>...</didl:Descriptor> <!-- Identification --> <didl:Descriptor>...</didl:Descriptor> <!-- Modification date --> <didl:Item>...</didl:Item> <didl:Item>...</didl:Item> <didl:Item>...</didl:Item> ... </didl:Item> </didl:DIDL>
Príklad druhej úrovne; pridaný typ predmetu:
<didl:Item> <!-- Level 1 Root Item --> <didl:Item> <!-- Level 2 Child Item --> <didl:Descriptor>...</didl:Descriptor> <!—Identification --> <didl:Descriptor>...</didl:Descriptor> <!-- Modification date --> <didl:Descriptor>...</didl:Descriptor> <!-- Object type
89
--> ... </didl:Item> <didl:Item>...</didl:Item> <didl:Item>... </didl:Item> <didl:Item>...</didl:Item> ... </didl:Item> </didl:DIDL>
Descriptor Statement: Item 'Identifier' (stav deskriptora: položka 'Identifikátor')
Prvý Descriptor obsahuje ID prvok Item. P ou ž í va sa n ajčastejšie, aby bolo možné
jedinečne identifikovať digitálny objekt (napr. s DOI). Tento ID je zbalený v Statement
s prvkom DII Identifier. Napríklad:
<didl:Item> <didl:Item> <didl:Descriptor> <didl:Statement mimeType="application/xml">
<dii:Identifier>urn:nbn:nl:ui:10-6748398729821</dii:Identifier> </didl:Statement> </didl:Descriptor> ... </didl:Item> ... </didl:Item>
Poznámky:
1. Pre dcérske položky Item kmeňovej položky Item platí, že tento
Identifier sa NErovná použitému identifikátoru OAI alebo DIDL.
2. Identifier v kmeňovej položke Item MÔŽE byť ten istý ako identifikátor
DIDL alebo OAI, ale tento postup sa neodporúča.
3. Menný priestor dii musí byť označený v DIDL tagu.
90
4. Ak je to možné, identifikátor MUSÍ BYŤ popísaný ako URI.
Deskriptor Statement: Item 'modified' (stav deskriptora: položka ‘zmenený‘)
Druhý Descriptor obsahuje dátum úpravy. Keď sa niečo zmení v rámci prvku Item, táto
zmena dátového prvku musí byť obnovená. Táto modifikácia dátumu sa označuje prvkom
modified v mennom priestore dcterms:
<didl:Item> <didl:Item> ... <didl:Descriptor> <didl:Statement mimeType="application/xml"> <dcterms:modified>2006-12-20T10:29:12Z</dcterms:modified> </didl:Statement> </didl:Descriptor> ... </didl:Item> ... </didl:Item>
Poznámky:
1. Označte menný priestor dcterms v tagu DIDL.
2. Formát dátumu je čas Zulu; z čoho vyplýva, že môže byť triedený ako text.
3. V tomto vzorci sa smie nachádzať iba jeden Statement v prvku Descriptor,
čo znamená, že dii:identifier a dcterm:modified sú uložené
v oddelených prvkoch Descriptor.
Deskriptor Statement: Item ’ObjectType’ (stav deskriptora: položka ‘TypPredmetu’)
Tretí Descriptor obsahuje typ predmetu. Tento objekt sa objavuje na druhej úrovni prvku
Item. Inak povedané, používa sa iba na dcérskych položkách kmeňového Item. Tento typ
objektu špecifikuje prvok ObjectType z MPEG-21, menný priestor digitálne spracovanie
91
položky (Digital Item Processing, DIP), ktorý určuje štruktúru vzťahujúcu sa na
sprístupňovanie dokumentov zložených z digitálnych položiek (Digital Item Documents,
DID).
<didl:Item>
<didl:Item>
...
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/descriptiveMetadata
</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
</didl:Item>
...
</didl:Item>
V časti Zložený prvok: Vyjadrenie komplexnej práce sa ďalej rozvinie stanovisko k vyjadreniu
komplexnej práce tohto ObjectType.
Poznámky:
1. Označte menný priestor dip v tagu DIDL.
2. ObjectType v Deskriptor Statement MUSÍ byť popísaný ako URI.
3. Architektúra spracovania, používaná na sprístupnenie záznamu, bude použitá pre
všeobecné európske repozitáre. Použité URI sa umiestni do menného priestoru
info ako info:eu-repo (http ://i n f o - u ri . i n f o/ ) . V súčasnosti sa toto označenie
používa ako neoficiálny štandard v rámci DRIVER.
92
Zložený prvok: Vyjadrenie komplexnej práce
Prvok hlavnej položky obsahuje aspoň dva povinné prvky ObjectType položky Item. Tieto
ObjectType sú vyjadrením kmeňovej položky Item: jeden pre metaúdaje a druhý pre
digitálny súbor, napr. PDF, ktorý popisuje metaúdaje. Dobrovoľne je možné uviesť tretí
ObjectType položky Item, ktorý odkazuje na stránku mimo hlavej stránky. Táto stránka je
okamžitá html stránka, ktorá sa používa na prezentácie čitateľné „ľudským jazykom“
v prípade, že položka Item obsahuje viac ako jeden digitálny súbor. Takáto situácia sa
štandardne vyskytuje vtedy, keď majú kvalifikačné práce oddelené objektové súbory
(napríklad, ak sa kvalifikačná práca skladá zo súboru vopred uverejnených článkov). Táto
situácia nastáva aj vtedy, keď má poskytovateľ obsahu PDF, MS Word DOC a HTML verziu
toho istého článku.
<didl:DIDL ...>
<didl:Item>
<didl:Item>...</didl:Item> <!-- metadata -->
<didl:Item>...</didl:Item> <!-- objects -->
<didl:Item>...</didl:Item> <!-- jump-off-page -->
</didl:Item>
</didl:DIDL>
Prvá položka Item obsahuje metaúdaje ako nekvalifikovaný Dublin Core (DC) (povinné),
ktorý sa štandardne používa vo formátoch OAI_DC v súlade s odporúčaniami DRIVER pre
metaúdaje, ktoré patria do sústavy spracovania digitálnych položiek (Digital Item Processing
architecture). Druhá položka/y Item obsahuje odkazy na digitálne objekty a tretia zahŕňa
odkaz na stránku mimo stránky.
<didl:Item>
<didl:Item> <!--one or many occurrences-->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-
repo/semantics/descriptiveMetadata</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
93
...
</didl:Item>
<didl:Item> <!--one or many occurrences-->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-
repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
</didl:Item>
<didl:Item> <!-- zero or one occurrences -->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>
info:eu-repo/semantics/humanStartPage</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
</didl:Item>
</didl:Item>
URI sa spracujú ako necitlivé na frázovanie. Odporúča sa použiť frázovanie camelCase. Je
veľmi dôležité použiť presnú kombináciu znakov, v opačnom prípade nebude možné
automatické spracovanie údajov. Aby pri tomto postupe nedošlo k nejasnostiam, používajú sa
nasledujúce URI:
• info:eu-repo/semantics/descriptiveMetadata(Táto položka sa objavuje buď raz, alebo mnohokrát.)
• info:eu-repo/semantics/objectFile(Táto položka sa objavuje buď raz, alebo mnohokrát.)
• info:eu-repo/semantics/humanStartPage(Táto položka sa objavuje buď 0, alebo jedenkrát.)
Poznámky:
94
• Menný priestor info:eu-repo sa používa s nasledujúcou syntaxou:
info:eu-repo/_typ_/_identifikátor
Ďalšie informácie pozri na:h tt p: //in fo-u ri. in fo/reg ist ry/OA IHan dle r?ve rb=Ge tRe cord&met adat aPre fix =reg &ide nt ifie r=in fo: eu - re po/
• Táto sémantika ObjectTypes znamená napríklad: Položka Item stanovuje, že prvá podpoložka obsahuje opisné metaúdaje.
ObjectType: Metadata Item
Prvý prvok objectType položky Item obsahuje metaúdaje. Metaúdaje sú vložené do
prvku Resource . Každý Resource obsahuje menný priestor metaúdajového formátu,
ktorý sa používa. Takto poskytovateľ služby bude môcť rozoznať formát. V súlade
s protokolom OAI je povinné používať 'oai_dc'. Ak OAI_DC spĺňa základné požiadavky
OAI-PMH, pre uľahčenie implementácie môžeme použiť OAI_DC ako metaúdaje. Každý
metaúdajový záznam môže mať dobrovoľne vlastný Identifier a prvok modified v prvku
Descriptor:
info:eu-repo/semantics/descriptiveMetadata</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>--------------------------------------------------------------------------
1 <didl:Descriptor> <!-- This metadata instance has its own ID number -
->
<didl:Statement mimeType="application/xml">
<dii:Identifier>info:doi/10.1705/74836724783</dii:Identifier>
</didl:Statement>
</didl:Descriptor>--------------------------------------------------------------------------
2 <didl:Descriptor> <!-- This record has its own Modification date -->
<didl:Statement mimeType="application/xml">
<dcterms:modified>2006-12-20T10:29:12Z</dcterms:modified>
</didl:Statement>
</didl:Descriptor>
<didl:Component>--------------------------------------------------------------------------
3 <didl:Resource mimeType="application/xml"> <!-- the DC data -->
<oai_dc:dc
xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
95
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/
http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
<dc:creator>...</dc:creator>
<dc:creator>...</dc:creator>
<dc:title> ... </dc:title>
...
</oai_dc:dc>
</didl:Resource>
</didl:Component>
</didl:Item>
Poznámky:
1. (Povinné, ak sa dá použiť.) Odporúča sa identifikovať každý jeden oddelený
komponent, aby sme sa naň mohli odvolať v budúcnosti, alebo za účelom opätovného
získania dát. Tento súbor metaúdajov má vlastný identifikátor, ktorý NIE je zhodný s
identifikátorom DIDL.
2. Ak sa zmenil dátum metaúdajov, uistite sa, že sa zmenil i dátum koreňovej
položky.
3. Označte menný priestor dc v prvom tagu prvku zdroja, v ktorom použijete Dublin
Core.
ObjectType: Object Item
Druhá položka ObjectType zahŕňa odkaz k jednému digitálnemu súboru. Ak sa používa na
účely prenosu metaúdajov, tak je to vždy „doplnková informácia“ o obmedzení veľkosti
súboru („doplnková hodnota“ je možná, ale zväčšuje veľkosť súboru a dotýka sa otázok
vlastníctva, použite kódovanie base64; príklad neuvádzame) a položka Item má stav
ObjectType s URI info:eu-repo/semantics/objectFile. ObjectFile sa môže vyskytnúť
viac ako jedenkrát. Pozri:
96
<didl:Item>
...
<!—Pod touto čiarou môžeme nájsť linky k jednému alebo viacerým digitálnym súborom
-->
<didl:Item> <!-- First Item for a File/Bitstream -->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
<didl:Component>
<didl:Resource mimeType="application/pdf"
ref="http://my.server.nl/report.pdf"/></didl:Component>
</didl:Item>
<didl:Component>
<didl:Resource mimeType="application/pdf"
ref="http://my.server.nl/appendix.pdf"/><didl:Component>
</didl:Item>
<didl:Item> <!-- Third Item for a File/Bitstream -->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
<didl:Component>
<didl:Resource mimeType="application/pdf"
ref="http://my.server.nl/datasheets.xls"/><didl:Component>
</didl:Item>
</didl:Item>
Ako môžete vidieť na uvedenom príklade, umiestnenie Resource sa nevyskytuje v rôznych
komponentoch v rámci jednej položky, ale každá lokácia zdroja je zbalená v prvku Item.
97
Princípom je, že každý prúd bajtov súboru musí mať vlastný identifikátor. Na tri bodky „...“
(uvedené v príkladoch) môžete umiestniť identifikátor a modifikované tagy, čo sa podobá
položke metaúdajov.
Poznámky:
1. Poradie zložiek objektu by malo byť pri čítaní v logickom poradí! Po položke
s kapitolou jedna by mala nasledovať ďalšia sesterská položka s kapitolou 2
atď... Takto môže poskytovateľ služby urobiť lepšiu prezentáciu. Postup na
presné vyjadrenie poradia použitím číselnej postupnosti sa uvádza v ďalšej
verzii týchto špecifikácií.
2. Ak sa dátumy v prvku Resource výrazne zmenili, oznámte túto zmenu
pomocou rodičovskej položky Item, ktorá obaľuje zmenenú dcérsku položku
Item.
3. Pridajte identifikátory iba v prípade, že sa tu nejaké vyskytujú.
4. Ak sa tu nenachádzajú žiadne identifikátory pre ObjectType, použije
poskytovateľ služby identifikátor prvku DIDL.
5. Použite pre prvok „modified“ alebo „identifier“ oddelený záznam prvkov
<Descriptor> <Statement>.
6. Pravidlo palca hovorí, že ak má prúd bajtov alebo súbor vlastný identifikátor,
baliaci je prvok Item. Aby bolo prúdu bajtov umožnené mať identifikátor,
používame položku Item ako preddefinovaný subjekt na zbalenie
umiestnenia zdroja.
ObjectType: Mimostránková položka
Tretia položka ObjectType obsahuje odkaz na stránku mimo aktuálnej stránky alebo na novú
okamžitú stránku. Tento odkaz sa nastavuje rovnako ako pre prvok Object Item.
V súčasnosti sa obmedzujeme na jednu položku tohto typu, nepoužívame žiadne
identifikátory, ani prvky zmien dátumu. Táto položka je dobrovoľná:
98
<didl:Item> ... <!-- Below this line; an Item with a link to one optional Intermediate page -->
<didl:Item> <didl:Descriptor> <didl:Statement mimeType="application/xml"> <dip:ObjectType> info:eu-repo/semantics/humanStartPage </dip:ObjectType> </didl:Statement> </didl:Descriptor> ... <didl:Component> <didl:Resource mimeType="application/html" ref="http://my.server.nl/mypub.html"/></didl:Component> </didl:Item>
</didl:Item>
Príklad: DIDL vložený do OAI-PMH
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="DIDL_documentHTML.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="
http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
<responseDate>2006-12-20T10:29:11Z</responseDate><request identifier="oai:dspace.library.uu.nl:1874/15290" metadataPrefix="didl" verb="GetRecord">
http://dspace.library.uu.nl:8080/dspace - oai/request </request><GetRecord>
<record><header>
<identifier>oai:dspace.library.uu.nl:1874/15290</identifier><datestamp>2006-12-06T19:00:49Z</datestamp><setSpec>hdl_1874_69</setSpec>
99
<setSpec>hdl_1874_12233</setSpec></header><metadata>
<!-- Introducing the DIDL document. -->
<!-- Implementation Version 2.3. used in the SURFshare (nl) and DRIVER (eu) context--><!--
<didl:DIDL> is the wrapper or container that can be seen as an autonomous entity that can exist outside the OAI-PMH context.
The DIDLDocumentId attribute (optional) is the DIDL identifier and it CAN be the same as the record Identifier!Leave it out if you have no dedicated DIDL identifier.-->
<didl:DIDL DIDLDocumentId="urn:NBN:nl:ui:10-6748398729821" xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" xmlns:dip="urn:mpeg:mpeg21:2002:01-DIP-NS" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="
urn:mpeg:mpeg21:2002:02-DIDL-NShttp://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/did/didl.xsd
urn:mpeg:mpeg21:2002:01-DII-NShttp://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dii/dii.xsd
urn:mpeg:mpeg21:2005:01-DIP-NShttp://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dip/dip.xsd">
<!-- The Item is the autonomous compound complex entity that is a representation of a work--> <didl:Item> <didl:Descriptor> <didl:Statement mimeType="application/xml"><dii:Identifier>urn:NBN:nl:ui:10-6748398729821</dii:Identifier>
</didl:Statement></didl:Descriptor><didl:Descriptor>
100
<didl:Statement mimeType="application/xml"><dcterms:modified>2006-12-20T10:29:12Z</dcterms:modified>
</didl:Statement></didl:Descriptor><didl:Component>
<!-- Actual resource of Item; Location of the DIDL document --><didl:Resource mimeType="application/xml"
ref="http://dspace.library.uu.nl:8080/dspace - oai/r equest?verb=GetRecord
&metadataPrefix=didl&identifier=oai%3Adspace.library.uu.nl%3A1874%2F15290"/>
</didl:Component><!-- Introducing the area for metadata --><didl:Item>
<didl:Descriptor><!-- ObjectType of Item --><didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu- repo/semantics/descriptiveMetadata</dip:ObjectType>
</didl:Statement></didl:Descriptor><didl:Component>
<!-- Actual resource of Item --><didl:Resource mimeType="application/xml">
<oai_dc:dc xmlns="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemaLocation="
http://www.openarchives.org/OAI/2.0/oai_dc/http://www.openarchives.org/OAI/
2.0/oai_dc.xsd http://purl.org/dc/elements/1.1/
http://dublincore.org/schemas/xmls/
101
simpledc20021212.xsd"><dc:title>Neonatal Glucocorticoid Treatment
and Predisposition to Cardiovascular Disease in Rats</dc:title>
<dc:creator>Bal, M.P.</dc:creator>
<dc:subject>Geneeskunde</dc:subject><dc:subject>glucocorticoid</dc:subject><dc:subject>dexamethasone</dc:subject><dc:subject>
<!--etc...--></dc:subject><dc:subject>cellular hypertrophy</dc:subject>
<dc:subject>contractile proteins</dc:subject> <dc:description>The present thesis
describes the issue of "neonatal glucocorticoidtreatment and predisposition to cardiovascular
disease in rats". </dc:description><dc:publisher>Utrecht University</dc:publisher><dc:date>2006-12-12</dc:date>
<dc:type>Doctoral thesis</dc:type><dc:format>image/jpeg</dc:format><dc:format>image/pdf</dc:format><dc:format>image/pdf</dc:format><dc:format> <!--etc...-->
</dc:format><dc:identifier>http://igitur - archive.library.uu.nl/dissertations/
2006 - 1206- 200250/UUindex.html </dc:identifier>
<dc:language>en</dc:language> <dc:rights>(c) Bal, M.P., 2006</dc:rights>
</oai_dc:dc> </didl:Resource>
</didl:Component> </didl:Item> <!-- Introducing the area for MODS metadata -->
102
<didl:Item>
<didl:Descriptor> <!-- ObjectType of Item --> <didl:Statement mimeType="application/xml"><dip:ObjectType>info:eu-repo/semantics/
descriptiveMetadata</dip:ObjectType></didl:Statement>
</didl:Descriptor> <didl:Component> <didl:Resource mimeType="application/xml">
<mods version="3.2"xmlns="http://www.loc.gov/mods/v3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/mods/v3
http://www.loc.gov/standards/mods/v3/mods-3-2.xsd"><titleInfo xml:lang="en">
<title> Neonatal Glucocorticoid Treatment and Predisposition to Cardiovascular Disease in Rats </title>
</titleInfo> <name type="personal" ID="n1">
<namePart type="family"> Bal </namePart><namePart type="given">M.P.</namePart>
<role><roleTerm authority="marcrelator" type="code">aut</roleTerm>
</role> </name> <name type="personal" ID="n2">
<namePart type="family">Winter, de</namePart><namePart type="given">R.J.</namePart<role>
<roleTerm authority="marcrelator" type="code">aut</roleTerm>
</role> </name>
103
<extension> <daiList xmlns:dai="info:eu-repo/dai" xsi:schemaLocation="info:eu-repo/dai
http://www.surfgroepen.nl/sites/oai/metadata/Shared%20Documents/dai-extension.xsd">
<identifier IDref="n2" authority="info:eu-repo/dai/nl">157455590</identifier> <identifier IDref="n1" authority="info:eu-repo/dai/nl">123456678</identifier>
</daiList> </extension>
</mods> </didl:Resource>
</didl:Component> </didl:Item> <!-- Introducing the area for digital fulltext objects --> <!--Bitstream no: [0] --> <didl:Item>
<didl:Descriptor> <!-- ObjectType of Item --> <didl:Statement mimeType="application/xml"><dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement> </didl:Descriptor> <didl:Component> <!-- Actual resource of Item -->
<didl:Resource mimeType="text/html"
ref="https://dspace.library.uu.nl:8443/bitstream/1874/15290/18/index.htm"/></didl:Component>
</didl:Item> <!--Bitstream no: [1] --> <didl:Item> <didl:Descriptor> <!-- ObjectType of Item --> <didl:Statement mimeType="application/xml"> <dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement> </didl:Descriptor> <didl:Component> <!-- Actual resource of Item --> <didl:Resource mimeType="image/jpeg"ref="https://dspace.library.uu.nl:8443/
104
bitstream/1874/15290/16/bal.jpg"/></didl:Component>
</didl:Item> <!--Bitstream no: [2] --><didl:Item>
<didl:Descriptor> <!-- ObjectType of Item --> <didl:Statement mimeType="application/xml"> <dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement> </didl:Descriptor> <didl:Component> <!-- Actual resource of Item -->
<didl:Resource mimeType="application/pdf"ref="https://dspace.library.uu.nl:8443/bitstream/1874/15290/15/c1.pdf"/>
</didl:Component> </didl:Item> <!--Bitstream no: [3] --> <didl:Item> <didl:Descriptor> <!-- ObjectType of Item --> <didl:Statement mimeType="application/xml"> <dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement> </didl:Descriptor> <didl:Component> <!-- Actual resource of Item --> <didl:Resource mimeType="application/pdf"ref="https://dspace.library.uu.nl:8443/bitstream/1874/15290/14/c2.pdf"/>
</didl:Component> </didl:Item> <!--Bitstream no: [etc...] --> <!-- Introducing the intermediate page -->
<didl:Item> <didl:Descriptor> <!-- ObjectType of Item --> <didl:Statement mimeType="application/xml"> <dip:ObjectType>info:eu-repo/semantics/humanStartPage</dip:ObjectType>
</didl:Statement>
105
</didl:Descriptor> <didl:Component>
<!-- Actual resource of Item --> <didl:Resource mimeType="text/html" ref="http://igitur-archive.library.uu.nl/dissertations/2006-1206-200250/UUindex.html"/>
</didl:Component> </didl:Item>
</didl:Item> </didl:DIDL>
</metadata> </record>
</GetRecord></OAI-PMH>
106
Použitie slovníkov a sémantiky
info:eu-repo – Menný priestor pre pridelenie URI schémam a identifikátorom, ktoré ho nemajú pridelené
Menný priestor info:eu-repo je registrovaný na http ://i n f o - u ri . i n fo .
Menný priestor je výhradný vlastník sémantických pojmov, riadených slovníkov
a identifikátorov.
Použitím tohto menného priestoru majú všetky použité pojmy „webovú prítomnosť“. Preto už
viac nie sú ľubovoľným reťazcom, ale majú zmysel. Toto použitie ich mení na kontrolovateľné
v budúcnosti.
Identifikácia autora
(táto informácia je citovaná a z európskeho projektu NEEO16 a upravená)
Vytvorenie dynamických zoznamov autorových publikácií si vyžaduje, aby boli autori
jednoznačne identifikovaní. Najlepšie ich identifikujeme pomocou jedinečného identifikátora,
ktorý sa prideľuje každému autorovi práce. Takýto identifikátor autora voláme DAI (Digital
Author Identifier - Digitálny identifikátor autora).
DAI môžeme prideliť autorom na národnej úrovni (ako v Holandsku, kde každý autor dostáva
identifikátor v rámci systému METIS) alebo na inštitucionálnej úrovni. Každý inštitucionálny
repozitár (IR) je samostatne zodpovedný, aby mohol byť autor identifikovaný pomocou DAI
a za to, aby bol každý pridelený DAI jedinečný v rámci IR.
Formát DAI
Každý IR môže prideliť DAI v akomkoľvek formáte, ktorý mu vyhovuje v prípade, že v tejto
schéme je možné rozpoznať správnu inštitúciu, ktorá zohráva úlohu registračnej agentúry. Na
druhej strane však odporúčame použiť číslo z medzinárodných štandardov pre identifikáciu
16 Online sieť európskych ekonómov Network of European Economists Online (NEEO): informácie o projekte pozri na: h tt p : //www . n e r eu s4 e c o n o m i c s . i n fo/ n e e o .h t m l . Pre informácie o DAI pozri špecifikácie: http :// ho mepag es .u lb .a c . be/ ~ bpa uw e ls/ NEE O/W P5/W P5 %20 Tech ni ca l%20g ui d eli nes. pdf
107
mien (ISNI)17. Každý DAI MUSÍ byť jedinečný na celom svete. Tento aspekt docielime tak, že
spojíme DAI s jeho autoritou (hodnota príznaku autorita prvku identifikátor) alebo tak, že
z DAI vytvoríme úplný URI, ktorý je jedinečný. Uvádzame niekoľko príkladov platného
zakódovania DAI:
info:eu-repo/dai/nl/12456454 http://staff.university.eu/19262 urn:isni:1234567-2
Trvácnosť DAI
DAI by malo slúžiť ako trvalý identifikátor: zmena DAI autora by mohla vyvolať nesúvislé
výstupy pre poskytovateľov služby na celom svete a zoznamy publikácií by nemuseli byť
úplné. Napríklad, časť publikačného zoznamu by spadala pod DAI X, iná časť pod DAI Y
a obe by sa vzťahovali na rovnakého autora. Tým by sa aj štatistiky o sťahovaných súboroch
podľa autora zneprehľadnili. Ak potrebuje inštitúcia zmeniť DAI svojich autorov z akéhokoľvek
dôvodu, malo by sa vykonať celkové medzinárodnej úrovni, aby sa napríklad opätovne získal správny zoznam publikácií.
Chyby v používaní štatistických služieb už pravdepodobne nebude možné zvrátiť. Preto
jednoznačná rada znie: DAI nemeniť, keď už raz bol autorovi pridelený.
Predmetová klasifikácia
Metaúdaje doručené prostredníctvom OAI-PMH majú široký záber predmetových hesiel
a klasifikačných informácií. Používané klasifikačné systémy a systémy na označenie
predmetových hesiel sa veľmi líšia. Vo väčšine prípadov sa táto informácia vyskytuje vo
formáte jednoduchého dc v prvku predmet. Klasifikačná informácia sa často používa na
roztriedenie repozitára do položiek podľa toho, ktorú disciplínu pokrývajú. Preto sa daná
informácia mnohokrát vyskytuje v prvku OAI setSpec. Repozitáre e-print (klasifikácia LoC)
a repozitáre certifikované DINI (DDC) sú príkladmi tohto prístupu.
Najpoužívanejšími klasifikačnými schémami v kontexte OAI sú:
17 (ISN I ) : Štandard vo vývoji, zatiaľ neboli založené žiadne registračné agentúry, projekt skončil v roku 2009. Čísla DAI v Holandsku súhlasia s ISNI vďaka využitiu OCLC. http ://www .col le ctio ns ca na da .g c .ca/iso/ tc46s c9/ docs/s c9 n429 .pdf
108
• Klasifikácia kongresovej knižnice18
• Deweyova desatinná klasifikácia (DDC)19
• Univerzálna desatinná klasifikácia20
Často používanými systémami na označenie predmetových hesiel v kontexte OAI sú:
• Predmetové heslá Kongresovej knižnice (LCSH)
• Kontrolovaná databáza kľúčových slov (Schlagwortnormdatei - SWD)
Okrem toho metaúdaje OAI obsahujú klasifikačné kódy, ktoré sa vzťahujú na disciplínu zo
schém, ako sú matematická predmetová klasifikácia (MSC) a lekárske predmetové heslá
(MeSH), ale takisto rôzne miestne klasifikačné informácie.
V súčasnosti majú služby založené na týchto typoch informácií vážne problémy správne
vyňať informáciu z doručených údajov. Prvý krok na zlepšenie tejto situácie by sa mal
zamerať na to, aby boli použité prehľadné techniky a klasifikačné schémy pre poskytovateľov
služby.
DRIVER odporúča, aby repozitár premiestnil informáciu vzťahujúcu sa na používanie
klasifikácií a predmetových hesiel do popisného prvku identifikačnej odpovede. Keď sa
klasifikácia používa na usporiadanie repozitára pomocou množín, súčasti klasifikácie by sa
mali zopakovať v predmete.
Osvedčeným postupom je presunúť klasifikáciu do prvku predmetu „s prideleným URI“
použitím oprávneného menného priestoru, aby sa tak podporilo rozpoznanie klasifikačnej
schémy. Na základe tejto informácie môžu poskytovatelia služby ponúknuť také služby,
ako je napríklad prehliadanie klasifikácií. Tento proces zahŕňa i pridelenie anglických
pojmov klasifikačným kódom, preloženie pojmov do rôznych jazykov alebo vytvorenie
zhluku klasifikačných kódov použitím pravidiel mapovania.
Ak používate klasifikačné schémy alebo riadené slovníky, najmä kodifikačné schémy DDC alebo UDC,
odporúča sa použiť URI. Keď má schéma pridelený URI oprávneným menným priestorom, vtedy
poskytovatelia služby môžu jednoduchšie rozpoznať kodifikačné schémy. Ak je klasifikačná schéma
18 h tt p : //www .l o c . gov/ c a t d i r / c p so/ l cc o / 19 h tt p : //www . o c l c . o r g/ d e w e y/ 20 http://www.udcc.org/
109
kodifikovaná, použite čitateľný text kódu, pokiaľ sa dá v angličtine, priamo pod kodifikovaným prvkom.
Napríklad:
<dc:subject>info:eu-repo/classification/ddc/641</dc:subject> <dc:subject>Anatomy</dc:subject>
Ak nie je použitá žiadna špecifická kodifikačná schéma odporúčame použiť Deweyovu
desatinnú klasifikáciu (DDC). Prvých 1000 pojmov nazývame Sumár Deweyovej desatinnej
klasifikácie; môžete si ho stiahnuť z webovej stránky:
http :// www . o c l c . o rg/ d e w e y /re sou r c e s / summa rie s / , ak súhlasíte s nasledujúcimi podmienkami:
http://www. oc lc. org/researc h/researc hworks/ddc/terms.htm.
Slovník typov publikovania
Nižšie uvedený slovník typov publikovania má v rámci komunity európskych repozitárov dlhú
históriu. Je kombináciou typov DARE z príručky DC, typov vymenovaných v DINI a typov e-
print21. Na základe týchto odporučení boli vytvorené zlepšené odporúčania DRIVER v
„Použitie MODS pre inštitucionálne repozitáre“22, ktoré sa zhodujú s tipmy publikovania
použitými v rámci informačných systémov o vede (CRIS), akým je napríklad METIS. Tento
dokument tvorí základ pre nižšie uvedené typy publikovania.
Tieto typy publikovania sa primárne zameriavajú na európsku interoperabilitu iba za účelom
výmeny údajov medzi európskymi repozitármi. Používajú sa na zaplnenie sémantickej
medzery tým, že vytvoria spoločný základ a rôznym typom určia význam. Pojmy a popisy sú
zvolené tak, aby pokryli typy používané vo vedeckej komunikácii, zároveň aby umožňovali
rozlíšenie medzi rôznymi vo vedeckej komunikácii používanými položkami. Pojmy by mali byť
dostatočne všeobecné na to, aby manažéri repozitárov vytvorili vhodné, nie príliš špecifické
mapovanie, ktoré bude platiť všeobecne, a nie iba pre jednu komunitu.
Poznámka: Nižšie uvedené typy publikovania sú vyvinuté za účelom výmeny metaúdajov
s poskytovateľmi služby, ktoré sa zameriavajú na vedeckú komunikáciu vo všeobecnosti a nie
sú určené na interné použitie repozitárom. Mali by ste prepojiť interné publikačné typy s typmi
21 Slovník aplikačných typov Eprints (Aplikačný profil vedeckých prác - SWAP) h ttp: // ww w . u k o ln . a c . u k / re p osi t o r i e s/ d i g i re p /i n d e x /E p r i n t s_ T y p e _ V o c a b ul a ry _E nc o d i n g _ Sche m e
22 h tt p s : //www . s ur fg r o e p e n . nl /si t e s/oai/ m e t a d a t a/ S h a red % 20 D o c u m e n t s/Us e % 20of % 20 MODS% 20f o r % 20i n s t i t u t io n a l % 20 rep o s i t o r i e s - v er sio n % 201 .d o c
110
použitými nižšie. S pomocou expertov na metaúdaje a manažérov repozitárov sme dôsledne
zozbierali uvedené popisy typov publikovania. Tieto popisy nám pomôžu pri mapovaní
procesov v lokálnom repozitári.
Na typy publikovania sa využíva špeciálny menný priestor, aby boli ľudia a výpočtová
technika schopné rozoznať použitý slovník. Tento menný priestor je info:eu- repo/semantics/
(pozri prvý stĺpec nasledujúcej tabuľky). URI sa používa ako prefix k pojmu, ktorý
reprezentuje publikačný typ. Napríklad, URI článku je: info:eu repo/semantics/article. Tretí
stĺpec obsahuje popisy typov publikovania. Mali by uľahčiť rozhodovanie pri výbere správneho
typu, ktoré sa musí urobiť ešte na úrovni lokálnych repozitárov.
Druhý stĺpec obsahuje verzie, ktoré popisujú stav dokumentu. Takto môžeme popísať
publikačné typy bez toho, aby sme zamenili pojmy a verzie alebo informácie o stave. Pojem
PeerReviewArticle je ešte rozdelený, napríklad takto:
info:eu repo/semantics/article and info:eu repo/semantics/accepted.
in fo : e u - r e p o / s ema nti c s / Povolená verzia Popis
Article (článok) Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Článok alebo úvodník zverejnený v časopise.
bachelorThesis (bakalárska práca)
Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Najnižší stupeň kvalifikačnej práce (zvyčajne po troch rokoch štúdia). Pozri tiež: http ://e n . w i k i p e d i a . o rg/ w i k i/ D i p l o m
masterThesis (magisterská práca)
Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Stredný stupeň kvalifikačnej práce (zvyčajne po štyroch alebo piatich rokoch štúdia). Pozri tiež: http ://e n . w i k i p e d i a . o rg/ w i k i/ D i p l o m. Tento popis sa zameriava na kvalifikačné práce pred Bolonským dohovorom so zameraním na titul, ktorý zodpovedá titulu master.
doctoralThesis (doktorská práca)
Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Najvyšší stupeň kvalifikačnej práce (zvyčajne po viac ako štyroch alebo piatich rokoch štúdia). Pozri tiež:
111
http ://e n . w i k i p e d i a . o rg/ w i k i/ D i p l o m. Takisto všetko rovnaké a vyššie ako doktorandská práca, čo nie je v súlade s Bolonským dohovorom spadá do kategórie doctoralThesis. Pole s voľným textom neskôr poskytne príležitosť na špecifikáciu práce.
Book (kniha) Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Kniha alebo monografia.
bookPart (časť knihy) Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Časť alebo kapitola knihy.
Review (recenzia) Draft/submitted (návrh/odovzdaná) /Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Recenzia knihy alebo článku.
onferenceObject Draft/submitted (návrh/odovzdaná) /Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Všetky druhy dokumentov viažuce sa ku konferencii, napr. konferenčné príspevky, konferenčné správy, konferenčné prednášky; dokumenty publikované v zborníku, konferenčné príspevky, správy z abstraktov z konferenčných dokumentov a konferenčné postery.
Lecture (prednáška) Draft/submitted (návrh/odovzdaná) /Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Prednášky a prezentácie použité počas akademického podujatia, napr. inauguračná prednáška. Konferenčná prednáška do tejto kategórie nepatrí (pozri konferenčnáPoložka).
workingPaper (Pracovný dokument)
Draft/submitted (návrh/odovzdaná) /
Predbežný vedecký alebo technický dokument, ktorý vydala skupina inštitúcií, ktoré sa podieľajú na projekte. Používa sa aj názov výskumný dokument, výskumné memorandum alebo diskusný príspevok. Rozdiel
112
medzi ešte nevydanou prácou (preprint) a pracovným dokumentom je uverejnený v inštitučných edíciách. Príkladom sú: pracovné dokumenty, výskumné dokumenty, výskumné schémy, memorandá a diskusné príspevky.
Preprint (ešte nevydaná práca)
Draft/submitted (návrh/odovzdaná)
Podobne ako pri pracovnom dokumente (workingPaper), aj v tomto prípade ide o predbežný vedecký alebo technický dokument, ktorý však ešte nebol vydaný v inštitučnej edícii. Dokument by mal byť uverejnený vo vedeckom časopise alebo ako kapitola knihy.
Report (správa) Draft/submitted (návrh/odovzdaná)/Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná)
Táto viac-menej zostatková kategória pokrýva správy od komisií, memorandá, externé výskumné správy, interné správy, štatistiky, správy pre grantové agentúry, technickú dokumentáciu, výsledky projektov atď. Nepatria sem však konferenčné správy (pozri conferenceitem).
Annotation (anotácia) Draft/submitted (návrh/odovzdaná) /Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná
Poznámka k právnemu rozsudku.
contributionToPeriodical (Príspevok do časopisu)
Draft/submitted (návrh/odovzdaná) /Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná
Príspevok do novín, týždenníkov alebo iných neakademických časopisov.
Patent Draft/submitted (návrh/odovzdaná) /Accepted (prijatá) /Published (zverejnená) /
Patent
113
Updated (prepracovaná
Other (iné) Draft/submitted (návrh/odovzdaná) /Accepted (prijatá) /Published (zverejnená) /Updated (prepracovaná
Primárne myslené pre údaje, ktoré nie je možné publikovať, ako sú výskumné údaje, audiovizuálne materiály, animácie a podobne.
Odvodené zo
• slovníka typov e-print http://purl.org/eprint/type/.
Príklady použitia s kompletným reťazcom, vrátane URI info:eu-repo:
<dc:type>info:eu-repo/semantics/article</dc:type><dc:type>info:eu-repo/semantics/accepted</dc:type>
Reťazec info:eu-repo sa vždy pripája k pojmu. Tak určuje autoritu použitého riadeného
slovníka.
Menný priestor info:eu-repo je registrovaný na http ://i n f o - u ri . i n fo .
Viac o použití DC:type s verziami pozri časť Typ na strane 63 v kapitole Použitie
metaúdajov OAI_DC.
Slovník verzií
Táto časť popisuje verzie, charakterizujúce stav dokumentu. Zaviedli sme informáciu o verzii,
aby sme umožnili popis typov publikovania bez toho, aby sa miešali pojmy s verziami
a informáciami o stave dokumentu.
Napríklad, pojem PeerReviewedArticle sa môže rozdeliť do info:eu repo/semantics/article a
info:eu repo/semantics/accepted.
Slovník verzií je odvodený z http:// w ww . lse . a c. uk/library/v e rsions/ , pričom ide o projekt
s názvom VERZIE (VERSIONS) (Verzie e - p r i n t – p o užívateľská štúdia požiadaviek
a prieskumu o potrebe štandardov) podporovaný JISC. Tento projekt sa dotýka otázok
a pochybností, ktoré sa vzťahujú na verzie akademických dokumentov v digitálnych
114
repozitároch. Verzie sa snažia pomôcť vybudovať dôveru v obsah repozitárov
s neobmedzeným prístupom medzi všetkými zainteresovanými stranami, a tak vytvoriť súbor
nástrojov, ktorý môžete nájsť na stránke:
http :// www . l s e. a c . uk /l i b r a r y /ver s i ons /V E R S I ON S _ Too l k i t _v1_fi na l . pdf .
info: eu-repo/semantics/ Popis
Draft (náčrt) Prvotná verzia, ktorá sa funguje ako práca vo vývoji.
submittedVersion (odovzdaná verzia)
Verzia, ktorá bola odovzdaná do časopisu na recenzovanie (peer review).
acceptedVersion (prijatá verzia) Autorská verzia, ktorá zahŕňa komentáre recenzentov a je prijatá ako verzia na vydanie.
PublishedVersion(vydaná verzia)
Vydavateľom vytvorená a vydaná verzia.
updatedVersion (prepracovaná verzia)
Verzia, ktorá bola od svojho vydania už upravená.
Kódovacie schémy
Príručka DRIVER používa nasledovné kódovacie schémy:
Názov Pole Schéma
Autor dc:creator Štýl písania bibliografických údajov APA ako v referenčnom zozname. Syntax: priezvisko, krstné meno (prvé meno), [http ://e n . w i k i p e d i a . o r g/ w i k i/ Apa _ s ty le# R efere n c e_li s t ] .
Spolupracovník dc:contributor Štýl písania bibliografických údajov APA ako v referenčnom zozname. Syntax: priezvisko, krstné meno (prvé meno), [http ://e n . w i k i p e d i a . o r g/ w i k i/ Apa _ s ty le# R efere n c e_li s t ] .
Jazyky dc:language ISO 639-3 Syntax:znaky,
[http :// www . s il . o rg/ I S O639 - 3/ c od e s . asp ] .
115
Dátumy dc:date ISO 8601 [W3CDTF] Syntax: RRRR-MM-DD , MM a DD sú dobrovoľné, [http :// w ww .w 3 . o rg/Q A / T i ps /i so - dat e ] .
Formáty dc:format IANA registrovaný zoznam internetových typov nosičov (typy MIME),[http :// www . i ana . o rg/ a ss ig nm e nts / m e d i a - typ e s / ] .
Územie dc:coverage ISO 3166 (Krajiny), [http :// www . i so .c h /i so / e n / p r od s-
s ervi c e s /i so 3166 ma /02i s o - 316 6 -c od e - li sts /i nd ex. htm l ] .
Oblasť dc:coverage Box, [http :// dub li n c o re . o rg/ do c um e nts / d c m i- bo x / ] .
Geografické názvy dc:coverage TGN,
[http :// www . ge t t y . e du /re s e a r c h / too l s /v o c abu l a r y / t g n / ] .
Časové obdobie dc:coverage DCMI,
[http :// dub li n c o re . o rg/ do c um e nts / 2000/07/28 / d c m i- p eri od / ] .
Citačné informácie dc:source Príručka pre kódovanie informácií o bibliografických citáciách v Dublin Core Metadata, [http :// dub li n c o re . o rg/ do c um e nts / d c - c i tat i on - g u i d eli n e s / ] ako v dcterms:bibliographicCitation.
116
Prílohy: Ciele do budúcnosti
117
Príloha: Použitie značiek kvality
Príručka DRIVER 2.0 poskytuje základné informácie o dôležitosti kvality a interoperability.
Značky kvality sa používajú na uistenie, že takéto repozitáre sú stabilné a spoľahlivé
a pretrvajú dlhšie ako podvodné zdroje a majú aj archívnu funkciu na dlhodobé uchovanie
dokumentov.
Značkou kvality môžu byť napríklad oficiálne schválenie údajov (Data Seal of Approval) a
certifikát DINI (D I N I Certifi c ate) .
118
Príloha: Použitie trvalých identifikátorov
Trvalé identifikátory pre webové zdroje sú nevyhnutné, aby sa dala vytvoriť stabilná
a spoľahlivá infraštruktúra. Toto sa netýka iba technických detailov, ale najmä dohôd na
organizačnej úrovni.
Príručka DRIVER môže poskytnúť manažérom repozitárov zopár odporúčaní v oblasti
implementácie. Základ tvorí Správa o trvalých identifikátoroch projektu PILIN (R epo r t on
Persistent I dentifiers of the PI L IN pro j e c t ).
Poskytuje sa aj implementačný plán (implementat i on plan).
Mali by sme jednoznačne objasniť, ako súvisia trvalé identifikátory s výmenou metaúdajov
oai_dc.
V období papierových medzinárodných štandardných čísiel kníh (International Standard
Book Number, ISBN) bol vyvinutý jedinečný číselný obchodný identifikátor knihy. Každá
edícia a verzia knihy (okrem nového vydania) dostala ISBN. V digitálnom veku potrebujeme
stále viac jedinečné číselné identifikátory nielen pre digitálne publikácie, ale aj pre všetky
typy digitálnych objektov. Na internete slúži URL ako identifikátor digitálneho objektu.
Na druhej strane, všetci máme skúsenosti s poškodenými alebo nefunkčnými odkazmi, ktoré
smerujú na trvalo nedostupné webové stránky.
URL sa časom môže zmeniť z dôvodu presunu serveru ako aj z iných technických dôvodov.
To však so sebou nesie nežiaduce dôsledky na odkazy a citácie v rámci vedeckej
komunikácie.
Preto je potrebný „trvalý identifikátor“, ktorý zostane natrvalo prepojený s digitálnym
záznamom. Toto trvalé identifikačné číslo bude vždy odkazovať na digitálny záznam, ktoré
mu bolo pridelené, bez ohľadu na základnú technológiu umiestnenia (v súčasnosti máme
webové stránky; v budúcnosti môže byť však umiestnenie záznamu úplne iné).
Vo viacerých krajinách sa zaviedol systém daných trvalých identifikátorov a vznikli „národné
dekódery“. Dekóder je služba, ktorá premiestňuje a presúva, premiestňuje znakové reťazce
do URL a je prevádzkovaná národnou organizáciou. Štandardné identifikátory v prípade
vedeckej komunikácie sú DOI, Handle a URN:NBN. V prípade DOI a Handle je dekódovací
119
mechanizmus umiestnený v USA v združení pre národné výskumné iniciatívy C N R I 2 3 . V
prípade URN:NBN prevádzkuje dekódovací mechanizmus národná organizácia, často
národná knižnica.
Každému digitálnemu záznamu sa pridelí číslo, ktoré ho bude navždy reprezentovať. Aj
v prípade, že sa technológia posunie ďalej, národné organizácie zaistia, aby bol dokument
naďalej čitateľný. K dokumentom sa však treba i dostať. Trvalé identifikátory zaistia, aby boli
záznamy vystopovateľné. Stabilná informačná infraštruktúra urobí z výskumných citácií
oveľa hodnovernejšie zdroje.
URN:NBN a Handle sú v súčasnosti populárne spôsoby, ako vytvoriť trvalý identifikátor.
Odkedy sú menné priestory URN:NBN distribuované riadeným spôsobom, očakávame, že
získajú štatút spoľahlivých identifikátorov, keďže DOI už má vybudovanú dobrú povesť.
Rozdiely medzi trvalými identifikátormi sú opísané v publikácii Hansa-Wernera Hilseho and
Jochena Kotheho Zavádzanie trvalých identifikátorov (I mplementing Persiste n t I dentifier s ) 24.
Môžeme však spomenúť aj článok Emmy Tonkinovej Trvalé identifikátory: Zvažovanie
možností (Persistent I dentifiers: Considering the Options ) 25, ktorý vyšiel v 56. vydaní
časopisu Ariadne. Autorka v článku dospela k záveru, že používanie trvalých identifikátorov
si vyžaduje, aby repozitáre zabezpečili pretrvanie identifikátorov na dlhé časové obdobie.
Toto trvanie môžu zabezpečiť tzv. dôveryhodné repozitáre, ktoré majú potrebnú certifikáciu.
Pozri kapitolu Príloha: Použitie značiek kvality na strane 117.
Pre bližšie informácie pozri: http :// www . p er s i st e n t - i d e nt ifier . de a https : // www . p il i n . n e t . au/ .
Škandinávske krajiny, Nemecko, Česká republika a Holandsko používajú URN:NBN.
Hlavným dôvodom pre zvolenie urns je, že urns je internetový štandard, ktorý je overiteľný
v budúcnosti. Jedinou jeho súčasnou nevýhodou je, že nie je funkčný bez použitia http ako
prefixu. Naďalej je potrebné pracovať na tom, aby sa UR N integrovalo do systému D N S 26
použitím záznamov NAPT R 27, ktoré sa takisto používajú pre telefonáty VOIP.
23 CNRI: htt p://www. cnri .re s to n.va .us /24 Hilse, H., Kothe, J., I m p l e m en t i n g P e r sis t en t I d e n t ifi er s , KNAW, h tt p : //www . k n a w . n l / e c p a/ pu b l / pd f/2732 .pd f 25 Tonkin, E., Persistent Identifers: Considering the Options, Ariadne, issue 56,
h tt p : //www . a r ia d n e. a c . u k /iss ue 56/ t o n k i n / 26 Integrácia DNS-URN h tt p : //www . p er sis t en t - i de n t ifi er . de / e n g l is h /33 5 - p r oj e c t- pr o p osal . p hp #U R N s c o p e 27 Záznam NAPTR: h tt p : // e n .wi k i ped ia . o r g/wi k i/ NA P TR _ re c o r d
120
V súčasnosti Švédsko, Fínsko a Holandsko prišli so sľubným návrhom pre medzinárodné
dekódery trvalých identifikátorov (URN:NBN). V spolupráci so zástupcami univerzít Hopkins
a Berkeley (USA) vyvinuli pracovnú verziu základného konceptu p r oof of c on ce p t 28
medzinárodného dekóderu (GRRS). GRRS integru je štyri rôzne národné dekódery do
jedného medzinárodného dekódera. GSRS (n 2 t .i n f o ) dostane identifikátor zo zásuvného
modulu (plug-inu) prehliadača a presmeruje prehliadač k správnemu národnému dekóderu,
kde je prehliadač opätovne presmerovaný k súčasnému umiestneniu webového zdroja.
Nasleduje zobrazenie schémy tohto mulitsystémového procesu:
0. Získa prúd bitov založený na URN; 1. Presmeruje vyhľadávanie URN k GRRS; 2. Presmeruje vyhľadávanie URN k správnemu NRS; 3. Presmeruje k správnemu repozitáru; 4. Návrat s prúdom bitov Browser – prehliadač; Global Resolver Resolution Service (Medzinárodná dokódovacia rozoznávacia služba); National Resolution Service (Národná rozpoznávacia služba); Repository – repozitár
28 Global Resolution Proof of Concept: http ://www .s urfg ro epe n/si tes/s urfs ha re/ p ub li c/sof twa re/ pi ha n dl er
121
Implementačný plán používania trvalých identifikátorov URN:NBN
V prvom rade by sme radi zdôraznili, že trvalosť identifikátorov a webových zdrojov nie je
o technológii, ktorú používame, ale o organizácii a trvalej udržateľnosti obchodných modelov.
Pre viac informácií o stratégiách trvalých identifikátorov si prezrite úspešný austrálsky Projekt
spájania trvalých identifikátorov (P er s i st e nt I d e nt ifier L i nk i ng ( P IL I N ) p r o j e c t) 29, ktorý je
súčasťou projektu ARR OW 30.
Aby ste vytvorili program trvalých identifikátorov založený na číslach národnej bibliografie
N at i onal Bi b li o gr aph ic N umb e r s (NBN) URN identifikátoroch a dekóderoch, musíte dodržať
takýto postup:
1. Pracovná skupina: Vytvorte pracovnú skupinu, ktorá bude zodpovedná za všetky
technické a organizačné záležitosti projektu. Myslite však aj na syntax, ktorú použijete, napr.:
urn:nbn:{country}:{sub-namespace}:{repozitoryid}-{localid}. Country je skrátený názov krajiny,
sub-namespace predstavuje webový zdroj, ktorý pochádza z repozitára, repozitoryid je
dvojciferná reprezentácia repozitára a localid je identifikátor vygenerovaný repozitárom.
Tento postup môže vyústiť napríklad do nasledujúceho identifikátora pre jednu publikáciu:
urn:nbn:ie:ui:21-1234/5678.
2. Formálne záležitosti: Keďže menný priestor urn:nbn:ie je podľa nastavenia zásuvný
modul národnej knižnice, musíte sa s národnou knižnicou dohodnúť na používaní pod-
menného priestoru pre vedecký materiál. Tento názov by mal byť krátky a nemal by mať
žiadny sémantický význam, napríklad urn:nbn:ie:ui, urn:nbn:ie:oa alebo urn:nbn:ie:sp.
3. Registračná agentúra: Vytvorte zápis, v ktorom dostanú repozitáre krátke náhodné
dvojciferné číslo. Takto vytvoríte podmenný priestor, v ktorom môžu repozitáre nezávisle šíriť
trvalé identifikátory svojich publikácií. Napríklad dublinská Trinity College (TCD) je
registrovaná ako 21. menný priestor, v ktorom funguje, TCD bude urn:nbn:ie:ui:21.
4. Implementácia na národnej úrovni: Každý repozitár musí vygenerovať trvalý identifikátor
pre každú publikáciu v rámci poskytnutého menného priestoru a uložiť tento identifikátor
v zázname databázy. Napríklad TCD môže použiť existujúce identifikátory, aby ich pridala
po svojom mennom priestore za pomlčku. V prípade, že TDC používa handle,
identifikátor pre jednu publikáciu môže vyzerať nasledovne: urn:nbn:ie:ui:21-1234/5678.
29 Infraštruktúra projektu trvalých identifikátorov: h tt p s : //www .p i l i n . n e t . a u / 30 Projekt ARROW: http ://www .a rro w .edu .a u/
122
Ak TDC používa čísla databázy, potom: urn:nbn:ie:ui:21-15874. (Uistite sa, že ste
vygenerované identifikátory uložili. V prípade migrácie databázy sa neuložené čísla môžu
zmeniť, a tak sa stratí trvácnosť.)
5. Presun identifikátorov a URL: Každý repozitár musí vygenerovať balíček DIDL, v ktorom
sú zahrnuté URN a URL. Pozri časť o MPEG-21 DIDL v hlavnom dokumente.
6. Národné dekódovacia služba: Národný dekóder sa môže vytvoriť zozbieraním balíčkov
DIDL z každého repozitára, kde sú URL a zväzky URL dekompilované a uložené.
Webová lokácia sa musí vytvoriť na takom mieste, kde človek alebo stroj môžu hľadať
dekódovanie identifikátora. Napríklad http ://re so lver . ie, do ktorého môže používateľ vložiť
identifikátor a dostane súčasné umiestnenie webového zdroja.
Napríklad h tt p : //re so lver.ie/ u r n : nbn : ie: u i : 2 1- 1234/5678 je dekódované do
http ://re pos i to r y . t c d . ie/1234/5678 .
123
Príloha: Výmena informácií o štatistikách používania
Táto časť sa neobjaví v záverečnej verzii príručky DRIVER 2.0. Vstupné údaje pre túto časť
vychádzajú zo skúseností a osvedčených postupov dvoch európskych projektov, ktoré
z repozitárov zbierali záznamy o použití COUNTER, aby mohli predstaviť štatistiky v súhrnom
pohľade.
PIRUS: Vydavateľské štatistiky a štatistiky o používaní inštitucionálnych repozitárov
„Cieľom tohto projektu je vytvoriť také štatistiky o používaní, ktoré budú v zhode so správami
z COUNTER na úrovni individuálnych článkov. Bude ich môcť implementovať akýkoľvek
subjekt (vydavateľ, pracovník zberu údajov, IR, atď.), ktorý disponuje online článkami
z časopisov a umožní, aby boli výstupy z používania zaznamenané, nahlásené
a usporiadané na medzinárodnej úrovni štandardným spôsobom.“
Citované z: http://www.j isc. ac. uk/whatwedo/pr ogrammes/pals3/pirus.a spx.
Kontaktná osoba k projektu: Peter Sheperd at pshepherd@p r oj ec t c ounter . org
Štatistiky OA
„Jednoduchosť prístupu k dokumentu, ktorú zažívame pri dokumentoch s neobmedzeným
prístupom, keď sa nemusíme nikde prihlasovať, nič platiť, ani sa osobne identifikovať,
umožňuje oveľa ľahšie dosiahnuť požadovanú úroveň vnímania dokumentu vo vedeckej
komunite. Takéto a podobné hypotézy môžeme zistiť pomocou empirickej analýzy.
1. Aké údaje potrebujeme zozbierať?
2. Ako ich prevedieme k tvorcovi štatistík?
Open-Access-Statistics (OA-S) (Štatistiky s neobmedzeným prístupom) je spojený projekt,
ktorý sa dotýka niekoľkých otázok. V júli 2008 sa vytvorila infraštruktúra pre štandardizované
nahromadenie heterogénnych prihlasovacích webových údajov s dôrazom na inštitucionálne
repozitáre. V úzkej spolupráci so sieťou repozitárov s neobmedzeným prístupom (Network of
Open Access Repositories (OA-N)) sa používateľom sprístupnia rôzne doplnkové služby.“
124
Citované z: http :// www . d i n i . d e/ p r o j e kt e/ oa - st a t i st i k / .
Kontaktná osoba k projektu: Nils K. Windisch at w i nd i s c h @ sub . un i - g o e tt i n ge n . d e
Predbežné výsledky projektu Štatistík OA
Ciele Štatistík OA
Snažíme sa vytvoriť platné a spoľahlivé štatistiky o používaní dokumentov založené záväzne
na informáciách získaných z vrstvy HTTP.
Všetky existujúce štandardy sa dotýkajú dvoch základných bodov, ktoré vytvárajú väčšinu
nevyhnutných opráv:
• identifikácia iného ako ľudského prístupu,
• oprava multi-kliku.
Okrem toho sa pokúšame zistiť rozsah údajov a vynaloženej námahy, ktoré sú nevyhnutné,
aby sme vytvorili komplexnú štatistiku – napríklad postupnosti klikov – bez toho, aby sme
narušili súkromné práva.
Na tejto strane sa nachádza tabuľka s porovnaniami, ktorá zahŕňa odkazy na všetky
spomenuté štandardy. Podrobný popis OA-S môžete nájsť na:
http :// www . d i n i . d e/ p r oj e kt e/ oa - stat i st i k /# c 12 0 3 .
Štatistiky o používaní – a ešte dôležitejšie prvotné údaje o používaní – musia byť popísané
na abstraktnej úrovni. Nestačí definovať derivát prístupového logu Apache, keďže existuje
množstvo softvérových riešení používaných na prevádzku plnotextového repozitára. Mnohé
nevytvárajú log súbory, ani nevyužívajú serverApache.
Informácie potrebné na vytvorenie COUNTER, LogEc a IFABC
Poznámka: Názvy polí sa vo vývine projektu stále môžu zmeniť.
125
OA-S-názov poľa
Popis COUNTER LogEc IFABC|-
Document-Identifier
Jednoznačný príznak označujúci úplný text
potrebný(needed)
potrebný potrebný|-
File Format Formát súboru alebo odpoveď zo serveru (napr. HTML alebo PDF)
potrebný
potrebný potrebný|-
Service Type Povaha odpovede zo serveru (napr. úplný text, abstrakt)
potrebný potrebný -|-
Time of Request
Dĺžka spracovania požiadavky
potrebný potrebný potrebný|-
IP IP-adresa používateľa (klient)
potrebný potrebný Ak nie je dostupný identifikátor relácie:potrebný|-
Session-Identifier
Serverom vygenerovaná jednoznačná relácia/návštevný príznak
voliteľný(optional)
- Ak nie je dostupná IP:potrebný|-
User Agent Reťazec používateľského agentažiadajúceho klienta
potrebný potrebný Ak je nedostupné ID relácie: potrebný|-
HTTP Status Code
Kód stavu servera žiadostí v tvare HTTP
potrebný potrebný potrebný|-
Bytes sent Veľkosť odpovede zo servera
- - Ak nie je dostupný formát súboru HTML: potrebný
126
Doplnkové informácie, ktoré súhlasia s kontextovými objektmi OpenURL
Pre pokročilé výskumné záujmy sú dôležité nasledujúce polia, ktoré sú zavádzané už od
začiatku.
Referrer (Dovolávateľ) Jednoznačný identifikátor servera, ktorý vytvoril ContextObject|-
Referrer entity(Dovolávací subjekt)
Jednoznačné označenie predmetu pôvodu (napr. stránka abstraktu, ktorá je prepojená s úplným textom)
Dodatočné návrhy
Stav a charakteristiky softvéru repozitára musia byť získané z dostupných údajov.
Príklady:
• Cieľová stránka prehľadu stránok výsledkov vyhľadávania
• ID súčasného dokumentu
• Vyhľadávacie argumenty a prezentácia výsledkov
• Stránka s abstraktom vs. stránka s úplným textom
• Administratívne kroky
• Odosielanie dokumentu
• Alokácia metaúdajov
Mali by sme mať k dispozícii i spoľahlivú informáciu o pôvode klienta (t. j. dovolávateľa),
napríklad, či sa klient dostal k súboru pomocou frontpage alebo pomocou odkazu v RSS
repozitára.
V prípade viacnásobných serverových logov je potrebné, aby sa zosynchronizoval
systémový čas na všetkých pridružených serveroch s repozitármi.
127
Tabuľka štandardov webového používania
Poskytovateľ URL
Počítacia fráza (Counting Clause)
Časové rozpätie multi-klikov
Identifikácia používateľa
Fráza Crawler (Crawler Clause)
Crawler identifikácia
Crawler Počítaciaspráva
Co u nt e r kód
P ra xe
Náčrt 3
HTTPKód stavu (status code) je 200 alebo 304.
pre HTML 10s; pre PDF 30s
aspoň IP, v najlepšom prípade reláciu (Session)
roboty, predbežné vyvolávače, úschovne, združené vyhľadávanie(nedostupné)
čierna listina, klient http hlavička
oddelená správa
O L o g Ec HTTPKód stavu je200, 206,301, 302 alebo304.
jeden kalendárny mesiac
IP roboty,automatické sťahovanie (wget)
prístup robots.txt; # žiadostí 10,000 položiek/me-siac prístup: C-trieda 10% zásob; známa robot- Doména/IP
oddelený stĺpec v správe
Súčinné štatistiky repozitárov (I n te r o p e ra b l e
R e p osi t ory
S t a t i s t ics )
HTTPKód stavu je 200 pri abstraktoch alebo stránke s úplným textom
24 hodín IP Vyhľadávačcrawlers + automatizo-vané|AWStats'čierne listiny|vyra-dené
A WS t a ts prednastavenéhttpKód stavu{200; 304}
prednastavené:1 hodina
IP Vyhľadávač crawlers
čierna listina oddelený stĺpec v správe
I F A BC HTML: Tracking Pixel; iné: bity prenášané 95% veľkosti súboru
každé načítanie stránky sa započítava iba raz za návštevu, návšteva znamená sériu klikov pochádzajúcu z jedného IP-čísla/ID relácie menej ako 30 minút od seba
IP+agenta používateľa; Cookie- reláciu,Login-reláciu
Vyhľadávač crawlers; automatizované sťahovania (dobrovoľné)
vlastnícka čierna listina
vyradené
128
Príloha: Použitie práv duševného vlastníctva (IPR)
Táto časť sa týka dôležitej otázky – práv použitia a práv deponovania. Tieto opatrenia sa
musia zaviezť do praxe. Príručka DRIVER poskytuje informácie ako by práva použitia
a práva deponovania mali byť zobrazené a naformátované v metaúdajoch.
Základom tejto časti bude kopírovateľný súbor nástrojov, ktoré odrážajú princípy Zwolle,
vyvinutý nadáciami SURF a JISC.
Pozri: http :// c opy rig htt o o l bo x . su rf . n l/ c opy rig httoo l bo x/ .
Pre bližšie informácie o autorských právach a o tom, ako ukladať, používať a opätovne
využívať licencie, pozri:
http :// www . su rff o u ndat i on . n l/ sma r t s i t e. d w s ?c h = A HO&i d =13591 .
Dokumenty s neobmedzeným prístupom musia byť bezchybne spravované v oblasti
vlastníckych práv. Dokonca i v prípade, keď je dokument neobmedzene dostupný, autorské
právo môže obmedziť použitie nájdeného materiálu. Creative Commons ponúkajú bezplatné
nástroje, ktoré umožňujú autorom, vedcom, umelcom a vzdelávacím pracovníkom ošetriť ich
tvorivú prácu právami, ktoré má zdieľať. Môžete použiť CC, aby ste zmenili v autorských
právach pojem „všetky práva vyhradené“ na „niektoré práva vyhradené“.
Vo vede, za účelom neohraničeného šírenia poznania a súčasne bez toho, aby sa stratilo
povedomie o vlastníctve, môžete v oblasti vašej právomoci použiť Licencie Creative
Commons (C re a tive Commons li c ense BY - SA ) .
To znamená, že:
• SA – Zdieľaj rovnako (Share Alike): každému je povolené použiť váš materiál,
dokonca sa povoľuje i komerčné použitie.
o Poznámka 1: Komerčný alebo nekomerčný používateľ musí použiť rovnaké
licencie pre odvodenú prácu. Výsledok: poznatok nezostane uzavretý.
o Poznámka 2: Na druhej strane by rýchlosť inovácií nemala byť privysoká,
pretože niektoré strany nechcú pri tvorbe odvodených prác použiť rovnaký
licenčný model.
129
• BY: Každý vždy musí spomenúť vaše meno, ako meno originálneho autora (aby
ste aj vy získali uznanie za prispenie k dokumentu).
Ak používate autorské právo, odporúčame vám použiť autorské práva s dobrým popisom
použitia, napríklad: http ://cre a t ivec ommons . o rg/lice ns e s / b y- sa /3.0/ n l/ .
V nekva l i f i kovan om Du b l i n Co re sa l i cenc ie s t áva jú s t ro jom
ro zpozna t e ľným i a k pou ž i j e me :
<dc:rights>http://creativecommons.org/licenses/b y - sa/2.0/uk/</dc:rights><dc:rights>cc-by-sa, Andrew Smith</dc:rights>
Pre podrobný technický prehľad si pozrite časť o Právach na strane 73.
Viac informácií nájdete na stránkach:
• http :// c opy rig htto o l bo x . su rf . n l/ c opy rig httoo l bo x/
• http :// s c ie n c e c ommons . o rg/ p r o j e c ts / pub li sh i n g /
• http :// c re at ive c ommons . o rg
• http://www. surffounda t ion.nl/smartsite.dws?c h=AHO&id=13591
130
Glosár
CRIS (Current Research Information System) Informačný systém pre oblasť vedy
a výskumu, obsahujúci okrem publikačnej činnosti najmä informácie o organizáciách
a výskumných tímoch, riešených projektoch a personálnu databázu odborníkov.
DAI (Digital Author Identifier) Jedinečné číslo (na celonárodnej úrovni v Holandsku),
priradené jednotlivým autorom. Umožňuje zjednotenie zápisu mien autorov
a rozlíšenie autorov s rovnakým menom.
DCMI (Dublin Core Metadata Initiative) Otvorené fórum, zaoberajúce sa vývojom
metaúdajových štandardov.
DDC (Dewey Decimal Classification) Proprietárny systém klasifikácie knižničných
dokumentov, vyvinutý Melvilom Deweyom v roku 1876. U nás sa používa ako
medzinárodné desatinné triedenie, MDT.
DIDL (Digital Item Declaration Language). Deklaračný jazyk digitálnych prvkov (digital
items). Ide o štruktúrované digitálne objekty vrátane štandardnej reprezentácie,
identifikácie a metaúdajov.
DINI (Deutsche Initiative für Netzwerkinformation) Organizácia zastrešujúca štandardy
pre elektronické dokumenty a ich publikovanie a vydávajúca certifikáty
prevádzkovateľom repozitárov, spĺňajúcim tieto štandardy.
DOI (Digital Object Identifier) Identifikátor digitálneho objektu je systém pre
identifikáciu obsahu objektov v digitálnom prostredí. DOI sú mená, priradené každej
entite v digitálnej sieti. Používajú sa, aby zabezpečili aktuálnu informáciu vrátane
toho, kde sa objekt (alebo informácia o ňom) na internete aktuálne nachádza. Systém
DOI umožňuje identifikáciu a riadenie intelektuálneho obsahu, riadenie metaúdajov,
spájanie používateľov s poskytovateľmi digitálneho obsahu.
Dublin Core je formálny štandard pre popis metaúdajov prvkov. Je výsledkom
medzinárodnej dohody, ktorá definuje minimálne informačné zdroje popisu, pre
použitie v prostredí webu.
HTML (Hypertext Mark-up Language) Hypertextový značkovací jazyk je štandardom
pre tvorbu web dokumentov. Základom tohto jazyka sú značky, čo je text v ostrých
131
zátvorkách. Internetový prehliadač má za úlohu vyhodnotiť a spracovať text v
zátvorkách.
HTTP (HyperText Transfer Protocol) Protokol pre prenos stránok medzi web serverom
a prehliadačom. Jednoduchý aplikačný protokol vystavený nad protokolom TCP.
Bezstavový protokol modelu požiadaviek.
Interoperabilita je schopnosť informačného systému používať informácie a funkcie
iného systému používaním spoločných štandardov.
ISBN (International Standard Book Number) Medzinárodné štandardné číslo knižných
dokumentov. Národná agentúra ISBN je národným strediskom pre ISBN, Bookland
ISBN. Spolupracuje s organizáciami pre tieto systémy a s ich národnými členmi.
Buduje bázy údajov pre potrebu medzinárodnej evidencie dokumentov, verejné
knižnično-informačné služby a vnútorné využitie.
ISNI (International Standard Name Identifier) je návrh normy ISO (ISO 27729),
zameraný na identifikáciu verejných identít (mien) tvorcov a prispievateľov v sektore
médií. Systém ISNI jednoznačne identifikuje verejné identity v rôznych odboroch
tvorivej činnosti, ako sú napríklad knihy, televízne programy, novinové články.
ISSN (International Standard Serial Number) Medzinárodné štandardné číslo seriálu
jednoznačne identifikuje pokračujúce pramene, ktoré zahŕňajú seriály (tlačené
časopisy, magazíny, adresáre, ročenky, noviny, monografické série, elektronické
časopisy, e-seriály) a integrujúce pokračujúce pramene (aktualizované databázy,
webové stránky a publikácie na voľných listoch).
Klasifikácia kongresovej knižnice (Library of Congress Classification, LCC)
Triediaci systém vedných disciplín (21 tried) používaný najmä v USA.
Kompatibilita je zlučiteľnosť, spojiteľnosť, schopnosť spolupracovať. V IKT ide o
vlastnosť periférnych jednotiek, programov, kódov, umožňujúca ich použitie bez
zmeny aj v iných typoch počítačov.
Kvalifikačné práce sú práce spracúvané na získanie vysokoškolského titulu alebo
vedecko-pedagogickej hodnosti. Rozoznávame tieto druhy kvalifikačných prác:
o záverečné bakalárske práce
132
o diplomové práce
o rigorózne práce
o dizertačné práce
o habilitačné práce
eTheses (elektronické kvalifikačné práce) sú kvalifikačné práce v elektronickej
podobe.
LaTeX – typografický a DTP (Desktop Publishing) softvér na tvorbu, zalamovanie
a tlač dokumentov.
MARC (Machine Readable Cataloguing) Rodina formátov založená na ISO 2709 pre
výmenu bibliograf. a súvisiacich informácií v strojovom kóde. Napr. USMARC,
UKMARC and UNIMARC.
Mapovanie údajov medzi dvoma odlišnými údajovými modelmi znamená priraďovanie
jednotlivých položiek jedného modelu zodpovedajúcim položkám druhého modelu,
párovanie.
Menný priestor (Namespace) je množina mien identifikovaných URI referenciou,
ktoré sa v XML dokumentoch používajú ako názvy elementov a atribútové názvy.
Metaúdaje sú štruktúrované údaje nesúce informácie o primárnych údajoch. Môžu
reprezentovať jednoduché pomenovanie informácií o zdroji, ale aj zložitejšie
štruktúrované záznamy. Opisujú aspekty dokumentov a údajov ako sú definícia,
štruktúra a administratíva.
METS (Metadata Encoding and Transmission Standard) XML schéma pre kódovanie
popisných, štrukturálnych a administratívnych metaúdajov digitálnych objektov.
Používa sa na podporu výmeny digitálnych objektov medzi úložiskami, skladmi. Vývoj
utilít na bežnú prezentáciu a archiváciu digitálnych objektov.
MIME (Multipurpose Internet Mail Extensions) je internetový štandard, ktorý rozširuje
základný formát emailu, je používaný aj na popis obsahu súborov. Slúži na popis
možných obsahových typov vo všeobecnosti, nielen v oblasti elektronickej pošty.
Používa sa ako súčasť komunikačných protokolov.
133
Množina (Set) Množina je voliteľný pojem pre zoskupenie položiek za účelom
selektívneho zberu. Úložiská (repozitáre) môžu organizovať položky do množín.
MODS (Metadata Object Description Schema) XML schéma vyvinutá Library of
Congress pre reprezentáciu MARC sémantík v značkovacom jazyku XML. MODS
môže byť používaný pri prenose vybraných údajov z MARC21 záznamov alebo pre
tvorbu pôvodných zdrojových popisných viet podľa bohatšej špecifikácie ako Dublin
Core, ale menej úplne ako plný MARC.
Nástroj balenia (Wrapper) v oblasti dolovania údajov (data mining) znamená
program, ktorý extrahuje obsah čiastkového informačného zdroja (z internetu) a
prekladá ho do štruktúrovanej formy.
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) Iniciatíva
otvorených archívov je iniciatívou z oblasti digitálnych knižníc. Koncept OAI sa
sústreďuje najmä na prístup k údajom, na limitované rešeršné funkcie realizované cez
metaúdaje (metadata harvesting). Pôvod iniciatívy OAI je v oblasti elektronického
publikovania, predovšetkým odborného – pod pojmom archív sa primárne rozumie
“sklad” vedeckých/odborných článkov a štúdií, určené na šírenie v rámci odbornej
komunity. Otvorenosť sa chápe na úrovni systémovej architektúry v zmysle
definovania rozhraní, umožňujúce prístup k údajom rôznych producentov.
Oneskorený prístup je forma voľného sprístupnenia úplného textu časopiseckých
článkov na internete s určitým časovým odstupom od vydania konkrétneho čísla
periodika. Ide spravidla o niekoľko mesiacov až pol roka.
OA (Open Access) Otvorený prístup znamená neobmedzený internetový prístup
k článkom vo vedeckých časopisoch, ale aj k monografiám a kapitolám kníh.
OCLC (Online Computer Library Center) Nezisková servisná a výskumná organizácia
zameraná na podporu knižničných činností (lokalizácia, akvizícia, katalogizácia,
cirkulácia...). Je správcom katalógu WorldCat vrátane autoritných a pomocných báz a
sprievodných služieb.
ODT (Open Document Text) je otvorený dokumentový formát pre kancelárske
aplikácie. Je otvorený formát súboru určený na ukladanie a vzájomnú výmenu
134
upravovateľných kancelárskych dokumentov, charakteristický pre programový balík
Open Office. Súbory majú príponu .odt.
Peer review je pojem, označujúci kontrolu práce alebo diela odborníkmi aktívnymi v
rovnakej oblasti; recenzia.
Položka (Item) Položka je zložka úložiska (repozitára), z ktorého môžu byť šírené
metaúdaje o zdroji. Položka je vlastne kontajner, ktorý ukladá alebo dynamicky
generuje metaúdaje o jednotlivých zdrojoch vo viacerých formátoch, z ktorých každý
môže byť zozbieraný ako záznam cez protokol OAI-PMH.
Prefix (predpona) je časť slova stojaca pred slovným základom a obvykle meniaca
jeho význam.
PURL (Persistent Uniform Resource Locator) Trvalý unifikovaný lokátor zdroja. Slúži
na odstránenie problémov s častou zmenou URL adries. Vznikol ako medzi krok pre
zabezpečenie stáleho prístupu k sieťovým zdrojom do času plnej funkčnosti URN.
RDF (Resource Description Framework) Je všeobecne zameraným jazykom určeným
na webovskú prezentáciu. RDF vyvinulo World Wide Web Consortium (W3C), aby
položilo základ pre interoperabilitu metaúdajov medzi rôznymi komunitami
popisujúcimi informačné zdroje.
Taxonómia je systematické triedenie a opis v rámci konkrétnej oblasti.
Token znamená kategorizovaný blok textu, obyčajne pozostáva z nedeliteľných
znakov. V počítačovej vede sa používa aj pojem známka.
Typ publikovania je typ publikácie (dokumentu) a verzie – spôsobu zverejnenia.
Unicode je štandard pre univerzálne kódovanie znakov pre počítače. Definuje
kódovaciu schému schopnú reprezentovať väčšinu znakov používaných v písaných
jazykoch (napr. diakritika) spolu s inými symbolmi.
UDC (Universal decimal classification) Univerzálna desatinná klasifikácia je
celosvetovo používaný viacjazyčný klasifikačný systém pre všetky vedné oblasti,
nástroj na indexovanie a vyhľadávanie.
135
URI (Uniform Resource Identifier) Štandard popisujúci umiestnenie objektu na
internete. Popisuje mechanizmus prístupu k objektu (napr. protokolu), určenie
počítača (napr. DNS, IP), kde je objekt umiestnený a umiestnenie objektu na počítači
(napr. cestu a názov súboru).
URL (Uniform Resource Locator) Je adresa, ktorá jednoznačne identifikuje nejaký
zdroj v Internete. URL nie je obmedzený len na službu WWW, ale obsahuje celé
spektrum služieb (WWW, FTP, e-mail, telnet, ...).
URN:NBN (Uniform Resource Name:National Bibliography Numbers) sú bibliografické
identifikátory ako názvy pre objekty, ktoré existujú ako v tlačenej podobe a v
elektronických formátoch.
Úplný text. Zverejniť úplný text znamená zverejniť kompletné znenie článku, na
rozdiel od bibliografického záznamu (obsahuje iba základné údaje ako sú autor,
názov, zdroj, rok vydania a pod.), príp. abstraktu (stručná charakteristika článku
spravidla v rozsahu od jedného odseku do cca 300 slov).
Validácia – overenie, preverenie. Všeobecne validácia produktu je činnosť, ktorou sa
preukazuje zhoda produktu s požiadavkami. Validácia vstupných údajov je jedna z
najdôležitejších častí každej aplikácie. Pomocou validácie máme zaručené, že údaje
vstupujúce do našej aplikácie zodpovedajú nastaveným pravidlám a nebudú
narušovať konzistenciu aplikácie.
W3C (World Wide Web Consortium) Je medzinárodné konzorcium, ktorého členovia
spoločne s verejnosťou vyvíjajú webové štandardy pre World Wide Web.
XML (eXtensible Markup Language) je jednoduchý, veľmi flexibilný, textový formát
odvodený od SGML (ISO 8879). Pôvodne bol navrhnutý, aby splnil požiadavky na
masové elektronické publikovanie. Zohráva dôležitú úlohu pri celosvetovej výmene
rôznych údajových štruktúr nielen v prostredí World Wide Webu, ale aj v iných
prostrediach vyžadujúcich údajovú komunikáciu.
Záznam (Record) Záznamom rozumieme metaúdaje v špecifickom formáte. Keď
zadáme protokolu požiadavku na vyhľadanie, vráti sa záznam v podobe bajtov v tvare
XML.
136
Zberný modul (Harvester) je softvérový nástroj na archiváciu informačných zdrojov
internetu.
Zdroj (Resource) je objekt, predmet, ktorý je opísaný metaúdajmi. Informácia o tomto
zdroji je uložená v repozitári.
137