31
TELplus és EDLnet úton az Európai Digitális Könyvtár felé Horváth Ádám Országos Széchényi Könyvtár Múzeumok az EUROPEANA-ban - ATHENA projekt Budapest, 2009. május 22.

TELplus és EDLnet úton az EurópaiDigitális Könyvtár felé - Múzeumok az EUROPEANA-ban

Embed Size (px)

Citation preview

TELplus és EDLnetúton az Európai

Digitális Könyvtár felé

Horváth ÁdámOrszágos Széchényi Könyvtár

Múzeumok az EUROPEANA-ban - ATHENA projekt

Budapest, 2009. május 22.

TELPlus - EDLNet 2 Horváth Ádám - OSZK

Tartalom• TELPlus• EDLNet

TELPlus - EDLNet 3 Horváth Ádám - OSZK

TELPlus• Fő cél

– A The European Library átalakulhasson egy Európai Digitális Könyvtárrá

– Résztvevők• 26 nemzeti könyvtár

• Honlaphttp://www.theeuropeanlibrary.org/telplus/

TELPlus - EDLNet 4 Horváth Ádám - OSZK

TELPlus• Eszköz

– Optikai karakterfelismeréssel kereshetővé tenni a digitalizált könyveket

– A leíró adatokat OAI kompatibilissé tenni– Új keresőmotor kiválasztása– Web szolgáltatások integrálása a TEL

keresőfelületébe– TEL személyre szabása– Bulgária és Románia csatlakoztatása a TEL-

hez

TELPlus - EDLNet 5 Horváth Ádám - OSZK

TELPlus• Karakterfelismerés

– 50 millió oldal felismertetés– Leíró adatok és a szövegek begyűjtése

• TEL Application Profile– http://www.theeuropeanlibrary.org/handbook/

Metadata/tel_ap.html

• <tel:fullText>• <tel:structuralMetadata>

– Leíró adatok és a szövegek indexelése• Lucene

TELPlus - EDLNet 6 Horváth Ádám - OSZK

TELPlus• OAI-PMH kompatibilitás

– Repox OAI-PMH szerver• Input formátum: ISO2709, MARCXML,

MarcXchange; bármi• Input karakterkészlet: sokféle köztük a MARC8• Belső formátum: MarcXchange/ normalizált UTF-

8, vagy bármi.• Kimenet: TEL Application Profile, bármi (XLST

megadható)• Tud aratni is

TELPlus - EDLNet 7 Horváth Ádám - OSZK

TELPlus• Az elérhetőség növelése (1/3)

– Használhatóbb indexelés és keresés• Nevek, kulcsszavak, helyek felismerése• Egyértelműsítés (London)• „Facet” navigálás• Keresési javaslat• „Fuzzy” és fonetikus keresés• Hasonló dokumentumok megmutatása• Többnyelvű keresés

TELPlus - EDLNet 8 Horváth Ádám - OSZK

TELPlus• Az elérhetőség növelése (2/3)

– Tárgyi visszakeresés fejlesztése• Rameau, SWD, LCSH konvertálás SKOS

formátumba• SKOS automatikus megfeleltetés

– Rameau – LCSH– Rameau – SWD– LCSH - SWD

TELPlus - EDLNet 9 Horváth Ádám - OSZK

TELPlus• Az elérhetőség növelése (3/3)

– FRBR keresés és böngészés megvalósítása• Egy szűkebb mintán: Biblia, Nobel díjasok • Szemantikus megoldás

TELPlus - EDLNet 10 Horváth Ádám - OSZK

TELPlus• Web szolgáltatások

– Szolgáltatások felkutatás – Szolgáltatásokat leíró séma– Szolgáltatás regiszter készítése– Szolgáltatások integrálása a TEL portálba– Új szolgáltatások készítése

• Képek annotálása• Zoom szolgáltatás• Időgép a Google térképek szolgáltatásán• SKOS rekordok készítése tezaurusz rekordokból és név

besorolási adatokból: OSZK kész• Szövegelemző (nevek kiemelése, csak angolra)• Szövegkiemelő (keresőszót)• XSLT transzformáció

TELPlus - EDLNet 11 Horváth Ádám - OSZK

TELPlus• Személyre szabás

– A felhasználó viselkedésének megértése– Igények felmérése– Személyre szabott keresés– Személyre szabott értesítések– Annotálás

TELPlus - EDLNet 12 Horváth Ádám - OSZK

TELPlus• OSZK részvétel

– Karakterfelismerés• 200 000 oldal: készül

– OAI-PMH• A teljes katalógus arathatóvá tétele: készül• Az teljes-szöveges dokumentumok arathatóvá

tétele: készül

– Webszolgáltatások• Tezaurusz használata a keresés gazdagítására

– SKOS SRU kereséssel: kész

TELPlus - EDLNet 13 Horváth Ádám - OSZK

EDLNet• Cél

– Európai Digitális Könyvtár megteremtése a könyvtárak, múzeumok és levéltárak együttműködésével

• Honlaphttp://www.theeuropeanlibrary.org/portal/organisation/cooperation/archive/edlproject/index.php

TELPlus - EDLNet 14 Horváth Ádám - OSZK

EDLNet• Eredmények

– Folyamatos támogatás: Holland Nemzeti Könyvtár, Német kormány, EU

– Közel 5 millió objektum– Kb. 200 közreműködő intézmény– Objektum modell kész– Irányítási modell van– Működő prototípus– Javasolt gazdasági modell van– Elkezdődött a tényleges szervezet

felépítése

TELPlus - EDLNet 15 Horváth Ádám - OSZK

EDLNet -> Europeana V.1.0• Feladatok (1/2)

– Beadás automatizálása– Az adatok fejlesztése– Jogkezelés megoldása (beleértve a szabad

dokumentumok megtartását)– Az objektum modell megvalósítása– Felhasználó által létrehozott tartalom

kezelése– Többnyelvű keresés fejlesztése

TELPlus - EDLNet 16 Horváth Ádám - OSZK

EDLNet - > Europeana V.1.0• Feladatok (2/2)

– Márka létrehozása– A márka eladása– Egyetértés az irányításról– További pályázatok– Europeana Open Source feljelesztői

közösség létrehozása– Új kapcsolatok építése– Hosszútávú önfenntartó működés

biztosítása

TELPlus - EDLNet 17 Horváth Ádám - OSZK

Europeana V.1.0• Elosztott fejlesztés

TELPlus - EDLNet 18 Horváth Ádám - OSZK

EDLNet• Elosztott fejlesztés

TELPlus - EDLNet 19 Horváth Ádám - OSZK

The Big Post-It experiment[2/4]

TELPlus - EDLNet 20 Horváth Ádám - OSZK

Europeana körüli projektek

– Europeana V.1.0– EuropeanaConnect

• Nagyon sok fejlesztés ennek keretében valósul meg

– EuropeanaLocal• Magyar részvétel

– Athena• Magyar részvétel

TELPlus - EDLNet 21 Horváth Ádám - OSZK

Europeana V.1.0• Adatmodell

– http://dev.europeana.eu/functional specification

TELPlus - EDLNet 22 Horváth Ádám - OSZK

EDLNet• Adatmodell

TELPlus - EDLNet 23 Horváth Ádám - OSZK

• Szurrogátum modell

TELPlus - EDLNet 24 Horváth Ádám - OSZK

EDLNet• Adatmodell

TELPlus - EDLNet 25 Horváth Ádám - OSZK

Europeana V.1.0• Konkretizálás alapjai lehetnek

– DELOS Reference Model: http://www.delos.info/ReferenceModel

– MPEG 21 DIDL: http://xml.coverpages.org/MPEG21-WG-11-N3971-200103.pdf

– PRISM, Publishing Requirements Industry Standard Metadata, http://www.prismstan dard.org/

– OAI-Data: ORE http://www.openarchives.org/ore/0.1/datamodel

– CIDOC CRM / FRBRoohttp://cidoc.ics.forth.gr/docs/frbr_oo/frbr_docs/FRBR_oo_V0.9.pdf

TELPlus - EDLNet 26 Horváth Ádám - OSZK

Europeana V.1.0• Az Europeana prototípus így

konkretizált:– Europeana Semantic Elements

• http://dev.europeana.eu/specification for metadata elements

TELPlus - EDLNet 27 Horváth Ádám - OSZK

Europeana V.1.0• Europeana Semantic Elements (1/2)

– DC title; alternative– DC creator– DC subject– DC description tableOfContents– DC publisher– DC contributor– DC date created; issued– DC type– DC format extent; medium– DC identifier– DC source– DC language– DC relation; isVersionOf; hasVersion; isReplacedBy;– replaces; isRequiredBy; requires;– isPartOf; hasPart; isReferencedBy;– references; isFormatOf; hasFormat;– conformsTo– DC coverage; spatial; temporal– DC rights– DCterms provenance

TELPlus - EDLNet 28 Horváth Ádám - OSZK

Europeana V.1.0• Europeana Semantic Elements (1/2)

– Europeana isShownBy; isShownAt– Europeana userTag– Europeana unstored– Europeana object– Europeana language– Europeana provider– Europeana type– Europeana uri– Europeana year– Europeana hasObject– Europeana country

TELPlus - EDLNet 29 Horváth Ádám - OSZK

Europeana V.1.0• Fejlesztés módszere

– OpenSource és kód megosztás az EuropenaLabs keretein belül

– Fejlesztési környezet a gyors prototípus készítéshez

– Nagy mennyiségű, jó minőségű adatok– Homokozó a teszteléshez

• Hatékonyság• Skálázhatóság

TELPlus - EDLNet 30 Horváth Ádám - OSZK

EDLNet

TELPlus - EDLNet 31 Horváth Ádám - OSZK

Köszönöm a figyelmet

[email protected]