Upload
horvadam
View
17
Download
6
Embed Size (px)
Citation preview
TELplus és EDLnetúton az Európai
Digitális Könyvtár felé
Horváth ÁdámOrszágos Széchényi Könyvtár
Múzeumok az EUROPEANA-ban - ATHENA projekt
Budapest, 2009. május 22.
TELPlus - EDLNet 3 Horváth Ádám - OSZK
TELPlus• Fő cél
– A The European Library átalakulhasson egy Európai Digitális Könyvtárrá
– Résztvevők• 26 nemzeti könyvtár
• Honlaphttp://www.theeuropeanlibrary.org/telplus/
TELPlus - EDLNet 4 Horváth Ádám - OSZK
TELPlus• Eszköz
– Optikai karakterfelismeréssel kereshetővé tenni a digitalizált könyveket
– A leíró adatokat OAI kompatibilissé tenni– Új keresőmotor kiválasztása– Web szolgáltatások integrálása a TEL
keresőfelületébe– TEL személyre szabása– Bulgária és Románia csatlakoztatása a TEL-
hez
TELPlus - EDLNet 5 Horváth Ádám - OSZK
TELPlus• Karakterfelismerés
– 50 millió oldal felismertetés– Leíró adatok és a szövegek begyűjtése
• TEL Application Profile– http://www.theeuropeanlibrary.org/handbook/
Metadata/tel_ap.html
• <tel:fullText>• <tel:structuralMetadata>
– Leíró adatok és a szövegek indexelése• Lucene
TELPlus - EDLNet 6 Horváth Ádám - OSZK
TELPlus• OAI-PMH kompatibilitás
– Repox OAI-PMH szerver• Input formátum: ISO2709, MARCXML,
MarcXchange; bármi• Input karakterkészlet: sokféle köztük a MARC8• Belső formátum: MarcXchange/ normalizált UTF-
8, vagy bármi.• Kimenet: TEL Application Profile, bármi (XLST
megadható)• Tud aratni is
TELPlus - EDLNet 7 Horváth Ádám - OSZK
TELPlus• Az elérhetőség növelése (1/3)
– Használhatóbb indexelés és keresés• Nevek, kulcsszavak, helyek felismerése• Egyértelműsítés (London)• „Facet” navigálás• Keresési javaslat• „Fuzzy” és fonetikus keresés• Hasonló dokumentumok megmutatása• Többnyelvű keresés
TELPlus - EDLNet 8 Horváth Ádám - OSZK
TELPlus• Az elérhetőség növelése (2/3)
– Tárgyi visszakeresés fejlesztése• Rameau, SWD, LCSH konvertálás SKOS
formátumba• SKOS automatikus megfeleltetés
– Rameau – LCSH– Rameau – SWD– LCSH - SWD
TELPlus - EDLNet 9 Horváth Ádám - OSZK
TELPlus• Az elérhetőség növelése (3/3)
– FRBR keresés és böngészés megvalósítása• Egy szűkebb mintán: Biblia, Nobel díjasok • Szemantikus megoldás
TELPlus - EDLNet 10 Horváth Ádám - OSZK
TELPlus• Web szolgáltatások
– Szolgáltatások felkutatás – Szolgáltatásokat leíró séma– Szolgáltatás regiszter készítése– Szolgáltatások integrálása a TEL portálba– Új szolgáltatások készítése
• Képek annotálása• Zoom szolgáltatás• Időgép a Google térképek szolgáltatásán• SKOS rekordok készítése tezaurusz rekordokból és név
besorolási adatokból: OSZK kész• Szövegelemző (nevek kiemelése, csak angolra)• Szövegkiemelő (keresőszót)• XSLT transzformáció
TELPlus - EDLNet 11 Horváth Ádám - OSZK
TELPlus• Személyre szabás
– A felhasználó viselkedésének megértése– Igények felmérése– Személyre szabott keresés– Személyre szabott értesítések– Annotálás
TELPlus - EDLNet 12 Horváth Ádám - OSZK
TELPlus• OSZK részvétel
– Karakterfelismerés• 200 000 oldal: készül
– OAI-PMH• A teljes katalógus arathatóvá tétele: készül• Az teljes-szöveges dokumentumok arathatóvá
tétele: készül
– Webszolgáltatások• Tezaurusz használata a keresés gazdagítására
– SKOS SRU kereséssel: kész
TELPlus - EDLNet 13 Horváth Ádám - OSZK
EDLNet• Cél
– Európai Digitális Könyvtár megteremtése a könyvtárak, múzeumok és levéltárak együttműködésével
• Honlaphttp://www.theeuropeanlibrary.org/portal/organisation/cooperation/archive/edlproject/index.php
TELPlus - EDLNet 14 Horváth Ádám - OSZK
EDLNet• Eredmények
– Folyamatos támogatás: Holland Nemzeti Könyvtár, Német kormány, EU
– Közel 5 millió objektum– Kb. 200 közreműködő intézmény– Objektum modell kész– Irányítási modell van– Működő prototípus– Javasolt gazdasági modell van– Elkezdődött a tényleges szervezet
felépítése
TELPlus - EDLNet 15 Horváth Ádám - OSZK
EDLNet -> Europeana V.1.0• Feladatok (1/2)
– Beadás automatizálása– Az adatok fejlesztése– Jogkezelés megoldása (beleértve a szabad
dokumentumok megtartását)– Az objektum modell megvalósítása– Felhasználó által létrehozott tartalom
kezelése– Többnyelvű keresés fejlesztése
TELPlus - EDLNet 16 Horváth Ádám - OSZK
EDLNet - > Europeana V.1.0• Feladatok (2/2)
– Márka létrehozása– A márka eladása– Egyetértés az irányításról– További pályázatok– Europeana Open Source feljelesztői
közösség létrehozása– Új kapcsolatok építése– Hosszútávú önfenntartó működés
biztosítása
TELPlus - EDLNet 20 Horváth Ádám - OSZK
Europeana körüli projektek
– Europeana V.1.0– EuropeanaConnect
• Nagyon sok fejlesztés ennek keretében valósul meg
– EuropeanaLocal• Magyar részvétel
– Athena• Magyar részvétel
TELPlus - EDLNet 21 Horváth Ádám - OSZK
Europeana V.1.0• Adatmodell
– http://dev.europeana.eu/functional specification
TELPlus - EDLNet 25 Horváth Ádám - OSZK
Europeana V.1.0• Konkretizálás alapjai lehetnek
– DELOS Reference Model: http://www.delos.info/ReferenceModel
– MPEG 21 DIDL: http://xml.coverpages.org/MPEG21-WG-11-N3971-200103.pdf
– PRISM, Publishing Requirements Industry Standard Metadata, http://www.prismstan dard.org/
– OAI-Data: ORE http://www.openarchives.org/ore/0.1/datamodel
– CIDOC CRM / FRBRoohttp://cidoc.ics.forth.gr/docs/frbr_oo/frbr_docs/FRBR_oo_V0.9.pdf
TELPlus - EDLNet 26 Horváth Ádám - OSZK
Europeana V.1.0• Az Europeana prototípus így
konkretizált:– Europeana Semantic Elements
• http://dev.europeana.eu/specification for metadata elements
TELPlus - EDLNet 27 Horváth Ádám - OSZK
Europeana V.1.0• Europeana Semantic Elements (1/2)
– DC title; alternative– DC creator– DC subject– DC description tableOfContents– DC publisher– DC contributor– DC date created; issued– DC type– DC format extent; medium– DC identifier– DC source– DC language– DC relation; isVersionOf; hasVersion; isReplacedBy;– replaces; isRequiredBy; requires;– isPartOf; hasPart; isReferencedBy;– references; isFormatOf; hasFormat;– conformsTo– DC coverage; spatial; temporal– DC rights– DCterms provenance
TELPlus - EDLNet 28 Horváth Ádám - OSZK
Europeana V.1.0• Europeana Semantic Elements (1/2)
– Europeana isShownBy; isShownAt– Europeana userTag– Europeana unstored– Europeana object– Europeana language– Europeana provider– Europeana type– Europeana uri– Europeana year– Europeana hasObject– Europeana country
TELPlus - EDLNet 29 Horváth Ádám - OSZK
Europeana V.1.0• Fejlesztés módszere
– OpenSource és kód megosztás az EuropenaLabs keretein belül
– Fejlesztési környezet a gyors prototípus készítéshez
– Nagy mennyiségű, jó minőségű adatok– Homokozó a teszteléshez
• Hatékonyság• Skálázhatóság