25
Udviklingen af databrønden som national infrastruktur Piet Seiden DBC A/S

Udviklingen af databrønden som national infrastruktur

Embed Size (px)

DESCRIPTION

Oplæg ved Piet Seiden, DBC på BibTechKonf lørdag den 26. oktober 2013 på DTU bibliotek. Konference om biblioteksteknologi m.h.p. at give udviklere af biblioteksteknologier et forum til at dele erfaringer, udfordringer, projekter og værktøjer.

Citation preview

Page 1: Udviklingen af databrønden som national infrastruktur

Udviklingen af databrønden som national infrastruktur

Piet SeidenDBC A/S

Page 2: Udviklingen af databrønden som national infrastruktur

DBC – mest kendt for den nationale fælleskatalog – Danbib

Danbib

Page 3: Udviklingen af databrønden som national infrastruktur

Disposition

• Tidslinien• Implementation af en databrønd• Service-orienteret arkitektur (SOA)• Open Source – valg og konsekvenser• Testadgang

Page 4: Udviklingen af databrønden som national infrastruktur
Page 5: Udviklingen af databrønden som national infrastruktur
Page 6: Udviklingen af databrønden som national infrastruktur
Page 7: Udviklingen af databrønden som national infrastruktur
Page 8: Udviklingen af databrønden som national infrastruktur
Page 9: Udviklingen af databrønden som national infrastruktur
Page 10: Udviklingen af databrønden som national infrastruktur
Page 11: Udviklingen af databrønden som national infrastruktur
Page 12: Udviklingen af databrønden som national infrastruktur

DBC's implementering af SOA

Databrønd Søgemaskine

Services for søgning, bestilling, ekstra data

Webside App Storskærm

DBC

Primærtandre  leverandører

Page 13: Udviklingen af databrønden som national infrastruktur

Søgeadgang – webservice

Søgeindekser

Data- og relationslager

Databrønden konceptuelt

Page 14: Udviklingen af databrønden som national infrastruktur

Søgeadgang – webservice

Søgeindekser

Data- og relationslager

Databrønden konceptuelt

Page 15: Udviklingen af databrønden som national infrastruktur

Databrønden – repository + integrated search

Søgemaskine

Datastore

PostgreSQLadmin  metadata

Luceneindholdsregister

Page 16: Udviklingen af databrønden som national infrastruktur

Open Source som strategisk valg

• Gode erfaringer (driftsarkitektur baseret på Linux)• Følge digitaliseringsstyrelsens anbefalinger

- Åbne standarder og modularitet- Open Source er ønskelig ved software udviklet til den

offentlige sektor- Serviceorienteret arkitektur (SOA)

• Not for profit – DBC ejes af det offentlige Danmark

Page 17: Udviklingen af databrønden som national infrastruktur

Open Source –udfordringerne

• Ingen leverandørsupport• Kompetencer skal opbygges

in-house• Eksempler på udfordringer vi har mødt

- Scalability- Community- Compatibility

Page 18: Udviklingen af databrønden som national infrastruktur

Scalability

• Valgt som data- og relationslager pga.- erfaringer fra tilsvarende projekter (Summa fx)- versionering, relationsmodel, web-teknologi

• Komplikationer undervejs- Langsom i/o- Indbygget søgefunktion ubrugelig til vores formål

Page 19: Udviklingen af databrønden som national infrastruktur

Relationer mellem indhold persisteres

Soundclip

SubjectDescrip?on

Analysis

Review

Creatordescrip?on

Katalogpost

Work

Manifesta?on

Track/album

OpenUrl

Onlineaccess

Creatorhomepage

HasImage

Page 20: Udviklingen af databrønden som national infrastruktur

Emnebeskrivelser

Analyser

Anmeldelser

ForfaPerbeskrivelser

katalogpost

Videresøgning

værk

Forlagets  beskrivelse

Online  adgang

Page 21: Udviklingen af databrønden som national infrastruktur

Scalability

• Løsning- Større ændringer introduceret i Fedora

- RDBMS delvist udskiftet med Lucene-index

- Andre ændringer i kodebasen derudover

• Konsekvens- DBC må vedligeholde sin egen branch af Fedora

Page 22: Udviklingen af databrønden som national infrastruktur

Community

• Udgangspunktet: Søgemaskine baseret på Lucene- Compass = Shay Banon‚ stoppet i 2010- Solr – fremstod svagt i 2008; idag merged med Lucene

• DBC skiftede til Solr i 2010 – helt afgørende valg- Velfungerende community; konferencer, kurser, docs- Kommercielle drivkræfter styrker projektet

• Community kan være vægtigere end teknologi

vs

Page 23: Udviklingen af databrønden som national infrastruktur

Compatibility

• Det eksterne API – webservices• SOAP

- WSDL- XSD

• Automatisk kodegenering fejler- Standarderne er overholdt, men værktøjerne opgiver...

• Fremover: Ændringer i DBC's services for at gøre det nemmere for 3. part at kode op imod

Page 24: Udviklingen af databrønden som national infrastruktur

Status efter 5 år med databrønden

• Datamodellen er tilpasset nye behov- Version 3 lanceres ultimo 2013

• Et etableret community (TING)• Der kommer løbende nye

indholdskilder til

Page 25: Udviklingen af databrønden som national infrastruktur

Databrønden – prøv den selv

• Dokumentation og testadgang- http://opensource.dbc.dk