90
Open data Koninklijke Bibliotheek hergebruik op Wikipedia, Commons en Wikisource Olaf Janssen, KB, 8 juni 2013

Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Embed Size (px)

DESCRIPTION

Presentation (in Dtch) about the open data sets of the Koninklijke Bibliotheek (KB), the national library of the Netherlands (http://kb.nl/dataservices). What open data does the KB offer (dd. 8-6-2013), where can you find it and what are you allowed to do with it? What are the opportunities for reusing this data on Wikipedia, Wikimedia Commons en Wikisource? This slidedeck is also available on http://commons.wikimedia.org/wiki/File:Open_Data_KB_en_Wikipedia_8juni2013_OlafJanssen.pdf

Citation preview

Page 1: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Open data Koninklijke Bibliotheek

hergebruik op Wikipedia, Commons en Wikisource

Olaf Janssen, KB, 8 juni 2013

Page 2: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Ik hoop dat jullie meer inzicht krijgen in … • Open data KB

- wat hebben we - waar vind je het - wat mag je ermee

• Kansen voor hergebruik op

- Wikipedia - Wikimedia Commons - Wikisource

Page 3: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Open data KB • Massadigitalisering in volle gang : boeken, kranten, tijdschriften

• Beleid KB : “alles open… tenzij” (auteursrecht, contracten met

digitaliseringspartners Google, Proquest)

• Collectie in PD of met CC-licentie open dataset

• (Bulk) hergebruik door 3den (bv WikiCommons) mogelijk maken

• Tot nu toe 5 sets vrijgegeven

Page 4: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

1. Early Dutch Books Online

• 11.000 full-text boeken (2,2 M pagina’s) uit 1780-1800

• Onderwerpen: geschiedenis, politiek, religie, maatschappij, wetenschap, toneel, economie, handel, kunst, literatuur ….

• Voorkant: earlydutchbooksonline.nl full-text zoeken

• Achterkant: API

Page 5: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EarlyDutchBooksOnline.nl full-text zoeken

Page 6: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF (hele boek)

Page 7: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF (hele boek)

Page 8: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF (hele boek)

Page 9: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF (hele boek)

Page 10: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO zoek- en download-API

http://www.kb.nl/banners-apis-en-meer/dataservices-apis/early-dutch-books-online

Page 11: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO gebruiksvoorwaarden • Losse objecten (JPG, PDF, OCR) : Public Domain Mark

• Substantiële delen of alles kb.nl/dataservices

• Bron- en naamsvermelding vinden we fijn!

Page 12: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Wikipedia

Onderzoeksbron voor artikelen Mosasaurus

Page 13: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Wikipedia

Page 14: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Wikipedia

Page 15: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Wikipedia

Page 16: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Commons

Naast tekst

ook veel

(verstopte)

afbeeldingen!

Page 17: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Commons

Page 18: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Commons Naast tekst ook veel rechtenvrije

afbeeldingen

Page 19: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Commons Naast tekst ook veel rechtenvrije

afbeeldingen

Page 20: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Commons Naast tekst ook veel rechtenvrije

afbeeldingen

Page 21: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Commons Naast tekst ook veel rechtenvrije

afbeeldingen

Page 22: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor Commons Naast tekst ook veel rechtenvrije

afbeeldingen

Page 23: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor WikiSource

OCR (en scans) van rechtenvrije (Nederlandse)

boeken

Page 24: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor WikiSource

Page 25: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor WikiSource

Page 26: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

EDBO content voor WikiSource

Page 27: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

2. Staten-Generaal Digitaal (SGD)

1. Kamerverslagen - woordelijke verslagen van de 1e+2e Kamer, Verenigde Vergaderingen

2. Kamerstukken - schriftelijk uitgewisselde stukken tussen regering en parlement (bv. Troonrede, rijksbegroting)

3. Kamervragen - schriftelijke vragen 1e+2e Kamerleden + bijbehorende antwoorden bewindslieden

• 454.800 documenten, 2.5M pagina’s. • Periode 1814 tot 1995

• Voorkant: statengeneraaldigitaal.nl

full-text zoeken in stukken + thematische achtergronddossiers

• Achterkant: API

Page 28: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

statengeneraaldigitaal.nl full-text zoeken

Page 29: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF

Page 30: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF

Page 31: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF

Page 32: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt) 3. PDF

Page 33: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Bulk hergebruik: SGD zoek- en download-API

http://www.kb.nl/banners-apis-en-meer/dataservices-apis/staten-generaal-digitaal

Page 34: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD gebruiksvoorwaarden • Losse objecten (JPG, PDF, OCR, kaarten) : CCO

• Substantiële delen of alles: CCO (bv. Political Mashup)

• Bron- en naamsvermelding vinden we fijn!

Page 35: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor Wikipedia

Onderzoeksbron voor artikelen Geschiedenis van de prostitutie in Nederland Bijlmerramp Lijst van rechtbanken in Nederland

Tegenpartij

Page 36: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor Wikipedia

Page 37: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor Wikipedia

Page 38: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor Commons 1.112 kaarten en tekeningen

• Visueel materiaal in bv. memories van toelichting

• Thema’s o.a. havens, dijken, ballonvaart, analfabetisme,

wegennet, luchthavens…

• Geo-boxed (lengte & breedte)

• CC0

Page 39: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor Commons

Afsluiting en droogmaking van de Zuiderzee

Page 40: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor Commons

Overzichtskaart van de verplicht door de Koninklijke Paketvaart Maatschappij te bevaren verbindingen in Nederlandsch-Indie

Page 41: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor Commons

Mogelijke grenzen van het continentaal plat

Page 42: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor WikiSource

Page 43: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor WikiSource

Page 44: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

SGD content voor WikiSource

Wetten & rechtsdocumenten, bv.

• Afschaffing slavernij (1863)

• Afschaffing doodstraf (1870)

• Kinderwet Van Houten (1874)

• Zuiderzeewet (1918)

• Deltaplan (1953)

Page 45: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

3. Middeleeuwse Verluchte Handschriften (MVH)

• 11.000 verluchtingen (illustraties en versieringen) uit 400

middeleeuwse handschriften tot ca. 1550

• Onderwerpen: religie, natuur, de Bijbel, de mens, mythologie, hemel & aarde….

• Voorkant: manuscripts.kb.nl verluchtingen zoeken & bladeren op onderwerp

• Achterkant: API

Page 46: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

manuscripts.kb.nl verluchtingen zoeken & bladeren

Page 47: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie Scans (jpg) + uitleg

Page 48: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie Scans (jpg) + uitleg

Page 49: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

http://www.kb.nl/banners-apis-en-meer/dataservices-apis/middeleeuwse-verluchte-handschriften

MVH zoek- en download-API

Page 50: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH gebruiksvoorwaarden • Losse objecten (JPG) : Public Domain Mark

• Substantiële delen of alles: Public Domain Mark

• Bron- en naamsvermelding vinden we fijn!

Page 51: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH content voor Wikipedia

Referenties & illustraties bij artikelen Jacob van Maerlant Beatrijs Evangeliarium van Egmond Gruuthuse manuscript (EN)

Historia del pan (ES)

Page 52: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH content voor Wikipedia

Page 53: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH content voor Wikipedia

Page 54: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH content voor Wikipedia

Page 55: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH content voor Commons

11.141 afbeeldingen

Page 56: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH content voor Commons

Page 57: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH batch upload naar Commons • GLAMwiki toolset project: tools om content van

GLAMs naar Commons te uploaden (in bulk) • Partners: Wikimedia-NL, UK, FR, CH + Europeana

• http://commons.wikimedia.org/wiki/Commons:GLAMToolset_project • http://gwtoolset.wmflabs.org/index.php/GWToolset

Testrun met 3 MVH-afbeeldingen

Page 58: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Input (XML v/d KB)

Page 59: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Output (op Commons)

Page 60: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Output (detail)

Page 61: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

MVH content voor WikiSource

Geen, MVH bevat geen bronteksten

Page 62: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

4. Watermerken (WILC)

• 16.000 watermerken uit boeken gedrukt in de Lage Landen (Nederland & België) in 1450 - 1501

• Voorkant: watermark.kb.nl watermerken zoeken + veel achtergrondinformatie

• Achterkant: API

Page 63: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

watermark.kb.nl watermerken zoeken + achtergrondinformatie

Page 64: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. PDF

Page 65: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. PDF

Page 66: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

http://www.kb.nl/banners-apis-en-meer/dataservices-apis/watermerken

WILC zoek- en download-API

Page 67: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

WILC gebruiksvoorwaarden • Losse objecten (JPG, PDF) : CCO

• Substantiële delen of alles: CCO

• Bron- en naamsvermelding vinden we fijn!

Page 68: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

WILC content voor Wikipedia

Onderzoeksbron voor artikelen Gheraert Leeu (drukker)

Page 69: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Over Gheraert Leeu

Page 70: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Watermerken in Leeu’s boeken

Page 71: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Watermerken in Leeu’s boeken

Page 72: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

WILC content voor Commons

Category: William Caxton (1e Engelse drukker)

Page 73: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

WILC content voor Commons

Category: William Caxton

Page 74: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

WILC content voor WikiSource

Niet, want WILC = afbeeldingen

Page 75: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

5. Radiobulletins ANP

• Typoscripten van radionieuwsbulletins van het ANP (“zes uur, dit is de radionieuwsdienst verzorgd door het ANP”)

• 1,5 miljoen pagina’s uit 1937-1984 (geen 100% dekking)

• Voorkant: anp.kb.nl full-text zoeken & bladeren op datum

• Achterkant: API

Page 76: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

anp.kb.nl full-text zoeken

Page 77: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt)

Page 78: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Resultaat zoekactie 1. Scans (jpg) 2. OCR (txt)

Page 79: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

http://www.kb.nl/banners-apis-en-meer/dataservices-apis/anp-radiobulletins-digitaal

ANP zoek- en download-API

Page 80: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

ANP gebruiksvoorwaarden • Losse objecten (JPG, OCR) : CC-BY-NC

• Commercieel hergebruik : goedkeuring ANP

• Bron- en naamsvermelding verplicht!

Page 81: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

ANP content voor Wikipedia

Onderzoeksbron voor artikelen Resolutie 2079 Algemene Vergadering

Verenigde Naties

Vlag van Nederland

Page 82: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

ANP content voor Wikipedia

“Op 19 februari 1937 tekende Koningin Wilhelmina op haar vakantieverblijf in Zell am See het kortste Koninklijk Besluit ooit, luidend: "De kleuren van de vlag van het Koninkrijk der

Nederlanden zijn rood, wit en blauw."

Page 83: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

ANP content voor Wikipedia

Bron: anp.kb.nl (24-2-1937)

Page 84: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

ANP content voor Commons

Niet, want ANP = CC-BY-NC

Page 85: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

ANP content voor WikiSource

Niet, want ANP = CC-BY-NC

Page 86: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Naast kb.nl,

waar zijn de open sets van de KB nog meer te vinden?

Page 87: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

opencultuurdata.nl

Page 88: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

data.overheid.nl

Page 89: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

opendatanederland.org

Page 90: Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

Publicdata.eu (joining soon)