Sessie de ijsberg zichtbaar maken
histoijsberg
Voorstellen
bull Wie zijn wij en waarom zijn wij hier
bull Wie bent u en waarom bent u hier
Ons doel
bull Kijkje in de keuken waar zijn archiefinstellingen mee bezig wat zit er onder water
bull Nieuwe methoden om bronnen toegankelijk te maken
bull De ijsberg zichtbaar te maken
De uitdaging vindbaar en bruikbaar
Uw doel
bull Wat kun je hiermee als historicus
bull Hoe gaat dit onderzoek veranderen
De ijsberg zichtbaar maken
1 VAN ANALOOG NAAR DIGITAAL
bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)
bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal
Archief) en Nico Vriend (Noord-Hollands Archief)
2 WAT ALS HET DIGITAAL IS
bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)
bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)
bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen
(Koninklijke Bibliotheek)
1 Van analoog naar digitaal
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Voorstellen
bull Wie zijn wij en waarom zijn wij hier
bull Wie bent u en waarom bent u hier
Ons doel
bull Kijkje in de keuken waar zijn archiefinstellingen mee bezig wat zit er onder water
bull Nieuwe methoden om bronnen toegankelijk te maken
bull De ijsberg zichtbaar te maken
De uitdaging vindbaar en bruikbaar
Uw doel
bull Wat kun je hiermee als historicus
bull Hoe gaat dit onderzoek veranderen
De ijsberg zichtbaar maken
1 VAN ANALOOG NAAR DIGITAAL
bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)
bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal
Archief) en Nico Vriend (Noord-Hollands Archief)
2 WAT ALS HET DIGITAAL IS
bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)
bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)
bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen
(Koninklijke Bibliotheek)
1 Van analoog naar digitaal
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Ons doel
bull Kijkje in de keuken waar zijn archiefinstellingen mee bezig wat zit er onder water
bull Nieuwe methoden om bronnen toegankelijk te maken
bull De ijsberg zichtbaar te maken
De uitdaging vindbaar en bruikbaar
Uw doel
bull Wat kun je hiermee als historicus
bull Hoe gaat dit onderzoek veranderen
De ijsberg zichtbaar maken
1 VAN ANALOOG NAAR DIGITAAL
bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)
bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal
Archief) en Nico Vriend (Noord-Hollands Archief)
2 WAT ALS HET DIGITAAL IS
bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)
bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)
bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen
(Koninklijke Bibliotheek)
1 Van analoog naar digitaal
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
De uitdaging vindbaar en bruikbaar
Uw doel
bull Wat kun je hiermee als historicus
bull Hoe gaat dit onderzoek veranderen
De ijsberg zichtbaar maken
1 VAN ANALOOG NAAR DIGITAAL
bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)
bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal
Archief) en Nico Vriend (Noord-Hollands Archief)
2 WAT ALS HET DIGITAAL IS
bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)
bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)
bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen
(Koninklijke Bibliotheek)
1 Van analoog naar digitaal
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Uw doel
bull Wat kun je hiermee als historicus
bull Hoe gaat dit onderzoek veranderen
De ijsberg zichtbaar maken
1 VAN ANALOOG NAAR DIGITAAL
bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)
bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal
Archief) en Nico Vriend (Noord-Hollands Archief)
2 WAT ALS HET DIGITAAL IS
bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)
bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)
bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen
(Koninklijke Bibliotheek)
1 Van analoog naar digitaal
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
De ijsberg zichtbaar maken
1 VAN ANALOOG NAAR DIGITAAL
bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)
bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal
Archief) en Nico Vriend (Noord-Hollands Archief)
2 WAT ALS HET DIGITAAL IS
bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)
bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)
bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen
(Koninklijke Bibliotheek)
1 Van analoog naar digitaal
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
1 Van analoog naar digitaal
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017
Volautomatische archiefontsluiting
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Netwerk Oorlogsbronnen (NOB)
bull Sinds 2010
bull Samenwerkingsverband van instellingen met WO2-collecties
bull Onderwerp Tweede Wereldoorlog
bull Doel vergroten gebruik Collectie WO2 Nederland
bull Perspectief archieven musea instituten etc (+- 400)
bull Programma 2016-2019
bull Digitaal verbinden van collecties
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Onderzoeksteam
bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)
bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)
bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)
bull Edwin Klijn (Netwerk Oorlogsbronnen)
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Doel
bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
bull Met welke settings krijg je de beste OCR
bull Meten meten meten
bull Volautomatisch
bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Ontsluiting op DOCUMENT-niveau
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Stappen
3 Voorbewerking
4 Transcriptie
(OCR of HTR)
Machineleesbaardocument
5 Postcorrectie
Origineel document
2 Scannen
1 Selectie
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Selectie testset
bull 89 scans
bull Centraal Archief Bijzondere Rechtspleging
bull Geen gewogen representatieve selectie
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Word Accuracy Rate (ongewogen)
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Word accuracy rates (gewogen)
bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)
bull 7595 word accuracy rate (volgorde afhankelijk)
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Waar houdt OCR-software niet van
bull Doorslagen
bull Tabellen kolommen complexe lay-out
bull Handgeschreven notities in de tekst
bull 1rsquotjes en Irsquotjes en lrsquotjes
bull Onregelmatige inktdikte van tekst
bull Weinig contrast achtergrond en tekst
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Slecht 5286 word accuracy rate(volgorde onafhankelijk)
bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Slecht een bloemlezing
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Waar houdt OCR-software wel van
bull Eenvoudige lay-out (portret geen tabellen of kolommen)
bull Tekst met een gelijkmatige inktdikte
bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond
bull Rechte tekstregels
bull Ruimte tussen de woorden
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Koploper 9831 word accuracy rate(volgorde onafhankelijk)
zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)
Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A
Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Postcorrectie met bestaande lijsten
bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM
bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter
bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD
bull Datum t943 25 Ootober 1545 2 October l9uuml6
bull Woorden ltolshorloge recnercneur
bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp
bull Ook spellingsfouten in origineel verbeteren
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Algemene conclusie
In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools
Ja het is zinvol
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Kansen automatisch sorteren
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)
bull Partners Nationaal Archief NIOD Huygens ING NOB
bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief
bull Optical Character Recognition en data-verrijking wie wat waar en wanneer
bull 2016-2019
bull Pilot Centraal Archief Bijzondere Rechtspleging
bull KNAW onderzoeksfonds
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
31
De ijsberg zichtbaar
maken
Ceciel Huitema (Nationaal Archief) amp
Nico Vriend (Noord-Hollands Archief)
Historicidagen Utrecht 25 augustus 2017
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
De ijsberghellip
Boven water (online)bull Beschrijvingen van documenten
bull lsquoMachine leesbarersquo indexen databases
bull Scans van documenten
Illustratie Shutterstock copy grop
Onder waterbull Kilometers aan documenten
bull Geschreven getypte en gedrukte indexen
bull Informatie in documenten zelf
Illustratie Shutterstock copy grop
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Seriearchieven in de ijsberg
Soms meer dan 75
bull Bij lsquoverbaalstelselrsquo ministeries
1813-1940
bull Overgrote deel Nederlandse
overheidsarchieven
Berekening Charles Jeurgens
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Een voorbeeld
bull 140 meter aan documenten
bull Tien jaarhellip
Archief Ministerie van Kolonien 1910-1919
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Toegankelijk
bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo
bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip
Online ziet het er zo uit
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Maar er zijn weacutel beschrijvingen beschikbaarhellip
bull Destijds aangemaakt (1910-1919)
bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Analoge situatie
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
De index als sleutel
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Voorbeeld index
Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)
Online doorzoekbaar te maken
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Hoe komen we van dithellip
Illustratie Shutterstock copy grop
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
hellipnaar dit
Illustratie Shutterstock copy grop
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
voor handgeschreven bronnen Naar een
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Handwritten Text Recognition (HTR)
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Full-text zoeken wordt mogelijk Maar is er niet zomaar
bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)
bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Voor- en nadelen index
bull Voordelen
bull Uniform qua lay-out
bull Weinig verschillende handschriften
bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd
bull Nadelen
bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
De ijsberg zichtbaar maken
Wat we willen1) Pilots op verschillende archieven
bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)
bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)
2) HTR testen
3) Crowdsourcingprojecten op resultaten HTR
bull Marktpartijen zoeken
4) Samenwerken met gebruikers
bull Historici
Interessebull cecielhuitemanationaalarchiefnl
bull nicovriendnoord-hollandsarchiefnl
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
2 Wat als het digitaal is
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Ontsluiten wat er iacuten zit
Marieke van Erp merpeltje
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Tekst in collecties
bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden
bull In vrije tekstvelden kan via trefwoorden gezocht worden
bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn
bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties
Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Domeinen
Geschiedenis
Semantisch
Web
Taal-
technologie
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Taaltechnologie
bull Onderzoek en ontwikkeling van manieren om informatie uit
teksten te extraheren
bull information retrieval automatisch vertalen deep reading
bull meerderheid van datasets in het domein zijn contemporaine
kranten
bull Digital Humanities taaltechnologen onderzoeken hoe deze
technologie zich gedraagt in een ander domein
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Semantisch Web
bull Onderzoekt en ontwikkelt mogelijkheden om een machine
leesbaar Web te creeumleren
bull kennismodelering formaten kennisrepresentatie data delen
bull Linked Open Data wolk is de portal tot een rijkdom aan
gestructureerde databronnen
bull Semantisch Web technologie heeft moeite gebruikers buiten
het domein te bereiken
Image source httplod-cloudnetversions2017-02-20lodpng
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Geschiedenis
bull Geiumlnteresseerd in
bull mensen
bull gebeurtenissen
bull Veel historici zijn geiumlnteresseerd in
bull analyse van grotere datasets
bull kwantitatieve methoden
image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Taal-
technologie
Components
Geschiedenis
Semantisch Web
kennismodellering
amp representatie
kennis
kennis
informatie
extractie
event extractie
named entity
recognition and linking
vocabulaires
vocabulaires
entiteit
netwerken
standaardisatie
personen amp gebeurtenissen
kwalitatief en kwantitatief
onderzoek
gestructureerde data
gestructureerde data
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
2009 - 2013
bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties
bull Digital Hermeneutics
bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)
bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)
bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011
bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Taal-
technologie
Components
Geschiedenis
Semantisch Web
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpmariekevanerpcom
Wat kan taaltechnologie voor jouw
collectieonderzoekhobbyproject betekenen
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017
Personenportal WO2
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Van lsquoweb of documentsrsquohellip
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Naar lsquoweb of datarsquo
httpwwwkampwesterborknl
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Naar lsquoweb of datarsquo
httpwwwkampamersfoortnl
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Naar lsquoweb of datarsquo
Geonames
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Naar lsquoweb of datarsquo
WO2-thesaurus
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Semantic web
ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
WO2 thesaurus
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
WO2 thesaurus
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Partners personenportal WO2
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Per bron overzicht matches
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Overzicht personen
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Detailpagina
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Te weinig om te matchen
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Personenportal Pilot ndash Hoe we matchen
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2
Olaf Janssen Koninklijke Bibliotheek
Historicidagen 2017 Utrecht 25 augustus
olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Tijdens WO2 zijn veel verzetsbladen
uitgegeven
In allerlei soorten en matenhellip
htt
p
ww
w4
en5
mei
amst
erd
amn
lat
tach
men
t4
74
54
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948
httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508
Van de grote bekende titels
(oa Parool Vrij Nederland Trouw de Waarheid)
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip
httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223
en in bibliotheekcatalogi beschreven(1300 titels)
Bibliografische metadata
Illegale studentenkrant uit Den HaagLeiden
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
wwwdelphernlkranten
hellipen staan nu in Delpher(1300 titels)
Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Dus ook De Geus onder studenten
httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip
De antwoorden vindt je niet op Delpher
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Gebrek in Delpher
Geen contextuele informatie over illegale kranten
httpsthejungleisneutralfileswordpresscom201311lostjpg
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken
Wikipedia zeer vermoedelijk (via Google)
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg
Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen
1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog
1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel
2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet
ltltlt 1300 titels
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben beide problemen aangepakt
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
tinyurlcomverzetskranten
Groot publieksbereik
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpsthejungleisneutralfileswordpresscom201311lostjpg
We hadden dringend behoefte aan contextuele info over de kranten
Hoe kwamen we daaraan
De Ondergrondse Pers 1940-1945
Lydia E Winkel H de Vries 1989
Bevat beschrijvingen van vrijwel alle
1300 ondergrondse krantenuit WO2
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Lemma 199 ndash De Geus (onder studenten)
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Metadata
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Uniek ID
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Plaats van uitgave
Krantentitel Plaats van uitgave
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Contextueleinformatie
Ruw materiaal voor Wikipedia-artikel
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Bij deze krant betrokken personen
Krantentitel Personen
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
IDs van gerelateerde kranten
Deze krantentitel Andere titels
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben dit boek gescand en als PDF met vrije licentie online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrije licentie (CC-BY-SA)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet
httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Database-expert
Gerard Kuys
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Converteer PDF naar database
Koppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
VIAF
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Beschikbaar online (PDF platte file)
Vrij voor hergebruik (CC-BY-SA licentie)
---------------------------------------------------
Converteer PDF naar databaseKoppel titels plaatsen personen andere titels
Koppel titels bieb-cat (metadata) en Delpher (full-text)
Koppel titels personen amp plaatsens externe bronnen
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Zomer 2016 - Unieke database
Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is
htt
ps
w
ww
pin
tere
stc
om
fre
eth
ewro
nge
dw
orl
d-w
ar-i
i
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Wikiproject Verzetskranten
ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
We hebben dus een database met informatie over 1300 verzetskranten
Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren
htt
ps
c1
sta
ticf
lickr
co
m9
82
81
76
99
23
19
18
_11
a73
56
c38
_bjp
g
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Database + sjabloon = WP-artikelbeginnetje
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Niet-grijs = Wikipedia artikelbeginnetje
Automatisch uit database gegenereerd mbv sjabloon
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken
Crowdsourcing door Nederlandse Wikipedia-gemeenschap
httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip
hellipen maken langzaam maar zeker steeds meer volwaardige artikelen
Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Voacuteoacuter het project
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Stapje voor stapjehellip
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
hellip Nederlanders weer wat wijzer amp blijer
htt
p
ww
wf
orm
erd
ays
com
20
11
05
du
tch
-lib
erat
ion
htm
l
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Vielen Dankolafjanssenkbnl - ookgezellig
tinyurlcomverzetskranten
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Stellingen
1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Stellingen
2 Historici moeten leren programmeren
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Stellingen
3 Als een bron niet digitaal is bestaat ie niet
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied
Stellingen
4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied