Upload
impact-centre-of-competence
View
333
Download
0
Embed Size (px)
DESCRIPTION
Presentation given on the KB IMPACT Demo Day on 16 February 2011 in The Hague.
Citation preview
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
Experimentele OCR toolsLotte Wilms – Koninklijke Bibliotheek
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
2
Word spotting - Introductie
Ontwikkel een alternatieve techniek voor het indexeren van historische documenten Gebaseerd op het spotten van woorden direct op de
afbeelding Vermijdt de reguliere OCR
Drie methoden voor word spotting: Selecteer de query uit een eerder gemaakte lijst met
trefwoorden Query vanaf een voorbeeld Vrije tekst query
Alles is geincorpereerd in een bruikbare tool
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
Query met trefwoord
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
Query vanuit voorbeeld
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
Zoeken met tekst
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
Inventory Extraction Prototype Creëert een lijst van karakters in de tekst zonder kennis van diezelfde tekst voor
gebruik in OCR software
Gebruikt om OCR software efficiënter voor een nieuw lettertype te trainen
Open-source software
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.
Typewritten OCR Prototype OCR software voor getypte documenten
– Elk karakter wordt apart bekenen, verbeterd en hierdoor beter herkend