12
Ecient graph-based dictionary search and its application to text-image searching Simon Lucas Department of Computer Science, University of Essex, Colchester CO4 3SQ, UK Abstract This paper describes a novel method for applying dictionary knowledge to optimally interpret the con®dence-rated hypothesis sets produced by lower-level pattern classi®ers. This problem arises whenever image or video databases need to be scanned for textual content, and where some of the text strings are expected to be strings from a dictionary. The method is especially appropriate for large dictionaries, as might occur in vehicle registration number recognition for example. The problem is cast as enumerating the paths in a graph in best-®rst order given the constraint that each complete path is a word in some speci®ed dictionary. The solution described here is of particular interest due to its generality, ¯exibility and because the time to retrieve each path is independent of the size of the dictionary. Synthetic results are presented for searching dictionaries of up to 1 million UK postcodes given graphs that correspond to in- sertion, deletion and substitution errors. We also present the initial results from processing real noisy text images. Ó 2001 Elsevier Science B.V. All rights reserved. Keywords: Dictionary search; Text image indexing; Graph search 1. Introduction Contextual knowledge is of critical importance in most pattern recognition applications. Examples of the type of knowledge that can be applied to improve recognition accuracy include dictionary, grammatical, arithmetic, logical or database type knowledge. See Schurmann et al., 1992) for a discussion on the im- portance of context in document image analysis. Note that where applicable, dictionary type knowledge is an extremely tight form of constraint. The work described here was originally funded by The Post Oce UK) in order to develop more robust and ecient mail address and form reading software, but also has applications in many related areas, such as optimal retrieval of vehicle registration numbers from video image databases for example. The system described here is a graph-based version of a dictionary search system originally reported in Lucas, 1996) and subsequently extended to cope with other kinds of contextual information Downton et al., 1997). The original system showed that best-®rst retrieval could be done in a way that did not get www.elsevier.nl/locate/patrec Pattern Recognition Letters 22 2001) 551±562 E-mail address: [email protected] S. Lucas). 0167-8655/01/$ - see front matter Ó 2001 Elsevier Science B.V. All rights reserved. PII: S 0 1 6 7 - 8 6 5 5 0 0 ) 0 0 1 1 7 - 3

Efficient graph-based dictionary search and its application to text-image searching

Embed Size (px)

Citation preview

Page 1: Efficient graph-based dictionary search and its application to text-image searching

������� ��� ���� �������� ���� �� ��� ��������� ������ ���� �������

����� ����

���������� ������� ������� ���������� ������ ��������� ��� � �� ��

��������

���� ��� �������� ����� ������ �� ������� �������� ��������� �� �������� ������� ��� ��������� ���

���������� ���� ������� �� ���� ����� ����� ��������� ���� ������ ���� ������� ���� � ����� ������ ����

�� �� ������ �� ������ ������� �� ���� ���� �� ��� ���� ������ � �������� �� �� ������ ��� ��������� ���

������ �� ��������� ������� �� ��� ���������� � ����� ���� �� ������� ��������� ����� ���������� ��

������� ��� ������ �� ��� � ��������� ��� ���� �� ��� �� ���� ��� ��� ����� ��� �������� ��� ���

�������� ��� �� ��� �� ���� �������� ��������� ��� �������� �������� ��� �� �� ������ ������� ��� �� ���

�������� !��������� �� ������ ��� ���� �� ������ ��� ��� �� ����������� �� ��� ��"� �� ��� ��������� ���������

������ � �������� �� ������� ���������� �� �� �� # ������� $% ��������� ����� ���� ��� �������� �� ��

������ �������� �� ������������ ���� &� ��� ������ ��� ������ ������ ��� ��������� �� ����� ���� ������

� '((# ������� ������� )�*� +�� ����� �������

������� ,������� ����- ���� ���� ��������- .�� ����

� ���� ������

/�������� ��������� �� �� ������ �������� �� ���� ����� ���������� ����������� ������� �� ������� �� ��������� ��� �� �� ������ �� ������ ���������� ����� ������� �������� ������� �������� ������ � ����� ���� ���������� ��� 0������� �� �� #11'2 �� ���������� �� ��� �� ������ �� ������� �� �������� ���� ������� 3��� ��� ���� �������� �������� ���� ��������� ��� �������� ����� ��� �� ��������� ��� ��� �������� ��� �� �������� ������ �� ��� 4��� 5���0$%2 �� ��� �� ������� ��� ����� �� ������� ��� ����� �� ��� ����� ������ ��� ��� ������������ �� ��� ����� �� ���� � ������ ������ �� ������� ��������� ������ ��� ��������� ������ �� �������

��� ������ �������� ��� �� ��� ���� ������ �� �������� ���� ������ �������� ������ ��0���� #1162 �� �����7������ �������� �� ���� ���� ���� ����� �� ��������� ��������� 0,�������� �� #1182� ��� ������ ������ ������ ��� ���� ��� ������ ����� �� ���� �� �� ��� ��� ��� ���

��������������9�����9����

4���� :���������� ������ '' 0'((#2 ;;#<;6'

�!���� ������� ���=���������� 0�� ����2�

(#68 >6;;9(#9? ��� ���� ���� � '((# ������� ������� )�*� +�� ����� �������

4@@A � ( # 6 8 > 6 ; ; 0 ( ( 2 ( ( # # 8 B

Page 2: Efficient graph-based dictionary search and its application to text-image searching

����� � ��� ��"� �� ��� �������� ���� ���� ������ �� �������� ���� ����������� ������� �������� ��� ����� ������ ���� ������ �� ��� ��"� �� !� �������� 0C����� �� .�� #1162 � ���������� �� ��� ��"� �� ��� �������� �������� 0/��� �� �� #1112�

��� ������ ������ 0���� #1162 ������ ������ ��� ��� ����� ����� �� ������� ��������� ��������� ���� ���� ���� ������������ ���� ��� ����� �� ���� ������ �� ��7����� �� ����� �� �������� �����

��� ����� �� ��� ��� ������ �� ������� ��� ���� ��� � �� ��� ��� ��������� �� ��� ��� ������ �� ������ ����� ���� ����� ������ �� ������ ����� �� ��� ����� ����� ���� ����� ��������� �� ���� ������ ���� ������������ �������� �� �������� ��� �� �� ����� �� �������������������� �� ��� ����� � ����� ������ ��� �� ������ ����� � ��� �� �������� ������ �������@�������� ��� ������ ���� �� ����� �� ��� ����������� �� �������� ��"�� ���� ��� ���� ������������ ������ �� ��� �������� �� 0���� '(((2� ���� ��� ����� ��� ������������ ���������� �� ��������� ��������� �� ��� ������� �������� ��� ������ �� ������� ��� �� ������� ��� ������������ ��������� ���� ���� ���� ������ �������

��� ���� �� ���� � ���� �� ���� ����� ���� �� ��� ��D���� ��������� ������� 4���� ������� ����� ��������� �� ������� �������� ����� ����� ����� � ��� ������ �� ������ ��������� �� �� ��� ����� ������ ���� 7����� ���� ���� ��������� ������ �� �� ������� ���� �������� �������������� ������ ������� �� ���� ��� �� �� ���� ���� ��� 5/: �� ��������� ���� ����� ���� ��� ���� ����� 7����� �� ������ ���� � ���� �� ��� ���� ����� ��� ������� ������ ��������� ����� ��� �� ������

��� ����������� ����� �� ��������� �������� ����� ���� ������� ������ �� �� ��� 5/: ������� �� ������ �� �� ���� ���� ���� 0���� ����� ���� +�/@@ � ��� ������� ���� ������������ ���������2� 5��� ��� �������� �� �� ���� ��� ���� ���� ��� �� ���� �������� ���� ������� �������� �� �� ���� �� ���� �� ������ 0� ���� ���������� ����2 ������ ��� ���� �� �������� ���� ������ ���� ���� ���� ��� 5/: ������ �� ����� �� �� ��� ����� ���� �������� �� ��� ������� ���� 7����� �������� ����� �� �� �� ������� ���� �������� �D ��� ����� 5/: �������E����� ����� ��� 7����� �������� ����� � ���� ����� ��� F��� ����� �� ������ ������ �� ������� ���� ������ ����� ��� ���� �� ��� ������� �� ����� ����������� ������� �� �� ��������� ��������� ��� 5/: ������ �� ������� ���� �� ���� ����������� ���� ���� �� ���� ����� ��� ��� ��� ��

��� ������������ �������� ������ ���� ����������� ��������� ,������� ���� 0�� ����2 �� ���� ��� ���������&� ������ � �������� ������ ������ ��� 5/: ������ �� ���� �� ������ ��� �� ������������� ���������� ����� �� ������ �� �� ����� �� �������� �������� � ����������� �������� � ����� ��� ��� ���� ��� �� �� ���� �� �� ������ ���� ���� �������� ��� ������ �������� ��� �� ���� �� ����� �� ���� ��� �� ��� �� ���� �� � �������� �� ��������� G��� #����� ��� ��� ���� �������� ���� ��� ���� �������� ���� ���� ���� ������� + ������ �������� ��� ���� �� ���� �� ����� ��� �� ���� �� ����� �� G��� '� #

3��� ��� ���� ��� ���� �������� ��� ��� ���� �������� ���� ��������� �������� �� ���� ��G��� # ������ ��� �"� ��� ������ �������� ��� �� �� ���� �� �� ��������� ��� ������� �� ����������� ���� ������� ���� ���� ����� �� ��������� ����������

# ������ �� ���� ��� ��� ��� $% 4��� 5��� �� �������� ������������ ��� ����� ���� ����� �� �������� �� ��������� ��

��� $% 4��� 5����

;;' " #���� $ %������ &��'����� #������ (( )(**+, --+.-/(

Page 3: Efficient graph-based dictionary search and its application to text-image searching

� ���������� ������

��� ������ ���� ��� ����� ��� ��� ������� �� ����� � ����� �� G���� B �� #(� G��� B ����� ��� ��� ����� �� ��� ��D���� ������������ ��� �� �� ����� �� �� ������� ������� �� �� ��������� ������ ������� ��D���� ��� ����������� ����������� G��� #( �� ���������� ��� ������ � �������� �� ������� H�# �� ����� �� ��� �������� ����������� ����������� ���� �� ����������� �� ��� ��� �� ������� ��� ��� ��� ������ �� ������

��� ������ ���� ����� ���� �� ���� ���� �� �� ���������� ���� ���� �� ����� ���� ���� ��� ����� ��� �� ���� ��� ������ �� ����� ��� �� �� ����� ��� �7������� �� �� ������ ��� � ���� ����

G��� '� +� ������ ��� ����� �����

G��� #� .�� ���� �������� ���� �� ��� ��� ������ �������� ���� ���� �������� �������

" #���� $ %������ &��'����� #������ (( )(**+, --+.-/( ;;B

Page 4: Efficient graph-based dictionary search and its application to text-image searching

������ ��� ��� ��� � ���� ' �� ���� �������� ��������� 3��� ��� �� �� ��� �������� �� ��������� ������ ���� ��� ����� �� ����� ��� ���� �� �������� � ���� �� ��� �� �� ���� �������� �������� ���������� G� ������ �������� � "������ ������ ���� ��� ����� ����� �� ��� ����� ������� ��������� ����� ������ ���� ��� � �������

��� �� � ������ ���� ���� 0��� ��� ����� �� ������� ���2 ���� ��� ����� �� ��� ����������� ��� ��� ��� ����� ��� ���� ��D���� ������ ��� � ���� �� ��� ���A ����� ������������ ��������� � ��������� ����� ���� �� � ������� ��� �� ��� ��� ��� ������ �� ������ ������� �� �����

("+" �������' ��� '����

��� ��F��� �� ��� ���� �� �� ������ ���� ��� ��������� �� ���� ������ ��� ��� ���� ��� ����������� ��� ��������� �� �������� ����� 3��� ��� ����� 0�������� #1>12 ���� ��� ��� ������� ��� ��� �� ��������� �� ���� ������ ������ ��� �7������� �� �������� ���� ���� ���� ��������� �� �������� ���� ������� ���� ��� �� ��������� ��������� ���� ��� ���������� ��7������� � ������ ���� �� ������ �� ������� ������� @� ��� ������ �� ��� ���� � ���������������������� ���� �� ��� ��� ��������� ��� ��� �������� ��� ����� �� ������ ��7����� �� ������� �� ����������� ������� ��� ��������� �� ��� �� 3��� ��� ��� ��� ��������� ��� ����������� ��� ����� ������ �� ����� �� ������� ��� �� �������� � ����� ��7������ ��� ������ ������� �� ������� �� ������� ������ �� �� ������ �� ��� ���� �������� @� ECC ���������� ���� ��������� �� *����� ��� ��� ����9����� ����������

@� �� ���� ��� ���� ���� ������ ��� ���� ��� ������� �� ��� ����� �� ��� ��� B �� �� ��������� ,�F���I� ������� 0,�F��� #1;12 ����� �� ���� ��� ���� ���������� �� 5��'� ����� � ����� ����� ���� ���� �� ������ ������� ��� �� �� ����� �� �� ��� ����� �� �� ���� ����� ������� 3������ ���� ������� �� ���� �� ������ �������� ������� 0)����� #1;82�

���� � ��� �7�������� ��� ��������� ������ G����� �� � ���� ��������� �� ���� ����� ����� ���� ���������� ��� ���� ����� �� ��� ��������� �������� �� � ��������� ��� ���� �� ��� ������� ��� ��� �� ��� � ���� �����

� ���� ��������

������� �������� ����� ������� ��� � ����� �� �7������� �� ������ �� ���� ������ ������ ���� ��� ��� ���������� � ����� �� ����� ��� ��� ���� ��� �� ��� ��������� +� �������� �� ������� ���� �� ���� �� ����� ������� �� �� ��� ��� ���� 0/�� #1812� @� ��� ���

' ��� ������ �� �7���� ���� ������ �� ��������� �� ���� ��� � ��� ������ �� �������� �����B 5 ���������� �� �7�� ���� ��� ���� ��� ���� ��� ��� ����� ���� �� �� ���� ������

G��� B� +� ������ ����� ��� ��� ����� ��D���� ��� ������������ 0��� JKI �������� ����2�

;;H " #���� $ %������ &��'����� #������ (( )(**+, --+.-/(

Page 5: Efficient graph-based dictionary search and its application to text-image searching

���� ��������� ��� ������ ������ �� ���������� ��� ����� ��� �� � ������� �� ��� ���� ���F��� �� ������ ������ �� ��� "�� �� ���� ���������

E���� ���� ���� ����� ���� ������� �� ���� �� ���� �� ��� ��������� �� ��� ������ � ��� ���� ����� ������� � ����������� �� ��� ������ �� �����

3��� ��� �� ��� �������� ������ ��� ��� �� ���� ����� ������� ���� ��� ������� ��� �� ������������� ������� ��������� ��� ������ �� ������ ���� ������ ������� ��� ����� ������� ���� � �������� ��� �� ������� �� ��� 5/: ������ 0��� �������� ��2 � ���� �� ����������� ������ ���� �#� +�� ���� �� ���� ���� ������� �� ������ �� 3��� ������ ��� ���� � ����������� �������� �� ������A ��� �� ���� ���� ������ �� ����� ���� 0����� �� ����� ������ �� ���2 �� ������ �� ��� ���� 0����� �� �������� �� �� ���2� ,������� ��� 0��������� �� ��� �������� ��� ���� ������� �� ���� ��������� ��� �� ������ ��� ������2 � �������� � �� ��� ���� ��������� ����� ��� "�� ������ �� ���� ���� ��� �������� ������ �� # �� ����� ����� @������� ���0����� ����� �� ����� �� ���� ��������� �������� � ��� ����� � �� ��� ����������� �� ��������2 � �������� �� �� ������� ���� ��� ����� ����� ������� �� J�I �� G��� B� ����� ��� ��� "�������� �� ���� ���� ��� ������ �� "�� �� ����� ����� +���������� ����� ��� �� �� �������� ���� ��� ������� ����� ��� � ��� �F���� �� ���� ���� � ����� �� G��� #(�

.���� �# �� �� ���� 0�� �����2 ��� ���� �� ��� ������ � �� ��������� ��#��� ���� �� ������ �������� �� �� ������� ��� ������� ��� ����� ������ ��� � ��������� ���� ��������� �������� �����������A ��� �"� �������� �� ���� ������ ���� ��� � ��������� �� ���� �� ��� ��������� ��� �"��������� ������� �� ���� �� ��� ������ < �� ��� ��� ���� �� ����� �"� F��� �� �"� ������0��� G���� H �� ;2� &��� ������ �� ����� ���� ����� ������ ��� �� ������ �� �"� ����������������� ���� �� ���� �� ����� ������ ���������� ��� ��� ��� ����� � ������� �� ������ �"� F���������� 5��� ���� ������ �� ��� �� �� ���� ���� ��� ���� � ��� �"� F��� �� �� ��� �������� ���

G��� H� ,�������� �� ��� �"�L��� �������

G��� ;� ,�������� �� ��� �"�4����� �������

" #���� $ %������ &��'����� #������ (( )(**+, --+.-/( ;;;

Page 6: Efficient graph-based dictionary search and its application to text-image searching

���� ��� �� ������� �������� ��� ����� ����� E���� ���� ���� ��� ��� ���� ���� ������� �������������� �� ���� ����� ���� � ���� ��������� �� ��� �������� �� ������� ���� ��� ����

+� � ������ ������� ��� �� �� ��� ������ ��� ���� ���� ������� ����� ( �� ' �� ��� ��� ��G��� B� ������� �� � ����� ��� �� ������� �� �������� ��������� ���� ���� �� �� ������� �� ������ ����������� �� ��� �F����� ���� �# ���� �� � ���#�# ��� �� ��� ��� ��� �� ����� ��� �������� �� ����� ��� ��� ��������� �� ���� E���� �� �� ������ ��� ������� ���������� ����� ��� 0 ���� ���� �� ������ � � ���� ���� ���� ������� ( �� ' �� ������ ' �� ���� �� �������� �� ��� ��A

�'(' � �#

(#�##'�

5� ��� ���� ��� ���� �� ������ B ������� ����� ��� ����� �� �� ����� �� ��� F��� �� ��� ����������

�B(' � �'

('�#'' � �'

(#�##'

��� ���� ��� �'(# �� �� ����� �� ��� ���

�'(# � �#

(#�### � �#

((�#(#�

��� ������ ���� ���� ������������� �� ���� �� �� ����� �� ������ �� �"� F��� �� �"� ������ ������G��� 6 ����� ��� �� �� ��� �"� �������� ������ ������ �� ������� �B

(' 0����� �� ������� +(' B �� ������� ��� �� ���������� �� ��� ����� ����� ����2�

��� �"� ������ ���� ���� �� ��� ������ �� ������ ��� ������ �� ��� ��� ����� ���� � ��������+� �� �������� ����� ��� �� ���������� ��� ��������� ����� �� ������� ��� ��� ���� �� ���� ����� ��� ���� ��� ��� �������� �� ������ ���� �� �� ���� ��� ���� ��� ����� �� ����� ���� ���� ��� � �����

G��� 6� 4� �� ��� �"� �������� ������ �� ��� ��� �� G��� B�

;;6 " #���� $ %������ &��'����� #������ (( )(**+, --+.-/(

Page 7: Efficient graph-based dictionary search and its application to text-image searching

��� �� ��� ����� ���� �� ������ ��� �"� ������ ���� �� �������� �� G��� ;� ��� �� ��� �7��� ��� ����� �� ������� ������� ��� ��� ���� ���� �������� �� ������ ����� ��� ����� ��� �7����������� �� ������� ������� ��� ��� ���� �������� ��� � ����� ���� �� ��� �"� ������I� ������7���� 0��� �����2� ��� ������� ������� ���� ��� ������� �� ��� ��� ���� ������� �� �� ������ �� ������ ��� �� ��� ����� ��� �7��� < �� ���� ��� �� ��� ����� ����� @� ���� ���� ��� ���� ���� ����������� ��� �� ���� ���� �� ��� ���� + ��� �������� ���������� �� ���� ���� �� �� ����� �� 0���� #1162�

��� �"� F��� ����� �� ��� �� ����� �� ������ < ��� �� ����� �� � ����� �"� ���� +� ������"� ��� �� � ��F��� ��� ���������� ���� �������A ����� ����� ��� ������ ���� �� ��� ��� ������� �� ������- �� ����� ����� ��� �� ��� ��� �� �����- �� ����� ��� ���� ������� �� ��� ����

��� �"� F��� ���� �� ������� �� ��� �������� ����� �� ������ 7����� 5� ������������ �� ���� ����� ��� ���� �� ��� ������� �� ���� ���� ���� ���� ���� �� �� ���� �� � ���� ���� �� ���� ���� 1�������� ���

&��� ��0 2 �� ����� �� �"�L��� �� ���� ��� ������ 7���� �� ��� ��� ����� �"� ��� ���� ��� ������������ @� ���� ���� �� �� ���� ��� �� ���� ��� ���� ���� �������� @� ���� ��� �� ��� ����� ���� �� ��������� �������� �� �� � ������� ���� ��� ������ 7���� � ������� ��� ����� ������������ ������� ��"� �� ��� 7����� ���� ������ �� �������� �� G��� H ���� ��� ������ ������� ����� �"� ����� 3������ ��� ������ �� �"� F��� �� �� � ��� ����� �� ��� ���� �"� F���� �� �"� �������� ������� ���������� ��� �� �� ����� �� � � �� ����� ��� �� ��� �� ��������� ����� � ��� J5����� �����I����� �� G��� 6� ��� ��"� �� ��� ������ �� �� �� ���� � ������� �� ��� ����� ����� ������������ �� ��� ������ ���� ����� � �� ����� &� ��� ���� ������ �� �� ��"� '(( ��� ������� ��������� �� �������� ��� � ��"� � �� ���� ������� � ���!�� ����� ����� @����������� �� ��� ������ �� ���� B ���� ��"� ���������� ���� � ��� � B'(( < ���� ����� �� �7������� �� ���������� ���� ��� �� ����� ��� �����

�� ����� �������� ������� ���� � ��� �������� �� �������� �� ����� ��� ���� �� ����� ���������� �� ��� ���������� ������ E�� �� ��� ������ ��� �� ��������� ��� ���� ����� � ��������� ��� �� �� �������� ���� �� ��� �������� ���� �� ���� ������� ���� 5������ ���� 1 �� �������� �� ��������� �� ���� �� ��� ��� ��� ���� ��� 1 �� ������� �� ��� ��"� �� ��� ������� ����������� �� ��� ������ ��� ����� � � �� ��������� �� ��� ���� �� ��� ��������� �� �� ������ �� �� ����� ��� ���� ��� 7������ 0��� ���� #2� G� ������ ������ �� �������� ��� ��� ����� �� '(( ((( $% ��������� ���� ���� #(( ��� H ��� ��� �� ���� ������� ������� ��� ��� ��������� ���� B ������ ����� �� ���� ���� � ��� �������� ��"� ��������

� ������ �������

+� � ������ ���� ��� ��� �� �� ����� �� G��� B ��� ��� ���� ��� ������ �� ������ ��� ;( ���� ���� ����� �������� �� ��� 0�����������2 ��� #(( ((( $% ����������

���� #

������ ���9��� ���� �� ���� �� �� ��������� ���

1 ���� �� 0�2 ��/ 0��2 ��/ 0��2 � ��"�

#(� B ##( 6( #B'�

;(� #; ##( ;( 6;8�

#((� B# #8( ##( #B#B�

'((� 6> '>( ##( '6'H�

H +�� ������ ������ ������ ��� � �� L� ������������� ������ �� H;( CE" 4@@@�

" #���� $ %������ &��'����� #������ (( )(**+, --+.-/( ;;8

Page 8: Efficient graph-based dictionary search and its application to text-image searching

3��� ��� ��� ������ �� �������� !������� &� �� ����� ��� ��� ���� ���� �� ��� �������� ��� ��� �������� ��� � ��� ���� ���� �� ��� �������� ��� ��� �� ��� ����� �� ��� ���� ��� ������ ���������� �� �� ���� ��� ��� (<> �� ��� ����

3��� �� ���� ��� ������ ���� ����� ������ ��� �� ���� �� ��� ����

��� ������� ������� ��� ������� �� ��� ������ ������ �� ������ ��� ���� ��� ������������������ ��� ���� ���� �� ���� ��� ������ ������� ���� ���� # ��� 3��� ��� ���� ������ ���� ������������� �� ��� �������� ��"�� ��� ������ ������ �� ����� ���� ��� �� ���� ����� �������� ��"��� ����� �� ���� ' 0����� ��� #( ���� ��,� �� ���������2�

3��� �� ���������� ���� ���� �� ��� ��� �������� � �� G��� B ��� ���� �� �������� B> ����� 0���� B6 ��������� ���� ���� ���� ����2 ���������� ���������� ����� �� ��� ������� ��� �� ��� ���� 0���� ��� ��� ��� �� � ��� ����� �� 862 ��� ���� ��� ��������� ����� ������ ��� ������ ��������������� �� ��� ��� (<# 0��� ���� B2� G� ����� ���� ���� ���� � ��� '�' � #(#; �������� ������ � ������ > ������� ��� ��� �� ��� ����� G� ���� ��� �� ��� ��� ������ ���� �� ��������

�������� ���� ����� ���� � ��

��� ���� � � � �� �������

� ����K��� ����������

� ����K��� ����������

� ���K��� ���������

� ����K� � ����������

��� �������� � K��� ���������

� ����K��� ����������

� ���K�!� ����������

� ���K� � ����������

� ���K��� ����������

� ���K��� ����������

�� ������"��� � �� �� �������

����� �� ��#�

�������� ���� ����� ���� � ��

��� ���� � ��� �� �������

� � ��K��$ ����������

� � ��K��� ����������

� � ��K�%� ����������

� � ��K��� ������ ���

� ���K��� �������� �

��� �������� � � K��$ ����������

� � K��& ����������

� � K��' ����������

� ����K� � ����������

� � ���K��( ����������

�� ������"��� � �� �� �������

;;> " #���� $ %������ &��'����� #������ (( )(**+, --+.-/(

Page 9: Efficient graph-based dictionary search and its application to text-image searching

������ ��� ������ 0���� ��� �������� ��"� �� ������� < ��� ��� ������ �2� ���� ���������� �� �������� ��� � ��� �������� ��"� �� ������� ����� ���� ������ ���� ���� ���� ����� ���� ������� �� ������ ��������

G��� 8 ����� ��� ���� ���� �� ������ ���� 0����� ;( �������2 ����� ��� J������I < ���� ��������� �� ������ � ��� ����� �� ����� �� ��� �� ��� ��� �������� � ��� ��� �� G��� B� 5��� ���������� ��� ������ �� ��� ���� ������� ����� �� �� �������� ������ ��� ������ �� ������������� ���� ���������� ���� < ������ ��� ��� ���� ��� �� � ��� ����� �� B1 ������ ��� ������� ��� �� � ��� ����� �� #� E���� ��� ����� ��� �� ��� ���� �� # � �B1 � 'H� � 1B8 ��0����� ����������2� 3��� ��� ����� ��� �� ��� ������ ���� � ������ ��� ���� �� ������� �� ������ �������� ��� ����� ������ ����� E���� ���� �� �� ���� ����� ��� ������ ���� ���� ���� �������� ���� � ���� ���� � ������� ��� ���� ;(� &� �������� ��� ������ ����� �� �������� ���������� ��� �� �� #� $��� ����� ����������� ��� ���� ���� ���� �� ������ ���� ������ �� ��� ���������� 3��� ��� �� � ������� ���� ������ �� ����� � �� ���� �� ��� ���� @� �� ���� ���� ���������� �� ����� � ��� J���I �� ��� ��� ���� ��������� ��� ��� ������ ������ ��� ������ ����������� �� ��� �������� �� �� �D��� �� ��� ��������� ���� 0��� ����� ��� �� ���������M2�

G��� 8� :������ ���� ������� ����� ��� J������I 0��� ����2�

���� B

4������� �� ���� ����

&��� ��� ���� 0��2 C�� ������ ���� 0��2

#(� #'>6 0B#62 B�( 0(�62

;(� H668 01#>2 B�' 0(�12

#((� HH1B 0>1>2 H�1 0B�B2

;((� B;(( 0>'B2 6�> 0H�>2

#(((� BHHH 08H>2 >�8 0;�62

� #'# 0#;B2 (�B 0(�;2

���� '

4������� �� ��� �� G��� B

&��� ��� ���� 0��2 C�� ������ ���� 0��2

#(� #'> 0#B62 (�8> 0(�82

;(� ##6 0#>2 (�1> 0(�62

#((� #6; 0;2 (�;6 0(�;2

;((� #66 0;2 (�>6 0(�H2

#(((� #6H 0;2 #�#( 0(�#2

" #���� $ %������ &��'����� #������ (( )(**+, --+.-/( ;;1

Page 10: Efficient graph-based dictionary search and its application to text-image searching

�"+" &���!���� �������

�� ��������� ��� ���� �������� ���� ��������� �� �� ���� �� �� ���� ������ �� ��� ������� �������� ������ �� ����������� ���� ���� ������ �� ����� �������� ����� 5/:� ����������� ��� ����� ������ !�� �� G��� #� ��� ������ ����� �� ��������� ����� ��� ��� 3���E����� C������

+ ����� ��� ��� �������� 5/: ������� ��� ������� ���� �� ����� �� G��� > ����� �� �� ����� ��� ��� ��� ���� �� G��� '� &� ����� ������ ����� �������� ������� ��� ������� ��������� ��� ���� ��� 0���� ��� ����� ����� �� G��� > ��� ��� �� ��� ������ ���2� &� ���� ������������ ����� �������� ������� ��� ��� ����� ����� ��� ���� �� ��� ������ ������� ������ �� ������������ ��� � �������� �D��� ��� ��� ���� ��� ���� �� ��� ��� ���� �� G��� 1� ����� � ���������� ��������� ����� ����� ��������� ��� ��� �� (� ���� ����������� �� ���� �� ���� ��� ������� ����������� ����� �� ��� ���� ��� ���� ����� ���� ��� ������ ������� �� ��� ����� ����� G����������� �� ���� ������ �� ������ ��� ���� �� ���� ���� ��� ��� ������ ��������� &� ���� ���� ������ ��� ����������� ������� �� ������ ��� ����� ���������� ��� ����� �� G��� #(� ��������� � �������� ��� ���� �� ����� ���� ��� ��� �� �� � ��������� �� �� �� ��� ���������������� ��� ����� 3# �� 3' ��� ������ ���������� ������� �� ��� ��������� ����A

��!��� )� ����� � �����*+

��*!��� )� �����* � �����+

#��#� �� ,,��!��� � ��- ��! ,��*!��� � ��--

@� ��� ����� ��� ���������� ���� �� ��� ���������� �� ��� ��� ���� ��� ��� ���� �� �� ������� ����� ������ ����� ��� ������ �� ���� ����� ���� ##B ((( ��� ������� �������� ��� ��� &��3�� ;

������ ���� ��� �� ���� ��� ��� �� G��� #( �� ������ ��� ��������� ������A

E�� �� ���� ������ ������� ������� ��� ����� ��� 0��� ���� (<>2� ��� �� �������� �� ������� ����� 0���� ��� ��� ��� �� �� ������2 ��� ��� ���� ��� �� ���� ��� ��� ��� ��� ���� ����� �� ��� ��������� ������ ����� ��� ��������� ������� ���������� ���� ������ ������� �������� �� ������� ����� ��� �� ��� ��� ��� ������� ��� ����� ���� +������� ��� ����� �������� �� ��� ������ �������� ���� �� �� ���� �� ��� ��� ���� ������� 5� ��� ���� ��� �� ������������� ��� ���� �� ������ ��� �������� �� ��� ��� ����������� �������

%����� ��#�����. �)����� �� �������

��� ���� �)� � �� �������

�� A � %/0 ���������� A � �� �������

�� A � 1/0 ���������� A � �� �������

� A � %/2 ����� ���� A � �� �������

�� A � 0/0 ����� � � A � �� �������

�� A � 2%1 ����� ���� A � �� �������

�� A � 1/2 ���������� A � �� �������

�� A � 0/2 ���������� A �� �� �������

�� A � %/10 ���������� A �� �� �������

�� A � 1/% ���������� A �� �� �������

� A � /$2 ���������� A �� �� �������

; &����� < ������ ����� �� �������� ����A99�����������������������9��9�

;6( " #���� $ %������ &��'����� #������ (( )(**+, --+.-/(

Page 11: Efficient graph-based dictionary search and its application to text-image searching

� ���������� �� �����������

������� �������� ����� ��� ���� ���� ������ ���� ������� ����� �� ���� ������� ��������� ������ ��� �� ���������� ������ �� ��� ��� ������� 0����������� �� ��� ��"� �� ��� ��������2�� ��� !���������� G� ������ �� �� ��� ������� �� ���� ���� ��� ������ �� ���� < ��� ������ ������� �7��� ��� ��� ������� ��� ��� �� ��� ����� �� ��� ��� ������ �� ����� ���� �������� ���� ������� �� ������� @� ������ �� ��������� ��� ��� ������ �� ����� ��� �� ��� ����� ��� �� ���� ����������� ��� � ���� ���� �� ��� ��� �� ���� �� ��� �������� �� ��� �� ��� �� �� ��� ��� �� ��������� �� �� ������ �� ��� ����� ��� 0������ ��� ���� ������ ����� ����� ���� ��2� +������ �� ������ �� �������� �� ������ ��� ������ ������ ����������� �� �� ��� �� ������� ��������� ����� ����� ��������� � ����������

��� ������ ���� ������ ���� ������� �������� ��� ��� ������ ���� ������ ����� ���� ��� ��� ������ �� ���� �� ��� ����������� �� ��� ��"� �� ��� �������� �� ��� ��� ������ ���� ���� ����� ����������� @� ����� �� ������ �� ���� ���� ����������� ��� ���� � ��� ����� ������ �� ��

G��� #(� /���� ���������� ��� ���������� ��� ��� ���� �� G��� >�

G��� 1� 5/: ������� ����� ���"���� �D��� �� ������ ��� ��� ����

G��� >� &�� �� �� ��������� 0��� ���� �� G��� '2�

" #���� $ %������ &��'����� #������ (( )(**+, --+.-/( ;6#

Page 12: Efficient graph-based dictionary search and its application to text-image searching

�������� 5�� �� ����� �� ��� ��� ������ �� �� ������� �� ���� �������� �������� 0����� ��� �������������2 D���� ������ ��������� 4������� ����� �������� ������� ������� ���� ��� ���� ��� ������� ������ ��� ���� �� ������� �������� ������� ��� �����

&� ��� ���� �� ����� ��� ���� ������ �� ���� �� ������ �� ������ �������� *����� � ������� ��� ������ ������ �������� ��� ���� � �������� ���� ��� � ���� �� ��� ����� ���� ���7������� �� ��� �� �� ���� ��� �� ��� ����� ��� �� ��� �� ���� ���� ��� ��� ��� ������ ���� �� ������ ����������

�� �������

)����� :� #1;8� ,����� 4�������� 4������� $�������� 4��� 4������� 3L�

/�� )� #181� .��� �� 3������� 5���� $�������� 4��� 5�����

/��� ,� C� L� C�������� %� #111� +� ������� ������� �� ������� ������� ���� ����������� ���� @�A �� &� 0���2

4��������� �� ��� G���� @��������� /�������� �� ,������� +������ �� :���������� @��� ��� ;HB<;H6�

,�F��� �� #1;1� + ���� �� ��� ������� �� ���������� ���� ����� 3���� C��� # '61<'8#�

,������ +� ,� �� ���� �� )� +� #118� .�����"�� ��������� ���������� �� ��� ������ ���������� ����� ������� ����

���� �"� ��������� @�A 4��������� �� ��� G���� @��������� /�������� �� ,������� +������ �� :���������� @��� $��

.���� ��� 'B><'H'�

���� �� #116� :��� ���� ��� ������ ��� ������ ����������� 4���� :���������� ������ #8 #;(8<#;#'�

���� �� '(((� ������� ���� ��� �������� ���� ����� ��� ���� ������ @�A 4��������� �� ��� @��������� /�������� ��

4���� :���������� *��� H ��� HBH<HB8�

C����� C� .�� 4� #116� E�������� ��� ��������� ����� ����������� ��� ������ C��� �������� �� �����������

���� ������ ��������� @��� ���� 4���� +������ �� C����� @����������� ; ;H><;;H�

������� L� )����� 3� )�� �� G��� L� C���� �� 5������ C� #11'� ,������� ������ < ��� ������ �� ��������

4��������� �� ��� @��� >( ##(#<###1�

�������� E� #1>1� + ��� ����� �������� �� ������ ��������A ���� ��� ��������� �� ���� �� ������� @�A 4���������

�� ��� ������ /�������� �� ������ /����������� �� ���������� )�������

;6' " #���� $ %������ &��'����� #������ (( )(**+, --+.-/(