78
CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES NEURONALES Jorge Mario Barajas Ingeniería de Sistemas y Computación Universidad de los Andes 2003

CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES

NEURONALES

Jorge Mario Barajas

Ingeniería de Sistemas y Computación

Universidad de los Andes

2003

Page 2: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

Universidad de los Andes

Descripción breve

CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES

NEURONALES

Por Jorge Mario Barajas

Asesores: José Tiberio Hernández Rafael Armando García

Departamento de Ingeniería de Sistemas y Computación

La clasificación de huellas dactilares es crucial para el desempeño de un AFIS

(Automated Fingerprint Identificaction System), más específicamente, es utilizada para

indexar cada huella dactilar en una base de datos. Se diseñaron e implementaron 2

redes neuronales: un perceptrón multicapa entrenado con el algoritmo de

aprendizaje backpropagation y una red SOM (Self-Organizing Map). Con el

perceptrón multicapa se logró una tasa de error de 14,58% para el problema de

clasificación de huellas dactilares en las 5 clases de Henry sin rechazar huellas y

sin mejorar las imágenes. Rechazando el 10% de las huellas se logró una tasa de

error de 9,56% sin mejorar las imágenes. La red SOM subclasificó las huellas

dactilares revelando interesantes características de huellas que pertenecían a la

misma clase de Henry pero que la red encontraba diferentes.

Page 3: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

TABLA DE CONTENIDO

LISTA DE TABLAS ...........................................................................................................................II LISTA DE ILUSTRACIONES .......................................................................................................III GLOSARIO .......................................................................................................................................VII 1 INTRODUCCIÓN........................................................................................................................... 1

1.1 DESCRIPCIÓN DEL TRABAJO.......................................................................................................1 1.1.1 Objetivos del trabajo ........................................................................................................ 1

1.2 SUSTENTACIÓN DEL TEMA.........................................................................................................1 1.3 PRERREQUISITOS NECESARIOS..................................................................................................2 1.4 ORGANIZACIÓN DEL DOCUMENTO............................................................................................2

2 LOS SISTEMAS BIOMETRICOS.............................................................................................. 4 2.1 METODOLOGÍAS BIOMÉTRICOS.................................................................................................4

2.1.1 Sistemas Biométricos Existentes..................................................................................... 5 2.2 SISTEMAS BIOMÉTRICOS DE HUELLA DACTILAR....................................................................9 2.3 LAS HUELLAS DACTILARES.....................................................................................................13

2.3.1 Historia de las Huellas Dactilares................................................................................13 2.3.2 Características de las Huellas Dactilares...................................................................17

2.4 LAS CINCO CLASES DE HENRY................................................................................................19 3 PREPROCESAMIENTO ............................................................................................................21

3.1 ESTADO DEL ARTE....................................................................................................................21 3.2 BASE DE DATOS NIST-14 ........................................................................................................24 3.3 PREPROCESAMIENTO DE LA IMAGEN.......................................................................................26

3.3.1 Segmentación...................................................................................................................27 3.4 MAPA DE DIRECCIONES............................................................................................................35

4 CLASIFICACIÓN DE HUELLAS DACTILARES ..............................................................42 4.1 REDES NEURONALES................................................................................................................42 4.2 ANÁLISIS DE COMPONENTES PRINCIPALES............................................................................43

4.2.1 Normalización del Mapa de Direcciones.....................................................................44 4.2.2 Matriz de Transformación.............................................................................................46

4.3 BACKPROPAGATION..................................................................................................................47 4.4 SELF-ORGANIZING MAP...........................................................................................................54

5 CONCLUSIONES .........................................................................................................................63 5.1 TRABAJO FUTURO .....................................................................................................................65

BIBLIOGRAFÍA ...............................................................................................................................67

Page 4: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

ii

LISTA DE TABLAS

Número Página Tabla 1. Tabla comparativa de algunos sistemas biométricos existentes.

(Jain, Hong & Pankanti, 1997, p. 6). ......................................................8 Tabla 2. Estado del Arte para la Clasificación de Huellas Dactilares.

(Prabhakar, 2001, p. 123).....................................................................23 Tabla 3. Resultados en la determinación de la arquitectura de red.....................48 Tabla 4. Determinación del Numero Optimo de Épocas en la Etapa de

Entrenamiento....................................................................................49 Tabla 5. Determinación experimental del valor de ambigüedad en la red

para el 10% de las huellas. ...................................................................52 Tabla 6. Clasificación de la SOM de acuerdo a las 5 clases de Henry mas la

clase Accidental ..................................................................................58

Page 5: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

iii

LISTA DE ILUSTRACIONES

Número Página Ilustración 1. Geometría de la mano (Recuperado el 14 de marzo de

2003, de http://biometrics.cse.msu.edu/hand_proto.html)....................5 Ilustración 2. Regiones de la Iris para ser procesadas con fines de

identificación o autenticación en sistemas biométricos. (Recuperado el 12 de marzo de 2003, de http://www.igd.fhg.de/igd-a8/biometrics/images/iris.gif) ....................6

Ilustración 3. Los patrones de las venas en la retina son únicos para cada individuo. (Recuperado el 13 de marzo de 2003, de http://www.prip.tuwien.ac.at/Teaching/SS/GdBA/LU/Images/retina.png) ..........................................................................................7

Ilustración 4. El reconocimiento de cara es una de las tecnologías más fascinantes. (Recuperado el 15 de marzo de 2003, de http://biometrics.cse.msu.edu/face1.gif)...............................................7

Ilustración 5. Las ondas de la voz se utilizan como método biométrico (Recuperado el 10 de marzo de 2003, de http://www-inst.eecs.berkeley.edu/~assist/hearing_image11.gif ). ............................8

Ilustración 6. AFAS (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 9)...............10 Ilustración 7. AFIS (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 10)..............12 Ilustración 8. Marcelo Malpigui (Recuperado el 01 de marzo de 2003, de

http://www.ridgesandfurrows.homestead.co/files/marcello_malpighi.jpg) ............................................................................................13

Ilustración 9. Jean Evangelista Purkinje (Recuperado el 01 de marzo de 2003, de http://vlp.mpiwg-berlin.mpg.de/people/images/img3802.jpg)........................................14

Ilustración 10. Sir William Herschel (Recuperado el 01 de marzo de 2003, de http://www.ridgesandfurrows.homestead.co/files/marcello_malpighi.jpg) ............................................................................................15

Ilustración 11. Henry Faulds (Recuperado el 01 de marzo de 2003, de http://www.ridgesandfurrows.homestead.com/ files/HenryFaulds.jpg) ........................................................................15

Ilustración 12. Francis Galton. (Recuperado el 02 de marzo de 2003, de http://www.doktor.ru/doctor/biometr/Galton.jpg)...........................16

Ilustración 13. Juan Vucetich. (Recuperado el 01 de marzo de 2003, de http://www.policiacientifica.gov.ar/images/vucetich.jpg)....................16

Ilustración 14. Sir Edward Henry. (Recuperado el 01 de marzo de 2003, de http://www.met.police.uk/history/images/time3d.gif)...................17

Page 6: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

iv

Ilustración 15. La Huella Dactilar (Generada con SFinge Versión 2.5, Universidad de Bologna). ....................................................................18

Ilustración 16. Minucias Comunes (Generada con SFinge Versión 2.5, Universidad de Bologna).....................................................................18

Ilustración 17. Las 5 clases de Henry (Recuperado el 22 de marzo de 2003 de http://anil299.tripod.com/vol_002_no_001/papers/paper005.html) ....................................................................................................19

Ilustración 18. Huellas Dactilares de la Base de Datos NIST-14 (f0000001 y f0000002).........................................................................25

Ilustración 19. Imagen de mala calidad (NIST-14, f0006890)............................26 Ilustración 20. Imagen de huella dactilar (NIST-14, f0000009). ........................27 Ilustración 21. Separación del Fondo...............................................................29 Ilustración 22. Grupo más grande centrado con base en su centroide...............30 Ilustración 23. Bordes de la imagen .................................................................31 Ilustración 24. Imagen binaria rotada...............................................................33 Ilustración 25. Imagen binarizada pequeña.......................................................33 Ilustración 26. Imagen Segmentada (Imagen Original NIST-14,

f0000009). ..........................................................................................34 Ilustración 27. Error en la segmentación por fondo no uniforme (NIST-

14, f0007720)......................................................................................34 Ilustración 28. Error en la segmentación por presencia de caracteres

(NIST-14, f0008915)...........................................................................35 Ilustración 29. Imagen segmentada (Original NIST-14, f0000011)....................36 Ilustración 30. Mapa de direcciones. ................................................................38 Ilustración 31. Mapa de direcciones suavizado. ................................................39 Ilustración 32. Imagen segmentada de mala calidad con un mapa de

direcciones correcto (Original NIST-14, f0009047)..............................39 Ilustración 33. Imagen segmentada con exceso de tinta y su mapa de

direcciones erróneo (Original NIST-14, f0009265)...............................40 Ilustración 34. Imagen segmentada de mala calidad con cortaduras en la

huella y su mapa de direcciones (Original NIST-14, f0009740).............40 Ilustración 35. Mapa de direcciones con dos núcleos y su normalización. .........45 Ilustración 36. Mapa de direcciones con núcleo falso y su incorrecta

normalización. ....................................................................................46 Ilustración 37. Desempeño de la Red con diferente Número de Épocas

en el Entrenamiento............................................................................50 Ilustración 38. Errores en la clasificación de la red entrenada con

backpropagation. ....................................................................................51 Ilustración 39. Huellas que presentan ambigüedad para la red (Imágenes

tomadas de NIST-14)..........................................................................53

Page 7: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

v

Ilustración 40. Huellas mal clasificadas por la red que no son rechazadas (Imágenes tomadas de NIST-14). ........................................................54

Ilustración 41. Convergencia de la SOM. .........................................................55 Ilustración 42. Clusters SOM...........................................................................56 Ilustración 43. Vectores Peso con Las Clases de Huellas. .................................57 Ilustración 44. Huellas más cercanas a cada neurona de salida (Imágenes

tomadas de NIST-14)..........................................................................59 Ilustración 45. Diferencias en los puntos singulares de las huella lado

derechos de cada neurona. ..................................................................60 Ilustración 46. Huellas con mejor respuesta por neurona de acuerdo a su

clase....................................................................................................61 Ilustración 47. Secuencia (Imagen tomada de NIST-14, f0012994)...................63

Page 8: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

vi

AGRADECIMIENTOS

El autor desea dar las gracias a José Tiberio Hernández y Rafael Armando García

quienes asesoraron este proyecto.

A la Universidad de los Andes por su patrocinio.

Page 9: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

vii

GLOSARIO

AFAS. Automated Fingerprint Authentication System. Sistema automatizado de autenticación con huella dactilar.

AFIS. Automated Fingerprint Identificaction System. Sistema automatizado de identificación con huella dactilar.

Biométrico. Cualquier característica fisiológica y/o de comportamiento que puede ser capturada y subsecuentemente comparada con otra instancia en el tiempo de verificación.

Dactiloscopia . Estudio de las huellas dactilares como medio de identificación de las personas.

Delta. El punto donde 3 flujos de surcos se encuentran en una huella dactilar.

Filtro Pasa Bajo. Filtro de suavización ideal. Filtro que retiene los puntos que están dentro de una distancia L y elimina los que están por fuera.

Minucia. Discontinuidades locales en una huella dactilar.

Núcleo. El punto más alto del surco curveado más interior en una huella dactilar.

Red Neuronal. Red Neuronal Artificial. Sistemas de procesamiento distribuido paralelo.

Page 10: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

C a p í t u l o 1

INTRODUCCIÓN

La clasificación de huellas dactilares es crucial para el desempeño de un AFIS (Automated Fingerprint Identificaction System), más específicamente, es utilizada para indexar cada huella dactilar en una base de datos. El documento ilustra el proceso de diseño e implementación de 2 redes neuronales con el fin de clasificar las huellas dactilares dentro del marco de las 5 clases de Henry.

1.1 Descripción del Trabajo

En el trabajo se muestra el proceso de diseño del sistema de clasificación así como los resultados obtenidos en su implementación y evaluación. Para lo referente al preprocesamiento de la imagen se utilizó Matlab 6.1 con el toolbox de procesamiento de imágenes v4.0 y java v1.4 con la librería de ImageJ v1.29 mientras que en lo que respecta a redes neuronales propiamente dichas se utilizó el toolbox de redes neuronales v4.0 de Matlab 6.1.

1.1.1 Objetivos del trabajo

- Modelar e implementar un método para preprocesar imágenes de huellas dactilares con el objetivo de clasificarlas.

- Modelar e implementar un perceptrón multicapa entrenado con el

algoritmo de aprendizaje backpropagation para que clasifique huellas dactilares en las 5 clases de Henry.

- Modelar e implementar una red neuronal SOM y analizar el resultado de

la clasificación de huellas dactilares con aprendizaje no supervisado.

1.2 Sustentación del Tema

Existen muchos trabajos que intentan solucionar el problema de clasificar huellas dactilares de diferentes maneras, ¿Por qué hacer otro más? Un estudio a los trabajos existentes muestra que estos dejan en el aire muchas preguntas acerca del proceso que realizan y los resultados que consiguen. Las pruebas de métodos

Page 11: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

2

orientados a clasificar huellas dactilares manejan una gran cantidad de datos, es por este motivo que los métodos implementados deben tener un muy buen diseño. Por otra parte las fallas de cada método no se encuentran completamente documentadas ya que los resultados de las clasificaciones se han convertido en una especie de competencia donde muy pocos trabajos se preocupan por ilustrar completamente el proceso realizado con sus fallas correspondientes.

Queda por explicar el por qué se utilizaron redes neuronales artificiales para solucionar el problema de clasificar huellas dactilares. Existen varias ventajas que brindan las redes neuronales entre las cuales esta la no necesidad de conocimiento a priori de la distribución estadística de los datos, paralelismo inherente, clasificación rápida y la más importante que es la tolerancia a fallas. El problema a tratar es un problema de clasificación de patrones donde las redes neuronales han demostrado tener éxito.

Backpropagation y SOM son dos ejemplos de algoritmos de aprendizaje supervisado y no supervisado en redes neuronales. Por ser ejemplos de diferentes tipos de aprendizaje su estudio resulta ilustrativo y de alguna forma comparable. Es por esta razón que se escogieron estos algoritmos de aprendizaje.

Finalmente vale la pena destacar lo ilustrativo del problema desde un punto de vista pedagógico. La clasificación de huellas dactilares es un gran ejemplo de cómo integrar el procesamiento de imágenes con la implementación de redes neuronales. El proceso de diseño de una red neuronal es muy importante y en el caso del clasificador de huellas este proceso es muy claro y fácil de entender.

1.3 Prerrequisitos Necesarios

El documento asume un completo entendimiento de los conceptos básicos de las redes neuronales artificiales así como de los algoritmos de aprendizaje backpropagation y Self-Organizing Map. Los conceptos necesarios sobre las huellas dactilares para solucionar el problema de clasificación son cubiertos en su totalidad en el segundo capítulo.

1.4 Organización del Documento

El documento tiene 5 capítulos organizados de la siguiente manera:

Page 12: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

3

- Capitulo 2, Los Sistemas Biométricos. En este capítulo se introduce al lector en los sistemas biométricos profundizando en aquellos que utilizan la huella dactilar. Este capítulo comprende lo que el lector necesita saber para acercarse a l problema de clasificación de huellas dactilares y entender el funcionamiento de los sistemas biométricos en general.

- Capítulo 3, Preprocesamiento. Se ilustra todo el proceso implementado para poder extraer aquellas características que sirven para poder clasificar las huellas dactilares. Se muestran los resultados obtenidos con los métodos implementados para preprocesar las imágenes que se van a clasificar.

- Capítulo 4, Clasificación de Huellas Dactilares. Este es el capítulo donde se muestran los resultados obtenidos en la implementación de las redes neuronales. Se ilustra paso a paso su diseño y se analizan los resultados obtenidos.

- Capítulo 5, Conclusiones. Se discute el trabajo global y el trabajo futuro a realizar.

Page 13: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

4

C a p í t u l o 2

LOS SISTEMAS BIOMETRICOS

Desde el antiguo Egipto se tienen datos del uso de sistemas biométricos. Se cuenta la historia de Khasekem, un trabajador oficial encargado de la administración y provisión de comida a los trabajadores durante la construcción de la gran pirámide de Khufu (Ashbourn, 2002, pp. 1-4). Existían casos en que los trabajadores hacían trampa y pedían dos raciones de comida o mantenían dos identidades. Por esta razón, Khasekem desarrolló un sistema en que se tenía diferente información acerca de los trabajadores como el nombre, edad, lugar de origen y ocupación. A través del tiempo Khasekem mejoró su sistema de identificación incluyendo en cada ficha del trabajador características físicas que le servirían para constatar su identidad. Fue así que empezó Khasekem a anotar la forma de la cara, cicatrices, etc. Khasekem había implementado un sistema de verificación de identidad biométrico.

2.1 Metodologías Biométricos

Biométrico es cualquier característica fisiológica y/o de comportamiento que puede ser capturada y subsecuentemente comparada con otra instancia en el tiempo de verificación (Ashbourn, 2002, p. 12).

Para que una característica biométrica pueda ser usada como método de identificación, debe cumplir las siguientes características (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 4):

- Universalidad, se refiere a que todos los individuos deben tener la característica.

- Unicidad, se refiere a que no existen dos individuos iguales en términos de la característica.

- Permanencia, se refiere a que la característica debe ser invariante en el tiempo.

- Coleccionabilidad, se refiere a que la característica puede ser medida cuantitativamente.

Page 14: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

5

A partir de esta definición se puede empezar a estudiar las características humanas que clasifican como biométricos para así poder entender las diferentes tecnologías biométricas actuales.

2.1.1 Sistemas Biométricos Existentes

Existen diferentes metodologías biométricas y cada una de estas se diferencian en su confiabilidad y facilidad de uso. Las más populares son las de huella dactilar (de los cuales se profundizará un poco mas adelante), de mano, iris, cara y voz. También existen otros sistemas que por ahora no son populares pero están tomando fuerza a medida que pasa el tiempo como la comparación de retina, de ADN y de firma.

Ilustración 1. Geometría de la mano.

Los sistemas que utilizan la geometría de la mano son muy interesantes ya que son muy fáciles de usar. El usuario pone la mano en un escáner que toma una “imagen” tridimensional de la mano. Existen varias medidas que se hacen a la geometría de la mano y que el sistema las usa para verificar. El gran problema es que viola el principio de unicidad para ser usado como sistema biométrico confiable. La mano humana no es única1. Es por esto que la mano puede ser utilizada como método complementario en la verificación pero no en la autenticación. La verificación hace referencia al procedimiento llevado a cabo con

1 Tomado de: Biometrics: Hand Geometry. Recuperado el 10 de marzo de 2003, de Biometrics Research.

Department of Computer Science And Engineering Michigan State University: http://biometrics.cse.msu.edu/hand_geometry.html.

Page 15: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

6

el fin de comprobar que una persona es quien dice ser mientras que la autenticación es el proceso necesario para identificar a una persona o usuario.

Otros sistemas biométricos hacen uso del iris. A través de los años se ha comprobado que el iris es único para cada persona y que cambia poco a través de los años (Ashbourn, 2002, p. 52). Estos sistemas son bastante confiables y hacen uso de los patrones existentes en el iris, el problema es que el costo de su implementación es alto en comparación a los demás métodos. Hoy en día existen aplicaciones lo suficientemente confiables para usuarios que utilicen gafas o lentes de contacto.

Ilustración 2. Regiones de la Iris para ser procesadas con fines de identificación o autenticación en sistemas biométricos.

La retina es otro órgano que ha sido utilizado con fines de autenticación e identificación. Esta tecnología explota el hecho de que los patrones de las venas dentro de la retina son únicos en cada individuo y no se alteran a través del tiempo. Esta característica hace que la retina sea un buen órgano para ser usado en un sistema biométrico. El gran problema del uso de esta metodología es que es considerado el sistema biométrico más difícil de usar y es bastante lento en comparación a los demás.

Page 16: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

7

Ilustración 3. Los patrones de las venas en la retina son únicos para cada individuo.

Otra de las tecnologías biométricas que ha generado una gran cantidad de investigación es el reconocimiento de la cara. Un paso necesario en el sistema es la detección de la cara, y aunque en escenarios controlados esto puede ser muy fácil, en escenarios habituales el problema se complica. Sin embargo últimamente se han dado grandes pasos y las actuales soluciones brindan resultados prometedores. Algunos casinos utilizan reconocimiento de caras para detectar tramposos. Los sistemas biométricos que utilizan la cara es una de las tecnologías más amigables para los usuarios, sin embargo hace falta tiempo para que esta metodología sea lo suficientemente confiable.

Ilustración 4. El reconocimiento de cara es una de las tecnologías más fascinantes.

La forma del tracto vocal hace que la voz de cada ser humano tenga características especiales, lo que lo convierte en un candidato para ser utilizado en

Page 17: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

8

sistemas biométricos. Utilizar la voz como medio de identificación o autenticación resulta muy fácil para el usuario ya que solo debe acercarse y pronunciar un par de palabras. Aunque dos voces parezcan iguales a los oídos de una tercera persona, las ondas tienen diferencias visibles. Aunque los sistemas que existen hoy en día son relativamente confiables, existen diferentes problemas para su implementación: recintos abiertos (con la presencia de otros ruidos), usuarios con gripe o alguna otra enfermedad que afecte su voz, etc.

Ilustración 5. Las ondas de la voz se utilizan como método biométrico.

Existen varias metodologías biométricas fuera de las ya antes descritas. La verificación de firma es interesante ya que es una metodología biométrica de tipo anatómico que explota la familiaridad y naturalidad asociada a la firma de cada individuo. También existen sistemas que utilizan el patrón de las venas detrás de la mano y de la muñeca. Aunque no es fácil decidir cuál es mejor que todas, si se puede observar que cada una brinda ventajas y desventajas que deben ser tenidas en cuenta de acuerdo a las diferentes necesidades. Los sistemas más seguros reúnen un conjunto de diferentes metodologías.

Biométrico Universalidad Unicidad Permanencia Coleccionabilidad Desempeño Aceptabilidad Violabilidad

Cara Alto Bajo Medio Alto Bajo Alto Bajo

Huella Dactilar Medio Alto Alto Medio Alto Medio Alto

Geometría de la Mano

Medio Medio Medio Alto Medio Medio Medio

Venas de Manos Medio Medio Medio Medio Medio Medio Alto

Iris Alto Alto Alto Medio Alto Bajo Alto

Page 18: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

9

Retina Alto Alto Medio Bajo Alto Bajo Alto

Firma Bajo Bajo Bajo Alto Bajo Medio Bajo

Voz Medio Bajo Bajo Medio Bajo Medio Bajo

Tabla 1. Tabla comparativa de algunos sistemas biométricos existentes.

En la anterior tabla (Jain, Hong & Pankanti, 1997, p. 6), universalidad, unicidad, permanencia y coleccionabilidad hacen referencia a las características que debe tener un buen sistema biométrico y que ya fueron descritas. Por ejemplo una huella dactilar tiene alta permanencia (dura toda la vida) y unicidad (la huella es única en los seres humanos), media permanencia (es posible que no todos los seres humanos tengan huellas o incluso todos los dedos) y aceptabilidad (algunos usuarios asocian las huellas a procesos judiciales). La aceptabilidad se refiere al nivel de confianza que inspira el sistema en los usuarios y la violabilidad a la capacidad que tienen los usuarios para violar el sistema.

2.2 Sistemas Biométricos de Huella Dactilar

Los sistemas biométricos que utilizan huella dactilar se pueden reunir en dos grupos:

- Sistema Automático de Autenticación con Huellas Dactilares, AFAS (Automatic Fingerprint Authentication System).

- Sistema Automático de Identificación con Huellas Dactilares, AFIS (Automatic Fingerprint Identification System).

En un AFAS, se compara. Normalmente un usuario se acerca al sistema y provee un método que le permita validar la huella, puede ser con información proveniente de una tarjeta inteligente o simplemente insertando en el sistema una identificación. El sistema simplemente compara lo que procesa (toma una impresión de la huella dactilar de la persona con un escáner de alta resolución) con la información dada por el usuario y con base en esto valida, responde si o no. El sistema responde afirmativamente, si la huella procesada y la información contenida en el sistema corresponden.

La ilustración 6 es un diagrama de bloques de un sistema AFAS (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 9). El sistema tiene dos entradas: la huella dactilar y la información del usuario para que el sistema pueda sacar de su base de datos la información necesaria para autenticar la huella dactilar de entrada. Para la

Page 19: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

10

adquisición de la huella dactilar se utiliza un escáner de alta resolución o una cámara CCD. La huella dactilar digitalizada necesita ser procesada para arreglar la imagen (aunque esto no es necesario en todos los casos) y se extraen las características que describen la huella y que representan la unicidad de la huella. Paralelamente al proceso anteriormente descrito, el usuario debió haber insertado información al sistema que ayudaba a identificarlo. Esta información es usada para buscar en la base de datos del sistema la entrada que corresponde al usuario y sacar las características de la huella dactilar del usuario que se encontraban en el sistema. Como se puede ver, se tienen dos conjuntos de datos y cada uno representa características de una huella dactilar; uno proviene del escáner biométrico y el otro de la base de datos del sistema. Lo único que queda es comparar los dos tipos de datos y el sistema ya está en capacidad de rechazar o aceptar al usuario.

Ilustración 6. AFAS.

Page 20: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

11

La entrada perteneciente a la información del usuario puede ser un login y su correspondiente contraseña. Con esta información el sistema ya puede extraer de la base de datos las características de su huella. Esta entrada puede ser también una tarjeta inteligente que contiene los datos que le permiten al sistema identificar la entrada en la base de datos. Cualquiera que sea el sistema utilizado, el objetivo es el mismo. Esta base de datos es actualizada cuando un nuevo usuario se registra con el sistema. Al registrarse el usuario provee datos personales y se le toman huellas dactilares para ser usadas en la comparación del sistema. Normalmente se registra en el sistema la mejor impresión de la huella dactilar del usuario. Esto se logra tomando múltiples impresiones y su objetivo es incrementar la precisión del sistema.

En un AFIS, se encuentra. En este sistema el método de clasificación de huellas dactilares juega un rol primordial en el diseño. El sistema captura la impresión de la huella dactilar del usuario y es el sistema el encargado de identificar el usuario al que pertenece la huella dactilar, o en el peor de los casos, dar una lista de personas que cumplan con las características de la impresión. Para responder el porque de la importancia de clasificar en estos sistemas, basta poner un ejemplo: en un sistema que maneje gran cantidad de usuarios, cada vez que llegara un usuario, el sistema tendría que comparar la impresión de la huella dactilar adquirida con el escáner, con cada huella dactilar que se encuentre en la base de datos. Este proceso podría no ser muy rápido en una base de datos de miles o millones de personas, es por esto que resultaría más fácil “dividir” la información para que cada vez que un usuario intente validarse, el sistema pueda de algún modo enfocar su búsqueda en un número de datos menor al total en la base de datos. La calidad de tal clasificación mejoraría el desempeño de cualquier sistema AFIS.

La capacidad de identificar es lo más atractivo de un sistema AFIS. Como se puede ver en la ilustración 7, el sistema tiene solo una entrada: la huella dactilar. Al igual que en un sistema AFAS, la huella dactilar se adquiere mediante un escáner biométrico o una cámara CCD. A la huella dactilar digitalizada se le extraen las características y son estas características (o con una parte de estas características) las que ese utilizan para clasificar la huella dactilar y acceder a la base de datos para adquirir los datos que le permitan al sistema hacer la comparación con un número de datos reducido. Puede que en esta comparación, aparezca más de una persona que cumplen las mismas características que la huella dactilar. En este caso son necesarios algoritmos que califiquen los niveles de similitud y el sistema responda con un conjunto de individuos cuyas calificaciones sean altas.

Page 21: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

12

Ilustración 7. AFIS.

Los sistemas biométricos de huella dactilar normalmente utilizan las minucias para autenticar e identificar, aunque existen otros métodos. Las minucias son las discontinuidades locales que aparecen en una huella (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 12). De la impresión de la huella dactilar se extraen las minucias, su localización y su orientación, esto es suficiente para saber si dos huellas dactilares pertenecen a la misma persona. En una huella dactilar existen entre 50 y 150 minucias; en los sistemas automatizados 10 minucias que correspondan son suficientes para establecer identidad (Baldi & Chauvin, 1993).

Page 22: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

13

2.3 Las Huellas Dactilares

A continuación se dará una breve introducción a las huellas dactilares para poder entender mejor el problema de clasificación. Se continuará con una breve descripción de las características de las huellas dactilares y finalmente se hará una descripción de las 5 clases de huellas dactilares definidas por Henry.

2.3.1 Historia de las Huellas Dactilares

Realmente no es claro en que punto las huellas dactilares empezaron a ser usadas como método de identificación. Los expertos en el tema no se han puesto de acuerdo en quienes fueron los primeros y existen varias hipótesis respecto al tema. Se ha sugerido que las impresiones de huellas dactilares que se han encontrado en las tablas de arcilla babilónicas y en los sellos chinos de arcilla, fueron puestas deliberadamente como método de identificación (Keogh, 2001), pero otros expertos sostienen que aunque los chinos si utilizaban las huellas dactilares habitualmente para una gran cantidad de documentos, no sabían de las propiedades de las huellas dactilares para identificación de personas.

Ilustración 8. Marcelo Malpigui.

En 1686, un profesor de anatomía en la Universidad de Bologna, Marcello Malpigui, continuó la investigación del inglés Nehemia Grew. En este trabajo se encontraron los surcos, ciclos y espirales, sin embargo, no se hizo ninguna referencia a las huellas dactilares como herramienta de identificación de personas. El trabajo de Malpigui estaba orientado al estudio de la naturaleza anatómica y no a la superficie (Lennard & Patterson, s.f.). Fue hasta 1798 que el alemán J. C. Mayer propuso la idea de que los arreglos de los surcos eran únicos. Pero

Page 23: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

14

realmente fue hasta 1823 con el checo Jan Evangelista Purkinje, que el concepto de unicidad en las huellas dactilares se incorporó en el pensamiento científico (Ashbourn, 2002, p. 5). Purkinje, estaba estudiando las glándulas sudoríparas y observo que estas desembocaban en unos patrones que parecían ser únicos en cada individuo. Entre sus resultados mas interesantes estaba la clasificación de huellas, identificando nueve patrones.

Ilustración 9. Jean Evangelista Purkinje.

La primera persona en darle uso a las huellas dactilares fue Sir William Herschel, un trabajador oficial inglés en 1856. Herschel hacía que las personas imprimieran su huella dactilar en documentos públicos; en un principio lo hizo como un acto de solemnidad ya que pensaba que ayudaba a que las personas tomaran conciencia del acto y no hicieran trampa o engañaran, sin embargo, se dio cuenta de que las huellas dactilares podrían ser utilizadas como métodos de identificación en diferentes asuntos oficiales y legales. Su entusiasmo no fue compartido en el Reino Unido (Keogh, 2001, párr. 9).

Page 24: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

15

Ilustración 10. Sir William Herschel.

Un paso crucial en el uso de las huellas dactilares fue hecho por el médico escocés Henry Faulds a finales de los 1870´s mientras trabajaba en un hospital en Japón. Faulds, observó que las huellas dactilares permanecían en los pacientes sin mayores cambios aún con heridas superficiales, y que estos eran diferentes entre los individuos. Se le pidió ayuda para investigar un crimen y mediante el análisis de huellas dactilares en la escena, convenció a las autoridades de que su sospechoso era el culpable. Este fue el primer crimen en el mundo que fue resuelto con la ayuda de las huellas dactilares. Escribió al diario Nature una carta con su investigación y lo mismo hizo a Charles Darwin quién pensó que era muy viejo para estudiar el tema y le mando esta carta a su primo Sir Francis Galton.

Ilustración 11. Henry Faulds.

Francis Galton estaba trabajando en la aplicabilidad de la estadística en datos sicológicos y parte de su trabajo tenía que ver con las huellas dactilares (Ashbourn, 2002, p. 6). En 1892 Galton publicó un profundo estudio acerca de la ciencia de las huellas dactilares. Fue así que estableció que las huellas dactilares

Page 25: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

16

son únicas; en su estudio estaba incluido un método de clasificación pero su acercamiento era inadecuado (Lennard & Patterson, s.f.) y fue necesario el trabajo de otros científicos para establecer métodos de clasificación.

Ilustración 12. Francis Galton.

Un policía argentino de Buenos Aires, Juan Vucetich fue el primero en usar imágenes de huellas dactilares en tinta, dactilogramas. En 1888 publicó un tratado sobre la dactiloscopia comparativa, donde definió un esquema de clasificación para las huellas dactilares, llamándolo "icnofalagometrico". Este esquema empezó a funcionar en 1891 y en junio de 1892 se pudo resolver un caso de asesinato en Necochea. Se trataba de un asesinato de dos niños cuya madre (Francisca Rojas) alegaba haber sido atacada por un vecino. En un vistazo a la escena del crimen se encontraron huellas de la madre y cuando fue confrontada con la evidencia confesó su crimen.

Ilustración 13. Juan Vucetich.

Page 26: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

17

En 1897, Sir Edward Henry, un policía ingles que para la época trabajaba en India, definió un sistema para clasificar huellas dactilares. Finalmente publicó su investigación en 1900: “Classification and Uses of Fingerprints”.

Ilustración 14. Sir Edward Henry.

2.3.2 Características de las Huellas Dactilares

En una impresión de una huella dactilar se pueden observar claramente los surcos y los valles. Las áreas oscuras de una huella dactilar se llaman surcos y las áreas claras se llaman valles. Los surcos y los valles describen “líneas” suaves a través de la impresión de la huella dactilar.

Otros puntos visibles en la huella dactilar son el núcleo y el delta. Aunque ninguno de los dos ocurre en una de las clases definidas por Henry como se verá mas adelante, estos dos son los llamados puntos de singularidad en una huella dactilar y constituyen una de las principales características descriptivas de una huella dactilar. El núcleo se define como el punto más alto del surco curveado más interior y el delta es el punto donde 3 flujos de surcos se encuentran (Srinivasan & Murthy, 1992).

Page 27: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

18

Ilustración 15. La Huella Dactilar.

Como se puede ver en la ilustración 15, los surcos tienen discontinuidades. Estas discontinuidades fueron estudiadas por Galton y se llaman minucias. Las minucias son las características más utilizadas para identificar y autenticar las personas.

Ilustración 16. Minucias Comunes.

El tipo, posición y orientación de las minucias son lo que hace que las huellas dactilares sirvan como método fiable de autenticación e identificación. En un principio, Galton definió los surcos, bifurcaciones, islas y cerramientos. Estas

Page 28: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

19

características fueron completadas a través del tiempo. En la mayoría de sistemas de autenticación solo se usan las terminaciones y bifurcaciones (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 7).

2.4 Las Cinco Clases de Henry

Cuando Sir Edward Henry estaba definiendo su sistema de clasificación, observó 5 patrones globales que se encontraban en todas las huellas dactilares, fue así que definió cinco clases o tipos de huella dactilar: lado izquierdo, lado derecho, arco, arco tendido y espiral.

Ilustración 17. Las 5 clases de Henry.

Existen huellas dactilares que no clasifican en ninguna de las 5 clases de Henry, estas huellas hacen parte del grupo llamado accidental y no son muy comunes. Cada huella que pertenece a alguna de las clases tiene las siguientes características (Keogh, 2001):

- Una huella de arco tiene surcos que entran desde un lado, se elevan cierta cantidad para volver a caer y salir por el lado opuesto al que entraron.

Page 29: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

20

- Una huella de arco tendido es muy parecida a una huella de arco, la única diferencia es que existe al menos un surco que tiene una elevación de más de 45 grados.

- Una huella de espiral contiene al menos un surco que da una vuelta completa de 360 grados alrededor del núcleo de la huella.

- Las huellas de lado izquierdo o derecho tienen uno o más surcos que entran por un lado, dan la vuelta por el núcleo y vuelven a salir por el mismo lado por el que entraron.

Las clases de Henry tienen distribuciones irregulares en la población. La proporción de distribución natural de las clases es (Prabhakar, 2001, p. 18):

- Espiral: 32,52% - Lado Derecho: 36,48% - Lado Izquierdo: 17,03% - Arco: 6,16% - Arco Tendido: 7,79%

Estas distribuciones varían en una pequeña proporción de acuerdo a las regiones.

Page 30: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

21

C a p í t u l o 3

PREPROCESAMIENTO

El problema es clasificar imágenes de huellas dactilares para poder ser indexadas en una base de datos, y para conseguir este objetivo se han propuesto muchas metodologías a través del tiempo. Aunque el desarrollo de los computadores ha sido exponencial, todavía es necesario nivelar desempeño y calidad de los sistemas biométricos en general. Existen métodos con excelentes resultados para clasificación de patrones, el problema empieza cuando esta clasificación ocurre en sistemas cuyo tiempo de respuesta es primordial. En los sistemas biométricos de huella dactilar el tiempo de respuesta es importante, y este será aún más importante a medida que la autenticación e identificación automatizada se vuelve una cotidianidad. Es por esto que se deben buscar métodos que minimicen los rangos de error en el menor tiempo de ejecución. En la mayoría de metodologías propuestas, el preprocesamiento de la imagen de huella dactilar se lleva la mayor cantidad de tiempo de procesamiento del sistema en comparación a la clasificación, aunque este preprocesamiento esta orientado ha mejorar la imagen y por ende, mejorar la clasificación.

3.1 Estado del Arte

Existen 4 grandes acercamientos al problema de clasificación de huellas dactilares (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, pp. 14,15):

- Sintáctico: los patrones de surcos y minucias se aproximan a cadenas de primitivas, las clases de clasificación se modelan como reglas de producción o reglas de gramática con las muestras de entrenamiento. La clasificación se realiza pasándole a un parser la cadena de primitivas.

- Estructural: características basadas en minucias (o singularidades) se extraen y se representan con un grafo. La clasificación estructural se realiza mediante la explotación de la topología de las características.

- Estadístico: se utilizan clasificadores estadísticos con las características de las huellas dactilares.

- Red Neuronal Artificial: se construyen vectores característicos de la huella dactilar para ser pasado a una red neuronal artificial clasificadora.

Page 31: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

22

Existen muchos métodos propuestos para la clasificación de las huellas dactilares. En el caso de este trabajo se evaluará la clasificación con redes neuronales artificiales y se utilizará la base de datos NIST-14, la cuál será descrita más adelante. El escoger esta base de datos, cierra de algún modo el marco de comparación ya que la solución para estos problemas depende de la calidad y tipo de las imágenes. La gran mayoría de los trabajos hechos sobre el tema de clasificación de huellas dactilares utilizan la base de datos NIST-4, una base de datos que es mucho mas útil para evaluar algoritmos de extracción de características; el utilizar la base de datos NIST-14 provee resultados mucho mas realistas (Watson, Candela & Grother, 1994, p. 7). Vale la pena destacar que la base de datos NIST-9 está contenida en la base de datos NIST-14. Es por esta razón que aquellos trabajos que hagan uso de la base de datos NIST-9 sirven como marco de comparación.

Watson, Candela y Grother implementaron en 1994 un clasificador probabilístico con red neuronal. En su experimento utilizaron los 5 primeros volúmenes de la base de datos NIST-9, las imágenes “F” fueron utilizadas para entrenar la red, y las imágenes “S” fueron utilizadas para probar la red. En el preprocesamiento de la imagen hacen una segmentación para obtener una imagen más pequeña de la original que contiene la huella dactilar, y utilizan filtros con base en la transformada Fourier para mejorar la imagen. Para extraer las características utilizan un método basado en surco-valle, y la transformada K-L. El sistema rechaza huellas dependiendo de su calidad dado que presentan ambigüedad para el clasificador.

Watson, Candela y Grother obtuvieron tasas de error de 8,65% clasificando en las 5 clases de Henry rechazando 10% de las huellas dactilares, una mejora del 2% en la tasa de error comparando la clasificación sin mejoras a la imagen antes de la clasificación.

La tabla 2 (Prabhakar, 2001, p. 123) muestra los resultados conseguidos por algunos autores en el problema de clasificación de huellas dactilares. Aunque en esta tabla no se especifica la base de datos utilizada y en algunos casos no se clasifican las huellas en las 5 clases de Henry, sirve para poder comparara los resultados obtenidos en este trabajo.

Page 32: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

23

Tabla 2. Estado del Arte para la Clasificación de Huellas Dactilares.

Autores Clases Características Método Precisión (% de rechazo)

Kawagoe & Tojo, 1984.

7 Puntos Singulares Basado en Reglas

91,5% (0%)

Blue, 1994. 5 Campo de Direcciones

Red Neuronal 92,8% (0%)

Wilson, 1994. 5 Campo de Direcciones

Red Neuronal 90,2% (0%)

Candela, 1995. 6 Campo de Direcciones

Red Neuronal 92,2% (0%)

Pal & Mitra, 1996. 5 Campo de Direcciones

Red Neuronal 82+% (0%)

Fitz & Green, 1996. 3 FFT Vecino más cercano.

85% (0%)

Karu & Jain, 1996. 5 Puntos Singulares Basado en reglas.

85% (0%)

Senior, 1997. 4 Surcos Modelo de Markov oculto.

90% (0%)

Chong, 1997. 5 Surcos Basado en reglas 96,5% (0%)

Hong & Jain, 1999. 5 Puntos singulares y surcos.

Basado en reglas 87,5% (0%)

Proposed, 1999. 5 Respuesta Gabor. Combinación 90% (1,8%)

Capelli, 2000. 5 Campo de Direcciones.

Combinación 99% (20%)

Page 33: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

24

3.2 Base de Datos NIST-14

El método utilizado para adquirir las imágenes de huellas dactilares, personaliza la solución del problema de clasificación de huellas dactilares. En un sistema biométrico que cuente con un escáner de alta resolución, el preprocesamiento de la imagen va a ser mínimo ya que el escáner garantiza de algún modo la calidad y posición de la huella dactilar dentro del marco de la imagen. En cambio, un sistema de clasificación cuyas imágenes sean adquiridas mediante fotografías de alta resolución (normalmente se hace con una cámara CCD), el preprocesamiento es importante ya que estas imágenes vienen normalmente de impresiones de tinta donde la posición y calidad de la huella no fueron evaluadas para su posterior digitalización y procesamiento. El saber escoger una base de datos para evaluar un sistema es muy importante ya que le da realismo a los resultados del experimento.

En este trabajo se utilizaron las imágenes “F” del segundo volumen de la base de datos NIST-14. Esta base de datos es mantenida por el Instituto Nacional de Estándares y Tecnología de Estados Unidos, NIST (National Institute of Standards and Technology). Esta es una base de datos apropiada para la investigación de métodos de clasificación de huellas dactilares2.

El segundo volumen de la base de datos NIST-14 cuenta con 13.500 imágenes de huellas dactilares en escala de grises de 8 bits con dimensiones de 832x768 píxeles (19.7 píxeles por milímetro). Estas 13.500 imágenes de huellas dactilares pertenecen a una colección de tarjetas pares de huellas dactilares. Es decir, se tomaron impresiones de los diez dedos de un individuo en una tarjeta de 4096x1536 píxeles 2 veces, y a partir de estas tarjetas se obtuvieron 20 imágenes de impresiones de huellas dactilares de 832x768 píxeles. Una de las tarjetas esta compuesta por las imágenes cuyo nombre de archivo comienza por “F” y las otras imágenes de la segunda impresión comienzan por “S”. La diferencia entre estas copias es que las “F” son los archivos y las “S” hacen parte de las tarjetas de búsqueda.

2 NIST Special Database 14. NIST SCIENTIFIC AND TECHNICAL DATABASES.

http://www.nist.gov/srd/nistsd14.htm

Page 34: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

25

Ilustración 18. Huellas Dactilares de la Base de Datos NIST-14.

La distribución de las imágenes “F” del segundo volumen de las base de datos NIST-14 es la siguiente:

- Lado Izquierdo: 34,32%

- Lado Derecho: 34,91%

- Espiral: 22,23%

- Arco Tendido: 4,38%

- Arco: 4,05%

- Accidental (Scar): 0,07%

Esta distribución es parecida a la distribución natural de huellas. Esta clasificación viene como encabezado en el archivo de cada imagen con L para lado izquierdo, R para lado derecho, W para espiral, A para arco, T para arco tendido y S para accidental.

La base de datos NIST-14 es adecuada para investigar métodos de clasificación. Como se puede ver en la ilustración 18, las imágenes fueron tomadas teniendo en cuenta el campo de impresión de la tarjeta y no se intento centrar la huella dactilar. Este aspecto incrementa el realismo de la situación. Solo basta imaginar el proceso de digitalización de una base de datos de algún organismo que tenga gran cantidad de huellas dactilares. Este proceso de digitalización debería tener en

Page 35: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

26

cuenta que el proceso físico de impresión de cada huella dactilar fue hecho sin tener mucho cuidado en la calidad o posición de la impresión.

Las imágenes con las que se trabajo tienen niveles de calidad variables. Como ya se dijo anteriormente no se tuvo en cuenta la orientación de la huella, la posición y la calidad de la impresión. Aunque hay varias imágenes con calidad aceptable, hay otras que presentarán problemas en el trabajo a realizar. La ilustración 19 muestra una imagen de mala calidad.

Ilustración 19. Imagen de mala calidad.

La base de datos NIST-14 tiene todas las huellas dactilares de la base de datos NIST-9. De hecho, las primeras 13.500 imágenes de NIST-14 son todas las imágenes que se encuentran en los 5 volúmenes de la base de datos NIST-9.

3.3 Preprocesamiento de la imagen

Las imágenes de huellas dactilares de la base de datos NIST-14 tienen niveles de calidad variables. Este aspecto crea la necesidad de tratar de mejorar la calidad de la imagen para no exponer el sistema de clasificación a ruido proveniente de una huella de mala calidad que incida en el resultado de la clasificación.

El primer paso necesario es tomar de cada imagen lo que realmente interesa, es decir, extraer la huella dactilar. Se parte de la hipótesis que la huella es aquel grupo más grande de píxeles oscuros con un fondo mucho más claro. Como se podrá ver mas adelante este no es el caso en todas las imágenes ya que hay imágenes que tienen las huellas con algún tipo de escritura que dificultará el proceso de segmentación.

Page 36: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

27

3.3.1 Segmentación

Las imágenes de la base de datos NIST-14, tienen a la huella dactilar en diferentes posiciones y orientaciones. Es necesario implementar un método que capture la huella dactilar y deseche el resto de la imagen. Al segmentar la imagen también se logra que la dimensión de la información se reduzca y también la carga de operaciones del sistema.

Ilustración 20. Imagen de huella dactilar.

El método implementado se basa en el algoritmo propuesto por Watson, Candela y Gother (1994). En este método, se toma la imagen de huella dactilar con dimensiones de 832x768 píxeles y se genera una imagen de 512x480 píxeles. Esta dimensión resultado se definió para lograr compatibilidad con algoritmos existentes que se implementan en los sistemas biométricos de huella dactilar. La orientación de esta imagen resultado puede ser distinta a la imagen original ya que el algoritmo intenta enderezar la huella dactilar.

1. En este primer paso se asocia una imagen binaria de 104x96. Esta imagen binaria pretende generalizar el proceso de segmentación para toda la imagen, la idea es operar sobre bloques de 8x8 de la imagen original. Primero se intenta definir que parte de la imagen es huella y que parte es fondo, para esto se debe calcular el valor mínimo y máximo de píxel en toda la imagen y el valor mínimo de píxel de cada bloque.

for (varios valores (factor) entre 0,0 y 1,0)

{

Page 37: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

28

umbral=mínimo_global+factor*(máximo_global – mínimo_global)

Asignar “verdadero” a cada píxel de la imagen binaria asociada (104x96) cuyo valor de bloque mínimo sea menor o igual que el umbral. Se cuenta el número de píxeles “verdaderos” de la imagen binaria. Estos píxeles de la imagen binaria equivalen a bloques que no hacen parte del fondo en la imagen original (832x768).

A continuación se deben contar el número de transiciones que existen entre los píxeles verdaderos y falsos de la imagen binaria asociada, horizontalmente y verticalmente. Esto equivale a contar el número de huecos que existen en las filas y columnas de la imagen binaria asociada. Se debe llevar el factor que al ser aplicado, tiene el menor número de transiciones en la imagen binaria asociada.

}

Una vez se completa este ciclo, se debe tener un valor para factor cuya imagen binaria asociada sea una imagen binaria de la imagen original. Se repite el algoritmo una vez mas, solo que ya no es un ciclo por que el valor de factor óptimo ya se conoce.

Hay varios aspectos para resaltar de esta rutina. Es posible que el ciclo comience desde 0,4 y termine en 1 con incrementos de 0,1. Si por ejemplo se asigna a factor un valor muy bajo (0,0 – 0,4), la imagen binaria tendrá muchos huecos en lugares que no hacen parte del fondo, y si se tiene un valor muy alto (0,8 – 1,0), habrá muchas manchas en lo que debería ser fondo. Basta notar que se efectúan al menos 6 iteraciones para concluir que este proceso es bastante pesado para la máquina por lo que empezar desde 0,4 no es mala idea. No es posible imponer un límite menor a 1,0 ya que la base de datos cuenta con imágenes de huellas muy claras donde no es fácil diferenciar la huella del fondo. Si la rutina tiene un límite superior menor a 1,0 es muy posible que no se detecte la huella y la imagen binaria sea una imagen de píxeles falsos lo que estropearía las siguientes rutinas.

Es necesario definir un rango para el número de píxeles verdaderos en la imagen binaria asociada ya que si no existe un límite inferior, una imagen binaria asociada llena de píxeles falsos tendría 0 transiciones lo que llevaría a cometer errores en el cálculo del factor. Análogamente se tendría el mismo problema si no se tiene un límite superior: una imagen llena de píxeles verdaderos tiene 0 transiciones pero esto no es lo que se quiere. Se encontró que era suficiente que hubiesen entre 4.500 y 8.000 píxeles

Page 38: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

29

verdaderos que no hacen parte de fondo en la imagen binaria asociada. Si el límite bajo es por ejemplo 3.000, se va a tener una imagen con muchas partes “falsas”. Si el límite alto es demasiado alto se va a obtener una imagen con muchas partes “verdaderas”.

Ilustración 21. Separación del Fondo.

2. Se limpia la imagen binaria asociada y se centra. Primero se erosiona la imagen 3 veces. En cada erosión se cambian a falso aquellos píxeles que tienen algún vecino verdadero. Estos vecinos son aquellos de conexión 4: (arriba, abajo, izquierda y derecha).

La huella siempre va a ser el conjunto de píxeles verdaderos más grande. Se cambian a falso aquellos píxeles que no pertenecen a este grupo. Esto se puede lograr mediante el método de etiquetamiento de componentes para imágenes binarias (Ritter & Wilson, 2000, p. 173).

Se cambia a verdadero todo píxel falso que tenga los píxel de la izquierda y derecha verdaderos o los píxeles de arriba y abajo.

Se calcula la posición del centro del área de la huella y se centra la huella con base en las coordenadas del centroide. Las coordenadas del centroide de una imagen binaria I con dimensiones mxn (píxeles verdaderos son 1 y falsos son 0) son:

Page 39: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

30

∑∑

∑∑

∑∑

∑∑

= =

= =

= =

= =

⋅=

⋅=

m

x

n

y

m

x

n

y

m

x

n

y

m

x

n

y

yxI

yxIyy

yxI

yxIxx

1 1

1 1

1 1

1 1

),(

),(

),(

),(

Ilustración 22. Grupo más grande centrado con base en su centroide.

3. Se encuentra el borde izquierdo, derecho y superior de la imagen binaria asociada. El procedimiento es análogo para los tres lados. Por ejemplo para el borde derecho, se parte desde la columna de la mitad y se hace un ciclo que recorra las columnas hasta que se exista una transición de verdadero a falso o hasta cuando exista una diferencia de 2 con respecto a la columna del borde de la fi la inmediatamente anterior. Esta última condición se incluye para no aceptar cambios bruscos en el borde.

Como se puede ver en la ilustración, el recorrido se hace dentro de límites. Para el borde derecho e izquierdo, se recorre desde la fila 30 hasta la fila 66, ya que con la información contenida en estas filas es suficiente para continuar con el siguiente paso. Lo mismo ocurre con el borde superior, se recorre desde la columna 30 hasta la columna 76.

Page 40: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

31

Ilustración 23. Bordes de la imagen

4. Linearizar los bordes de la imagen binaria asociada y encontrar sus pendientes. Esta rutina tiene un problema ya que en el método al intentar linearizar un conjunto de puntos verticales aproxima una línea horizontal, es por esto que es necesario ver los bordes derecho e izquierdo de lado: las filas de la imagen son la primera dimensión y las columnas la segunda dimensión. En el caso del borde superior las columnas son la primera dimensión y las filas la segunda.

Se parte de la hipótesis que no van a existir bordes derechos o izquierdos horizontales lo cual es claramente muy difícil que ocurra o que no haya bordes superiores verticales.

El método de evaluación de eigenvectores sirve para linearizar. Primeo se calculan los promedios de cada dimensión x,y dado un conjunto de puntos:

=

=

yy

xx

i

i

N

N1

1

Se le resta el promedio a cada punto en cada dimensión para estandarizarlo:

Page 41: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

32

yyy

xxx

ii

ii

−=

−=

ˆ

ˆ

Se calculan los valores a, b y c:

( )∑

∑∑

=

=

=

y

yxx

ic

b

ia

ii

ˆˆˆ

ˆ

2

2

Se calcula λ (menor eigenvalor) y la pendiente m :

( )

)/(2

44))((

abm

bbaccacaca

−−=

+−++−+=

λ

λ

Si λ=a la pendiente es vertical. Ya con la pendiente se puede calcular el ángulo del borde linearizado.

5. Promediar los ángulos de las pendientes de la imagen binaria asociada. Es trivial calcular el ángulo teniendo la pendiente, después se debe cambiar cada ángulo para que se cumpla la siguiente condición:

0 ≤ φ <180

Esto es necesario para conseguir el promedio de ángulos ya que si simplemente se suman y se divide por 3, el resultado es erróneo. Por ejemplo 90° y -90° son ángulos equivalentes, pero si se suman y se dividen entre 2 dará como resultado 0°, lo cuál esta mal. Si en cambio se cambia el -90° a 90 que es su equivalente, al sumar y dividir entre 2 da 90° que es la respuesta que se busca.

6. Rotar la imagen con base en el cálculo del ángulo promedio de las pendientes de los tres lados. Para conocer la orientación de la imagen:

orientación_de_la_huella = atan(pendiente).

Page 42: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

33

rotación_de_la_imagen = π/2 - orientación_de_la_huella.

Ilustración 24. Imagen binaria rotada.

7. Encontrar el borde superior de la huella dactilar con la imagen binaria asociada. Para esto se desplaza una ventana de 60x64centrada horizontalmente de arriba abajo. Se para cuando la primera fila contenga 10 o más píxeles verdaderos. Este número se calcula experimentalmente y lo que se logra es bajar un poco el marco de la ventana pequeña con respecto al borde superior de la imagen. Con la información que se tiene hasta este punto ya se sabe cuanto se debe rotar, desplazar y desde donde se toma la imagen pequeña de la imagen original.

Ilustración 25. Imagen binarizada pequeña.

8. La imagen original se desplaza, rota y se toma la subimagen de la huella dactilar. La segmentación ha terminado.

Page 43: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

34

Ilustración 26. Imagen Segmentada.

Con esta rutina de segmentación se logran buenos resultados la mayoría de los casos. Cuando esta rutina no logra buenos resultados es por que la huella no se diferencia fácilmente del fondo mas claro y esto ocurre por varias razones:

- El fondo no es uniformemente mas claro que la huella. El fondo tiene partes oscuras y el primer paso de la rutina de segmentación no logra separar la huella del fondo.

Ilustración 27. Error en la segmentación por fondo no uniforme.

Page 44: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

35

- Hay ruido en la imagen como escritura ajena a la huella que en la primera parte de la segmentación se confunde como conjunto de píxeles pertenecientes a la huella:

Ilustración 28. Error en la segmentación por presencia de caracteres.

3.4 Mapa de Direcciones

Existen 2 grandes tipos de características en la huella dactilar (Prabhakar, 2001, pp. 18-19):

- Estructuras globales de surcos y valles.

- Minucias locales de surcos y valles.

Para clasificar huellas dactilares las estructuras globales son las que se utilizan para clasificar en los grupos globales. Para identificación y autenticación se utilizan las minucias. Es así que se debe buscar algo que caracterice esa estructura global de la huella dactilar que es formada por los surcos y los valles, una estructura que es claramente distinguible en cada clase de Henry.

Page 45: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

36

Ilustración 29. Imagen segmentada.

El mapa de direcciones representa una propiedad intrínseca de las imágenes de huellas dactilares y define coordenadas invariantes para surcos y valles en vecindades locales (Hong, Wan & Jain, 1998, p. 10). Esto quiere decir que la huella dactilar se puede ver como una textura orientada, y por ende se puede caracterizar la huella dactilar con el mapa de direcciones. Este mapa de direcciones es la orientación de cada punto en la imagen con respecto a sus vecinos y normalmente se determina la orientación de bloques y no por puntos para reducir la carga computacional (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, p. 20).

Para calcular el mapa de direcciones se implementó un método muy popular y es parecido al utilizado por Zhang, Huang y Yan (s.f.) entre muchos otros autores. Siendo G la imagen de M×N, primero se calculan los gradientes Gx y Gy que son matrices con dimensiones de M×N cada una (Sobel fue el operador utilizado para calcular el gradiente), Son un conjunto de vectores que apuntan en la dirección de valores crecientes de G. Una vez se tienen los gradientes, se calcula la orientación ángulo de cada punto:

=∨=

≠∧≠

=

00,0

00,arctan),(

yx

yxx

y

GGsi

GGsiG

G

jiα

Page 46: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

37

Es necesario poner la segunda condición en la ecuación ( =),( jiα 00,0 =∨= yx GGsi ) ya que si 00 == yx GoG , el punto tiene una orientación vertical u horizontal, así que se pueden tomar los valores de 0 o π/2 radianes.

Ahora se calcula la orientación de bloques de 16×16 (W). Para esto es necesario promediar los ángulos de los puntos que se encuentran en cada bloque:

=∨=

≠∧≠

=

∑∑

∑∑∑∑

∈∈

∈∈∈

0)),(*2sin(0)),(*2cos(,0

0)),(*2sin(0)),(*2cos(,)),(*2cos(

)),(*2sin(

arctan*21

),(

),(),(

),(),(),(

),(

WjiWji

WjiWjiWji

Wji

jijisi

jijisiji

ji

yx

αα

ααα

α

θ

Es necesario aclarar varias cosas de la anterior ecuación. θ es una matriz con menor dimensión a la imagen original ya que cada valor representa la dirección de cada bloque; es decir si NjMi ≤≤∧≤≤ 11 , entonces

wNywMx ≤≤∧≤≤ 11 , ya que 16=w es el tamaño de cada bloque ( ww× ).

Para poder promediar los ángulos, es necesario sumar los senos de los ángulos multiplicados por 2, y dividirlo por la suma de cosenos de los ángulos multiplicados por 2. La matriz orientación fue convertida a un campo vectorial continuo. Si por ejemplo se tienen 2 ángulos de 1° y 179°, el sumarlos y dividirlos por 2 daría un ángulo cercano a los 90°. Si se convierten a un campo vectorial continuo (cos(2*ángulo), sin(2*ángulo)), 1°=(0.9994, 0.0349) y 179°=(0.9994, -0.0349), al promediarlos da (0.9994, 0) que equivale a una línea horizontal (Wilson, Candela & Watson, 1993, p. 5).

Page 47: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

38

Ilustración 30. Mapa de direcciones.

Como se puede ver, el mapa de direcciones presenta diferentes perturbaciones, es necesario implementar algún método que suavice este mapa de direcciones. El método utiliza un filtro pasa bajo ω de radio 2 con una ventana de tamaño λ=5. Este paso equivale a promediar aquellos puntos que se encuentran dentro de una radio de 2 puntos para asignárselo al punto del centro del filtro. Para esto es necesario convertir primero la matriz orientación en un campo vectorial continuo como se describió anteriormente. La matriz orientación suavizada O se obtiene con:

.),(*),(),(

,),(*),(),(

)).,(*2sin(),()),,(*2cos(),(

2/

2/

2/

2/'

2/

2/

2/

2/'

∑∑

∑∑

−=−=

−=−=

++=

++=

==

λ

λ

λ

λ

λ

λ

λ

λ

ϕωϕ

ϕωϕ

θϕθϕ

uv yy

uv xx

y

x

vyuxvuyx

yvyuxvuyx

yxyxyxyx

=∨=

≠∧≠

=

0),(0),(,0

0),(0),(,),(

),(arctan*

21

),(''

'''

'

yxyxsi

yxyxsiyx

yx

yxO

yx

yxx

y

ϕϕ

ϕϕϕ

ϕ

Page 48: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

39

Ilustración 31. Mapa de direcciones suavizado.

El mapa de direcciones puede ser utilizado para clasificar las huellas dactilares por que describe el patrón formado por los surcos y los valles. Los mapas de direcciones que no correspondes con estos patrones son errores producto de la calidad de la huella. Estos mapas de direcciones se calculan de las imágenes segmentadas, así que todavía se depende de la calidad de las imágenes de la base de datos NIST-14. Aunque se logran buenos resultados en la mayoría de las imágenes, la mala calidad de una huella puede derivar fácilmente en un mapa de direcciones erróneo.

Ilustración 32. Imagen segmentada de mala calidad con un mapa de direcciones correcto.

Page 49: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

40

La mala calidad de las imágenes puede ser producto de un exceso de tinta en la impresión de la huella dactilar o una falta de tinta haciendo que los surcos y los valles no estén claramente delineados aunque en este último caso el método implementado para el mapa de direcciones no introduce tantos errores.

Ilustración 33. Imagen segmentada con exceso de tinta y su mapa de direcciones erróneo.

Como era de esperarse, el mapa de direcciones es afectado por objetos ajenos a la huella dactilar o por cortaduras en el dedo que se ven representadas en la impresión. Para el mapa de direcciones el método implementado tiene muy buenos resultados, los problemas ocurren cuando la calidad de la imagen no es buena, el mismo problema que se puede tener en la segmentación. La buena calidad de la imagen es crucial para un buen mapa de direcciones así que para buscar mejorar el mapa de direcciones se debe mejorar previamente la imagen.

Ilustración 34. Imagen segmentada de mala calidad con cortaduras en la huella y su mapa de direcciones.

Page 50: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

41

El mapa de direcciones describe los patrones globales de las huellas. Es una matriz de 30x32 que se puede ver como un vector de 960 dimensiones tomando las filas de la matriz. Con el mapa de direcciones se puede continuar con la clasificación.

Page 51: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

42

C a p í t u l o 4

CLASIFICACIÓN DE HUELLAS DACTILARES

En el anterior capítulo se describieron los pasos necesarios para lograr una correcta representación de los patrones formados por los surcos y los valles en una huella dactilar. El último paso es crear una red que logre clasificar las huellas dactilares para ser indexadas en una base de datos para el funcionamiento de un AFIS.

4.1 Redes Neuronales

Este trabajo no pretende dar al lector una descripción de que son y como funcionan las redes neuronales artificiales, en cambio, se limita a describir los aspectos más importantes de las redes neuronales artificiales que se implementaron para el problema de clasificación de huellas dactilares. Es por esto que se recomienda, antes que todo, familiarizarse con el marco teórico referente a las redes neuronales artificiales, en especial con los algoritmos de aprendizaje backpropagation y Self-Organizing Maps.

En cada experimento se siguen 4 pasos generales para los procesos de diseño y aprendizaje de las redes3:

1. Construir los datos de entrenamiento. A partir del mapa de direcciones se debe buscar un vector que represente la clase de la huella.

2. Crear la red. Se diseñará e implementará un perceptrón multicapa y una red SOM para analizar su funcionamiento.

3. Entrenamiento de la red. Mediante la construcción de los vectores de características de un determinado número de imágenes de huellas dactilares del segundo volumen de la base de datos NIST-14, se determinaran los métodos de entrenamiento de cada red creada. El perceptrón multicapa se entrenará con el algoritmo de aprendizaje backpropagation.

3 MATLAB 6.1 Online Documentation. Neural Network Toolbox, Backpropagation. Recuperado el 28 de

marzo de 2003, de http://www.mathworks.com/access/helpdesk/help/toolbox/nnet/backpr5.shtml

Page 52: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

43

4. Probar la red. Se analizará cada red para el problema de clasificación de huellas dactilares con el procesamiento de imágenes “f” pertenecientes al segundo volumen de la base de datos NIST-14 que no se utilizaron en la fase de entrenamiento. Para el perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation se comparan los resultados obtenidos con los esquemas de clasificación en las 5 clases de Henry. En el caso de la red SOM, solo se puede analizar el comportamiento de la red. Esto se explicará mas adelante.

4.2 Análisis de Componentes Principales

El mapa de direcciones calculado tiene un tamaño de 30×32 que se puede modelar como un vector de 960 dimensiones. Este número es demasiado grande como para servir de entrada a cualquiera de las redes a implementar y fuera de eso se introduce demasiado ruido porque el mapa de direcciones se calcula a partir de una imagen que puede contener objetos ajenos a la huella dactilar como se pudo ver en el capítulo 3. Es necesario buscar alguna forma de reducir esta dimensión pero manteniendo las principales características del vector. El análisis de componentes principales brinda un método donde se elimina la información redundante reduciendo la dimensionalidad del vector de datos (mapa de direcciones).

En el análisis de componentes principales, los datos se ortogonalizan para que no exista correlación entre ellos, se ordenan los componentes principales de tal forma que aquellos con mayor variación están de primeros; y elimina aquellos componentes que contribuyen con la menor variación en los datos de entrada4. Para conseguir esto primero se normalizan los vectores, se multiplican por una matriz cuyas filas son los vectores propios de la matriz de covarianza de los datos de entrada.

El análisis de componentes principales maneja el mapa de direcciones como un solo vector. Como el análisis de componentes principales es lineal en el espacio del mapa de direcciones, no puede manejar satisfactoriamente variaciones en la geometría. Por ejemplo si se tienen dos mapas de direcciones de dos imágenes de huella dactilar lado derecho con sus núcleos en diferente posición, una combinación lineal de estos mapas solo puede generar un mapa con el núcleo en una sola de las posiciones o dos núcleos sobrepuestos pero no un mapa que represente un lado derecho. Las combinaciones lineales de los mapas de

4 MATLAB 6.1 Online Documentation. Neural Network Toolbox. Recuperado el 28 de marzo de 2003, de

http://www.mathworks.com/access/helpdesk/help/toolbox/nnet/backpr21.shtml

Page 53: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

44

direcciones no interpolan geometría, es por esta razón que se debe buscar un mecanismo para normalizar el mapa de direcciones.

4.2.1 Normalización del Mapa de Direcciones

Como se ha hecho en trabajos existentes, el núcleo se utiliza como punto que sirve para normalizar las huellas dactilares. El núcleo se define como el punto más alto del surco curveado más interior y el delta es el punto donde 3 flujos de crestas se encuentran (Srinivasan & Murthy, 1992). El arco es la única clase de Henry que no tiene núcleo claramente definible.

La mejor forma de hallar el núcleo es modelar el mapa de direcciones como un campo de direcciones y calcular el índice poincare que se define como el integral de la tasa de cambio de orientación en un contorno cerrado (Vizcaya & Gerhardt, 1996), (Lee & Gaenssley, 1991). La idea es hallar un punto en el mapa de direcciones y definir unos puntos que lo encierren para calcular el índice poincare. El índice poincare en el punto ),( yx del mapa del campo de direcciones en cerrado por los puntos pN se define como:

∑−

=

∆=1

0

)(21

),(pN

k

kyxpoincareπ

Donde,

),(),()(

.),(2

)(),(

2)(),(

)(

mod)1(mod)1( kkNkNk yxyxk

contrariolodek

ksik

ksik

k

ppθθδ

δπ

πδδπ

πδδ

−=

−≤+

<

=∆

++

Se recorre de 0 a pN en el sentido de las manecillas del reloj. pN es 4 así:

Page 54: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

45

),(),(),(

),(),(

2233

1100

yxyxyx

yxyx

−−−

Una vez se tiene el índice poincare en el campo de direcciones, es necesario remover algunos núcleos “falsos”. Primero con el método de cluster vecino mas cercano se remueven los falsos. Esto es eliminar aquellos “núcleos” que se encuentren dentro de un radio cercano de 3 puntos de un núcleo. Esto depende de cómo se recorra el campo de direcciones pero los diferentes resultados producto de diferentes recorridos son muy parecidos ya que el núcleo y sus vecinos tienen un índice poincare de 0.5. Este método no debe ser muy ambicioso ya que solo pretende tener un punto de referencia para centrar el mapa de direcciones y no encontrar el núcleo verdadero de la huella.

Para la normalización se desplaza el núcleo a 3 puntos encima del centro geométrico del mapa, ya que hay huellas cuyo delta se encuentra muy por debajo del núcleo. Si la huella se normalizara con el centro, es muy posible que se pierda información. Para la normalización es necesario contar con las siguientes reglas:

1. Si no hay núcleos la huella no se normaliza ya que se parte de la hipótesis de que la huella es una clase arco y la segmentación tuvo un buen resultado.

Ilustración 35. Mapa de direcciones con dos núcleos y su normalización.

2. Si hay dos núcleos su centro geométrico es el núcleo verdadero. Es muy probable que este caso ocurra en la clase espiral ya que este tipo de huellas tienden a tener dos núcleos lo bastante separados como para no ser eliminados en la primera etapa donde se intenta eliminar aquellos núcleos falsos.

Page 55: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

46

Ilustración 36. Mapa de direcciones con núcleo falso y su incorrecta normalización.

3. Si hay más de dos núcleos el centro geométrico de los dos primeros núcleos encontrados es el verdadero núcleo. Este es un caso muy común que ocurre cuando un mapa de direcciones se calcula de una huella de mala calidad o con escritura en la imagen. El mapa de direcciones no tiene un patrón suave y es muy probable que tenga muchos puntos donde el índice poincare es 0.5 lo que significaría que el punto es un núcleo cuando realmente es producto de ruido.

El método antes descrito es muy útil para normalizar el mapa de direcciones. Cualquier error es producto de una mala segmentación, una huella de mala calidad o una imagen con mucho ruido. Una vez se tiene la imagen normalizada, se puede continuar con al análisis de componentes principales.

4.2.2 Matriz de Transformación

El análisis de componentes principales es un método estadístico para determinar una matriz de transformación lineal óptima )( nmW nm <ℜ∈ × tal que dado un vector de entrada 1×ℜ∈ nx con media 0, los datos en x pueden ser comprimidos de acuerdo a

Wxy =

donde 1×ℜ∈ my . A través de la matriz de transformaciónW , el análisis de componentes principales proyecta los datos de entrada del espacio vectorial original n-dimensional en un espacio de salida m-dimensional a través de la matriz W , donde normalmente nm << (Haykin, 1999).

Page 56: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

47

Teniendo la matrizW , se puede calcular el análisis de componentes principales del vector formado por el mapa de direcciones que es 960-dimensional. Los componentes formados al multiplicar el vector de entrada por la matriz de transformación están ordenados en orden decreciente de acuerdo a su varianza, es por esta razón que si por ejemplo se quieren tomar los primeros 80 componentes de x , se toman los primeros 80 componentes de y . La matriz W es de 960960× y es esta matriz la que se utilizará en un futuro para utilizar el sistema de clasificación que se ha estado construyendo. Mas adelante se determinará cuál es el número óptimo de componentes principales para ser utilizados por la red neuronal clasificadora y la matriz W será de 960×n donde

.960<n

Para calcular la matriz de transformación W es necesario conocer la matriz de covarianza ya que cada fila de W está compuesta por sus valores propios. Esta matriz de covarianza no es conocida pero puede ser estimada con un conjunto de vectores x de entrada5, así que se tomaron 3000 campos de direcciones (se tienen 6750), se formo un vector 960-dimensional con cada uno y se le quitó la media a cada vector (es necesario para el análisis de componentes principales) para calcular la matriz de transformación W . Ya que se tiene W , se hace el análisis de componentes principales a cada uno de los 6750 vectores 960-dimensionales producto de los mapas de direcciones. Se pasó del espacio de datos al espacio de características en cada vector. Ahora si se puede continuar con el diseño de las redes neuronales con el objetivo de la clasificación de huellas dactilares.

El análisis de componentes principales es un área bastante interesante y lo que se ha dicho solo pretende dar una idea de lo que se hizo en este trabajo. Para poder profundizar en el análisis de componentes principales se recomienda Haykin (1999) o Kostanic y Ham (2001).

4.3 Backpropagation

Se implementó un perceptrón multicapa que se entrenó con el algoritmo de aprendizaje backpropagation. Experimentalmente se determinó el número de neuronas ocultas y de entrada siguiendo la metodología de Wilson, Candela y Watson (1993) donde se comienza con 32 neuronas de entrada y se van aumentando 16 hasta llegar a 96 para evaluar la arquitectura óptima de la red. La red tiene 6 neuronas de salida; 5 para la clase de Henry y la 1 para la accidental que en el segundo volumen de la base de datos NIST-14 tiene la etiqueta S de scar. 5 MATLAB 6.1, Neural Network Toolbox. Función prepca.

Page 57: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

48

Como se puede ver en la siguiente tabla, la óptima arquitectura de la red tiene 80 neuronas de entrada, 64 en la capa oculta y las 6 neuronas de salida.

CAPA OCULTA

32 48 64 80 96

32 23.23% 19.09% 18.80% 19.52% 19.01%

48 18.36% 19.09% 19.23% 18.69% 18.69%

64 20.00% 19.09% 18.87% 18.90% 18.54%

80 20.32% 19.05% 17.70% 18.72% 18.76%

CA

PA D

E E

NT

RA

DA

96 21.34% 21.05% 19.12% 18.43% 18.36%

Tabla 3. Resultados en la determinación de la arquitectura de red.

La función tangente hiperbólica6 fue utilizada como función de activación para todas las neuronas. Se ha probado que el desempeño de una red no depende mucho de las funciones de activación siempre y cuando estas sean no lineales (Ham & Kostanic, 2001, p. 111). La función tangente hiperbólica es antisimétrica, esta elección es uno de los consejos de Haykin (1999) para que el algoritmo de aprendizaje backpropagation funcione mejor. Otros de los consejos de Haykin que se tuvieron en cuenta en los experimentos son:

- Valores de respuesta dentro del rango de activación. Los límites superiores e inferiores de la función de activación utilizada son 1 y -1. En la etapa de entrenamiento se usaron valores de activación de 0.8 para las neuronas que debían ganar y -0.8 para las neuronas que debían inhibirse.

- Parámetros de aprendizaje variables. Para los experimento se inicializaron todos los parámetros de aprendizaje a el valor nominal 0.01 y se fueron modificando por cada época de entrenamiento7.

6 MATLAB 6.1. Función tansig.

7 Matlab &.1, Neural Network Toolbox. Función traingda.

Page 58: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

49

- Valores de inicialización para los pesos sinápticos ni muy altos ni muy bajos. Se utilizó el algoritmo de inicialización Nguyen y Widrow8, que ha demostrado mejorar la velocidad de entrenamiento de la red (Nguyen & Widrow, 1990).

Para el experimento de arquitectura de red se entrenó la red con 50 épocas, con las primeras 4.000 huellas para entrenar la red y las 2.750 restantes para probarlas. Después se entrenó la red con la mejor arquitectura (80 neuronas de entrada, 64 ocultas y 6 de salida) con diferente número de épocas.

Tamaño del Conjunto de Entrenamiento

Número de Épocas Error en la Clasificación

4000

4000

4000

4000

4000

50

100

500

1.000

1.500

17,70%

16,69%

14,58%

15,78%

15,3%

Tabla 4. Determinación del Numero Optimo de Épocas en la Etapa de Entrenamiento.

Con 500 épocas se obtuvo un error en la clasificación de 14,58%. Incrementando el número de épocas la clasificación no mejoro aunque el cuadrado del error medio bajo. A partir de las 500 épocas la red perdió la capacidad de generalizar, pasa a aprenderse los ejemplares y cuando se presentan huellas que nunca ha visto (las 2.750 que se utilizaron para probarla) el error es alto.

8 Matlab 6.1, Neural Network Toolbox. Función initnw.

Page 59: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

50

Ilustración 37. Desempeño de la Red con diferente Número de Épocas en el Entrenamiento.

Page 60: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

51

En el entrenamiento con 1500 épocas se observa como el algoritmo de aprendizaje backpropagation se acerca al mínimo error de una manera suave, aspecto que no es observable en el entrenamiento con 100 épocas. Este aspecto esta directamente relacionado con el método para actualizar la tasa de aprendizaje de la red; al principio se observan cambios bruscos para intentar minimizar el error rápidamente pero después la red se estabiliza.

Ilustración 38. Errores en la clasificación de la red entrenada con backpropagation.

Como era de esperarse, la red clasificó mal aquellas huellas de mala calidad que no fueron correctamente representadas por el mapa de direcciones o cuya segmentación es completamente errónea. Aquellas huellas que pertenecían a la clase accidental fueron mal clasificadas por que no están definidas y la red no sabe como manejarlas. Esto significa que la 6 neurona de salida puede ser innecesaria o inútil. Una huella que es lado izquierdo pero que tiene una porción dañada se

Page 61: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

52

clasifica como accidental, sin embargo la red logra clasificarla como lado izquierdo pero significa una incorrecta clasificación. Este error se deriva de la suavización del mapa de direcciones donde se generaliza a una huella de clase lado izquierdo

Para mejorar el desempeño de la red, se rechazan aquellas huellas dactilares que presentan ambigüedad para la red. Esta ambigüedad se define por la diferencia entre los valores de activación entre la neurona ganadora y la neurona con el segundo mayor valor de activación. El objetivo es rechazar el 10% de las huellas y determinar el nivel máximo de ambigüedad permitido por la red al clasificar una red neuronal.

Diferencia # de Huellas 0,1 86 0,2 153 0,3 219 0,4 309 0,5 372 0,6 438 0,31 227 0,32 240 0,33 247 0,34 256 0,35 268 0,36 277 0,37 286 0,38 293 0,39 303 0,351 269 0,352 271 0,353 272 0,354 273 0,355 273 0,356 274 0,357 275 0,358 276 0,359 276

Tabla 5. Determinación experimental del valor de ambigüedad en la red para el 10% de las huellas.

Para determinar el nivel de ambigüedad se utilizaron las 2.750 huellas utilizadas para probar la red. Como se puede ver en la tabla 5, hay una diferencia de 0,357

Page 62: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

53

entre la neurona ganadora y la neurona con el segundo mayor valor de activación con 275 huellas de las 2.750 huellas que se utilizaron para evaluar el desempeño de la red. Es así que se determina el nivel límite de diferencia para asegurarse de que no haya ambigüedad al clasificar una huella. Si la red no se compromete con estas 275 huellas, está rechazando aquel 10% que presenta ambigüedad en la clasificación y que puede llevar a errores en la clasificación.

Ilustración 39. Huellas que presentan ambigüedad para la red.

Se logra un error en la clasificación de 9,56% rechazando huellas. Esto representa una mejora del 5,02% a la clasificación sin rechazar huellas. El 36,77% de las huellas que fueron mal clasificadas por la red son rechazadas en la segunda etapa, es decir que el 63,22% de las huellas mal clasificadas no presentan ambigüedad para la red, la red se equivoca completamente en este grupo. El 0,44% de las huellas rechazadas en la segunda etapa fueron bien clasificadas por la red pero presentaban ambigüedad para la misma.

Page 63: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

54

Ilustración 40. Huellas mal clasificadas por la red que no son rechazadas.

Las huellas que fueron mal clasificadas y que no son rechazadas por la red dependen de la segmentación y de la calidad de las huellas. Una mala segmentación puede ser clasificada en cualquier clase por la red y el error se espera, sin embargo una huella bien segmentada que no tiene la suficiente calidad para que su mapa de direcciones sea correctamente calculado es mal clasificada por la red. Este último caso ocurre más que todo con arcos tendidos cuyo núcleo no está definido en su mapa de direcciones o en lados derechos o izquierdos cuyo núcleo está muy cerca del delta de tal forma que al suavizar el mapa de direcciones, estos se pierden y por tal razón son incorrectamente clasificados (en un arco , por ejemplo).

Es en esta segunda etapa donde un preprocesamiento de la imagen de la huella serviría para mejorar el desempeño de la red. En las huellas bien segmentadas, el preprocesamiento arreglaría la calidad de la imagen y los patrones que definen cada clase de Henry se diferenciarían unos de otros y la red no presentaría ambigüedad en la clasificación mejorando el desempeño de la red.

4.4 Self-Organizing Map

El aprendizaje no supervisado de la red significa que no se tiene un parámetro con el cuál se puede evaluar el desempeño de la red como si se tuvo con el perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation (Ej. las 5 clases de Henry). La tarea consiste en intentar averiguar cual fue la partición que hizo la red del universo de huellas.

Page 64: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

55

Se implementó una red SOM con 80 neuronas de entrada y 6 neuronas de salida. Las 80 neuronas de entrada es el mismo número que se utilizó para el perceptrón multicapa con el que se obtuvieron los mejores resultados y las 6 neuronas de salidas corresponden a las clases en las que se pueden dividir el universo: las 5 clases de Henry mas la clase accidental. Como se pudo observar con el perceptrón multicapa, la sexta neurona no sirvió para nada ya que la clase accidental no está definida, lo que significa que las huellas representadas por las 5 clases de Henry serán “divididas” en 6 grupos.

Para la fase de entrenamiento se utilizaron las mismas 4000 huellas que se utilizaron en el entrenamiento del perceptrón multicapa junto con el análisis de componentes principales que también se utilizó en la misma red. La función de distancia utilizada fue la distancia Euclidiana9 y la topología hexagonal10 de 2 dimensiones. Siguiendo la metodología propuesta por Haykin (p. 452, 1999), en la fase de ordenamiento la tasa de aprendizaje se inicializa en 0,1 y en 1.000 el número de pasos; para la fase de convergencia el parámetro de aprendizaje se inicializa en 0,01.

En la siguiente ilustración se muestran los vectores posiciones del universo de huellas y de las 6 neuronas de salida (las 2 primeras dimensiones). Después de 2.000 iteraciones las neuronas de salida no parecen cambiar de posición por lo que se puede afirmar que después de 2.000 iteraciones la red parece converger.

Ilustración 41. Convergencia de la SOM.

9 Matlab 6.1, Neural Network Toolbox. Función dist.

10 Matlab 6.1, Neural Network Toolbox. Función randtop.

Page 65: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

56

Una vez la red converge, se prueba la red con las 2.750 huellas para ver como clasificó el universo de huellas. La siguiente ilustración muestra los clusters formados por la red, estos están bien definidos aunque parezca que en algunos casos se sobrepongan, vale la pena recordar que solo se muestran las 2 primeras dimensiones de las huellas y de la red.

Ilustración 42. Clusters SOM.

Si se observa la misma gráfica de la red con las huellas diferenciadas de acuerdo a su clase, se puede ver que los clusters encontrados por la SOM no corresponden a los grupos formados por las huellas. Observando las dos gráficas se puede prever que la clasificación de la SOM no tenga el mismo éxito que tuvo el perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation diferenciando cada huella de acuerdo a su clase de Henry. Lo único que se puede

Page 66: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

57

hacer a partir de aquí es intentar entender como clasificó la red SOM cada una de las huellas.

Ilustración 43. Vectores Peso con Las Clases de Huellas.

La tabla 6 confirma que la red no clasificó cada huella de acuerdo a su clase de Henry. De hecho hay muchas ambigüedades para huellas de una misma clase; por ejemplo, las neuronas de salida 4 y 5 tienen porcentajes de respuesta muy parecidos cuando se les presentan huellas de arco. Algo parecido ocurre con las neuronas de salida 4, 5 y 6 con las huellas de arco tendido.

Page 67: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

58

NEURONAS DE SALIDA

1 2 3 4 5 6

Lados Derechos

9,18% 18,77% 9,18% 29,94% 13,93% 18,97%

Lados Izquierdos

9,43% 17,08% 9,63% 12,51% 34,16% 17,17%

Espirales 42,98% 11,51% 9,17% 7,55% 24,10% 4,67%

Arcos 1,11% 5,55% 4,44% 28,88% 26,66% 33,33%

Arcos Tendidos

6,02% 16,86% 3,61% 28,91% 20,48% 24,09%

Accidentales 0% 0% 0% 50% 50% 0%

Tabla 6. Clasificación de la SOM de acuerdo a las 5 clases de Henry mas la clase Accidental.

La siguiente ilustración muestra aquellas huellas nunca antes vistas por la red con mejor respuesta (menor norma Euclidiana) a cada neurona de salida con sus distancias entre ellas. Todas las huellas tienen buena calidad y se puede ver que hay 4 neuronas con huellas de clase lado derecho muy cercanas entre sí, también hay un lado izquierdo y un espiral, los arcos y los arcos tendidos no aparecieron.

Page 68: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

59

Ilustración 44. Huellas más cercanas a cada neurona de salida.

Hay varios aspectos para resaltar de la anterior ilustración:

- Los 4 lados derechos son muy diferentes. Estas diferencias se notan entre los puntos singulares de las huellas. A excepción de las huellas lado derecho de las neuronas 6 y 4, la distancia geométrica entre el delta y el núcleo es muy diferente, siendo menor en la de la segunda neurona, mayor en la de la tercera y media en la de la cuarta y de la sexta.

- En los lados derechos de la cuarta y sexta neurona la distancia geométrica entre el núcleo y el delta es muy parecida pero la distancia horizontal es muy diferente siendo mayor en la huella lado derecho de la 4 neurona.

Page 69: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

60

- La distancia horizontal entre el delta y el núcleo diferencia las 4 huellas lado derecho: es mayor en la huella de la segunda neurona y va creciendo hasta la sexta neurona. Esto también se puede ver como el ángulo formado por el delta y el núcleo de cada huella lado derecho: menor en la de la segunda neurona y va creciendo hasta el máximo que es el de la sexta neurona.

Ilustración 45. Diferencias en los puntos singulares de las huella lado derechos de cada neurona.

Las anteriores observaciones llevan a pensar que la red ha subclasificado las huellas dactilares. Una de las propiedades de las redes SOM es que extraen características estadísticas de los datos, esto no puede visualizarse fácilmente pero se puede observar que la red ha extraído características estadísticas que diferencian huellas que pertenecen a una misma clase de Henry pero que la red SOM reconoce como diferentes.

Page 70: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

61

En la siguiente ilustración se muestran las huellas de cada clase con la mejor respuesta en cada neurona activada y se muestra con una línea blanca la conexión entre los núcleos y los deltas de cada huella.

Ilustración 46. Huellas con mejor respuesta por neurona de acuerdo a su clase.

La SOM pudo extraer las características que diferenciaban a las huellas pertenecientes a una misma clase. Para las huellas pertenecientes a la clase lado izquierdo, se observa que la línea que une el núcleo y el delta de las neuronas uno y cinco son muy parecidas, sin embargo las demás son claramente diferentes (ángulo y longitud). Con este se puede intuir que la red SOM dividió las clases lado izquierdo en cinco grupos. De manera análoga dividió en cuatro grupos las huellas lado derecho, en seis las espirales y los arcos tendidos. Los triángulos formados por los deltas y el núcleo de las espirales son muy diferentes para cada neurona.

Page 71: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

62

Los arcos no tienen núcleo o delta pero analizando los arcos de las neuronas uno y cinco (tienen la mayor distancia entre ellas) se puede observar que el arco de la neurona cinco es casi horizontal y el de la neurona uno tiene una curvatura pronunciada. Con esto en mente se puede ver que la red dividió los arcos en dos grupos: los casi horizontales y los curveados. Finalmente un vistazo a las huellas de clase accidental explica su ambigüedad. La huella accidental de la cuarta neurona parece una huella lado izquierdo y es muy parecida a la huella lado izquierdo de la cuarta neurona.

No es sorprendente que la red SOM no hubiese clasificado las huellas de acuerdo a su clase. La red SOM extrajo las características de cada huella de una misma clase que la diferenciaba de las demás. La red SOM ha sido utilizada para extraer las características de los mapas de direcciones (Halici & Ongun, 1996), en vez de utilizar el método de análisis de componentes principales del capítulo 3, usan una red PCA-SOM que se encarga del mismo objetivo: reducir dimensionalidad extrayendo las características fundamentales.

Los resultados obtenidos en la tabla 6 demuestran que la red SOM no funciona para clasificar una huella nunca antes vista por la red en una de las clases de Henry. La red SOM es útil si se observa como un complemento al perceptrón multicapa como método de subclasificación aunque no es del todo despreciable la clasificación que hizo la red de cada huella aunque esta no haya sido en las clases de Henry.

Page 72: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

63

C a p í t u l o 5

CONCLUSIONES

El siguiente diagrama representa el trabajo realizado:

Ilustración 47. Secuencia.

Page 73: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

64

A partir del mapa de direcciones los procesos son bastante confiables. Los errores se derivan de la calidad de la imagen y de la segmentación. El primer paso en la segmentación es crucial y es cuando se intenta diferenciar la huella del fondo lo que puede llevar a errores en la segmentación. Implementando una rutina que aclare el fondo y oscurezca la huella sin cambiar la imagen y utilizar la rutina de segmentación ya implementada puede mejorar los resultados obtenidos. También se podría mejorar la segmentación añadiendo decisiones basadas en cálculos de la textura de la imagen de huella dactilar (Bazen & Gerez, s.f.). La rutina de segmentación implementada asume que la huella es aquel grupo de píxeles oscuros que pertenecen al grupo conectado más grande. Este acercamiento puede ser muy básico y realmente no se pueden estar explotando toda la información que ya se conoce de la imagen de una huella dactilar.

En cualquier sistema biométrico de huella dactilar es necesario contar con un método orientado a mejorar la huella dactilar. Este paso es primordial porque la verificación de un individuo con base en su huella dactilar utiliza la posición y la orientación de las minucias. Los métodos propuestos para obtener una imagen cuya calidad sea lo suficientemente confiable para detectar las minucias son muy sofisticados (Jain, Halici, Hayashi, Lee & Tsutsui, 1999) y normalmente tienen una carga computacional muy alta. La clasificación puede aprovechar este método necesario que no se implementó en este trabajo. Vale la pena destacar que en el trabajo de Watson, Candela y Grother (1994), se implementó un método para mejorar la calidad de la huella dactilar utilizando filtros con la transformada Fourier y solo obtuvieron una mejora en la tasa de error en la clasificación del 4%. La mejora de la imagen de huella dactilar no va a brindar resultados espectaculares en la clasificación pero si va a robustecerla.

Si se implementan las rutinas orientadas a mejorar la segmentación y la calidad de la imagen los parámetros del experimento de clasificación podrían variar. Por ejemplo el valor con el cual la red rechaza huellas podría crecer ya que la ambigüedad entre huellas no es tan imperceptible para la red, en el caso de perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation.

En el caso del perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation se lograron unos resultados aceptables teniendo en cuenta que no se trato la imagen con el fin de mejorar su calidad. El modelo fue correcto. Sin embargo el proceso de aprendizaje de la red fue exageradamente largo. Entrenando la red con las 500 épocas tomó alrededor de 1 hora. Experimentos parecidos se hicieron varias veces para determinar la arquitectura óptima de la red. Así que un gran problema fue el de la capacidad computacional. El mismo problema ocurrió para la red SOM. Para que la red convergiera después de 5.000 iteraciones fueron necesarias 12 horas. Esta es una de las grandes desventajas en

Page 74: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

65

el trabajo he inevitablemente lleva a cuestionar la utilización de redes neuronales. Hay métodos que clasifican huellas utilizando los puntos de singularidad (Karu & Jain, 1996), (Ratha, Karu, Shaoyun & Jain, 1996) y son mucho mas simples que los métodos con redes neuronales, aunque el procesamiento es un poco diferente para que estos sean confiables.

Con la red SOM se encontró que se subclasificaron las huellas. En los AFIS la subclasificación es igual de importante a la clasificación para agrupar las huellas mas parecidas y guardar estas huellas en varias bases de datos. Normalmente la subclasificación se lleva a cabo contando el número de surcos entre el núcleo y el delta para los lados derechos e izquierdos y para los espirales se siguen los surcos que conectan los deltas. Esta subclasificación está definida por el FBI (Jain, Halici, Hayashi, Lee & Tsutsui, 1999, pp. 115-118). La subclasificación hecha por la red SOM no es comparable con la del FBI pero si es para tener en cuenta como una opción.

Los resultados obtenidos con el perceptrón multicapa entrenado con el algoritmo de aprendizaje backpropagation fueron buenos. La tasa de error de 14,58% es comparable con los resultados que se observan en la tabla 2. Se mejoran los resultados de Pal y Mitra (1996) que lograron una tasa de error de 18% y de Watson, Candela y Grother (1994) que lograron una tasa de error de 18,91% sin rechazar huellas y sin mejorar la imagen.

Finalmente un sistema de clasificación robusto debe utilizar varios mecanismos, no solo las redes neuronales. El utilizar varios mecanismos ayuda a minimizar las tasas de error. No hay que olvidar que un AFIS que no encuentre una huella por error en la clasificación sería prácticamente inservible.

5.1 Trabajo Futuro

Todo este trabajo hace referencia a una de las partes que componen un AFIS. Así que el diseño e implementación de un AFIS es el trabajo a realizar mas grande posible.

Para la parte de clasificación se pueden implementar métodos que mejoren los resultados obtenidos en este trabajo. Este trabajo se concentro en el diseño así que es necesario optimizar cada algoritmo para después ser implementado con la mejor arquitectura de software posible.

En el trabajo de Watson, Candela y Grother (1994) se mejoraron los resultados no solamente con el mejoramiento de la imagen, también se calcularon

Page 75: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

66

direcciones cuyo espaciado no era parejo dando mas importancia a las direcciones de ciertas áreas predefinidas de la huella dactilar. Este es un ejemplo de cómo se pueden mejorar los resultados explorando nuevas técnicas no orientadas a mejorar la imagen. Sin embargo, es necesario proponer métodos orientados a mejorar la imagen. Esta parte se puede extender a la identificación de cada huella, y el diseño e implementación de esta parte es un largo camino por recorrer.

Page 76: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

67

BIBLIOGRAFÍA

Ashbourn, J. (2002). Biometrics: Advanced Identity Verificaction. Springer. Balde, P., & Chauvin, Y. (1993). “Neural Networks for Fingerprint Recognition,” Neural Network, 5, pp. 402-418. Bazen, A. & Gerez, S. (s.f.). Segmentation of Fingerprint Images. University of Twente, Department of Electrical Engineering, Laboratory of Signals and Systems. Biometrics Research at Michigan State University. Department of Computer Science And Engineering, Michigan State University (s. f.). Web site mantenido por Arun Ross y Anil Jain. http://biometrics.cse.msu.edu/ Blue, J.L., Candela, G.T., Grother, P.J., Chellapna, R. & Wilson, C.L. (1994), “Evaluation of Pattern Classifiers for Fingerprint and OCR Applications,” Pattern Recognition, 27(4), pp. 485-501. Boher, J., Bazen, A. & Gerez S. (s. f.). Indexing Fingerprint Databases Based on Multiple Features. University of Twente, Department of Electrical Engineering, Laboratory of Signals and Systems. Ham, F. & Kostanic, I. (2001). Principles of Neurocomputing for Science and Engineer. McGraw Hill. Haykin, S. (1999). Neural Networks - A Comprehensive Foundation. Upper Saddle River, New Jersey: Prentice Hall. Hong, L., Wan, Y. & Jain, A. (1998). Fingerprint Image Enhancement: Algorithm and performance Evaluation. Pattern Recognition and Image Processing Laboratory, Department of Computer Science. Michigan State University. Hung, D., Huang, C. & Cheng, J. (s. f.). Detecting Fingerprint Singular Points by a Hierarchical Model. Computer Vision Lab, Department of Computer and Information Science, New Jersey Institute of Technology. Jain, A., Hong, L., Pankanti, S. & Bolle, R. (1997). An IdentityAuthentication System Using Fingerprints, Proceedings of the IEEE, Vol. 85, No. 9, pp. 1365-1388. Recuperado el 09 de enero de 2003 de

Page 77: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

68

http://citeseer.nj.nec.com/jain97identity.html. Jain, L. C., Halici, U., Hayashi, I., Lee, S.B., & Tsutsui, S. (1999). Intelligent Biometric Techniques in Fingerprint and Face Recognition (1ra Ed.). Estados Unidos: The CRC Press International Series on Computational Intelligence. Jain, A. & Pankanti, S. (s. f.). Automated Fingerprint Identification and Imaging Systems. Jain, A. & Pankanti, S. (s. f.). Fingerprint Classification and Matching. Karu, K. & Jain, A.K. (1996), “Fingerprint Classification,” Pattern Recognition, 29(3), pp. 389-403. Lee, H.C. & Gaenssley, R.E. (1991). Advances in Fingerprint Technology, Nueva York, Elsevier. MATLAB 6.1. Online Documentation, Release 13. Image Processing Toolbox Documentation. The Mathworks, Inc. Recuperado el 20 de marzo de 2003, de http://www.mathworks.com/access/helpdesk/help/toolbox/images/images.shtml MATLAB 6.1. Online Documentation, Release 13. Neural Network Toolbox Documentation. The Mathworks, Inc. Recuperado el 20 de marzo de 2003, de http://www.mathworks.com/access/helpdesk/help/toolbox/nnet/nnet.shtml MATLAB 6.1. Online Documentation, Release 13. The Mathworks, Inc. Recuperado el 20 de marzo de 2003, de http://www.mathworks.com/access/helpdesk/help/helpdesk.shtml Nguyen, D. & Widrow, B. (1990). “Improving the Learning Speed of the 2- Layer Neural Networks by Choosing Initial Values of Adaptive Weights,” Proceedings of the International Joint Conference on Neural Networks, vol. 3, 1990, pp. 21-26. NIST-14 Fingerprint Database. National Institute of Standards and Technology. http://www.nist.gov/srd/nistsd14.htm Prabhakar, S. (2001). Fingerprint Classification and Matching Using a Filterbank. Michigan State University, Computer Science & Engineering.

Page 78: CLASIFICACIÓN DE HUELLAS DACTILARES CON REDES …

ISC-2003-1-5

69

Ritter, G. & Wilson, J. (2000). Handbook of Computer Vision Algorithms in Image Algebra. CRC Press. Seul, M., O´Gorman, L. & Sammon, M. (2000). Practical Algorithms for Image Analysis. Cambridge University Press. Srinivasan, V.S., & Murthy. N.N. (1992), “Detection of Singularity Points in Fingerprints Images,” Pattern Recognition, 25, pp. 139-153. Vizcaya, P.R. & Gerhart, L.A. (1996). “A Non-Linear Orientation Model for Global Description of Fingerprints,” Pattern Recognition, 29(7), pp. 1221-1231. Watson, C. I., Candela, G. T. & Grother, P. J. (1994). Comparison of FFT Fingerprint Filtering Methods for Neural Network Classification. U. S. Department of Commerce. Technology Administration, National Institute of Standards and Technology – Advanced Systems Division. Wilson, C, Candela, G. & Watson, C. (1993). Neural Network Fingerprint Classification. National Institute of Standards and Technology, Advanced Systems Division, Image Recognition Group. Zhang, Q., Huang, K. & Yan, H. (s.f.). Fingerprint Classification Based on Extraction and Analysis of Singularities and Pseudoridges. School of Electrical and Information Engineering University of Sydney, Australia.