10
Reconocimiento de caracteres manuscritos a partir de se˜ nales EMG usando redes neuronales convolucionales y recurrentes de Elman Jos´ e Guadalupe Beltr´ an-Hern´ andez, Jos´ e Ruiz-Pinales, Pedro L´ opez-Rodr´ ıguez, Jos´ e Luis L´ opez-Ram´ ırez Universidad de Guanajuato, Divisi´ on de Ingenier´ ıas, Departamento de Ingenier´ ıa Electr´ onica, exico {jg.beltranhernandez, pinales, p.lopez.rodriguez, jl.lopezramirez}@ugto.mx Resumen. Hoy en d´ ıa la tecnolog´ ıa est´ a presente en todos los ´ ambitos de la vida diaria, y la escritura es sin duda un medio muy importante de comunicaci´ on. Adem´ as, la escritura y la lectura juegan un papel importante en el desarrollo cognitivo de los ni˜ nos, tanto as´ ı que ´ estas determinan su posterior ´ exito acad´ emico. Este documento presenta una nueva metodolog´ ıa para el reconocimiento de caracteres manuscritos. La metodolog´ ıa propuesta consiste en el uso de un brazalete Myo para capturar las se˜ nales EMG que se generan durante el proceso de escritura y el uso de redes neuronales convolucionales y redes recurrentes para el procesamiento y reconocimiento de caracteres. Los resultados usando una base de datos propietaria grande muestran un porcentaje de aciertos promedio de 94.92 %. Palabras clave: Se˜ nales electromiogr´ aficas, aprendizaje profundo, re- des neuronales convolucionales, redes de Elman. Handwritten Character Recognition from EMG Signals using Convolutional and Elman Neural Networks Abstract. Nowadays, technology is present in almost every aspect of our lives. Reading and writing continue to be an important means of communication. Besides that, they play en important role in the cognitive development of children and later on determine their academic success. This paper presents a new methodology for the recognition of handwriting. The poposed methodology consists in using a Myo armband to capture the EMG signals generated during the writing process and the use of Convolutional Neural Networks and Elman Networks for processing and recognizing characters. The results using a large propietary database show an average accuracy of 94.92 %. 659 ISSN 1870-4069 Research in Computing Science 149(8), 2020 pp. 659–668

Reconocimiento de caracteres manuscritos a partir de

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Reconocimiento de caracteres manuscritos a partir de

Reconocimiento de caracteres manuscritos apartir de senales EMG usando redes neuronales

convolucionales y recurrentes de Elman

Jose Guadalupe Beltran-Hernandez, Jose Ruiz-Pinales,Pedro Lopez-Rodrıguez, Jose Luis Lopez-Ramırez

Universidad de Guanajuato, Division de Ingenierıas,Departamento de Ingenierıa Electronica,

Mexico

{jg.beltranhernandez, pinales, p.lopez.rodriguez,

jl.lopezramirez}@ugto.mx

Resumen. Hoy en dıa la tecnologıa esta presente en todos los ambitosde la vida diaria, y la escritura es sin duda un medio muy importantede comunicacion. Ademas, la escritura y la lectura juegan un papelimportante en el desarrollo cognitivo de los ninos, tanto ası que estasdeterminan su posterior exito academico. Este documento presenta unanueva metodologıa para el reconocimiento de caracteres manuscritos.La metodologıa propuesta consiste en el uso de un brazalete Myo paracapturar las senales EMG que se generan durante el proceso de escrituray el uso de redes neuronales convolucionales y redes recurrentes parael procesamiento y reconocimiento de caracteres. Los resultados usandouna base de datos propietaria grande muestran un porcentaje de aciertospromedio de 94.92 %.

Palabras clave: Senales electromiograficas, aprendizaje profundo, re-des neuronales convolucionales, redes de Elman.

Handwritten Character Recognition from EMGSignals using Convolutional and Elman Neural

Networks

Abstract. Nowadays, technology is present in almost every aspectof our lives. Reading and writing continue to be an important meansof communication. Besides that, they play en important role in thecognitive development of children and later on determine their academicsuccess. This paper presents a new methodology for the recognitionof handwriting. The poposed methodology consists in using a Myoarmband to capture the EMG signals generated during the writingprocess and the use of Convolutional Neural Networks and ElmanNetworks for processing and recognizing characters. The results using alarge propietary database show an average accuracy of 94.92 %.

659

ISSN 1870-4069

Research in Computing Science 149(8), 2020pp. 659–668

Page 2: Reconocimiento de caracteres manuscritos a partir de

Keywords: Electromyographic signals, deep learning, convolutionalneural networks, Elman networks.

1. Introduccion

La escritura y la lectura, son tareas complejas y habilidades importantespara los seres humanos. De hecho, existen estudios que han mostrado la impor-tancia de tales habilidades para el desarrollo cognitivo y el exito academicode los ninos [15]. Sin embargo, resulta que la escritura manuscrita a partirde senales bioelectricas ha sido poco abordada en el area de las interfaceshumano-computadora. Estas interfaces son importantes porque ofrecen unaalternativa en aplicaciones clınicas y de asistencia para las personas con o sindiscapacidades.

Ya se han logrado desarrollar algunas protesis neurales capaces de hacer losmismos movimientos que un brazo o una pierna humana. Incluso, ya existeninterfaces para juguetes y videojuegos que permiten el control por medio de lassenales bioelectricas de los usuarios. En particular, existen dispositivos comercia-les tales como el brazalete Myo que puede usarse para controlar presentaciones,vehıculos, etc.

Las senales bioelectricas tales como las senales EMG (electromiograficas),han sido aplicadas a la deteccion de trastornos neurologicos [10]. Por ejemplo,el analisis de patrones de escritura se ha utilizado para el diagnostico de laenfermedad de Parkinson y la disgrafıa en ninos.

En la literatura hay un cierto numero de publicaciones que tratan con lassenales EMG generadas por los musculos de las manos y los antebrazos durantela actividad de la escritura [14,6]. En general, el reconocimiento de la escrituraa partir de las senales EMG se han abordado utilizando diferentes enfoques:concordancia de plantillas [14], Dynamic Time Warping (DTW) [6,13], RedesNeuronales RBF [10]. Igualmente, la reconstruccion de la escritura a partir de lassenales EMG ha sido abordada usando: filtros de Wiener [14], mınimos cuadradosrecursivos [8], Redes Neuronales RBF [18], y filtros de Kalman [16].

Las senales EMG son biosenales complejas, cuya forma se ve afectada pormuchos factores externos ası como por propiedades de los musculos, la instru-mentacion que se utiliza para detectarlas, etc. La complejidad puede explicarsepor el simple hecho de que hay muchas maneras de realizar una tarea motora(fenomeno de redundancia motora) [16,4,1].

Siempre se ha sabido que las senales EMG contienen una gran cantidadde informacion sobre los movimientos de las extremidades del cuerpo humano.Aprovechando esta informacion, varias aplicaciones en la literatura han efec-tuado reconstruccion de movimientos de la escritura, modelado, simulacion demovimientos, reconocimiento de movimientos. Con respecto al reconocimientode caracteres existen muy pocas bases de datos. Sin embargo, muchos de losestudios imponen restricciones de diferentes tipos: colocacion de los electrodossobre musculos del antebrazo, numero y complejidad de los trazos manuscritos.

660

José Guadalupe Beltrán-Hernández, José Ruiz-Pinales, Pedro López-Rodriguez, et al.

Research in Computing Science 149(8), 2020 ISSN 1870-4069

Page 3: Reconocimiento de caracteres manuscritos a partir de

En nuestro caso, proponemos abordar el problema del reconocimiento de carac-teres manuscritos desde un punto de vista mas general. En lugar de imponerrestricciones, se utiliza una pulsera Myo en el antebrazo y el usuario puede usarsu estilo de la escritura. Para contrarrestar las variaciones de las senales EMG, sepropone el uso de redes neuronales convolucionales (CNN), para el procesamientoy extraccion de caracterısticas. Esto es debido a que se ha demostrado que lasCNN son excelentes para extraer caracterısticas directamente de los datos enbruto [3,12]. Para el procesamiento de las secuencias se propone el uso de redesrecurrentes (RNN) con funciones de activacion ReLU. Estas redes son menospesadas computacionalmente y tienen igual o mejor desempeno que otras redesmas recientes tales como las LSTM.

En la siguiente seccion se presenta una descripcion de los materiales ymetodos empleados durante este estudio. Finalmente, se presentan los resultadosy conclusiones.

2. Metodos y materiales

2.1. Materiales

A fin de validar nuestra metodologıa, se escogio una gran base de datos quecontiene senales EMG. Las senales EMG fueron capturadas por medio de unbrazalete Myo colocado en el antebrazo derecho de tres personas. El brazaleteMyo es un dispositivo comercial inalambrico de bajo costo, no invasivo, de 8canales, y tiene una frecuencia de muestreo de 200 Hz. La Fig. 1 muestra comose usa el dispositivo para capturar las senales EMG generadas al momento deescribir con el dedo sobre una pantalla.

-0.50

0.5

-0.50

0.5

-0.50

0.5

-0.50

0.5

-0.50

0.5

-0.50

0.5

-0.50

0.5

0 0.5 1 1.5 2-0.5

00.5

Filtering Sampling

Perform wri�ng task

8-channel capture

Database

Myo armband

Fig. 1. Diagrama del sistema de captura de las senales EMG.

Por lo tanto, contiene 3,000 capturas por clase. Cada captura comprende 8senales correspondientes a los 8 sensores del dispositivo. La Fig. 2 muestra unacaptura para la letra ’b’. En este caso particular, se puede observar mas actividaden los 4 primeros canales. En el caso general, el brazalete puede colocarse encualquier posicion, y los canales activos suelen ser diferentes.

661

Reconocimiento de caracteres manuscritos a partir de señales EMG usando redes neuronales...

Research in Computing Science 149(8), 2020ISSN 1870-4069

Page 4: Reconocimiento de caracteres manuscritos a partir de

0 0.5 1 1.5 2-0.5

0

0.5

0 0.5 1 1.5 2-0.5

0

0.5

0 0.5 1 1.5 2-0.5

0

0.5

0 0.5 1 1.5 2-0.5

0

0.5

0 0.5 1 1.5 2-0.5

0

0.5

0 0.5 1 1.5 2-0.5

0

0.5

0 0.5 1 1.5 2-0.5

0

0.5

0 0.5 1 1.5 2Time(s)

-0.5

0

0.5

Fig. 2. Ejemplo de una captura correspondiente a la letra ’b’. La parte superiorcorresponde al canal 0 y la parte inferior al canal 7.

2.2. Metodos

Redes Neuronales Convolucionales Una red neuronal convolucional (CNN),es una red neuronal estatica inspirada originalmente de hallazgos en neurocien-cias. En 1959, Hubel & Wiesel [7], propusieron un modelo jerarquico de redpara explicar el comportamiento de las celulas simples del gato. A partir deese modelo se propusieron varios otros modelos como el Neocognitron [2] quequizas constituye una de las primeras CNN, ya que usaba capas convolucionalesy capas de submuestreo. Otro modelo, el Cresceptron [21], utilizo por primeravez el mecanismo de max-pooling.

El modelo LeNet fue el primero en utilizar el algoritmo de retropropa-gacion [12]. Este modelo demostro que una CNN puede procesar la imagendirectamente sin ningun o poco preprocesamiento. Lo que abrio el camino parael desarrollo de las arquitecturas actuales de Deep Learning. Aunque el modeloLeNet-5 tuvo gran exito en el reconocimiento de dıgitos, su uso para tareas mascomplejas estaba muy limitado debido, por un lado, al poco poder de computodisponible en su epoca, y, por otro lado, a algunos problemas que presentabanlas CNNs de mayor profundidad (DCNN) [3].

Despues de varios anos, las CNN resurgieron exitosamente con el modeloAlexNet al ganar por primera vez un concurso internacional (ILVRC2012). Elmodelo AlexNet [9], tenıa una arquitectura mas profunda que el modelo LeNet-5,con capas mas grandes y nuevos avances como: funcion de activacion ReLU,metodos de inicializacion adHoc, mecanismo de regularizacion llamado Dropout,y mecanismo max-pooling.

662

José Guadalupe Beltrán-Hernández, José Ruiz-Pinales, Pedro López-Rodriguez, et al.

Research in Computing Science 149(8), 2020 ISSN 1870-4069

Page 5: Reconocimiento de caracteres manuscritos a partir de

El modelo ResNet [5], quien gano algunos anos despues el mismo concurso(ILSVRC2015), era mucho mas profunda que el modelo AlexNet, e incorporoinnovaciones como el bloque residual, y capas batch-normalization.

Redes Neuronales Recurrentes Las redes Neuronales recurrentes (RNN)son un tipo de red neuronal dinamica capaz de procesar secuencias [17]. Laredes de Elman y Jordan constituyen algunas de las primeras redes recurrentes.Su caracterıstica principal es que tienen la capacidad de memorizar patronespor medio de la retroalimentacion de las neuronas. Su entrenamiento utiliza unalgoritmo llamado retropropagacion en el tiempo (BPTT). En realidad, la redrecurrente es desenvuelta en el tiempo dando lugar a una variante de red estaticacon pesos compartidos que se entrena usando el algoritmo de retropropagacion.Estas primeras redes recurrentes tuvieron un exito limitado debido a quepresentaban problemas para aprender secuencias largas (desvanecimiento delgradiente). Se podrıa decir que estas redes solo eran capaces de memoria decorto plazo. La Fig. 3 muestra una RNN y su desenvolvimiento en el tiempo.

UnfoldW W W

VVVV

U U U

W

o oi oi+1 oi+2

hi+2hi+1hi

U

v1 vmh1 hm

x ix x i+1 x i+2

Fig. 3. Arquitectura de una RNN y su desenvolvimiento en el tiempo.

Las redes recurrentes LSTM (Long Sort-Term Memory) fueron las primerasen incorporar la capacidad de memoria de largo plazo ya que no presentaban masel problema del desvanecimiento del gradiente. Una red LSTM esta compuestade unidades de memoria, con la capacidad de decidir cuando recordar, olvidar yadquirir informacion. La operacion de una unidad LSTM esta controlada por trescompuertas multiplicadoras: una para olvidar, otra para adquirir informacion yotra para dar salida al estado de la celda de memoria. El problema de las redesLSTM es que contienen mucho mas parametros que sus predecesoras.

3. Metodologıa propuesta

En general, el reconocimiento de caracteres a partir de senales EMG se habasado en el pre-procesamiento, extraccion de caracterısticas, y clasificacion [14].

663

Reconocimiento de caracteres manuscritos a partir de señales EMG usando redes neuronales...

Research in Computing Science 149(8), 2020ISSN 1870-4069

Page 6: Reconocimiento de caracteres manuscritos a partir de

Sin embargo, existen metodos que se basan en el preprocesamiento, medida desimilitud usando DTW y clasificacion usando distancia Euclidiana. Por otrolado, la mayorıa de los estudios anteriores han sido realizados bajo condicionescontroladas de tal manera que se facilita la clasificacion de las senales EMG. Porejemplo, colocar cuidadosamente cada electrodo sobre cada musculo de la manoo antebrazo. Otras restricciones son que cada letra conste de un solo trazo y quelas letras sean de la misma forma.

En este trabajo, se propone una metodologıa mas general para el recono-cimiento de caracteres a partir de senales EMG. En particular, la escritura esmulti-usuario, sin restricciones en la forma del caracter y el numero de trazos.Ademas, en lugar de colocar electrodos sobre el brazo de los sujetos, se utilizaun brazalete Myo en el antebrazo. Para hacer frente a la problematica de lavariabilidad de las senales EMG, se usan capas convolucionales y max-poolingpara la extraccion de caracterısticas, IRNN para el procesamiento de la secuenciay una capa totalmente conectada para la clasificacion. La razon por la que seescogio una RNN es que son menos pesadas computacionalmente que otras redesmas recientes. Ademas, el problema del desvanecimiento gradiente se debe aluso sigmoides como funcion de activacion. Por lo tanto, las RNN que utilizanReLU como funcion de activacion, llamadas IRNN, no presentan el problema deldesvanecimiento del gradiente [11]. Se ha observado que en muchos casos hastahan llegado a superar a otras redes tales como las LSTM [11,20].

Sin embargo, las IRNN aun pueden presentar problemas de convergenciadebido al uso de ReLU. Afortunadamente, eso se puede resolver facilmenteinicializando los pesos recurrentes a 1 y los demas pesos a valores pequenosgenerados de una distribucion normal [11].

La Fig. 4 muestra la arquitectura de la red propuesta. Se utiliza la funcionde activacion ReLU en todas las capas convolucionales. Para combatir el sobre-aprendizaje y mejorar la generalizacion de la red, se aplico la tecnica de Dropouten cada capa convolucional. La capa totalmente conectada utiliza la funcion deactivacion SoftMax para que las 36 salidas puedan corresponder a probabilidades.La longitud maxima de secuencia se puso en L = 900.

MAXPOOL CONV1D IRNN FCCONV1DINPUT

ReLU ReLU ReLU SoftMax

dropout(0.6) dropout(0.8)

3×1, 32 3×1, 32 200 36

L×8 L×32 L/2×32 L/2×32 200dropout(0.9)

Fig. 4. Arquitectura de la red propuesta. La longitud de la secuencia de entrada estaindicada con L.

4. Implementacion

Para estimar el desempeno del sistema se utilizo validacion cruzada estratifi-cada k-fold. Por lo que la base de datos se dividio al azar en 10 partes disjuntas

664

José Guadalupe Beltrán-Hernández, José Ruiz-Pinales, Pedro López-Rodriguez, et al.

Research in Computing Science 149(8), 2020 ISSN 1870-4069

Page 7: Reconocimiento de caracteres manuscritos a partir de

de igual tamano. Es importante mencionar que se tuvo cuidado de preservar laproporciones de cada clase en cada parte. Cada parte se tomo como conjunto deprueba y el resto se utilizo para entrenar la red neuronal. El desempeno de lared se calcula como el promedio de los resultados de las 10 pruebas.

La implementacion se efectuo bajo Python 3.6 utilizando el paquete Kerascon Tensorflow. El entrenamiento se efectuo en una estacion de trabajo conWindows 10, procesador INTEL Core i7, 16 GB de RAM, y GPU nVidia RTX2080. Para entrenar la red, se utilizo el algoritmo de momento adaptivo aceleradocon Nesterov. A fin de acelerar aun mas el entrenamiento y ademas evitarmınimos locales, se utilizo un algoritmo de tasa de aprendizaje cıclico [19] (tasasmınima y maxima de 0.000001 y 0.0001, respectivamente, tamano de paso igual a285 o tres veces el numero de iteraciones por epoca). El tamano de batch se fijo en1024. El entrenamiento se repitio varias veces con diferentes condiciones iniciales.Al principio se observo que la red presentaba algo de sobre-entrenamiento.Por lo tanto, se opto por regularizar la red usando dropout en las dos capasconvolucionales.

5. Resultados

Despues de entrenar la red durante 3,500 epocas se encontro que la tasa deaciertos promedio en el conjunto prueba es de 94.92 %.

La tabla 1 muestra una comparacion con el estado del arte. A partir de esto,podemos concluir que, en general, la metodologıa propuesta se compara bien conotros trabajos del estado del arte. Es de resaltar que todos los trabajos anterioresutilizaron bases de datos pequenas con menos clases y menos variabilidad en lassenales EMG.

Tabla 1. Comparacion con otros trabajos del estado del arte.

Trabajo Muestras Clases %

Template Matching [14] 350 10 97DTW [6] 520 26 84.29DTW [13] 780 26 92.42Propuesto 108,000 36 94.92

La Fig. 5 muestra la matriz de confusion obtenida para la arquitecturapropuesta en el conjunto de prueba. Se puede observar que, en general, todas lasclases son bien reconocidas. Sin embargo, hay ciertas clases que presentan maserrores, por ejemplo, ’0’, ’3’, ’v’ y ’x’ son confundidas la mayorıa de las vecescon ’6’, ’5’, ’u’ y ’y’, respectivamente.

665

Reconocimiento de caracteres manuscritos a partir de señales EMG usando redes neuronales...

Research in Computing Science 149(8), 2020ISSN 1870-4069

Page 8: Reconocimiento de caracteres manuscritos a partir de

0 1 2 3 4 5 6 7 8 9 a b c d e f g h i j k l m n o p q r s t u v w x y z0 280 0 1 1 2 1 12 0 2 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 01 0 279 2 0 1 0 0 2 1 1 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 4 0 1 1 3 0 1 0 0 1 12 0 10 274 2 0 2 0 2 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 1 0 0 1 63 1 0 3 278 0 14 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 2 04 1 0 1 0 289 1 0 2 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 2 0 0 0 1 05 1 0 0 8 1 286 1 0 2 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 06 6 1 0 3 0 4 285 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 07 0 1 1 0 3 0 0 289 2 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 08 2 2 0 1 2 2 1 0 285 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 19 1 1 0 0 2 0 1 0 4 286 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 2 0 0 1 1 0a 1 0 0 0 0 1 0 0 0 0 289 1 0 3 0 0 1 0 1 0 1 0 0 0 0 1 1 1 0 0 1 0 0 0 0 0b 0 0 0 0 0 0 0 0 0 0 3 287 4 0 0 3 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0c 0 0 1 0 0 0 0 0 0 3 0 7 280 1 2 1 0 1 0 0 0 3 0 0 0 0 0 0 1 0 0 1 0 0 0 0d 0 0 0 0 0 0 0 0 2 0 0 0 0 296 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0e 0 0 0 0 0 0 0 0 0 0 0 0 1 4 278 7 1 0 0 1 0 3 0 0 1 2 0 0 2 1 0 0 0 0 0 0f 0 0 0 0 0 0 0 0 0 0 0 1 0 0 4 282 1 0 2 2 2 0 0 2 0 1 0 3 0 1 0 0 0 0 0 0g 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 284 6 1 1 0 0 1 1 0 0 3 2 0 0 0 0 0 0 0 0h 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 290 1 3 0 0 1 2 0 0 0 0 0 0 0 0 0 0 0 0i 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 287 6 0 1 0 1 1 0 1 0 1 0 0 0 0 0 0 0j 0 0 0 0 0 0 0 0 0 0 2 0 0 1 0 1 1 2 4 282 3 0 0 1 1 0 0 0 2 1 0 0 0 0 0 0k 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 1 2 0 1 5 288 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0l 1 0 0 0 1 0 0 1 0 0 0 0 0 0 2 0 2 0 0 0 1 284 2 0 1 2 0 4 0 0 0 0 0 0 0 0

m 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 5 284 5 0 1 0 1 0 1 0 0 0 0 2 1n 0 0 1 0 0 2 0 0 0 0 0 1 0 1 0 0 1 3 0 1 0 0 2 280 2 1 0 2 0 0 1 0 0 0 0 2o 0 0 0 1 0 1 1 0 0 0 1 0 0 1 0 1 1 0 1 0 0 0 0 5 280 5 2 0 1 0 0 0 0 0 0 0p 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 3 0 1 0 0 0 1 1 0 2 291 0 1 1 0 0 0 1 0 0 0q 0 0 0 0 0 0 1 0 0 2 0 0 0 0 0 1 4 0 1 0 2 0 0 0 1 1 287 0 0 0 0 0 0 0 0 0r 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 1 0 2 0 9 1 0 0 6 0 269 6 0 1 0 0 1 1 0s 0 0 0 1 0 1 2 0 0 1 0 0 2 2 0 1 0 0 0 0 0 0 0 0 3 2 0 3 279 1 0 0 0 0 1 2t 0 3 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 2 1 288 2 0 0 0 1 0u 0 0 0 1 3 0 0 1 0 4 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 2 2 275 6 0 2 3 0v 2 2 0 0 3 1 1 0 0 2 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 13 270 0 0 2 2w 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 290 1 2 3x 0 0 1 0 1 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 285 11 0y 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 1 1 0 2 7 284 2z 0 3 5 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 4 281

Fig. 5. Matriz de confusion obtenida para la arquitectura propuesta.

6. Conclusiones

Se propuso una nueva metodologıa para el reconocimiento de caracteresmanuscritos a partir de senales EMG. Esta consiste en utilizar capas convo-lucionales, y max-pooling para la extraccion de caracterısticas, IRNN para elprocesamiento de secuencias y totalmente conectada para la clasificacion.

Una ventaja de la propuesta es que se pueden escribir caracteres con cualquierinstrumento de escritura o simplemente con el dedo. Otra de las ventajas es quelos caracteres tambien pueden ser trazados en el aire. En ese caso, no es necesariotener un soporte plano para la escritura. Una ventaja adicional es que se usanredes recurrentes menos pesadas computacionalmente que otras redes tales comolas LSTM.

Se encontro que la tasa de aciertos promedio de la arquitectura propuestaes de 94.92 %. Los resultados obtenidos son comparables a otros resultados delestado del arte. Es importante recalcar que los trabajos anteriores utilizaronbases de datos pequenas con menos variaciones y menos clases. En nuestro caso,las senales EMG presentan variaciones complejas debidas a la colocacion delbrazalete Myo y al estilo de escritura de cada sujeto. Ademas, los resultadoscomprueban que las IRNN presentan un excelente desempeno para la tareade reconocimiento de caracteres manuscritos y no presentan ningun problemadebido al desvanecimiento del gradiente.

Este trabajo es importante para el area de las interfaces humano-computadora la cuales ofrecen una alternativa para restaurar o mejorar lashabilidades de comunicacion de las personas con y sin discapacidad.

666

José Guadalupe Beltrán-Hernández, José Ruiz-Pinales, Pedro López-Rodriguez, et al.

Research in Computing Science 149(8), 2020 ISSN 1870-4069

Page 9: Reconocimiento de caracteres manuscritos a partir de

Trabajos a futuro podrıan abordar el problema del reconocimiento de pala-bras manuscritas a partir de senales EMG. Igualmente, aun cuando las IRNNno son muy pesadas computacionalmente, se considera que es necesario estudiarsu implementacion en tiempo real.

Agradecimientos. Los autores agradecen a la Universidad de Guanajuato, enparticular a la Division de Ingenierıas Campus Irapuato-Salamanca por el apoyobrindado.

Referencias

1. De Luca, C.J.: Physiology and Mathematics of Myoelectric Signals. IEEE Transac-tions on Biomedical Engineering BME-26(6), 313–325 (jun 1979)

2. Fukushima, K.: Neocognitron: A self-organizing neural network model for a mecha-nism of pattern recognition unaffected by shift in position. Biological Cybernetics36(4), 193–202 (apr 1980)

3. Gu, J., Wang, Z., Kuen, J., Ma, L., Shahroudy, A., Shuai, B., Liu, T., Wang, X.,Wang, G., Cai, J., Chen, T.: Recent advances in convolutional neural networks.Pattern Recognition 77, 354–377 (may 2018)

4. Guigon, E., Baraduc, P., Desmurget, M.: Computational Motor Control: Redun-dancy and Invariance. Journal of Neurophysiology 97(1), 331–347 (jan 2007)

5. He, K., Zhang, X., Ren, S., Sun, J.: Deep Residual Learning for Image Recognition.In: 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).pp. 770–778. IEEE (jun 2016)

6. Huang, G., Zhang, D., Zheng, X., Zhu, X.: An EMG-based handwriting recognitionthrough dynamic time warping. In: 2010 Annual International Conference of theIEEE Engineering in Medicine and Biology. pp. 4902–4905. IEEE (aug 2010)

7. Hubel, D.H., Wiesel, T.N.: Receptive fields and functional architecture of monkeystriate cortex. The Journal of Physiology 195(1), 215–243 (mar 1968)

8. Ines Chihi, Afef, A., Mohamed, B.: Analysis of Handwriting Velocity to IdentifyHandwriting Process from Electromyographic Signals. American Journal of Ap-plied Sciences 9(10), 1742–1756 (oct 2012)

9. Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classification with deep con-volutional neural networks. In: Pereira, F., Burges, C.J.C., Bottou, L., Weinberger,K.Q. (eds.) Advances in Neural Information Processing Systems 25, pp. 1097–1105.Curran Associates, Inc. (2012)

10. Lansari, A., Bouslama, F., Khasawneh, M., Al-Rawi, A.: A novel electromyography(EMG) based classification approach for Arabic handwriting. In: Proceedings of theInternational Joint Conference on Neural Networks, 2003. vol. 3, pp. 2193–2196.IEEE (2003)

11. Le, Q.V., Jaitly, N., Hinton, G.E.: A simple way to initialize recurrent networks ofrectified linear units (2015)

12. LeCun, Y., Boser, B., Denker, J.S., Henderson, D., Howard, R.E., Hubbard, W.,Jackel, L.D.: Backpropagation Applied to Handwritten Zip Code Recognition.Neural Computation 1(4), 541–551 (dec 1989)

13. Li, C., Ma, Z., Yao, L., Zhang, D.: Improvements on EMG-based handwritingrecognition with DTW algorithm. In: 2013 35th Annual International Conferenceof the IEEE Engineering in Medicine and Biology Society (EMBC). pp. 2144–2147.IEEE (jul 2013)

667

Reconocimiento de caracteres manuscritos a partir de señales EMG usando redes neuronales...

Research in Computing Science 149(8), 2020ISSN 1870-4069

Page 10: Reconocimiento de caracteres manuscritos a partir de

14. Linderman, M., Lebedev, M.A., Erlichman, J.S.: Recognition of Handwriting fromElectromyography. PLoS ONE 4(8), e6791 (aug 2009)

15. Maldarelli, J.E., Kahrs, B.A., Hunt, S.C., Lockman, J.J.: Development of earlyhandwriting: Visual-motor control during letter copying. Developmental Psycho-logy 51(7), 879–888 (jul 2015)

16. Okorokova, E., Lebedev, M., Linderman, M., Ossadtchi, A.: A dynamical modelimproves reconstruction of handwriting from multichannel electromyographic re-cordings. Frontiers in Neuroscience 9, 1–15 (oct 2015)

17. Sinha, N.K., Gupta, M.M., Rao, D.H.: Dynamic neural networks: An overview. In:Proceedings of the IEEE International Conference on Industrial Technology. vol. 1,pp. 491–496. IEEE (2000)

18. Slim, M.A., Abdelkrim, A., Benrejeb, M.: An efficient handwriting velocity mo-delling for electromyographic signals reconstruction using Radial Basis Functionneural networks. In: 2015 7th International Conference on Modelling, Identificationand Control (ICMIC). pp. 1–6. IEEE (dec 2015)

19. Smith, L.N.: Cyclical Learning Rates for Training Neural Networks. In: 2017 IEEEWinter Conference on Applications of Computer Vision (WACV). pp. 464–472.IEEE (mar 2017)

20. Talathi, S.S., Vartak, A.: Improving performance of recurrent neural network withrelu nonlinearity (2015)

21. Weng, J., Ahuja, N., Huang, T.S.: Cresceptron: a self-organizing neural networkwhich grows adaptively. In: International Joint Conference on Neural Networks(IJCNN). vol. 1, pp. 576–581 (1992)

668

José Guadalupe Beltrán-Hernández, José Ruiz-Pinales, Pedro López-Rodriguez, et al.

Research in Computing Science 149(8), 2020 ISSN 1870-4069