Upload
vicente-ordonez
View
1.233
Download
4
Embed Size (px)
Citation preview
“ANÁLISIS, DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA
DE BÚSQUEDA DE AUDIO MEDIANTE LA INTEGRACIÓN DE
RECONOCIMIENTO AUTOMÁTICO DE VOZ Y BÚSQUEDA POR
INDEXACIÓN.”
Vicente Ordóñez R.
EL PROBLEMA
3
EL PROBLEMA
Búsqueda de documentos de audio (multimedios que incluyan audio), cuando estos documentos no poseen información de descripción (metadatos).
4
MOTIVACIÓN
Investigar acerca de herramientas para hacer reconocimiento automático del habla y los protocolos utilizados para acceder a estas tecnologías.
Conocer la relación entre eficacia de las tecnologías de reconocimiento de voz subyacentes y la efectividad del sistema como un todo.
5
OBJETIVOS
Investigar el estado del arte de las tecnologías de reconocimiento automático de voz.
Analizar y diseñar una arquitectura que permita extraer transcripciones de grandes cantidades de archivos digitales de audio para luego almacenarlas de tal forma que posteriormente se puedan efectuar búsquedas de manera eficiente.
Implementar un prototipo de la arquitectura propuesta utilizando un motor de reconocimiento de voz disponible en el mercado.
6
OBJETIVOS
Diseñar e implementar un modelo de aplicación que permita la integración de los componentes de esta arquitectura con un sistema ya existente.
Implementar un buscador de archivos de audio accesible como una aplicación Web y que utilice la arquitectura propuesta.
ANÁLISIS Y DISEÑO
8
CASOS DE USO DEL SISTEMA
9
FLUJO DE PROCESOS DEL SISTEMA
10
MODELO DEL SISTEMA
11
CAPAS DE ABSTRACCIÓN DEL SISTEMA
IMPLEMENTACIÓN
13
COMPONENTES IMPLEMENTADOS
14
ACCESO A SERVICIOS DE RECONOCIMIENTO DE VOZ
CLIENTE WEB
15
DEMO
PRUEBAS
18
RENDIMIENTO DE INDEXACIÓN
19
RENDIMIENTO DE BÚSQUEDA
Prueba 1 Prueba 2 Prueba 3
Cantidad de documentos total en el índice
10000 100000 250000
Tamaño resultante del índice
12.4 MB 125 MB 300 MB
Tiempo promedio para cada consulta
4.17ms 16.78 ms 35.84 ms
Desviación estándar de los tiempos de consulta
17.3 ms 13.29 ms 15.49 ms
Máximo tiempo registrado
174 ms 130 ms 155 ms
Mínimo tiempo registrado
1 ms 11 ms 26 ms
20
PRECISIÓN DEL MOTOR DE RECONOCIMIENTO DE VOZ
Transcripción Palabrasreconocidascorrectamente
Total de palabras reconocidas
Precisión
Transcripción1 123 385 32%
Transcripción2 53 171 31%
Transcripción3 136 230 60%
Total 312 786 40%
21
RETENTIVA DEL MOTOR DE RECONOCIMIENTO DE VOZ
Transcripción Palabrasreconocidascorrectamente
Total de palabras en el audio
Retentiva
Transcripción1 123 277 44%
Transcripción2 53 134 39%
Transcripción3 136 302 45%
Total 312 713 44%
22
PRUEBAS CON USUARIOS
0102030405060708090
100
Computer Technology
Scientific Research
Presidential Race
Usuario 1
Usuario 2
Usuario 3
Usuario 4
Usuario 5
23
PRECISIÓN DEL BUSCADOR
Transcripción Cantidad deDocumentosRelevantes
Total de Resultados Considerados
Precisión
Computer technology
8 10 80%
Scientific Research
9,8 10 98%
Presidential Race 6,8 10 68%
Total 24,6 30 82%
24
CONCLUSIONES
Los resultados de búsqueda resultan relevantes utilizando solamente información obtenida con reconocimiento de voz.
Precisión del sistema de búsqueda es mayor a la precisión del sistema de reconocimiento de voz subyacente.
25
PERSPECTIVAS
Los sistemas de reconocimiento del habla se continuarán integrando con los sistemas operativos modernos.
Surgirá la necesidad de llegar finalmente a un consenso entre fabricantes y seguir estándares.
PREGUNTAS