Upload
daniel-munoz-melendez
View
58
Download
0
Tags:
Embed Size (px)
DESCRIPTION
asasasasas
Citation preview
1UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y ARQUITECTURA
DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y TELECOMUNICACIONES
INGENIERA ELECTRNICA
TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN ELECTRNICA
TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UN
CODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTACOMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN
AUTOR: REYNALDO CRDENAS JORGE
PAMPLONA-COLOMBIANOVIEMBRE DE 2006
2UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y ARQUITECTURA
DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y TELECOMUNICACIONES
INGENIERA ELECTRNICA
TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN ELECTRNICA
TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UNCODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTA
COMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN
AUTOR: REYNALDO CRDENAS JORGE
DIRECTOR: PhD. (c) DIEGO FERNEY GMEZ CAJAS
DIRECTOR DE PROGRAMA: Ing. CESAR AUGUSTO RANGEL
PAMPLONA-COLOMBIANOVIEMBRE DE 2006
3UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y ARQUITECTURA
DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y TELECOMUNICACIONES
INGENIERA ELECTRNICA
TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN ELECTRNICA
TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UNCODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTA
COMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN
NOMBRES Y FIRMAS DE AUTORIZACIN PARA SUSTENTAR:
---------------------------------------------- --------------------------------------------------REYNALDO CRDENAS PhD. (c) DIEGO FERNEY GMEZ
JORGE CAJAS Autor del trabajo de grado Director del trabajo de grado
--------------------------------------------------------------
Ing. CESAR AUGUSTO RANGEL VERA
Director de programaJURADO CALIFICADOR
---------------------------------------------- -- ---------------------------------------------
Ing. ADRIN CARVAJAL MSc.(c) WALTER GASTELBONDO FERRER BARRAGAN
Presidente Oponente
---------------------------------------------MSc. (c) JOS DEL CARMEN PEA
Secretario
PAMPLONA-COLOMBIANOVIEMBRE DE 2006
4DEDICATORIA
Este proyecto va dedicado a Dios, a mi papa Cristbal Crdenas Mendoza, a
mi madre Emilse del Socorro Jorge Arrieta; a mis hermanos, Mauricio Jos,
Mara Anglica; a mi sobrino Reyden Daniel Crdenas Jorge y a todas
aquellas personas que ayudaron a crear en mi un espritu de lucha y
fortaleza, a mis amigos que me colaboraron a que este proyecto se
efectuara.
5PENSAMIENTO
El seor es mi pastor, nada me falta:
En verdes praderas me hace reposar, me conduce hacia las aguas del
remanso y me conforta mi alma; me gua por los sendero de justicia, por
amor a su nombre; aunque vaya por un valle tenebroso, no tengo miedo a
nada, porque tu ests conmigo, tu voz y tu callado me sostienen.
Me preparas una mesa ante mis enemigos, perfumas con ungento mi
cabeza y me llenas la copa a rebozar.
Lealtad y dicha me acompaan todos los das de mi vida; habitar la casa del
seor por siempre jams.
Salmo
6AGRADECIMIENTOS
En primer lugar, agradezco a Dios por las bendiciones que me ha dado y por
permitirme culminar esta etapa importante de mi vida, a mi pap Cristbal
Crdenas Mendoza, a mi madre Emilse del Socorro Jorge Arrieta, a mis
hermanos Mauricio Jos, Anglica Mara, a mi sobrino Reyden Daniel
Crdenas, y a todos mis amigos.
Agradezco a mi director Diego Ferney Gmez Cajas por la colaboracin en
el desarrollo y finalizacin de este proyecto.
Agradezco a mis compaeros que contribuyeron de alguna u otra forma a la
realizacin de este trabajo.
7NDICE GENERAL
DEDICATORIAPENSAMIENTOAGRADECIMIENTOS
Pag.
RESUMEN Y ABSTRACT ???????????????????. 13INTRODUCCIN ??????????????????????.. 16JUSTIFICACIN???????????????????????? 17
DELIMITACIONES???????????????????????? 19
CAPITULO I.EL SONIDO Y SUS CARACTERSTICAS?????????????. 20
El sonido???????????????????????????.. 20
Antecedentes histricos?????????????????????. 21
Naturaleza del sonido??????????????????????. 25
CUALIDADES DEL SONIDO??????????????????? 26
Intensidad???????????????????????????. 27
Tono?????????????????????????????? 28
Presin sonora ?????????????????????????. 29
Potencia ???????????????????????????? 30
Fenmenos fsicos del sonido??????????????????? 30
Reflexin???????????????????????????? 31
Refraccin???????????????????????????. 31
Difraccin ???????????????????????????. 33
Efecto doppler ?????????????????????????. 34
8LA VOZ Y SUS CARACTERISTICAS??????????????? 37
Fonologa y fontica ??????????????????????. 40
Fontica experimental?????????????????????? 41
Fontica articulatoria ??????????????????????. 41
ANATOMIA DEL APARATO FONADOR?????????????? 43
Formantes ??????????????????????????? 45
Clasificacin de los sonidos???????????????????.. 49
Oralidad y nasalidad??????????????????????? 50
Tonalidad ???????????????????????????. 50
Lugar y modo de articulacin??????????????????? 51
Posicin de los rganos articulatorios???????????????. 53
Duracin???????????????????????????? 54
Unidades fonticas ??????????????????????? 57
CARACTERISTICAS DE LA VOZ????????????????? 58
Modelo del tracto voclico ???????????????????? 58
ANATOMIA DEL SISTEMA AUDITIVO HUMANO??????????. 61
El odo????????????????????????????? 61
El odo externo ????????????????????????? 62
El odo medio ?????????????????????????.. 63
El odo interno?????????????????????????.. 65
Fenmenos asociados al odo??????????????????.. 68
Efecto de enmascaramiento???????????????????. 69
Capacidad auditiva???????????????????????. 69
RUIDO Y SUS CARACTERISTICAS ???????????????. 72
Ruido externo?????????????????????????.. 73
Ruido industrial????????????????????????? 74
Ruido atmosfrico???????????????????????? 74
9Ruido extraterrestre??????????????????????? 75
Ruido interno?????????????????????????... 75
Ruido trmico?????????????????????????.. 76
Ruido de los semiconductores ??????????????????. 78
Ruido de intermodulacion????????????????????.. 78
Ruido blanco o gaussiano????????????????????. 79
Ruido de impulso de aguja???????????????????? 80
CAPITULO II.CODIFICACION DE VOZ ????????????????????. 81
Definicin de codificacin de voz ????????????????? 81
Historia de los codificadores ??????????????????... 81
Muestreo y cuantificacin ???????????????????? 83
Cuantificacin uniformes ????????????????????.. 85
Cuantificacin logartmica ???????????????????? 89
Cuantificacin no uniforme ???????????????????. 89
Cuantificacin vectorial ????????????????????? 91
Medida subjetiva de la voz???????????????????? 92.
CLASIFICACION DE LOS CODIFICADORES???????????.. 91
Codificadores de forma de onda ?????????????????. 95
Codificadores en el dominio del tiempo??????????????.. 95
Modulacin por codificacin de impulsos?????????????? 96
Modulacin por codificacin de impulsos diferencial????????? 96
Modulacin delta???????????????????????? 98
Modulacin por codificacin de impulsos diferencial adaptativa???? 99
Codificacin el dominio de la frecuencia ?????????????.. 100
Codificacin perceptual????????????????????.. 101
Codificacin en subbandas ?????????????????? 102
Codificacin por transformada ?????????????????. 102
10
Vocoders ??????????????????????????. 105
Vocoder por prediccin lineal?????????????????? 107
Codificadores hbridos ????????????????????? 111
Codificacin relp???????????????????????? 112
Codificacin mpc ???????????????????????. 112
Codificacin celp???????????????????????. 114
Codificacin vselp??????????????????????? 116
Anlisis de predicion lineal???????????????????. 120
Filtro de prediccin de retardo largo???????????????. 121
Codificadores celp??????????????????????? 124
Orgenes del celp???????????????????????.. 127
Estndares??????????????????????????. 127
Predictor corto????????????????????????? 128
Predictor largo????????????????????????? 128
Excitacin por cdigo?????????????????????? 128
Filtros????????????????????????????? 129
Filtro FIR???????????????????????????... 130
Fundamentos de diseo????????????????????? 133
Especificaciones de diseo???????????????????? 134
Fundamentos de mtodos de ventaneo??????????????.. 134
Propiedades de las ventanas??????????????????? 135
Filtro IIR????????????????????????????. 140
Capitulo IIICODIFICACIN DE LA VOZ MEDIANTE PREDICCIN LINEAL CON
EXCITACIN POR CDIGO ALGEBRAICO DE ESTRUCTURA
CONJUGADA ESTANDAR G.729????????????????. 146
PRINCIPIOS BSICOS????????????????????? 146
11
Prediccin lineal ???????????????????????? 146
Modelo fuente filtro de la voz??????????????????? 150
Anlisis de prediccin lineal???????????????????? 150
Clculo de la excitacin?????????????????????.. 152
Predictor de largo plazo????????????????????? 152
Implementacin del codificador CELP??????????????? 153
Descripcin general del codificador/decodificador?????????. 154
Codificador??????????????????????????.. 155
Decodificador?????????????????????????.. 157
Retardo???????????????????????????? 157
Preprocesamiento??????????????????????. 158
Anlisis de la frecuencia fundamental en lazo abierto????????. 158
Clculo de la respuesta impulso?????????????????. 160
Clculo de la seal objetivo?????????????????? 160
Bsqueda de la tabla de cdigos adaptativos????????????.. 161
Generacin del vector de tabla de cdigos adaptativos???????.. 164
Clculo de palabras de cdigo para retardos de tabla de cdigos???
adaptativos??????????????????????????. 164
Clculo de la ganancia de tabla de cdigos adaptativos???????.. 165
Tabla de cdigos fijos: estructura y bsqueda????????????.. 165
Procedimiento de bsqueda de la tabla de cdigos fijos???????.. 168
Clculo de palabra de cdigo de la tabla de cdigos fijos???????. 168
Cuantificacin de las ganancias?????????????????? 168
Bsqueda de la tabla de cdigos para cuantificacin de la
ganancia ??????????????????????????? 169
Descripcin de las funciones del decodificador?????????? 170
Procedimiento de decodificacin de los parmetros????????? 170
Decodificacin de los parmetros de filtro LP??????????? 170
Decodificacin del vector de tabla de cdigos adaptativos????? 171
Decodificacin del vector de tabla de cdigos fijo????????? 172
12
Decodificacin de las ganancias de las tablas de cdigos adaptativos y
Fijos?????????????????????????????? 172
Cdigo en matlab?????????????????????? 175
ANALISIS DE CONFIABILIDAD ????????????????? 180MARCO ECONOMICO????????????????????? 181ANALISIS DE LEGALIDAD???????????????????. 183INFLUENCIA AMBIENTAL DEL TRABAJO????????????. 184RESULTADOS????????????????????????.. 185CONCLUSIONES ???????????????????????. 187RECOMENDACIONES?????????????????????. 188REFERENCIAS BIBLIOGRAFICAS???????????????? 189ANALISIS BIBLIOGRAFICO??????????????????? 193GLOSARIO DE TERMINOS NO CONVENCIONALES ???????.. 194SIMBOLOS NO CONVENCIONALES ??????????????? 196ABREVIATURAS UTILIZADAS????????????..................... 198ANEXOS ???????????????????????????. 199
13
ndice de Figuras
Nombre Pg.FIGURA 1 Intensidad de varios elementos................................................................... 31FIGURA 2 Reflexin del sonido ..................................................................................... 35FIGURA 3 Refraccin del sonido................................................................................... 36FIGURA 4 Difraccin del sonido .................................................................................... 38FIGURA 5 El efecto Doppler .......................................................................................... 39FIGURA 6 Corte esquematico del aparato fonador humano ...................................... 48FIGURA 7 La glotis ......................................................................................................... 48FIGURA 8 Funcin de rea ............................................................................................ 50FIGURA 9 Formantes de un sonido sonoro.................................................................. 50FIGURA 10 Formantes de un sonido sordo.................................................................. 51FIGURA 11 Corte esquematizo de la laringe segn un plano horizontal................... 51FIGURA 12 Diagrama funcional del aparato fonador .................................................. 52FIGURA 13 Diagrama funcional del aparato fonador .................................................. 53FIGURA 14 Zonas del aparato fonador......................................................................... 63FIGURA 15 El odo.......................................................................................................... 65FIGURA 16 El Odo externo ........................................................................................... 66FIGURA 17 El Odo medio ............................................................................................. 68FIGURA 18 El Odo interno ............................................................................................ 69FIGURA 19 Funcionamiento del odo............................................................................ 71FIGURA 20 Enmascaramiento simultaneo ................................................................... 73FIGURA 21 Capacidad auditiva de varios animales .................................................... 74FIGURA 22 Seal continua ............................................................................................ 87FIGURA 23 Seal discreta ............................................................................................. 88FIGURA 24 Cuantificacin uniforme.............................................................................. 90FIGURA 25 Cuantificacin no uniforme ........................................................................ 92FIGURA 26 Ejemplo de comprensin ........................................................................... 94FIGURA 27 Ejemplo de comprensin( b)...................................................................... 94FIGURA 28 Grfico de la ley- para distintos valores de ......................................... 95FIGURA 29 Calidad de voz vs Velocidad.................................................................... 98FIGURA 30 Sistema DPCM (a) codificador (b) decodificador....................................101FIGURA 31Modulacin delta codificador y decodificador ...........................................102FIGURA 32. Error de sobrependiente ..........................................................................102FIGURA 33. Codificador/decodificador ADPCM .......................................................103FIGURA 34. Codificador en sub-bandas....................................................................106FIGURA 35.Codificador ITU G722 Sub -band.............................................................107FIGURA 36 .Decodificador ITU G722 Sub ?band.......................................................108FIGURA 37.Codificacin por transformada .................................................................109FIGURA 38.Modelo de produccin de voz.................................................................110FIGURA 39. Esquema de funcionamiento de Vocoder LPC-10. .............................112FIGURA 40. Diagrama de bloques del emisor. .........................................................113FIGURA 41 Diagrama de bloques del Receptor .......................................................114
14
FIGURA 42 Salida del predictor..................................................................................116FIGURA 43 (a) Seal original. (b) Residuo del filtro LPC (aumentado en 10dB). (c)Residuo de los filtros LPC y de pitch en cascada (aumentado en 10dB) .............117FIGURA 44 Etapa de anlisis de un transmisor CELP.............................................119FIGURA 45 Detalle de la figura 44..............................................................................119FIGURA 46. Decodificador (sintetizador) CELP ........................................................120FIGURA 47 Decodificador VSELP. .............................................................................121FIGURA 48 Diagrama del Speech coder ...................................................................122FIGURA 49. Codificador RPE-LTP..............................................................................123FIGURA 50. Seal filtrada submuestreada y sus correspondientes secuencias.126FIGURA 51.Decodificador RPE-LTP ............................................................................127FIGURA 52. Esquema de un analizador CELP en la prctica ...................................130FIGURA 53. Especificaciones de diseo de un filtro paso-bajo normalizado...........135FIGURA 54. Prototipo de filtros pasa-bajo y pasa-alto ...............................................136FIGURA 55 Prototipo de filtros pasa-banda y banda de rechazo..............................137FIGURA 56 Filtro FIR pasa-bajo usando ventana de hamming................................140FIGURA 57 Filtro FIR paso bajo usando ventana de Kaiser......................................141FIGURA 58 Filtro FIR pasa banda usando ventana de Blackman ............................141FIGURA 59 Esquema bsico de un filtro IIR ...............................................................142FIGURA 60 Estrategias de diseo de filtros IIR ..........................................................144FIGURA 61 Modelo de un sistema digital bsico ........................................................146FIGURA 62 Curva a modelar ........................................................................................147FIGURA 67 Diagrama general de un Sistema digital de produccin de voz ............148FIGURA 68.a)seal sorda b) Seal sonora c) excitacin completa ..........................152FIGURA 69. Diagrama de bloques del predictor corto y largo plazo.........................152FIGURA 70 Diagrama del filtro de largo plazo ............................................................153FIGURA 71 Diagrama funcional del modelo conceptual de sntesis (CELP). ..........154FIGURA 72. Principio de codificacin del codificador CS-ACELP.............................156FIGURA 73 Principio del decodificador CS-ACELP....................................................157FIGURA 74 Diagrama de vector de cdigos fijos........................................................167FIGURA 75 Diagrama de bloques del codificador celp ..............................................174FIGURA 765 Codificador y Decodificador CELP.........................................................174
15
ndice de Tablas
Nombre Pg.TABLA 1 Ejemplo de monemas, grafemas y fonemas ................................................ 43TABLA 2 Clasificacin de las consonantes de la lengua castellana segn el lugar yel modo de articulacin y la sonoridad .......................................................................... 57TABLA 3 Clasificacin de las vocales castellanas segn la posicin de la lengua... 58TABLA 4 Ortografas alternativas de George Bernard Shaw para dos palabrasinglesas ............................................................................................................................ 59TABLA 5 Los fonemas del alfabeto fontico internacional utilizados en la lenguacastellana ......................................................................................................................... 60TABLA 6 Medida subjetiva de la calidad de voz .......................................................... 97TABLA 7 Respuesta del filtro FIR de largo plazo........................................................125TABLA 8 Estructura da la tabla de cdigos fijos .........................................................166
16
RESUMEN
Esta investigacin esta orientada al diseo de un codificador de voz CELP
(Code Excited Linear Prediction) utilizando la herramienta computacional
MATLAB calculando la excitacin, tomando como gua el estndar G.729 de
la UIT-T (Unin Internacional de Telecomunicaciones) con el fin de reducir el
numero de bits en la transmisin de voz .
Para el modelado de la seal de voz, se utilizan dos predictores, un predictor
a largo plazo, y uno de corto plazo, el primero intenta modelar la excitacin
peridica de la seal, y el segundo, imita el comportamiento del tracto vocal.
Por otro lado, un vector de cdigos fijos modela la excitacin no peridica de
la seal de voz.
La herramienta computacional MATLAB nos ayuda al diseo del codificador
de voz CS-CELP (Conjugated Structure - Code Excited Linear Prediction)
definido por el estndar G729, pues contiene diferentes funciones que nos
facilitan el clculo de los parmetros del codificador, tales como, los
coeficientes de prediccin lineal, la correlacin de la seales, la
ventanizacin, conversin de LPC a LSP (line espectrum pairs), etc.
Para conseguir nuestro objetivo, primero generamos la excitacin sin pitch
(frecuencia fundamental), es decir, solo la componente sorda de la excitacin
(vector de cdigos fijos), posteriormente le sumamos la excitacin peridica
(seal sonora, que se modela con un vector de cdigos adaptativos)
completando la excitacin.
17
La funcin de este diseo es la de proporcionar informacin del error,
transmitiendo a bajas tasas de bits reduciendo el ancho de banda sin
sacrificar calidad en la voz y tambin, para aprovechar de una forma ms
eficiente los diferentes servicios prestados a travs de las redes que
transportan voz, como Internet, redes de telefona fija, celular, etc.
18
ABSTRACT
This investigation its oriented to design an voice coder CELP (Code Excited
Linear Prediction) using computacional tool MATLAB, calculating the
excitation, taking as guide the G.729 standard from the ITU-T (International
Telecommunications Union - Telecommunications) with the purpose of
reducing the number of bits in the voice transmission.
By obtain the model of voice signal, two predictors are used, an long term
predictor, and other short term predictor, first tries to model the periodic
excitation of the signal, and the second, imitates the behavior of vocal tract.
On the other hand, a vector of fixed codes models the nonperiodic excitation
of the voice signal.
Computacional tool MATLAB helps us to the design of voice coder CS-CELP
(Conjugated Structure - Code Excited Linear Prediction) defined by the G729
standard, because it contains different functions that facilitate the calculation
of the coder parameters, such as, the coefficients of linear lead, the signals
correlation, the windowed, conversion of LPC to LSP (Line Spectrum Pairs),
between others.
First the excitation without pitch is generated (base frequency), that is to say,
single the deaf component of the excitation (vector of fixed codes), later adds
the periodic excitation to him (sonorous signal, that it is modeled with a vector
of adaptive codes) completing the excitation.
19
The task of this design is the one to also provide information of the error,
transmitting to low rates of bits reducing the bandwidth for the improvement of
the voice quality and taking advantage of one more efficient form different
served through the networks that transport voice, like Internet, networks of
fixed, cellular telephony, between others.
20
INTRODUCCION
La voz es la forma ms natural y eficiente de comunicacin entre los seres
humanos. Sin embargo, cada vez son ms frecuentes las situaciones en las
que la comunicacin se establece con una mquina, o aquellas en las que
una mquina puede ayudar a la comunicacin entre dos seres humanos. Por
esta razn hay herramientas que nos permiten el procesamiento de la voz,
tales como los mtodos de codificacin diseados para almacenar y
transmitir la informacin de la voz en forma digital eficientemente, incluso sin
perder calidad.
La codificacin de voz nos ayuda a optimizar la utilizacin del canal de
comunicacin transmitiendo informacin a un ancho de banda menor y una
mayor inteligibilidad y naturalidad. Por ejemplo, cuando se desea transmitir
varias comunicaciones por un solo canal con la mnima perdida de calidad,
optimizando la relacin entre velocidad de transmisin (bits/segundo) e
inteligibilidad del mensaje. Teniendo en cuenta el almacenamiento de
informacin en forma digital la codificacin de voz permite utilizar menos bits
necesarios para el almacenamiento, manteniendo un nivel de calidad de voz
adecuado. Tambin nos permite incorporar algoritmos de cifrado para
establecer comunicaciones privadas y seguras, o realizar grabaciones
indescifrables para otras personas.
21
JUSTIFICACION
OBJETO
Diseo e implementacin software de un modelo para la excitacin de un
codificador CELP para el anlisis de la seal de voz en diferentes entornos,
tales como telefona digital tanto en la red telefnica pblica conmutada,
como en la red celular mvil, utilizando el algoritmo genrico de codificacin
CELP.
PROBLEMA
La comunicacin eficiente de las seales de voz ha sido una necesidad
creciente desde hace ya muchos aos, en particular, la telefona en sus
distintas manifestaciones satelital, mvil, convencional y ms recientemente
con la comunicacin de voz a travs de Internet.
En todos estos sistemas de comunicacin modernos el tratamiento de la
seal de voz para su adecuada transmisin con un mnimo uso de los
recursos del sistema, tales como canales telefnicos, ancho de banda de
radio frecuencia, ranuras (slots) de tiempo, etctera, representa uno de los
intereses ms grandes de la investigacin actual debido a la creciente
demanda de servicios con un nivel de calidad especfico.
La seal de voz en las aplicaciones ms modernas se transmite en forma
digital. sta es la preferida actualmente para los servicios de comunicacin
punto a punto debido a la versatilidad que ofrece para su manipulacin por
22
algoritmos que permitan realizar tareas como compresin, redistribucin de la
energa en el espectro mediante transformaciones, extraccin de parmetros
caractersticos, proteccin contra errores del canal y criptografa.
Las tcnicas de codificacin de voz son usadas tanto para la transmisin
cuanto para el almacenamiento compacto de seales de voz. Ellas son
demandadas para la transmisin compartida por diferentes canales de voz
en comunicaciones telefnicas digitales tanto por la red telefnica pblica
como por la red celular mvil, adems de permitir mayor seguridad y sigilo
mediante la criptografa. Por otro lado, los canales compartidos pueden
transportar vdeo o datos en entornos multimedia, que se estn tornando
cada vez mas frecuentes y en los cuales la versatilidad de disponer de
codificadores que operen a varias tasas de compresin permite establecer
compromisos entre calidad de servicio y cantidad de canales, necesarios
para atender a la demanda de la telefona por paquetes como la telefona va
Internet.
23
DELIMITACIONES
Objetivo general:
En el presente trabajo se busca estudiar el desarrollo que tienen en la
actualidad las diferentes formas de codificacin de voz, puntualizando la
investigacin en el funcionamiento e implementacin de la excitacin de un
codificador tipo CELP.
Objetivos especficos:
1. Desarrollo conceptual sobre las diferentes tcnicas y dispositivos
utilizados en la codificacin de voz.
2. Estudio del software MATLAB para las diferentes aplicaciones
como elaboracin de filtros, clculos, anlisis de seales.
3. Anlisis de la seal de voz por medio de varios tipos de excitacin.
4. Experimentacin con el codificador CELP, trabajando con una
base de datos de voz.
5. Modelado de la excitacin para un codificador de voz CELP.
24
CAPITULO I. EL SONIDO Y SUS CARACTERSTICAS FSICAS
El Sonido
Fsicamente, el fenmeno sonoro se puede describir como la percepcin de
oscilaciones rtmicas estimuladas por algn objeto fsico vibrante que acta
como fuente emisora, este proceso requiere de una fuente que lo emita, un
canal que lo distribuya y otro que lo reciba. Como formas del lenguaje sonoro
encontramos la voz, la msica, el ruido o efecto sonoro y el silencio. El
fenmeno sonoro se divide en tres [38].
Forma sonora:
Toda configuracin acstica que tiende a ser percibida como un bloque
sonoro unitario y coherente.
Ruido o efecto sonoro:
Conjunto de formas sonoras representadas por sonidos inarticulados o de
estructura musical, de fuentes sonoras naturales y/o artificiales, que
restituyen objetiva y subjetivamente la realidad, construyendo una imagen.
Silencio:
Conjunto continuo de sucesos sonoros poco definidos, configurados por una
disminucin sbita de la intensidad en la evolucin temporal del sonido.
25
Por lo tanto, el sonido es la vibracin de un medio elstico, bien sea
gaseoso, liquido o slido. Cuando nos referimos al sonido audible por el odo
humano, estamos hablando de la sensacin detectada por nuestro odo, y
que se produce por las rpidas variaciones de presin en el aire por encima y
por debajo de un valor esttico. Este valor esttico nos lo da la presin
atmosfrica (alrededor de 100.000 Pascals) el cual tiene unas variaciones
pequeas y de forma muy lenta, tal y como se puede comprobar en un
barmetro.
Cmo son de pequeas y de rpidas las variaciones de presin que causan
el sonido?:
Cuando las rpidas variaciones de presin se centran entre 20 y 20.000
veces por segundo (igual a una frecuencia de 20 Hz a 20 kHz) el sonido es
potencialmente audible aunque las variaciones de presin puedan ser a
veces tan pequeas como la millonsima parte de un pascal. Los sonidos
muy fuertes son causados por grandes variaciones de presin, por ejemplo
una variacin de 1 pascal se oira como un sonido muy fuerte, siempre y
cuando la mayora de la energa de dicho sonido estuviera contenida en las
frecuencias medias (1kHz - 4 kHz) que es donde el odo humano es ms
sensitivo. El sonido puede ser producido por diferentes fuentes, desde una
persona hablando hasta un altavoz vibrando y puede viajar a travs de
distintos medios de propagacin.
ANTECEDENTES HISTORICOS
Antigedad
Los pueblos antiguos efectuaron numerosas especulaciones sobre los
fenmenos elementales del sonido; sin embargo, con la excepcin de unas
26
pocas suposiciones que resultaron ser ciertas, la ciencia del sonido no
empez a desarrollarse hasta aproximadamente 1600 d.C. A partir de
aquella poca, el conocimiento del sonido avanz con ms rapidez que el
conocimiento de los fenmenos luminosos correspondientes, ya que estos
ltimos son ms difciles de observar y medir. A los antiguos griegos no les
preocupaba demasiado el estudio cientfico del sonido, pero estaban muy
interesados por la msica, y consideraban que representaba los ?nmeros
aplicados?, frente a la aritmtica, que representaba los ?nmeros puros?. El
filsofo Pitgoras descubri que una octava corresponde a una relacin de
frecuencias de dos a uno, y enunci la ley que vincula la consonancia a las
relaciones numricas; posteriormente construy todo un edificio de
especulaciones msticas en torno a esa ley. Aristteles, en unas breves
observaciones sobre el sonido, realiz una suposicin bastante acertada
sobre la naturaleza de su generacin y transmisin. Sin embargo, no se
efectuaron estudios experimentales vlidos hasta 1600, cuando Galileo llev
a cabo un estudio cientfico del sonido y enunci muchas de sus leyes
fundamentales. Galileo determin la relacin entre tono y frecuencia, y unas
leyes musicales de armona y disonancia. Tambin explic de forma terica
cmo la frecuencia natural de vibracin de una cuerda tensa, y por tanto la
frecuencia de los sonidos producidos por un instrumento de cuerda, depende
de la longitud, peso y tensin de la cuerda.
Siglos XVII Y XVIII
El matemtico francs Marin Mersenne realiz medidas cuantitativas en
relacin con el sonido al hallar el tiempo de retorno de un eco y calcular un
valor de la velocidad del sonido que difera del valor real en menos del 10%.
Mersenne tambin fue el primero en medir de forma aproximada la
frecuencia de una nota de tono determinado. Midi la frecuencia de vibracin
de un cable largo y pesado cuyo movimiento era tan lento que poda seguirse
27
a simple vista; despus, a partir de consideraciones tericas, calcul la
frecuencia de un cable corto y ligero que produca un sonido audible.
En 1660, el cientfico ingls de origen Irlands Robert Boyle demostr que el
sonido necesitaba un medio gaseoso, lquido o slido para su transmisin.
Boyle colg una campana de una cuerda en el vaco y mostr que, aunque
poda verse cmo el badajo golpeaba la campana, no se oa ningn sonido.
El matemtico y fsico britnico Isaac Newton fue el primero en realizar un
tratamiento matemtico del sonido en sus principios matemticos de la
filosofa natural (1687). Una vez demostrado que la propagacin del sonido a
travs de cualquier fluido slo dependa de propiedades fsicas medibles del
fluido, como la elasticidad o la densidad, Newton calcul a partir de
consideraciones tericas la velocidad del sonido en el aire.
El siglo XVIII fue sobre todo un periodo de desarrollo terico. El clculo
supuso una potente herramienta nueva para cientficos de muchos campos.
Los matemticos franceses Jean le Rond d'Alembert y Joseph Louis
Lagrange y los matemticos suizos Johann Bernoulli y Leonhard Euler
contribuyeron al conocimiento de cuestiones como el tono y el timbre del
sonido producido por un instrumento musical determinado, o la velocidad y
naturaleza de la transmisin del sonido en diferentes medios. Sin embargo,
el tratamiento matemtico completo del sonido requiere el anlisis armnico,
desarrollado por el matemtico francs Joseph Fourier en 1822 y aplicado al
sonido por el fsico alemn Georg Simon Ohm.
Las variaciones de sonido denominadas ?batidos?, una consecuencia de la
naturaleza ondulatoria del sonido, fueron descubiertas en torno a 1740 por el
violinista italiano Giuseppe Tartini y el organista alemn Georg Sorge. El
fsico alemn Ernst Chladni realiz numerosos descubrimientos sobre el
28
sonido a finales del siglo XVIII, sobre todo en relacin con la vibracin de
cuerdas y varillas.
Siglos XIX Y XX
El siglo XIX supuso, sobre todo, una era de desarrollo experimental. Las
primeras medidas precisas de la velocidad del sonido en el agua fueron
llevadas a cabo en 1826 por el matemtico francs Jacques Charles
Franois Sturm, y a lo largo del siglo se realizaron numerosos experimentos
para determinar con extremada precisin la velocidad de sonidos de
diferentes frecuencias en distintos medios. La ley fundamental que dice que
la velocidad es la misma para sonidos de cualquier frecuencia y depende de
la densidad y elasticidad del medio qued establecida en dichos
experimentos.
Durante el siglo XIX se emplearon en el estudio del sonido aparatos como el
estroboscopio, el fonendoscopio o la sirena. En este siglo se dedic tambin
mucho inters al establecimiento de un patrn de tono. La primera
sugerencia de un patrn la realiz el fsico francs Joseph Sauveur alrededor
de 1700. Sauveur propuso que el do equivaliera a 256 Hz, un patrn cmodo
desde el punto de vista matemtico (al ser una potencia de dos). El fsico
alemn Johann Heinrich Scheibler llev a cabo la primera determinacin
precisa de la frecuencia de un tono, y en 1834 propuso como patrn que el la
equivaliera a 440 Hz. En 1859, el gobierno francs decret que el patrn
para el la fuera de 435 Hz, segn las investigaciones del fsico francs Jules
Antoine Lissajous. Este patrn se acept en muchas regiones del mundo
hasta bien entrado el siglo XX.
En el siglo XIX se inventaron el telfono, el micrfono y diversos tipos de
gramfono, todos ellos muy tiles para el estudio del sonido. En el siglo XX,
los fsicos dispusieron por primera vez de instrumentos que hacan posible
29
un estudio sencillo, preciso y cuantitativo del sonido. Mediante osciladores
electrnicos pueden producirse ondas electromagnticas de cualquier tipo y
convertirlas en sonido mediante sistemas electromagnticos o piezoelctricos.
En sentido inverso, es posible convertir los sonidos en corrientes elctricas
mediante un micrfono, amplificarlas electrnicamente sin distorsin y
analizarlas mediante un osciloscopio de rayos catdicos. Las tcnicas
modernas permiten grabar y reproducir el sonido con una fidelidad
extremadamente elevada.
En la primera Guerra Mundial, las necesidades militares llevaron a emplear
por primera vez el sonar para la deteccin de submarinos, que hoy tambin
se emplea para estudiar las corrientes y capas ocenicas y para realizar
mapas de los fondos marinos. En la actualidad, las ondas de sonido de
frecuencias muy elevadas (ultrasonidos) se emplean en numerosas
aplicaciones tcnicas y mdicas.
Naturaleza del sonido
Las ondas sonoras constituyen un tipo de ondas mecnicas que tienen la
virtud de estimular el odo humano y generar la sensacin sonora. En el
estudio del sonido se deben distinguir los aspectos fsicos de los aspectos
fisiolgicos relacionados con la audicin. Desde un punto de vista fsico el
sonido comparte todas las propiedades caractersticas del comportamiento
ondulatorio, por lo que puede ser descrito utilizando los conceptos sobre
ondas. A su vez el estudio del sonido sirve para mejorar la comprensin de
algunos fenmenos tpicos de las ondas. Desde un punto de vista fisiolgico
slo existe sonido cuando un odo es capaz de percibirlo. El sonido La
sensacin producida en el odo por la vibracin de las partculas que se
30
desplazan a travs de un medio elstico (slido, lquido o gaseoso) que las
propaga.
Para que exista el sonido se tienen en cuenta los siguientes factores.
Una fuente de vibracin mecnica.
Un medio elstico por el cual se propague la perturbacin.
Cuando hay variaciones y perturbaciones est claro que debe haber un valor
esttico, a partir del cual se producen estas variaciones. En el caso del aire,
el valor esttico no los da la presin atmosfrica.
CUALIDADES DEL SONIDO
Intensidad
La intensidad del sonido percibido, o propiedad que hace que ste se capte
como fuerte o como dbil, est relacionada con la intensidad de la onda
sonora correspondiente, tambin llamada intensidad acstica. La intensidad
acstica es una magnitud que da idea de la cantidad de energa que est
fluyendo por el medio como consecuencia de la propagacin de la onda.
Se define como la energa que atraviesa por segundo una superficie unidad
dispuesta perpendicularmente a la direccin de propagacin. Equivale a una
potencia por unidad de superficie y se expresa en W/m2. La intensidad de
una onda sonora es proporcional al cuadrado de su frecuencia y al cuadrado
de su amplitud y disminuye con la distancia al foco.
La magnitud de la sensacin sonora depende de la intensidad acstica, pero
tambin depende de la sensibilidad del odo. El intervalo de intensidades
acsticas que va desde el umbral de audibilidad, o valor mnimo perceptible,
31
hasta el umbral del dolor es muy amplio, estando ambos valores lmite en
una relacin del orden de 1014.
Debido a la extensin de este intervalo de audibilidad, para expresar
intensidades sonoras se emplea una escala cuyas divisiones son potencias
de diez y cuya unidad de medida es el decibelio (dB). Ello significa que una
intensidad acstica de 10 decibelios corresponde a una energa diez veces
mayor que una intensidad de cero decibelios; una intensidad de 20 dB
representa una energa 100 veces mayor que la que corresponde a 0
decibelios y as sucesivamente.
Otro de los factores de los que depende la intensidad del sonido percibido es
la frecuencia. Ello significa que para una frecuencia dada un aumento de
intensidad acstica da lugar a un aumento del nivel de sensacin sonora,
pero intensidades acsticas iguales a diferentes frecuencias pueden dar
lugar a sensaciones distintas.
Los sonidos que percibimos deben superar el umbral auditivo (0 dB) y no
llegar al umbral de dolor (140 dB).
FIGURA 1 Intensidad de varios elementos
32
Tono
El tono es la cualidad del sonido mediante la cual el odo le asigna un lugar
en la escala musical, permitiendo, por tanto, distinguir entre los graves y los
agudos. La magnitud fsica que est asociada al tono es la frecuencia. Los
sonidos percibidos como graves corresponden a frecuencias bajas, mientras
que los agudos son debidos a frecuencias altas. As el sonido ms grave de
una guitarra corresponde a una frecuencia de 82,4 Hz y el ms agudo a
698,5 hertzs. Para que los humanos podamos percibir un sonido este debe
estar comprendido en la franja de 20 a 20.000 Hz. Por debajo tenemos los
infrasonidos y por encima los ultrasonidos. A esto se le denomina rango de
frecuencia audible. Junto con la frecuencia, en la percepcin sonora del tono
intervienen otros factores de carcter psicolgico. As sucede por lo general
que al elevar la intensidad se eleva el tono percibido para frecuencias altas y
se baja para las frecuencias bajas. Entre frecuencias comprendidas entre 1
000 y 3 000 Hz el tono es relativamente independiente de la intensidad.
Timbre
El timbre es la cualidad del sonido que permite distinguir sonidos
procedentes de diferentes instrumentos, aun cuando posean igual tono e
intensidad. Debido a esta misma cualidad es posible reconocer a una
persona por su voz, que resulta caracterstica de cada individuo.
El timbre est relacionado con la complejidad de las ondas sonoras que
llegan al odo. Pocas veces las ondas sonoras corresponden a sonidos
33
puros, slo los diapasones generan este tipo de sonidos, que son debidos a
una sola frecuencia y representados por una onda armnica. Los
instrumentos musicales, por el contrario, dan lugar a un sonido ms rico que
resulta de vibraciones complejas. Cada vibracin compleja puede
considerarse compuesta por una serie de vibraciones armnico simples de
una frecuencia y de una amplitud determinadas, cada una de las cuales, si
se considerara separadamente, dara lugar a un sonido puro. Esta mezcla de
tonos parciales es caracterstica de cada instrumento y define su timbre.
Debido a la analoga existente entre el mundo de la luz y el del sonido, al
timbre se le denomina tambin color del tono.
Presin Sonora
En primer lugar tenemos la presin atmosfrica, es decir la presin del aire
ambiental en ausencia de sonido. Se mide en una unidad SI (Sistema
Internacional) denominada Pascal (1 Pascal es igual a una fuerza de 1
newton actuando sobre una superficie de 1 metro cuadrado, y se abrevia 1
Pa). Esta presin es de alrededor de 100.000 Pa (el valor normalizado es de
101.325 Pa). Podemos luego definir la presin sonora como la diferencia
entre la presin instantnea debida al sonido y la presin atmosfrica, y,
naturalmente, tambin se mide en Pa. Sin embargo, la presin sonora tiene
en general valores muchsimo menores que el correspondiente a la presin
atmosfrica. Por ejemplo, los sonidos ms intensos que pueden soportarse
sin experimentar un dolor auditivo agudo corresponden a unos 20 Pa,
mientras que los apenas audibles estn cerca de 20 mPa (mPa es la
abreviatura de micropascal, es decir una millonsima parte de un pascal).
Esta situacin es muy similar a las pequeas ondulaciones que se forman
sobre la superficie de una profunda piscina. Otra diferencia importante es
que la presin atmosfrica cambia muy lentamente, mientras que la presin
sonora lo hace muy rpido, alternando entre valores positivos (presin
34
instantnea mayor que la atmosfrica) y negativos (presin instantnea
menor que la atmosfrica) a razn de entre 20 y 20.000 veces por segundo.
Potencia (W)
La potencia acstica es la cantidad de energa radiada por una fuente
determinada. El nivel de potencia Acstica es la cantidad de energa total
radiada en un segundo y se mide en w. La referencia es 1pw = 1E-12 w.
Para determinar la potencia acstica que radia una fuente se utiliza un
sistema de medicin alrededor de la fuente sonora a fin de poder determinar
la energa total irradiada.
La potencia acstica es un valor intrnseco de la fuente y no depende del
local donde se halle. Es como una bombilla, puede tener 100 w y siempre
tendr 100 w la pongamos en nuestra habitacin o la pongamos dentro de
una nave enorme su potencia siempre Serra la misma. Con la potencia
acstica ocurre lo mismo el valor no varia por estar en un local reverberante
o en uno seco. Al contrario de la Presin Acstica que si que varia segn
vare las caractersticas del local donde se halle la fuente, la distancia etc.
Fenmenos fsicos del sonido
Reflexin
Una onda se refleja (rebota al medio del cual proviene) cuando topa con un
obstculo que no puede traspasar ni rodear.
35
FIGURA 2 Reflexin del sonido
El tamao del obstculo y la longitud de onda determinan si una onda rodea
el obstculo o se refleja en la direccin de la que provena. Si el obstculo es
pequeo en relacin con la longitud de onda, el sonido lo rodeara (difraccin),
en cambio, si sucede lo contrario, el sonido se refleja (reflexin). Si la onda
se refleja, el ngulo de la onda reflejada es igual al ngulo de la onda
incidente, de modo que si una onda sonora incide perpendicularmente sobre
la superficie reflejante, vuelve sobre s misma. La reflexin no acta igual
sobre las altas frecuencias que sobre las bajas. Lo que se debe a que la
longitud de onda de las bajas frecuencias es muy grande (pueden alcanzar
los 18 metros), por lo que son capaces de rodear la mayora de obstculos.
En acstica esta propiedad de las ondas es sobradamente conocida y
aprovechada. No slo para aislar, sino tambin para dirigir el sonido hacia el
auditorio mediante placas reflectoras (reflectores y tornavoces).
Refraccin
Es la desviacin que sufren las ondas en la direccin de su propagacin,
cuando el sonido pasa de un medio a otro diferente.
36
A diferencia de lo que ocurre en el fenmeno de la reflexin, en la refraccin,
el ngulo de refraccin ya no es igual al de incidencia.
La refraccin se debe a que al cambiar de medio, cambia la velocidad de
propagacin del sonido. Posteriormente puede producirse dentro de un
mismo medio, cuando las caractersticas de este no son homogneas, por
ejemplo, cuando de un punto a otro de un medio aumenta o disminuye la
temperatura.
Ejemplo: Sobre una superficie nevada, el sonido es capaz de desplazarse
atravesando grandes distancias. Esto es posible gracias a las refracciones
producidas bajo la nieve, que no es medio uniforme. Cada capa de nieve
tiene una temperatura diferente. Las ms profundas, donde no llega el sol,
estn ms fras que las superficiales. En estas capas ms fras prximas al
suelo, el sonido se propaga con menor velocidad.
FIGURA 3 Refraccin del sonido
37
Difraccin
La difraccin es un fenmeno que afecta a la propagacin del sonido.
Hablamos de difraccin cuando el sonido en lugar de seguir en la direccin
normal, se dispersa.
La explicacin la encontramos en el Principio de Huygens que establece que
cualquier punto de un frente de ondas es susceptible de convertirse en un
nuevo foco emisor de ondas idnticas a la que lo origin. De acuerdo con
este principio, cuando la onda incide sobre una abertura o un obstculo que
impide su propagacin, todos los puntos de su plano se convierten en
fuentes secundarias de ondas, emitiendo nuevas ondas, denominadas ondas
difractadas.
La difraccin se puede producir por dos motivos diferentes:
Por que una onda sonora encuentra a su paso un pequeo obstculo y lo
rodea. Las bajas frecuencias son ms capaces de rodear los obstculos que
las altas. Esto es posible porque las longitudes de onda en el espectro
audible estn entre 3 cm y 12 m, por lo que son lo suficientemente grandes
para superar la mayor parte de los obstculos que encuentran.
Por que una onda sonora topa con un pequeo agujero y lo atraviesa.
La cantidad de difraccin estar dada en funcin del tamao de la propia
abertura y de la longitud de onda.
Si una abertura es grande en comparacin con la longitud de onda, el efecto
de la difraccin es pequeo. La onda se propaga en lneas rectas o rayos,
como la luz.
38
Cuando el tamao de la abertura es considerable en comparacin con la
longitud de onda, los efectos de la difraccin son grandes y el sonido se
comporta como si fuese una luz que procede de una fuente puntual
localizada en la abertura.
FIGURA 4 Difraccin del sonido
Efecto Doppler
El fenmeno fue descrito por primera vez por el matemtico y fsico austriaco
Christian Doppler (1803-1853). Consiste en que el sonido emitido por una
fuente es percibido por nuestro odo con distintas frecuencias dependiendo si
dicha fuente est en reposo, acercndose o alejndose. En efecto, la
frecuencia aumenta si la fuente se aproxima (sonido ms agudo) y disminuye
si se aleja (sonido ms grave).
39
FIGURA 5 El efecto Doppler
Una fuente emisora de ondas sonoras que se aproxima, se acerca al
observador durante el periodo de la onda. Y, dado la longitud de la onda se
acorta y la velocidad de propagacin de la onda permanece sin cambios, el
sonido se percibe ms alto. Por esta misma razn, la altura (desplazamiento
de la frecuencia de las ondas sonoras) de una fuente que se aleja, se reduce.
El efecto Doppler se observa siempre que la fuente de ondas se mueve con
respecto al observador. Es el efecto producido por una fuente de ondas mvil
por el cual hay un aparente desplazamiento de la frecuencia hacia arriba
para los observadores hacia los cuales se dirige la fuente y un aparente
desplazamiento hacia debajo de la frecuencia para los observadores de los
cuales la fuente se aleja.
El efecto Doppler se origina cuando hay un movimiento relativo entre la
fuente sonora y el oyente cuando cualquiera de los dos se mueven con
respecto al medio en el que las ondas se propagan. El resultado es la
aparente variacin de la altura del sonido. Existe una variacin en la
frecuencia que percibimos con la frecuencia que la fuente origina.
40
El fenmeno no se restringe al movimiento de la fuente. Si la fuente de
sonido est fija, un oyente que se mueva hacia la fuente observar un
aumento similar en el tono. Un oyente que se aleja de la fuente de sonido
escuchar un sonido de menor tono. El cambio en la frecuencia del sonido
que resulta del movimiento relativo entre una fuente y un oyente se
denomina efecto Doppler.
El efecto Doppler se refiere al cambio aparente en la frecuencia de una
fuente de sonido cuando hay un movimiento relativo de la fuente y del oyente.
Efecto clsico: Mientras la onda avanza, el cuerpo se aleja del observador. El
receptor capta tarde el prximo mximo y dir que el periodo es mas largo, la
frecuencia es menor y la longitud de onda mayor.
41
LA VOZ Y SUS CARACTERISTICAS
Los sistemas de comunicacin transportan informacin. A continuacin se
estudiar un sistema de comunicacin especfico, el de la comunicacin a
travs de seales de voz, es decir seales acsticas tradicionalmente
emitidas y recibidas por seres humanos en forma oral.
Histricamente, desde la Antigua Grecia se han realizado intentos por
generar voces artificiales. En muchos casos eran simplemente juegos de
tuberas conectadas a un locutor humano, en otros autnticos ingenios
acsticos capaces de producir sonoridades voclicas.
El desarrollo de la telefona a principios del siglo XX motiv intensas
investigaciones sobre las propiedades de la voz y la audicin con el fin de
mejorar la calidad de la comunicacin telefnica. El proceso continu y hoy
en da las tecnologas existentes permiten, por ejemplo, disponer de
sistemas de comunicacin oral hombre mquina.
En todo sistema de comunicacin hay varios componentes: emisor, receptor,
mensaje, cdigo, canal y contexto .Se debe conocer algunos aspectos de
cada uno de ellos para poder integrar sistemas que funcionen de manera
eficaz y eficiente. En l a s p e r s o n a s el emisor es el conjunto integrado por
el cerebro que ?piensa? el mensaje y el aparato fonatorio que lo ?traduce? a
una emisin acstica. El receptor es el aparato auditivo que recibe la onda
sonora y la transforma en impulsos nerviosos que luego son interpretados por
el cerebro. El mensaje es la idea a comunicar. El cdigo es el lenguaje
hablado. La combinacin del mensaje y el cdigo constituyen la seal. El
canal puede ser el medio en el cual se propaga la onda sonora (en general el
42
aire) o un medio de transmisin electrnico que constituye en s mismo otro
subsistema de comunicacin cuyas propiedades son bien conocidas y que
se aproxima en muchos casos (aunque no siempre) a la idealidad. El
contexto puede tener un sinnmero de componentes, que van desde factores
puramente subjetivos o psicolgicos, como el inters, la atencin, la
motivacin hasta factores fsicos tales como respuesta en frecuencia,
interferencias, distorsiones, ruido. De acuerdo con investigaciones realizadas,
existen evidencias suficientes como para establecer que empleamos ms o
menos el 70% de nuestras horas de actividad comunicndonos verbalmente,
es decir, que cada uno de nosotros emplea alrededor de 10 a 11 horas
diarias para comunicarse.
Conceptos sobre lenguaje
La lengua es un sistema de signos lingsticos que permiten la
comunicacin en una comunidad. Es un sistema, cada uno de sus
elementos tiene entidad propia y entidad relativa a su posicin o relacin
con los otros elementos. Es un cdigo de signos. Tiene carcter social, ya
que es comn a una sociedad. El habla es el acto de seleccionar los signos
de entre los disponibles y organizarlos a travs de ciertas reglas. Materializa
el cdigo, es individual, vale decir que cambia de un individuo a otro.
Los signos pueden corresponder al lenguaje escrito o al oral. El lenguaje es
un sistema articulado ya que los sonidos y otros componentes se integran
entre s. Est formado por signos lingsticos, nombre que recibe la seal en
el lenguaje. El lenguaje tiene modalidades regionales llamadas dialectos. Un
signo es algo que reemplaza a otra cosa para comunicarla en un mensaje.
Los signos lingsticos se clasifican en dos tipos: significado y significante.
El significado es el concepto mental, idea o contenido a comunicar. El
significante es la imagen, ya sea grfica o acstica que se le asigna. La
43
relacin entre significado y significante es arbitraria o convencional, aunque
no necesariamente discrecional: involucra acuerdos tcitos, explcitos o
normativos en una comunidad lingstica. En el lenguaje escrito, el
significante es la grafa escrita, formada por combinaciones de letras, en
tanto que en el lenguaje hablado es su realizacin acstica mediante la
palabra hablada. Las palabras son los elementos libres mnimos del
lenguaje. La sintaxis es el conjunto de reglas para la coordinacin de las
palabras en frases u oraciones. En su versin escrita las palabras estn
formadas por letras o grafemas, es decir unidades grficas mnimas, y, en el
caso oral, por fonemas. Los fonemas son la unidad fnica ideal mnima del
lenguaje. Se materializan a travs de los sonidos, pero de una manera no
unvoca. Las variantes de los fonemas se denominan alfonos. Los
monemas son unidades mnimas con significado, que puede ser gramatical,
dando origen a los morfemas, o lxico, representado por los lexemas. Los
morfemas tienen relacin con la gramtica, o la forma de organizar o dar
estructura a las categoras bsicas del lenguaje (gnero, nmero, tiempo o
persona de los verbos, etc.), mientras que los lexemas se refieren a
significados externos al lenguaje mismo. Las palabras constan de al menos
un monema, siendo las ms comunes bimonemticas, que incluyen un
lexema y un morfema.
En la tabla siguiente se dan dos ejemplos en los que se identifican los
componentes de la palabra
TABLA 1 Ejemplo de monemas, grafemas y fonemas
44
Fonologa y fontica
La Fonologa estudia los fonemas, es decir el modelo fnico convencional e
ideal del lenguaje. La Fontica, en tanto, se refiere a los sonidos en el
habla, incluyendo su produccin acstica y los procesos fsicos y
fisiolgicos de emisin y articulacin involucrados. As, la Fonologa es el
estudio de los sonidos de la lengua en cuanto a su carcter simblico o de
representacin mental. Procede detectando regularidades o recurrencias en
los sonidos del lenguaje hablado y sus combinaciones, y haciendo
abstraccin de las pequeas diferencias debidas a la individualidad de cada
hablante y de caractersticas suprasegmentales como la entonacin, el
acento (tnico, es decir por aumento de la intensidad y aggico, por
aumento de la duracin). Cada uno de los sonidos abstractos as
identificados es un fonema. Uno de los objetivos de la fonologa es acotar al
mximo la cantidad de fonemas requeridos para representar cada idioma de
una manera suficientemente precisa.
La Fontica estudia experimentalmente los mecanismos de produccin y
percepcin de los sonidos utilizados en el habla a travs del anlisis
acstico, articulatorio y perceptivo. Se ocupa, por consiguiente, de las
realizaciones de los fonemas.
Fontica experimental
Es la que estudia los sonidos orales desde el punto de vista fsico, reuniendo
los datos y cuantificando los datos sobre la emisin y la produccin de las
ondas sonoras que configuran el sonido articulado. Utiliza instrumentos como
los rayos X y el quimgrafo, que traza las curvas de intensidad. El conjunto
de los datos analizados al medir los sonidos depende nicamente de la
45
precisin del instrumental as como de otros conocimientos conexos. Adems
se han descubierto diferencias importantes en cada sonido oral.
Fontica articulatoria
Es la que estudia los sonidos de una lengua desde el punto de vista
fisiolgico, es decir, describe qu rganos orales intervienen en su
produccin, en qu posicin se encuentran y cmo esas posiciones varan
los distintos caminos que puede seguir el aire cuando sale por la boca, nariz,
o garganta, para que se produzcan sonidos diferentes. No se ocupa de todas
las actividades que intervienen en la produccin de un sonido, sino que
selecciona slo las que tienen que ver con el lugar y la forma de articulacin.
Los smbolos fonticos y sus definiciones articulatorias son las descripciones
abreviadas de tales actividades. Los smbolos fonticos que se usan ms
frecuentemente son los adoptados por la Asociacin Fontica Internacional
en el alfabeto fontico internacional (A.F.I.) que se escriben entre corchetes.
Los rganos que intervienen en la articulacin del sonido son mviles o fijos.
Son mviles los labios, la mandbula, la lengua y las cuerdas vocales, que a
veces reciben el nombre de rganos articulatorios. Con su ayuda, el hablante
modifica la salida del aire que procede de los pulmones. Son fijos los dientes,
los alvolos, el paladar duro y el paladar blando. Los sonidos se producen
cuando se ponen en contacto dos rganos articulatorios por ejemplo el
bilabial (p), que exige el contacto entre los dos labios; tambin cuando se
ponen en contacto un rgano fijo y otro articulatorio, y el sonido se nombra
con los rganos que producen la juntura, o punto de articulacin, como por
ejemplo el sonido labiodental (f) que exige el contacto entre el labio inferior y
los incisivos superiores. Cuando es la lengua el rgano mvil no se hace
referencia a ella en la denominacin del sonido, as el sonido (t) que se
46
produce cuando la lengua toca la parte posterior de los incisivos superiores
se llama dental.
El modo de articulacin se determina por la disposicin de los rganos
mviles en la cavidad bucal y cmo impiden o dejan libre el paso del aire.
Esta accin puede consistir en la interrupcin instantnea y completa del
paso del aire para las implosivas; en dejar abierto el paso nasal pero
interrumpido el oral para las nasales; en producir un contacto con la lengua
pero dejar libre el paso del aire a uno y otro lado para las laterales; en
producir una leve interrupcin primero y dejar el paso libre despus para las
africadas; en permitir el paso del aire por un paso estrecho por el que el aire
pasa rozando para las fricativas, y en permitir el paso libre del aire por el
centro de la lengua sin friccin alguna para las vocales.
Se emiten diferentes clases de vocales segn vare la posicin de la lengua,
tanto a partir de su eje vertical (alta, media y baja), como a partir de su eje
horizontal (anterior, central y posterior). Por ejemplo, en espaol son vocales
altas las vocales de la palabra huir, es decir, la [i] y la [u]. Son vocales
medias la [e] y la [o], es decir las vocales de la palabra pero y es vocal baja
la [a] de la palabra va. As, la lengua va de abajo arriba para pronunciar las
dos vocales seguidas de la palabra aire, pero desciende a una posicin
media para pronunciar su ltima vocal. Hace el camino contrario de arriba
abajo para pronunciar puerta. Son vocales anteriores del espaol la [i] y la [e],
es decir las vocales seguidas de la palabra piel; las vocales posteriores son
la [o] y la [u], es decir las vocales de la palabra puro; la [a] es la vocal central.
La lengua se mueve de atrs hacia adelante para emitir las vocales de la
palabra totales, hace el camino contrario para emitir las vocales de la palabra
pilago. Las posiciones que mantiene la lengua para emitir las vocales u, i y
a constituyen los vrtices del llamado esquema voclico uai.
47
Anatoma del aparato Fonador[34]
La voz humana se produce voluntariamente por medio del aparato fonatorio.
ste est formado por los pulmones como fuente de energa en la forma de
un flujo de aire, la laringe, que contiene las cuerdas vocales, la faringe, las
cavidades oral (o bucal) y nasal y una serie de elementos articulatorios: los
labios, los dientes, el alvolo, el paladar, el velo del paladar y la lengua
(Figura 6). Las cuerdas vocales son, en realidad, dos membranas dentro de la
laringe orientadas de adelante hacia atrs (Figura 8). Por adelante se unen
en el cartlago tiroides (que puede palparse sobre el cuello, inmediatamente
por debajo de la unin con la cabeza; en los varones suele apreciarse como
una protuberancia conocida como nuez de Adn). Por detrs, cada una est
sujeta a uno de los dos cartlagos aritenoides, los cuales pueden separarse
voluntariamente por medio de msculos. La abertura entre ambas cuerdas
se denomina glotis. Cuando las cuerdas vocales se encuentran separadas,
la glotis adopta una forma triangular. El aire pasa libremente y prcticamente
no se produce sonido. Es el caso de la respiracin. Cuando la glotis
comienza a cerrarse, el aire que la atraviesa proveniente de los pulmones
experimenta una turbulencia, emitindose un ruido de origen aerodinmico
conocido como aspiracin (aunque en realidad acompaa a una espiracin
o exhalacin). Esto sucede en los sonidos denominados ?aspirados? (como la
h inglesa). Al cerrarse ms, las cuerdas vocales comienzan a vibrar a
modo de lenguetas, producindose un sonido tonal, es decir peridico. La
frecuencia de este sonido depende de varios factores, entre otros del tamao
y la masa de las cuerdas vocales, de la tensin que se les aplique y de la
velocidad del flujo del aire proveniente de los pulmones. A mayor tamao,
menor frecuencia de vibracin, lo cual explica por qu en los varones, cuya
48
glotis es en promedio mayor que la de las mujeres, la voz es en general ms
grave. A mayor tensin la frecuencia aumenta, siendo los sonidos ms
agudos. As, para lograr emitir sonidos en el registro extremo de la voz es
necesario un mayor esfuerzo vocal. Tambin aumenta la frecuencia (a
igualdad de las otras condiciones) al crecer la velocidad del flujo de aire,
razn por la cual al aumentar la intensidad de emisin se tiende a elevar
espontneamente el tono de voz.
FIGURA 6 Corte esquematico del aparato fonador humano
FIGURA 7 La glotis
49
Finalmente, es posible obturar la glotis completamente. En ese caso no se
produce sonido. Sobre la glotis se encuentra la epiglotis, un cartlago en la
faringe que permite tapar la glotis durante la deglucin para evitar que el
alimento ingerido se introduzca en el tracto respiratorio. Durante la respiracin
y la fonacin (emisin de sonido) la epiglotis est separada de la glotis
permitiendo la circulacin del flujo de aire. Durante la deglucin, en cambio,
la laringe ejecuta un movimiento ascendente de modo que la glotis apoya
sobre la epiglotis. La porcin que incluye las cavidades farngea, oral y nasal
junto con los elementos articulatorios se denomina genricamente cavidad
supragltica, en tanto que los espacios por debajo de la laringe, es decir la
trquea, los bronquios y los pulmones, se denominan cavidades infraglticas.
Varios de los elementos de la cavidad supragltica se controlan a voluntad,
permitiendo modificar dentro de mrgenes muy amplios los sonidos
producidos por las cuerdas vocales o agregar partes distintivas a los
mismos, e inclusive producir sonidos propios. Todo esto se efecta por dos
mecanismos principales: el filtrado y la articulacin.
El filtrado acta modificando el espectro del sonido. Tiene lugar en las cuatro
cavidades supraglticas principales: la faringe, la cavidad nasal, la cavidad
oral y la cavidad labial. Las mismas constituyen resonadores acsticos que
enfatizan determinadas bandas frecuenciales del espectro generado por
las cuerdas vocales, conduciendo al concepto de formantes.
Formantes
Son una serie de picos de resonancia ubicados en frecuencias o bandas de
frecuencia que, segn veremos, son bastante especficas para cada tipo de
sonido.
50
FIGURA 8 Funcin de rea
FIGURA 9 Formantes de un sonido sonoro
51
FIGURA 10 Formantes de un sonido sordo
FIGURA 11 Corte esquematizo de la laringe segn un plano horizontal
La articulacin es una modificacin principalmente a nivel temporal de los
sonidos, y est directamente relacionada con la emisin de los mismos y con
los fenmenos transitorios que los acompaan. Est caracterizada por el
52
lugar del tracto vocal en que tiene lugar, por los elementos que intervienen y
por el modo en que se produce, factores que dan origen a una clasificacin
fontica de los sonidos que veremos luego.
FIGURA 12 Diagrama funcional del aparato fonador
Pulmones Laringe Faringe TractoVocal
TractoNasal
Funcin
Pulmones Laringe Faringe TractoVocal
TractoNasal
rganos
53
FIGURA 13 Diagrama funcional del aparato fonador
Clasificacin de los sonidos
Los sonidos emitidos por el aparato fonatorio pueden clasificarse de acuerdo
con diversos criterios que tienen en cuenta los diferentes aspectos del
fenmeno de emisin. Estos criterios son:
Segn su carcter voclico o consonntico.
Segn su oralidad o nasalidad
Segn su carcter tonal (sonoro) o no tonal (sordo)
Segn el lugar de articulacin e) Segn el modo de
articulacin
Segn la posicin de los rganos articulatorios
Intensidad Tono fundamental
Efectos Resultantes
Pulso GlotalPresin Subglotal
Modulacin
Modulacin
Modulacin
Traza deVoz
FonacinArticulacin
54
Segn la duracin
Vocales y consonantes
Desde un punto de vista mecanoacstico, las vocales son los sonidos
emitidos por la sola vibracin de las cuerdas vocales sin ningn obstculo o
constriccin entre la laringe y las aberturas oral y nasal. Dicha vibracin se
genera por el principio del oscilador de relajacin, donde interviene una
fuente de energa constante en la forma de un flujo de aire proveniente de
los pulmones. Son siempre sonidos de carcter tonal (cuasiperidicos), y por
consiguiente de espectro discreto. Las consonantes, por el contrario, se
emiten interponiendo algn obstculo formado por los elementos
articulatorios. Los sonidos correspondientes a las consonantes pueden ser
tonales o no dependiendo de si las cuerdas vocales estn vibrando o no.
Funcionalmente, en el castellano las vocales pueden constituir palabras
completas, no as las consonantes.
Oralidad y nasalidad
Los fonemas en los que el aire pasa por la cavidad nasal se denominan
nasales, en tanto que aqullos en los que sale por la boca se denominan
orales. La diferencia principal est en el tipo de resonador principal por
encima de la laringe (cavidad nasal y oral, respectivamente). En castellano
son nasales slo las consonantes ???, ???, ???
Tonalidad
Los fonemas en los que participa la vibracin de las cuerdas vocales se
55
denominan tonales o tambin, sonoros. La tonalidad lleva implcito un
espectro cuasi peridico.
Como se puntualiz anteriormente, todas las vocales son tonales, pero
existen varias consonantes que tambin lo son: ???, ???, ???, etc. Aquellos
fonemas producidos sin vibraciones glotales se denominan sordos. Varios de
ellos son el resultado de la turbulencia causada por el aire pasando a gran
velocidad por un espacio reducido, como las consonantes ???, ???, ???, ???.
Lugar y modo de articulacin (consonantes)
La articulacin es el proceso mediante el cual alguna parte del aparato
fonatorio interpone un obstculo para la circulacin del flujo de aire. Las
caractersticas de la articulacin permitirn clasificar las consonantes. Los
rganos articulatorios son los labios, los dientes, las diferentes partes del
paladar (alvolo, paladar duro, paladar blando o velo), la lengua y la glotis.
Salvo la glotis, que puede articular por s misma, el resto de los rganos
articula por oposicin con otro. Segn el lugar o punto de articulacin se
tienen fonemas:
Bilabiales: oposicin de ambos labios
Labiodentales: oposicin de los dientes superiores con el labio inferior
Linguodentales: oposicin de la punta de la lengua con los dientes superiores
Alveolares: oposicin de la punta de la lengua con la regin alveolar
Palatales: oposicin de la lengua con el paladar duro
Velares: oposicin de la parte posterior de la lengua con el paladar blando
Glotales: articulacin en la propia glotis
56
A su vez, para cada punto de articulacin sta puede efectuarse de
diferentes modos, dando lugar a fonemas:
Oclusivos: la salida del aire se cierra momentneamente por completo
Fricativos: el aire sale atravesando un espacio estrecho
Africados: oclusin seguida por fricacin
Laterales: la lengua obstruye el centro de la boca y el aire sale por los lados
Vibrantes: la lengua vibra cerrando el paso del aire intermitentemente
Aproximante : La obstruccin muy estrecha que no llega a producir
turbulencia
Los fonemas oclusivos (correspondientes a las consonantes ??? inicial o
postnasal, ???, ???, ???, ??? inicial, postnasal o postlateral,???, ???) tambin se
denominan a veces explosivos, debido a la liberacin repentina de la presin
presente inmediatamente antes de su emisin. Pueden ser sordos o sonoros,
al igual que los fricativos (??? postvoclica, postlateral y postvibrante, ???
postvoclica y post vibrante, ???, ???, ??? aspirada, ???, ???, ???). Slo existe un
fonema africado en castellano, correspondiente a la ?ch?. Los laterales (???, ?ll?)
a veces se denominan lquidos, y son siempre sonoros. Los dos fonemas
vibrantes del castellano (consonantes ???, ?rr?) difieren en que en uno de
ellos (???) se ejecuta una sola vibracin y es intervoclico, mientras que en el
otro (?rr?) es una sucesin de dos o tres vibraciones de la lengua. Finalmente,
los fonemas aproximantes (la ??? y la ??? cerradas que aparecen en algunos
diptongos) son a veces denominados semivocales, pues en realidad suenan
como vocales. Pero exhiben una diferencia muy importante: son de corta
duracin y no son prolongables.
En la tabla 2 se indican las consonantes clasificadas segn el lugar y el
modo de articulacin, la sonoridad y la oronasalidad. En algunos casos una
57
misma consonante aparece en dos categoras diferentes, correspondiente a
las diferencias observadas.
TABLA 2 Clasificacin de las consonantes de la lengua castellana segn ellugar y el modo de articulacin y la sonoridad
Posicin de los rganos articulatorios (vocales)
En el caso de las vocales, la articulacin consiste en la modificacin de la
accin filtrante de los diversos resonadores, lo cual depende de las
posiciones de la lengua (tanto en elevacin como en profundidad o
avance), de la mandbula inferior, de los labios y del paladar blando. Estos
rganos influyen sobre los formantes, permitiendo su control.
Podemos clasificar las vocales segn la posicin de la lengua como se
muestra en la tabla 3.
58
TABLA 3 Clasificacin de las vocales castellanas segn la posicin de lalengua.
Otra cualidad controlable es la labializacin, es decir el hecho de que se haga
participar activamente los labios. Las vocales labializadas, tambin definidas
como redondeadas, son las que redondean los labios hacia adelante,
incrementando la longitud efectiva del tracto vocal. La nica vocal labializada
en el castellano es la ???.
En otros idiomas, como el francs, el portugus, el cataln y el polaco, as
como en lenguas no europeas como el guaran o el hindi, existe tambin el
matiz de oralidad o nasalidad. En las vocales orales el velo (paladar blando)
sube, obturando la nasofaringe, lo cual impide que el aire fluya parcialmente
por la cavidad nasal. En las vocales nasalizadas (u oronasales) el velo baja,
liberando el paso del aire a travs de la nasofaringe. Se incorpora as la
resonancia nasal
Duracin
La duracin de los sonidos, especialmente de las vocales, no tiene
importancia a nivel semntico en el castellano, pero s en el plano expresivo,
a travs de la agogia, es decir el nfasis o acentuacin a travs de la
duracin. En ingls, en cambio, la duracin de una vocal puede cambiar
completamente el significado de la palabra que la contiene
59
El alfabeto fontico internacional
El castellano es un idioma cuya escritura es eminentemente fontica, ya que
salvo pocos casos, hay correspondencia entre grafema y fonema. No todos
los idiomas tienen esta caracterstica. El ingls es un caso quizs extremo, a
tal punto que George Bernard Shaw ha creado posibles ortografas
alternativas para algunas palabras basndose en la forma en que sus
fonemas aparecen escritos en otras palabras. Estas extraas ortografas y el
anlisis correspondiente se muestran en la tabla 4.
TABLA 4 Ortografas alternativas de George Bernard Shaw para dospalabras inglesas
Se ha compilado un extenso conjunto de smbolos fonticos conocido
como el Alfabeto Fontico Internacional (International Phonetic Alphabet,
IPA) que contiene una gran cantidad de fonemas de los diversos idiomas, y
que permite representar de una manera inequvoca los fonemas
independientemente del idioma. El subconjunto correspondiente al idioma
castellano se indica en la tabla 5.
60
TABLA 5 Los fonemas del alfabeto fontico internacional utilizados en lalengua castellana
Fontica Acstica[39]
Es la que estudia la onda sonora como la salida de un resonador cualquiera;
esto es, equipara el sistema de fonacin con cualquier otro sistema de
emisin y reproduccin de sonidos. En la comunicacin , las ondas sonoras
tienen un inters mayor que la articulacin o produccin de los sonidos, para
un determinado auditorio recibe y descodifica la impresin a pesar de que
haya sido emitida por medio de una articulacin oral, o por medio de un
determinado aparato emisor de sonidos o incluso por medio de una cotorra.
Para grabar las caractersticas ms significativas de las ondas sonoras y
para determinar el resultado de las distintas actividades articulatorias se
puede emplear el espectrgrafo. De forma experimental, para poder llegar a
saber cules son los rasgos necesarios y suficientes que identifican los
sonidos de la lengua, se suprimieron partes de la grabacin de la onda
sonora y se reprodujeron otras.
61
Unidades fonticas
Los alfonos
Los alfonos son cada uno de los sonidos propios de una lengua. Alfonos
son las realizaciones concretas, fonticas, de los fonemas, de acuerdo con
los elementos fnicos que entren en contacto. Son sonidos del habla,
variantes fonticas de un sonido real. Por ejemplo, en castellano la e inicial
de la palabra ejes es ms abierta que la segunda; sin embargo, si
pronunciamos la e ms o menos abierta no cambiamos nunca el
significado de las palabras. Estas dos realizaciones concretas son variantes
fonticas, alfonos, del fonema /e/.
Los fonemas
Se definen como el conjunto de alfonos con el mismo valor fonolgico en
una lengua. Cada lengua tiene un nmero limitado de fonemas, que son
iguales a todos los hablantes en un momento dado (sincrnicamente) y que,
segn la eleccin y combinacin que se haga con ellos, constituyen los
diferentes significantes de los signos lingsticos. Por ejemplo:
/s/, /z/ casa, mismo
/n/, /N/ cana, tango
62
Caractersticas de la voz[46]
Los sonidos se clasifican en sonoros y no sonoros. En los primeros se abren
y cierran las cuerdas vocales, cambiando el rea de la traquea y originando
un tren de impulsos cuasi peridicos. El periodo o frecuencia fundamental de
este tren de impulsos se conoce con el nombre de pitch, y su valor esta
comprendido entre 50 y 400 Hz para los hombres y es superior en mujeres y
nios. En los sonidos no sonoros el aire fluye libremente hasta alcanzar el
tracto vocal al permanecer las cuerdas vocales. Posteriormente, la variacin
voluntaria del tracto vocal, junto con el estado variante de las cuerdas,
produce la voz.
El tracto vocal acta como una cavidad resonante para los sonidos sonoros,
estando centradas las frecuencias de resonancia para la mayora de la gente
en 500 Hz y sus armnicos pares. Esta resonancia causa grandes picos en
el espectro resultante, a los cuales se les llama formantes. Tambin la seal
tiene una naturaleza paso baja y a partir de unos 4KHz comienza a
predominar el ruido.
En cambio, el segmento de voz no sonoro muestra una estructura ruidosa
tanto en el dominio del tiempo como en el de la frecuencia, no tenindose
formantes. Adems la energa de la seal es mucho menor que la de los
sonidos sonoros.
Modelo del tracto voclico[36]
La voz se produce a partir de sonidos formados por la vibracin de las
cuerdas vocales y posterior resonancia en la pared del tracto voclico de la
seal producida. En los adultos, el tracto voclico es un tubo de
63
aproximadamente 17cm de largo con un rea transversal que vara de 0 a 20
cm2.La figura 9 muestra un diagrama del tracto voclico. Los pulmones
actan solamente como emisores de aire. Son las cuerdas vocales las
encargadas de introducir una perturbacin cuasi peridica en el flujo de aire.
FIGURA 14 Zonas del aparato fonadora) Tracto voclico. a) articulaciones del habla: (1) cuerdas vocales; (2)faringe; (3) velo; (4) paladar blando; (5) paladar duro; (6) alveolos; (7) dientes;(8)labios; (9) punta de la lengua; (10) cuerpo lingual; (11) dorso; (12) raz; (13)mandbula; (14) cavidad nasal; (15) cavidad oral; (16) ventanas nasales; (17)traquea; (18) epglotis. b) tipos de articulacin de voz: (1) labial; (2) dental; (3)alveolar; (4) palatal; (5) velar; (6) uvular; (7) faringeal; (8) glotal.
Los sonidos que conforman la voz se pueden clasificar en vocalizados
(sonoros, originados en las cuerdas vocales) y no vocalizados (sordos,
originados por una friccin en el tracto voclico), en la prctica la voz est
formada por una mezcla de ambos. Durante el proceso de generacin de
sonidos vocalizados, las cuerdas vocales estn cerradas, pero la presin
ejercida por el aire contenido en los pulmones fuerza su apertura y su
posterior relajacin ocasionando la vibracin de las cuerdas a una frecuencia
entre los 50 y 400 [Hz]. A esta frecuencia se le conoce como pitch. La forma
64
de la seal que se produce en la vibracin con las cuerdas vocales es
aproximadamente triangular. sta atraviesa el resto del tracto voclico donde
la amplitud se ve alterada por el choque de la seal con las paredes del
tracto. Durante el proceso de generacin de sonidos no vocalizados, las
cuerdas vocales estn completamente abiertas, posibilitando la circulacin
del aire por el tracto voclico, la que se ve ligeramente obstaculizada por el
roce con las paredes del tracto, lo que produce un ruido fricativo. Adems del
movimiento de las cuerdas vocales y del tracto voclico, para modelar el
proceso de generacin de voz se debe considerar tambin los movimientos
de la boca, la lengua, los labios y vibraciones nasales. Por tanto, un modelo
bsico de este proceso debe considerar lo siguiente:
La voz es una seal que emerge de una fuente definida: los pulmones
actan como emisores de aire y la seal se produce por la vibracin
de las cuerdas vocales y la posterior resonancia con las paredes del
tracto voclico.
La voz est formada por la mezcla de seales de excitacin peridica
y ruido.
La variacin temporal de la seal en el tracto voclico produce el
timbre caracterstico que diferencia los fonemas, ciertos fonemas son
articulados sin la presencia de las cuerdas vocales (fonemas sordos).
Antes de pasar por el tracto voclico, la onda sonora tiene un espectro
relativamente plano (sin formantes).
La fuente emisora posee dos estados: generacin de sonidos
vocalizados y no vocalizados.
Si se toman intervalos de tiempos pequeos se puede modelar el
rgano generador de voz a travs de la bsqueda de su funcin de
transferencia, que define relacin entre la entrada (excitacin gltica) y
la salida (voz generada) por medio de filtros.
65
ANATOMIA DEL SISTEMA AUDITIVO HUMANO[48]
EL OIDO
El odo se encarga de recoger los sonidos, procesarlos y mandar seales
sonoras al cerebro mediante el proceso de transduccin .Otra funcin muy
importante del odo es la de mantener el sentido del equilibrio.
FIGURA 15 El odo
El odo se divide entre partes que describiremos a continuacin:
Odo externo
Odo medio
Odo interno
66
ELOIDO EXTERNO
La nica parte visible del odo es el pabelln auditivo (la aurcula) que, debido
a su especial forma helicoidal, es la primera parte del odo en reaccionar ante
el sonido. El pabelln auditivo funciona como una especie de embudo que
ayuda a dirigir el sonido hacia el interior del odo. Sin la presencia de este
embudo las ondas sonoras tomaran una ruta directa hacia el conducto
auditivo. Esto hara que el proceso de audicin fuera difcil e ineficaz ya que
gran parte del sonido se perdera y seria ms difcil escuchar y comprender los
sonidos.
FIGURA 16 El Odo externo
El pabelln auditivo es imprescindible debido a la diferencia de presin que
existe en interior y exterior del odo. La resistencia del aire es mayor en el
interior que en el exterior del odo porque el aire en el interior se encuentra
comprimido, y por ello, a mayor presin. Para que las ondas sonoras penetren
en el odo de la mejor forma posible, la resistencia del aire no debe ser
demasiado alta. El pabelln auditivo es esencial para ayudar a vencer la
67
diferencia de presin en el interior y exterior del odo. El pabelln auditivo
funciona como un vnculo intermedio que hace que esta transicin sea ms
suave y menos brutal, permitiendo que penetren mayor numero de sonidos en
el conducto auditivo (meatus).
Una vez que las ondas sonoras han superado el pabelln auditivo, se
desplazan de dos a tres centmetros dentro del conducto auditivo antes de
golpear el tmpano, tambin conocido como membrana timpnica.
El tmpano
El tmpano (membrana timpnica), el cual seala el inicio del odo medio, es
extremadamente sensible. Para proteger al tmpano, el conducto auditivo se
curva ligeramente haciendo ms difcil que por ejemplo, los insectos puedan
alcanzarlo. Al mismo tiempo la cera del odo (cerumen) del conducto auditivo
ayuda a mantener fuera