40
Técnicas de digitalización y Técnicas de digitalización y análisis de señales análisis de señales Curso de doctorado 2001/2002 Inmaculada Hernáez [email protected]

Técnicas de digitalización y análisis de señales - aholab.ehu.es · Si consideramos ahora una señal senoidal, con una frecuencia F0, siguiendo el mismo criterio, será necesario

  • Upload
    vandung

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 1

Técnicas de digitalización y Técnicas de digitalización y análisis de señalesanálisis de señales

Curso de doctorado 2001/2002Inmaculada Herná[email protected]

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 2

Técnicas de digitalización y análisis de señales

Muestreo ideal de señales analógicasImágenes y AliasesCuantificaciónAnálisis de señales

Este es un tema de contenidos básicos relativos a la digitalización y análisis básico de señales. En él se realiza una descripción del proceso de muestreo y de la cuantificación de los datos, y de los efectos que pueden afectar a la calidad de las señales. También se explican muy brevemente las técnicas de análisis digital de señal y la obtención del espectrograma.El tema no pretende ser exhaustivo, sino más bien todo lo contrario: es un rápido repaso para introducir al alumno no iniciado en el mundo del tratamiento digital de la señal de voz. Para profundizar en el tema, puede consultarse cualquiera de los muchos libros de tratamiento digital de señales, particularmente los de nivel medio-bajo (Oppenheim et al 1994, Watkinson, 1994).El primer apartado “Muestreo ideal de señales analógicas” presenta los conceptos más elementales del proceso de digitalización de una señal analógica, tales como la frecuencia de muestreo. El segundo apartado “Imágenes y aliases” describe la aparición de las imágenes en la digitalización, y el efecto del “aliasing”. El apartado de “Cuantificación” describe a grandes rasgos los efectos de discretizar las amplitudes de una señal. Finalmente, en el apartado de análisis de señales se describe el modo de realizar el análisis por tramas de las señales y la obtención de un espectrograma.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 3

Muestreo de señales

Velocidad de muestreo:Tiempo de muestreo:

Tiempo entre muestras consecutivas

Frecuencia de muestreo: Fs-> nº de muestras/segundo

Si la señal varía rápidamente: frecuencia de muestreo mayor¿Criterio de elección de Fs?

La digitalización de una señal analógica permitirá representar en un espacio finito (la memoria de nuestro ordenador) señales de evolución continua en el tiempo. Para ello, el primer paso evidente es eliminar el carácter continuo de la variable tiempo, evaluando el valor de la función en instantes determinados, es decir, realizar el muestreo de la señal analógica.El parámetro más importante en este caso es la frecuencia o velocidad de muestreo Fs: el número de muestras tomadas por unidad de tiempo. La frecuencia de muestreo se mide en Hz.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 4

Ejemplo: Cine, muestreo de la realidad visual a 24 imágenes/segundo:

Velocidad insuficiente para las ruedas de las “caravanas” en las peliculas de vaqueros:

Al menos debemos tomar 2 imágenes/vuelta!

Muestreo de señales

Para comprender mejor el criterio en la selección de la frecuencia de muestreo, vamos a utilizar un par de ejemplos. Considere por ejemplo las tomas realizadas con una cámara de cine, en la que como sabe se toman 24 imágenes por segundo (Fs=24Hz). Las figura representa una secuencia de imágenes en las cuales se observa que tenemos pérdida de información: la película no mostrará las subidas y bajadas rápidas en el perfil de alturas seguido por el motorista, movimientos que han sido superiores al tiempo entre dos tomas consecutivas. La velocidad de muestreo ha sido insuficiente. Este efecto es típico en las tomas correspondientes a las ruedas de las caravanas en las películas de vaqueros o en las hélices de los helicópteros. Tal y como muestra la figura, será necesario realizar al menos dos tomas por cada vuelta de la rueda para verla ‘avanzar’ a la velocidad correcta. Si como en el ejemplo, se realizan menos tomas, la velocidad observada será menor, y además, en función de cuál sea su velocidad, dará la sensación de retroceder.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 5

Muestreo de señales

Al menos 2 muestras por ciclo:

Frecuencia de la señal F0: duración del ciclo 1/F0

Fs>2/(1/F0)=2·F0

Para una señal compleja: Fs>2·Fmax

Si consideramos ahora una señal senoidal, con una frecuencia F0, siguiendo el mismo criterio, será necesario realizar un muestro con una frecuencia superior al doble de la frecuencia de la senoide, de forma que tomemos dos muestras por cada ciclo.Teniendo en cuenta que cualquier señal puede siempre expresarse como una combinación lineal de senoides, si queremos muestrear correctamente deberemos ajustar nuestra frecuencia de muestreo al peor de los casos, y por tanto: Fs>2Fmax, en donde Fmax es la máxima frecuencia existente en la señal.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 6

Muestreo ideal de señales analógicas

48kHz

AudioProf.

44,1kHz32KHz16kHz8kHz

AudioCD

Audio(DAT)

RadioTelephone

La tabla muestra las frecuencias de muestreo típicas utilizadas en las bandas de audio. Sus valores están directamente relacionados con los anchos de banda típicos de cada una de elllas.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 7

Técnicas de Digitalización de Señales

Muestreo ideal de señales analógicasMuestreo ideal de señales analógicasImágenes y AliasesCuantificaciónAnálisis de señales

Continuando con el proceso de muestreo, en este apartado lo analizaremos con un poco más de detalle, para comprender mejor la naturaleza y características de una señal discreta.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 8

Imágenes y Aliases

En los ejemplos que se muestran a continuación, se va a utilizar una frecuencia de muestreo Fs=8KHz para muestrear senoides de diferentes valores. En todos los dibujos, la figura de la izquierda representa la señal analógica con las muestras dibujadas sobre la misma gráfica. La figura del centro muestra únicamente las muestras, tal y como se almacenarían en el procesador. Finalmente, la figura de la derecha muestra la señal analógica que obtendríamos, realizando una interpolación entre muestras consecutivas.Sobre la señal correspondiente a la figura superior, con una frecuencia de 1KHz se toman 8 muestras por ciclo, y la señal que se obtiene al tratar de recuperar la señal analógica, es de la misma frecuencia que la señal analógica fd=fa=1KHz. En la figura de la parte inferior, el muestreo se realiza también de forma correcta: la señal tiene una frecuencia de 2KHz, y el muestreo se está realizando a 8KHz, superior al doble de la máxima frecuencia de la señal.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 9

Imágenes y Aliases

Suponga ahora que la señal analógica a muestrear es una senoide de frecuencia 6KHz. Para muestrearla correctamente se requeriría una velocidad de muestreo de al menos 12KHz. Pero la frecuencia de muestreo es de 8KHz, de forma que como puede verse en la figura superior, se toman menos de 2 muestras en cada ciclo de la senoide. Las muestras obtenidas son idénticas a las obtenidas con el muestreo de la señal de 2KHz. Así, al realizar la interpolación entre muestras no obtenemos la señal analógica original, sino otra de menor frecuencia (2KHz), que se conoce como su “alias”.Esto es lógico, porque la mayor frecuencia que puede ser correctamente recuperada muestreando a 8KHz es 4KHz. Es decir, no podemos representar de forma unívoca frecuencias superiores a Fs/2. La frecuencia Fs=2*Fa se conoce como la Frecuencia de Nyquist: es la mínima frecuencia con la que debemos muestrear una señal para que no se produzca ‘aliasing’. La figura siguiente muestra el muestreo de una senoide de 7KHz. Esta vez vamos a obtener las mismas muestras que las obtenidas con el muestreo de la señal de 1KHz, aunque con un desfase de medio ciclo.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 10

Imágenes y Aliases

Las figuras siguientes representan situaciones similares, en las que el muestreo se está realizando a velocidad insuficiente (inferior a la velocidad de Nyquist) (o bien la frecuencia de las señales que se están muestreando son superiores a la máxima permitida).

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 11

Imágenes y Aliases

Como hemos visto, una senoide discreta de una cierta frecuencia frecuencia fd, puede corresponderse con infinitas senoides analógicas, o dicho de otra forma, infinitos posibles valores de senoides analógicas, quedan representados (de forma ambigua) en el intervalo de frecuencias discretas [-Fs/2 Fs/2], y la relación entre ambas frecuencias puede obtenerse mediante la expresión:Fd=Fa mod(Fs)Y queda representado en el gráfico de la figura.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 12

Imágenes y Aliases

11KHz 33KHz 55KHz

Fs/2=22KHz Fs=44KHz

11KHz 33KHz 55KHz

Fs/2=22KHz Fs=44KHz

Si fa<22KHz, aparecen imágenes:

Si fa>22KHz, aparecen aliases (por debajo de Fs/2):

Fs=44KHz

La siguiente figura realiza una representación del espectro de una señal discreta. El eje horizontal del gráfico representa la frecuencia, y dibujaremos una flecha vertical para representar las frecuencias contenidas en una señal. Si consideramos una señal senoidalde frecuencia 11KHz, esta quedaría representada por las dos flechas situadas en 11KHz y –11KHz (siempre son necesarias una frecuencia positiva y otra negativa para representar una señal real). Muestreamos ahora la señal a una velocidad de 44KHz. Lógicamente, podemos decir que la señal discreta contiene las frecuencias de 11KHz y –11KHz. Sin embargo, las mismas muestras podrían corresponderse al muestreo realizado sobre una señal de 33KHz. Por eso, podemos decir que la frecuencia de 33KHz también forma parte de la representación frecuencial de la señal discreta. Lo mismo pasa con las señales de frecuencias 55KHz, 77KHz, 99KHz... Todas ellas forman parte de la representación frecuencial de la señal discreta. Sin embargo, en la representación, todo aquello que se encuentre fuera del rango [-22KHz, 22KHz] es irrelevante, ya que es una repetición de la información contenida en dicho rango. Así, cuando realizamos el muestreo de a velocidad Fs de una señal analógica con frecuencia inferior a Fs/2, la señal discreta está formada por las frecuencias de la señal analógica, más infinitas repeticiones de dichas frecuencias, situadas en los múltiplos de la frecuencia de muestreo. Estas repeticiones se conocen como imágenes de la señal original. Si el muestreo se realiza con una velocidad inferior a la necesaria, entonces obtendremos una frecuencia en el rango [-Fs/2, Fs/2], que se conoce como alias de la frecuencia original (se trata de la señal original que se presenta ante nosotros disfrazada bajo un valor diferente, o alias).

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 13

Imágenes y Aliases

Filtro Paso Bajo

(anti-imágenes)

Espectro señal recuperada

Espectro señal digital

Espectro señal analógica

f

f

f

f

Fs

Fs/2

ImágenesW-W

W-W

Fs>2W

W-W

Generalizando los resultados anteriores para cualquier señal, encontramos que, para una señal con componentes frecuenciales comprendidas en el rango [-W, W], tras ser muestreada, la señal digital contendrá además del espectro original, copias o imágenes de dicho espectro, centradas siempre en los múltiplos de la frecuencia de muestreo. El proceso de recuperación de la señal analógica requerirá la eliminación de las imágenes, para lo cual se empleará un filtro paso-bajo, con frecuencia de corte precisamente Fs/2. Este filtro es conocido como Filtro anti-imágenes. Si el ancho de banda de la señal es justamente Fs/2, el filtro paso bajo utilizado en la recuperación de la señal, deberá tener las características de un filtro ideal (en ladrillo). Para relajar las características de este filtro, es conveniente utilizar una frecuencia de muestreo algo superior a la frecuencia de Nyquist, es decir, Fs>FN. Como criterio práctico, puede tomarse un margen de un 20% por encima de la mínima frecuencia (Fs=1.2*FN).

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 14

Imágenes y aliases

Filtro Paso Bajo

(anti-imágenes)

Espectro señal recuperada

Espectro señal digital

Espectro señal analógica

f

f

f

f

Fs

Fs/2

Imágenes

Aliasing

W-W

W-W Fs-W

Fs/2

Fs<2W

Si consideramos el muestreo de una señal con frecuencias de hasta WHz, realizado a una frecuencia de muestreo inferior a la velocidad de Nyquist(Fs<2W), se producirá el efecto conocido como “aliasing”: aparición de los alias de aquéllas frecuencias superiores a FN/2. Por eso, previo a la digitalización de la señal, debemos asegurarnos de que el contenido frecuencial de la señal está limitado al rango [-Fs/2, Fs/2]. Los filtros que se deben utilizar serán filtros paso-bajo, con frecuencia de corte Fs/2, por tanto con las mismas características del filtro anti-imágenes. En este caso, los filtros se conocen como filtros anti-aliasing. De nuevo, si no disponemos de un filtro ideal, deberemos utilizar una frecuencia de muestreo superior a la mínima requerida.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 15

Imágenes y aliases

Filtro Paso Bajo

(anti-imágenes)

Espectro señal recuperada

Espectro señal digital

Espectro señal analógica

f

f

f

f

Fs

Fs/2

Imágenes

El filtrado anti-aliasing debe realizarse siempre, incluso aunque la señal esté correctamente limitada en banda, debido a la existencia de ruido: al realizar el muestreo, todo el ruido fuera de banda se reproducirá en forma de alias en la banda [-Fs/2, Fs/2].

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 16

Imágenes y aliases

Espectro señal recuperada

Espectro señal digital

Espectro señal analógica

f

Filtrado Paso Bajo

(anti-aliasing)f

f

Fs/2

fFs

Imágenes

Fs/2

El filtro antialiasing elimina el ruido que se encuentra fuera de la banda de frecuencias [-Fs2, Fs/2], de forma que después no aparecerá en forma de alias.Evidentemente no podemos hacer nada con el ruido que se encuentra en la banda de la señal, pero con la utilización del filtro anti-imágenes, al menos evitamos que aumente.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 17

Imágenes y aliases

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 18

Imágenes y Aliases

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 19

Imágenes y Aliases

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 20

Técnicas de Digitalización de Señales

Muestreo ideal de señales analógicasMuestreo ideal de señales analógicasImágenes y AliasesImágenes y AliasesCuantificaciónAnálisis de señales

En lo visto hasta el momento del proceso de muestreo, se ha discretizadoúnicamente el eje de tiempos: hemos pasado de una variable continua t, a una variable discreta, n, que representa el instante en que se ha realizado el muestreo. De la misma forma, será necesario discretizar los valores de las amplitudes de la señal, ya que en cualquier sistema de almacenamiento de los datos, dispondremos de una longitud de palabra finita. El proceso de discretización de las amplitudes de una señal se conoce como cuantificación. Por ejemplo, las señales de audio se suelen almacenar utilizando 16 bits por cada muestra de señal. Con 16 bits podemos representar un total de 216 amplitudes diferentes. Si el almacenamiento se realizara con 8 bits por cada muestra, entonces tendríamos 28 niveles diferentes. En este apartado vamos a estudiar cuál es el efecto sobre la señal de este proceso

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 21

Cuantificación

(a)

(b) (c)

(d)

La figura representa de una forma esquemática el de digitalización, incluyendo ahora también la cuantificación. La discretización se realiza por tanto en ambos ejes (tiempo y amplitud), y el orden en el que se realice es indistinto, como se muestra en la parte (a) de la figura. El cuantificador uniforme divide el rango de valores de la señal de entrada en un número determinado de intervalos, y asigna a la salida el valor central, como se indica en la parte (c). El número de intervalos que se deben considerar, depende fundamentalmente del nivel de ruido en la señal de entrada. Tal y como muestra la parte (b) de la figura, no será necesario ni conveniente utilizar intervalos de valor inferior al nivel de ruido: ¡lo único que estaremos haciendo será cuantificar con mucha precisión el ruido!. También tendremos que tener en cuenta el ruido que se generará por el hecho de cuantificar, es decir, el error cometido, que estará acotado en amplitud a medio intervalo de cuantificación.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 22

CuantificaciónAmplitud del ruido de cuantificación: limitado a ½ LSBEl error es blanco (igualmente distribuido en todo elespectro) si:

La señal ocupa todo el rango dinámico.Es espectralmente compleja

Si la cuantificación es uniforme (todos los intervalosiguales) S/N~6n+4.8-20logKL

KL=xmax/σx (factor de cresta)Máxima S/N~6n+4.8

Aumento de 1 bit: +6dB16 bits (CD), senoide (KL=√2): 98dB12 bits, voz (KL=√7): 60dB

Así, cuanto menores sean los intervalos de cuantificación, menor será el error cometido en el proceso, como muestran la figura (a). Por lo general, el error estará bien distribuido en todo el espectro de la señal y se podrá considerar ‘blanco’. Esto no ocurre si por ejemplo la señal es un tono simple: el ruido estará correlado con la señal, y tendrá componentes armónicas relacionadas con la frecuencia de la señal, tal y como se aprecia en la figura. Igualmente, si la señal no está ocupando todo el rango del cuatificador (es decir, el número de intervalos útiles es pequeño), el ruido mostrará componentes armónicas (se produce aliasing en el dominio digital). Una vez cuantificada la señal, el valor obtenido se codifica en binario con el número de bits pertinente: necesitaremos log2q bits para codificar q valores o símbolos. Si incrementamos el número de bits en 1, equivale a doblar el número de intervalos, tal y como muestra la figura (b). Como el nivel del ruido se mantendrá en el nivel de un intervalo, mejoraremos la relación señal a ruido de cuantificación en 6dB (doblamos amplitud). Por otro lado, el valor final de la relación señal a ruido, dependerá de la distribución de amplitudes de la señal. Si una señal tiene valores bajos más probables que los valores altos (caso habitual), estará utilizando menos bits durante mas tiempo, y eso empeorará la S/N.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 23

A/D Seinale.wav

Tecnicas de digitalización de señales

Idazkeramemorian

Irakurketa memoriatik etaidazkera disko gogorrean

Laginke txartela Memoria RAM Disko gogorra

PCPC

Fs

Esquema simplificado del proceso de ditalización de una señal de audio

El esquema muestra el proceso práctico de digitalización de una señal acústica sobre un PC. La conversión analógica/digital la realizará una tarjeta insertada en el PC (tarjeta de sonido), la cual incluirá la electrónica necesaria para realizar los procesos de muestreo y cuantificación de la señal estudiados. Todas las tarjetas actuales (para frecuencias de audio) incluyen los filtros antialising y antiimágenes, en su lugar realizan el tratamiento de señal adecuado que permitirá eliminar estos filtros. El muestreo se realiza utilizando un reloj cuya frecuencia está relacionada con la frecuencia de muestreo, que podemos configurar externamente por software. Los datos correspondientes a las muestras de la señal son transferidos al disco duro a través de un búfer de memoria. La memoria actúa de tampón, adaptando las velocidad es de escritura y lectura de uno y otro sistema. El formato en que se desean almacenar los datos, se selecciona por software por el usuario.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 24

D/A Seinale.wav

Tecnicas de digitalización de señales

Irakurketamemoriatik

Irakurketa diskotik eta idazkeramemorian

Laginke txartela Memoria RAM Disko gogorra

PCPC

Fs

Esquema simplificado del proceso de ditalización de una señal de audio

La figura muestra el proceso de obtención de la señal acústica partiendo de las muestras correspondientes. Estas muestras podrán encontrarse en el disco duro del ordenador, en un fichero, o bien directamente en memoria, como resultado de algún tratamiento. El proceso es justamente el inverso al realizado durante el proceso de digitalización.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 25

Fluxu bitarra

Bitrate (Flujo binario): bits/segundo (velocidad de transmisión, bps.)Bitrate=Fs (m/s)* n(bits/m)Por ejemplo:

Voz (calidad telefónica):Fs=8000m/sn=12bits/mR=8000*12 bps=128kbps.Espacio requerido por un segundo:

• 128000bits=128000/8bytes=16000bytes=16000bytes/1024bytes/kb=15,625kb.

Audioa (calidad CD)Fs=44100m/sn=16bits/mR=16000*16 bps=705600bps (mono)Espacio requerido por un segundo estéreo:

• 705600*2bits=705600*2/8 bytes=88200bytes=88200bytes/1024bytes/kb=172,26kb

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 26

Ejercicio 1

Ejercicio 1: Las señales de audio de alta fidelidad (Hi-Fi) tienen un ancho de banda de 20KHz.

a) Cual es la velocidad de Nyquist para estas señales?b) Defina una velocidad de muestreo más práctica. c) Como filtro antialiasing (AAAF) se utiliza el filtro de la figura. Si no se

permite aliasing, defina los valores de las frecuencias de corte del filtro.d) Suponga que no se utiliza un filtro antialiasing, y que existe un ruido

armónico fuera de la banda de la señal a 30 KHz. ¿Cuál es la frecuencia de la versión discreta de 30 KHz?

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 27

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 28

Chirp.wavtono de 0 a 22kSRate=44K, muestreo correcto

ChirpA.wavtono de 0 a 22kSRate=22K, sin filtrado anti-aliasing(se produce aliasing: cuando el tono va de 11k a 22k, tenemos 11k a 0k)

Demostraciones Aliasing

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 29

Chirp2.wavtono de 0 a 5kSRate=11K, muestreo correcto

ChirpI.wavtono de 0 a 5kSRate=11K, sin filtrado anti-imágenes(podemos ver y escuchar las imágenes hasta 11K)

Demostraciones Aliasing

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 30

Demostraciones Aliasing

Lor4.wavSRate=44k, muestreo correcto, señal originalLor1.wavSrate=11k, muestreo correctoLor1A.wavSRate=11k pero sin filtro anti-alias al muestrear (simulación)Lor4i.wavSrate=11k, sin filtro anti-imagen (simulación)

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 31

Técnicas de digitalización y análisis de señales

Muestreo ideal de señales analógicasImágenes y AliasesCuantificaciónAnálisis de señales

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 32

Análisis de señales Dadas las características variantes de la señal de voz, será necesario realizar el análisis por intervalos. El proceso de selección de un intervalo se conoce como enventanado de la señal.La ventana atenúa gradualmente la amplitud de la señal en los extremos del intervalo, evitando cambios abruptos. Trama: distancia entre dos ventanas consecutivasEn frecuencia, el espectro de la ventana se convoluciona con el de la señal, realizando un filtrado paso bajo del espectro.

N: longitud ventana

Trama

)()·()( lnwnxnxl −=

Espectro de la ventana

Espectro de la señal

La transformada de Fourier permite conocer las características de las señales en el dominio de la frecuencia. En el caso de un proceso estocástico estacionario, se utiliza la Densidad Espectral de Potencia para conocer sus características frecuenciales. En el caso de señales con características variantes en el tiempo, análisis frecuencial de la señal se realiza por intervalos o ventanas temporales en las que se supone estacionariedad, de forma que obtendremos una representación de la evolución a lo largo del tiempo de las características frecuenciales de la señal. Por lo general, el segmento de señal seleccionado para el análisis no se utiliza directamente para la obtención de la transformada (u otros parámetros que se deseen obtener), sino que las muestras de la señal, se ponderan de forma que se atenúa gradualmente la amplitud de la señal en sus extremos, evitando así bordes abruptos en el segmento de análisis. La función de ponderación empleada se denomina ventana. La longitud de la ventana de análisis corresponde con la duración del segmento de señal a analizar (en muestras o ms.). El enventanado de una señal para su análisis tiene ciertas consecuencias que distorsionan el resultado, y pueden entenderse mejor considerando que el espectro obtenido es el resultado de realizar la convolución del espectro de la señal sin enventanar (considerada estacionaria también fuera de la ventana), con la transformada de Fourier de la ventana. Por un lado, el efecto de suavizado en el espectro y la pérdida de resolución en la medida, debido a la longitud finita de la ventana (o anchura del lóbulo principal en la transformada). Por otro lado, la influencia de componentes frecuenciales lejanas en la evaluación de una dada, debido a la existencia de los lóbulos secundarios en la transformada de Fourier de la ventana.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 33

Análisis de señales

N: longitud ventana

Trama

Cálculo de parámetros

t

t

El suavizado de los bordes, reduce la longitud efectiva de la ventana. Por ello, para obtener una representación adecuada en el dominio transformado, las ventanas consecutivas se solapan en un cierto porcentaje de su longitud (habitualmente un 30%, dependiendo del tipo de ventana empleado). La longitud de la ventana debe ser cuidadosmanete elegida, teniendo en cuenta el análisis que se desea realizar. Obviamente, si la velocidad de variación de las características de la señal es tal que dichas variaciones quedan inmersas en el interior de una ventana, no seremos capaces de distinguir estas variaciones en la evolución de los parámetros obtenidos.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 34

Análisis de señalesResolución frecuencial limitada por la anchura del lóbulo principal:

∆fmax~1/NTs (ventana rectangular)

~∆fmax~2/NTs (resto de las ventanas)

Pérdidas por lóbulos secundariosVentana ideal:

Alta resolución frecuencial: lóbulo principal muy estrecho y afilado.Bajas pérdidas: alta atenuación de los lóbulos secundarios.

Disminución de la longitud efectiva de la ventana: solape entre intervalos consecutivos.Habitualmente: Longitud de ventana=30ms, Trama=10ms.

Espectro de 10 periodos de una senoide de 1KHz

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 35

Definición STFT:

Hay dos interpretaciones:1. Con n fija y Ω variable, es la transformada de Fourier de la señal

enventanada para el instante de tiempo n:

2. Con Ω fija, y n variable, es la representación paso bajo del contenido de la señal a la frecuencia W, y con el ancho de banda de la ventana:

Muestreo de la STFT (DSTFT):En el dominio frecuencial (W variable): Ωk=k·2π/N En el dominio temporal (n variable):

Ancho de banda de la ventana: B=2/NTs->2B

Análisis de Fourier Short-Time

∑∞

−∞=

Ω− −⋅=Ωm

mjn mnwemsS )()()(

)()·()( mnwnsFSn −=Ω

)()·()( nwensS njn ∗=Ω Ω−

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 36

Análisis Short-TimeEjemplo: Tomamos una ventana de Hamming N=100muestras, con fs=10KHz, B=200Hz.En el tiempo, Sn(Ω) debe evaluarse 400 veces por segundo, es decir, 25 muestras.En frecuencia, debe evaluarse en puntos espaciados 2π/100 rad. (es decir, fs·/100=100Hz).En total se requiere espacio para 400*100 datos/seg.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 37

EspectrogramasEs una representación gráfica del espectro de la señal en función del tiempo (una representación del módulo de Sn(W)). El tiempo se situa en el eje de abcisas, y la frecuencia en el eje de ordenadas. El valor de |Sn(W)| se representa con un color o nivel de gris.Espectrograma de banda ancha/ banda estrecha: considerando la interpretación 2 de la STFT, se refiere al ancho de banda de la ventana utilizada.

Banda estrecha: la ventana es larga, tendremos una buena resolución frecuencial, pero poca resolución temporal.Banda ancha: la ventana es corta, tendremos una buena resolución temporal, pero poca resolución frecuencial.

Si la señal presenta periodicidad (segmentos sonoros de la señal de voz), y la ventana es corta (menor que el periodo del pitch), aparecen estriaciones verticales (buena resolución temporal). Si la ventana es larga (mayor que el periodo de pitch), aparecen estriaciones horizontales (buena resolución frecuencial).El espectrógrafo clásico realizaba una modulación de la señal de entrada con un oscilador de frecuencia variable, y un filtrado paso banda. A la salida se obtenía una representación sobre papel térmico de la energía media de la señal filtrada, siendo esto una aproximación de la STFT. Al tratarse de un instrumento analógico, el ancho de banda de filtro podía ser configurado en dos posiciones, lo que dio lugar a la denominación de espectrograma de banda ancha (300Hz) y estrecha (40Hz).

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 38

Espectrogramas

Espectrograma de banda ancha. Ventana de 5ms.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 39

Espectrogramas

Espectrograma de banda estrecha. Ventana de 30ms.

Técnicas de digitalización y análisis de señales

Tratamiento digital de la señal de voz 40

Bibliografía

Básico:Alan V. Oppenheim, Alan S. Willsky con Ian T. YoungSeñales y SistemasPrentice Hall, 1994

Para profundizar:John WatkinsonThe art of Digital AudioFocal Press, 1994

Rabiner & SchaferDigital Processing of Speech SignalsPrentice Hall, 1978