Upload
trinhkhue
View
214
Download
0
Embed Size (px)
Citation preview
UNIVERSIDAD POLITÉCNICA DE MADRID
ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN
DEPARTAMENTO DE SEÑALES, SISTEMAS Y RADIOCOMUNICACIONES
TESIS DOCTORAL
IDENTIFICACIÓN AUTOMÁTICA DE ACORDES MUSICALES
Autor: Luis I. Ortiz Berenguer. Ingeniero de Telecomunicación
Director: Dr.Francisco Javier Casajús Quirós. Doctor Ingeniero de Telecomunicación por la
Universidad Politécnica de Madrid
Madrid, 2002
CALIFICACIÓN
Tesis Doctoral: IDENTIFICACIÓN AUTOMÁTICA DE ACORDES
MUSICALES
Autor: D. Luis I. Ortiz Berenguer
Director: Dr. Francisco Javier Casajús Quirós
El Tribunal nombrado para juzgar la Tesis Doctoral arriba indicada, compuesto por los
siguientes señores:
Presidente:
Vocales:
Secretario:
Acuerdan otorgarle la calificación de:
Madrid, a
El Secretario del Tribunal
RESUMEN
La identificación automática de acordes musicales es un eslabón en la cadena de la
transcripción automática. Si bien existen varios trabajos sobre identificación de notas (pitch y
fundamental) y sobre detección polifónica y separación de parciales, todavía queda bastante
por resolver, y esta Tesis supone una contribución a la resolución del problema muy especial
de la identificación de acordes de pianos.
El método planteado para la identificación es el del reconocimiento de patrones
espectrales. Hay dos aspectos muy específicos en el método presentado:
a) los patrones espectrales son espectros completos y no sólo parámetros espectrales.
b) los patrones se generan a partir de un modelo acústico simple del piano
Para asegurar la adecuación de los patrones así como la generalidad del método para
otros pianos, el modelo acústico se entrena para cada piano a identificar.
Las características especiales de las notas del piano, hacen que el algoritmo de análisis
usado para extraer los parámetros de entrenamiento, haya tenido que ser desarrollado
específicamente.
Los parámetros de entrenamiento, obtenidos de unas pocas notas, son usados por el
modelo acústico del piano para calcular los parámetros de todas las 88 notas del piano, de los
que se derivan los valores de frecuencia central y anchura espectral de los parciales de los
patrones a generar.
La señal que va a ser identificada se comparará con los patrones con una técnica de
reconocimiento de patrones mediante “pattern-matching”. La comparación se realiza con una
métrica simple consistente en el cálculo del producto interno del espectro de la señal y el
espectro patrón.
Previamente a la identificación, a la señal se le calcula la FFT, se limpia el espectro
mediante una umbralización simple y se realiza una predetección de la banda a la que pertenece
la señal.La predetección permite eliminar ciertas incertidumbres entre patrones de bandas
distintas que tienden a dar métricas altas y crean ambiguedad.
La identificación del acorde exige una identificación iterativa de las diversas notas que
lo componen. En cada iteración, la nota identificada sufre un proceso de validación. Una vez
validada se procede a sustraer su parte del espectro, mediante una máscara, para realizar la
siguiente iteración.
De esta manera se han realizado identificaciones correctas de diversos acordes de 3 y 4
notas pertenecientes a las octavas 1 a 7 del piano, con dos tipos de ejecución: “legato” y
“staccato”.
ABSTRACT
Automatic identification of chords is a part of the transcription problem. Several
contributions about note identification (pitch and fundamental), polyphonic detection and
partials separation have been presented up to today. However, there are still enough issues to
solve and this Thesis presents a contribution to resolve the very specific problem of identifying
piano chords.
The method proposed to carry out the identification is “spectral patterns recognition”.
There are two specific aspects in the method presented:
a) The spectral patterns are full spectra instead of simple spectral parameters
b) The pattern are generated from a simple acoustic model of the piano
The acoustic model is trained for every piano to be identified in order to assure the
fitting of the patterns and that the model is able to be applied to any piano.
The special characteristics of piano note sounds make necessary to develop an specific
analysis algorithm to extract the note parameters during the training.
Training parameters, obtained from a few notes only, are used by the acoustic model of
the piano to evaluate the parameters of the whole 88 notes, which, in turn, allow to calculate
the values of partials central frequency and partials spectral width of the patterns to be
generated.
The signal to be identified is compared to the patterns using pattern-matching.
Comparison is carried out using the inner product as a metric. The inner products of the signal
spectrum and the pattern spectra are performed
Previous to the identification, the FFT of the signal is calculated and its spectrum is
cleaned by a simple thresholding process. Also, a band predetection is evaluated in order to
avoid some ambiguity between bands that occurs in the metric calculation.
Chord identification is carried out by iterative identification of the notes componing to
the chord. During each iteration, the identified note undergoes a validation process. Once the
note is validated, a mask is used to remove the part of the spectrum corresponding to it, to
proceed with the next iteration.
Correct identifications of several three and four notes chords belonging to octaves 1 to
7 have been carried out with this method. Chords identified have been performed in both
“legato” and “staccato” manner.
“En tiempo de desolación nunca hacer mudanza, mas estar firme
y constante en los propósitos...”
S. Ignacio de LoyolaQuinta Regla de discernimiento
de las mociones que en el ánima se causan
Al tesón,
sin el que no es posible acabar una Tesis.
(¿por qué se escribirán casi igual?)
A María Jesús, Ignacio y a mí mismo,
porque al fin tendremos más tiempo para nosotros.
A mis padres,
porque siempre están orgullosos de los logros de sus hijos.
AGRADECIMIENTOS
A María Jesús y a Ignacio
por aguantarme y por muchas cosas más.
A Ricardo Cuenca
del Dpto. Técnico del Teatro Real de Madrid
por hacer posible las grabaciones y facilitarme los medios
A Javier Ortega y Manuel Sobreira
por su gran apoyo en esta Tesis y su amistad
A Vladi, Danilo, Pedrero y Constantino
por resolver mis dudas, y a los dos primeros
también por su labor de revisión y crítica.
A Javier Casajús,
por aceptar ser mi director
y tener las ideas tan claras.
A todos mis amigos, que me han apoyado, y a mis hermanos que no tendrán que seguir
preguntándome por la Tesis en las reuniones familiares.
Madrid, Julio 2002
IDENTIFICACIÓN AUTOMÁTICA DE
ACORDES MUSICALES
TESIS DOCTORAL
Identificación Automática de Acordes Musicales I Tesis Doctoral
ÍNDICE
CAPÍTULO 1: INTRODUCCIÓN . . . . . . . . . . . . . . . . . . 11.1.- PANORÁMICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.- SOLUCIÓN QUE SE PROPONE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.- DESCRIPCIÓN GENERAL DEL PROBLEMA . . . . . . . . . . . . . . . . . . . . . . 2
1.4.- DESCRIPCIÓN DEL PIANO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.1.- ESTRUCTURA BÁSICA DEL PIANO . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.1.1.- Elementos vibrantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.1.2.- Elemento excitador: “actuador” y martillo . . . . . . . . . . . . . . . . 8
1.4.2.- ASPECTOS ESPECÍFICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2.1.- Cuerdas triples (unísono) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2.2.- Zona de excitación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2.3.- Vibración y afinación del unísono . . . . . . . . . . . . . . . . . . . . . . 10
1.4.2.4.- Ruido de piano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.2.5.- Inarmonicidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.2.6.- Afinación del piano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4.2.7.- Efecto de carga de la placa resonante . . . . . . . . . . . . . . . . . . . 12
CAPÍTULO 2: REVISIÓN y OBJETIVOS . . . . . . . . . . 152.1.- INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.- REVISIÓN SOBRE HERRAMIENTAS PARA ANÁLISIS DE SEÑALES
MUSICALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.1.- TRANSFORMADA ESPECTRAL DE Q CONSTANTE . . . . . . . . . . 15
2.2.2.- REPRESENTACIÓN TIEMPO-FRECUENCIA DE ALTA
RESOLUCIÓN USANDO DISTRIBUCIÓN MODAL. . . . . . . . . . . . . 15
2.2.3.- “GENERALIZED HARMONIC ANALYSIS (GHA)” . . . . . . . . . . . . 16
2.2.4.- “REASSIGNED SPECTROGRAMS” . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.5.- TRANSFORMADA ONDICULAR (WAVELET) . . . . . . . . . . . . . . . 16
2.2.6.- TRANSFORMADA DE FOURIER . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Identificación Automática de Acordes Musicales II Tesis Doctoral
2.3.- REVISIÓN SOBRE CLASIFICACIÓN DE SONIDOS E INSTRUMENTOS
MUSICALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.1.- RECONOCIMIENTO Y CLASIFICACIÓN DE LOS TIPOS DE
MÚSICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.2.- RECONOCIMIENTO Y CLASIFICACIÓN DE INSTRUMENTOS
MUSICALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.- REVISIÓN SOBRE DETECCIÓN DEL PITCH Y DEL FUNDAMENTAL 18
2.5.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA . . . . . . . . . . . . . . . . . . . . 18
2.6.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA ESPECÍFICA DE
PIANO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.7.- REVISIÓN SOBRE MODELADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.8.- RESULTADOS PRESENTADOS EN LOS TRABAJOS REVISADOS . . . 23
2.9.- TRABAJO A REALIZAR EN ESTA TESIS . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.9.1.- OBJETIVO GENERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.9.2.- PLANTEAMIENTO DEL MÉTODO . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.9.2.1.- Patrones y Entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.9.2.2.- Identificación de Acordes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.9.2.3.- Acordes y Señales a Identificar . . . . . . . . . . . . . . . . . . . . . . . . 25
2.9.3.- OBJETIVOS CONCRETOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.9.4.- MATERIAL Y GENERALIZACIÓN DE RESULTADOS . . . . . . . . 28
2.9.4.1.- Pianos acústicos y salas de ensayo . . . . . . . . . . . . . . . . . . . . . . 28
2.9.4.2.- Grabación y procesado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.9.4.3.- Señales grabadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.9.4.4.- Generalidad del método: robustez frente a cambio de piano . 30
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO . 33
3.1.- VIBRACIÓN DE CUERDAS FLEXIBLES . . . . . . . . . . . . . . . . 34
3.1.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN . . . . . . . . . . . . . 34
3.1.2.- SOLUCIONES GENERALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS Y
AMORTIGUAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Identificación Automática de Acordes Musicales III Tesis Doctoral
3.1.4.- MODOS PROPIOS PARA CUERDA CON EXTREMOS FIJOS . . 36
3.1.5.- EXTREMO IMPEDANTE: CUERDA FIJA-NO FIJA . . . . . . . . . . . 38
3.1.5.1.- Resolución para soporte con impedancia simple . . . . . . . . . . 40
3.1.5.1.1- Frecuencias de Modos propios para impedancia tipo masa 40
3.1.5.1.2- Frecuencia de Modos propios para impedancia resistiva . . 44
3.1.5.1.3- Frecuencia de Modos propios para impedancia tipo
elasticidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.5.2.- Frecuencias de Modos propios para impedancia genérica . . . 47
3.1.6.- FRECUENCIAS DE MODOS PROPIOS PARA CUERDA FIJA-
IMPEDANTE Y SOPORTE MULTIMODAL . . . . . . . . . . . . . . . . . . . . . . . . 48
3.1.6.1.- Isb calculado considerando Msb fijo y wosb/wt=1.3 . . . . . . . 52
3.1.6.2.- Isb calculado considerando Msb variable y dos valores de la
relación wosb/wt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.1.6.3.- Efecto de la rigidez ortotrópica en Isb . . . . . . . . . . . . . . . . . . 56
3.1.6.4.- Valores previsibles para la relación wosb/wt . . . . . . . . . . . . . 57
3.1.6.5.- Aplicación al modelo de patrones . . . . . . . . . . . . . . . . . . . . . . 58
3.1.7.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN
ESPECTRAL DE NIVELES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.1.7.1.- Soluciones ante condiciones iniciales simples . . . . . . . . . . . . . 60
3.1.7.1.1- Golpe del martillo “uniforme” e instantáneo . . . . . . . . . . . 61
3.1.7.1.2- Golpe del martillo no uniforme e instantáneo . . . . . . . . . . 62
3.1.7.2.- Condiciones iniciales no simples: Golpe del martillo no
uniforme y no instantáneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2.- VIBRACIÓN DE CUERDAS CON RIGIDEZ . . . . . . . . . . . . . . 68
3.2.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN . . . . . . . . . . . . . 68
3.2.2.- SOLUCIONES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS . . . . . . . . . 71
3.2.3.1.- Soluciones para cuerda fija-fija con extremos apoyados en
bordes finos (“pinned by knife edges”) . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2.3.2.- Soluciones para cuerda fija-fija con extremos abrazados
(“clamped”) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Identificación Automática de Acordes Musicales IV Tesis Doctoral
3.3.- VIBRACIÓN DE FLEXIÓN DE BARRA RÍGIDA . . . . . . . . . . 74
3.3.1.- ECUACIÓN DIFERENCIAL Y SOLUCIONES . . . . . . . . . . . . . . . . . 74
3.3.2.- CONDICIONES DE CONTORNO: MODOS PROPIOS . . . . . . . . . 76
3.3.3.- VIBRACIÓN DE LA CUERDA CON EXTREMO IMPEDANTE . . 77
3.3.4.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN
ESPECTRAL DE NIVELES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.4.- VIBRACIÓN DE UNÍSONOS . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.4.1.- UNÍSONOS CON AMORTIGUAMIENTO . . . . . . . . . . . . . . . . . . . . 86
3.5.- VIBRACIÓN DE PLACAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.5.1.- PLACA ISÓTROPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.5.1.1.- Soluciones para panel infinito . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.5.1.2.- Impedancia de entrada a una placa infinita: impedancia
característica de la placa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.5.1.3.- Soluciones para panel finito . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.5.1.4.- Impedancia de entrada a panel finito . . . . . . . . . . . . . . . . . . . 98
3.5.2.- PLACA ANISÓTROPA: PLACA ORTOTRÓPICA . . . . . . . . . . . . . 98
3.5.2.1.- Soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.5.3.- PLACA ORTOTRÓPICA CON COSTILLAS . . . . . . . . . . . . . . . . . 99
3.5.4.- MODOS PROPIOS EN PLACAS NO RECTANGULARES . . . . . 100
3.5.5.- IMPEDANCIA DE PLACAS REALES . . . . . . . . . . . . . . . . . . . . . . 101
3.5.6.- MODELO IMPEDANCIA PLACA . . . . . . . . . . . . . . . . . . . . . . . . . 104
3.5.6.1.- Modelo de “campo próximo aislado” . . . . . . . . . . . . . . . . . . 107
3.5.6.2.- Modelo de “campo próximo tonal” . . . . . . . . . . . . . . . . . . . . 109
3.5.7.- AMORTIGUAMIENTO DE LAS NOTAS Y COEFICIENTE “R”
DE LA PLACA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Identificación Automática de Acordes Musicales V Tesis Doctoral
CAPÍTULO 4: MODELO . . . . . . . . . . . . . . . . . . . . . . 1154.1.- PARÁMETROS DE DISEÑO DE CUERDAS DEL PUENTE DE AGUDOS115
4.1.1.- COEFICIENTE DE INARMONICIDAD . . . . . . . . . . . . . . . . . . . . . 121
4.1.1.1.- Efecto de un B erróneo en el patrón generado: sensibilidad del
modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.1.2.- MODELOS ADAPTABLES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.1.3.- AFINACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.1.4.- ENTRENAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.1.5.- PATRONES ESPECTRALES A GENERAR PARA LA
IDENTIFICACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.2.- ALGORITMO DETECCIÓN NOTAS AGUDAS PARA
ENTRENAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.2.1.- DETECCIÓN DEL FUNDAMENTAL PARA DETERMINAR
AFINACIÓN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.2.2.- DETECCIÓN DEL SEGUNDO PARCIAL PARA CALCULAR B 141
4.2.3.- APLICACIÓN DEL ENTRENAMIENTO AL MODELO . . . . . . . 152
4.3.- MODELO PARA NOTAS GRAVES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.3.1.- LONGITUD DE LAS CUERDAS GRAVES . . . . . . . . . . . . . . . . . . 154
4.3.2.- FACTOR DE CARGA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
4.3.2.1.- Densidad lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.3.2.2.- Tensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.3.3.- INARMONICIDAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
4.3.4.- RADIO EXTERIOR DE LAS CUERDAS GRAVES . . . . . . . . . . . . 159
4.3.5.- ASIGNACIÓN DE VALORES DEL RADIO INTERNO Y
FACTOR DE CARGA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
4.3.6.- COEFICIENTE DE INARMONICIDAD CALCULADO POR EL
MODELO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
4.4.- ENTRENAMIENTO del MODELO DE NOTAS GRAVES . . . . . . . . . . . 164
4.4.1.- RESULTADOS Y VALIDACIÓN DEL ENTRENAMIENTO . . . . 166
4.5.- MEJORA DEL MODELO DE GRAVES . . . . . . . . . . . . . . . . . . . . . . . . . . 169
Identificación Automática de Acordes Musicales VI Tesis Doctoral
4.5.1.- AFINACIÓN DEL PRIMER MODO LONGITUDINAL . . . . . . . . 169
4.5.2.- MANTENIMIENTO DE LA CURVA DE “MASA VIBRANTE” . 171
4.5.3.- MODELO REVISADO: SIN HIPÓTESIS INICIAL DE CURVA
DE TENSIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
4.5.4.- RESULTADOS Y VALIDACIÓN DEL MODELO CON
ENTRENAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.6.- OPTIMIZACIÓN DEL ENTRENAMIENTO DEL MODELO DE
GRAVES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
4.6.1.- MODELO CON VARIACIÓN DE LA CURVA DE LONGITUD . 179
CAPÍTULO 5: RECONOCIMIENTO . . . . . . . . . . . . . 1835.1.- MÉTODO DE RECONOCIMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
5.2.- APLICACIÓN DEL MODELO: GENERACIÓN DE PATRONES . . . . . 186
5.2.1.- INARMONICIDAD, AFINACIÓN Y MEDIDA DE PARCIALES . 186
5.2.1.1.- Otras aproximaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
5.2.2.- EFECTO DE LA PLACA RESONANTE . . . . . . . . . . . . . . . . . . . . . 189
5.2.3.- ANCHURA DE PULSOS DE LOS PATRONES . . . . . . . . . . . . . . 190
5.2.4.- MULTIPATRONES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.2.5.- ESTRUCTURA DE NIVELES EN LOS PATRONES:
CANTIDAD Y PONDERACIÓN DE PARCIALES . . . . . . . . . . . . . . 195
5.3.- IDENTIFICACIÓN DE NOTAS SUELTAS . . . . . . . . . . . . . . . . . . . . . . . 198
5.3.1.- TÉCNICAS DE PREPROCESADO: LIMPIEZA DEL ESPECTRO
A ANALIZAR. UMBRALIZACIÓN DE NIVELES BAJOS . . . . . . . 198
5.3.2.- RESULTADOS APLICANDO MULTIPATRONES . . . . . . . . . . . . 200
5.3.3.- PREDETECCIÓN DE OCTAVA . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
5.3.3.1.- Predetección mediante transformada ondicular . . . . . . . . . . 204
5.3.3.2.- Predetección mediante zonas y bandas . . . . . . . . . . . . . . . . . 205
5.3.3.3.- Aplicación de la predetección . . . . . . . . . . . . . . . . . . . . . . . . 209
5.4.- RECONOCIMIENTO DE ACORDES: ITERACIÓN Y SUSTRACCIÓN
ESPECTRAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.4.1.- MÉTODO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
Identificación Automática de Acordes Musicales VII Tesis Doctoral
5.4.2.- MÁSCARAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.4.3.- LÍMITES EN LA IDENTIFICACIÓN DE NOTAS DENTRO DE
UN ACORDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
5.4.3.1.- Sustracción Espectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
5.4.3.2.- Espectro multi-nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
5.4.4.- EVALUACIÓN DE LA DETECCIÓN . . . . . . . . . . . . . . . . . . . . . . 217
5.5.-RECONOCIMIENTO DE ACORDES: VALIDACIÓN DE NOTAS
IDENTIFICADAS EN UN ACORDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
5.5.1.- MÉTODO 1: VALIDACIÓN DE LA ÚLTIMA NOTA
DETECTADA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
5.5.2.- MÉTODO 2: VALIDACIÓN POR ORDENACIÓN DE
CANDIDATOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
5.5.3.- MÉTODO 3: VALIDACIÓN POR ORDENACIÓN ESPECTRAL
DE NOTA DETECTADA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
5.5.3.1.- Resumen de los 3 primeros métodos . . . . . . . . . . . . . . . . . . . 222
5.5.4.-MÉTODO 4: VALIDACIÓN MEDIANTE VERIFICACIÓN
DEL FUNDAMENTAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
5.6.- RECONOCIMIENTO DE ACORDES: ESTRATEGIA DEFINITIVA
DE VALIDACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
5.7.- IDENTIFICACIÓN DE ACORDES CORTOS . . . . . . . . . . . . . . . . . . . . . . 226
5.8.- IDENTIFICACIÓN DE ACORDES DE OTRO PIANO . . . . . . . . . . . . . . 231
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN . . . . . 2336.1.- INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
6.2.- ALGORITMO DEFINITIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
6.3.- ACORDES A IDENTIFICAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
6.4.- TABLAS DE RESULTADOS: ACORDES CERRADOS y LARGOS . . . 236
6.4.1.- ALGORITMO CON VALIDACIÓN ALTA . . . . . . . . . . . . . . . . . . 236
6.4.2.- ALGORITMO CON VALIDACIÓN MEDIA . . . . . . . . . . . . . . . . . 239
6.4.3.- ALGORITMO SIN VALIDACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . 243
6.5.- TABLAS DE RESULTADOS: ACORDES ABIERTOS . . . . . . . . . . . . . . . 246
Identificación Automática de Acordes Musicales VIII Tesis Doctoral
6.6.- TABLAS DE RESULTADOS: ACORDES CORTOS . . . . . . . . . . . . . . . . 247
6.7.- TABLAS DE RESULTADOS: PIANO YAMAHA C3 . . . . . . . . . . . . . . . 249
6.8.- FIGURAS DE PROCESOS DE IDENTIFICACIÓN DE ACORDES . . . . 251
6.8.1.- FIGURAS DE IDENTIFICACIÓN DE ACORDES CERRADOS
LARGOS CON VALIDACIÓN ALTA Y SUSTRACCIÓN [A,P] . . . 251
6.8.2.- NIVELES DE RESIDUOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273
CAPÍTULO 7: CONCLUSIONES . . . . . . . . . . . . . . . . 275
ANEXOS: TABLA de NOTAS y ABREVIATURAS . . . . . 281
BIBLIOGRAFÍA: REFERENCIAS . . . . . . . . . . . . . . . . 287
Identificación Automática de Acordes Musicales 1 Tesis Doctoral
CAPÍTULO 1: INTRODUCCIÓN
1.1.- PANORÁMICA
La detección de señales musicales polifónicas está teniendo amplio tratamiento en los
últimos años [Klapuri 00][Bello 00][Marolt 00][ Brown 99][Fernandez-Cid 98 ]. Sin embargo el
éxito varía mucho con el instrumento y es especialmente complejo en el caso del piano. Es objetivo
de esta tesis aportar elementos a la solución de la identificación de acordes de piano.
La detección polifónica tiene una utilidad directa en la transcripción automática. Dicha
transcripción puede llegar a ser útil para sistemas de escritura musical automática, para sistemas
de conversión forma de onda a MIDI o incluso para identificación automática de fragmentos
musicales.
La escritura musical automática es útil para compositores y músicos pues facilita la
conversión de su tarea creativa a la formalización en papel pautado.
La conversión a MIDI permite obtener archivos reducidos para posterior generación
electrónica de dichos sonidos a partir de muestras del mismo tipo de instrumento o incluso permite
generar sonidos de otros instrumentos a partir de los sonidos del instrumento original. Puede
llegarse como cosa original a obtenerse generación electrónica de acordes de instrumentos cuya
ejecución física los impide (por ejemplo instrumentos de viento). Esto ya se puede hacer a partir
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 2 Tesis Doctoral
de la ejecución en un teclado MIDI, pero podría llegar a hacerse a partir de una grabación de
música de piano.
La identificación automática de fragmentos musicales tiene aplicación en sistemas de
clasificación automática con interés en generación automática de metadatos para trasmisión o
archivo.
1.2.- SOLUCIÓN QUE SE PROPONE
Se trata de obtener un sistema de identificación automática de acordes. Para ello lo que
se plantea es un sistema de identificación basado en reconocimiento de patrones. La identificación
del patrón más cercano se realizará evaluando medidas de similitud, como la del producto interno
entre la señal y cada uno de los patrones.
Los patrones serán espectrales, más concretamente, se compondrán del valor de las
frecuencias del fundamental y parciales, su anchura espectral y su nivel, lo que permitirá generar
un conjunto de espectros patrones, que serán comparados con el espectro real.
Los patrones se generarán a partir de un modelo. Dicho modelo generará los patrones a
partir de unos pocos parámetros. El modelo y los parámetros tienen en cuenta las ecuaciones y
valores físicos y acústicos del piano. Dichos parámetros podrán ajustarse mediante entrenamiento
para cada piano que vaya a identificarse. Se analizará la posibilidad de considerar parámetros con
variaciones típicas, de forma que se creen varios conjuntos de patrones, evitando así la necesidad
de entrenamiento previo.
Debido a la similitud en valor de frecuencias de parciales de notas separadas una octava,
aparece una fuente de posible confusión en la identificación de patrones, que se evitará mediante
métodos de predetección de octava o incluso de procesado previo de la señal.
1.3.- DESCRIPCIÓN GENERAL DEL PROBLEMA
Para entender el problema de la identificación de acordes de piano, tanto desde el punto
de vista de la complejidad y especificidad del espectro a identificar como de los aspectos a
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 3 Tesis Doctoral
Fig.1.-Partes del piano [Berg 82]
considerar para la generación de patrones mediante un modelo del piano, conviene presentar una
descripción de dicho instrumento.
1.4.- DESCRIPCIÓN DEL PIANO
El piano está compuesto de varios elementos ensamblados entre sí. La caja o estructura
soporte, la placa resonante, el marco de cuerdas y las cuerdas.
La estructura soporte o caja está hecha de madera de gran densidad e idealmente no
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 4 Tesis Doctoral
debería vibrar, sin embargo, su rigidez no es infinita y algo de vibración se transite a ella y de ella
se radia como sonido según sus modos propios. Dicha estructura soporte acoge al teclado y a los
mecanismos de acción de los martillos. También pertenece a ella el clavijero, que es una pieza de
madera sobre la que se atornillan las clavijas de tensar (afinar) las cuerdas. La tapa del piano
también es parte de la caja
La placa resonante es unos de los elementos esenciales en la generación y emisión del
sonido. Es una plancha de madera de pícea, un tipo de abeto, con un grosor de alrededor de 1cm.
La plancha se realiza ensamblando entre sí tableros de unos 15cm de ancho conservando la
dirección de la veta. Debido a que la madera tiene un comportamiento anisótropo en lo que a
rigidez se refiere, la dirección de la veta (una de las direcciones de la placa) presenta un módulo
de elasticidad de Young (del orden de 13GN/m2) mientras que la dirección perpendicular presenta
un módulo de elasticidad unas 60 veces inferior como media [Conklin 96b]. Para evitar esta gran
diferencia de valores la placa suele llevar unas costillas o nervios en la dirección perpendicular a
la veta para aumentar la rigidez en dicha dirección [Giordano 97]. Este comportamiento
anisótropo afecta a los valores de los modos propios de la placa.
La placa también lleva adherida a ella un listón de madera que recorre la placa
describiendo una curva. Este listón se denomina puente y es el que transmite la vibración de las
cuerdas a la placa resonante, ya que en la superficie superior tiene contacto con las cuerdas. Los
pianos tienen dos puentes, uno para las notas más graves, denominado “puente de graves” y otro
para las notas medias y agudas, denominado “puente de agudos”.
El marco es un elemento metálico realizado de aleaciones cuya finalidad es soportar las
cuerdas, y más concretamente aguantar la gran tensión que acumulan todas ellas una vez afinado
el piano. La tensión de las cuerdas es casi constante en todas ellas y del orden de 600 N a 800 N,
siendo mayor en las cuerdas de notas graves [Conklin 96b]. Debido a la existencia de 88 notas,
la mayoría de las cuales se producen con un unísono de tres cuerdas, la fuerza total que debe
aguantar el marco que sujete los extremos de las cuerdas es del orden de 200000N,
correspondiente a un peso de 20000kg. Los problemas de deformación son claves en su diseño.
El peso típico de un marco de cuerdas actual es de 170 kg [Conklin 96b].
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 5 Tesis Doctoral
En el marco también se encuentran las clavijas finales de las cuerdas. En el extremo más
lejano al teclado, esta clavija es fija y solidaria al marco. Además están las piezas donde apoyan
las cuerdas antes de llegar a la clavija y que hacen que la cuerda no roce la superficie del marco
al vibrar. En el extremo más cercano al teclado, las clavijas deben permitir la afinación, por lo que
no son solidarias con el marco sino que lo atraviesan para ir a “morder” la madera del clavijero
que se dispone por debajo de esa parte del marco. Al atravesar el marco por un agujero ceñido al
tamaño de la clavija, las fuerzas laterales debidas a tensión de la cuerda se transmiten al marco que
es quien sujeta la clavija. A este lado del marco también se disponen piezas que separan la cuerda
del marco y que además determinan el comienzo realmente vibrante de la cuerda (trastes y “capo
d’astro”).
Las cuerdas son de acero, la longitud y la densidad lineal varían de nota a nota para
permitir la vibración a la frecuencia adecuada. La densidad lineal se varía modificando la sección
de la cuerda de acero (densidad de material kg/m³ es constante). Por tanto, las cuerdas cambian
de longitud y de radio. La mayoría de las notas usan tres cuerdas. Las notas más graves usan sólo
2 o incluso 1 cuerda, pero son cuerdas con entorchado, un recubrimiento espiral metálico que
incrementa su masa (densidad lineal) sin hacer uso de cuerdas de mayor diámetro. El uso de varias
cuerdas permite conseguir varios aspectos[Benade76]: mayor impedancia de la cuerda con más
propagación de energía a la placa vibrante y obtención del doble decaimiento temporal de las notas
(muy típico del piano) al combinar la oscilación de una frecuencia con otra de frecuencia
ligeramente distinta. Para ello, una de las cuerdas se afina al sonido a conseguir y la otra u otras
dos se afinan ligeramente por encima (apenas unos pocos cents).
Las cuerdas se apoyan en el puente gracias al diseño de este, del marco y de la caja, de
modo que la cuerda queda a ras con él. Unas piezas metálicas permiten la unión firme de la cuerda
al puente de forma que la cuerda describe una ligera curva antes de seguir hacia la clavija fija del
marco. Esa curva permite minimizar la propagación de energía hacia el trozo restante de la cuerda.
Puede decirse por tanto que la longitud vibrante de la cuerda está delimitada por el traste del
marco cerca de las teclas y por el puente en el otro extremo. Esto no es del todo cierto y el
sobrante de cuerda posterior al puente suele amortiguarse con un trozo de fieltro.
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 6 Tesis Doctoral
Fig.2.-Elementos esenciales que establecen el principio de funcionamiento de un piano. Se muestra una seccióna lo largo de una cuerda. La izquierda corresponde a la zona cercana a las teclas del piano.
La cuerda es accionada por el martillo, que controlado por la tecla y el mecanismo
(denominado “acción” o “accionador”) impacta sobre el grupo de cuerdas de la nota provocando
la vibración al unísono de las dos o tres cuerdas. Se suele denominar “unísono” al conjunto de
cuerdas de una nota. El accionador incluye una pieza con fieltro (“apagador”) que se apoya sobre
las cuerdas una vez que la tecla se suelta y que provoca la extinción más rápida de la nota. Si dicha
pieza no apoyase, como ocurre al pisar el pedal de “sustain”, la cuerda seguiría vibrando incluso
después de soltar la tecla, permaneciendo su sonido durante el tiempo correspondiente.
1.4.1.- ESTRUCTURA BÁSICA DEL PIANO
La figura 2 muestra el principio básico de la estructura del piano.
1.4.1.1.- Elementos vibrantes
Una cuerda, realmente un hilo de acero, se fija por los dos extremos a un marco rígido de
metal. Uno de los extremos (el de la derecha en la figura 2) se une al marco de forma fija. El otro
extremo se une a un tornillo que está enroscado en una pieza de madera anexa al marco por debajo
de él, denominada clavijero. Este tornillo sirve para ajustar la tensión de la cuerda y así su
afinación. La cuerda queda apoyada, en este lado, en un punto del marco cercano al tornillo de
afinación que puede estar implementado de dos maneras, recibiendo en cada caso la denominación
de “agraffe” o de “capo d’astro”.
Cerca del extremo que está unido fijo al marco, se sitúa por debajo de la cuerda, una barra
de madera que está unida a la placa resonante del piano y que se denomina puente. La vibración
de la cuerda se transmite a través de ella a la placa, que actúa de diafragma emisor (placa
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 7 Tesis Doctoral
Fig.3.-Vista de un piano* con los elementos fundamentales reseñados
Fig.4.-Agraffe. Las notas graves y medias apoyan lacuerda al marco mediante unas piezas solidarias aeste, que disponen de agujeros por los que pasa lacuerda. Al estar a un nivel inferior que los tornillosde afinación, la cuerda se apoya en dichas piezas enla parte superior del agujero. La posible vibración deltramo de cuerda entre estas piezas y los tornillos seamortigua mediante un material absorbente (colorrojo)
Fig.5.-Capo d’astro. En las notas más agudas, elagraffe no existe y el apoyo se realiza en la parteinferior de la pieza del marco metálico quetrascurre por encima de las cuerdas. El materialamortiguador (color rojo) elimina la vibracióndel tramo de cuerda desde el capo d’astro hastael tornillo de afinación.
resonante o “soundboard”). Una pieza metálica con dos vástagos fijan el puente a la cuerda,
haciendo que el conjunto de cuerda y placa estén mecánicamente acoplados. Esa misma pieza
hace que el resto de la cuerda se comporte como una cuerda independiente, aunque acoplada a
la primera. La vibración de este segundo tramo de cuerda se amortigua. En definitiva, suele
considerarse que la cuerda acaba en el puente.
*Piano de cola Yamaha usado para la
grabación en el Teatro Real de Madrid.
Fotografías tomadas por el autor.
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 8 Tesis Doctoral
1.4.1.2.- Elemento excitador: “actuador” y martillo
La vibración es excitada mediante el golpe de un martillo de fieltro en la cuerda. La
amplitud de la vibración es proporcional a la velocidad con que el martillo golpea la cuerda, la que
a su vez es proporcional a la fuerza con que el pianista pulsa la tecla.
El martillo es una pieza de madera recubierta de fieltro que va pegado a aquella y que tiene
una forma redondeada por donde impacta con la cuerda.
El sonido producido depende de la forma concreta de dicha zona de impacto así como del
estado de la superficie del fieltro (más o menos rígido). Si la superficie es dura se acentúan los
armónicos superiores de la vibración de la cuerda y el sonido resultante es más brillante. La
superficie del fieltro se puede endurecer mediante el tratamiento del fieltro con un hierro caliente.
Si la superficie es blanda, los armónicos superiores se reducen de nivel y el sonido es más suave.
La superficie del fieltro se puede ablandar pinchándola con alfileres [Backus 69]. El mecanismo
del martillo debe permitir diversas funciones [Backus 69]:
-El martillo debe impactar la cuerda cuando el pianista pulse la tecla.
-Una vez excitada la cuerda, el martillo no debe seguir en contacto con la cuerda, pues
amortiguaría la vibración. Así pues, el martillo debe retroceder a su posición inicial.
-En el caso de que el pianista mantenga pulsada la tecla, el martillo que ha retrocedido, no
debe volver a impactar sobre la cuerda.
-Si el pianista vuelve a pulsar la tecla rápidamente, el martillo debe volver a impactar sobre
la cuerda. Esta acción debe poderse hacer incluso aunque la tecla no haya retrocedido a
su posición de reposo sino que bastará que la tecla haya subido la mitad de su recorrido.
- La vibración de la cuerda persistirá hasta que la tecla vuelva a su posición inicial (no
pulsada), en ese momento se extinguirá la vibración (más o menos rápidamente) mediante
un elemento amortiguador (denominado “apagador”)
La figura 6 muestra un mecanismo actuador (“action”) que consigue lo indicado
anteriormente. Este mecanismo está asociado a cada tecla y en un piano existen tantos como
teclas. La explicación del funcionamiento queda fuera del interés de este trabajo y puede
encontrarse en varios textos [Backus 69] [Askenfelt 90][Askenfelt 91].
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 9 Tesis Doctoral
Fig.6.-Mecanismo accionador o actuador de un piano de cola [Backus69]
1.4.2.- ASPECTOS ESPECÍFICOS
El piano presenta además ciertos aspectos muy específicos que conviene resaltar, de
momento de manera somera al tratarse de una introducción..
1.4.2.1.- Cuerdas triples (unísono)
Aunque la base es la excitación de una cuerda, la realidad es que la mayoría de las notas
de un piano se obtienen por la excitación simultánea de tres cuerdas con afinación muy parecida
pero no igual entre ellas (figura 7).
Las notas más graves son las que presentan una agrupación de sólo dos cuerdas o incluso
sólo una (figura 8). La agrupación de cuerdas en una nota se denomina unísono.
1.4.2.2.- Zona de excitación
La posición de la cuerda donde el martillo impacta también afecta a la vibración y por tanto
al sonido producido. La posición de excitación en los pianos suele situarse entre un séptimo y un
octavo de la longitud en gran parte del rango de las notas. La razón de la elección es simplemente
de calidad subjetiva del sonido obtenido frente a otras posiciones probadas por los fabricantes.
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 10 Tesis Doctoral
Fig.7.-Unísonos de notas medias y agudascon cuerdas triples. [Piano de cola Yamahadel Teatro Real de Madrid. Fotografías delautor]
Fig.8.- Unísonos de notas graves con cuerdassimples y dobles
Se sabe que los parciales cuya vibración defina un nodo en el punto de excitación, no serán
excitados. Por tanto, parece deducirse que el séptimo u octavo parcial no serían excitados. Sin
embargo, el martillo no excita un solo punto de la cuerda sino una cierta zona por lo que el
resultado real es que sí se excitan los parciales séptimo y octavo, aunque con menor nivel. Un
estudio detallado aparece en [Hall 87c]. También la dimensión del martillo afecta a que ciertos
parciales se exciten con menor nivel [Benade 76].
1.4.2.3.- Vibración y afinación del unísono
Si se deja que la vibración desaparezca por sí misma, es decir, si no se suelta la tecla y no
actúa el elemento apagador, una parte de la energía se disipa por fricción con el aire y la otra parte
se transmite a la placa resonante del piano [Backus 69]. También se sabe que la extinción de la
vibración se realiza en dos tramos, primero decrece rápidamente y luego más despacio [Weinreich
77]. Esta característica se debe a que la afinación de las tres cuerdas de cada nota se realiza para
conseguir dicho efecto. Si se afinara para obtener una única pendiente de caída, el sonido no
parecería de piano [Afinador 00]. Por tanto, la afinación de las tres cuerdas que pertenecen a cada
nota, se realiza de modo que haya una cierta diferencia de afinación entre cada una de las tres. Es
lo que se denomina la afinación del unísono. Esta afinación asegura el decrecimiento de niveles
indicado anteriormente y la prolongación de la duración de la vibración. Los test de escucha
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 11 Tesis Doctoral
seguidos indicaban que las cuerdas de una misma nota deben afinarse con una separación de pitch
entre 1 y 2 cents [Backus 69] [Kirk 59].
1.4.2.4.- Ruido de piano
La vibración del piano va acompañada de considerable cantidad de ruido. Dicho ruido se
debe principalmente al mecanismo: La pulsación de la tecla supone un ruido del dedo contra la
tecla y de la tecla contra el marco del teclado, el golpe del martillo sobre la cuerda no sólo la
excita sino que provoca un cierto ruido, el mecanismo actuador con sus diversas piezas provoca
ruidos durante su uso, a pesar de estar recubiertas de fieltro.
Este ruido no suele ser fácilmente identificable por el oyente, pero su ausencia en una señal
sintetizada, provoca una clara diferencia de sonido respecto al original [Backus 69].
1.4.2.5.- Inarmonicidad
Las cuerdas del piano no reaccionan como cuerdas perfectamente elásticas, cuya fuerza
recuperadora se debe sólo a la tensión. En realidad, la cuerda presenta una rigidez, especialmente
alta por estar fabricadas de acero. Al ser curvada por el choque del martillo, la fuerza de
recuperación no sólo depende de la tensión, sino también de la rigidez, lo que modifica la ecuación
diferencial de la vibración.
En general, la aportación de la rigidez incrementa la fuerza de recuperación, aumentando
la aceleración de la cuerda y aumentando así la frecuencia de la vibración de todos los parciales.
Además, la fuerza de recuperación debida a la rigidez es mayor a mayor curvatura de la cuerda,
lo que provoca que las oscilaciones de mayor frecuencia (al provocar una curvatura mayor que
las de baja frecuencia) presenten aún mayor frecuencia. Por eso, los distintos parciales van
incrementando su frecuencia respecto al valor de frecuencia armónica, lo que hace que la
distribución de parciales no sea armónica. Este comportamiento se denomina “inarmonicidad”.
La inarmonicidad es una característica inherente al sonido del piano, sin embargo no debe
llegar a ser excesiva. Se ha comprobado que la inarmonicidad depende de la longitud de la cuerda,
siendo mayor si la cuerda es más corta [Fletcher 63]. Así, hay diferencias de sonido entre pianos
CAPÍTULO 1: INTRODUCCIÓN
Identificación Automática de Acordes Musicales 12 Tesis Doctoral
de cola larga y otros pianos, especialmente en notas graves, debido a que los de cola tienen
cuerdas más largas, presentando menor inarmonicidad. El efecto sobre la percepción de las notas
más graves se acentúa si tenemos en cuenta que la frecuencia fundamental de dichas notas apenas
es radiada y además es percibida por el oido con menor sensibilidad, por lo que debe ser
reconstruirla por diferencia entre el segundo y tercer parcial (efecto no lineal del oido). A mayor
cantidad de inarmonicidad, menos se parecerá dicha resta al valor real del fundamental realmente
emitido.
1.4.2.6.- Afinación del piano
La existencia de inarmonicidad provoca que los parciales superiores de una nota no
coincidan con los fundamentales de notas más altas, lo que suele considerarse necesario para una
sensación de sonido armónico. Para remediar dicha situación las notas se afinan “desafinadas”
respecto al valor teórico de la escala temperada. Esta característica muy propia del piano es
dependiente de la inarmonicidad de las cuerdas, la cual a su vez depende de las longitudes, por lo
que la afinación suele ser distinta entre pianos [Afinador 00][Lattard 93].
1.4.2.7.- Efecto de carga de la placa resonante
Las cuerdas no están fijas en sus dos extremos. El extremo del puente presenta una
impedancia mecánica alta pero no infinita, lo que modifica las condiciones de vibración de las
cuerdas. El efecto es que la frecuencia de cada parcial depende también de la impedancia vista en
el puente. Dicha impedancia es fundamentalmente la de la placa resonante modificada en valor por
el efecto de adaptación de impedancias mecánicas producido por el propio puente
Una segunda consecuencia de que el extremo no sea fijo es que la impedancia que se ve
en el puente incluye el efecto de la impedancia presentada por el resto de las cuerdas.
Identificación Automática de Acordes Musicales 13 Tesis Doctoral
Identificación Automática de Acordes Musicales 14 Tesis Doctoral
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 15 Tesis Doctoral
CAPÍTULO 2: REVISIÓN y OBJETIVOS
2.1.- INTRODUCCIÓN
En este capítulo se hace una presentación de documentación existente sobre aspectos
relevantes en Tesis que se presenta. Como conclusión se exponen las líneas del trabajo que se
realiza en esta Tesis, indicando los objetivos y los aspectos claves de los métodos.
2.2.- REVISIÓN SOBRE HERRAMIENTAS PARA ANÁLISIS DE
SEÑALES MUSICALES
2.2.1.- TRANSFORMADA ESPECTRAL DE Q CONSTANTE
Este método usa una transformada cuyo resultado equivale al uso de un banco de filtros
de hasta 1/24 de octava [Brown 91].
2.2.2.- REPRESENTACIÓN TIEMPO-FRECUENCIA DE ALTA RESOLUCIÓN
USANDO DISTRIBUCIÓN MODAL.
Partiendo de la idea de la distribución Wigner se obtiene una mejora del análisis de
transitorios frente a métodos con ventanas como transformadas de Fourier o transformadas de Q
constante [Pielemeier 96].
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 16 Tesis Doctoral
2.2.3.- “GENERALIZED HARMONIC ANALYSIS (GHA)”
Es un análsis tiempo-frecuencia. Resulta útil para señales no estacionarias. Presenta mayor
resolución espectral que transformada de Fourier con tramos cortos de señal, evitando el
efecto del enventanado.[Terada 1994]
2.2.4.- “REASSIGNED SPECTROGRAMS”
Realiza una extracción de características que permite clasificar los espectros como :
sinusoide, transitorio o ruido. De esta manera facilita la búsqueda de parciales.
[Hainsworth 2001].
2.2.5.- TRANSFORMADA ONDICULAR (WAVELET)
En la línea de transformadas de Q constante pero con más libertad de elegir la
transformación mediante la selección de la ondícula madre. La representación es tipo
tiempo-frecuencia pero con la salvedad de que la frecuencia viene representada
indirectamente por el término “escala”. Se han realizado aplicaciones en esta tesis para
analizar sonidos de piano, diseñando una ondícula madre a partir de un tramo de nota de
piano. [Ortiz 00] [Ortiz 01]
2.2.6.- TRANSFORMADA DE FOURIER
Es el método por defecto. Sus inconvenientes pueden ser despreciados si los tramos a
analizar son suficientemente largos para que la resolución espectral sea suficiente y la
ventana es adecuada a la aplicación que se busca. Si se requiere representación tiempo-
frecuencia se recurre a la implementación de STFT
2.3.- REVISIÓN SOBRE CLASIFICACIÓN DE SONIDOS E
INSTRUMENTOS MUSICALES
2.3.1.- RECONOCIMIENTO Y CLASIFICACIÓN DE LOS TIPOS DE MÚSICA
Se ha presentado un trabajo [Lambrau 98] usando para identificar tipos de música (rock,
jazz,..) usando transformada ondicular y una posterior extracción de características estadísticas
para realizar una clasificación usando reconocimiento de patrones de dichas características
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 17 Tesis Doctoral
obtenidas en entrenamiento previo.
2.3.2.- RECONOCIMIENTO Y CLASIFICACIÓN DE INSTRUMENTOS MUSICALES
El uso de coeficientes cepstrales para reconocimiento de instrumentos de viento-madera
ha sido presentado en varios trabajos [Brown 98][Brown 99] [Brown 01] incrementando cada uno
el número de instrumentos incluidos en el reconocimiento hasta llegar a incluir saxofón, oboe,
clarinete y flauta.
Una sofisticación en el reconocimiento de instrumentos es la identificación de entre varios
instrumentos distintos del mismo tipo. Así, en el caso del piano se han analizado diversos métodos
para identificar un piano respecto a otro. El entrenamiento establece patrones de cada piano para
su posterior reconocimiento. Se han realizado pruebas usando transformaciones tiempo-frecuencia
(STFT, wavelet, wavelet packet,...) [Delfs 97] y también extrayendo características del ataque
[Delfs 98].
La generalización del reconocimiento a cualquier instrumento supone un incremento de
posibilidades que sugiere el uso de un método jerarquizado. Se ha propuesto una metodología de
tres niveles [Martin 98]
Nivel 1: Identificar si es un instrumento tocado en pizzicato o en sostenido
Nivel 2: Identificar la familia
Nivel 3: Identificar el instrumento
No se incluye el intento de reconocer entre dos instrumentos iguales.
El uso de coeficientes cepstrales y características temporales tratados estadísticamente se
ha usado en un trabajo [Eronen 00] que ha entrenado e identificado 30 instrumentos distintos
incluso con distintos estilos de excitación. El resultado ha sido ampliado incluyendo predicción
lineal y coeficientes cepstrales mel-frecuencia [Eronen 01].
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 18 Tesis Doctoral
2.4.- REVISIÓN SOBRE DETECCIÓN DEL PITCH Y DEL
FUNDAMENTAL
Este es un problema ampliamente trabajado y resuelto con mayor o menor éxito
dependiendo del instrumento, siendo el piano el más complicado.
Los métodos más tradicionales son el uso de la autocorrelación [Rabiner 77] y el uso de
cepstrum [Noll 67].
El uso de análisis tiempo-frecuencia con transformadas enventanadas combinadas se ha
presentado [Klapuri 99 ] como método con suficiente precisión en las octavas 3 y siguientes,
mientras que presentan evidente limitaciones en octavas bajas al depender de la longitud de las
ventanas. Para la identificación del pitch, y de la nota en definitiva, se afirma que es suficiente
detectar la frecuencia del fundamental con un error inferior a un semitono.
Los métodos tradicionales de autocorrelación y cepstrum se han comparado con el uso de
Espectro Generalizado [Black 00] usando ventanas de sólo50ms con overlap de 50%, para
sonidos de tuba, flauta, violín y piano consistentes en una nota repetida durante 5 segundos (sólo
las notas C2,C3 y C4) y los resultados no han sido mejores para el espectro generalizado que para
los tradicionales
También se ha usado la autocorrelación como parte de algoritmos de detección
monofónica más sofisticados [Monti 00]
2.5.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA
El uso de métodos de identificación de pitch usados iterativamente para detectar 2 notas
simultáneas [Klapuri 98] [Klapuri 99] exige realizar una sustracción espectral de la primera nota
detectada antes de realizar la detección de la otra nota.
Otros métodos no usan la identificación iterativa pues ésta presenta problemas cuando
la sustracción espectral no es buena y permanecen parciales altos de las notas ya detectadas, que
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 19 Tesis Doctoral
a su vez parecen nuevas notas a ser detectadas.
La discriminación de parciales de más de una nota simultánea, cuya separación es inferior
a la que existe entre parciales de una misma nota o que incluso llegan a coincidir, es una de las
tareas a las que más esfuerzo se ha dedicado. Así, se han probado métodos como:
-La interpolación espectral para aumentar la resolución de una FFT [Mcleod 98]
-La detección de parciales cuyo orden es número primo para poder discriminar entre notas
relacionadas armónicamente [Klapuri 98],
-Transformada de Fourier Multiresolución que calcula varias representaciones tiempo-
frecuencia de la señal mediante transformada de Fourier (STFT) con longitud de ventana
variable [Keren 98]. El análisis conjunto de las diversas transformadas a distintas
resoluciones permite obtener conclusiones.
-El modelo sinusoidal multiescala [Fernández-Cid ] realiza una labor parecida pero las
diversas transformadas de Fourier se calculan sobre las salidas de un banco de filtros que
realiza una transformada ondicular (“wavelet”) de 4 escalas. Una vez más, la
discriminación de parciales y sus notas exige un análisis posterior de dichas medidas.
El tratamiento estadístico del problema tiene una referencia en el uso del modelo de
sinusoides armónicas con análisis Bayesiano y estimación de parámetros mediante MCMC
(“Markov Chain Monte Carlo”) [Walmsley 99]. Partiendo de la afirmación de que los métodos
con coeficientes cepstrales no son útiles para polifonía y considerando que las frecuencias útiles
para definir la nota existen a lo largo de mucho tiempo (no desaparecen pronto ni aparecen de
repente, no son transitorias sino estacionarias), se propone analizar su comportamiento estadístico
a lo largo de muchos “frames” de análisis tiempo-frecuencia. Dicho análisis puede hacerse con
probabilidades condicionadas a apariciones en frames anteriores mediante método bayesiano. Las
búsquedas del método persiguen obtener conclusiones según un orden, primero determinar el
número de notas que suenan, luego el número de armónicos de cada nota. Su ventaja es que se
puede intentar aplicar a cualquier instrumento.
En la línea de planteamientos de gran complejidad computacional y de sistemas
inteligentes, se han descrito:
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 20 Tesis Doctoral
-Análisis tiempo-frecuencia adaptativo para alta resolución. Cada valor asociado a un par
de las variables tiempo-frecuencia se obtiene mediante un filtro que maximiza una medida
de concentración de energía local tipo Kurtosis [Jones 90]. Este método presenta graves
problemas computacionales.
-Siguiendo con la idea anterior de adaptar filtros del análisis tiempo-frecuencia, se puede
recurrir a técnicas de inteligencia artifical tipo IPUS(“Integrated Processing and
Understanding of Signal” [Lesser 95]) para aplicar el conocimiento sobre sonidos
musicales al ajuste de los filtros. Se ha presentado un método con filtros gausianos de Q
constante aplicado a sonidos de 2 notas [Mani 98].
2.6.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA ESPECÍFICA DE
PIANO
El problema de identificación polifónica en pianos no sólo reside en el método de análisis
de la señal sino también en el proceso de decisión a partir de dichas medidas. Tener buenas
representaciones tiempo-frecuencia no es suficiente para realizar una buena detección de las notas
del sonido polifónico (por ejemplo, acorde)
La detección de notas y polifonía en piano haciendo uso de un método de identificación
respecto a bases de datos espectrales ha sido probada [Rossi 97], si bien la base de datos usada
requería el análisis previo de todas las notas del piano en concreto, por lo que se pierde toda
generalidad. Del análisis tiempo-frecuencia mediante transformada de Fourier (STFT) de todas
las notas se extraen los valores de las frecuencias de los parciales, lo que constituye la base de
datos. En la identificación, se calcula la STFT de la señal y se extraen los valores de frecuencia de
los máximos locales. Dichos valores son los que se comparan con la base de datos. Este tipo de
extracción de datos espectrales en función simplemente de máximos presenta serios errores para
notas de piano de octavas altas, como se explicará más adelante. Además, los datos de la base no
pueden considerarse suficientes para establecer un patrón espectral.
Estudios que persiguen la detección polifónica específica de piano y hacen uso de técnicas
de inteligencia artificial y redes neuronales son:
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 21 Tesis Doctoral
-El uso de multiagentes para implementar un mecanismo de percepción para el
reconocimiento de las notas [Privosnik 98]. Se aplica sobre los datos obtenidos en un
análisis tiempo-frecuencia previo. El estudio presentado no usaba un buen análisis tiempo-
frecuencia y propone mejorarlo mediante uso de transformada ondicular. Sólo presentaba
éxito con algunas notas del piano.
-Las redes neuronales se proponen en un trabajo [Marolt 00] con un método más
complicado de análisis espectral. Primero se realiza un análisis tiempo-frecuencia con un
modelo auditivo (modelo cloquear) que incluye filtrado multibanda. Las salidas de los
filtros atacan a unos osciladores adaptativos que emulan una señal lo más parecida pero
sólo con sinusoides. Esta fase es denominada “partial tracking”. Se usan 88 osciladores
cada uno delos cuales ataca a un circuito neuronal que es el que realiza el reconocimiento
en base a unos patrones desarrollados por él mismo durante la fase de entrenamiento.
Las bondades de este método son un 99% de aciertos en acordes de notas de octavas altas
y un 96% en acordes de notas graves. Los inconvenientes son: persisten los errores por
confusión entre octavas (notas separadas un número entero de octavas), se han requerido
400000 acordes para el entrenamiento, los osciladores adaptativos están ajustados a la
frecuencia teórica de las notas del piano ( es decir, no consideran la afinación tan específica
del piano que llega a suponer variaciones de hasta 40 cents en algunas notas) y que los
osciladores incluyen una serie de subosciladores que implementan los parciales que están
ajustados a frecuencias armónicas (es decir, no se tiene en cuenta la marcada
inarmonicidad de las notas del piano). Otro gran inconveniente es que el trabajo reconoce
que para el entrenamiento y los reconocimientos ha usado sonidos sampleados tomados
de un CD y que los acordes no estaban sampleados sino que los han compuesto
sintéticamente a partir de las notas sampleadas. En resumen, no se han hecho pruebas del
sistema con sonidos directos de un piano ni con acordes ejecutados como tales por un
pianista.
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 22 Tesis Doctoral
2.7.- REVISIÓN SOBRE MODELADO
El uso de modelos para generar patrones de diversos tipos para comparar con el sonido
a analizar y determinar las notas existentes es otra línea de solucionar el problema. Bien es cierto
que muchos de los modelos son presentados como modelos para síntesis de sonidos de un cierto
instrumento.
Sobre modelado de instrumentos de viento pueden resaltarse los trabajos sobre simulación
de la producción de sonido en el dominio temporal de los instrumentos de viento-metal (excitados
por la vibración de los labios) [Adachi 95] y el modelado de flauta [Ystad 00].
El modelado del piano ha tenido menos resultados debido a su gran complejidad. Existen
varios trabajos que describen el comportamiento físico y acústico del piano y de los que se pueden
sacar elementos para desarrollar un modelo. De ellos se irá dando cuenta a lo largo de la
explicación del modelo diseñado en esta Tesis. Trabajos que se refieran al uso de modelos para
síntesis (aplicables a generación de patrones) y para reconocimiento de piano son:
-Modelado tipo excitación múltiple y filtrado [Laroche 94]. No consigue buenos
resultados para piano ni siquiera considerando la existencia de sonidos tipo percusivos.
-Modelado tipo excitación y filtrado pero con la técnica de “conmutación” que permite
intercambiar la posición de excitadores y filtros del sistema resonante de modo que se
pueden tener excitaciones previamente filtradas formando una tabla de ondas [Smith 95].
La limitación es que al tener el martillo real un comportamiento no lineal, la conmutación
no puede realizarse tan “transparentemente”. El trabajo presentado indica la realización
de síntesis polifónica de hasta 2 notas.
El modelado espectral tampoco ha tenido mucha atención:
-Modelado del espectro de piano mediante pulsos con la forma de la función de
distribución de Cauchy [Chong 99].
Existen trabajos que desarrollan modelos parciales, referidos a ciertos detalles del piano,
a los que se irá haciendo referencia a lo largo de esta Tesis
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 23 Tesis Doctoral
2.8.- RESULTADOS PRESENTADOS EN LOS TRABAJOS REVISADOS
De los trabajos revisados, ninguno ha presentado resultados para el margen completo de
notas del piano ni para un amplio rango de acordes. Ninguno presenta pruebas con acordes de 4
notas y apenas unos pocos usan acordes de tres notas. La discriminación de tan sólo dos notas
parece ser un problema suficientemente complejo para la mayoría de los métodos presentados.
Por otro lado muy pocos trabajos con pruebas sobre sonidos de piano se han realizado con
sonidos de pianos grabados directamente por los investigadores. En muchos casos se ha recurrido
a archivos de muestras de notas sueltas. No queda claro si dichos archivos han sido previamente
limpiados, en base a decisión humana, de elementos que acompañan a sonidos reales y que pueden
suponer una fuente de confusión para los sistemas de reconocimiento automáticos “on-line”. En
algunos casos se reconoce incluso que los acordes no fueron ejecutados como tales sino
sintetizados mezclando varias notas sueltas.
Algunos métodos requieren entrenamiento excesivo (redes neuronales y otros de
inteligencia artifical), otros requieren de un entrenamiento razonable y algunos aparentemente no
requieren de entrenamiento, pero implementan en la etapa de decisión conocimientos previos,
sobre los sonidos musicales, desarrollados o conocidos por quien elabora el método.
Los únicos trabajos que han indicado claramente que usen diversos pianos para las pruebas
son los trabajos que intentan identificar un piano frente a otro, pero sin identificar notas ni acordes.
Los pianos muestran suficientes diferencias entre ellos que afectan a la distribución espectral de
los parciales de las notas, entre ellas las más notables: afinación y curvas de longitud y radio de
las cuerdas que afectan a la inarmonicidad.
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 24 Tesis Doctoral
2.9.- TRABAJO A REALIZAR EN ESTA TESIS
2.9.1.- OBJETIVO GENERAL
Se va a desarrollar un sistema de identificación de acordes de 3 y 4 notas aplicado
principalmente al piano, basado en un sistema de reconocimiento de patrones generados por un
modelo.
2.9.2.- PLANTEAMIENTO DEL MÉTODO
A continuación se describe el método que se propone usar para conseguir el objetivo
general.
2.9.2.1.- Patrones y Entrenamiento
Los patrones para identificar las notas y acordes, son generados por el propio sistema
durante una etapa de entrenamiento. Los patrones consisten en espectros de las notas con varios
parciales centrados en las frecuencias adecuadas y con los anchos adecuados. Dado que la bondad
del método depende del número de notas entrenadas, se ha intentado llegar a un compromiso pues
no resulta razonable plantear que el entrenamiento exija el uso de todas las notas.
Los patrones no se generarán simplemente a partir de los datos medidos durante el
entrenamiento, sino que dichos datos serán procesados mediante la aplicación de un modelo que
tendrá en cuenta aspectos físicos, acústicos y de diseño de pianos. De esta manera se podrá
obtener una extrapolación de los datos de unas pocas notas usadas en el entrenamiento, para
generar fiablemente los patrones de las 88 notas del piano.
La validez del proceso de entrenamiento podrá verificarse, opcionalmente, con la
identificación de notas sueltas, antes de proceder a la identificación de acordes. Así, el método
sirve para identificar tanto acordes (polifonía) como notas sueltas (monofonía)
El entrenamiento asegura la validez del método de identificación para pianos distintos. Se
estudiará el uso de un modelo único para intentar identificar acordes de varios pianos y se
comprobará si el entrenamiento es necesario.
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 25 Tesis Doctoral
2.9.2.2.- Identificación de Acordes
La identificación de acordes se realizará mediante una identificación iterativa de las
diversas notas que lo componen, realizando una sustracción espectral de cada nota identificada.
La sustracción espectral se realizará en base a una máscara calculada de forma análoga al
patrón correspondiente a la nota identificada. Esto puede dejar restos de parciales en la señal, pues
tanto las máscaras como los patrones usados para reconocer, tienen un número de parciales
suficiente pero no siempre completo (especialmente en graves). En caso de residuo excesivo, el
sistema generaría unas máscaras extendidas para realizar la sustracción espectral.
Para eliminar los problemas de ambigüedad entre octavas que aparecen al comparar una
señal con patrones de todas las octavas, se realiza una predetección del rango de la octava para
disminuir el número de patrones usados en el reconocimiento eliminando los que puedan causar
problemas de ambigüedad. Esta predetección puede crear problemas en la identificación de los
acordes abiertos (los que tienen las notas repartidas en dos octavas consecutivas).
2.9.2.3.- Acordes y Señales a Identificar
Las notas y los acordes a identificar serán de todas las octavas del rango del piano, tanto
de graves como de octavas altas. Se identificarán diversos tipos de acordes, entre ellos: mayores,
menores, con séptima disminuida, cerrados y abiertos. El uso de acordes de más de 4 notas es
poco frecuente y no se considera objetivo de esta Tesis. La polifonía debida a dos manos, típica
en el piano, tampoco será abordada.
Las señales usadas para entrenar y para identificar provendrán de pianos acústicos
grabados “in-situ” en salas de ensayo, con ejecución de las notas y de los acordes a usar por parte
de un pianista o estudiante de piano.
Las notas se usarán para el entrenamiento y los acordes directamente para la identificación.
Los acordes se ejecutarán de dos maneras: “stacatto” y “legato”. “Stacatto” supone un
ataque rápido de los dedos a las teclas desde una posición separada de ellas y una suelta rápida
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 26 Tesis Doctoral
de las teclas. Es la forma de ejecutar acordes de corta duración pues el apagador cae sobre la
cuerda apenas soltar la tecla. “Legato” supone pulsar las teclas de forma suave a partir de una
posición de la mano con los dedos apoyados en ellas, y sin soltar las teclas una vez pulsadas. Da
lugar a acordes de larga duración.
2.9.3.- OBJETIVOS CONCRETOS
Implementar el método descrito supone llevar a cabo una serie de objetivos concretos.
Son objetivos de esta tesis:
1-Desarrollar un modelo de piano que permita obtener patrones para reconocimiento.
A partir de las bases acústicas de la vibración de cuerdas y de documentación específica
sobre pianos, se acopian los detalles teóricos y prácticos de los aspectos que influyen en el
espectro de una nota de piano. Algunos se desarrollarán con más detalle del existente y se irá
comprobando su acercamiento a las medidas disponibles. Con los detalles suficientes se realizará
una simplificación del modelo para que pueda depender del menor número posible de parámetros.
Se realizará el ajuste del modelo en base a las medidas disponibles identificando cuales de
ellos son muy dependientes de los datos concretos, de modo que podamos establecer posibles
necesidades de aprendizaje del modelo al ser usado para identificar acordes de otro instrumento.
El modelo se elaborará en dos partes, que se integrarán posteriormente, una dedicada a
las notas medias y agudas y otra centrada en las notas graves, ya que presentan suficientes
diferencias en su implementación física.
Este modelo simplificado permitirá generar patrones espectrales de todas las notas del
piano. Estos patrones podrán tener en cuenta la distribución de amplitudes de los parciales o
simplemente su posición y anchura espectral, según resulte ser suficiente para la identificación. De
igual manera, el número de parciales generados en el modelo será suficiente para asegurar la
identificación.
El modelo permitirá generar patrones de notas sueltas.
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 27 Tesis Doctoral
2-Utilizar dichos patrones para la identificación de notas y acordes
El conjunto de patrones generados se compararán con la señal a identificar mediante
métricas sencillas. En los casos más complejos se podrá recurrir a generar patrones variables o
conjunto de patrones asociados a una única nota (“multipatrón”), para cubrir varias posibilidades
de algún parámetro del modelo.
3-Optimizar la identificación mediante predeterminación de octavas y procesado previo
de la señal.
Se desarrollará una transformada ondicular específica basada en una ondícula madre
obtenida a partir de la propia señal de piano. El análisis de la transformada ondicular diádica nos
consigue detalles en base a octavas, lo que nos permitirá por un lado aislar ciertas componentes
espectrales de la señal a identificar y tener más detalle para su análisis si fuese necesario, y por otro
predeterminar con cierto margen la octava a la que pertenece la señal (nota o acorde) a identificar,
lo que mejora notablemente el proceso de identificación.
La ondícula madre se escalará con cierto número de compresiones y expansiones
suficientes para cubrir el espectro de las señales.
A pesar del esfuerzo que se dedique a la predetección con transformada ondicular, no será
totalmente aplicada pues una predetección octava a octava presenta problemas con los acordes
abiertos. Se desarrollará una predetección más global basada en la transformada de Fourier, que
permita seleccionar zonas espectrales y bandas (de al menos 2 octavas cada una)
4-Comprobar la validez del modelo para identificación de otros pianos
La grabación de otros pianos para intentar identificar sus acordes, permitirá comprobar la
validez del modelo de generación de patrones con otros instrumentos y guiarnos en la
determinación de necesidades de adaptación del modelo mediante entrenamiento o mediante
patrones múltiples con parámetros variables dentro de un margen.
5-Valorar posibles estrategias de aprendizaje en el modelo.
De los aspectos que recomienden aprendizaje, se propondrán posibles métodos, basados
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 28 Tesis Doctoral
en la identificación previa de cierta cantidad de notas sueltas concretas. Se valorará la cantidad de
notas necesaria para el aprendizaje y la fiabilidad obtenida en la identificación.
2.9.4.- MATERIAL Y GENERALIZACIÓN DE RESULTADOS
2.9.4.1.- Pianos acústicos y salas de ensayo
Ya se ha indicado que las señales tanto para entrenar el modelo como para ser identificadas
se obtienen de pianos acústicos mediante grabación del sonido emitido, lo que supone que el
método funciona para situaciones reales, si bien algo controladas.
El sonido grabado es el que directamente se obtiene de un piano sin ningún procesamiento
de limpieza, y por tanto incluye ruidos mecánicos propios del piano.
La sala de ensayo presenta un tiempo de reverberación no despreciable, por lo que el
sonido grabado contiene cierto nivel de ella, si bien es poco pues el micrófono se posiciona cerca
de las cuerdas que en cada momento vibran y por tanto cerca de la placa resonante, primando el
campo acústico directo sobre el reverberante.
Además, la sala de ensayo usada, perteneciente al Teatro Real de Madrid, no presenta un
aislamiento perfecto respecto a ruidos exteriores de tráfico rodado, por lo que no es descartable
que en algunos casos se tenga grabado parte de ruido ajeno al piano.
En conclusión, aunque las condiciones de grabación se han cuidado, los sonidos pueden
no estar totalmente libres de elementos ajenos, lo que es más cercano a situaciones reales.
2.9.4.2.- Grabación y procesado
La grabación se realiza con micrófono de condensador de gama profesional de estudio de
grabación y se registra en cinta de audio digital DAT con muestreo de 44.1kHz y 16 bits de
cuantificación, consiguiendo así respetar un ancho de banda de audio completo y teniendo un
margen dinámico alto para poder tener señales con bajo ruido pero sin distorsiones no lineales
causadas al sistema de grabación. El equipo grabador DAT usado es también de gama profesional.
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 29 Tesis Doctoral
Así, las componentes no lineales que aparezcan serán debidas al piano y no al equipo de
grabación.
Las señales grabadas se transfieren al ordenador mediante una tarjeta digitalizadora, pues
no se disponía de una tarjeta con entrada digital directa, ajustada también para trabajar con
44.1kHz de frecuencia de muestreo y 16 bits de cuantificación.
La estimación del espectro de los sonidos grabados se realiza mediante el cálculo de la FFT
de dicha señal enventanada con ventana Hanning. Para ciertas pruebas se ha utilizado ventana
Kaiser, que aunque disminuye la resolución en frecuencia permite un mayor margen dinámico en
los valores obtenidos de la FFT.
2.9.4.3.- Señales grabadas
De cada uno de los pianos que se han grabado, se ha realizado el siguiente registro:
-Todas las 88 notas del piano con vibración libre y actuación tipo “legato”. Cada tecla se
ha pulsado suavemente y se ha mantenido durante 3 segundos. Después se ha soltado la
tecla y el apagador ha actuado sobre la cuerda. No se ha pulsado la siguiente tecla hasta
no haberse extinguido el sonido de la anterior.
Esta grabación es esencial para realizar el entrenamiento (aunque en ese caso sólo se usan
algunas de las notas y no todas) y para realizar la verificación de la detección de notas
sueltas. Esta verificación es importante para evaluar la bondad del entrenamiento, pero no
necesaria para realizarlo.
-6 acordes en cada una de las 7 octavas completas (42 acordes en total) con dos
ejecuciones distintas, una en “legato” manteniendo la nota tres segundos y luego soltando
las teclas; y otra en “stacatto” pulsando rápidamente las teclas y soltándolas apenas unas
décimas de segundo más tarde para que actúe el apagador. En total son 84 acordes.
Estos 6 acordes con dos de 3 notas y cuatro de 4 notas, todos ellos con las notas
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 30 Tesis Doctoral
dentro de la misma octava.
Esta grabación es la usada para identificar dichos acordes.
-1 acorde abierto en cada una de las octavas 1 a 6 con ambas ejecuciones. en total 12
acordes. Estos acordes abiertos tienen una de sus notas en la octava adyacente
inmediatamente superior.
Con esta grabación verificamos la validez del método ante notas pertenecientes a
octavas distintas, lo que es una de las problemáticas del uso de predetección de octava.
2.9.4.4.- Generalidad del método: robustez frente a cambio de piano
Para poder asegurar la generalidad del método y que sus resultados sean aplicables a
pianos en general, y dado que no se dispone de una amplia base de datos de grabaciones de pianos
acústicos en las condiciones descritas anteriormente, se ha desarrollado el trabajo de la siguiente
manera.
Se han grabado tres pianos de cola. Dos pianos de cola Yamaha iguales (marca y modelo)
pero grabados en momentos distintos, por lo que presentan diferencias de afinación aún siendo el
afinador de ambos la misma persona. El tercero es un piano de gran cola (casi 3 metros de
longitud) de marca distinta (Steinway), afinado por la misma persona.
La grabación del primer piano Yamaha se ha utilizado durante la fase de desarrollo y
validación del modelo de generación de patrones.
Para evitar que pudiera parecer que los patrones se ciñen “empíricamente” a las notas de
ese piano facilitando la identificación, no se ha procedido a identificar acordes de dicho piano.
En la segunda fase, el modelo ya diseñado, se ha entrenado con notas sueltas del piano
Steinway, claramente distinto al usado para desarrollar el modelo, y por tanto no sospechoso de
ceñirse “particularmente” a los patrones.
CAPÍTULO 2: REVISIÓN Y OBJETIVOS
Identificación Automática de Acordes Musicales 31 Tesis Doctoral
Como tercera fase, se ha procedido a identificar acordes del piano Steinway con los
patrones generados durante el entrenamiento de la fase anterior.
Durante esta tercera fase se han realizado ajustes en el algoritmo de identificación, pero
que no afectan al modelo de cálculo de patrones, sino a aspectos de número de parciales a usar
en los patrones y máscaras; y aspectos de la sustracción espectral.
Por último, se ha aplicado el método completo a las grabaciones del otro piano Yamaha.
Identificación Automática de Acordes Musicales 32 Tesis Doctoral
Identificación Automática de Acordes Musicales 33 Tesis Doctoral
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
En este capítulo se describen las ecuaciones teóricas que rigen el comportamiento de
diversos elementos del piano, lo que nos permitirá presentar la interrelación entre ellos así como
la problemática de elaborar un modelo acústico completo, lo que nos llevará a desarrollar un
modelo simplificado.
El uso de modelos basados en aspectos físicos ya han sido usados por ciertos autores para
ciertos elementos del piano [Giordano 97]
En este capítulo se plantean las bases que se usarán en el modelo para generación de
patrones. Sin embargo, no todos los aspectos que aquí se tratan dan lugar a un método que incluir
en el modelo. Esto se debe a que no todos los comportamientos acústicos pueden ser modelados
de forma sencilla, ni siquiera como primera aproximación. El objetivo de este trabajo no es dar
solución a las cuestiones acústicas sino elaborar en base a ellas un modelo simple que facilite la
identificación de notas y acordes mediante patrones espectrales.
Quedarán en este capítulo justificadas muchas de las expresiones y aproximaciones que
se usarán en el desarrollo del modelo, presentado en el siguiente capítulo, así como algunas
decisiones que se aplicarán a éste. Especial relevancia tienen los desarrollos sobre el efecto del
extremo no fijo de la cuerda y el efecto de la rigidez de la cuerda sobre las frecuencias de
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 34 Tesis Doctoral
vibración. Dado que la vibración de la cuerda está influida por las características de la placa, es
inevitable su inclusión en el modelo, aunque sea de forma simplificada. Por tanto también se
presentan los aspectos sobre vibración de placas que justifican lo complicado que resulta su
inclusión en un modelo.
3.1.- VIBRACIÓN DE CUERDAS FLEXIBLES
La aproximación más sencilla a la vibración de cuerdas es la que supone que son flexibles
y por lo tanto la única fuerza restauradora que se involucra en el movimiento es la debida a la
tensión a la que está sometida la cuerda. A veces se les denomina “perfectamente elásticas”
indicando que no existe término de elasticidad en la ecuación diferencial.
3.1.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN
Para cuerdas flexibles, la ecuación diferencial obtenida es:
∂∂ ρ
∂∂
2
2
2
2
yt
T yxL
= (2)
La vibración tiene lugar según la dirección “y” y la propagación según la dirección perpendicular
“x”.
3.1.2.- SOLUCIONES GENERALES
La solución general compleja:
y Ce ex j t= γ ω (3)
aplicada a esta ecuación diferencial da como resultado γ=±jk, con k=ω/c. Cada solución tiene dos
términos.
La ecuación diferencial es por tanto cumplida por soluciones armónicas de la forma:
y(x, t) = Ae + Bej( t-kx) j( t+kx) ω ω (4)
que se corresponden con diversas ondas propagándose en sentidos contrarios con frecuencias “ω”
y con números de onda “k”. No debe perderse de vista que “k” no es independiente sino que es
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 35 Tesis Doctoral
función de la frecuencia: k=ω/c.
La velocidad de propagación es:
cT
L
=ρ
(5)
En la mayoría de los casos se tiene un número infinito de valores discretos de ωn y kn que
son característicos de los denominados “modos propios” de la vibración, y que permiten escribir
la ecuación (4) de la forma:
y x t A j t k x B j t k xn n nn
n n n( , ) [ exp( ( )) exp( ( ))]= − + +∑ ω ω (6)
Los valores de las frecuencias de los modos propios se obtienen particularizando estas
soluciones según las condiciones de contorno que se corresponden con los elementos de fijación
de los extremos de la cuerda. Además se suelen obtener ciertas relaciones entre los valores de An
y Bn. Los valores de An y Bn quedan establecidos al aplicar las condiciones iniciales establecidas
por la excitación de la cuerda.
Debe tenerse en cuenta que An y Bn pueden ser complejos, por lo que en realidad deben
obtenerse 4 valores de coeficientes, además de los valores de las frecuencias de los modos
propios.
3.1.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS Y AMORTIGUAMIENTO
Como se ha indicado, las condiciones de contorno hacen referencia a los aspectos de la
fijación de los extremos de la cuerda. Existen dos tipos de aspectos a tener en cuenta, que dan
lugar a al menos hasta 4 condiciones de contorno posibles.
El primer tipo de aspecto tiene que ver con el método de sujeción y afecta a la forma física
que puede tomar la cuerda en las cercanías de dicha sujeción. Así, si los soportes son tipo
mordaza (“clamped string”) la cuerda debe mantenerse horizontal en la cercanía del soporte, por
lo que la derivada de y(x,t) respecto a x (“pendiente”) debe ser nula [Esta condición de contorno
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 36 Tesis Doctoral
sólo puede darse en cuerdas con rigidez o en barras y no en las flexibles como se justificará]. Si
el soporte es tipo apoyo, ya sea en enganche (“hinged string”) o en borde (“knife edge”) [también
llamado traste o agraffe según el instrumento] la cuerda podrá moverse alrededor del apoyo y la
derivada primera anteriormente indicada no será nula. Sin embargo, la cuerda en la posición de
dicho apoyo sólo podrá tomar forma recta por lo que la segunda derivada respecto a “x” será nula.
Si la cuerda está libre en un extremo (caso que no ocurre en un instrumento, pero que puede
aproximarse si el apoyo vibra muy libremente), son la segunda y tercera derivadas respecto a “x”
las que se anulan, al no haber fuerzas de torque ni cizalladura.
El segundo tipo de aspecto tiene que ver con la impedancia mecánica que presenta el
elemento de sujeción a la cuerda. Si esta impedancia no es infinita, la cuerda y el elemento de
sujeción presentan vibración en esa posición. Esto impone normalmente una ecuación de la
velocidad de la vibración (derivada de y(x,t) respecto a t) en función de la impedancia mecánica
del soporte y de la fuerza aplicada por la cuerda. A su vez, la fuerza aplicada por la cuerda
depende, al ser flexible, de la tensión y de la forma que toma la cuerda en la zona del soporte.
La aplicación de dichas condiciones de contorno llevan, entre otros, al cálculo de los
modos propios y las frecuencias de vibración. También llevan, en el caso de extremos
impedantes, a introducir un factor de amortiguamiento de la vibración de la cuerda, adicional al
propio de la cuerda, debido a la transferencia de energía al soporte, y que normalmente es el que
resulta determinar el amortiguamiento efectivo de la vibración de la cuerda.
Veamos a continuación algunos casos.
3.1.4.- MODOS PROPIOS PARA CUERDA CON EXTREMOS FIJOS
La solución típica que se encuentra en la mayoría de los textos [Kinsler 88] es la que se
corresponde a las condiciones de extremos fijos. En dicho caso, la impedancia mecánica que ve
la cuerda en sus extremos (x=0 y x=L) es infinita por lo que no hay movimiento en dichos puntos.
Las condiciones son: y(0,t)=0 e y(L,t)=0 y dan lugar a:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 37 Tesis Doctoral
A BA B j kL A j kL j kL
= −= − = ⇒ =exp( ) exp( ) exp( )2 2 2 1
(7)
En definitiva, debe cumplirse que:
2 2 1 2kL n k nL
con n
ck
n
n n
= ⇒ = =
=
ππ
ω
, , .....
(modos propios) (8)
y las ondas tendrán una ecuación de la forma:
y x t jA sen k x j t
C jD sen k x j t C y D reales
n nn
n n nn
n n
( , ) ( ) exp( )
( ) ( ) exp( )
= − =
= +
∑
∑
2 ω
ω (9)
La conclusión, de momento definitiva, de aplicar las condiciones de contorno es que los
modos propios de vibración, y por tanto las componentes espectrales, tienen como valor de
frecuencia:
f ncL
nL
Tn
L
= =2
12 ρ
(10)
donde se ha tenido en cuenta que la velocidad de propagación es la dada en la ecuación (5)
En cuanto al amortiguamiento, dado que la impedancia presentada por el soporte es
infinita, no existe cesión de energía desde la cuerda al soporte y por tanto la única causa de
amortiguamiento es el propio de la cuerda, que tiene valores extremadamente bajos. Puede
comprobarse que se suele evitar incluir en las ecuaciones diferenciales los términos
correspondientes al amortiguamiento y por tanto tampoco aparecen en las ecuaciones de las
soluciones. Sin embargo eso no impide que se pueda hacer referencia cualitativa a él.
Los textos que incluyen su tratamiento suelen imponer ciertas restricciones para poder
obtener soluciones a las ecuaciones [Kinsler 88]. Las situaciones más simples de
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 38 Tesis Doctoral
amortiguamiento imponen un decrecimiento exponencial con el tiempo de los coeficientes de
amplitud.
Por último comentar que no se ha especificado si los extremos fijos están abrazados
(“clamped”) o apoyados en enganche o sobre bordes (“hinged” “knife edge”). Si estuvieran
abrazados y no pudiera haber “pendiente” de la cuerda en los extremos, la vibración dejaría de
existir, pues al estar controlada por la tensión como fuerza recuperadora, la cuerda debe formar
ángulo para que exista componente vertical debida a la tensión. De hecho, si se aplican las
ecuaciones de contorno para dicho caso, saldría A=-B y A=B, lo que sólo puede cumplirse si
A=B=0, y no existiría vibración. Esto es conforme con la advertencia ya indicada de que la
condición de contorno tipo “clamped” no puede darse en cuerdas flexibles. Por tanto sólo cabe
la posibilidad de que estén apoyados.
3.1.5.- EXTREMO IMPEDANTE: CUERDA FIJA-NO FIJA
En el caso de que alguno de los extremos, en el caso del piano sólo uno de ellos, esté
fijado a un elemento que permita el movimiento, la impedancia mecánica no es infinita sino que
tendrá un cierto valor, por lo que diremos que el extremo es “impedante”.
La cuerda, al deformarse por la vibración, ejerce una fuerza sobre dicho elemento que
tiene la expresión (para el extremo derecho de la cuerda):
f TyxL x L= =
∂∂
(11)
que es controlada por la tensión de la cuerda y en la que se ha obviado el vector unitario pues la
dirección de la fuerza sigue la dirección del desplazamiento “y”. Si la cuerda tiende a subir en la
proximidad del extremo derecho, la pendiente es negativa y la fuerza lo es, pues la tensión hace
que la cuerda realice fuerza hacia abajo, contraponiéndose al movimiento.
Dado que la impedancia es una característica del elemento de sujeción, la cuerda se ve
obligada a moverse en dicho punto con una velocidad que es:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 39 Tesis Doctoral
• = = − +
• = − − −
• = −• − − =
= − − − −
=
uyt
j j t A jkL B jkL
yx
jk j t A jkL B jkL
A B extremo fijojA j t jkL jkL
jkTA j tZ
jkL jkL extremo impedante
L
x L
SB
∂∂
ω ω
∂∂
ω
ω ωω
exp( )[ exp( ) exp( )]
exp( )[ exp( ) exp( )]
exp( )[exp( ) exp( )]exp( )
[ exp( ) exp( )]
(13)
uT
ZyxL
SB x L
= −=
∂∂
(12)
en la que la dirección del vector unitario de velocidad es contrario al de la fuerza ejercida por el
soporte sobre la cuerda y por eso aparece el signo negativo. La impedancia mecánica del soporte
se ha denominado “impedancia debida a la placa resonante ZSB (‘SoundBoard’)” dado que la placa
resonante (que ya hemos presentado en el capítulo de “Introducción”) es el elemento del piano
que determina principalmente esta impedancia.
La ecuación 12 es la condición de contorno para el extremo derecho de la cuerda. Si el
extremo izquierdo está fijo, su condición será y(0,t)=0, por lo que la solución general queda
particularizada teniendo en cuenta:
lo que lleva a que debe cumplirse que:
tg k L jTkZSB
( ) =ω
(14)
condición que determina el valor de los modos propios y cuya resolución no es sencilla por no
ser analítica y requerir de métodos gráficos o numéricos para calcular dichos modos propios.
Diversos textos presentan la resolución para situaciones particulares de ZSB, concretamente
para impedancia tipo masa con ZSB=jωM e impedancia real (resistiva) con ZSB=R [Kinsler 88].
Algunos muestran curvas que indican soluciones más genéricas pero sin entrar a resolverlas
[Rossing 95] referidas a trabajos previos, los cuales se basan, no en resolver la ecuación 14, sino
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 40 Tesis Doctoral
en evaluar el efecto de la placa resonante considerando que la cuerda, a frecuencias cercanas a
la de uno de sus modos propios, se podría comportar como un sistema de segundo orden [Gough
81].
Debe tenerse en cuenta que aunque en las condiciones de contorno aparezcan términos
debidos a efectos de elasticidad, esto no modifica el comportamiento de la cuerda en cuanto a
flexible.
En este apartado se van a resumir las resoluciones para el caso tipo masa, resistivo
y elástico dadas por Kinsler [Kinsler 88] por ser interesantes para incluir una discusión
simple (y por tanto con limitaciones para el caso del piano) destinada a adquirir cierta
“intuición” de la situación; y por último se va a presentar la resolución para un caso general
de impedancia de la placa resonante (que denominados caso de “soporte multimodal”).
Como podrá verse, se hace mucho hincapié en comparar la situación con la de cuerda fija-
fija pues esta última se considera básica como primera aproximación al problema de diseñar las
cuerdas del piano.
Debe tenerse en cuenta además que una placa resonante real presenta una distribución no
uniforme de modos propios, siendo muy distanciados en frecuencias bajas y muy densos en
frecuencias altas, por lo que la impedancia que presenta a bajas frecuencias puede en ocasiones
asumirse como predominantemente tipo masa (si la frecuencia de vibración es superior a un modo
propio de la placa y muy inferior al siguiente), elástica (si la frecuencia de la vibración es algo
inferior a un modo propio pero muy superior al modo propio anterior) o incluso resistiva (si la
frecuencia de vibración coincide con un modo propio de la placa).
Más adelante, en este capítulo, se presenta un modelo de la placa resonante en el que la
impedancia se modela como la suma de admitancias debidas a los diversos modos. También se
comentarán las posibilidades de incluirlo como parte del modelo total. Sin embargo, usar ese
planteamiento en estos cálculos iniciales se sale del intento de establecer un modelo simple y una
explicación sencilla del fenómeno a modelar.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 41 Tesis Doctoral
Fig.10.-Resolución gráfica de los modos propios (k) para extremo tipomasa. El eje horizontal está marcado con dos escalas. Los puntos másgrandes corresponden a los valores de k para el caso fijo-fijo. Cadaparcial se resuelve con una recta distinta. Para primer parcial, si la masaes muy pequeña puede aparecer un modo inferior al fundamental fijo-fijo.En el caso de un piano, todas las rectas tienen pendientes muy pequeñasy la variación del valor del modo propio no es excesivamente grande.
3.1.5.1.- Resolución para soporte con impedancia simple
3.1.5.1.1- Frecuencias de Modos propios para impedancia tipo masa
La ecuación de los modos propios quedará:
tg k L jTkZ
jTk
j MTM
kSB SB SB
( )( )
= = =ω ω ω ω 2 (15)
Dado que k=ω/c, no se trata de variables independientes. La resolución típica de al ecuación
anterior es mediante método gráfico. En el eje de abscisa se pone “k” y se representa por un lado
las rectas con pendiente T/(ω2MSB) que serán tantas como valores de ω se quieran representar. Por
otro lado se representan las curvas de tg(kL). Los puntos de intersección serán las soluciones a
la ecuación. Sin embargo, cada valor de ω representado da un conjunto de intersecciones, pero
sólo serán solución las intersecciones de las rectas cuyo valor de ω se corresponda con el valor
de k obtenido, al no ser variables independientes. El método pues, no sólo es gráfico sino que
requiere cierta iteración. Se obtienen infinitos valores discretos de kn y ωn, que son los modos
propios.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 42 Tesis Doctoral
Lo interesante es que con independencia de lo difícil que resulte el cálculo, puede
observarse en la figura 10, que los valores de kn (y por tanto de ωn) cumplen ciertos criterios:
-Para obtener kn=nπ/L, que coincide con los pasos por cero de la función tg(kL), la
pendiente de la recta debe ser 0, lo que exige masa infinita, es decir, soporte fijo.
-Como todas las pendientes son positivas, los cortes con la función tangente tienen lugar
a valores de k por encima del de cuerda fija-fija. Un extremo tipo masa eleva todas las
frecuencia de vibración.
-Cada parcial de la vibración tiene un ωn distinto, por lo que también es distinta la
pendiente de la recta que lo calcula. Así pues, no es una única recta con todos sus cortes
la que define todos los parciales de la vibración.
-A mayor parcial, menor es la pendiente que lo calcula y por tanto menos se separa su
valor del que tendría en el caso de cuerda fija-fija.
-Puede llegar a existir un primer modo inferior al fundamental en cuerdas fija-fija(k=π/L)
que se correspondería con vibración presentando un máximo en el soporte derecho
(L=λ/4).
Esta última afirmación describe una situación poco evidente ya que en la típica vibración
fija-fija no puede existir un modo que tenga menos de dos nulos (L=λ/2) y mucho menos que
además tenga un máximo de vibración en el extremo (caso de L=λ/4). Sin embargo al no estar
totalmente fijo el extremo, puede llegar a tener suficiente desplazamiento, que aunque no sea
necesariamente un máximo (cuerda vibrando con λ=4L), puede ser el desplazamiento
correspondiente a un punto del primer cuarto de longitud de onda de una vibración de muy baja
frecuencia. En el caso límite de que el extremo pudiera llegar a vibrar libremente (masa muy
pequeña), sí se tendría un máximo en dicho extremo. En tal caso además, los valores de k de los
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 43 Tesis Doctoral
modos propios serían múltiplos impares del fundamental k=π/2L, lo que significaría un cambio
radical respecto al caso de cuerda fija-fija
Para los instrumentos de cuerda con condiciones fijo-impedante, pueden aportarse varios
razonamientos para descartar la importancia de ese primer parcial, inferior al fundamental del
caso fijo-fijo, en el caso de que llegara a existir.
a) El extremo impedante no es muy libre, por lo que limita mucho la excursión de la
vibración provocando que dicho modo tenga muy bajo nivel espectral.
b) Tendría una frecuencia muy inferior a la mitad del fundamental fijo-fijo, lo que
supondría una disminución del tono en más de 1 octava. En los instrumentos musicales no se
aprecia una disminución de más de 1 octava en el tono de la cuerda, ni es necesario corregir la
tensión en más de 1.41 veces para compensar la bajada de frecuencia del fundamental cuando el
extremo tiene comportamiento tipo masa. Esto demuestra que dicho primer parcial no existe o
no afecta al sonido.
Por otra parte, aún existiendo dicho parcial, como la masa es alta, las pendientes de las
rectas del método gráfico (figura 10) son bajas, especialmente para parciales más altos (frecuencia
más alta). Como resultado, los valores de frecuencia calculada de los parciales 2 y siguientes
resultan ser algo superiores y cercanos a los parciales 1 y siguientes, respectivamente, del caso
fijo-fijo. Por tanto, podría seguir afirmándose que las frecuencias son las mismas que en el caso
fijo-fijo, pero ligeramente aumentadas de valor.
En definitiva, puede considerarse que en el caso de impedancia tipo masa dicha primera
componente sería, desde el punto de vista musical y en el caso de llegar a existir, una
componente de ruido sub-fundamental, con una importancia escasa dado su bajo nivel espectral.
Por último, indicar que existen otras posibilidades para acometer la resolución gráfica,
como por ejemplo manipular la ecuación 15 para obtener:
tg k L jTkZ
TM
kT
c M kSB SB SB
( ) = = =ω ω 2 2
1 (16)
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 44 Tesis Doctoral
en cuyo caso se tienen gráficas de tg(kL) y de hipérbola pero sin la iteración debida a ω .
La ecuación de la solución sigue siendo:
y x t jA sen k x j t
C jD sen k x j t C y D reales
n nn
n n nn
n n
( , ) ( ) exp( )
( ) ( ) exp( )
= − =
= +
∑
∑
2 ω
ω (17)
pues se sigue requiriendo que A=-B.
El uso de este cálculo para un piano requiere incluir el hecho de que Msb no es una
constante sino que varía como se indicará más adelante.
3.1.5.1.2- Frecuencia de Modos propios para impedancia resistiva
Esta situación lleva implícita que la masa es nula, por lo que el resultado se parecerá al
ya indicado de múltiplos impares de π/2L. Una vez más, si la vibración es limitada en excursión,
este fundamental podrá considerarse sub-fundamental y todas las frecuencias serán superiores al
caso fijo-fijo. Pero en este caso, la limitación de excursión sólo puede deberse al amortiguamiento
(resistencia mecánica) de la placa resonante. En situaciones reales de piano suele cumplirse que
este amortiguamiento es alto, sin embargo, las resoluciones teóricas como la expuesta por Kinsler
suele suponer que el amortiguamiento es pequeño, para obtener una solución analítica.
Así, para ZSB=R, la ecuación a resolver es
tg k L jTkZ
jTk
RSB
( ) = =ω ω
(18)
lo que exige que k sea complejo (pues la tangente de un número real jamás es compleja), y por
tanto deberá considerarse una frecuencia compleja pues la velocidad de propagación tampoco
puede ser compleja. Se tomará k’=k+jα y ω’=ω+jβ. Al sustituir en la solución general, α
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 45 Tesis Doctoral
determina la disminución (amortiguamiento) de amplitud con la distancia y β la disminución de
amplitud a lo largo del tiempo. Ambos son términos de amortiguamiento que modifican además
los valores de los modos propios. Además, al ser cuerda flexible Tk/ω=cρL, siendo ρL la densidad
lineal de la cuerda. La existencia de modos propios supone el cumplimiento de:
sen kL y th Lc
Ro bien
kL y th LRc
( ) ( )
cos( ) ( )
= =
= =
0
0
αρ
αρ
(19)
Si ahora se impone como es habitual en los textos teóricos la condición de
amortiguamiento suficientemente bajo: R<<ρLc , sólo puede cumplirse la segunda condición y
además podrá aproximarse th(αL)=αL, lo que nos lleva a:
αρ
≈ < <RcL
1 (20)
lo que hace que la parte imaginaria de k’ sea despreciable frente a la parte real, que determinará
los modos propios con valor:
kn
Ln =−( )1
2 π (21)
que son los mismos que para masa nula como se indicó al principio. Dado el bajo
amortiguamiento del soporte, la vibración no está limitada y la situación es similar a la de
extremo libre.
En estas condiciones, la ecuación del desplazamiento vibratorio es:
y x t Ae k x x k x j ttn n n
n
( , ) sin ( ) ( ) cos ( ) exp( )≈ +−∑ 2 2 2 2β α ω (22)
Esta típica resolución teórica no es aplicable al caso de pianos, pues el amortiguamiento
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 46 Tesis Doctoral
de la placa resonante no es pequeño. Puede verse que la condición anteriormente impuesta es
R<<ρLc , lo que supone que la resistencia mecánica de la placa sea mucho menor que la
impedancia característica de la cuerda (Zocuerda=ρLc). De hecho, la impedancia característica de las
cuerdas de piano no es la misma para todas, pero tiene valores que varían desde un valor del
orden de 1.7 Kg/s para las más agudas hasta unas 5 veces dicho valor para las graves [Conklin
96c]. El valor de R de una placa resonante es superior a 200 Kg/s, según se desprende de medidas
realizadas [Giordano 98a].
Resulta evidente que no sería posible diseñar una placa con una impedancia menor que
la impedancia característica de la cuerda. En un piano o en cualquier instrumento musical, es por
tanto necesario que la impedancia característica de la cuerda siempre sea menor que la
impedancia que impone la placa, porque así se evita que la energía de la vibración se transmita
rápidamente a la placa resonante, lo que extinguiría el sonido demasiado pronto. Esto incluye que
el valor de R (que es la menor impedancia que la placa presenta) sea mayor que la impedancia
característica de la cuerda.
Así, en piano, R>ρLc , y sería la primera condición de la ecuación 19 la que se cumpliría,
siendo α<1 y los modos propios kn=nπ/L como en el caso fijo-fijo.
A pesar de que pueden plantearse estas dos situaciones tan distintas en cuanto a relación
entre impedancia característica de la cuerda e impedancia de la placa, cabe resaltar que, aunque
sólo una es la realizable, ambas dan lugar a bajo amortiguamiento de la vibración. Además, del
primer caso expuesto, parecería deducirse que el bajo amortiguamiento de la vibración (α) está
asociado al hecho del bajo amortiguamiento del soporte (R). Sin embargo, el bajo
amortiguamiento de la vibración se corresponde realmente con el hecho de que la energía de la
onda de la cuerda no se transmita al soporte sino que permanezca en ella. Para ello el único
requerimiento es que exista una gran diferencia entre la impedancia característica de la cuerda y
la impedancia del soporte, así la onda siempre se refleja y no se transmite al soporte. Esto hace
que la vibración dure mucho tiempo, lo que se expresa como amortiguamiento (β y α) bajo.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 47 Tesis Doctoral
Así, ambos valores extremos de R frente a ρLc, presentan el mismo resultado en cuanto
a amortiguamiento de la vibración, pero diferentes comportamientos respecto a modos propios.
En definitiva, un alto valor de R, como ocurre en pianos, supone tener unos modos propios
prácticamente iguales a los de la cuerda fija-fija y un amortiguamiento de la vibración bajo.
3.1.5.1.3- Frecuencia de Modos propios para impedancia tipo elasticidad
En este caso, ZSB=-jSSB/ω, por lo que la ecuación de modos propios es:
tg k L jTkZ
jTk
jST
Sk
SB SB SB
( ) = = − =−
ω ωω
(23)
que supone una situación muy distinta de cara a la resolución gráfica pues la recta es de pendiente
única.
Sin embargo, en el caso del piano, la elasticidad varía con la frecuencia, lo que será tenido
en cuenta en el modelo del soporte multimodal.
Como puede desprenderse de la figura, no existe un “sub-fundamental” y todos los modos
propios son de frecuencia más baja que en el caso fijo-fijo. Además, los parciales mayores se
separan más del valor fijo-fijo que los parciales menores.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 48 Tesis Doctoral
Fig.11.-Resolución gráfica de los modos propios (k) para extremo tipoelasticidad. El eje horizontal está marcado con dos escalas. Los puntosmás grandes corresponden a los valores de k para el caso fijo-fijo. Todoslos parciales se resuelven con una única recta. En el caso de un piano,existirían varias rectas pues el valor de la elasticidad (que afecta a lapendiente de la recta) es distinta en la cercanía de la frecuencia de cadamodo, y volveríamos a tener una resolución gráfica iterativa.
3.1.5.2.- Frecuencias de Modos propios para impedancia genérica
Ha quedado visto que los valores de modos propios para extremo impedante tienden a
diferir respecto al caso fijo-fijo. El tipo de aspecto predominante en la impedancia determina el
sentido de la variación de las frecuencias: el predominio de masa eleva las frecuencias mientras
que el predominio de elasticidad las disminuye. El predominio de resistencia las mantiene
cercanas (casi iguales). Además, en los dos primeros casos, cuanto mayor es el parámetro del
soporte (masa o S), menores son las variaciones respecto al caso fijo-fijo, mientras que en le
tercer caso lo importante es que el parámetro R del soporte sea suficientemente alto.
El predominio de un aspecto u otro queda reflejado, en una curva cualquiera de
impedancia, por el hecho de que el valor a una frecuencia de interés sea real para resistivo,
complejo positivo (+jX) para másico o complejo negativo (-jX) para elástico.
Además, la ecuación de modos propios, con un extremo fijo y el otro impedante, puede
escribirse de la forma:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 49 Tesis Doctoral
tg k L jTkZ
cjZ
ZjZSB
L
SB
cuerda
SB
( ) = = − = −ω
ρ 0 (24)
donde se ve la interrelación de las impedancias con la resolución de los modos propios y donde
debe tenerse presente que Z0cuerda es una cantidad real (y constante para una cierta cuerda) y “k”
aparece intrínsecamente en la ω de ZSB.
3.1.6.- FRECUENCIAS DE MODOS PROPIOS PARA CUERDA FIJA-IMPEDANTE Y
SOPORTE MULTIMODAL
En la situación real del piano, la placa resonante no se comporta como un único tipo de
carga, pues no es un sistema simple sino multimodal. Así, la impedancia depende de la frecuencia
de la vibración, variando de un parcial a otro no sólo su valor sino su efecto predominante. Así,
una nota puede tener para el fundamental una carga con impedancia tipo elástico mientras que
su parcial n-simo puede estar viendo una impedancia tipo masa o incluso resistiva. Esto hace que
en realidad, la resolución de la ecuación de modos propios deba realizarse independientemente
no solo para cada nota sino también para cada parcial de cada nota, al haber cambio en las
condiciones de contorno.
En todo caso, para cada frecuencia a estudiar, la impedancia de la placa tendrá un valor
concreto y podrá aplicarse la fórmula 24 para casos genéricos.
Como consideraciones generales se puede remarcar que:
1-Parece interesante conseguir que la ZSB sea siempre mucho mayor que Z0 cuerda, para que
no solo el amortiguamiento de la vibración sea bajo, sino que también las variaciones de
frecuencia tiendan a ser pequeñas.
2-La resolución de la ecuación debe plantearse de forma numérica para su resolución por
ordenador.
3-En un piano, cada cuerda tiene una velocidad de propagación distinta, lo que hace que
la resolución de los modos propios en términos de “k” no sea suficiente. Hay que
particularizar los valores de frecuencia para cada cuerda.
4-Es necesario establecer un modelo que permita conocer la impedancia de la placa
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 50 Tesis Doctoral
(incluido el efecto del puente). El puente actúa como adaptador mecánico de impedancias,
haciendo que la impedancia vista por la cuerda no sea exactamente la de la placa, aunque
sigamos denominándola como tal.
5-La evaluación de la impedancia en una zona con modos propios separados puede
realizarse como si se tratase de un sistema de orden 2. Llamaremos “sistema de orden 2"
a un sistema masa-resorte con un grado de libertad.
6-La evaluación de la impedancia en una zona con modos propios cercanos puede
realizarse calculando la movilidad (inverso de impedancia) resultante como suma de las
movilidades de varios sistemas de orden 2, cada uno correspondiente a un modo.
7-El modelo de cálculo de impedancia de la placa debe dar resultados conformes a las
medidas existentes de impedancias de placas resonantes reales [Giordano 98a].
La primera condición (ZSB>>Z0cuerda) no puede cumplirse en una cuantía excesiva, pues
impedir la transmisión de energía al soporte y a la placa resonante conllevaría la incapacidad del
piano para emitir sonido con alto nivel, ya que es la placa la principal responsable de la emisión
del sonido al actuar como un diafragma radiador [Martin 47]. De hecho, las mejoras introducidas
a partir del año 1940 por los fabricantes más importantes como Steinway, suponen la disminución
tanto de la masa como de la rigidez de la placa resonante, unidas a una disminución del
amortiguamiento de ésta, todo lo cual lleva a una considerable mejora en la calidad musical del
sonido radiado [Bilhuber 40].
Las dos últimas consideraciones se aplican en el modelo de impedancia de placa que
hemos desarrollado y que se presenta más adelante en el apartado de vibración de placas.
Sin embargo, en esta primera aproximación al problema de la variación de las frecuencias
de vibración de las cuerdas por el efecto de la placa resonante, vamos a considerar para los
cálculos, que el efecto de los modos propios de la placa son independientes entre sí
(frecuencia de los modos alejadas).
Así, para cada frecuencia en estudio, supondremos que la placa es un sistema único de
orden 2, ajustado al modo de la placa más cercano a la frecuencia en estudio, como si el resto de
modos de la placa no afectaran. Se han considerado los casos en que la frecuencia teórica (es
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 51 Tesis Doctoral
decir, para condición fija-fija) de la cuerda esté por encima, coincidente o por debajo de la del
modo de la placa y se han considerado diversos valores de masa de la placa(MSB). Además, se ha
considerado que la excitación de cada modo de la placa supone poner en movimiento inicial una
sección de ésta de un tamaño del orden de una longitud de onda al cuadrado, lo que supone que
la masa que ve la cuerda es menor a mayor modo de la placa (en definitiva a mayor frecuencia).
La rigidez para cada modo también varía, de forma que se obtiene la frecuencia de dicho modo
como:
ω 0SBSB
SB
SM
= (25)
En definitiva, se plantea resolver con todas estas consideraciones la ecuación:
tg kL jTkZ
Tk
MT
k jkRTSB
SBL
SB SBL
( ) = =−
−
ωρ
ωρ
202 (26)
Para una cuerda dada, la tensión y la densidad lineal son unas constantes. Cada modo de
la cuerda estará cerca de un modo de la placa, por lo que MSB y RSB deberán cambiar para calcular
cada modo.
La resolución de esta ecuación sólo es posible si k es complejo. La parte real especificará
la frecuencia de vibración y la parte imaginaria establece una medida de la transferencia de
energía a la placa y por tanto del amortiguamiento que sufre la vibración.
Para simplificar, y como primera aproximación, si consideramos que la mayor variación
de frecuencia debida a la placa existe cuando la parte reactiva de la impedancia de la placa es
mayor que la resistiva (efecto de masa o de elasticidad predominante), podemos proceder a
resolver la ecuación:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 52 Tesis Doctoral
tg kL jTkZ
Tk
MT
kSBSB
LSB
( ) = =−
ωρ
ω202 (27)
que sí obtiene un valor real para k. Evidentemente esta resolución no es aplicable a frecuencias
de vibración cercanas al modo propio de la placa, pero sí permite acotar el efecto que puede llegar
a tener la placa sobre las frecuencias de vibración de la cuerda.
Este dato de acotación es muy importante para el modelo que vamos a desarrollar.
Debe tenerse en cuenta que es poco útil tener la resolución exacta de los modos propios de las
cuerdas con efecto de la placa pues en ningún caso de identificación, el modelo dispondrá de los
suficientes datos sobre la placa como para que el cálculo de la ecuación sea significativamente
aplicable a la generación de los patrones. Resulta más interesante tener una idea de la frecuencia
de la cuerda sin el efecto de la placa y luego aplicar un margen de variación máximo que
corresponda al efecto de la placa.
La resolución de la ecuación (27) se ha realizado para varios casos de valores de MSB.
También se ha incluido la consideración de que entre la frecuencia teórica fijo-fijo y la resonancia
de la placa existe una relación prefijada (relación wosb/wt). Esta consideración se debe a que al
no poder conocer los modos que realmente tiene la placa resonante (ω0SB), la ecuación no sería
resoluble. De este modo resolvemos la ecuación para cada nota, pero no de forma genérica sino
para el caso de que la resonancia de la placa sea una concreta (nótese que la frecuencia fijo-fijo
viene a ser una constante asociada a cada nota). Recalculando la ecuación para diversos valores
de esta relación, se podría componer una resolución más genérica. El valor de wosb/wt debe ser
suficientemente alto para asegurar que estemos suficientemente lejos del modo, y así la ecuación
27 tenga sentido. Tras varias pruebas, se ha elegido el valor 1.3, que como se justificará es
suficientemente alto.
Para que los resultados tengan más sentido, calculamos también la relación entre la
frecuencia real calculada resolviendo numéricamente la ecuación y la frecuencia teórica para el
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 53 Tesis Doctoral
caso fijo-fijo. A dicha relación la denominaremos Isb (“Inharmonicity due to Sound Board”)
Inarmonicidad debida a la placa resonante. La denominación inarmonicidad se debe a que los
parciales calculados no son exactamente armónicos del fundamental.
Se ha calculado para cada nota la variación de sus 10 primeros parciales. Sólo hemos
realizado el cálculo para notas por encima de C3 (fundamental hacia 130Hz), pues como se
justificará, son las que se puede asegurar siempre que estarán sometidas a cargas tipo masa o tipo
elasticidad con probabilidad variable, mientras que las notas inferiores a C3 suelen tener cargas
principalmente tipo elasticidad.
En un principio se realizaron estos cálculos usando para cada una de las notas unos
valores típicos de los parámetros de las cuerdas. Se calcularon pocas notas. Posteriormente, dado
que este aspecto bajo estudio no afecta al modelo usado durante el entrenamiento, hemos usado
el entrenamiento para extraer una aproximación de los parámetros de las cuerdas de un piano real.
Para aumentar la validez del cálculo de Isb, hemos aplicado a la resolución de cada nota los
valores de los parámetros concretos de sus cuerdas obtenidos a partir del entrenamiento. Los
resultados son los que se presentan en las figuras siguientes, en las que por sencillez sólo se
presentan los tres primeros parciales de cada nota.
3.1.6.1.- Isb calculado considerando Msb fijo y ωosb/ωt=1.3
Aunque se ha procurado ser lo más realista en los parámetros de la cuerda, no es tan fácil
serlo en los parámetros de la carga que supone el puente y la placa resonante en la cuerda. Como
primera aproximación hemos supuesto Msb fijo, con dos valores. Estos valores están dentro del
orden de magnitud de lo que se corresponde con calcular la masa de una sección de la placa del
tamaño de una longitud de onda al cuadrado.
Aunque se indique que la relación wosb/wt=1.3, eso sólo supondría una situación de
cargas tipo elasticidad, en realidad se calculan los casos wosb/wt=1.3 y wosb/wt=1/1.3.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 54 Tesis Doctoral
Fig.12.-Isb en cents para wosb/wt=1.3 y Msb=0.4Kg. Se muestra paracada nota la variación de sus tres primeros parciales. Puede verse que amayor parcial menor variación. A mayor nota menor variación. Endefinitiva, a mayor frecuencia involucrada menor variación provoca laplaca, tanto si es tipo masa como elasticidad. por último, puede verse quela carga tipo masa provoca más variación que la tipo elasticidad, para lamisma nota y parcial
De las figuras 12 y 13 puede concluirse que a mayor Msb menor es la variación de las
frecuencias. Esto es importante pues como sabemos, la situación real no es de Msb constante sino
que aumenta al bajar2 la nota, lo que permite prever que las notas graves no tendrán tanta
variación en sus frecuencias como aparentan las figuras anteriores. También puede verse que la
variación es de unos pocos cents.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 55 Tesis Doctoral
Fig.13.-Isb en cents para wosb/wt=1.3 y Msb=1 Kg. Puede verse que amayor parcial menor variación. A mayor nota menor variación. Puedeverse que la carga tipo masa provoca más variación que la tipoelasticidad, para la misma nota y parcial
3.1.6.2.- Isb calculado considerando Msb variable y dos valores de la relación wosb/wt
Una vez que se ha visto el efecto de Msb en Isb, interesa ver el efecto de la relación
wosb/wt. Para tener unos resultados más cercanos a la realidad vamos a introducir valores de Msb
adaptados a cada nota.
Para ello, se calcula la masa de una sección λ2 de una placa resonante típica. La λ se
calcula según la frecuencia teórica (fijo-fijo) de la nota. Para ello se consideran valores típicos
de la placa resonante y las fórmulas presentadas en el próximo apartado sobre “vibración de
placas”.
Realmente los cálculos incluyen una modificación que se debe a que la placa es realmente
ortotrópica, por lo que la rigidez no es igual en las dos direcciones perpendiculares y existen dos
longitudes de onda para cada frecuencia. La sección para el cálculo de masa es realmente λL* λT
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 56 Tesis Doctoral
Fig.14.-Isb calculado para Msb ajustado a nota y wosb/wt=1.3 y 1/1.3.se muestran tres parciales por nota. Isb decrece al subir nota o subirparcial. Msb ajustado a nota permite ver que las variaciones no son tangrandes en notas bajas.
Fig.15.-Isb calculado para Msb ajustado a nota y wosb/wt=1.5 y 1/1.5.se muestran tres parciales por nota. Isb decrece al subir nota o subirparcial. Una mayor relación wosb/wt supone menor variación.
De las gráficas 14 y 15 pueden sacarse varias conclusiones. Si bien sigue manteniéndose
la tendencia de mayor variación al bajar la nota o el parcial, los márgenes de variación son
menores por subir la masa Msb al bajar la nota o el parcial.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 57 Tesis Doctoral
También puede verse que una mayor relación wosb/wt disminuye la variación. Esto último
supone que cuanto más lejos esté la frecuencia fijo-fijo de la cuerda respecto a un modo, menos
se modifica dicha frecuencia. Esto podría llevarnos a concluir que cuanto más cerca del modo
estemos, más se separa la frecuencia real de vibración de la frecuencia teórica fijo-fijo. Sin
embargo, sabemos que si la frecuencia teórica coincide con el modo, la frecuencia real coincide
con la teórica.
Podemos llegar a suponer, a falta de una resolución completa de la ecuación 26, que el
valor de Isb empieza creciendo al separarnos del modo y que a partir de un cierto valor de la
relación wosb/wt, Isb empieza a decrecer.
Ese punto de inflexión en la relación wosb/wt resulta importante para acotar los valores
de Isb. Sin embargo, conocerlo supone disponer de demasiados datos sobre la placa resonante o
incluso resolver la ecuación 26, y ninguna de las dos son factibles en una aplicación de
identificación de notas y acordes.
Como se verá más adelante, a lo largo de este capítulo sobre el modelo, la no exactitud
de esta acotación no resulta ser el elemento determinante en ciertas limitaciones que aparecen en
los patrones generados.
3.1.6.3.- Efecto de la rigidez ortotrópica en Isb
Si modificamos el valor de la relación entre la rigidez longitudinal y la transversal de una
placa resonante (esto se explica más adelante en el apartado de “placa ortotrópica con costillas”)
los resultados indican que Isb se incrementa al aumentar la diferencia entre los valores de rigidez
(figura 16).
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 58 Tesis Doctoral
Fig.16.- Mismo cálculo que el de la figura 14, pero modificación en larigidez transversal de la placa ortotrópica. El valor de Isb se haincrementado apreciablemente
Dado que al fabricar pianos se tiende a disminuir la diferencia entre los dos valores de
rigidez con el uso de las costillas [Giordano 97], podemos considerar que Isb tiende a disminuir.
3.1.6.4.- Valores previsibles para la relación ωosb/ωt
En la figura 17 se muestran los valores calculados como previsibles para la relación
ωosb/ωt. Para ello se ha realizado un cálculo de los modos propios de dos placas con dimensiones
1.8x1.4m y 2.8x1.4m y con dos valores de la relación de rigidez ortotrópica (0.2 y 0.1 veces) que
son los usados en cálculos anteriores (ver ecuaciones en el apartado de placa ortotrópica). Se ha
considerado que una frecuencia teórica pueda tener cualquier valor con precisión de 1Hz y se ha
calculado su relación respecto al modo más cercano.
Como puede verse, el valor de 1.3 apenas se da, por lo que los cálculos anteriores
permiten establecer una cota en cuanto a que no se van a dar relaciones mayores. En cuanto al
efecto de relaciones ωosb/ωt menores, ya se ha indicado que pueden suponer un Isb algo mayor
que el calculado para relación 1.3, pero según disminuya la relación acercándose a 1, Isb debe
tender a 0 cents.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 59 Tesis Doctoral
Fig.17.-Relaciones wosb/wt calculadas para cuatro placas resonantes ortotrópicas. La relación unidad indicaexistencia de modo propio de la placa a dicha frecuencia. Existe un modo fundamental entre 65 y 130Hz según elcaso, por debajo del cual la relación crece determinando una carga tipo elasticidad. Puede verse que rara vez se llegaa la relación de 1.3 veces usada en los cálculos anteriores como valor límite. La gran densidad d emodos enfrecuencias medias y altas hace imposible que una frecuencia esté muy lejos de un modo.
Las placas usadas para el cálculo son placas de pianos de cola, por lo que los
fundamentales de placa indicados son los más bajos que suelen encontrarse en pianos.
El primer modo de las placas está entre 65 y 130 Hz, este margen de valores corresponde
aproximadamente a los fundamentales de las notas de la 2º octava del piano. Puede decirse por
tanto que las notas de la primera octava y alguna de la segunda, tienen su fundamental con efecto
elástico en todos los pianos. Algunas notas de la octava 2 tendrán siempre efecto tipo masa. Las
últimas notas de la octava 2 y las notas de las octavas superiores se encuentran a un lado u otro
de algún modo por lo que no puede asegurarse si tienden a tener efecto tipo masa o elasticidad.
Por esto es por lo que se han realizado cálculos sólo para notas por encima de C3.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 60 Tesis Doctoral
Fig.18.-Diferencia en Hz correspondiente a los valores de Isb para cadanota. Si bien Isb disminuye con la nota, la diferencia en Hz (ancho de lavariación) aumenta. Para una relación wosbt/wt igual, no hay diferenciade ancho entre los parciales de una misma nota. Las notas de la octava 3sufrirían una variación de entre 2 y 3 Hz, mientras que las de la octava 7entre 12 y 19 Hz, de tener sus parciales teóricos a 1.3 veces la frecuenciade un modo de la placa.
3.1.6.5.- Aplicación al modelo de patrones
La existencia de Isb supone que los diversos parciales de cada nota no estarán centrados
en el valor teóricamente previsto, sino que sufrirán ciertas modificaciones hacia arriba o hacia
abajo según haya un modo cercano de la placa por debajo o por encima de ellos. Desde el punto
de vista de modelar un patrón que tenga en cuenta esto, el planteamiento que seguimos es
considerar que el ancho del pulso del patrón es suficiente como para incluir al parcial real se
encuentre donde se encuentre. Por ello, el valor de Isb se expresa como diferencia de frecuencias
real y teórica, y dicha diferencia será tenida en cuenta al calcular el ancho del patrón. Ya se
explicará en el apartado sobre patrones otros aspectos que afectan al cálculo de su anchura.
Llama la atención que no haya diferencia de anchos entre parciales de una misma nota.
Debe tenerse en cuenta que este resultado supone que todos los parciales de la nota se encuentran
a la misma relación respecto a un modo de la placa. Que esto ocurriera en la realidad sería una
coincidencia, por lo que no puede esperarse que en la realidad todos los parciales se separen la
misma cantidad de Hz de su valor teórico. De hecho en las pruebas llevadas a cabo, inicialmente
se usaron patrones con mismo ancho en todos los parciales y se comprobó que se obtenían
mejores resultados usando un ancho mayor a mayor parcial.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 61 Tesis Doctoral
Como se ha visto en la figura 17, la relación wosb/wt “máxima” va decreciendo con la
frecuencia, por lo que según subimos en los parciales habría que esperar primero un incremento
en la cota de Isb y para frecuencias más altas un decrecimiento al bajar la relación hasta valores
muy cercanos a 1. Esto supone un incremento en la diferencia de frecuencias para los primeros
parciales y una disminución en los más altos. Como no es fácil conocer en qué parcial del patrón
empezar a disminuir el ancho, se ha decidido que los patrones se generen con un ancho mayor a
mayor parcial.
3.1.7.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN ESPECTRAL
DE NIVELES
La distribución espectral de niveles que se obtiene en una cuerda depende de la excitación
que se realiza. La cuerda de piano es golpeada por un martillo con forma redondeada y recubierto
de material blando. El estudio detallado ha sido realizado por varios autores, tanto con modelos
sencillos [Hall 86][Hall 87a][Hall 87b][Hall 87c][Hall 88] e incluso se han propuesto modelos
bastante complejos que incluyen no linealidad [Hall 92] e histéresis [Stulov 95].
En nuestro intento por obtener un modelo simple vamos a revisar algunas resoluciones
típicas, aunque insuficientes para explicar los espectros que se obtienen y una resolución basada
en un modelo sencillo de la excitación [Benade 76], que se aproxima bien a los resultados
medidos.
Sin duda que la existencia de una impedancia terminal no infinita debida a la placa
resonante también modifica en algo los niveles de las componentes espectrales, sin embargo,
inicialmente sólo se van a considerar las distribuciones para el caso de cuerda fija-fija.
3.1.7.1.- Soluciones ante condiciones iniciales simples
Las condiciones iniciales que suelen imponerse a las cuerdas tienen que ver con:
-Desplazamiento inicial en un punto para t=0, justo antes de empezar a vibrar.
-Velocidad inicial en un punto para t=0 con la que empieza a vibrar
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 62 Tesis Doctoral
La ecuación de la vibración es:
y x t jA sen k x j t C jD sen k x j t C y D realesn nn
n n nn
n n( , ) ( ) exp( ) ( ) ( ) exp( )= − = +∑ ∑2 ω ω (28)
3.1.7.1.1- Golpe del martillo “uniforme” e instantáneo
Si el golpe del martillo es instantáneo, la cuerda adquiere una velocidad en la zona del
golpe, pero no tiene desplazamiento inicial. Si consideramos que el golpe tiene lugar centrado en
la posición “xe” de la cuerda y con un ancho “a”, con la misma velocidad en todos esos puntos,
desde xe-a/2 hasta xe+a/2, las condiciones son:
y(xe,0)=0
u(xe,0)=0 para x<xe-a/2
V0 para xe-a/2# x #xe+a/2
0 para x>xe+a/2
La resolución lleva a valores de los coeficientes:
[ ]
CL
y x k x dx
DL
u x k x dxL
V k x dx
VcLk
k x a k x a
n n
L
nn
n
L
nnxe a
xe a
nn e n e
= ⋅ =
= ⋅ = =
= − − +
∫
∫ ∫ −
+
20 0
20
2
22 2
0
0 0 2
2
0
( , ) sin( )
( , ) sin( ) sin( )
cos ( / ) cos ( / )
/
/
ω ω (29)
que en el caso de fija-fija, sustituyendo kn=nπ/L, queda:
C
DV L
c nn
xeL
naL
n
n
=
== ⋅
02 0
2 2ππ πsin sin
(30)
lo que nos indica la importancia de la posición del golpe y del ancho de dicho golpe respecto a
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 63 Tesis Doctoral
la longitud de la cuerda. En general, la amplitud del modo decrece proporcionalmente con n2
(orden del parcial al cuadrado).
Nótese también que existe modificación espectral según el punto de impacto xe, debido
al término “sen (nπxe/L)” que incluso llega a cancelar algún modo. También hay cancelación para
modos en base al término “sen (nπa/L)” que considera el ancho de la excitación.
En teoría, un impacto instantáneo llevaría unida la cancelación total de todos los modos
que tuvieran un nodo en dicho punto de impacto. En la realidad, esto no ocurre de forma tan
drástica.
3.1.7.1.2- Golpe del martillo no uniforme e instantáneo
Algunos autores consideran que la velocidad que se imprime a la cuerda con un martillo
de piano sigue una ley tipo ventana Hanning alrededor del punto central del impacto [Benade 76],
si bien otros consideran que la velocidad que se reparte en forma exponencial en la zona de
impacto [Hall 87]. En cualquier caso, podemos considerar una función ventana de ancho w,
centrada en el punto central de impacto, quedando:
y(xe,0) = 0
u(xe,0) = 0 para x<xe-a/2
= V0*W(x-xe) para xe-a/2# x #xe+a/2
= 0 para x>xe+a/2
Los coeficientes quedan:
CL
y x k x dx
DL
u x k x dxcLk
V W x xe k x dx
n n
L
nn
n
L
nnxe a
xe a
= ⋅ =
= ⋅ = − ⋅
∫
∫ ∫ −
+
20 0
20
20
0 0 2
2
( , ) sin( )
( , ) sin( ) ( ) sin( )/
/
ω
(31)
En el caso de ventana Hanning, los resultados pueden verse en las figuras 19 y 20.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 64 Tesis Doctoral
Fig.19.-Espectro evaluado para C1 con golpeinstantáneo del martillo y espectro real medido de lanota. El modelo de golpe instantáneo no es bueno. Sí seaprecia la cancelación por la posición del golpe respectoa la longitud total.
Fig.20.-Espectro evaluado para C4 para golpe delmartillo instantáneo y espectro real medido de la nota.Sí hay más parecido aunque no se corresponde lapendiente de disminución de niveles espectrales.
Puede verse que estas soluciones no se parecen a la realidad que se puede medir en el
piano, en el que los niveles espectrales de las notas graves no decrecen monótonamente sino que
sufren variación y no necesariamente el parcial de más nivel es el fundamental. Las notas agudas
sí tienen el fundamental como parcial de mayor nivel, pero tienen una variación de nivel algo
distinta a las vistas. El modelo de golpe del martillo instantáneo es muy limitado.
3.1.7.2.- Condiciones iniciales no simples: Golpe del martillo no uniforme y no instantáneo
Hemos desarrollado una solución para el caso de considerar que la cuerda no sólo tiene
velocidad inicial sino también desplazamiento inicial. La idea de este modelo simple reside en
el hecho de considerar que la vibración empieza cuando el martillo deja de estar en contacto con
la cuerda y retorna a su posición. El martillo retorna a su posición por dos posibles razones:
-El mecanismo tiene un tiempo prefijado de contacto tras el cual el martillo cae.
-La onda inicial creada ante el inicio del impacto, y con la forma de éste, y que se desplaza
hacia el extremo más cercano (“Agraffe”), rebota en este invertida y al llegar al martillo establece
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 65 Tesis Doctoral
una fuerza hacia abajo que ayuda a que este se separe de la cuerda. Esta fuerza tendrá que ser
igual a la fuerza que el martillo esté ejerciendo en ese momento. Existe un desarrollo más
elaborado con esta idea en [Askenfelt 93]
En nuestro modelo sencillo vamos a considerar que estas ondas iniciales no constituyen
parte de la vibración sino que son previas a esta y que sólamente afectan a la duración del
contacto entre el martillo y la cuerda previo al inicio de la vibración.
En el momento inicial de la vibración (t=0), podremos decir que:
-La cuerda tiene un desplazamiento inicial provocado por la aplicación de la fuerza del
martillo durante un cierto tiempo (previo al comienzo de la vibración). Este
desplazamiento además tiene la forma de la ventana de la fuerza aplicada.
y(x,0)=Y0*W(x-xe)
-La cuerda tiene una velocidad igual a la que crea la onda que hace bajar al martillo.
u(x,0)=-V0*W(x-xe)
de todas estas condiciones se obtienen los coeficientes como:
AYL
W x xe k x dx
BV
LckW x xe k x dx
n H nxe a
xe a
nn
H nxe a
xe a
= − ⋅
= − ⋅
−
+
−
+
∫
∫
2
2
0
2
2
0
2
2
( ) sin( )
( ) sin( )
/
/
/
/ (32)
En donde las integrales son iguales y el desplazamiento inicial Y0 es proporcional al tiempo que
dura el contacto entre martillo y cuerda (Tc), que es mayor a bajas frecuencias que a altas,
variando entre 0.5ms para C7 y 5ms para C1 [Askenfelt 90]. Durante este tiempo el
desplazamiento de la cuerda crece según la fuerza (y por tanto la velocidad) que el martillo
imprime en ella, quedando las ecuaciones:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 66 Tesis Doctoral
Y udt V W t Tc dt V I
BA
I
Tc
H
Tc
nn
n
0 00 00= = − = ⋅
=
∫ ∫ ( )
ω
(33)
en donde se considera que la fuerza que hace el martillo no es uniforme a lo largo del tiempo sino
que también puede considerarse como una curva Hanning [Benade 76], debido a la poca rigidez
de la felpa que recubre el martillo.
Los coeficientes complejos Cn cuyo módulo expresa la amplitud de cada componente
espectral, se calculan como:
[ ]CYL I
W x xe k x dxnn
H nxe a
xe a= +
− ⋅
−
+
∫4
110
2
2 2 2 2
2 2
ω( ) sin( )
/
/ (34)
Las figuras siguientes muestran resultados de resolver dichas ecuaciones para valores
típicos de parámetros físicos, punto de golpe, tamaño y velocidad del martillo y tiempos de
excitación de 3 notas del piano extremas y central (C1,C4 y C7).
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 67 Tesis Doctoral
Fig.21.-Espectro evaluado y real de la nota C1. Elgolpe del martillo se considera de 5 ms. La cuerda esde 1.8m y se golpea a 20 cm del borde.
Fig.22.-Espectro evaluado y real de la nota C4, conuna cuerda de 63 cm
Fig.23.-Espectro evaluado y medido de la nota C7. Lacuerda es de 9.6 cm. El tiempo de impacto usado paraque la evaluación de un espectro algo parecido a larealidad es extremadamente corto para las medidasexistentes [Askenfelt 90].
Fig.24.-Efecto del tiempo de impacto del martillo.Existe un tiempo de impacto crítico que supone que elespectro tenga fundamental máximo o tenga menornivel de fundamental. Dicho tiempo crítico es distintosegún las características de la cuerda. Un impacto máslargo del crítico no sólo atenúa más el fundamental sinoque además aumenta el nivel de los modos superiores.La cancelación por la posición del punto de impactosigue manteniéndose.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 68 Tesis Doctoral
Aunque puede verse que este modelo sencillo aproxima a grandes rasgos la distribución
espectral de las notas y nos puede permitir ciertos usos, lo cierto es que el modelado perfecto es
mucho más complejo y en él debe tenerse en cuenta variaciones debidas a la fuerza con que se
pulse la tecla [Askenfelt 93] (aspecto dependiente de la ejecución concreta de la nota o acorde a
identificar por parte del pianista) y otros aspectos del comportamiento del martillo y de las
reflexiones de la onda entre este y el extremo más cercano. Es por ello que hemos decidido evitar
el uso de este aspecto (distribución de niveles espectrales de las notas) en el proceso de
identificación, si bien puede ser usado para ajustar ciertos parámetros del algoritmo de
predetección de octavas.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 69 Tesis Doctoral
3.2.- VIBRACIÓN DE CUERDAS CON RIGIDEZ
3.2.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN
En el caso de tener una cuerda en la que se considere su rigidez, esta estará contemplada
mediante un término de fuerza recuperadora que es proporcional al módulo de elasticidad de
Young. La ecuación diferencial será [Rossing 95][Fletcher 64]:
ρ∂∂
∂∂
π∂∂L
yt
Ty
xE
r yx
2
2
2
2
4 4
44= − (35)
donde T es la tensión de la cuerda y E es el módulo de elasticidad de Young del material, y en la
que puede verse que el término debido a rigidez es proporcional a la derivada parcial cuarta del
desplazamiento.
La resolución de esta ecuación que es atribuida a Rayleigh es compleja incluso aunque
no contiene un término que contemple el amortiguamiento propio de la cuerda. En el caso del
piano, las cuerdas tienen muy poco amortiguamiento, por lo que bien puede considerarse correcta
la no inclusión de ese término. En todo caso, siempre puede contemplarse un posible
amortiguamiento incluyendo en el módulo de elasticidad una parte imaginaria.
3.2.2.- SOLUCIONES
La solución para cuerda infinita supone considerar una onda compleja del tipo:
y Ce ej t kx= ω (36)
donde C y k pueden ser complejos, como hace Fletcher en su artículo [Fletcher 64], aunque él
cambiara el signo a alguno de los exponentes y considerara un cambio de “escala” usando 2πk
en vez de k en la segunda exponencial. La existencia de esta solución lleva a una condición de
k que es una ecuación de orden 4 en k. Se tendrán infinitos modos propios, cada modo propio
definido por 4 números de onda. Los cuatro valores de k para cada modo, hace que la ecuación
tenga cuatro términos, por lo que la ecuación típica:
y C e e C e ej t jkx j t jkx= +−1 2
ω ω (37)
no es correcta en el caso de cuerda con rigidez, aunque también existan ondas progresiva y
reflejada.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 70 Tesis Doctoral
Al aplicar la solución compleja 36 a la ecuación diferencial, se obtiene la condición para
los valores de k, en la que no tienen influencia las condiciones de contorno, por lo que se
cumplirán siempre. Además, las condiciones de contorno establecerán más restricciones para la
resolución de la ecuación de onda. La ecuación que siempre debe cumplirse es:
k kT
E r Erf4 2
4
2
224 16
0− − =π
π ρ (38)
como también aparece en [Podlesak 88].
Si se define:
BE r
TLf
LT
L
= =π
ρ
3 4
2 041
2 (39)
donde B es el coeficiente de inarmonicidad, y no debe confundirse con la denominación genérica
de un coeficiente B de una ecuación de onda, la ecuación puede reescribirse como [Fletcher 64]:
k kL B L Bf
f4 22
2
4
402
2 0− − =π π
(40)
Esta es una ecuación de cuarto orden con coeficientes pares, por lo que puede reducirse
una de segundo orden y tomar la raíz cuadrada de las soluciones. Así tendremos [Fletcher 64]:
k k y k jk
kBL
Bff
kBL
Bff
= ± = ±
= + +
= + −
1 2
12
2
2
2
02
22
2
2
2
02
21
41
21
41
siendo
π
π
(41)
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 71 Tesis Doctoral
debe recordarse que los valores de k obtenidos con esta fórmula son 2π veces más pequeños que
los reales.
Además de la relación evidente de los modos dos a dos, existe otra relación [Fletcher 64]:
k kBL
TE r1
222
2
2 4
4− = =
ππ
(42)
Si resolvemos la ecuación 38 sin introducir los parámetros B y f0, tendremos:
kT
E r E rT
rE fi = ± ± +
2 444
2
2 62 2
π π ππ ρ (43)
que dan los 4 valores (2 reales y 2 imaginarios)
Por tanto, para cada resolución de la ecuación que nos dé una frecuencia de modo propio,
existen realmente 4 números de onda relacionados entre sí. Esto significa que la ecuación de la
solución es un sumatorio de infinitos términos(modos propios) que deben incluir cada uno los 4
términos de número de onda relacionados entre sí. Esto lleva a tener que calcular hasta 4
coeficientes en el caso de una cuerda finita que siga una ecuación de vibración del tipo [Fletcher
64]:
[ ]y A k x B k x C k x D k x j tn n n n n n n nn
n= + + +∑ cosh sinh cos sin exp( )1 1 2 2 ω (44)
y no las inicialmente propuestas de onda progresiva y regresiva simples (no dispersivas). Ahora
bien, la ecuación de orden 4 para calcular k sigue siendo válida.
Puede comprobarse que aunque Fletcher usara el término k para las cuatro raices, lo cierto
es que k1 es un término asociado a una función de variación progresiva (crecimiento o
decrecimiento) a través de las funciones seno y coseno hiperbólicos, y no establece un patrón con
ondulación más propio de una vibración. Por ello, cada modo propio tendrá un valor de k2 que
define la frecuencia de vibración y un valor de k1 que define una variación progresiva con la
distancia, y al que muchos autores denominarían α.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 72 Tesis Doctoral
Otra consecuencia de la ecuación 38 es que la velocidad de propagación es [Podlesak 88]:
cT T E r
fc c
BffL L L
= +
+ = + +
2 2 2 21 4
2 3 42 0
202
0
2
ρ ρπρ
(45)
El primer término es el que incluye la referencia citada e indica un resultado en función
de parámetros físicos de la cuerda. Puede verse que la velocidad varía con la frecuencia, siendo
una propagación dispersiva. Se confirma que a mayor frecuencia mayor velocidad. El segundo
término lo hemos derivado nosotros y muestra que la velocidad depende de la velocidad para
cuerda flexible (c0) y del coeficiente de inarmonicidad y que es mayor para parciales mayores (ya
que tienen mayor relación f/f0).
3.2.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS
Además de las condiciones anteriores, las distintas condiciones de contorno permiten
resolver los modos propios y las frecuencias a las que resuenan dichos modos, que resultan ser
las frecuencias de vibración libre.
En el caso de cuerdas con rigidez, la resolución es complicada y se requieren métodos
numéricos en casi todos los casos. Sin embargo, las condiciones que permiten resolución analítica
puede considerarse buenas aproximaciones a la situación de las cuerdas del piano.
Revisamos a continuación un par de casos importantes. En ningún caso se considera que
los extremos tengan una impedancia mecánica distinta de infinito. El efecto conjunto de rigidez
y placa impedante será tratado posteriormente
3.2.3.1.- Soluciones para cuerda fija-fija con extremos apoyados en bordes finos (“pinned
by knife edges”)
Al ser extremos fijos, la vibración(desplazamiento) será 0. En cuanto a la pendiente que
puede tomar la cuerda es cualquiera, pero sólo con forma recta pues el apoyo no hace fuerza salvo
la de la tensión.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 73 Tesis Doctoral
Por tanto y=δ2y/δx2=0, y las soluciones sólo tienen los términos de B y D con números
de onda k1 y k2. El término “vibrante” es el de k2=πn/L, lo que se corresponde con las frecuencias
de modos propios o de vibración dadas por [Fletcher 64]:
f nf n B nL
Tn
E dL T
nnL
= + = + =02 1 2 2
3 4
211
21
641 2 3( ) , , , .../
ρπ
(46)
que es una solución aproximada en la que Fletcher ha despreciado ciertos términos de un
desarrollo en serie. La ecuación de vibración resultante es:
[ ]y B k x D senk x j tn n n nn
n= +∑ sinh exp( )1 2 ω (47)
La ecuación de las frecuencias propias de vibración deja claro que los distintos parciales
son inarmónicos respecto al fundamental, y es normal referirse a dicha ecuación como “ecuación
de inarmonicidad”
Esta situación es la que más se corresponde con las cuerdas del piano. Las cuerdas reales
[Conklin 96b] están fijas en sus extremos a piezas metálicas (enganches). El del extremo más
cercano al teclado permite tensar la cuerda que se enrrolla en él (especie de tornillo que atraviesa
el marco metálico para atornillarse a la pieza de madera llamada “wrestplank”) y la del extremo
más lejano es una pieza solidaria al marco metálico que deja pasar la cuerda por un agujero para
luego trenzarse sobre sí misma asegurando que con la tensión no se va a soltar. Estas sujeciones
no son las que realmente determinan el tramo vibrante de la cuerda. En puntos cercanos a dichos
enganches existen las piezas donde la cuerda se apoya. Estas piezas (Agraffe, Capo D’astro,
apoyo posterior) funcionan como apoyos en borde fino . Estas piezas están a nivel distinto que
los tornillos, por lo que la tensión fuerza a que dichas piezas establezcan los extremos reales de
la cuerda vibrante.
En principio, no se está considerando el hecho de que el puente es impedante. La longitud
vibrante definitiva de la cuerda no suele considerarse hasta el apoyo final sino sólo hasta el
puente, el cual, para que esta solución fuese cierta, debería ser de impedancia infinita y actuar
como apoyo de borde fino. Lo primero se sabe que no es cierto, pero no se intenta resolver en este
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 74 Tesis Doctoral
apartado. Lo segundo es algo en lo que los algunos autores discrepan y suele indicarse que la
cuerda de piano está en una situación intermedia entre apoyada en borde fino y abrazada [Fletcher
64]. También podría considerarse que las cuerdas agudas están más cerca de la condición de
apoyo en borde fino mientras que las graves presentan una sujeción que podría asemejarse a
abrazada. Sin embargo, la casi totalidad de referencias a la ecuación de la inarmonicidad,
presentan la ecuación 46, indicada anteriormente, por lo que resulta más aceptada la situación de
apoyo en bordes finos (“Knife edge”).
3.2.3.2.- Soluciones para cuerda fija-fija con extremos abrazados (“clamped”)
Para comparar resultados, vamos a presentar esta otra situación. En este caso, la vibración
en los extremos es nula y también lo es la pendiente, ya que la abrazadera impide que la cuerda
se curve en su posición.
Las condiciones de contorno son: y=δy/δx=0, y las soluciones se complican. Con ciertas
hipótesis razonables, entre las que se encuentra que B es mucho menor que la unidad, se puede
llegar a una solución aproximada que sería [Fletcher 64]:
f nf n BB B
nn = + + +
=02
2
1 12 2
1 2 3π π
, , ... (48)
que como puede verse indica que las frecuencias de vibración son mayores de las del caso
anterior. El término adicional no es despreciable en absoluto, especialmente en cuerdas de notas
muy agudas en las que B tiene el valor más alto.
Si la impedancia en el puente de un piano fuese infinita, podrían medirse unos parciales
sólo controlados por estas ecuaciones y se podría comprobar cual de las dos condiciones de
contorno es más real. Algunos autores que han hecho pruebas con pianos con el puente
inmovilizado (impedancia terminal infinita) también hacen uso de la ecuación para extremos en
bordes finos, dándose a entender, aunque no se afirma, que las condiciones de contorno más
reales son las de apoyos en bordes finos [Conklin 96].
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 75 Tesis Doctoral
3.3.- VIBRACIÓN DE FLEXIÓN DE BARRA RÍGIDA
Para entender mejor el efecto de la rigidez sobre una cuerda, vamos a analizar la parte
debida exclusivamente a la rigidez. Esto no sólo permite repasar la vibración de una barra, lo que
no tiene demasiado interés de cara a una cuerda sino, más importante, determinar ciertas
similitudes respecto al caso ya descrito de la cuerda real, para deducir aproximaciones a ciertos
comportamientos de la cuerda real que no han sido descritos en su apartado.
3.3.1.- ECUACIÓN DIFERENCIAL Y SOLUCIONES
La ecuación diferencial para una barra cilíndrica delgada y vibración de flexión es
[Rossing 95][Fletcher 97]:
∂∂
πρ
∂∂
2
2
4 4
44y
tE r y
xL
= − (49)
donde “r” es el radio de la barra, ρL es la densidad lineal y E es el módulo de elasticidad de Young
del material.
La velocidad de propagación depende de la frecuencia, existiendo dispersión. La
velocidad de propagación es:
cr E
=ω
ρ2 (50)
siendo ρ la densidad del material.
Si se considera una solución genérica de propagación o vibración compleja tipo:
y Ae ex j t= γ ω (51)
donde A y γ son complejos, se tendrá que al sustituir en la ecuación diferencial se tiene que
cumplir que [Rossing 95]:
γωγ γ4
4
4Aec
Aex x= (52)
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 76 Tesis Doctoral
lo que supone que γ tiene cuatro valores para cada modo de vibración:
γω
γω
= ± = ±
= ± = ±
ck
jc
jk (53)
siendo el valor de k único, a diferencia de lo que pasa en una cuerda real. Esta situación coincide
con lo que pasaría en la ecuación de una cuerda real si la tensión fuese nula:
kT
E r E rT
rE f
kE r
E fr E
iT
Ti
= ± ± + →
→ = ± ± = ± ±
=
=
2 44
4 2
4
2
2 62 2 0
0 2 2
π π ππ ρ
ππ ρ
ω ρ (54)
por lo que se tienen los cuatro valores de k, todos iguales en magnitud, la cual a su vez, es igual
a ω/c. Pero como puede verse, de esta expresión no pueden obtenerse los valores de las
frecuencias de los modos propios, por lo que es esencial recurrir a las condiciones de contorno
como ya es sabido.
La ecuación para cada modo propio tendrá los cuatro términos, correspondientes a las
cuatro raíces vistas de ki y la de la vibración total será:
( )y x t A e B e C e D e ecnk x
cnk x
cnjk x
cnjk x j t
n
n n n n n( , ) = + + + ∗− −∑ ω (55)
en la que los subíndices “c” de los coeficientes indican que son complejos. Se puede reescribir
la ecuación en función de coeficientes reales [Kinsler 88]:
( )y x t A k x B k x C k x D k x j tn n n n n n n n nn
( , ) cosh( ) sinh( ) cos( ) sin( ) exp( )= + + + ∗∑ ω (56)
Aunque los coeficientes A, B, C, y D reciban el mismo nombre no son numéricamente iguales
a los Ac, Bc, Cc y Dc. No deben confundirse tampoco con los de la ecuación de la cuerda real
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 77 Tesis Doctoral
(cuerda con tensión y rigidez), pues allí hay dos valores distintos de “k” para cada modo “n”.
3.3.2.- CONDICIONES DE CONTORNO: MODOS PROPIOS
La resolución para el caso de ambos extremos apoyados en bordes finos (“pinned” or
“hinged”) supone que y=δ2y/δx2=0 en ambos extremos. Cumplirlo en x=0 nos lleva a A=C=0.
Cumplirlo en x=L nos lleva a que o bien D=0 o bien senkL=0. La segunda es la que interesa y
como resultado tenemos pues que la barra rígida sin tensión vibra a las frecuencias:
frL
En nn = =
πρ4
1 2 3 422 , , , , .... (57)
con ecuación:
( )y x t B k x D k x j tn n n n nn
( , ) sinh( ) sin( ) exp( )= + ∗∑ ω (58)
Esta ecuación es similar a la descrita para la cuerda real. Es interesante notar que en
ambos casos existe un término en “seno de kx” al igual que en el caso de la ecuación para cuerda
flexible, y que el término en “seno hiperbólico de kx” aparece en cuanto que se considera rigidez.
En los textos teóricos sobre barras rígidas, se impone también las condiciones en el
extremo finals
En cuanto a las frecuencias, puede verse que la ecuación elevada al cuadrado coincide con
la expresión:
f n f Bn2 4
02= (59)
donde B es el coeficiente de inarmonicidad. Lo que, junto a la expresión ya obtenida de las
frecuencias de vibración de la cuerda (46), permite establecer una interesante afirmación
publicada en [Benade 76] de que la frecuencia de vibración resultante en una cuerda real puede
calcularse como la suma cuadrática de las frecuencias de cada efecto por separado:
f f fncuerda nflexible nrigida= +2 2 (60)
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 78 Tesis Doctoral
lo que si se considera generalizable, nos permitiría aproximar ciertas soluciones en los casos más
complejos de otras condiciones.
Para otras condiciones de contorno, existen soluciones tabuladas que a veces pueden
ponerse en forma de ecuaciones pero con un parámetro que va tomando valores tabulados. Como
detalle interesante, las frecuencias de los modos propios de una barra fija-abrazada y totalmente
libre en el otro extremo son [Rossing 95]:
frL
Em m nn = = −
πρ16
1194 2 988 5 2 122 . , . , , ....., (61)
Sin entrar en el resto de los términos de la ecuación, puede verse que estas frecuencias son
en todos los casos menores que las correspondientes a apoyos de borde fino.
El interés, limitado, de este caso reside en que equivaldría al caso límite de un extremo
impedante con impedancia 0 (libre), marcando el límite inferior de frecuencia al que se podría
llegar por el efecto de la placa resonante si esta no tuviera amortiguamiento mayor que el de la
cuerda. Este valor de frecuencia se sumaría cuadráticamente a la de cuerda flexible para evaluar
la frecuencia menor de la cuerda real.
3.3.3.- VIBRACIÓN DE LA CUERDA CON EXTREMO IMPEDANTE
Vamos a presentar las conclusiones que se pueden obtener de todo lo dicho anteriormente
si se aplica a calcular el efecto de la placa resonante sobre la cuerda real con rigidez.
En cuanto a la velocidad de propagación de la cuerda, ya se ha descrito, sin embargo,
resulta interesante comprobar, que si analizamos dicha ecuación de la velocidad de propagación
en una cuerda real (45), teniendo en cuenta la ecuación de velocidad de propagación de la
vibración de flexión de una barra (50), que llamaremos cB, resulta que:
cc c
ccuerda B= +
+0
202 2
4
2 2 (62)
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 79 Tesis Doctoral
que indica que es una composición en la que influyen los valores de cuerda flexible y barra. Esta
ecuación será de ayuda a la hora de relacionar frecuencias y valores de k.
En cuanto a la ecuación genérica de la vibración:
[ ]y A k x B k x C k x D k x j tn n n n n n n nn
n= + + +∑ cosh sinh cos sin exp( )1 1 2 2 ω (63)
Conocemos que hay dos valores k1y k2, y que requerimos unas 4 condiciones de contorno, que
van a ser:
1ª y 2ª: Extremo x=0 apoyado en borde fino: y=δ2y/δx2=0.
3ª: Extremo en x=L apoyado en borde fino, pero no fijo: δ2y/δx2=0.
4ª: Extremo en x=L con movimiento: uT
ZyxL
SB x L
= −=
∂∂
Realmente la 4ª condición debería incluir un término de fuerza asociado a la rigidez
además del asociado a la tensión. Sin embargo, se puede considerar en primera aproximación que
la mayor aportación la hace la tensión. Esto está en consonancia con el hecho de que la
inarmonicidad (desviación de la frecuencia real respecto a la de cuerda flexible) existente no es
muy elevada.
Como resultado de las dos primeras, resultan los coeficientes A=C=0, lo que simplifica
mucho la resolución. No ocurriría así si el extremo en x=0 estuviera abrazado, pero como ya se
ha discutido, se acepta más la situación de apoyado.
La tercera condición establece una relación entre los coeficientes restantes B y D:
B Dk k Lk k L
= 22
2
12
1
sin( )sinh( )
(64)
La cuarta condición, junto con la anterior, lleva a:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 80 Tesis Doctoral
− =+
+
jZT
kk
k Lk L
k k L
k Lkk
n SBω22
1
2
12 2
222
121
sin( )tanh( )
cos( )
sin( ) (65)
que es la ecuación a resolver para obtener las frecuencias de los modos de vibración. Se puede
considerar que k1>>k2 ya que como se vió:
k kBL
TE r
k kBL1
222
2
2 4 12
22
2
2
4− = = ⇒ = +
ππ
π (66)
y dado que L es siempre menor de 2m y B menor de 0.02, el segundo sumando siempre será
mayor de 123. Además k2 será del orden de magnitud de 2πn/L, es decir, pequeño, al menos en
los primeros parciales. Además, podemos deducir que k1L tiende a ser suficientemente alto como
para que tanh( k1L)=1. Como resultado, la ecuación de los modos propios queda:
tg k L jTk
Zn SB
( )22≈
ω (67)
que como puede recordarse es igual que la obtenida para cuerda flexible, salvo por el hecho de
aparecer k2. Además, existe una relación entre frecuencias y k distinta que en el caso de cuerda
flexible, por lo que los resultados no serán iguales.
Sin embargo, pueden darse las condiciones para que la velocidad de propagación no se
desvíe del valor de la flexible y que apenas haya diferencia en la resolución. Para que esto ocurra,
se puede deducir de la ecuación de velocidad que debe cumplirse:
f fLr E
<< 02
32π
ρ (68)
que para las cuerdas de un piano (acero) queda en:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 81 Tesis Doctoral
f fLr
<< ⋅ ⋅−13 10 402
3
. (69)
Para valores típicos de longitud y radio de cuerdas de piano se tiene que:
Nota (f0) f<<
A0 (27.5 Hz) 1000 Hz
C4 (261.6 Hz) 3750 Hz
C8 (4186 Hz) 728 Hz
Si consideramos que la condición “mucho menor” se cumple con una relación “décima parte”,
es evidente que en la octava 4, sólo el fundamental puede considerarse libre del efecto de
dispersión. En las octavas más altas, ni siquiera el fundamental está libre del efecto de dispersión.
En las octavas más bajas podemos llegar a tener hasta 4 parciales sin efecto apreciable.
Debemos concluir por tanto que el efecto debe tenerse en cuenta.
Se puede realizar una aproximación a la resolución basada en un razonamiento. La forma
de resolver gráficamente los valores de k no cambia respecto al caso de cuerda flexible, de hecho,
en el caso de carga tipo elasticidad la resolución es la misma pues sólo aparecen términos en k
y ninguno más en ω:
tg k L jTkZ
jTk
jST
Sk
SB SB SB
( )22 2
2= = − =−
ω ωω
(70)
lo que da el mismo valor de k que en el caso de cuerda flexible, sólo que ahora, como la velocidad
de propagación es distinta (es más alta), la frecuencia resultante es menos baja (algo más alta) que
en el caso de cuerda flexible. Además, la relación entre frecuencias y valores de k que establece
la diferencia de velocidad en este cálculo, es la misma que establece en el cálculo de modos
propios para extremos de impedancia infinita. El resultado es por tanto equivalente a aplicar el
efecto de la placa calculado para el caso de cuerda flexible a los valores de frecuencias para
cuerda con rigidez y terminación infinita.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 82 Tesis Doctoral
Si esta afirmación puede considerarse válida para una situación concreta de impedancia
de la placa resonante, vamos a considerarla válida también para el resto. Por tanto, nuestra
hipótesis de trabajo al respecto es que el efecto de la placa resonante sobre una cuerda real es el
mismo que el calculado respecto a una cuerda flexible, pero aplicado a los valores de frecuencias
reales de la cuerda real.
Si a dicho efecto le denominamos “Inarmonicidad debida a placa resonante (ISB)”,
podemos establecer que la frecuencia de vibración de una cuerda real de piano será:
f nf n B I f f nf n Bn SB n n= + ⋅ = +∞ ∞02 1 2
02 1 21 1( ) ( ) ( )/ /siendo (71)
en donde queda claro que el valor de ISB es el que corresponde a una frecuencia igual a la de la
cuerda con rigidez supuesta con terminación infinita. Los valores de ISB que se van a aplicar ya
fueron calculados y explicados con anterioridad.
3.3.4.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN ESPECTRAL
DE NIVELES
Como ya se ha indicado, la situación más identificada con el piano es la de cuerda fija-fija
con extremos apoyados en bordes finos, lo que nos lleva a una ecuación de la vibración [Fletcher
64]:
[ ]y B k x D sen k x j tn n n nn
n= +∑ sinh( ) ( ) exp( )1 2 ω (72)
Las condiciones iniciales más cercanas a la realidad, dentro de un modelado simple, ya
han sido comentadas, sin embargo son sólo dos, mientras que estas ecuaciones requieren hasta
cuatro condiciones pues tanto Bn como Dn suelen ser complejos.
Una vez más, la realidad es muy difícil de modelar y los resultados que se puedan obtener
sólo aproximaran a grandes rasgos las distribuciones de niveles espectrales. Consideramos que
para la identificación de acordes, sin identificación de la fuerza con que se ejecutan, no es
necesario ni conveniente incluir cálculo por modelado de las distribuciones de niveles espectrales.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 83 Tesis Doctoral
De hecho, como se ha podido verificar en las pruebas, ni siquiera resulta claramente útil
incluir la estructura espectral real medida durante el entrenamiento en los patrones usados para
identificar las notas y acordes.
3.4.- VIBRACIÓN DE UNÍSONOS
La vibración simultánea de dos o tres cuerdas afinadas a frecuencias muy parecidas y
fijadas al puente en el mismo punto, presenta una amplia serie de aspectos como puede verse en
[Weinreich 77]. Básicamente se pueden resumir sus efectos en dos aspectos: aparición de vibrato
(modulación de amplitud con moduladora de muy baja frecuencia) y clara modificación de la
velocidad de decrecimiento del nivel de la nota a lo largo de su duración.
Las tres cuerdas vibrantes se fijan al puente con una pieza metálica que une a las tres,
como si de un único punto de unión al puente se tratara. Mecánicamente, ese punto de anclaje
común se mueve con una velocidad que es la suma de las velocidades de las tres vibraciones. Esta
velocidad resultante es la que se aplica a la placa resonante, que según sus modos propios y su
característica de radiación las emitirá para ser captadas por nuestro micrófono. Como se trata de
vibraciones de frecuencias muy cercanas, la placa no tendrá un comportamiento muy distinto ante
ellas, por lo que los efectos atribuibles al unísono no quedan apenas modificados por la placa.
En una primera aproximación vamos a considerar que las cuerdas no interactúan entre sí
y que el golpe del martillo las pone en movimiento por igual, es decir, inician su vibración en fase
y con la misma amplitud.
Las figuras 26, 27, 28, 29 y 30 muestran la variación temporal de, respectivamente, una
nota con una sola cuerda (C1), una con 2 cuerdas (G2) y tres con 3 cuerdas pero de frecuencias
distintas (C4, C5 y C6), grabadas del piano de cola Yamaha. La escala de nivel es logarítmica
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 84 Tesis Doctoral
Fig.26.-Nota C1. Una sola cuerda. Fig.27.-Nota G2. Unísono de 2 cuerdas
Fig.28.-Nota C4. Unísono de 3cuerdas
Fig.29.-Nota C5. Unísono de 3cuerdas.
Fig.30.-Nota C6. Unísono de 3cuerdas
Puede verse que el comportamiento de la envolvente es muy distinto en los cuatro casos.
La nota de una cuerda tiene un decrecimiento uniforme. La nota de 2 cuerdas presenta un
decrecimiento uniforme pero con cierta modulación de muy baja frecuencia (vibrato),
especialmente visible en el primer segundo. Las notas de 3 cuerdas presentan una clara
modificación en sus pendientes de decrecimiento y una modulación de amplitud. En las notas de
octavas más altas, la modulación es tan profunda que hace más difícil apreciar a simple vista el
cambio de velocidad de decrecimiento.
La existencia de vibrato, o modulación de amplitud de muy baja frecuencia resulta
intuitiva para el caso de 2 cuerdas. El espectro resultante para cada parcial son dos componentes
(casi deltas) ligeramente separadas una distancia F. Es el mismo espectro que tendía una
modulación de amplitud DBL (Doble Banda Lateral) con una portadora de valor media aritmética
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 85 Tesis Doctoral
y moduladora senoidal de frecuencia F/2. Si la separación es de unos pocos Hz, la moduladora
es claramente de muy baja frecuencia. El inconveniente de este modelo de modulación es que se
maneja una frecuencia (la portadora) que realmente no existe en ninguna cuerda.
Otro inconveniente es su uso para unísonos de 3 cuerdas. Si la separación de los
componentes de las tres cuerdas fuese simétrica, podría llegar a decirse que un a de ellas es la
portadora y las otras dos las bandas laterales de una modulación de muy baja frecuencia. Sin
embargo, los unísonos de 3 cuerdas no tienen porque estar afinados de forma simétrica.
Por tanto, la existencia de vibrato debe plantearse mejor como el resultado del proceso
temporal siguiente: 2 vibraciones de frecuencias (periodos) ligeramente distintas se inician en
fase, según pasa el tiempo, la pequeña diferencia de periodo hace que los pasos por cero de una
de ellas se retrasen respecto a los de la otra. Progresivamente, ese desfasaje llega a provocar que
cuando un vibración pasa por cero subiendo la otro lo hace bajando y las dos señales están en
oposición de fase. Su suma casi se cancela. Pasado más tiempo, vuelven a quedar en fase y la
suma se potencia, y así sucesivamente.
Las figuras 31, 32 , 33 y 34 muestran el resultado de sumar dos sinusoides de frecuencia
ligeramente distinta, inicialmente en fase. Como se ve pueden ser aparentemente distintos.
Estos resultados pueden establecerse matemáticamente en cuanto a que la posición
temporal en que las dos señales están en contrafase y sus periodos se cancelan se corresponden
con:
sen T sen T Tn
f fn
fn( ) ( )
( )( )
( )( )
, , , ....ω ωδ1 0 2 0 0
2 1 1
2 12
2 12 1
1 2 3= − ⇒ =−−
=−
−= (73)
siendo f2=δAf1, y por tanto δ es la relación entre frecuencias, que puede expresarse en cents:
δ δ( )log
logcents =1200
2 (74)
La primera cancelación se obtiene para T0=1/2(f2-f1) y las restantes a intervalos 1/(f2-f1).
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 86 Tesis Doctoral
Fig.31.-Suma de dos senoides, una de 200Hz y otra de200.6 Hz (5 cents de diferencia), de igual amplitud einicialmente en fase. La amplitud está normalizada alvalor máximo.
Fig.32.-La diferencia de sólo 1cent a 200 Hz (200Hz y200.11 Hz), hace que la cancelación se tienda a realizaren un momento mayor que la duración de la nota, porlo que puede pasar desapercibido el efecto demodulación. La amplitud está normalizada al valormáximo
Fig.33.-Un mismo intervalo (5 cents) a mayorfrecuencia supone mayor distancia entre lascomponentes y mayor frecuencia moduladora. Se ve lacomposición de 600 Hz y 601.7 Hz.
Fig.34.-El detalle de la zona de cancelación muestracómo se cancela casi todo un ciclo correspondiente aambas señales en contrafase. Esta condición no semantiene mucho tiempo y la cancelación vadesapareciendo
Como ejemplo, la figura 34 tendrá la cancelación en T0=1/2(200.578457-200)=0.864 s., como de
hecho ocurre.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 87 Tesis Doctoral
3.4.1.- UNÍSONOS CON AMORTIGUAMIENTO
El amortiguamiento de la vibración es un aspecto que no se ha incluido hasta ahora. El
amortiguamiento debido a la disipación interna en la cuerda es despreciable frente al causado por
la transferencia de energía a través del soporte al puente y la placa [Conklin 96c]. Además, no
resulta posible medir el amortiguamiento espacial, que es el que determina cómo se atenúa la
vibración a lo largo de la cuerda y sólo podemos medir el amortiguamiento temporal.
Como se ha podido ver en la figura 31, el amortiguamiento temporal de una nota con una
sola cuerda es prácticamente exponencial (lineal en escala logarítmica), lo que confirma que el
efecto de amortiguamiento por transmisión de energía a la placa puede considerarse proporcional
a la velocidad y modelable mediante un parámetro de Resistencia Acústica “R”, que estará
relacionado con el coeficiente de atenuación temporal α.
Podemos considerar pues que en el puente se cumple:
x t A e t
v t A e t A e t B e t
v t B e t B e t
v t B e t B e t B e t
i it
i
i i it
i it
i it
i
t t
t t t
( ) cos
( ) sin cos sin
( ) sin sin
( ) sin sin sin
=
= − − ≈
= +
= + +
−
− − −
− −
− − −
α
α α α
α α
α α α
ω
ω ω α ω ω
ω ω
ω ω ω
Para varias cuerdas:
2 cuerdas
cuerdas1 1 2 2
1 1 2 2 3 3 3
(75)
Para el caso de 2 cuerdas tenemos unas soluciones bastante parecidas al caso de sin
amortiguamiento, como puede verse en las figuras 35 a 40.
Puede verse que para notas de baja frecuencia y poca separación del unísono, casi no se
nota el efecto de éste. Dado que es característica del sonido del piano presentar doble
decrecimiento y algo de vibrato, los unísonos se afinarán con la suficiente separación.
Puede verse también que las cancelaciones siguen el mismo patrón visto sin
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 88 Tesis Doctoral
Fig.35.-Unísono de 2 cuerdas con amortiguamiento ypoca separación. El amortiguamiento enmascara elpoco efecto de vibrato.
Fig.36.-La figura de la izquierda con el eje logarítmico.Se aprecia el ligero efecto del unísono, pero elcomportamiento es parecido a una cuerda sola
Fig.37.-El efecto del unísono ya se aprecia al aparecerla cancelación en el momento previsto (0.864 s).Además, hasta ese momento, la amplitud decrece muyrápidamente. Tras la cancelación aparece un primerlóbulo. A partir de él el decrecimiento de la señal essimilar al caso de cuerda única. Existen 2 velocidadesde decrecimiento, lo que es típico del piano.
Fig.38.-La figura de la izquierda pero con escalalogarítmica. Se aprecia la caída inicial más rápida yal final como si fuera una cuerda única.
amortiguamiento y que todas las señales tienen algún punto que coincide con el caso de una
cuerda, al que tienden asintóticamente. A mayor separación de los unísonos (diferencia de
frecuencias), cada menos tiempo hay una cancelación y más lóbulos aparecen en el mismo
intervalo total de tiempo. Denominaremos primer lóbulo al que aparece después del primer
mínimo.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 89 Tesis Doctoral
Fig.39.- Si el intervalo del unísono aumenta, aparecenmás cancelaciones y más lóbulos. Puede verse que entodos ellos hay algún punto tangente a la curvaenvolvente del caso de cuerda única. El vibrato cobraimportancia. Hasta el primer nulo la caída es másrápida y luego el nivel decrece más lentamente, comosi la cuerda fuera única, pero con un vibratoimportante.
Fig.40.-La misma figura que la izquierda pero conescala logarítmica. se aprecia muy bien el vibratopero no tanto el efecto de doble decrecimiento.
Las ecuaciones para la posición de los nulos y de los puntos tangentes son:
Tn
fn
Tm
fmg
01
1
2 11 3 5 7
12 4 6 8
=−
=
=−
=
( ), , , , .....
( ), , , .....tan
δ
δ
(76)
Puede verse que de un análisis temporal de señales de notas con 2 cuerdas pueden
extraerse ciertos parámetros identificativos útiles para un proceso de entrenamiento. Así, si se
detectan las cancelaciones, se puede saber la diferencia entre las frecuencias del unísono. Esto
tiene una aplicación muy limitada en el caso de nuestro modelo de patrones espectrales del piano
porque:
a)Sólo se puede aplicar en la fase de entrenamiento, en la que se sabe que la nota que se
está entrenando tiene 2 cuerdas.
b)No siempre se sabe lo anterior, pues si se entrena con grabaciones, sin ver el piano, no
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 90 Tesis Doctoral
Fig.41.-Unísono de 3 cuerdas. El primer mínimo, quees un nulo como en el caso de 2 cuerdas, lo marca elintervalo más alto (2 cents). No hay tangencia con elcaso de una cuerda. Se aprecia el doble decrecimiento.
Fig.42.-El primer mínimo lo marca el intervalo mayor(3 cents). La relación entre intervalos afecta a loslóbulos y al valor del mínimo. Hay tangencia en elsegundo lóbulo. Se aprecia el doble decrecimiento.
se puede saber con total seguridad si la nota tiene 2 cuerdas.
c)Las notas que suelen tener dos cuerdas son siempre notas graves que no pasan del C3.
Así, con 128.4 Hz de fundamental, un unísono de 4 cents, que ya es elevado para el gusto
de los afinadores y oyentes [Kirk 59] supone una diferencia de 0.3 Hz y dará una
cancelación a 1.66 s. Aún en el caso de detectarlo, el dato espectral obtenido es mucho
menor que la resolución de frecuencia que se va a utilizar, que es de 0.5 Hz.
Los resultados para unísonos de 3 cuerdas son mucho menos previsibles. Como se ve en
las figuras 41 a 45, los cálculos realizados muestran que los nulos desaparecen salvo en casos
concretos y los lóbulos no siempre presentan puntos de tangencia con el caso de cuerda única. Los
puntos de cancelación (aunque no sean nulos los seguiremos llamando así) son menos marcados.
Los unísonos se definen con la frecuencia de la nota como referencia y las otras dos frecuencias
están expresadas ambas respecto a la de referencia.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 91 Tesis Doctoral
Fig.43.-El primer mínimo aparece antes por ser mayorel mayor intervalo (4 cents). Aparecen más lóbulos porello, pero los mínimos no son nulos y la tangenciaparece existir en el tercer lóbulo.
Fig.44.-El primer mínimo lo marca el intervalo mayor(4 cents) y es un nulo. Aparece una tangencia en elsegundo lóbulo. El doble decrecimiento sigue siendoevidente
Fig.45.-Caso poco usual en que ambas cuerdasadicionales se afinan iguales con un mismo intervalorespecto a la cuerda fundamental. El primer mínimo noes nulo pero lo ajusta la relación de 4 cents. Todos loslóbulos tienen tangencia
Se pueden extraer ciertas conclusiones de las simulaciones:
a) A mayor relación máxima antes aparece el mínimo, pero la posición de este no depende
sólo del máximo intervalo. El valor que se obtiene está entre los dos valores obtenidos
para ambos intervalos considerados por separado(fórmula para dos cuerdas). Está,
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 92 Tesis Doctoral
concretamente, por debajo de la media de dichos valores, y no una cantidad fija sino más
por debajo de esa media cuanto mayor sea el cociente entre los valores de los dos
intervalos y menor el valor del intervalo más pequeño.
b) Si las dos relaciones establecen un unísono simétrico (por ejemplo 1 y 2, 2 y 4), los
mínimos son nulos.
c) Existe punto de tangencia en el lóbulo cuyo orden coincide con la diferencia de los
intervalos. El orden de dicho lóbulo coincide con el número de mínimos que existen antes
de él.
d) Si los dos intervalos son iguales y las cuerdas adicionales están afinadas igual, la
situación no es como tener sólo dos cuerdas, pues los mínimos no se hacen nulos. Sin
embargo, existe tangencia en todos los lóbulos y no se cumple la conclusión c)
Resulta imposible en la práctica obtener los valores de las tres frecuencias midiendo los
puntos de cancelación, ya que serían necesario medir varios puntos de cancelación, los que no
siempre existen. Además, su suavidad provocaría errores de detección y errores en los cálculos
Por tanto, estas simulaciones que han permitido exponer los aspectos de doble
decrecimiento y de vibrato, no dan lugar a ninguna conclusión o método que pueda ser incluido
en el modelo de identificación de acordes.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 93 Tesis Doctoral
3.5.- VIBRACIÓN DE PLACAS
3.5.1.- PLACA ISÓTROPA
La ecuación de la vibración de una placa isotrópica, cuya vibración se supone restringida
al eje perpendicular al plano de ella, es [Giordano97]
ρ∂∂
hz
tD z
2
24= − ∇ (77)
en la que “z” es el desplazamiento en vertical (vibración de flexión), h es el grosor de la placa (se
considera uniforme), ρ la densidad del material y D es la “rigidez” calculada como [Giordano 97]
Dh E
Nm=−
3
212 1( )( )
σ (78)
donde E es el módulo de elasticidad de Young y σ es la relación de Poisson. Mientras que el
primero expresa la relación entre el estrés(fuerza por unidad de superficie) y el “strain” (cambio
de longitud por unidad de longitud que se produce), el último parámetro expresa la relación entre
la expansión transversal por unidad de longitud de una barra circular y su acortamiento por unidad
de longitud. Su valor es de 0.3 para materiales duros y de 0.5 para materiales tipo goma, por lo
que suele usarse el valor de 0.3 casi como si de una constante se tratara para la madera de la placa.
Estamos suponiendo que la placa sólo vibra en el eje z, por lo que:
∇ = +22
2
2
2
∂∂
∂∂x y
(79)
3.5.1.1.- Soluciones para panel infinito
La onda de flexión de un panel infinito se propaga con una velocidad dada por [Beranek
71 ]:
cD
s
=ω
ρ
2
4 (80)
que es aplicable a cualquier caso sin más que particularizar el D adecuado a la dirección de
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 94 Tesis Doctoral
propagación considerada.
Puede verse que la propagación es dispersiva siendo la velocidad dependiente de la
frecuencia. Concretamente, las frecuencias altas se propagan más rápidamente.
Resulta típico incluir en las expresiones de vibración por flexión, la velocidad de
propagación longitudinal, de forma que quedan relacionadas. No deben confundirse ambas
velocidades al analizar las ecuaciones.
Normalmente, la inclusión de un término de amortiguamiento propio de la placa se realiza
considerando la rigidez compleja [Beranek 71] Dc=D(1+jη),siendo η el factor de pérdidas
(adimensional)
Por último, la radiación de sonido por parte de la placa vibrante infinita se hace
especialmente a partir de un frecuencia que se denomina “de corte” y que viene expresada por
[Beranek 71]:
fc
Dcs
c
=2
2πρ
(81)
3.5.1.2.- Impedancia de entrada a una placa infinita: impedancia característica de la placa
La impedancia característica de una propagación en una placa infinita, que coincide con
la impedancia de entrada que ve el elemento excitador en cualquiera de sus puntos, es:
Z D hc0 8= ρ (82)
3.5.1.3.- Soluciones para panel finito
Si consideramos el caso más simple, el de panel rectangular con todos sus bordes fijados
(sin movimiento ni curvatura), se cumplirá [Beranek 71]:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 95 Tesis Doctoral
kmL
nL
fD m
LnL
m nm n x y
m nc
s x y
,,
,
= =
+
=
+
2
2
2 2
2 2
πλ
π π
πρ
π π (83)
debe observarse que la relación entre k y f no es lineal al ser propagación dispersiva.
Cada modo define una forma de deformación de la placa cuyo patrón de desplazamiento
para cada punto del plano es proporcional a:
ξπ π
( , ) sin sinx ym xL
n yLx y
= (84)
Si se establece una representación cartesiana de los valores de k en función de dos
componentes, uno dependiente de m (modos en eje x) y otro de n (modos en eje y), de forma que
se puede considerar a k como a un vector con dos componentes. Esta representación presenta las
siguientes ventajas [Beranek 71]:
-Para cada modo (valor de k) la dirección del vector k respecto a los ejes kx y ky es la
misma que la dirección de propagación de la onda directa (respecto a los ejes x e y de la
placa) que al combinarse con las reflexiones da lugar al modo.
-Para cada modo (valor de k), el módulo del vector k da una idea de la frecuencia que
excita al máximo dicho modo (resonancia). La frecuencia será'aquella cuyo valor de ke
coincida con el módulo de k. Esto supone que una frecuencia “f” excita principalmente
todos los modos que se encuentran en un arco de radio:
kf
cf
Dexcitacions
c
= =2
2 4π
πρ
(85)
lo que indica que toda frecuencia excita modos en todas las direcciones, que a mayor
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 96 Tesis Doctoral
frecuencia, al ser mayor el radio, mayor es el número de modos llevados a resonancia.
Debe recordarse que en principio, que un modo no sea llevado a situación de resonancia
no significa que no se excite en absoluto.
Un concepto interesante al analizar los modos propios de una placa es el de “Densidad
modal”, que expresa el número de modos que presentan resonancia en una cierta banda de
frecuencia con anchura de 1 rad/s. Así, el número de modos que presentan resonancia ( y por
tanto diremos que el número de modos propios) entre los valores de ω y ω+1 rad/s es [Beranek
71]:
[ ]n rad sL L
k rad s k
si k k
n fL L
D
x yexcit excit
excit
x y s
c
( ) * / ( / ) ( )
( )
ωπ
ω ω
ππ
ρ
14
1
24
2 2
11
= + −
≥
≈
(86)
puede verse que para modos muy superiores al primero, la densidad es alta e independiente de
la frecuencia, es decir, es constante [Beranek 71]. Esta última afirmación puede ser puesta en
duda si consideramos que Dc incluye un término de amortiguamiento(factor de pérdidas), que
suele variar con la frecuencia.
También puede deducirse que a más superficie y menor grosor de la placa, la densidad de
modos es mayor, lo cual es interesante pues es lo que se busca de una placa que servirá de
elemento radiador de la vibración de las cuerdas. Esto coincide con la realidad de la fabricación
de placas resonantes ya que dan mejor sonido las de pianos más grandes y además se las somete
a adelgazamiento en ciertas zonas (llamado “Tappering”) de forma que la sección de la placa no
es de grosor constante.
Esta fórmula es válida para cualquier forma de la placa resonante siempre que se aplique
a modos cuya longitud de onda sea mucho menor que la menor dimensión de la placa [Beranek
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 97 Tesis Doctoral
71]
3.5.1.4.- Impedancia de entrada a panel finito
La impedancia de entrada a panel finito no sigue la ley conocida para otros tipos de
propagaciones, como la de la cuerda, sin embargo puede ser intuitivo considerar que seguirá
existiendo una relación entre dicha impedancia, la impedancia característica, la impedancia
terminal en cada dirección y la distancia entre el punto de excitación (entrada) y dicha
terminación. Dicha relación será específica para cada modo de propagación o vibración a través
del parámetro k.
Así, es evidente que según la posición de excitación habrá diferencias en el valor de
impedancia incluso para la misma frecuencia de excitación.
Gracias a la existencia de diversas medidas realizadas en paneles finitos, pueden
desarrollarse modelos aproximados, cuyos resultados se asemejen a los medidos.
3.5.2.- PLACA ANISÓTROPA: PLACA ORTOTRÓPICA
Si consideramos que la rigidez de la placa, dada por el módulo de Young, no es la misma
para las dos direcciones principales (eje y perpendicular), la ecuación de la vibración de flexión
es [Giordano 97]:
ρ∂∂
∂∂
σ σ∂
∂ ∂∂∂
σ σ σ σ
hz
tD
zx
D D Dz
x yD
zy
Dh E
Dh E
Dh G
x x y y x xy y
xx
x yy
y
x yxy
xy
2
2
4
4
4
2 2 2 2
4
4
3 3 3
4
12 1 12 1 12
= − − + + −
=−
=−
=
( )
( ) ( )
siendo (87)
donde los parámetros están definidos para cada dirección y Gxy es el módulo de cizallamiento
(“shear”)
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 98 Tesis Doctoral
3.5.2.1.- Soluciones
La resolución es complicada y suele recurrirse a técnicas de elementos finitos, sin
embargo proponemos usar como primera aproximación:
fm D
L
n D
Lm ns
cx
x
cy
y, =
+
πρ
π π
21 4
24
2
(88)
3.5.3.- PLACA ORTOTRÓPICA CON COSTILLAS
La inclusión de costillas pretende incrementar la rigidez de la placa en aquella dirección
en que es demasiado baja, de modo que no sea tan alta la diferencia entre los módulos de
elasticidad de Young. Pero este efecto sólo se consigue a bajas frecuencias [Giordano 97]. Para
altas frecuencias la rigidez no se ve afectada por las costillas. Sin duda. La separación entre las
costillas determina la zona de frecuencias de “transición”.
La costilla es un listón de madera más rígida que la de la placa que se dispone a lo largo
del eje menos rígido. A falta de conocer el efecto global de las costillas en los parámetros físicos
de la placa, suele proponerse una resolución basada en diferencias finitas en las que la zona de
la costillas se considera homogénea (no mezclada con placa sin costillas), y en esa zona se
especifica [Giordano 97]:
Dh E
Dh h E
Dh h G
xribx
x yyrib
rib rib
x yxyrib
rib xy=−
=+
−=
+3 3 3
12 1 12 1 12( )( )
( )
( )
σ σ σ σ (89)
de forma que la costilla no sólo impone su mayor módulo de elasticidad sino que el segmento
debe considerarse más grueso, lo que también aumenta la rigidez. La costilla sí se considera
isótropa. Estas expresiones suponen otras aproximaciones en las que no vamos a entrar pues la
situación es ya suficientemente compleja de cara a presentar la problemática de la resolución de
la vibración de una placa resonante.
En cuanto a los parámetros físicos, mientras que E debe tomarse para cada dirección de
la propagación, sí se puede considerar un valor promedio de la densidad superficial [Beranek 71]:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 99 Tesis Doctoral
Fig.46.-Foto de la parte inferior de un piano de cola. La placa se sitúapor encima del armazón de madera apoyados sus bordes en el marco dela caja. Las costillas atraviesan la placa fijadas a ésta por debajo.[Pianode cola Yamaha del Teatro Real de Madrid. Foto del autor]
ρ ρρ
s placaL t t
x y
hL nL L
Kg m= ∗ + cos cos ( / )2 (90)
Como primera aproximación podemos usar la fórmula 88 usando la densidad promediada
y la rigidez de las costillas (módulo de Young y grosor) en la dirección “y”.
3.5.4.- MODOS PROPIOS EN PLACAS NO RECTANGULARES
Es conocido que la forma rectangular mejora la distribución de los modos respecto a la
forma cuadrada, al evitar la existencia de diversos modos entran en resonancia con el mismo valor
de frecuencia. De igual manera, la forma no rectangular favorece la distribución de los modos,
de forma que existirán más modos en medias y altas frecuencias que en placa rectangular de las
mismas dimensiones. Esta afirmación puede compararse con lo que ocurre en sistemas
tridimensionales (salas de conciertos y de grabación), en las que se evitan que los bordes
(paredes) del sistema vibrante sean paralelas entre sí, para evitar que ciertos modos propios
tengan más energía, en detrimento de otros, que pueden llegar a no existir.
Si se analiza la fórmula de modos propios para placa rectangular, puede verse que diversas
combinaciones de m y n pueden dar el mismo valor de frecuencia, sobre todo si las dimensiones
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 100 Tesis Doctoral
se relacionan por números enteros. Eso significa que dicha frecuencia excitará diversos modos,
transfiriéndose más energía de esa frecuencia que de otras. Esta situación es inadecuada y la
primera medida que se debe tomar, incluso en placas rectangulares, es que las dimensiones no
tengan relaciones enteras.
Si alguna frecuencia a emitir no provoca resonancia de ningún modo, será débilmente
radiada. Lo ideal sería que toda frecuencia tuviera asociada un modo del que provoca la
resonancia. Esto se aproxima mejor con la forma claramente irregular de la placa resonante del
piano, cuya contrapartida es la dificultad a la hora de intentar analizarla.
Una placa real persigue tener una alta cantidad de modos propios con la mayor igualdad
de importancia, para lo que se recurre a formas de la placa que no permiten la resolución analítica
de las ecuaciones diferenciales. Aunque existen métodos numéricos para analizar la vibración de
placas tan complicadas, como el de los elementos finitos, no resulta imprescindible para nuestro
modelo simple. Por otro lado, algunos métodos publicados para considerar el efecto de la placa
en aplicaciones de síntesis, hacen uso de simulación mediante filtro FIR, en las que se requieren
hasta más de mil coeficientes [Bank 2002].
Resulta por tanto más razonable plantear un modelo sencillo cuyos resultados se
aproximen razonablemente a las medidas existentes. Al respecto de esto conviene indicar dos
aspectos:
-Los modos en baja frecuencia son pocos y deben poder ser bien aproximados. El efecto
de cada uno es claramente distinto a cada frecuencia de excitación cercana.
-Los modos en alta frecuencia son tantos y tan densos que más importante que sus valores
exactos es su efecto conjunto, pues ninguna frecuencia de excitación estará muy cerca de
uno y a la vez muy lejos de otro. Dicho “efecto conjunto”dependerá de la densidad de
modos propios.
3.5.5.- IMPEDANCIA DE PLACAS REALES
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 101 Tesis Doctoral
Fig.47.-Módulo y fase de la impedancia de una placasegún estudios de Wogram [Giordano 97]. Losvalores oscilan alrededor de 1000Kg/s y decrecenmonótonamente a partir de 1kHz.
Fig.48.-Módulo de la impedancia de una placa medidaen el punto del puente correspondiente a la cuerda dela nota G3 [Giordano 98a]. Los valores son algo másaltos de 1000 Kg/s y decrecen a partir de 3 kHz. Losmínimos corresponden con los modos de la placa.
Este parámetro es clave para analizar el efecto de la placa sobre la vibración de la cuerda
(frecuencias emitidas) así como para considerar la cantidad de energía que se transfiere de la
cuerda a la placa para su posterior radiación. Esta cantidad de energía no sólo afecta al nivel
espectral de cada parcial radiado sino también a la duración del mismo, pues si la energía se
transfiere rápidamente la vibración se apagará pronto.
En primer lugar, la impedancia depende de las características físicas de la placa. Además,
la impedancia depende del punto donde se excite la placa. Existen diversos estudios sobre
medidas de impedancia de la placa [Conklin 96b][Giordano 98a][Giordano 97]. En algunos casos
se prefiere caracterizar la movilidad (inverso de la impedancia mecánica).
En las figuras 47, 48, 49 y 50 se muestran medidas típicas de placas reales, obtenidas de
algunas de las referencias anteriores [Giordano 98a][Giordano 97] . Puede verse que no se
corresponden con un sistema sencillo, por lo que su modelado es complicado.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 102 Tesis Doctoral
Fig.49.-Módulo de la impedancia de una placa medidaen el punto del puente correspondiente a la cuerda dela nota C4 [Giordano 98a]. Los valores están alrededorde 1000 kg/s y decrecen por encima de 3 kHz. Losmínimos corresponden a los modos de la placa y tienenla misma posición que en el caso de G3, sin embargo,sus valores son distintos.
Fig.50.-La fase de la impedancia medida en el puntodel puente de la cuerda G3 [Giordano 98a]. Indica si lavelocidad de desplazamiento del puente está en fase ono con la fuerza, mostrando si el comportamiento estipo masa, elasticidad o estamos en un modo de la placa(fase=0)
La impedancia de la placa es uno de los puntos de mejora en el diseño de pianos, pues
afecta críticamente al sonido como se ha indicado arriba. Téngase en cuenta que, por ejemplo, se
ha publicado que en cierta mejora introducida por un fabricante, la disminución de masa aplicada
llega al 7% mientras que la rigidez baja un 20%. La transmisión de energía a la placa aumenta una
media de 2.5dB. Sin embargo, el amortiguamiento de la vibración no solo no aumenta de manera
audible en octavas bajas, sino que en las notas más agudas (octavas 5 y superiores) disminuye,
alargándose la duración de la nota alrededor de un 30% [Bilhuber 40]. Esto se relaciona con una
mejora en la pendiente de la curva de impedancia a altas frecuencias que puede explicarse porque
al disminuir el amortiguamiento, cada modo es más independiente de los demás y el efecto
conjunto de modos densos no disminuye tan rápidamente la curva de impedancia.
Puede verse que todos los aspectos son tenidos en cuenta.
A pesar de la dificultad por modelar la placa, se incluye a continuación un modelo
suficientemente simple que nos permite acercarnos a los valores mostrados en las figuras xxx
anteriores
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 103 Tesis Doctoral
3.5.6.- MODELO IMPEDANCIA PLACA
Un modo es una forma de vibrar la placa. Las formas de vibrar son independientes de la
forma de excitarlas, la amplitud que adquieren no. Además, una vibración se puede expresar con
una ecuación, en la que existen términos o partes de la ecuación, que correspondan con la
descripción matemática de cada modo. Una excitación a una cierta frecuencia provoca una
vibración en la placa que puede ser representada por una combinación de las ecuaciones de los
modos propios. Si se requieren varios modos para expresar la vibración es que dicha frecuencia
ha provocado la excitación de varios modos.
Existe, en definitiva, una cierta independencia entre la frecuencia de la excitación y los
modos usados para la vibración, en cuanto a que una frecuencia puede llegar a excitar varios
modos y no sólo uno, de forma que la energía suministrada por la excitación puede distribuirse
entre varios modos.
Por otra parte, en la realidad, la placa no vibra como un sistema único y por eso no puede
decirse que sea un sistema de orden 2 (masa-resorte con un grado de libertad), sino que se trata
de un sistema en el que la vibración es el resultado de la propagación de una onda mecánica desde
el punto de excitación hacia el resto de la placa. Por tanto, los modos de vibración pueden
considerarse modos de propagación. Relacionar los modos con la propagación permite considerar
que hay dos procesos “separados”: el de la excitación y el de la propagación o vibración de la
placa. Este modelo es tanto más cierto cuanto menor sea la longitud de onda de la propagación
en la placa respecto a las dimensiones de esta.
Esta “separación” permite definir una zona de la placa asociada a la excitación y que
llamaremos “campo próximo”, que es la que determinará de forma simplificada las condiciones
de carga o impedancia de la placa vista por la cuerda. El planteamiento es análogo al usado para
estudiar la radiación de pistones y altavoces. Así, cada frecuencia que excita la placa ve una
impedancia equivalente a una impedancia de entrada a una línea de propagación (guia-onda)
bidimensional . Como dicha impedancia no es la misma si la frecuencia de excitación coincide
con un modo o no, dicha impedancia podrá expresarse en función de términos dependientes de
cada modo.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 104 Tesis Doctoral
En cuanto al modelado de dicha impedancia de entrada, consideraremos que cada modo
propio a excitar provoca un efecto en el “campo próximo” que se puede modelar como un sistema
resonante de orden 2. Además, los distintos modos propios interaccionarán entre sí sumando
movilidades, es decir como un conjunto paralelo de circuitos resonadores orden 2 que reparten
corrientes (es decir velocidades) para la misma tensión (fuerza) aplicada. Esto se corresponde con
el hecho de que la fuerza aplicada como excitación a la placa reparte su energía entre diversos
modos de propagación. La energía transferida a cada modo da lugar a una vibración con cierta
amplitud y velocidad en cada modo. En teoría se podría decir que todos los modos se excitan ante
cualquier frecuencia, aunque si la amplitud va a ser cero, no tiene mucho sentido decir que se
excita. Para determinar hasta qué punto son muchos los modos que se excitan ante una misma
frecuencia, aunque cada uno lo haga con una amplitud distinta, es importante introducir el factor
de calidad de las resonancias de una placa de piano.
Este factor Q da una idea de lo ancha que es la respuesta de cada modo, y depende del
amortiguamiento interno de la placa para cada modo. El factor de calidad en placas de piano es
del orden de 200 [Conklin 96b], que es suficientemente bajo como para asegurar que en
frecuencias agudas con placas con densidad modal alta, existirán varios modos excitados
simultáneamente. Sin embargo a bajas frecuencias cada modo resulta bastante poco excitable por
frecuencias más cercanas a otros. En todo caso, en nuestro modelo es más sencillo calcular el
efecto de todas las ramas en paralelo aunque algunas den velocidad nula. El valor del Q debería
aplicarse al modelo incluyendo en cada circuito resonante (rama) un valor de R adecuado para
ese valor de Q. Sin embargo, no se hará así pues el valor de Q no es realmente el mismo (200)
para todos los modos.
En resumen, ante una cierta frecuencia de excitación, será más excitado el que tenga
frecuencia del modo más parecida a la de excitación, pero no será el único. Esto corresponde con
el hecho de que ese modo tendrá más velocidad que los otros, o su circuito equivalente más
corriente que los otros pues su impedancia será menor (admitancia mayor), pues tiene más
movilidad que los otros. Todos los modos excitados tendrán una velocidad según su movilidad
y la suma de ellas da la velocidad (energía) total. Por tanto la fuerza da lugar a una velocidad total
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 105 Tesis Doctoral
Fig.51.-Modos calculados para placa de 2.8mx1.4m y relaciónortotrópica longitudinal/transversal de 0.2. Existen unos 300 modos pordebajo de 10 kHz, la mayoría por encima de 1 kHz. Se han calculadounos 700 modos y se han ordenado por valor creciente de frecuencia y acada uno se le ha asignado un índice (número) para ordenar y contar.
que depende de la suma total de movilidades, que determinan la impedancia.
Veamos ahora los resultados de impedancia de placa calculados por este modelo y su
optimización.
En la figura 51 se muestran los modos que se calculan para una placa ortotrópica
rectangular con relación longitudinal/transversal de 0.2, con un ancho de 1.4m y un largo de 2.8m
(cierto parecido a placa de piano gran cola con costillas) . Puede verse que hasta 1 kHz apenas
hay 30 modos, mientras que hay casi 500 modos por debajo de 20 kHz, de los cuales 300 modos
están por debajo de 10 kHz. El modelo debe calcular el efecto combinado de al menos esos 300
nodos. El primer modo está cerca de 100Hz y el décimo modo está cerca de 400Hz, por lo que
están bastante separados.
En definitiva, se trata de modelar los valores de Rsbi y Msbi que la placa presenta para
cada modo y que permiten definir cada uno de los circuitos resonadores y realizar el cálculo del
efecto de todos en paralelo, para cada frecuencia de excitación. El valor de Ssbi viene fijado por
el valor de la frecuencia característica del modo y el valor de Msbi.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 106 Tesis Doctoral
S MSBi i SBi= ω 02 * (91)
Para modelar los valores de Rsbi y Msbi proponemos dos alternativas, que llamaremos:
-Modelo de “campo próximo aislado”
-Modelo de “campo próximo tonal”.
3.5.6.1.- Modelo de “campo próximo aislado”
En los cálculos presentados en apartados anteriores sobre la variación de la frecuencia de
vibración de la cuerda “Isb”, en función de la impedancia de la placa, se había considerado que
cada frecuencia que se transmite a la placa hace vibrar, inicialmente, una sección de la placa de
tamaño similar a una “longitud de onda”, y aunque posteriormente esa vibración se transmitía por
toda la placa repartida en varios modos, eso no se tenía en cuenta. Esto equivalía a considerar que
cada frecuencia sólo excitaba el modo más cercano y que el sistema de orden 2 correspondiente
a dicho modo, viene impuesto sólo por las condiciones del “campo próximo” aislado, sin
considerar la propagación completa.
En este modelo vamos a considerar lo mismo, pero asignando valores de MSB y RSB a
todos los modos según su longitud de onda y calculando el efecto conjunto de todas las
admitancias.
La Msb viene calculada como:
MsbC
fC
fhBL BT= * * * ρ (92)
donde los dos primeros términos CB son las velocidades de propagación de la onda de flexión
(“Bending wave”) longitudinal y transversal, divididas por la frecuencia para obtener las
longitudes de onda; “h” es el grosor de la placa (del orden de 1cm) y ρ es la densidad del material
(400 Kg/m3). Como la propagación de la onda de flexión en una placa es dispersiva, las
velocidades de propagación dependen de la frecuencia según la ecuación 80, por lo que al final,
el modelo de la “campo próximo aislado” considera Msb inversamente proporcional a f.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 107 Tesis Doctoral
Para mantener el modelo de orden 2 en cada modo, la rigidez tampoco será la misma para
todos ellos, sino que se ajustará para cada modo de cara a obtener la frecuencia de resonancia del
sistema de orden 2 igual a la del modo: SSB=MSB*ω20SB. Esto supone que la rigidez es mayor para
modos altos lo que concuerda con la idea física de que es más fácil doblar un listón largo que uno
corto.
Establecer el valor de R para cada modo es más complicado. La primera cuestión es que
a mayor tamaño de zona excitada mayor serán las pérdidas por rozamiento con el aire. La segunda
es que cualquier vibración de alta frecuencia suele estar más amortiguada que las de baja. La
tercera es que R no sólo debe indicar el amortiguamiento de la vibración de la placa, sino que
debe dar una idea de la transferencia de energía entre la cuerda y la placa (no debe ser muy baja
para no acortar la duración de la nota, ni muy alta pues supondría poca transmisión y por tanto
poco nivel de sonido a esa frecuencia). Aunque no puede predecirse la variación de R, la primera
aproximación más lógica es considerar que R crece con la frecuencia.
La figura 52 muestra los resultados calculados con este modelo de “campo próximo
aislado”. No son unos resultados muy similares a la impedancia medida (ver figura 49), por lo que
el modelo no es el más adecuado.
El comportamiento a bajas frecuencias, similar a las medidas, es razonable. Por un lado,
estos primeros modos hacen vibrar casi toda la superficie de la placa, funcionando casi como un
sistema concentrado. El efecto de la propagación no es tan notorio y no haberlo considerado no
afecta mucho. Por otro lado, al ser modos más separados, el efecto viene impuesto principalmente
por un modo y no por la conjunción de muchos. La realidad se parece bastante a este modelo en
bajas frecuencias.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 108 Tesis Doctoral
Fig.52.-Módulo de la impedancia mecánica obtenida mediante el modelode “campo próximo aislado”. Msb decrece con la frecuencia (1/f) y Rcrece con la frecuencia (f1/2). Los modos corresponden con los mínimosde impedancia. La impedancia a bajas frecuencias sí se parece a lasmedidas.
3.5.6.2.- Modelo de “campo próximo tonal”
Si el efecto de la propagación sobre la impedancia que se ve en el punto de excitación para
cada modo no puede ser fácilmente previsto, pero debe ser considerado, lo que se propone es
establecer unas leyes razonables para los valores de Msbi y Rsbi, que permitan ajustar la curva
de impedancia calculada a la medida. Msbi y Rsbi no serán ya unas constantes para cada modo,
sino que variarán de valor con la frecuencia para cada modo. Por esa variación con la frecuencia
hemos considerado posible denominar al campo próximo “tonal”.
Si consideramos el efecto de propagación, sabemos que cada frecuencia de excitación
puede provocar propagación de varios modos, y que las características de propagación de cada
uno de esos modos no son las mismas para todas las frecuencias que lo excitan. Estos aspectos
generales de una propagación son más evidentes en técnicas de guía ondas (p.e. cálculos de
dispersiones), pero también pueden ser aplicados en propagaciones mecánicas.
Como resultado de este planteamiento, ya no se calculará el efecto de cada modo con un
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 109 Tesis Doctoral
Fig.53.-Módulo de la impedancia simulada con elmodelo de campo próximo tonal. R crece con lafrecuencia. No hay rizado en frecuencias altas.
Fig.54.-Impedancia simulada con el modelo decampo próximo tonal, con R creciendo con f hasta1kHz y luego se mantiene constante. Aumenta elrizado en las frecuencias altas.
Fig.55.-La simulación con el modelo de campopróximo tonal, considerando que R decrece a partirde 1kHz, exhibe un rizado excesivo respecto a lasmedidas.
Fig.56.-Módulo de impedancia medida para posiciónde la nota C4 [Giordano 98a ]
valor fijo de Msb y Rsb, sino que se considerará que dichos parámetros son una función de la
frecuencia. El efecto de cada modo se calculará en todo el margen de frecuencias con dichos
parámetros tomando valores según la frecuencia a la que se calcula el efecto (frecuencia de
excitación) y no según la frecuencia del modo que se calcula.
El resultado que se puede obtener aparece en las figuras 53, 54, 55 y 57, y puede verse una
buena similitud con la impedancia medida en figura 49 [Giordano 98a] , que se vuelve a
reproducir aquí por comodidad.
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 110 Tesis Doctoral
Fig.57.-Valores de Msb con la frecuencia deexcitación, usados para el cálculo de la movilidad decada modo. Nótese que por encima de 1kHz, el valordecrece rápidamente.
Fig.58.-Modos calculados para la placa de 2.8x1.4musada en la simulación del modelo de campo próximotonal y en otros resultados previos. El más bajo estáalrededor de 100Hz. Hasta 1kHz sólo hay unos 28modos. Sin embargo, la placa presenta unos 500modos hasta 20kHz.
Para llegar a estas soluciones se han tenido que ajustar las curvas de variación de Msb y
Rsb con la frecuencia, mediante diversas pruebas.
Para conseguir estos resultados, el ajuste de los parámetros Msb y Rsb es el que se
muestra en las figuras anteriores para Rsb y en la 57 para Msb. En esta última, puede verse que
existe una cierta relación entre la variación de Msb con la frecuencia, usada para el cálculo en
todos los modos, y el comportamiento de los valores de frecuencias características de los modos:
Los 10 primeros modos llegan hasta 400 Hz, que es hasta donde se mantiene constante Msb. De
400 Hz a 1kHz, Msb decrece ligeramente y a partir de 1kHz decrece rápidamente coincidiendo
con la zona de frecuencias en las que aparece la acumulación de modos.
Puede establecerse una relación, al menos aparentemente, entre los siguientes hechos:
-las frecuencias bajas se asocian a Msb altas, del orden de la masa de toda la placa.
2.8x1.4x0.01x400=16 kg (largo x ancho x grosor x densidad)
-los modos más excitados por dichas frecuencias movilizan la casi totalidad de la placa.
Esto se desprende de las medidas de vibración para los primeros modos de una placa
[Suzuki 86]
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 111 Tesis Doctoral
y también:
-las frecuencias altas se asocian a Msb cada vez menores.
-los modos más excitados por dichas frecuencias movilizan sólo partes de la placa
[Suzuki 86]
Ambas pueden llevar a considerar la posibilidad de relacionar Msb con la masa que
realmente se moviliza en la vibración de la placa.
La ecuación que cumple Msb es:
Msbf
=+
10
13000
2 (93)
En cuanto al parámetro R, que mide el amortiguamiento de la vibración, pueden verse en
las figuras tres casos:
- R creciendo con la frecuencia en todo el margen.
-R creciendo hasta 1 kHz y luego se mantiene constante
-R creciendo hasta 1kHz y luego decreciendo
El comportamiento de las tres curvas de impedancia es muy similar salvo por el “rizado”
a partir de 3kHz, que no existe en el primer caso y va creciendo en los otros. Dado que en las
medidas existe rizado, debemos concluir que el valor de R crece hasta una cierta frecuencia (1
kHz) para luego mantenerse constante o empezar a disminuir.
El comportamiento de una impedancia decreciente a partir de 3kHz es consistente con las
medidas de duración de notas. Al bajar la impedancia y acercarse más a la impedancia
característica de las cuerdas, la transmisión de energía es mayor y la vibración se extingue antes.
Esta disminución de la duración de las notas de frecuencias altas es conocida hace tiempo [Martin
47]
El resultado del modelo con “campo próximo tonal” es bueno y puede considerarse un
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 112 Tesis Doctoral
modelo sencillo con buena aproximación. Sin embargo hay aspectos que pueden ser mejorados.
Principalmente, no parece muy realista que el comportamiento de Msb y Rsb con la frecuencia
sea el mismo para todos los modos.
Otra de las limitaciones es derivada de que el ajuste a curva medida se hace sólo respecto
a una curva medida en la posición del puente de la nota C4. Sin duda en otros puntos del puente
la impedancia sufre una modificación en la forma
Por último, el aspecto que hace que este modelo no pueda ser fácilmente utilizado en la
identificación de notas y acordes, es el hecho de que no suelen ser conocidos los datos necesarios
sobre la placa resonante del piano que se está identificando. Una posibilidad que se apunta como
trabajo futuro es que, si se calcula, durante el entrenamiento del modelo, la longitud aproximada
de la cuerda más larga, se podría usar este dato como longitud de la placa. Y siendo el ancho un
valor casi siempre alrededor de 1.4m y considerando una relación ortotrópica típica, se podría
calcular la simulación de la impedancia según el modelo de campo próximo tonal.
En todo caso, si consideramos estos valores de Msb, el efecto sobre los cálculos de Isb
inicialmente presentados es que serán menores las variaciones de la frecuencia real de vibración
respecto a las teóricas en algunos casos, en los que se llegaban a considerar valores de Msb del
orden de 0.4 Kg y menores.
3.5.7.- AMORTIGUAMIENTO DE LAS NOTAS Y COEFICIENTE “R” DE LA PLACA
El amortiguamiento de una vibración es siempre un tema complicado puesto que existen
varios mecanismos simultáneos responsables del amortiguamiento, y no todos son proporcionales
a la velocidad [Beranek 71].
En el piano, el amortiguamiento de la vibración de la cuerda viene marcado casi
exclusivamente por la transferencia de energía a la placa.
Ya hemos tratado la existencia de amortiguamiento al analizar la vibración de unísonos,
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 113 Tesis Doctoral
pero no hemos entrado en su valoración.
El desarrollo teórico [Beranek 71] nos indica que para una vibración senoidal única, en
la que el amortiguamiento es proporcional a la velocidad de vibración, se tiene:
x t Ae t
ff
Q
Qf T
t( ) cos
.
=
≈ =
=
−α ω
α π ηπ
1
11
1 60
2 2
para amortiguamiento pequeño (94)
Donde α es la constante de atenuación, η es el “factor de pérdidas”, Q el “factor de
calidad” y T60 es el tiempo que tarda la vibración en disminuir 60dB su nivel.
Si se toman niveles logarítmicos, para cada nota podremos calcular:
log( ) log( ) log( ).
nivel nivel eT
f
nT n
n
2 12 3
− = =−
=
−α α
ηα
π
(95)
siendo T el tiempo que pasa entre los dos puntos cuyo nivel se mide. Si consideramos que para
valores de T superiores a 2 s. el unísono tiende a ser tangente con el caso de una cuerda,
podremos obtener el amortiguamiento equivalente a una única cuerda y serán aplicables las
fórmulas anteriores.
Si además se usa el parámetro “R” (Resistencia mecánica) para simbolizar el coeficiente
de amortiguamiento en la ecuación diferencial de un sistema de orden 2 correspondiente a la
carga de la placa en el extremo de la cuerda, se podrá calcular:
CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO
Identificación Automática de Acordes Musicales 114 Tesis Doctoral
Fig.59.-Valores medidos de R en las grabaciones del piano de muestray una aproximación polinómica. Ambas muestran un comportamientoinicialmente creciente con la frecuencia, para posteriormente empezar adecrecer.
R M fSB n= η π2 (96)
Aplicando la ecuación de Msb ajustada en el apartado del modelo de impedancia de placa
con parámetros ajustados, el valor que se obtiene de R a partir de las medidas, para el piano
Yamaha, y su aproximación polinómica aparecen en la figura 59
Estos resultados confirman que en el caso de considerar válida la ecuación de variación
de Msb que permite ajustar las curvas medidas de impedancia de placa, la curva de variación de
R debe ser creciente hasta un valor cercano a 1 kHz, para luego decrecer no tan rápidamente como
había crecido. Se trata de un caso intermedio entre los dos simulados en las figuras 54 y 55
Identificación Automática de Acordes Musicales 115 Tesis Doctoral
CAPÍTULO 4: MODELO
En este capítulo se desarrollan los aspectos correspondientes al modelo acústico usado
para generar los patrones espectrales. se incluyen los aspectos de entrenamiento y de extrapolación
de los valores entrenados al resto de las 88 notas del piano.
El modelo se completa a partir de dos submodelos. El primero es el de las cuerdas del
puente de agudos y el segundo es el de las cuerdas del puente de graves. Ambos difieren en
diversos aspectos de las cuerdas. Cada uno de ellos se entrena por separado, pero el modelo de
las notas del puente de graves requiere ciertos datos obtenidos del modelo de las notas del puente
de agudos, por lo que el orden en el entrenamiento y modelado es primero el puente de agudos
y después el de graves.
La transición entre el puente de agudos y el de graves se denomina “salto a graves” (“Bass-
break”) y tiene lugar entre dos notas que no son las mismas en todos los pianos. Dichas notas
suelen ser más bajas cuanto más largo es el piano.
4.1.- PARÁMETROS DE DISEÑO DE CUERDAS DEL PUENTE DE
AGUDOS
Todos los fabricantes hacen uso de unas reglas de diseño de la longitud de las cuerdas que
presentan pocas variaciones de unos a otros.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 116 Tesis Doctoral
La primera cuerda que se diseña es la más corta, correspondiente a la nota 88,
concretamente C8. Esta cuerda tiene entre 5.0 y 5.4 cm [Conklin 96c]. El resto de las cuerdas se
calcula a partir de la 88 con la fórmula:
L n L s n( ) = ⋅ −88 88 (98)
en la que L88 es la longitud de la cuerda 88 y ‘s’ es un coeficiente que decide cada fabricante y
que varía entre 1<s<1.06.
La mayor longitud de cuerda que se admite en el puente de agudos debe evitar que la
posición del puente esté muy cercana al borde de la placa vibrante (lo que supondría una mala
excitación de los primeros modos de la placa, disminuyendo la amplitud radiada de las
componentes graves de la nota), por lo que el tamaño de la placa vibrante, y por tanto del piano,
determinan la longitud máxima de cuerda en el puente de agudos. La nota inferior a esa deberá
estar situada en el puente de graves y diseñarse con entorchados. Las cuerdas del puente de
agudos son de acero sin entorchado.
El diámetro de las cuerdas del puente de agudos varía entre los valores de 0.787mm y
1.6mm (0.031" y 0.063"), tomando valores en saltos de 25.4 µm (0.001"), salvo a partir de
1.295mm (0.051") que los saltos son de 50.8 µm (0.002") [Conklin 96c]. En el caso de la nota 88,
el diámetro es alguno de los tres primeros: 0.787 mm, 0.813mm ó 0.838 mm (0.031",0.032" ó
0.033").
Otro aspecto importante en el que coinciden todos los autores es en que la tensión de las
cuerdas del puente de agudos es prácticamente constante. Las diferencias reales se deben a ajustes
de la afinación. Por tanto, el modelo considerará la tensión constante.
En cuanto a la afinación, las notas más altas presentan una afinación por encima del valor
de la frecuencia temperada que llega a 35 cents en la nota 88 [Backus 69]. Esto supondría un
incremento en la tensión, respecto a la necesaria para afinación a frecuencia temperada, de sólo
un 4%. Por tanto, el cálculo de las cuerdas se realizará considerando las fórmulas de afinación a
frecuencia temperada, ya que las variaciones para afinación real son pequeñas.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 117 Tesis Doctoral
Fig.61.-Tensiones calculadas para diversos valores de r88 y L88, paraafinar a f0.
La figura 61 muestra los valores de tensión que se corresponden con la cuerda 88 para
diversos valores de L88 y r88. La fórmula usada es:
f fc
L L
TT L f rflexible
L0 1 88
20 882
882
2
1
288 4= = = ⇒ =− ρ
ρπ( ) ( ) (99)
y puede verse que los posibles valores de la tensión varían entre 660 N y 875 N.
La figura 62 muestra posibles curvas de L según el valor de L88 y ‘s’ seleccionados.
Aparece clara la necesidad de adecuar el valor de ‘s’ al tamaño del piano, pues si no, estaríamos
forzando un salto a graves muy alto con una gran cantidad de cuerdas en el puente de graves. La
figura 63 es un detalle de la anterior, limitado a longitudes de 2m que es el orden de magnitud de
la cuerda más larga que suelen tener los pianos de gran cola de 2.74cm de longitud exterior
[Steinway].
Puede verse que es inevitable que el puente de graves exista y contenga al menos las
cuerdas de unas 15 notas.
Una vez que el fabricante ha elegido un conjunto L88, r88 y T, el valor de T se mantiene
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 118 Tesis Doctoral
Fig.62.-Longitud de las cuerdas para valores de L88 de 5.0cm y 5.4cm,y tres valores de ‘s’ típicos (1.052,1.054,1.057)
para el resto de las cuerdas y es fácil calcular el radio ‘r’ de cada una de ellas.
r notaT
L f
T
L s f
r
snota nota notanota
nota
nota( )( )
( )
= = =⋅
− −−
−
−22 2
2
088
880 88
88
12
88
88
12
88ρπρπ
(100)
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 119 Tesis Doctoral
Fig.63.-Detalle de la longitud de las cuerdas del puente de agudos. Eltamaño del piano limita la longitud máxima provocando el cambio alpuente de graves (‘bass-break’).
La figura 64 muestra posibles curvas del radio de las cuerdas. Debe considerarse que los
radios altos no son preferidos pues suponen una mayor inarmonicidad en la cuerda, lo que
deteriora la calidad del sonido
Puede verse que los valores altos de ‘s’ consiguen cuerdas de menor radio y menor
inarmonicidad, si bien requieren longitudes mayores.
Puede concluirse pues que de todos los posibles valores, sólo algunos son normalmente
elegidos para pianos de calidad y estos dependen a su vez del tamaño del piano. En general, un
piano mayor permite mayores longitudes de cuerda y menores radios lo que lleva a cuerdas con
menor inarmonicidad y a un puente de agudos que contenga la mayoría de las cuerdas.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 120 Tesis Doctoral
Fig.64.-Diámetros de cuerda calculados. Nótese que a mayor ‘s’menores radios se necesitan. Resulta claro que valores de ‘s’ iguales oinferiores a 1.052 no son recomendables.
Puede verse que los valores altos de ‘s’ consiguen cuerdas de menor radio y menor
inarmonicidad, si bien requieren longitudes mayores.
Puede concluirse pues que de todos los posibles valores, sólo algunos son normalmente
elegidos para pianos de calidad y estos dependen a su vez del tamaño del piano. En general, un
piano mayor permite mayores longitudes de cuerda y menores radios lo que lleva a cuerdas con
menor inarmonicidad y a un puente de agudos que contenga la mayoría de las cuerdas.
Ahora bien, todos los pianos tienen suficiente tamaño como para poderse asegurar que por
encima de la nota C4 hay pocas diferencias en la longitud de cada cuerda entre diversos pianos
[Conklin 96c]. Lo que lleva a considerar valores de L88 y ‘s’ que se equilibren entre sí y a
considerar un modelo promedio o típico que pueda ser adaptado o entrenado en cada caso.
De la figura 63 resulta evidente que para que la longitud de la nota C4 (nota 40) no varíe
mucho entre pianos, tampoco deberá existir entre pianos mucha variación en los valores de ‘s’
usados para el diseño.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 121 Tesis Doctoral
4.1.1.- COEFICIENTE DE INARMONICIDAD
El modelo persigue evaluar correctamente el coeficiente de inarmonicidad para poder
generar un patrón espectral lo más real posible.
La ecuación que determina el coeficiente de inarmonicidad es:
BE r
L T=
π 3 4
24 (101)
E es el módulo de elasticidad de Young. En nuestro caso del puente de agudos, T es
constante y lo que importa es la relación r/L. Aunque aparentemente ‘r’ afecta más, y normalmente
se analiza diciendo que a mayor ‘r’ mayor es la inarmonicidad, ocurre que el margen de variación
de ‘L’ es mayor que el de ‘r’, lo que lleva a situaciones en las que cuerdas menos gruesas pero con
poca longitud presentan más inarmonicidad que otras más gruesas pero con mucha más longitud.
Es lo que ocurre en el puente de agudos, en el que la inarmonicidad crece con la nota aunque el
radio disminuya con ella. Así, la nota con más inarmonicidad es C8.
Si usamos las ecuaciones 98 y 100, podremos decir que en el puente de agudos:
BE r
L T
E r
L T s
nota
= =
−
π π3 4
2
3884
882
13
6
88
4 4
2 (102)
donde se ve que mientras s>1.039, el valor de B crecerá con la nota, hasta alcanzar el valor:
BE r
L T( )88
4
3884
882=
π (103)
Si ocurriese que s<1.039, B crecería al disminuir la nota, pero por encima del valor B(88)
indicado, lo que daría valores muy altos de inarmonicidad.
La ecuación de B(88) no debe confundir nuestro análisis, pues haciendo uso de la ecuación
99, que liga r88 y L88, se llega a:
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 122 Tesis Doctoral
BE
f
T
L( )
( )
8864 2
0 884
886=
πρ
(104)
lo que indica que no interesa ni tensiones muy altas ni L88 bajas.
También es fácil comprobar que las distintas combinaciones de L88 y r88 dan lugar a
variaciones muy apreciables en B(88), lo que tendrá consecuencias en nuestro modelo.
Concretamente, para diámetros entre 0.787 mm y 0.838 mm (0.031" y 0.033") y longitudes entre
5.0cm y 5.4cm, el coeficiente de inarmonicidad de la cuerda de la nota 88 varía 1.5 veces entre
sus valores menor y mayor.
Otra ecuación genérica del coeficiente de inarmonicidad, que se puede derivar de la
ecuación 101, teniendo en cuenta que la tensión se relaciona con la frecuencia fundamental
temperada, es:
BE r
L f=
πρ
2 2
40216
(105)
La figura 65 muestra posibles valores de B, calculados a partir de los dos valores extremos
de r88 y de los dos extremos de L88, para tres valores de ‘s’ alrededor de los típicos. Las
siguientes dos figuras 66 y 67, muestran detalles hasta la nota 64 (C6) y hasta la nota 30 (D3). La
figura 66 muestra que a partir de la nota C6 la inarmonicidad varía mucho de un caso a otro, e
incluso en la nota C6, la variación total puede llegar a 3.5 veces. La figura 67 muestra los valores
que tendrían las notas más graves si se pudieran montar en el puente de agudos y el orden de
magnitud de las notas previas al ‘salto a graves’.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 123 Tesis Doctoral
Fig.65.-Coeficiente de inarmonicidad B para 4 valores extremos decuerda 88 y 3 valores de ‘s’. Existe gran variación de valores entre lasnotas de octavas graves y agudas. Existe variación en las octavas agudasdependiendo de los parámetros iniciales de diseño.
Fig.66.-Coeficiente de inarmonicidad B para 4 valores extremos decuerda 88 y 3 valores de ‘s’. Ya existe mucha variación en la nota 64,según las condiciones iniciales de diseño.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 124 Tesis Doctoral
Fig.67.-Coeficiente de inarmonicidad B para 4 valores extremos decuerda 88 y 3 valores de ‘s’. Orden de magnitud en la zona del ‘salto agraves’.
Las pruebas realizadas para identificar notas, indican que la predicción del valor de B en
las octavas bajas y medias del puente de agudos (octavas 3 a 5 del piano) usando un modelo
promedio, es suficiente para la generación de los patrones y la identificación. Sin embargo existen
diferencias demasiado significativas en las octavas 6 y 7 que de hecho provocaban inicialmente
errores en la identificación.
4.1.1.1.- Efecto de un B erróneo en el patrón generado: sensibilidad del modelo
Es interesante calcular la variación de frecuencia que existiría en los parciales primero,
quinto y décimo respecto al valor armónico (es decir, la inarmonicidad), para las dos curvas
extremas anteriores de B. La relación de la inarmonicidad entre ambos casos extremos nos permite
analizar lo sensible que será la generación de patrones a errores en la predicción del valor de B en
el modelo. La figura 68 muestra este margen de variación. Los casos extremos son r88=0.838 mm
(0.033"), L88=5.0cm, s=1.052 para el B mayor y r88=0.787 mm (0.031"), L88=5.4cm, s=1.057
para el B menor.
Puede verse que el fundamental (primer parcial) es poco sensible a un error en el valor de
B, salvo en las octavas superiores 6 y 7, en las que la variación de frecuencias expresada en Hz,
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 125 Tesis Doctoral
Fig.68.-Variación de la inarmonicidad entre los casos máximo ymínimo anteriores, para los parciales 1,5 y 10. Se evalúa la sensibilidadal usar un valor de B no real.
como aparece en la figura 69, es apreciable, llegando hasta 15Hz en la nota 88. El parcial 5
empieza a presentar serios problemas a partir de la octava 5, por lo que debe controlarse bien la
evaluación de B para no tener errores en la identificación de notas a partir de dicha octava. El
parcial 10 puede ser problemático en todo el margen de notas del puente de agudos, por lo que
el uso de tantos parciales para la identificación, y por tanto para la generación de patrones, deberá
hacerse con un control bastante alto del valor de B asignado por el modelo.
A la vista de la figura 69, resulta evidente que todos los parciales superiores presentan
problemas a partir de alguna nota. Las notas más altas sólo presentan dos parciales en su espectro,
por lo que el patrón podría reducirse a sólo dos parciales, pero puede verse que incluso el segundo
parcial es crítico en esas notas altas. El algoritmo de identificación usa patrones con 10 parciales,
y resulta evidente que la situación es crítica para todas las notas del puente de agudos.
Esto nos lleva a la necesidad de despreciar un modelo fijo con un valor de B típico, y nos
requiere plantear un modelo adaptable. Esto puede realizarse por dos métodos:
-Entrenamiento previo
-Modelo con patrones múltiples
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 126 Tesis Doctoral
Fig.69.-Diferencia de frecuencias para inarmonicidades máxima ymínima anteriores, correspondientes a parciales 1,2,5 y 10. Resultaevidente el problema ante una elección errónea de B en el modelo.
Ni siquiera se podría plantear un modelo fijo en el caso de suponer que todos los pianos
se fabrican con un margen de variación del parámetro ‘s’ mucho más estrecho, concretamente
1.054<s<1.056. La figura 70 muestra la variación para los casos extremos.
Nótese que el ancho de los parciales de los patrones deberá ser suficientemente estrecho
para que el producto interno de cualquier par de ellos sea lo menor posible, nulo idealmente, lo
que supondría ortogonalidad entre los patrones. En las notas más bajas este ancho no puede ser
alto pues la separación entre el fundamental de una nota y la siguiente, aproximadamente un
semitono, es de unos pocos Hz.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 127 Tesis Doctoral
Fig.70.-Diferencia de frecuencias para inarmonicidades máxima ymínima en caso de margen reducido de valores de ‘s’. El parcial 10supera los 10Hz de diferencia entre casos extremos en casi todo elmargen de notas del puente de agudos.
4.1.2.- MODELOS ADAPTABLES
La primera solución: entrenamiento previo, supone el uso de algunas notas sueltas para
evaluar el valor real de B en las octavas más altas, tras lo cual recalcular el modelo, regenerando
los patrones. El método es evidente pero presenta un gran problema al tratarse de notas tan altas:
el espectro de la nota apenas contiene el fundamental y un segundo parcial, que se atenúa
rápidamente. Además, las altas frecuencias que se miden con una resolución inferior a 1Hz
permiten la distinción de las tres componentes del unísono, por lo que habría que distinguir entre
ellas en el algoritmo de entrenamiento.
Una primera solución es promediar valores para obtener una valoración suficientemente
aproximada de B. Para ello se utilizará una ventana cuya convolución disminuya la resolución
espectral reduciendo el grupo unísono a un único máximo. Tras las primeras pruebas se ha
descartado esta solución pues el máximo resultante queda desplazado hacia arriba en frecuencia.
En el siguiente capítulo se describe el entrenamiento y la medida del fundamental y del parcial.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 128 Tesis Doctoral
La segunda solución: modelo con patrones múltiples, pretende evitar lo anterior, utilizando
directamente un juego de patrones generados con distintos valores de B, que cubran todo el
margen debido a la posible variación de L88. Así, se realizarán varias métricas, una para cada
conjunto de patrones, y la que de máximo se usará para detectar la nota, e iterativamente, el
acorde.
A priori se esperan ciertos problemas de fiabilidad en este método dado que al abarcar
diversas posibilidades de patrones en frecuencias altas, algunas notas de la octava inferior tendrán
parciales que muy probablemente coincidirán con patrones de algunas de las posibilidades,
pudiendo establecer falsos máximos. Esto puede minimizarse si se sabe a priori si la nota pertenece
a esas octavas o no, lo que nos lleva al uso de la predetección.
Una tercera solución que se propone es realizar un entrenamiento aplicando un modelo
variable. El modelo variable elimina la necesidad de medir el valor de B pues se trataría de
seleccionar el valor de B que corresponda al conjunto de patrones que de el máximo en el
entrenamiento. Además, al ser entrenamiento, sabemos seguro que la nota pertenece a esas
octavas.
Como se verá a continuación, las soluciones de entrenamiento con patrones necesitan
partir de un dato que es realmente incógnita: la frecuencia del fundamental. Esta no es la
temperada sino que está modificada por la afinación , la cual a su vez varía con la curva de B que
tenga el piano.
Con tantas posibilidades, los métodos de patrones múltiples y variables elevan la carga
computacional de su implementación como método tipo ”fuerza bruta”.
Como se explicará se usa un método de medida directa de afinación y B pero con el uso
de patrones múltiples, pero no patrones de toda la nota sino patrones del unísono y sólo para
ciertas octavas.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 129 Tesis Doctoral
Fig.71.-Curva de afinación promedio de Railsback y curva de afinaciónde un piano concreto durante las pruebas de Martin y Ward [Martin 61]
4.1.3.- AFINACIÓN
Resulta evidente que es necesario conocer la curva de afinación para poder generar unos
patrones espectrales fiables en octavas altas. La afinación real provoca una modificación en las
frecuencias fundamentales de hasta 86 Hz en las octavas más altas (35 cents a 4186 Hz). La figura
71 muestra la curva promedio de afinación estudiada por Railsback así como una curva con la
afinación concreta de un piano [Martin 61]. La desviación típica por afinación es de tan sólo 1
Hz en C5 (unos 3 cents) y va creciendo hasta C8. Es importante por tanto en octavas altas.
En octavas bajas también es importante. Si bien los fundamentales graves no sufren mucha
variación en Hz (30 cents a 30 Hz supone sólo 0.5 Hz), los parciales de orden 20 de dichas notas
sí difieren mucho si no se considera la afinación.
Existen dos aspectos de la afinación que se tienen en cuenta:
-Afinación del A4, que puede ser a 440Hz o subir a 442Hz.
-La curva de afinación de todo el piano
La primera puede obtenerse por entrenamiento con la nota A4. La segunda deberá estar
referida a la escala temperada modificada por la afinación del A4, indicándose los cents de
separación. El modelo parte de la curva Railsback, de modo que la octava 4 se considera sin
modificación , la octava 5 se le asigna una afinación pequeña del orden de 3 cents, y a las octavas
6 y 7 , en las que la desviación puede ser considerable, se les asigna una afinación conforme a la
calculada en el entrenamiento. A las octavas 0,1 y 2 también se les asigna según se calcula en el
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 130 Tesis Doctoral
entrenamiento.
La forma de realizar la afinación presenta una ventaja para nuestras medidas, y es que el
fundamental siempre presenta el valor que debe tener, con independencia de todos los efectos que
físicamente modifican la frecuencia de vibración. Así, si la frecuencia del fundamental se separa
de la temperada, es sólo por la afinación. Por supuesto que la frecuencia ‘flexible’ f0 sí diferirá
bastante de la del fundamental, evidenciando los efectos de inarmonicidad e impedancia de la
placa.
Podrían obtenerse unas curvas de afinación teórica, si consideramos que el criterio de
afinación sea eliminar el batido entre el fundamental de la nota que se está afinando y el segundo
parcial de la nota de la octava inferior. Para ello se usa cálculo iterativo a partir de la ecuación
que relaciona la frecuencia fundamental a que debe afinarse una nota respecto a la fundamental
de la nota de la octava inferior, para :
f fB
Bnota octava nota octava
nota octava
nota octava1 1 1 2
1 4
1, , , ,
,
,+ = ⋅
+
+ (106)
Si partimos como aproximación de una octava 4 sin modificación de afinación respecto
a la escala temperada, el resultado de la iteración para las octavas superiores aparece en la figura
72 para las dos curvas extremas de B que hemos considerando. Se confirma que pueden existir
apreciables diferencias en la afinación de las octavas 6 y 7.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 131 Tesis Doctoral
Fig.72.-Curvas de afinación calculadas teóricamente considerando 0cents en toda las octava 4. Se muestran las dos curvas extremasconsideradas en el modelo. La octava 5 apenas presenta unos pocoscents de variación entre ambos casos. La 6 y la 7 sí presentandiferencias apreciables.
4.1.4.- ENTRENAMIENTO
En definitiva, el entrenamiento en octavas altas tiene dos fases:
1.-Entrenamiento con medida del fundamental para ajustar la curva de afinación. Incluye
la medida del A4.
2.-Entrenamiento con medida del segundo parcial o bien con patrones variables para
ajustar el valor de B en las octavas más altas.
Como se explicará en el capítulo de entrenamiento de agudos, el espectro de esas notas
presentan ciertas singularidades que podrían dar falsas identificaciones con patrones variables si
no se realiza un procesado previo de limpieza, que se explica más adelante
4.1.5.- PATRONES ESPECTRALES A GENERAR PARA LA IDENTIFICACIÓN
En la vibración real existen otros aspectos que modifican la frecuencia de cada parcial, lo
que lleva a tener espectros algo distintos de los patrones generados considerando sólo
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 132 Tesis Doctoral
inarmonicidad. Estos otros aspectos quedan considerados en el patrón mediante el uso de
ensanchamiento de los pulsos espectrales para incluir dichos márgenes de variación, siempre que
se justifique que dicho margen de variación es suficientemente pequeño. Principalmente tenemos:
error en la medida de la afinación, efecto de la impedancia de la placa resonante y variación de
anchura por valores de amortiguamiento distintos.
Se ha establecido un algoritmo de selección de la anchura del pulso espectral de los
patrones, que tiende a hacerlos más anchos al subir las notas y mantiene un mínimo al bajar las
notas. En todo caso deben ser más estrechos que la separación entre dos notas consecutivas que
es del orden de un semitono.
4.2.- ALGORITMO DETECCIÓN NOTAS AGUDAS PARA
ENTRENAMIENTO
Como ya se ha indicado, el entrenamiento con notas agudas de las octavas 6 y 7
persigue la obtención de valores tanto de la curva de afinación como del coeficiente de
inarmonicidad que permitan establecer la curva de B general de toda la zona aguda del piano a
analizar. Con estas curvas de afinación y de B se podrán generar los patrones que servirán para
identificar notas y acordes.
La detección del fundamental es importante para evaluar la afinación, aunque
aparentemente no sería significativo para evaluar el valor de B, pues la nota se afina al valor de
frecuencia de la escala temperada a oído, es decir, ya teniendo en cuenta el efecto de la
inarmonicidad del primer parcial.
Así, la valoración de B exige la detección de al menos el segundo parcial de la nota, lo
que supone un problema en algunos casos como indicaremos y solucionaremos.
4.2.1.- DETECCIÓN DEL FUNDAMENTAL PARA DETERMINAR AFINACIÓN.
Ya hemos indicado que la afinación supone variaciones del orden de varios cents en la
octava 6, llegando a varias decenas de cents en la octava 7.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 133 Tesis Doctoral
El primer algoritmo aplicado para detectar el fundamental durante el entrenamiento de
una nota conocida consiste en segmentar la zona alrededor de la cual se espera tener al
fundamental y aplicar en ella una detección de máximo.
No presenta fallos de funcionamiento y siempre detecta un máximo. Ahora bien, el
espectro del fundamental de una nota de octava alta presenta claramente la estructura del
unísono (fig73).
Cualquiera de los componentes del unísono puede ser el máximo, pero sólo uno de ellos tiene
la frecuencia que caracteriza la nota en la afinación.
La afinación se realiza en dos etapas [Afinador 2001]. En la primera el afinador
bloquea la vibración de las cuerdas exteriores del unísono y afina sólo la cuerda central. Esta
determina la afinación de la nota. En una segunda fase, libera la vibración de las cuerdas
exteriores y las afina ligeramente por encima y por debajo hasta obtener la adecuada duración y
doble velocidad de decrecimiento del nivel característico del piano [Martin 47]. Este proceso
no implica que las cuerdas exteriores queden afinadas simétricamente respecto a la cuerda
central.
La afinación de ambas cuerdas extremas hacia abajo o bien a ambos lados de la central
produce un sonido poco interesante como puede demostrar cualquier afinador [Afinador].
Existen estudios sobre preferencias de separación de los unísonos [Kirk 59], en las que se han
hecho pruebas con afinaciones con las cuerda principal centrada en frecuencia respecto a las
exteriores, a pesar de que se reconoce que la tendencia es a afinar las dos cuerdas exteriores
ambas por encima de la central. Las preferencias obtenidas en dicho estudio limitan la variación
entre frecuencias de cuerdas externas a 2 cents, si bien se admite como máximo tolerable hasta
6 cents. El autor admite no haber hecho pruebas en las dos octavas más altas del piano (6 y 7),
pero aún así consideraremos los resultados como orientativamente válidos.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 134 Tesis Doctoral
Fig.73.-Espectro de la nota E6 que muestra los componentes delunísono. El máximo no se tienen en le componente central que es el quemarca la afinación.
Con esta hipótesis, y teniendo en cuenta que la frecuencia temperada de la nota C6
(Do6) es del orden de 1046 Hz, la separación entre componentes del unísono llegará a ser del
orden de entre 1.2Hz a 3.5Hz, que son perfectamente diferenciables por un algoritmo con
resolución de 0.5Hz.
Así pues, según cual de los tres componentes del unísono sea el de máxima amplitud
(no tiene porqué serlo el central, y no suele serlo), el cálculo de la afinación puede sufrir
errores de unos pocos cents.
Este error se puede asumir de cara a la simple generación de patrones para
identificación sin más que ensanchar el pulso del patrón para englobar esos pocos cents de
variación.
El algoritmo mejorado que hemos desarrollado para detección del fundamental, es de
necesaria aplicación debido a un aspecto que se explicará en la detección del segundo parcial.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 135 Tesis Doctoral
En todo caso, su uso da resultados más precisos.
Se trata de generar un patrón que emule el espectro de un unísono con sus tres
componentes separadas una cierta cantidad. A los pulsos se les asigna un ancho ajustable entre
varios valores.
Aunque existen varias posibilidades para modelar los pulsos, el primer candidato es el
pulso Hanning. Cuando se calcula una FFT de una sinusoide con ventana, el resultado ya se
sabe que es un pulso en vez de la teórica delta. Si la ventana es Hanning, la forma del pulso es
exactamente sen2, es decir, Hanning. Por ello, dado que el algoritmo de identificación calcula la
FFT de la señal a identificar usando ventana Hanning, lo mejor para identificar sus
componentes es usar un pulso con forma Hanning.
Sin embargo, nos permitimos la pequeña modificación de usar pulsos Hamming, que
tienen una cola un poco más duradera que los pulsos Hanning, lo que se corresponde más con
la realidad del espectro de las notas. Las pruebas realizadas muestran mejores resultados de
identificación usando Hamming que Hanning. Algunos autores proponen usar pulsos con
forma de distribución de Cauchy [Chong 99] basándose en experimentos de síntesis.
Los anchos se varían tomando tres valores: 1.5, 2.5 y 3.5 Hz. que consideramos
significativos tras analizar los espectros de varias notas del piano de muestra. Las separaciones
se varían en saltos de 0.5Hz desde un valor igual a la anchura menos 0.5Hz (para que los tres
pulsos no queden totalmente solapados, lo que no corresponde con la realidad), hasta un valor
que asegure que ninguno de los patrones generados en cada caso supere los 25Hz de anchura
total. Esta anchura de 25Hz no ha sido medida en ninguna de las notas del piano de muestra y
supone una relación entre frecuencias del orden de 40cents, lo que invita a considerar que
nunca se dará..
Para cada uno de los posibles patrones generados tomando varios valores de anchura y
separación, se calcula la convolución con la parte del espectro que contiene el fundamental de
la nota. Para ello, primero se segmenta la zona del espectro alrededor del fundamental como se
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 136 Tesis Doctoral
Fig.74.-Resultados de convoluciones para identificar un fundamentalcon su estructura de unísono
hacía en el algoritmo anterior . Después se calculan las convoluciones (La figura 74 muestra un
ejemplo). La que da valor máximo determina la anchura de pulsos, la separación del unísono y
el desplazamiento del patrón hasta coincidencia máxima. Con ellos se puede calcular la
frecuencia central del unísono (considerado simétrico, aunque en la realidad no lo sea del
todo), que será tomada como frecuencia del fundamental.
Como se dispone además de la separación del unísono y del ancho de los pulsos, se
puede generar un patrón del fundamental muy ceñido a este (figuras 75 y 76 ) o bien un patrón
simple basado en pulso único tipo Hanning, suficiente para el reconocimiento.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 137 Tesis Doctoral
Fig.75.-Patrones de fundamental obtenidos mediante convoluciones conpatrones de unísonos. El resultado es muy ceñido al espectro real.
Fig.76.- Patrones de fundamental obtenidos mediante convoluciones conpatrones de unísonos. El resultado es muy ceñido al espectro real.
Las figuras 77 y 78 muestra los valores obtenidos de afinación para las notas de la
octava 6 del piano de muestra. La primera es la diferencia entre el fundamental medido y el
valor temperado y la segunda muestra la relación entre ellos en cents. Puede verse que los
valores pueden aproximarse por una curva de orden 2 ó 3, lo que permitirá un entrenamiento
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 138 Tesis Doctoral
Fig.77.-Medida de la afinación. Los fundamentales de las notas altas seafinan varios Hz por encima del valor temperado.
Fig.78.-Afinación: Medida de la afinación en cents para las notas de laoctava 6.
con sólo unos pocos valores.
La figura 79 muestra la comparación entre el resultado de la medida de la afinación que
se obtiene usando el método de la convolución de patrones o simplemente la detección del
máximo en el espectro. Además, la figura 80 muestra la separación entre unísonos y
fundamental correspondiente a los patrones que dan máxima convolución.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 139 Tesis Doctoral
Fig.79.-Afinación: Comparación de los dos métodos de medida delfundamental. Aunque no hay grandes diferencias, el uso de convolucióncon patrones de unísono permite obtener más información que el métododel máximos, para otros cálculos.
Fig.80.-Separación del unísono detectada con el método de convolucióncon patrones de unísono. Aunque algunos superan los valores preferidosen los estudios existentes [Kirk 59], no resultan excesivos y justifican elmargen de valores posibles de dicho parámetro usado en el algoritmo dedetección.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 140 Tesis Doctoral
Fig.81.-Error en la medida del fundamental.
Para comprobar la validez de los resultados de las medidas, hemos medido
directamente los valores de frecuencia fundamental y los otros componentes del unísono en el
espectro y hemos obtenido que el error máximo cometido en la evaluación del fundamental es
inferior a 1.5cents. concretamente, para la octava 6 del piano de muestra se tienen los errores
que muestra la figura 81, todos ellos inferiores a 1.5 cents.
En cuanto a la separación de los unísonos, estos no suelen ser simétricos en la realidad
por lo que un modelo con unísonos simétricos tiene que dar resultados con cierto error. Sin
embargo, a la vista de la figura 82, en la que se muestra el valor de separación del unísono más
alejado para las notas de la octava 6, puede verse que los resultados obtenidos en la evaluación
con el método de la convolución con patrón del unísono, son muy cercanos a la realidad, con
apenas algún Hz de diferencia, lo que justifica su validez.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 141 Tesis Doctoral
Fig.82.-Separación respecto al fundamental, del unísono más separado,medido directamente en el espectro del piano de muestra. Sonligeramente mayores que los obtenidos al considerar unísonossimétricos, expuestos en la figura 80
4.2.2.- DETECCIÓN DEL SEGUNDO PARCIAL PARA CALCULAR B
Las figuras 83, 84 y 85 muestran un ejemplo de espectro de nota de octava alta . El
segundo parcial es muy pequeño frente al fundamental. El tercer parcial es prácticamente
inexistente por encima de la nota D6 (Re6). En la zona del segundo parcial aparece una
estructura espectral que indica la existencia de más tonos que los que corresponderían al
segundo parcial (que sólo sería un unísono de tres). Además existe nivel espectral de ruido que
puede llegar a ser superior al del segundo parcial.
Evidentemente, la medida del segundo parcial exige un algoritmo más elaborado.
En primer lugar, al usar un algoritmo sencillo de detección de máximos, tras la
segmentación de la zona de búsqueda, los valores obtenidos presentan tres posibles análisis:
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 142 Tesis Doctoral
Fig.83.-Espectro nota A6. Apenas el fundamental y un segundo parcialpoco destacado
Fig.84.-El espectro anterior con el eje logarítmico. Se aprecia aún mejorlo poco destacado que está el segundo parcial. Tiene más nivel elsegundo armónico de no linealidad (2f0). El tercer parcial puedeapreciarse separado del tercer armónico no lineal. Sus niveles son muybajos.
a)El valor es correcto aunque no sea el central del unísono
b)El valor no es correcto aunque corresponde a una estructura tipo tonos
c)El valor no es correcto y corresponde a una zona de ruido
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 143 Tesis Doctoral
Fig.85.-Detalle del espectro de A6 mostrando la zona del segundoparcial. Previamente y con mayor nivel se distingue el segundoarmónico no lineal del fundamental. El ruido en la banda 3000-3200Hzsupera en nivel al segundo parcial.
El segundo caso suele detectarse por el hecho de que el valor de B calculado a partir de
él no tiene ninguna posibilidad de ser real. No sólo porque se salga de las curvas tipo
desarrolladas en la introducción teórica del modelo, sino porque a veces dan valores de B
nulos o incluso ligeramente negativos (fig 86).
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 144 Tesis Doctoral
Fig.86.-Valores calculados de B a partir del valor de segundo parcialdetectado por máximos para toda la octava 6. La tendencia real estámarcada por la línea creciente, pero aparecen ciertos valores cercanosa 0 o incluso negativos, que son erróneos
Al comprobar la zona en la que se ha producido la detección, puede verse que es la
inicial de la estructura de tonos y que sus valores de frecuencia son prácticamente iguales al
doble del fundamental o algo menos, lo que justifica los valores nulos o negativos de B.
Resulta evidente que nos encontramos ante la réplica de segundo armónico del fundamental
debida a la no linealidad de la vibración.
Hasta ahora, se había considerado que el único efecto notable de la no linealidad eran
los productos de intermodulación de segundo orden correspondientes a la suma de parciales
anteriores [Conklin 99]. En el caso de notas agudas, debido al bajo nivel del segundo parcial, el
armónico del fundamental es claramente notorio.
La primera solución para el algoritmo es la comprobación de si lo detectado pertenece
a esa zona (verificando si la frecuencia no es suficientemente superior al doble del
fundamental) y en caso positivo, suprimir dicha zona del espectro y volver a evaluar el
máximo. Esta técnica ha funcionado salvo en los casos en que el ruido espectral es superior a
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 145 Tesis Doctoral
Fig.87.-B calculado a partir del valor de segundo parcial detectado pormáximos pero con comprobación de que no se trata de segundoarmónico no lineal.
la estructura tonal del espectro. La figura 87 muestra estos resultados.
Existen ciertas diferencias de valor de B. El algoritmo indica en sus datos de salida que
existe detección de valor de armónico no lineal y consiguientes acciones en las notas 7,8,10 y
11. Así, diferencias en notas distintas a estas se deben al cambio de usar detección de máximos
a usar convoluciones (p.e. primeras notas). La nota 7 incrementa ligeramente el valor de B
tras eliminar el armónico. La mejora no es muy grande porque la eliminación de armónico que
se realiza en este algoritmo no es muy sofisticada. Las notas 8,10 y 11 muestran el mayor
defecto de este algoritmo: Puede verse que la nueva B es incluso más negativa que antes, lo
que quiere decir que en la segunda detección se detectan frecuencias más bajas que incluso el
armónico no lineal. Esto se debe al ruido espectral existente por debajo de dicho armónico y
que tiene más nivel que el propio segundo parcial, por lo que el algoritmo de convolución da
máximos en esa zona
La solución definitiva desarrollada consiste en un algoritmo sofisticado de limpieza del
armónico no lineal y del ruido. Para limpiar el armónico no lineal es esencial tener muy bien
delimitado el fundamental, y para eso es esencial el algoritmo mejorado usado en la detección
del fundamental y explicado anteriormente.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 146 Tesis Doctoral
Una vez bien evaluado el patrón del fundamental, con los tres pulsos del unísono
definidos por su anchura y separación, se procede a generar un patrón del armónico no lineal
centrado en una frecuencia doble, con separación del unísono doble y con anchura de pulsos
doble, lo que se corresponde con las conclusiones matemáticas sobre la distorsión no lineal.
Además, dadas las colas espectrales que en la realidad muestran tanto los
fundamentales como sus productos no lineales, el patrón para aislamiento del armónico no
lineal se ha generado en base a pulsos Kaiser con parámetro $=13, en vez de pulsos Hamming.
Esto permite modelar el espectro con pulsos cuya base sea hasta tres veces más ancha que la
anchura del pulso en puntos mitad (HAD), pareciéndose más a la forma real de los pulsos
espectrales de la nota.
Los pulsos resultante se normalizan a amplitud unidad.
El resultado puede verse en las figuras 88 y ? que muestran los espectros y los patrones
del armónico no lineal de orden 2 para diversas notas de la octava 6. Los armónicos debidos a
no linealidad quedan claramente marcados por los patrones de componentes no lineales, lo que
permitirá su eliminación con éxito.
La aplicación de estos patrones de armónico no lineal es evidente en las notas más
altas, en las que existe separación evidente entre las dos zonas espectrales (no lineal y parcial).
Basta con definir una máscara que anule los valores del espectro en el ancho del pulso del
armónico no lineal. Sin embargo esto es muy drástico en las notas más bajas (C6 a E6) en las
que la separación no es total y se pueden eliminar componentes propias del segundo parcial.
La decisión final ha sido establecer una máscara que con valores nulos en la mitad
inferior del pulso y con valores complementarios al pulso (1-p) en la mitad superior (fig.89).
El problema del ruido de nivel mayor que el segundo parcial, y que siempre aparece en
la zona anterior al armónico no lineal se resuelve también mediante una máscara adicional que
elimine esa zona del proceso de detección del parcial.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 147 Tesis Doctoral
Fig.88.-Espectros de la zona de segundo parcial y patrones generadoscorrespondientes a segundo armónico no lineal. Notas C6,C#6 y D6
Fig.89.-Generación de la máscara de limpieza a partir del patrón delsegundo armónico no lineal
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 148 Tesis Doctoral
Fig.90.-Espectro con segundo armónico no lineal y segundo parcialcercanos y la máscara que los separa.
Fig.91.-Espectro con segundo armónico no lineal y segundo parcialsuficientemente separados y la máscara que los separa.
Así, se ha desarrollado un algoritmo que incluye ambos aspectos, el del armónico no
lineal y el del ruido, para generar una máscara para limpieza del espectro previa a la detección
del segundo parcial. Las figuras 90, 91, 92 y 93 muestran el espectro de dos notas (C6 y A6),
las máscaras calculadas y dicho espectro antes y después de la limpieza.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 149 Tesis Doctoral
Fig.92.-Espectro antes y después de la limpieza con la máscara deeliminación de ruido y no linealidad, en una nota en que no están muyseparados segundo armónico no lineal y segundo parcial.
Fig.93.-Espectro antes y después de la limpieza con la máscara deeliminación de ruido y no linealidad, en una nota en que estánseparados segundo armónico no lineal y segundo parcial, y en la que elruido supera al segundo parcial.
Una vez realizada la limpieza, se aplica un algoritmo de detección al espectro
resultante. Una vez más podría usarse un algoritmo de máximos, pero también en esta ocasión
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 150 Tesis Doctoral
Fig.94.-Comparación de métodos para medir segundo parcial de cara alcálculo de B. Dos de ellos coinciden completamente y son los quepresentan menos variabilidad en los resultados. Se seleccionan para elalgoritmo de entrenamiento definitivo.
ha sido descartado. Se utiliza un algoritmo por convolución con patrones posibles del unísono
de segundo parcial análogo al usado para detectar el fundamental. Se han probado cuatro
posibilidades:
a) patrones con pulsos del unísono de anchura fija a 1.5Hz
b) patrones con pulsos del unísono de anchura igual a la calculada para el fundamental
c) patrones con pulsos del unísono de anchura doble que los pulsos del fundamental
d) patrones con pulsos del unísono de anchura variable.
La figura 94 muestra los valores de B obtenidos a partir de los valores medidos en cada
caso. Puede verse que el caso a) presenta mucha variación y que el caso c) presenta valores
demasiado altos en las notas bajas de la octava 6, sin respetar las curvas previsibles de B
(fig.95).
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 151 Tesis Doctoral
Fig.95.-Curvas de valores de B correspondientes a diversas situaciones reales límite. Losescalonamientos de las curvas se deben a considerar sólo valores del radio de las cuerdasestandarizados [Conklin 96c].
Los casos b) y d) dan el mismo resultado y es el mejor, al presentar una menor
variación y una variación más parecida a la esperada. De hecho puede comprobarse que en el
modelo de anchura variable, los anchos que dan máxima convolución para el segundo parcial
coinciden con los obtenidos para el fundamental, lo que está en consonancia con el hecho de
no relacionarse con este por una relación no lineal sino con el hecho de ser una vibración
adicional, linealmente independiente, con un amortiguamiento (factor Q y ancho de pulso
espectral) similar.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 152 Tesis Doctoral
4.2.3.- APLICACIÓN DEL ENTRENAMIENTO AL MODELO
Una vez que se ha podido establecer con bastante precisión el valor de afinación y de B
para las notas agudas, se puede establecer un conjunto mínimo de notas a entrenar que
permitan interpolar los valores de afinación y B del resto de notas.
Además, la medida del coeficiente B de ciertas notas significativas, nos permitirá
localizar con cierta precisión el piano en entrenamiento dentro de las curvas de B, lo que nos
puede llevar a considerar como más probables ciertos valores de r88,L88 y ‘s’ y así delimitar
las posibles curvas de B, lo que disminuirá el número de patrones variables a usar en la
identificación. Concretamente, las notas de la octava 7 permiten fácilmente descartar
posibilidades, como puede verse en la figura 95 donde aparecen curvas de B en casos límites
de ‘s’ para las 4 combinaciones de r88 y L88 (curvas con mismo color son los límites para
valores extremos de s).
4.3.- MODELO PARA NOTAS GRAVES
Las notas graves son aquellas cuyas cuerdas transmiten su vibración a la placa
resonante a través del puente de graves. El puente de graves es más alto que el puente de
agudos, lo que permite que las cuerdas graves pasen por encima de algunas de las cuerdas
agudas sin tocarse, aprovechando más el espacio disponible en la estructura del piano.
Al contrario que las notas agudas, para las que existe mucha documentación sobre las
ecuaciones usadas para diseñar la longitud de sus cuerdas, las notas graves no disponen de
tanta documentación, siendo sus longitudes muy distintas de un piano a otro. La longitud de la
cuerda más larga (nota más grave) está limitada por el tamaño del piano. Dicho tamaño
también limita la longitud de la cuerda más larga del puente de agudos, por lo que la transición
del puente agudo al grave no siempre se realiza en la misma nota, aunque suele ocurrir entre la
20 y la 26 en los pianos de cola.
En general, la transición entre puentes, denominada “Salto a graves” supone una
disminución de golpe en la longitud de la cuerda, que luego sigue creciendo al bajar la nota
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 153 Tesis Doctoral
Fig.96.-Extremo final de las cuerdas en un piano de cola. El puente de agudos continúa por debajo de las cuerdasde notas graves. Las cuerdas se cruzan a dos niveles distintos. Aunque no resulte muy evidente, la primera cuerdadel puente de graves (a la izquierda en la foto) es más corta que las últimas del puente de agudos (a la derecha) quellegan con bastante ángulo. También se ven las piezas metálicas que fijan al puente las cuerdas de cada unísono,los pines finales que fijan la cuerda al marco metálico y el material absorbente (rojo) que elimina la vibración deese tramo de cuerda. También se aprecia el entorchado de las cuerdas del puente de graves frente a las simplescuerdas del puente de agudos.
hasta alcanzar la cuerda más larga (figura 96). La longitud de la cuerda más larga del puente de
agudos suele tener un valor intermedio entre la longitud de la cuerda más larga y la primera del
puente de graves.
Esta disminución repentina de la longitud supone una ruptura en la secuencia de valores
correspondientes a la vibración fundamental de la cuerda, lo que debe ser compensado con un
incremento de la densidad lineal de estas. Este incremento puede realizarse mediante cambio
del material (incremento de la densidad), aumento de la sección transversal de la cuerda o
incremento de la masa mediante cuerdas entorchadas (bordones). Esta última es la elegida para
evitar cambios muy abruptos en las características tímbricas del piano.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 154 Tesis Doctoral
El modelado mínimo de las cuerdas graves supone la consideración de los siguientes
parámetros: longitud, tensión, radio del núcleo del bordón, radio total de la cuerda o su factor
de carga. Con ellos se puede prever el valor del coeficiente de inarmonicidad que resulta clave
para la generación de patrones espectrales.
Se va a explicar el desarrollo de un modelo de graves. Este modelo desarrollado,
realmente son tres modelos, cada uno de los cuales va superando las limitaciones del anterior.
4.3.1.- LONGITUD DE LAS CUERDAS GRAVES
A falta de ecuaciones típicas, consideraremos los valores medidos en el piano de
prueba. A partir de estos valores se obtendrá una ecuación. La hipótesis del modelo es que
dicha ecuación es común a la mayoría de los pianos y se considerará que sólo difieren en un
factor correspondiente a la longitud de la cuerda más larga.
La ecuación será del mismo tipo que la usada para el puente de agudos, apareciendo la
nota como exponente de una constante específica. La ecuación obtenida para el piano de
prueba es:
Lg
.a
sa*s nota
con a. *s
s y s .
= +
− −
=−
− − =
1427
0 412
1 24 0 974478
(107)
La ecuación normalizada para aplicar la hipótesis al modelo será la anterior dividida por la
longitud de la cuerda más larga, es decir, 1.427 m.
La figura 97 muestra el resultado de dicha ecuación. Puede verse que es algo menos
curva que la forma del puente de graves, lo que es debido a que el agraffe de graves también
cambia de posición al descender la nota, aumentando la longitud de las cuerdas.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 155 Tesis Doctoral
Fig.97.-Curva normalizada de longitudes de cuerdas del puente degraves, usada para el modelo.
4.3.2.- FACTOR DE CARGA
El factor de carga evalúa el incremento de la densidad lineal de la cuerda debido al uso
de entorchado. Si la cuerda de acero que sirve de núcleo al bordón tiene una densidad lineal
expresada por ‘DLC’, entonces la frecuencia fundamental de vibración transversal del bordón
supuesto perfectamente flexible sería:
fL
T
F L
T
LC L0
1
2
1
2=
⋅=
ρ ρ (108)
siendo T la tensión, lo que nos lleva a que ρL , la densidad lineal del bordón, que controla la
frecuencia de vibración, puede expresarse como:
ρ ρ πL c cr F= 2 (109)
es decir, la densidad lineal del núcleo por el factor de carga ( ρc es la densidad del material del
núcleo, acero) .
Las ecuaciones del factor de carga según el entorchado son las siguientes [Conklin
96c], refiriéndose sus parámetros físicos a la figura 98.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 156 Tesis Doctoral
Fig.98.-Cuerdas entorchadas. Parámetros para cuerdas con entorchadosimple y doble [Conklin 96c]
( )F 1d d d
d 1 entorchado simplew
c
w2
w c
c2
w
c
= ++
= + + =π
ρρ
πρρ
∆ ∆ ∆2 w
c
dd
; ; (110)
( ) ( )F 1
d 2d d d d d d d
d
c
w2
w u w c w u2
u c u
c2= +
+ + + +
πρ
ρ ρentorchado doble (111)
( )[ ]F = 1+ entorchadodoble
con mismo material
w
c
πρρ
ψ ψ ψδ
δ1 11
+ = +
= =; ; ;∆ ∆
dd
dd
w
c
w
u (112)
D d 2d 2d Diametro exteriorc w u= + + (113)
Tanto el entorchado simple como el doble se realiza con hilo de cobre. Los límites
recomendados para la ejecución de estos bordones son )#1.2 y *$2 [Conklin 96c], lo que
nos lleva a que los valores del factor de carga F serán menores de 10.4 para bordones simples
y menores de 19 para bordones dobles.
En los bordones simples, las condiciones anteriores obligan a R#3.4Ar.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 157 Tesis Doctoral
Para ambos tipos de bordones (entorchado simple y doble) se puede llegar a la
ecuación para el factor de carga:
F .R
r.=
+0 892 0108
2
(114)
siendo R el radio exterior y r el radio del núcleo del bordón (cuerda de acero). Las constantes
de la ecuación se obtienen si se considera que las densidades del acero y del cobre son
respectivamente 7750 y 8800 kg/m3.
4.3.2.1.- Densidad lineal
La densidad lineal resultante del bordón se obtiene de (109) y (114) como:
ρ L D d= ⋅ +543 10 6583 2 2. (115)
Dado que el segundo término de la suma tiene valores inferiores a 10-4 para todo el margen de
valores del diámetro del núcleo, se propone la aproximación [Fletcher 64]:
ρ L D≈ ⋅55 103 2. (116)
4.3.2.2.- Tensión
La tensión es el tercer parámetro que afecta a la frecuencia de vibración. De la
ecuación (108) es fácil deducir que:
T f L dc cF= 02 2 2π ρ (117)
Ya se vio que para las cuerdas del puente de agudos, la tensión se mantenía
prácticamente constante para todas las cuerdas. Sin embargo, en el puente de graves se opta
por incrementar progresivamente la tensión al decrecer la nota [Conklin 96b], lo que como se
justificará a continuación, disminuye la inarmonicidad de las cuerdas más graves, que en caso
contrario tiende a subir.
4.3.3.- INARMONICIDAD
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 158 Tesis Doctoral
Existen otros aspectos que limitan la libertad a la hora de diseñar un piano y que por
tanto afectan al modelo. Se trata de la inarmonicidad, que también relaciona algunos de estos
parámetros. La inarmonicidad de los bordones puede ser aproximada con la fórmula [Fletcher
64]:
Bd
D L f= 4 6 106
4
2 402. * (118)
Esta fórmula se obtiene de considerar la aproximación de la ecuación (116) y un valor de
E=195GPa para el acero. Si consideramos la ecuación de inarmonicidad de una cuerda simple
que tenga la misma densidad lineal que el bordón, pero el mismo tamaño que la del núcleo, se
obtiene:
BEr
L f
Er
L f D
d
L f Dc
LB
c= = =π
ρπ3 4
402
3 4
402 3 2
64
402 216 16 55 10
4 3 10( . • • )
. • • (119)
por lo que la inarmonicidad de un bordón resulta ser igual a la de una cuerda del tamaño de la
del núcleo, con la densidad lineal del bordón, pero incrementada en un 7%, pues 4.6/4.3=1.07.
Además, la ecuación de la densidad (109) y la de la tensión(117) nos permiten indicar:
BEr
L f
Er
L f F
Er
L Tc
LB
c
c
c= = =107
16
107
16
107
4
3 4
402
2 2
402
3 4
2
. • . • . •πρ
πρ
π (120)
que coincide con la inarmonicidad del propio núcleo, incrementada un 7%.[Conklin 96c]
Si tenemos en cuenta las ecuaciones de inarmonicidad (120), de tensión (117) y de F
(114), hemos podido comprobar que resulta imposible establecer una secuencia decreciente de
los valores de B al bajar la nota. Además hemos comprobado que intentar mantener B
constante por debajo de la nota 26 e igual al valor para dicha nota, supondría ir incrementando
la tensión al bajar la nota desde un valor de unos 600N hasta casi 7000N en la nota más grave,
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 159 Tesis Doctoral
lo que resulta inviable. La conclusión evidente es que el sistema del puente de graves debe
asumir un incremento de la inarmonicidad B al bajar la nota, pero que dicho incremento puede
ser controlado si incrementamos la tensión al bajar la nota hasta valores admisibles entre
1500N y 2000N. Estas conclusiones están de acuerdo con los gráficos típicos de tensión e
inarmonicidad de graves en pianos de cola descritos en [Conklin96b, Conklin96c].
Nuestro modelo toma las conclusiones anteriores como base para su desarrollo.
4.3.4.- RADIO EXTERIOR DE LAS CUERDAS GRAVES
En una primera aproximación al problema, nos planteamos una curva de tensión que
tuviera una forma parecida a la descrita por Conklin [Conklin 96b], lo que nos llevó a:
T s snota= − =−2000 20 0 85• . (121)
Teniendo en cuenta las ecuaciones de tensión y de factor de carga F, resulta que:
r F R rT
L fc
2 2 22
020 892 0108
4= + =. .
ρ π (122)
Hemos observado que para todos los posibles valores de r (radio del núcleo), que varían entre
0.394 mm (0.0155") y 0.8 mm (0.0315"), y respetando que los valores de F sean inferiores a
19, cada nota exige un valor de R casi invariable con independencia del valor de r. Esto se
debe a que evidentemente r2F>>0.108r2. El resultado puede observarse en la figura 99 y puede
exponerse con dos ecuaciones:
r F R2 20892= . • (123)
DLf
T
c
=1
0 8920 . • ρ π (124)
Lo que indica que el diseño especifica una secuencia de diámetros exteriores de los bordones y
que posteriormente se debe decidir las secuencias de r y F que lo cumpla.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 160 Tesis Doctoral
Fig.99.-Curvas de R exterior para todos los valores de r. Puede decirseque cada nota tiene un único valor posible de R exterior.
Si bien parece evidente que a partir de los valores de f0, de los valores de L
considerados y de la curva de T supuesta, se pueden calcular los valores del radio exterior de
todas las cuerdas graves, lo cierto es que la curva de T propuesta puede no ser la única, por lo
que es necesario comprobar cómo variarían los valores de D para otros valores de T.
Si consideramos varias curvas de tensión de modo que todas tengan una forma similar
pero con distintos valores en las cuerdas más graves, podemos proponer la ecuación:
T T m mT
y Tnota= − =−
=−−0
026 0085
600
0851000 2000• . ;
.... (125)
en la que se considera que la tensión en la nota 26 (última del puente de graves en el piano de
prueba usado) es del orden de 600N, que es un valor promedio como ya se justificó en el
modelo del puente de agudos. La figura 100 muestra la variación de los radios exteriores en
función de la tensión en las notas más graves.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 161 Tesis Doctoral
Fig.100.-R exterior para las notas graves según la tensión en la notamás grave. Se consideran las curvas de L y T del modelo.
La tendencia es que los pianos tengan la mayor tensión posible para disminuir la
inarmonicidad, por lo que son más realistas las conclusiones si usamos las curvas de mayor
tensión. Concretamente, el valor de 1500N está dado para pianos de cola de 2.74 m [Conklin
96b], que son de los mayores. Cualquier otro piano menor tendrá cuerdas más cortas, lo que le
exige mayor R exterior (al exigir mayor r y/o F para vibrar a la frecuencia correspondiente) y
llevará a usar tensiones algo mayores para compensar la inarmonicidad.
Como consecuencia de que las curvas para tensiones mayores no muestran gran
variación en el valor de los radios exteriores, hemos decidido que nuestro modelo parta de una
curva de R exterior promedio y calcule la curva de tensiones. El ajuste a cada piano podrá
realizarse por un proceso de entrenamiento previo al de reconocimiento. Se realiza una
aproximación a las curvas de R exterior siendo la aproximación cuadrática suficientemente
buena. Se considera la aproximación a la curva de 1750N un buen promedio y se genera la
curva aproximada. Dicha curva se normaliza respecto al radio exterior de la nota más grave de
nuestro piano. Así, cualquier otro piano podrá modelarse inicialmente en función del radio
exterior de su nota más baja (A0) y de la curva promedio normalizada. Estos datos físicos
inicialmente necesarios para el modelo deberán tenerse disponibles antes de la identificación o
en su ausencia deberán sustituirse por un mayor número de notas en el entrenamiento.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 162 Tesis Doctoral
Fig.101.-Curva normalizada de Radios exteriores usada por el modelo.
El uso de esta curva normalizada, junto con el dato del radio de la cuerda más grave
también permite evaluar aproximadamente la posición del “salto a graves” puesto que el
diámetro exterior de la cuerda de la nota más alta del puente de graves suele ser mayor que el
diámetro de la cuerda de la nota más baja del puente de agudos.
4.3.5.- ASIGNACIÓN DE VALORES DEL RADIO INTERNO Y FACTOR DE
CARGA
Para la evaluación de la inarmonicidad, y la consecuente generación de patrones
espectrales, es necesario conocer los valores de los radios internos y las tensiones o bien de los
radios internos y los radios externos, según la ecuación del coeficiente de inarmonicidad B que
se quiera usar.
El modelo desarrollado usa un algoritmo de asignación que empieza por asignar a la
nota más alta un diámetro de núcleo del orden de 0.838 mm (0.033"), que es uno de los más
bajos que suelen usarse [Conklin 96c], y luego se calcula el valor de F. El método se aplica
iterativamente para el resto de las cuerdas. Interesa mantener el radio del núcleo lo menor
posible para minimizar la inarmonicidad. Los criterios que marcan la obligación de incrementar
el radio del núcleo según vamos bajando en las notas son que debe cumplirse que:
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 163 Tesis Doctoral
Fig.102.-Curva B calculada por el modelo y aproximacionespolinómicas de orden 4 a la curva y a sólo 6 puntos de la curva
rR
y F≥ ≤34
19.
(126)
como ya se explicó anteriormente.
4.3.6.- COEFICIENTE DE INARMONICIDAD CALCULADO POR EL MODELO
Los valores de radio de núcleo obtenidos con el algoritmo anterior, así como la curva
de tensiones nos permite evaluar el coeficiente de inarmonicidad B con la fórmula 120.
El resultado se muestra en la figura 102 y se corresponde con la tendencia real de
disminuir ligeramente B para luego ir creciendo al disminuir la nota. Ya se justificó que era
imposible mantener constante o incluso disminuir B al bajar las notas, manteniendo un margen
de tensiones realistas. La misma figura 102 muestra diversas aproximaciones a dicha curva de
B.
La primera aproximaciones realizada es con un polinomio de orden 4, que permite
reproducir la curva con mucha precisión. Para ello se parte de los 26 datos de la curva. La
segunda aproximación es por tramos lineales, y muestra el caso de usar sólo 6 puntos de la
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 164 Tesis Doctoral
curva original. Hemos comprobado que 6 puntos distribuidos son los mínimos para que se
tenga un parecido suficiente. La última aproximación, que es la que más nos interesa, es un
polinomio de orden 4 calculado a partir de esos 6 puntos. Puede comprobarse que este
polinomio es muy parecido al anterior y más parecido a la curva original que la aproximación
por tramos lineales.
La conclusión importante de estas aproximaciones es que si consideramos que la curva
B calculada por el modelo se corresponde suficientemente bien con la realidad, esta realidad
puede ser ajustada a cada piano concreto mediante un entrenamiento que utilice tan sólo 6
notas bien repartidas a lo largo del puente de graves. De este modo, el modelo puede ser
entrenado para generar los patrones de 26 notas, a partir de tan solo 6 notas.
Hasta este punto, el modelo es capaz de calcular, a partir de ciertos valores físicos del
piano, la curva completa de inarmonicidad. Falta verificar si dicha curva es la real y en caso
contrario ajustarla. Para ello se mide la inarmonicidad real de ciertas notas y se compara con la
del modelo. A partir de ahí se realizan ajustes a los parámetros del modelo para minimizar el
error del coeficiente B calculado respecto al medido. Este proceso es el entrenamiento. Si el
modelo no puede ajustarse suficientemente, deberá mejorarse
4.4.- ENTRENAMIENTO del MODELO DE NOTAS GRAVES
El entrenamiento se realiza midiendo el coeficiente de inarmonicidad de las notas de
entrenamiento.
Medir el coeficiente B tiene varios problemas. Primero hay que medir las frecuencias
exactas de varios parciales. Esto es fácil con un algoritmo de análisis espectral, sobre todo si el
algoritmo conoce el valor del fundamental de la nota. Esto no es difícil pues al ser un
entrenamiento, la nota será una preestablecida y conocida por el algoritmo. Además, podrá
obtenerse la resolución que se requiera, ajustando el método y el tiempo de análisis de la nota
de entrenamiento.
Segundo, los valores medidos de frecuencia de cada parcial se deben tanto a la
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 165 Tesis Doctoral
inarmonicidad como al efecto de la placa resonante y están afectados también por la afinación,
lo que dificulta la evaluación de la inarmonicidad.
En cuanto al efecto de la placa resonante, si los parciales son muy altos, no sólo
muestran mejor el efecto de la inarmonicidad sino que suelen estar menos afectados por el
efecto de la placa resonante ya que a mayores frecuencias, los modos de la placa son más
densos y su efecto se suaviza.
El efecto de la afinación en el puente de graves supone una disminución de la
frecuencia respecto a la de la escala temperada en una cantidad que llega a alcanzar 35 cents en
las notas más bajas. Esto implica que el fundamental no coincide con un valor de la escala
temperada, lo que no supone ningún problema si la fórmula de cálculo del coeficiente de
inarmonicidad B no considera dichos valores teóricos sino sólo los valores reales medidos. Por
otra parte, la afinación también afecta a los valores exactos de los parciales, que disminuyen.
Esto es tenido en cuenta en el algoritmo de determinación de los límites de búsqueda de cada
parcial (segmentación del espectro).
En el caso de la medida de los fundamentales, dado que las notas del puente de graves
se extienden hasta valores del fundamental temperado de tan solo 116.5Hz, la variación
absoluta de frecuencia debida a la afinación es inferior a 1Hz (de hecho inferior a 0.6Hz según
hemos calculado a partir de la curva promedio de afinación [Backus 69]). Dado que el
algoritmo trabaja con una resolución de 0.5 ó 1Hz al analizar frecuencias, podemos considerar
despreciable el efecto de afinación para segmentar la zona del fundamental, y se usa el valor
temperado (dato conocido a priori) para controlar la segmentación. De hecho, los
fundamentales medidos coinciden con los valores de la escala temperada redondeados a los
valores de enteros de Hz (para resoluciones de 1Hz) o a múltiplos de 0.5Hz (para resoluciones
de 0.5Hz).
Como consecuencia de lo indicado, nuestra decisión ha sido:
a) Evaluar la inarmonicidad sólo a partir de los parciales 15 a 20.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 166 Tesis Doctoral
b) Calcularla usando la ecuación:
f nf n B nfn B
BB
f
fn
nf
f
n
n
n
= + =+
+⇒ =
−
−
02
1
21
2
2
4
1
211
1 (127)
en cuyo cálculo se usan los valores medidos del fundamental y de cada uno de los
parciales 15 a 20
c) El valor elegido como coeficiente B de cada nota será el valor medio de los 5 ó 6
calculados.
El último punto supone asumir la hipótesis de que los parciales usados tienen
frecuencias que provocan que el efecto de la placa resonante esté distribuido alrededor de este
valor medio. esto equivale a suponer que dichas frecuencias se encuentran unas veces por
encima y otra por debajo de un modo propio de la placa resonante. Dado que los parciales
altos están en zona de alta densidad de modos propios de la placa, es razonable asumir dicha
hipótesis.
4.4.1.- RESULTADOS Y VALIDACIÓN DEL ENTRENAMIENTO
Al realizar el entrenamiento con el piano de prueba, hemos detectado que los valores
de B en las notas altas del puente de graves es mayor que el previsto por el modelo. Tras
proceder a entrenar todas las notas para tener una medida de todos los valores de B, se ha
comprobado que no era un error de algunas medidas sino una discrepancia entre el modelo y
las medidas (figura 103). Antes de proceder a los ajustes del modelo para mejorar la
predicción, hemos querido verificar si el entrenamiento ha sido correcto, pues las discrepancias
son altas.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 167 Tesis Doctoral
Fig.103.-Validación del modelo inicial: el entrenamiento con 6 notasmostró discrepancias en las notas altas y al analizar con unentrenamiento de todas las notas se puede comprobar la necesidad deajustar el modelo con las notas entrenadas.
Fig.104.-Aproximaciones polinómicas a los valores entrenados y curvacompleta medida. Como los valores entrenados han resultado ser los devalor alto (máximos locales), la aproximación queda ligeramente alta.La de orden 5 al tener más ondulaciones se acerca más a la curvamedida.
Para ello, se han aproximado los 5 puntos medidos (sólo 5 ya que la prueba se hace
desde la nota C1) con un polinomio de orden 4 y de orden 5. En la figura 104 pueden verse
dichas aproximaciones y los valores de B de las notas que se usan para entrenar. También se
incluye para comprobación toda la curva de valores de B medidos en un entrenamiento de
todas las notas
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 168 Tesis Doctoral
Fig.105.-El modelo, donde ajusta, puede aproximar con menos error quela aproximación polinómica
Ambas aproximaciones se han usado para generar los patrones espectrales de las 26
notas de graves para los dos casos. Se ha realizado una comprobación del resultado de la
métrica de detección de cada patrón con todas y cada una de las 26 notas del piano de prueba
(“todos contra todos”).
Las figuras son muy densas para mostrar aquí. Los resultados muestran que mientras
que la aproximación de orden 4 presenta ciertas incertidumbres en la detección pues asigna
valores altos de similitud a varios patrones para la misma nota, la aproximación de orden 5 ha
sido infalible en este test, marcando claramente máximos de similitud sólo en los patrones
correspondientes a cada nota.
Como conclusión, el algoritmo de medida de B usado en el entrenamiento es bueno, y
parece suficiente entrenar con 6 notas para obtener unos patrones correctos, incluso con una
aproximación polinómica no muy buena. Por tanto, el modelo de piano no se ha ceñido
perfectamente a todos los valores de B entrenados y debe ajustarse, obteniéndose una
aproximación mejor que la polinómica.
De hecho, en la zona en que el modelo presenta un ajuste evidente en la figura 103, el
error en esas notas es menor que con las aproximaciones polinómicas (figura 105)
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 169 Tesis Doctoral
Aunque la aproximación polinómica parece ser suficiente para resolver el problema de
la curva del coeficiente B, no renunciamos a contar con un modelo que no sólo minimice el
error en la aproximación, sino que además permita obtener ciertos datos físicos sobre el piano
que se está entrenando.
4.5.- MEJORA DEL MODELO DE GRAVES
Aunque el modelo anteriormente descrito es suficiente para generar una secuencia de
valores de r y F aplicable a un piano, las medidas realizadas sobre el piano de prueba muestran
que, en las notas altas del puente de graves, la inarmonicidad se corresponde con cuerdas de
núcleo mayor que el asignado por este algoritmo. Es decir, el modelo no predice con suficiente
precisión la inarmonicidad en las notas más altas del puente de graves y se depende
completamente del entrenamiento para asegurar la fiabilidad del modelo.
Si no se fuera a realizar un entrenamiento, o bien se quisiera controlar que los valores
obtenidos del entrenamiento están dentro de un orden de magnitud adecuado, sería
conveniente sofisticar el modelo incluyendo criterios como los que se indican a continuación:
-Afinación del primer modo de vibración longitudinal de la cuerda
-Mantenimiento de la curva de “masa vibrante” o de impedancias de las cuerdas
-Elaborar un modelo que no requiera curva de tensión aproximada inicial
4.5.1.- AFINACIÓN DEL PRIMER MODO LONGITUDINAL
La vibración longitudinal de las cuerdas graves es parte integrante del sonido que
producen, y los fabricantes de pianos procuran afinarlo para que su frecuencia sea la de alguna
nota concreta de octavas superiores y no suponga un sonido disonante. La frecuencia del
primer modo longitudinal es:
fL
E
FLMc
1
1
2=
ρ (128)
que resulta ligeramente modificada por el efecto de carga del puente (extremo no
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 170 Tesis Doctoral
completamente fijo) y que como puede verse no se modifica al variar la tensión que afina el
modo transversal de la cuerda. Se puede elegir que la frecuencia del modo longitudinal
coincida con algún número entero (k) de semitonos respecto al fundamental transversal, en
cuyo caso:
E r
Tc kπ 2
122= / (129)
Esta ecuación indica que la relación entre las frecuencias de lo dos modos es inversamente
proporcional al estrés sufrido por la cuerda (estrés=tensión/sección), por lo que no puede ser
muy pequeña porque la cuerda se rompería. Según el caso elegido, tenemos un nuevo criterio
para elegir ya sea ‘r’ o ‘F’.
Hemos calculado para nuestro modelo, considerando la curva de longitudes obtenida
del piano de prueba, la frecuencia del primer modo longitudinal para cada posible valor de F, y
la hemos comparado con la frecuencia fundamental teórica (f0). La figura 106 muestra la gama
de posibilidades en cuanto a posibles valores de ‘k’, si bien lo normal es que se elijan valores
correspondientes a un número entero de octavas. Se ha documentado [Conklin 96c] que las
relaciones de frecuencias más interesantes se eligen en saltos de 100cents (saltos de semitono)
y que suelen restringirse al margen entre 4200 y 5200 cents, siendo preferidos los valores de
4800 cents (4 octavas), 4700, 4600 y 4300 cents. Se desaconseja la relación de 4400 cents y se
permite una ligera subida para adecuarse a la frecuencia fundamental real de la nota,
ligeramente incrementada debido al “estiramiento (‘stretching’) de la afinación. En la figura
106, el valor en cents puede obtenerse multiplicando el valor de ‘k’ por 100.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 171 Tesis Doctoral
Fig.106.-Relación entre el primer modo longitudinal y el fundamentalde cada nota para varios valores de F. Se indican las relaciones de 4800y 4300 cents
Si los valores de F para un ‘k’ concreto no pudieran ser enteros, se puede reajustar
ligeramente la longitud de la cuerda para permitir un F entero para la frecuencia del modo
longitudinal buscada.
Este criterio no disminuye los grados de libertad sino que incrementa las posibles
variables a considerar. Además, no podemos afirmar que todos los pianos estén construidos
considerando esta afinación de modos longitudinales. Por eso hemos resuelto no incluirlo en el
algoritmo del modelo.
4.5.2.- MANTENIMIENTO DE LA CURVA DE “MASA VIBRANTE”
La masa de la longitud de la cuerda que vibra es la “masa vibrante” (M).
M L r FLL c c= =ρ ρ π• 2 (130)
Se ha comprobado [Conklin 96c] que dicha masa sigue una ley continua a lo largo de
todas las notas del piano, de modo que el logaritmo de la masa decrece linealmente con el
logaritmo de la frecuencia, sin presentar saltos de valor en el “salto a graves”. En dicho
artículo se ve también que apenas existen diferencias de masas vibrantes entre pianos de cola y
de pared, y que la variación es del orden de 2.15 veces por octava.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 172 Tesis Doctoral
La impedancia que presenta cada cuerda de una nota se relaciona con la masa vibrante:
Z fMcuerda = 2 (131)
Sin embargo, la variación con la frecuencia así como el cambio del número de cuerdas
en ciertas notas concretas, hace que la curva de impedancia de cada nota no siga una ley tan
simple como las masas vibrantes.
Como puede verse, la curva de las masas puede usarse para ajustar la curva de radios
exteriores.
M r FL R Lc c c= =ρ π ρ π2 20 892. (132)
Los resultados que se obtienen para masas vibrantes típicas (200g en nota C1) implican
radios exteriores superiores a los considerados por defecto en el modelo descrito. Esto lleva,
junto con los valores de F admisibles para la afinación del modo longitudinal, a valores del
radio de núcleo más altos y por tanto con mayor inarmonicidad. Esta situación coincide más
con la realidad medida.
Sin embargo, al incluir este criterio en el modelo, se obtiene una curva de R exterior
que nos lleva a una curva de tensiones excesivamente elevadas para concordar con la hipótesis
de curva de tensión usada inicialmente. Por ello, hemos desestimado la inclusión de este
criterio en el modelo.
4.5.3.- MODELO REVISADO: SIN HIPÓTESIS INICIAL DE CURVA DE TENSIÓN
Este que ahora se describe es el modelo que se ha establecido como definitivo
(realmente es el segundo de los tres desarrollados). Las hipótesis básicas para su desarrollo
son:
-las longitudes de las cuerdas graves siguen la curva normalizada usada anteriormente.
-considerar que se intenta mantener la tendencia decreciente (`pendiente’) del
coeficiente de inarmonicidad al bajar las notas, hasta que se pueda. Para notas
inferiores a ese límite, ‘B’ crecerá rápidamente.
Este modelo no parte de una curva de tensión y por lo tanto no define una curva de ‘R’
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 173 Tesis Doctoral
exterior. Directamente establece un algoritmo de selección de valores de ‘r’ interior y ‘F’
basado en una serie de criterios:
-‘F’ tomará valores enteros. El más pequeño será 2 y el mayor 18. La cuerda de la nota
más alta siempre usará F=2.
-‘r’ tomará valores de entre los existentes en la realidad, partiendo de un valor inicial
que se usa para la nota más alta. El valor inicial de ‘d’ interior se encuentra entre 1.016
mm y 1.346 mm (0.040" y 0.053"). El valor concreto permite ajustarse al factor de
inarmonicidad ‘B’ medido en el entrenamiento para esa nota. El valor máximo de ‘d’
será de 1.524 mm (0.060") [Conklin 96c].
-Los valores de ‘r’ y ‘F’ de cada nota, se eligen aproximando lo más posible el factor
de inarmonicidad ‘B’ correspondiente al valor previsto. Todo ello forzando un
incremento controlado en el valor de ‘r’ al bajar la nota y el consiguiente incremento de
‘F’. Esto se hace porque corresponde con la realidad de los pianos, que no presentan
cambios bruscos de una nota a otra.
-El valor previsto de ‘B’ se calcula a partir de los valores medidos en el entrenamiento,
considerando la relación de disminución (‘pendiente’). Sólo se aplica a las notas
superiores del puente de graves.
-Una vez que se alcanza un valor de F preestablecido (no tiene porqué ser el máximo
18), se ha llegado al límite en que B sigue decreciendo. F se mantendrá constante para
las cuerdas inferiores y ‘r’ tenderá a incrementarse, aumentando ‘B’. Este valor lo
denominaremos Fmax.
-Para controlar el aumento de ‘B’, los valores de ‘r’ no se incrementan de cualquier
modo sino que se recalculan para mantener el comportamiento de la curva de R
exterior calculada a partir de las notas superiores. Como ya sabemos, tienden a existir
curvas típicas de R exterior ( o bien curvas típicas de tensión) que pueden aproximarse
con polinomios de orden 2 ó 3. Esto permite aproximar la curva con datos de las notas
superiores y calcular el valor que le correspondería a la nota actual.
-Si los cálculos anteriores requieren un valor de ‘r’ que supere su máximo, entonces se
mantendrá ese máximo y se incrementará F, siempre sin superar el valor de 18.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 174 Tesis Doctoral
Indicar que este algoritmo de modelo de graves requiere sólo 3 datos iniciales: la
longitud de la cuerda de A0, el valor límite de ‘F’ (Fmax) y el valor inicial de ‘r’. Existe un
cuarto parámetro que se considera fijo y que se extrae del entrenamiento de las notas agudas y
es la tendencia de variación de B en la cercanía del ‘salto a graves’ (‘pendiente’).
Las comprobaciones iniciales realizadas muestran que Fmax no puede ser menor de 13,
pues las curvas del coeficiente de inarmonicidad B calculadas muestran comportamientos
anómalos.
4.5.4.- RESULTADOS Y VALIDACIÓN DEL MODELO CON ENTRENAMIENTO
A partir de los datos obtenidos durante el entrenamiento de las 6 notas, se ha aplicado
el algoritmo del modelo, realizando ajustes a los tres parámetros: longitud A0, r inicial y F
límite.
Se han ajustado en el orden indicado, minimizando el error de la curva calculada por el
modelo respecto a los valores medidos durante el entrenamiento. En vez de minimizar un error
promedio, cada parámetro se ajusta para minimizar el error en unas notas concretas.
Las figuras 107 y 108 muestran la aproximación que se obtiene con el ajuste del
modelo a las notas de entrenamiento y el error cometido a lo largo de las 23 notas, comparado
con el error de la aproximación polinómica de orden 5.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 175 Tesis Doctoral
Fig.107.-El modelo ajustado durante el entrenamiento reproduce conbuena aproximación el comportamiento del coeficiente deinarmonicidad en las notas graves.
Fig.108.-El error del modelo tiene un mejor comportamiento que elerror de la aproximación polinómica de orden 5 que permitió laidentificación de todas las notas
Puede verse que aunque los valores máximos absolutos de los errores son del mismo
orden de magnitud (aunque en notas distintas), el modelo ajustado produce un error con una
media más cercana a cero (0.28e-5 frente a -0.68e-5) y dado que la desviación de valores es
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 176 Tesis Doctoral
similar (0.14e-4 frente a 0.15e-4) el error está más repartido. Además, la suma cuadrática de
ambos errores es mucho menor en el caso de usar el modelo (0.43e-8 frente a 0.6e-8).
En conclusión, el modelo demuestra que al ser bien ajustado permite obtener una mejor
aproximación a la curva del coeficiente de inarmonicidad B
Posteriormente se han generado los patrones a partir de dicha curva calculada por el
modelo y se ha comprobado la métrica en un “todos contra todos”, obteniéndose una
identificación inequívoca de todas las notas del puente de graves.
En conclusión, el modelo es capaz de ajustarse a los 6 valores entrenados y calcular
una curva del coeficiente de inarmonicidad B para el resto de las cuerdas, que usada para
generar patrones espectrales permite la identificación de todas las notas. Es por tanto un
modelo definitivo bajo las hipótesis establecidas.
4.6.- OPTIMIZACIÓN DEL ENTRENAMIENTO DEL MODELO DE
GRAVES
Todo el modelo definido hasta ahora mantiene una hipótesis inicial que no se ha
modificado y que es que la curva de longitudes sigue una ley concreta. Basta conocer la
longitud de la cuerda más larga (nota A0) para obtener la curva de longitudes que es base del
algoritmo del modelo. Dicha longitud puede ser calculada iterativamente por el propio modelo
al ajustarse al valor de inarmonicidad de la nota A0 durante el entrenamiento.
Si al modelo, que ya ha sido validado con el piano de muestra, se le modifican los
parámetros, puede comprobarse que todos ellos tienden a modificar sólo una parte de la curva
del coeficiente de inarmonicidad con la nota. Muchos de ellos modifican zonas coincidentes,
pero puede comprobarse (figura 109) que ninguno modifica el valor de inarmonicidad de la
nota A0 (salvo la propia longitud de la cuerda A0) ni la forma de la curva en las primeras notas
siguientes a A0.
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 177 Tesis Doctoral
Fig.109.-Valores de B calculados por el modelo para varios valores delos parámetros, manteniendo fija la longitud de A0. Las primeras notasno se ven afectadas por el resto de parámetros. Las restantes sufrenefecto combinado, si bien se aprecia cierto predominio de algunosparámetros en algunas notas. En total hay representadas 18 curvas(combinación de 3 valores de Fmax, 3 valores de pendiente y 2 valoresde diámetro inicial). Muchas de ellas coinciden en ciertas zonas,indicando la independencia respecto ciertos parámetros
Puede verse que en las notas superiores (de la 20 en adelante) tiene predominio el
efecto de los parámetros radio inicial y pendiente, siendo independientes de Fmax. Las notas
intermedias son las que más notan el efecto del valor de Fmax, sin ser independientes del
efecto de los otros parámetros.
Así, pueden establecerse dos interesantes hipótesis de trabajo adicionales con el
modelo:
1.- La inarmonicidad medida para la nota A0 permite calcular el valor de la longitud de
dicha cuerda.
2.-La invariabilidad de la forma de la curva para las primeras notas está asociada a la
forma de la curva de longitudes considerada estándar por el modelo.
Mediante la aplicación del modelo para distintos valores de la longitud de A0 se puede
obtener una tabla de asignación longitud-coeficiente de inarmonicidad que permita durante
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 178 Tesis Doctoral
Fig.110.-Valor de B calculado por el modelo para 121 valores delongitud de A0 entre 80 cm y 200 cm. Dichos valores se obtienen conindependencia de los valores del resto de los parámetros introducidos almodelo. La curva puede aproximarse por polinomio de orden 7.
cualquier entrenamiento calcular la longitud al medir el coeficiente de inarmonicidad. En la
figura 110 puede verse que dicha relación puede establecerse mediante un polinomio de orden
7 en vez de usar una tabla.
Por otro lado, la existencia de una curva estándar para las longitudes de las cuerdas de
graves es una suposición que ha resultado útil para desarrollar un modelo interesante, pero que
resulta poco realista. Con independencia de la longitud del piano de cola, su ancho es
invariable ya que todos tienen 88 notas y las teclas tienen una ancho similar en todos. De ese
modo, cuanto más largo es el piano, mayor gradiente tendrá la curva de longitudes de las
cuerdas del puente de graves. Este gradiente puede quedar ligeramente compensado por el
hecho de que al ser más largo el piano, el “salto a graves” se hace en notas más bajas pues se
pueden instalar cuerdas más largas en el puente de agudos. Los pianos de cola más largos
presentan el salto a graves alrededor de la nota 20, como ha podido comprobarse por
observación de varios pianos.
El hecho es que el uso del modelo para ajustar la curva de inarmonicidad de todo el
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 179 Tesis Doctoral
puente de graves a partir de los datos de 6 notas durante el entrenamiento presenta errores si el
piano es más largo o más corto que el usado de muestra. Esto ha podido comprobarse al
entrenar otro piano distinto.
La optimización del proceso de entrenamiento del modelo, que permite ganar
generalidad, supone:
a)Calcular la longitud de la cuerda A0 a partir de la medida de su coeficiente de
inarmonicidad, en base a la curva anteriormente descrita.
b)Incluir en el modelo la variabilidad de la curva de longitudes, que se ajustará
considerando la zona de las primeras notas del coeficiente de inarmonicidad (2 de las
notas de entrenamiento), de forma que la curva modelada obtenga el mínimo error para
las notas medidas.
c)Establecer, como consecuencia de lo anterior, la curva de longitudes que usará el
modelo.
d) Se podrá buscar un ajuste más fino del modelo, realizando varias pruebas con
distintos valores del radio inicial (el de la cuerda de la nota más alta) y con distintos
valores del valor límite de F. Estos parámetros afectan principalmente a la zona de
notas intermedias (F límite) y de notas altas (r inicial) del puente de graves. Se elegirá
la combinación que suponga menor error en el coeficiente de inarmonicidad para las
notas entrenadas.
4.6.1.- MODELO CON VARIACIÓN DE LA CURVA DE LONGITUD
La curva de longitud va a seguir una ecuación análoga a la usada para el modelo inicial:
Lg
LAa
sa*s nota
con aLA *s rel
sbb bb nota mayor rel
L
LA
bbbb
= +
− −
=−
− −= =
0
0 11 1 0
( ); ;
(133)
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 180 Tesis Doctoral
Fig.111.-Efecto de considerar curvas de longitud de cuerdas gravesdistintas pero con igual relación entre la longitud de las notas extremas.
La figura 111 muestra el efecto, en el cálculo realizado por el modelo, al modificar las
curvas de longitud de manera que cambie el parámetro “s” pero no la relación entre longitudes.
Se calcula para dos valores de longitud de A0 (1.4m y 2m). El resto de parámetros del modelo
se dejan fijos. Puede verse que existe cierta alteración en la zona de la curva de las primeras
notas. Existen también evidentes efectos en el resto de notas, por lo que este ajuste deberá
realizarse con anterioridad a otros al aplicar este modelo a la aproximación de la curva de B.
También puede observarse que la pendiente de la curva B no sólo depende del
parámetro “s” de la curva de longitudes sino que es menor para menor inarmonicidad de la
nota A0.
El efecto de variar la relación de longitudes del puente de graves incluso manteniendo
un valor fijo de “s” puede verse en la figura 112. Para relaciones menores de las usadas en la
figura (mayor diferencia entre las longitudes del extremo del puente), la zona ascendente
empieza en notas aún más inferiores, pero aunque parece dar más libertad para ajustar curvas,
no tiene sentido pues lleva a pianos con gran inarmonicidad en graves. Por otro lado, aunque
puede verse que los pianos de mayor cuerda A0 (menor inarmonicidad en nota A0) pueden
usar una relación menor que otros, sin embargo, es previsible que la relación se haga mayor
para mejorar la inarmonicidad global de los graves. Esta situación lleva a pensar que lo que se
suela mantenerse constante al incrementar la dimensión del piano es la diferencia y no la
CAPÍTULO 4: MODELO
Identificación Automática de Acordes Musicales 181 Tesis Doctoral
Fig.112.-Efecto de modificar la curva de longitudes variando la relaciónpara una misma “s”. A menor relación mayor inarmonicidad.
relación entre las longitudes del extremo del puente.
Esta última afirmación, unida a la posible variación de valores de “s”, concuerda con el
hecho de que el número de cuerdas del puente varía de un piano a otro al aumentar sus
dimensiones.
Identificación Automática de Acordes Musicales 182 Tesis Doctoral
Identificación Automática de Acordes Musicales 183 Tesis Doctoral
CAPÍTULO 5: RECONOCIMIENTO
En este capítulo se presentan los aspectos relativos al método usado para la identificación
de las notas y acordes. Se define la métrica usada para comparación y se establecen los aspectos
concretos para la generación de los patrones de identificación.
Se utilizan los resultados de identificación de notas sueltas como fase de validación del
método de generación de patrones y se explican los métodos de optimización de la identificación,
entre los que se encuentran algunos de procesado previo de la señal a identificar.
Finalmente se presenta el método de reconocimiento de acordes en el que se incluyen
técnicas de validación de las identificaciones.
Para facilitar el seguimiento, se incluye en el anexo una tabla con indicación del índice de
la nota (numeración identificativa de la nota del piano de 1 a 88), nombre de la nota tanto en
notación inglesa como en denominación española, y el valor de frecuencia teórica (fundamental
según escala temperada).
5.1.- MÉTODO DE RECONOCIMIENTO
Se usa un reconocimiento de patrones por similitud (“pattern-matching”). La máxima
similitud se evalúa mediante una métrica.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 184 Tesis Doctoral
La métrica usada para determinar si una nota es más cercana a un patrón u a otro es el
producto interno del espectro de la señal con todo los patrones. El producto interno más alto es
el que describe al patrón candidato más parecido y determina que sea la nota correspondiente a
dicho patrón la que se considere identificada.
metrica m espectro n patron nmn
( ) ( ) * ( )= ∑ (135)
Cada patrón “m” se compara con el espectro para obtener una métrica. La comparación
supone sumar los productos punto a punto del espectro y del patrón. La suma total es la métrica.
Las componentes espectrales de la señal que coincidan con las componentes de los
patrones sumarán (“puntuarán”) en el cálculo del producto interno.
El inconveniente de dicha métrica es que existen varios patrones que puntúan ante la
misma estructura espectral de la señal y que incluso puede haber falsas detecciones. Es típico que
una cierta componente espectral pueda puntuar como segundo parcial de un patrón, como
fundamental de un patrón de doble frecuencia o como tercer parcial de un patrón de frecuencia
mitad. Así, ante ciertas componentes espectrales, aparecen varios patrones candidatos separados
octavas enteras. Esta ambigüedad de octava se minimiza como se explicará en adelante.
En la figura 114 se aprecia un caso de falsa detección en el que el patrón de la nota 21
(puntúa más que el patrón de la nota 9 que es la verdaderamente existente. Para ello, la figura
muestra no sólo el espectro de la señal y los dos patrones comparados, sino también la “métrica
acumulada”.
La métrica acumulada en un punto del espectro es el valor de la suma de productos punto
a punto del espectro y el patrón hasta ese punto. La métrica acumulada permite ver la evolución
del cálculo de la métrica y ver cómo afectan los distintos parciales a la métrica final
metrica acumulada m N espectro n patron nmn
N
_ ( , ) ( ) * ( )==
∑0
(136)
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 185 Tesis Doctoral
Fig.114.-Se muestra el espectro de la nota 9 y los patrones 9 y 21,separados una octava. También se muestra como van puntuando lasmétricas. Puede verse que la métrica del patrón 21 supera a la del 9,provocando un error de identificación.
La ventaja de esta métrica radica en que permite una definición más simple de los patrones.
Si se hubiera elegido una métrica consistente en el error cuadrático medio entre el espectro a
analizar y los patrones, estos últimos deberían generarse teniendo en cuenta la estructura de
amplitudes del espectro. Como ya se explicó en el apartado de fundamentos acústicos, la
distribución de niveles espectrales depende de la excitación, la cual varía mucho con la forma de
tocar el piano y la forma de interpretar una pieza musical. Si se intentase dotar a los patrones de
una estructura de niveles, esta se correspondería con la de las notas tocadas durante el
entrenamiento. Pero no se correspondería bien con los niveles espectrales de las notas tocadas en
un pasaje o como parte de un acorde. Los errores serían mayores.
El algoritmo de entrenamiento diseñado, incluye la extracción de la estructura de niveles,
y se ha llegado a generar unos patrones teniendo en consideración dicha estructura. Podría
pensarse que incluso la métrica de producto interno se beneficiaría de usar patrones con estructura
de niveles en base a la señal entrenada, pero el resultado de la identificación, incluso ante notas
sueltas, no ha sido mejor que con patrones que no consideraban la estructura de niveles.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 186 Tesis Doctoral
5.2.- APLICACIÓN DEL MODELO: GENERACIÓN DE PATRONES
5.2.1.- INARMONICIDAD, AFINACIÓN Y MEDIDA DE PARCIALES
La inarmonicidad que existe en una nota viene incluida en la fórmula que expresa la
frecuencia de vibración real de cada uno de los parciales de una cuerda con rigidez:
f nota nf n Bn nota nota( ) _= +021 (137)
en la que se indica la frecuencia real de vibración respecto a f0, que es la de vibración si la cuerda
fuese perfectamente flexible. Esta fórmula se denomina en muchas ocasiones como ‘ecuación de
inarmonicidad’
Para muchos cálculos es buena aproximación considerar que la frecuencia ‘flexible’ f0
coincide con el valor correspondiente a la escala temperada.
Sin embargo, la realidad de los instrumentos es que su fundamental (primer parcial real)
debe tener una frecuencia igual a la de la escala temperada, por lo que los cálculos y medidas
reales más precisas deben considerar no que f0(nota)=fT(nota) sino que f1(nota)=fT(nota). Esto
lleva a reescribir la ecuación de inarmonicidad como:
f nota nfn B
Bn notanota
nota
( ) _=+
+1
21
1 (138)
en la que f1 tomaría los valores de la escala temperada.
Lo anterior equivale a decir que la frecuencia ‘flexible’ f0 es algo menor, en todas las notas,
que los valores de la escala temperada, y consecuentemente debería introducirse en el modelo de
los puentes de graves y agudos. El resultado sería calcular partiendo de tensiones ligeramente más
bajas. La variación es tan pequeña que una vez más puede asumirse que se realizará en los ajustes
de afinación y que no merece ser incluida en los cálculos del diseño de las cuerdas, en los que
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 187 Tesis Doctoral
como ya se vió, se considera que f0(nota)=fT(nota).
El valor más alto de B, que es B(88) impondría la máxima disminución de frecuencia
‘flexible’. Concretamente, si consideramos el caso máximo de B(88)=0.02, que aparece en la
figura 65 en el capítulo 4, tendremos f0(88)=0.99015fT. Esto supone disminuir la tensión en 0.9804
veces, que supone un 2% de disminución, aplicable a todas las notas al ser un diseño de T
constante. Estas pequeñas disminuciones de frecuencia y tensión son asumibles para el diseño de
cuerdas e incluso para considerar en la generación de patrones que f0(nota)=f1(nota)=fT(nota).
Sin embargo, en la generación de patrones se usará f1(nota)=fT(nota).
Una segunda consideración a tener en cuenta en la afinación del piano, es el hecho de que
la escala temperada típica supone que la nota A4 tiene su fundamental a 440Hz. Sin embargo, cada
vez es más común que las orquestas afinen sus instrumentos respecto a una escala temperada con
A4 a 442Hz. Esto supone que en cada caso debe usarse una escala temperada u otra.
La tercera consideración sobre afinación, especialmente importante en el caso del piano,
tiene que ver con la existencia de inarmonicidad. Ya se ha explicado que para disminuir los batidos
entre el fundamental de una nota y el segundo parcial de la nota una octava inferior, las notas van
afinándose con fundamentales cada vez mayores respecto al valor de la escala temperada. Ya no
se trata de adecuar la escala temperada a una referencia distinta, sino al hecho de no trabajar con
escala temperada.
El ajuste se realiza tomando la octava 4 como referencia (pues se empieza por afinar el
fundamental de A4 al valor establecido de 440 ó 442 Hz) y se incrementa el fundamental, respecto
a los valores temperados, en las octavas mayores y se reduce el fundamental, respecto a los valores
temperados, en las menores.
En definitiva, el fundamental real f1 tiene una frecuencia que se obtiene a partir de:
a) Frecuencia de A4
b) Frecuencia temperada calculada a partir de a)
c) Modificación por la afinación para disminuir batidos (‘curva de afinación’).
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 188 Tesis Doctoral
Como las curvas de afinación se miden como desviación del fundamental real respecto al
valor temperado, puede decirse que para la cancelación de batidos, matemáticamente debe
cumplirse que:
f fB
Bnota oct nota oct
nota oct
nota oct1 1 2
1 4
1_ _ _sup _ _ _inf
_ _inf
_ _inf
= ⋅ ⋅+
+ (139)
por lo que queda claro que la curva de afinación teórica es el término de raíz cuadrada. Esta curva
depende de los valores del coeficiente B que tengan las cuerdas. Por eso, las curvas de afinación
reales pueden ser muy distintas, al igual que lo son las curvas de B. Además, no todos los
afinadores considerarán que la eliminación total del batido es el criterio perfecto de afinación,
puesto que dicha operación se realiza a oído por parte de los mejores afinadores. Por último, esta
fórmula no considera el efecto de la placa resonante sobre el segundo parcial de la nota de octava
inferior.
Un estudio más detallado de la cancelación de batidos, aunque con una ecuación más
simple para el efecto de la inarmonicidad en al afinación se tiene en [Lattard 93].
5.2.1.1.- Otras aproximaciones
Algunos autores [Benade 76][Lattard 93] proponen un cálculo más sencillo basado en la
aproximación de la ecuación de inarmonicidad por los dos primeros términos del desarrollo en
serie de la raíz cuadrada, quedando:
( )f nota nf nB
nf n Jn notanota
nota( ) _ _= +
= +0
20
212
1 (140)
Esta aproximación ha sido evitada en la aplicación de los modelos, pues provoca errores
apreciables en parciales altos de notas altas. Como ejemplo, una nota 64 (C6) con un B=2A10-3
tendría su quinto parcial 1.0003 veces más alto con esta aproximación que con la fórmula original.
La diferencia en frecuencias sería casi 2Hz. Es evidente que para notas superiores a C6, la
diferencia empieza a ser apreciable en una generación de patrones con precisión de 0.5Hz y
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 189 Tesis Doctoral
anchura de pulsos de unos cuantos Hz.
5.2.2.- EFECTO DE LA PLACA RESONANTE
Ya se ha indicado que la placa resonante y el puente establecen una impedancia en la
terminación de la cuerda que no es infinita, por lo que la frecuencia real de vibración no es la que
se obtiene con las fórmulas para cuerdas fija-fija.
Una vez más, puede incluirse un término en la ecuación de la frecuencia, que incluya esta
variación. Este término es complicado y en este trabajo se han aportado soluciones para
implementar este término.
Igual que con la afinación, el efecto de la placa sobre el fundamental no es apreciable pues
en la afinación se ha asegurado que el fundamental real tenga el valor concreto indicado en el
apartado de la afinación, y esto incluyendo el efecto de la placa. Sin embargo, los restantes
parciales sí sufren una variación respecto a los valores previstos anteriormente.
El planteamiento usado para tener en consideración el efecto de la placa resonante ha sido
el de acotar su efecto y considerar las posibles variaciones en el valor de la frecuencia de los
parciales de cada nota. Esa variación supone una banda de incertidumbre que va a ser cubierta
mediante el ensanchamiento del pulso del patrón espectral.
Las notas usadas para entrenar presentan el efecto de la placa. Los valores de los parciales
medidos son tales que al calcular el coeficiente de inarmonicidad para cada parcial, con respecto
al fundamental, no se obtiene un valor fijo, cosa que ocurriría si no existiese efecto de la placa.
Esto hace que la medida del coeficiente de inarmonicidad durante el entrenamiento no sea
totalmente real.
Los cálculos realizados sobre el efecto de la placa resonante así como los resultados de las
medidas invitan a realizar la hipótesis de que los valores de las frecuencias de los parciales se
distribuyen alrededor del valor que tendrían si no existiese el efecto de la placa. Por tanto, se ha
considerado en este trabajo que el valor del coeficiente de inarmonicidad es el valor medio de los
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 190 Tesis Doctoral
obtenidos para cada parcial al aplicar la fórmula de la inarmonicidad.
Asimismo, al generar los patrones, se considera que el valor del parcial obtenido por
aplicación del coeficiente de inarmonicidad es el valor central de todos los posibles.
5.2.3.- ANCHURA DE PULSOS DE LOS PATRONES
El ancho del pulso es inicialmente seleccionado en base a un criterio de similitud con el
ancho real. El ancho real está determinado por el amortiguamiento de la cuerda, y el ancho que
se puede medir depende también del efecto de la ventana usada al calcular el espectro. Una serie
de análisis iniciales sobre la anchura de los pulsos de los espectros del piano de muestra nos ha
permitido establecer una curva empírica de anchos de pulsos para cada nota. Ese es el valor inicial
del ancho de cada pulso, pero en la mayoría de los casos, el pulso del patrón es más ancho que
este valor inicial.
El primer aspecto que impone un ensanchamiento del pulso es le hecho de incluir el
unísono completo como un único elemento a identificar. Para ello, el pulso debe ser tan ancho
como el unísono. En notas graves, el unísono es indistinguible con la resolución de frecuencia
usada por el método (0.5Hz), pero en notas agudas sí lo es. El algoritmo de entrenamiento de
agudos evalúa el ancho del unísono completo y dicho dato se usa, aplicado también a las notas del
entorno de la entrenada, para calcular el nuevo ancho. En este punto, ya se verifica claramente que
el ancho de los unísonos es mayor no solo a mayor nota sino también a mayor parcial, debido a
la inarmonicidad.
El efecto de la placa resonante ya ha sido comentado. Simplemente indicar que aunque las
curvas del efecto decrecen con la frecuencia y con el parcial, dichas curvas son de relación de
frecuencias, por lo que en notas altas, aunque la variación porcentual es menor, el ensanchamiento
no es tan pequeño. Sin embargo, dado que a notas altas la separación entre ellas es mucho mayor,
el ensanchamiento necesario puede ser mayor sin afectar mucho a los resultados, en cuanto a
poder causar errores de identificación por solapamiento de patrones.
El resto de ensanchamientos se debe a la corrección de errores de medida y aproximación
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 191 Tesis Doctoral
Fig.115.-Curva de afinación promedio de Railsback y variacionesencontradas en un estudio sobre afinación de pianos [Martin 61]
durante el entrenamiento, concretamente, errores en la aproximación de la afinación y errores en
la medida de B por falta de resolución de frecuencia.
En cuanto al error de aproximación de la curva de afinación, se ha calculado dichos errores
respecto a las notas que se entrenan. Como no se puede asegurar cual será el error en el resto de
las notas, se incluye un porcentaje de error adicional basado en la dispersión de valores de
afinación de notas presentados entre la curva “Railsback” y ciertos valores de afinación existente
en pianos reales que resultan no presentar diferencia audible con la curva Railsback [Martin 61]
5.2.4.- MULTIPATRONES
Las notas de las octavas altas tienen un contenido espectral limitado casi exclusivamente
al fundamental y segundo parcial. Los patrones usados en octavas 6, 7 y 8 tienen únicamente dos
parciales pues añadir un tercer parcial al patrón no supone mejora en los resultados de la métrica
a la hora de diferenciar una nota de otra.
El error inevitable de aproximación en la curva de afinación calculada durante el
entrenamiento hace que para algunas notas el fundamental del patrón esté descentrado respecto
al fundamental real de la nota. Aunque el patrón incluye un ensanchamiento para asumir dichos
errores, como se ha explicado, estos han sido calculados en base a las notas que se entrenan y no
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 192 Tesis Doctoral
Fig.116.-Error en nota de octava 6 provocado por falta de centrado delpatrón propio (C6) y por mejor centrado de un parcial alto de patrón denota más baja(C2). Los parciales altos de patrones bajos deberíanponderarse y debería asegurarse que los patrones de notas altas seajustan mejor mediante multipatrones por nota.
se puede asegurar que alguna nota no tenga un error mayor.
La figura 116 muestra un error encontrado en las primeras implementaciones del algoritmo
de reconocimiento. La nota 64 (C6, Do6) era identificada como la nota 16 (C2,Do2) varias
octavas más baja. El hecho de que uno de los parciales muy altos de un patrón de la segunda
octava coincidiera con el fundamental de la nota C6 mejor que el fundamental del patrón de la
propia nota C6, hace que la métrica puntúa más, incluso considerando la aportación del segunda
parcial de la nota que sólo puntúa para el patrón 64. Además, los residuos o colas espectrales
también aportan puntuación en la métrica del patrón de la nota 16.
Estos detalles plantean sin dudas tres líneas de mejoras en el método de reconocimiento:
a) Patrones con barrido o multipatrones para las notas de octavas altas: Asegurar que
alguno esté bien centrado en el fundamental de la nota.
b) Ponderar la importancia de los parciales dentro de un patrón: Dotar al patrón de
estructura de niveles destinada a minimizar errores de octava
c) Predetección de octava o banda para evitar que patrones tan distintos puedan analizar
una nota.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 193 Tesis Doctoral
Los multipatrones consisten simplemente en generar más de un patrón para cada una de
las notas de octavas altas. Alguno de esos N patrones por nota estará debidamente centrado y
obtendrá la máxima métrica. De todas las posibilidades, hemos seleccionado una que ha resultado
dar suficiente robustez al método.
Los patrones de las octavas 6, 7 y 8 se han hecho triples: el calculado originalmente, y dos
versiones de este, una hacia frecuencias mayores y otra hacia frecuencias menores, una cantidad
que asegure un solapamiento del 50%, dado que no se espera que el “descentramiento” original
sea muy elevado. Se ha considerado que se solapa un 50% cuando la posición de la nueva
frecuencia del parcial del patrón se diferencia de la original en la mitad (50%) del ancho total del
pulso.
Los patrones adicionales no son meros desplazamientos del original, pues el segundo
parcial debe recalcularse pues se desplazan una cantidad distinta a la del fundamental debido al
coeficiente de inarmonicidad. El ancho de los pulsos de los patrones adicionales es el mismo que
en el patrón original.
Debe indicarse que con todas las estrategias incorporadas, la octava 6 no requiere de
multipatrones. Sólo las octavas 7 y 8 los requieren al ser en las que se tienen mayores errores de
“centrado” por la aproximación de la curva de afinación. Puede verse en la figura 117 el error
entre la nota E7 y su patrón generado originalmente.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 194 Tesis Doctoral
Fig.117.-Error en el patrón de la nota E7. Puede verse que un patrónadicional inferior solapado un 50%, se ceñiría adecuadamente alespectro de la nota.
Fig.118.-Multipatrón para la detección de la nota E7. El originalpresenta un gran error, pero el adicional inferior se ajusta al espectro.
La figura 118 muestra dos patrones del multipatrón triple de E7, y ahora se ve que uno de
ellos cuadra con la nota..
Otro aspecto que afecta al uso de los multipatrones es que no pueden llegar a crear
ambigüedad por solapamiento con multipatrones de notas adyacentes. En la figura 119 puede
verse que los patrones adicionales para los fundamentales de 11 notas de la octava 7 son
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 195 Tesis Doctoral
Fig.119.-Patrones adicionales generados para multipatróncorrespondientes a 11 notas de la octava 7. Se muestran losfundamentales y sólo los 2 patrones extremos de cada nota. Puede verseque no hay ambigüedad entre patrones adyacentes.
perfectamente distinguibles entre sí, sin existir solapamiento entre multipatrones de notas
adyacentes..
5.2.5.- ESTRUCTURA DE NIVELES EN LOS PATRONES: CANTIDAD Y
PONDERACIÓN DE PARCIALES
Ya se ha indicado que el hecho de que todos los parciales de los patrones tengan nivel
unidad, es decir, no tengan ponderación, facilita la existencia de errores en la detección. Estos
errores son especialmente probables entre patrones separados un número entero de octavas.
Se han realizado varias pruebas para determinar qué número de parciales deben incluir los
patrones y para determinar la ponderación. En cuanto al número de parciales, deben ser suficientes
para distinguir bien unas notas de otras, y para que se aprecie la utilidad del modelo con
inarmonicidad.
Esto último es importante pues la existencia de inarmonicidad facilita la eliminación de la
ambigüedad entre octavas dado que dos notas separadas una octava presentarán un coeficiente
de inarmonicidad distinto y los parciales, que típicamente coinciden en notas sin inarmonicidad,
no serán tan coincidentes. La única excepción a esta regla ocurre en octavas bajas en las que se
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 196 Tesis Doctoral
vió que el coeficiente de inarmonicidad presenta un mínimo, permitiendo que dos notas de las
octavas más bajas puedan tener el mismo coeficiente de inarmonicidad. No queda más remedio
que considerar que es poco probable que eso ocurra con dos notas separadas justo una octava.
Por otro lado no tiene sentido usar más parciales de los necesarios en base a la realidad
espectral de cada octava. Así las octavas graves generan sonidos con gran cantidad de parciales
significativos, mientras que las más agudas sólo presentan 2 ó 3 parciales con nivel significativo.
En cuanto a la ponderación, de ella depende en gran manera la disminución de la
ambigüedad entre octavas que hemos conseguido. Es un compromiso ponderar los parciales
superiores. Si se está calculando la métrica de una nota de octavas superiores, conviene que
tengan ponderación, así, si se está detectando un C4, conviene que el segundo parcial del patrón
de C3 tenga ponderación para no puntuar mucho. Sin embargo, eso haría que cuando se esté
intentado detectar la nota C3, su patrón no puntúe mucho en el segundo parcial.
Tras varias pruebas en las que hemos comprobados errores y márgenes en los valores de
las métricas obtenidas, hemos llegado a un compromiso, que sin poder asegurar que sea el óptimo,
sí es suficiente para dar un resultado con un número reducido de errores. La existencia de errores
residuales, será combatida con técnicas adicionales.
Como resultado de las pruebas, se ha decidido que el modelo genere patrones según la
tabla:
Octava Número de parciales Ponderación
0
1
23 NO
2 20 10 primeros parciales a 1
5 siguientes a 0.5
5 restantes a 0.3
3 12 3 primeros a 1
9 restantes a 0.5
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 197 Tesis Doctoral
Fig.120.-Patrón identificado (métrica máxima) y segundo candidatopara notas sueltas usando los patrones generados con ponderación.También se muestra la diferencia de valores de las métricas (margen).Sólo unas pocas notas no se identifican como primera o segunda opción.
4 10 NO
5 7 1 primer parcial a 1
6 restantes a 0.5
6 2 1 primer parcial a 1
1 restante a 0.5
7
8
2 1 primer parcial a 1
1 restante a 0.5
Las octavas 0 y 1 se consideran juntas puesto que la octava 0 sólo tiene 3 notas (desde A0)
y comparten muchos aspectos espectrales. De igual modo, la octava 8 sólo tiene la nota C8 y se
la consideramos una extensión de la octava 7.
Este modelo de patrones, sin ninguna técnica adicional, generados tras el entrenamiento
del piano, consiguen el siguiente resultado de identificación de notas sueltas:
Existen 27 fallos de identificación. Sin embargo, el número de notas que son calculadas
correctamente ya sea como primera o como segunda candidata son 80. Es decir, de aquellas 61
notas que han sido falladas, la mayoría (53) han sido consideradas como segunda candidata por
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 198 Tesis Doctoral
el algoritmo. A falta de aplicar otras técnicas de ayuda en el reconocimiento, podemos decir que
la métrica usada y los patrones generados son suficientemente buenos. Sólo 8 notas se escapan
claramente a la detección (notas 34, 45, 62, 64, 80, 82, 86, 87). Por eso se ha considerado
suficiente la definición de los patrones. El resto de mejoras hasta la detección sin errores se realiza
mediante técnicas de ayuda.
De los 27 fallos de identificación, la nota identificada resulta ser un número entero de
octavas inferior en 14 casos. Por lo que la ambigüedad de octavas no es la única causa de error
en la identificación. Esto es especialmente cierto en las 8 notas que no se aciertan ni como primera
ni como segunda candidatas, de las cuales 4 son de la octava 7 (que requerirá multipatrón) y sólo
2 de las 8 han sido confundida con una nota un número entero de octavas inferior (las notas 34
y 80).
Puede verse en la figura 120 que un aspecto que llama la atención es que ninguna de las
falsas detecciones se corresponden con notas superiores a las analizadas, siempre son notas
inferiores. Esta es una consecuencia directa del diseño del número de parciales y ponderación
usada.
Otro aspecto es que los errores sólo aparecen para notas a partir de la octava 3. Las notas
graves se detectan bien y con amplio margen, salvo el margen de la nota 9.
5.3.- IDENTIFICACIÓN DE NOTAS SUELTAS
Haciendo uso de los patrones generados en base a las consideraciones anteriores, se valida
el modelo realizando identificación de todas las notas del piano una a una.
Como resultado de esta fase, se establecen aspectos adicionales que optimizan la
identificación de notas sin modificar la generación de patrones ni el modelo.
5.3.1.- TÉCNICAS DE PREPROCESADO: LIMPIEZA DEL ESPECTRO A ANALIZAR.
UMBRALIZACIÓN DE NIVELES BAJOS
La primera técnica de ayuda que se introduce, que corresponde a preprocesado de la señal
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 199 Tesis Doctoral
Fig.121.-Patrón identificado (métrica máxima) y segundo candidatopara notas sueltas usando los patrones generados con ponderación ylimpieza previa del espectro a analizar. También se muestra ladiferencia de valores de las métricas (margen). Hay más deteccionescorrectas. Sólo unas pocas notas no se identifican como primera osegunda opción.
a analizar, es la de eliminar niveles espectrales existentes entre componentes significativas de la
señal. Cualquier parcial de cualquier patrón que estuviera entre dos componentes significativas de
la señal, puntuaría una cierta cantidad debido al nivel espectral no nulo que se obtiene en esas
zonas al calcular la FFT.
Para ello se realiza una umbralización parcial, de modo que los niveles inferiores a un
cierto umbral se anulan totalmente y los superiores se dejan como están. El umbral que se
implementa en el algoritmo es seleccionable. El valor que se está usando como umbral es 1/50
veces el valor máximo del espectro.
Se consigue el siguiente resultado de identificación de notas sueltas:
Existen aún 19 fallos de identificación, son menos que antes, como resulta evidente de la
gráfica. Además, el número de notas que son calculadas correctamente ya sea como primera o
como segunda candidata ha subido hasta 82. Sólo 6 notas se escapan claramente a la detección
(notas 34, 45, 62, 80, 86 y 87). Las dos notas mejoradas de este grupo, han pasado a ser segundas
candidatas. Sólo la 34 y la 80 siguen siendo confundidas con una nota de un número entero de
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 200 Tesis Doctoral
Fig.122.-Notas identificadas con y sin limpieza. Se indican las mejorasen los márgenes. Salvo una nota que ahora se falla, hay varias que ahorase aciertan. La mayoría de las nuevas que se aciertan van acompañadasde un aumento en el margen, lo que indica que la limpieza tiene granefecto en el método. Algunos de los márgenes que disminuyen secorresponden a notas que ahora se aciertan, por lo que se puedeconsiderar una mejora de la limpieza. Se incluye un gráfico indicadorde las notas acertadas para facilitar al análisis de la curva de mejora.
octavas inferior.
De los 19 fallos de identificación, la nota identificada resulta ser un número entero de
octavas inferior en 12 casos. Por eso, cambiar las ponderaciones de los patrones no serviría de
mucho.
En cuanto a los márgenes conseguidos en ambos casos, existen claras mejoras al usar
limpieza. La figura 122 muestra ambas identificaciones así como la mejora del margen.
Puede verse que algunos márgenes han bajado, pero a cambio se ha obtenido una
identificación correcta. Los márgenes calculados no consideran si la detección es correcta o no
y sólo indican una diferencia de métrica entre el primer y segundo candidato.
5.3.2.- RESULTADOS APLICANDO MULTIPATRONES
Si se incluye el uso de multipatrones para la octava 7 (y nota C8) en la identificación, los
resultados son los que aparecen en la figura 123. Puede verse que la octava 7 ya no tiene errores
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 201 Tesis Doctoral
de identificación.
Ya sólo existen 15 fallos, de los cuales son de octava 11. De esos once, 10 dan como
detectada la nota sólo 1 octava inferior, y 1 da la nota 2 octavas inferior. Es interesante hacer
notar que todas las notas erróneamente asignadas a esas 11, corresponden a la octava 2. Es
evidente que el gran número de parciales en los patrones de la octava 2 es causante de
puntuaciones altas en octavas superiores, aún estando ponderados sus parciales. Como se verá
esto se resuelve con otro proceso previo de las señal a analizar, que denominamos “predetección
de octava”. Los errores que no son de octava reparten sus candidatos entre las octavas 1 y 2.
De todos los 15 fallos, los fallos que tampoco son considerados correctamente como
segunda opción, son ahora sólo 3 notas: 34, 45 y 62. Es curioso notar que es una de cada una de
las octavas medias (3, 4 y 5). De ellas sólo la 34 es detectada como una nota de una octava
inferior (nota 22 de la segunda octava). Las otras son confundidas con notas de la primera octava
(notas 14 y 10 respectivamente).
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 202 Tesis Doctoral
Fig.123.-Identificación de señal limpiada con patrones múltiples en octava 7. Puede verse que los patronesmúltiples resuelven todos los errores que existían en la octava 7. Se muestra qué patrones múltiples han dadomáxima métrica y por tanto son directos responsables de una identificación y cuales han puntuado como segundacandidatura.
La coincidencia de identificación y segundo candidato en ciertas notas de la octava 7
simplemente indican que ambas métricas se obtienen con alguno de los tres multipatrones que
corresponden a la misma nota. Se muestra además en la figura qué notas puntúan gracias a los
patrones adicionales del multipatrón, y si dicho multipatrón puntúa como primer o segundo
candidato. En los casos en que puntúa como segundo candidato, dado que no hay error, está claro
que la identificación se debe al patrón original.
Por otro lado, la asignación de primer y segundo candidato a dos patrones del mismo
multipatrón, justifica la reducción en el valor del margen existente en dichas notas, pues ambas
métricas suelen ser muy parecidas, salvo en algunos casos.
La mejora frente al caso de no usar multipatrones se muestra en la figura 124
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 203 Tesis Doctoral
Fig.124.-Notas identificadas con y sin multipatrón. Donde coinciden lascurvas azul y roja, sólo se ve la roja. Sólo se usa multipatrón en octava7 y 8 (notas 76 a 88). Se indican las mejoras en los márgenes. Elmultipatrón no afecta a otras octavas, pero permite identificar sinerrores en las octavas 7 y 8. Los márgenes son más bajos pero a favorde la nota adecuada. Se incluye un gráfico indicador de las notasacertadas para facilitar al análisis de la curva de mejora. La rectahorizontal se corresponde con la nota 27 (Si2). Todos los errores marcancomo primera candidata a notas de las octavas 1 y 2.
Como puede observarse, las únicas fuentes de error que restan son las asociadas al hecho
de que las octavas 0, 1 y 2 usan patrones con gran número de parciales. Disminuirlos o
ponderarlos más llevaría a errores en la detección entre las notas de dichas octavas. Parece
evidente que la aplicación de la mejora indicada como “predetección de octava” resulta necesaria
y deberá ser suficiente.
Aparentemente, las notas 34, 45 y 62 no se beneficiarán de la predetección pues ni siquiera
su segundo candidato es el adecuado. Sin embargo, en los tres casos dicho segundo candidato
también resulta pertenecer a las octavas 1 y 2. Resulta evidente que si el sistema de predetección
lleva asociado el hecho de eliminar los patrones graves de la métrica durante la identificación de
notas de octavas 3 y superiores, no sólo se resolverán los errores de las notas con segundo
candidato correcto, sino también estas tres notas tendrán más oportunidades de tener primer
candidato correcto, como de hecho ocurre.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 204 Tesis Doctoral
5.3.3.- PREDETECCIÓN DE OCTAVA
Se ha visto que los patrones de las octavas 0, 1 y 2 provocan errores en el método al
obtener métricas más elevadas que el patrón de la propia nota a identificar. Si se desarrolla un
método de análisis previo de la señal que determine el orden de la octava a la que pertenece la
nota, se puede deshacer el error.
Para ello es posible modificar el proceso de identificación de dos maneras:
a)Descartando una nota una vez identificada, si no corresponde a la octava predetectada
b)limitando el proceso de identificación a un conjunto de patrones correspondientes a la
octava predetectada
Cada manera tiene sus ventajas y sus inconvenientes. La segunda ha sido elegida pues
además de romper la incertidumbre en los casos en que el error estaba en la primera candidata
pero no en la segunda, también permite resolver, más directamente, el problema de las tres notas
que no eran acertadas ni siquiera en segunda candidatura. En el caso de elegir la primera, esas tres
notas requerirían de dos descartes. La ventaja de la primera respecto a la segunda es la de no
limitar (no la de asegurar) la identificación de ciertas notas de acordes con notas en octavas
contiguas.
5.3.3.1.- Predetección mediante transformada ondicular
Se han realizado algoritmos para realizar detección de octavas y notas usando
transformada ondicular en base a una ondícula madre específica, diseñada a partir de una nota de
piano [Ortiz 00].
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 205 Tesis Doctoral
Fig.125.-Ondícula madre específica basada en un tramo de nota C4 deun piano de cola.
La aplicación de la transformada ondicular, según la fórmula de transformada contínua:
CWT (a,b) x(t) (t) dt (t),x(t)x a,b*
a,b*= ⋅ ⋅ =
−∞
∞
∫ ψ ψ (141)
es equivalente a la realización de un filtrado por bandas no excluyentes, cuyas respuestas en
frecuencia aparecen en la figura 126. El resultado de la transformada ondicular de la nota
(procesada en el dominio temporal) da lugar a la obtención del orden de la octava concreta de una
nota, siempre que la nota pertenezca a octavas superiores a la 3. Para ello se calcula una métrica
que equivale a la norma de los datos a la salida de cada uno de los filtros. Según las diferencias
de valor y los “cambios” bruscos de la métrica se obtiene la identificación de la octava [Ortiz 01].
Como se expone en el siguiente apartado, la no determinación de las octavas inferiores así
como el hecho de que no resulta necesario concretar mucho la octava de la nota, hizo que se
desarrollase otro método de predetección, por lo que el de la transformada ondicular no se ha
depurado ni se ha probado con acordes. Esto último es importante pues no se ha podido
comprobar si un grupo de notas cercanas (acorde) de la misma octava, provocan en las salidas de
los filtros un comportamiento similar al de una sola nota.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 206 Tesis Doctoral
Fig.126.-Respuesta de los filtros equivalentes a la transformadaondicular con la ondícula madre específica (escala 0), sus expansionesy contracciones. Se analizan un total de 7 escalas. Cada escala dejapasar bien octavas anteriores, pero atenúa rápidamente notas superiores.
5.3.3.2.- Predetección mediante zonas y bandas
Si bien la detección de octava por transformada ondicular permite determinar la octava
concreta para octavas superiores a la octava 3 , una predetección tan precisa puede no ser
necesaria. Además, está pendiente el hecho de detectar si la nota es de octavas altas o bajas.
Se ha desarrollado otro método basado en lo que se ha denominado zonas y bandas. Se
define que una nota es de zona alta si la frecuencia de su parcial de mayor nivel es superior a
700Hz.
Hasta la octava 3 incluida es normal que el parcial de mayor nivel no sea el fundamental.
En las notas bajas de la octava 4 puede ocurrir en situaciones poco frecuentes, pero encontradas
en nuestra medidas, que el segundo parcial tenga el máximo nivel, con algo más de nivel que el
fundamental. En las octavas 5 y superiores el fundamental es el que tienen mayor nivel.
Cualquier nota que tenga su máximo nivel en un parcial por encima de 524Hz (fundamental
temperado del C5) puede ser una nota de octava 5 o superior o bien una nota de octava 4 con el
segunda parcial con mayor nivel que el fundamental.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 207 Tesis Doctoral
Hemos considerado que cualquier máximo mayor de 700Hz se corresponderá con notas
de las octavas 5 a 8. Si bien algunas notas bajas de la octava 5 tendrán su máximo algo por debajo
de 700Hz, es poco probable que una nota de la octava 4 tenga su segundo parcial como máximo
si éste supera el valor de 700Hz (notas superiores a F4). F4 es la nota 45 y se encuentra en la zona
media del piano, donde los estudios sobre la excitación y el espectro obtenido [Askenfelt 93] [Hall
88] indican que el primer parcial siempre es el de mayor nivel para diversas situaciones de
excitación.
Ahora bien, un máximo menor de 700Hz puede corresponderse con cualquier nota entre
A0 y F5. De esta forma, el criterio de zona separa notas dejando un margen de solapamiento para
las notas de la octava 5. En resumen, el criterio de zona permite una primera predetección de
forma que:
-Si máximo nivel en parcial >700 Hz, la nota está entre C5 y C8 (Zona alta)
-Si máximo nivel en parcial <700 Hz, la nota está entre A0 y C6 (Zona baja)
Este criterio no es suficiente pues se requiere detectar si una nota está por encima o por
debajo de C3, es decir, si es de octavas 0,1,2 o superiores. Para ello se incluye el concepto
adicional de “Banda”. En cada banda se realiza un análisis adicional, calculando la métrica:
CPniN
xN
= ∑12
2 (142)
donde “x” es el valor de cada componente del espectro de la nota dentro de la banda “i”. CPn
responde a “Coeficiente de Predetección normalizado”. Para cada nota se calculan los CPn de las
tres bandas.
Se definen las bandas:
Banda 1 64 a 128 Hz Incluye Fundamentales de C2 a B2 (octava 2)
Banda 2 128 a 510 Hz Incluye fundamentales de C3 a B4 (octavas 3 y 4)
Banda 3 510 a 5000Hz Incluye fundamentales de C5 en adelante
La limitación a 5000Hz responde a no incluir datos espectrales no significativos, que no
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 208 Tesis Doctoral
Fig.127.-Coeficientes de predetección de cada banda calculados paratodas las notas del piano. Se puede apreciar el efecto de corte de lasbandas 1 y 2 para notas mayores de C3 y C5 respectivamente.
mejoran los resultados de cara a la predetección. Las pruebas realizadas considerando otros límites
superiores así lo han confirmado.
Tal y como están definidas, se cumple los siguiente:
a)Cualquier nota de las octavas 1 y 2 tiene métrica en las 3 bandas
b)Las notas de octavas 3 y 4 no presentan métrica en la banda 1
c)Las notas de octavas 5,6,7 y 8 no presentan métrica ni en la banda 1 ni en la banda 2.
La figura 127 se muestran los coeficientes de predetección de cada banda obtenidos para
todas las notas de uno de los pianos usados.
Realmente, la obtención de estos resultados exige dos consideraciones en el algoritmo de
cálculo:
a) El espectro de la nota se umbraliza eliminando valores inferiores a 1/6 del máximo,
considerándose por tanto sólo los componentes espectrales claramente significativos en
el cálculo de la predetección.
b) Si la zona detectada era la alta, antes de calcular los coeficientes se procede filtrar paso
alto, eliminando todos los datos espectrales inferiores a 300Hz. Esto se hace pues las notas
agudas presentan en su espectro un contenido de bajas frecuencias con alto nivel,
justificable como ruido, y que no debe ser tenido en cuenta para la predetección pues llega
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 209 Tesis Doctoral
a provocar fallos en ella.
Se desprende de lo anterior, que los cálculos de zona y de bandas están unidos. Y veremos
que su aplicación también.
Puede observarse que los coeficientes de las bandas 1 y 2 presentan un valor muy bajo a
partir de las notas C3 y C5 respectivamente. Esta zona que denominaremos de corte presenta un
valor muy bajo, existiendo un amplio margen entre los valores de los coeficientes antes y después
del corte. este margen facilita establecer un umbral y considerar que será válido para muchos
pianos distintos. El umbral elegido ha sido -40dB.
Cada nota presenta un comportamiento respecto a los tres coeficientes que permite
establecer un criterio de predetección de octavas de la siguiente manera:
Una vez calculados, para una nota a predetectar, sus tres coeficientes,
podremos decir que el fundamental de esa nota está dentro de una de las tres
bandas según el criterio:
if CPn1<umbral & CPn2<umbral
banda=3; (LA NOTA PERTENECE A OCTAVAS 5, 6, 7 ú 8)
elseif CPn1<umbral & CPn2>umbral
banda=2; (LA NOTA PERTENECE A OCTAVAS 3 ó 4)
elseif CPn1>umbral & CPn2>umbral
banda=1; (LA NOTA PERTENECE A OCTAVAS 0, 1 ó 2)
end
Como se ve, el coeficiente de la tercera banda no es utilizado pues no establece diferencias
claras.
5.3.3.3.- Aplicación de la predetección
El dato de la predetección se utiliza en el algoritmo de reconocimiento para limitar el conjunto
de patrones con los que se realiza la comparación de la señal. Además permite en algunos casos
activar un filtrado paso alto para disminuir el efecto de los ruidos de baja frecuencia en la
identificación de notas agudas.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 210 Tesis Doctoral
Fig.128.-Identificación con limpieza, multipatrón y predetección porzonas y bandas. La identificación no presenta ningún error. La curvaroja sobreescribe la azul en las notas en que coinciden, que son las queidentifican gracias al multipatrón
Así, el algoritmo usado para reconocimiento utiliza de este modo la predetección:
Si zona es alta (C5 a C8)
y banda =3 (C5 en adelante)
Patrones desde 52 a 88 (C5
a C8)
Multipatrones también se
incluyen
No puede darse que zona sea
alta y banda distinta de 3. Si
ocurre se debe a ruido de
baja frecuencia y se filtra
paso alto a 400Hz.
Si zona es baja (A0 a C6)
y banda =3 (C5 en adelante)
Patrones 52 a 63 La nota sólo puede ser de
octava 5
Si zona es baja (A0 a C6)
y banda=2 (C3 a B4)
Patrones 28 a 51 Nota de octavas 3 ó 4
Si zona es baja (A0 a C6)
y banda=1 (A0 a B2)
Patrones 1 a 27 Nota de octavas 0, 1 ó 2.
Los resultados obtenidos en la identificación de notas al usar la predetección aparecen en la
figura 128
Puede verse que la identificación es correcta, sin fallos. Por lo que la identificación de notas
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 211 Tesis Doctoral
Fig.129.-Comparación de identificación con predetección de zonas ybandas respecto a usar sólo limpieza y multipatrón en octava 7. No haypérdidas de márgenes ni en las notas que ahora se identifican. Todasmejoran o se quedan igual en cuanto a margen. Todas se identificancorrectamente.
está resuelta con éxito y puede acometerse la identificación de acordes.
Ahora los segundos candidatos ya no son sólo de notas inferiores pues al limitar el conjunto
de patrones, se tienen que encontrar entre ellos. Así, la octava 3 sólo puede tener candidatos
parecidos en la octava superior, pues la banda 2 incluye sólo octavas 3 y 4. En cuanto a las notas
de la octava 5 (zona baja, banda 3) sólo se comparan con notas de esa octava y las diferencias son
muy apreciables, de ahí que los segundos candidatos sean cercanos (notas de la misma octava 5)
y los márgenes muy altos (las métricas difieren bastante entre notas de la misma octava). La octava
6 también se beneficia de usar conjuntos de patrones, mientras que las octavas 0,1,2,7 y 8
presentan un comportamiento similar a no usar predetección, dependiendo su éxito del diseño de
los patrones en las octavas 0,1 y 2, y del multipatrón en las octavas 7 y 8.
La comparación entre usar predetección o no usarla, respecto al uso de limpieza y multipatrón,
aparece en la figura 129
Pueden realizarse dos comentarios al respecto de esta estrategia. El primero es que bastaría
con identificar si se trata de nota en octavas graves o en las otras pues todos los errores existentes
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 212 Tesis Doctoral
antes de usar la predetección se debían a patrones de las octavas graves (0,1 y 2). El segundo es
que cuantas más subconjuntos de patrones se usen, más difícil será la identificación de acordes con
notas repartidas en octavas contiguas.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 213 Tesis Doctoral
Fig.130.-Esquema del proceso de identificación de acordes. En unaprimera fase, el entrenamiento, se obtienen los patrones y las máscarasespectrales. En la segunda fase, identificación, se detectaniterativamente las notas que forman un acorde.
5.4.- RECONOCIMIENTO DE ACORDES: ITERACIÓN Y SUSTRACCIÓN
ESPECTRAL
5.4.1.- MÉTODO
El reconocimiento de acordes se realiza identificando cada una de sus notas de forma iterativa.
Una vez identificada una nota, se procede a la sustracción espectral de sus componentes, tras lo
cual se procede a detectar otra nota. La siguiente detección empieza por recalcular la métrica del
espectro resultante respecto al conjunto de patrones. La figura 130 muestra el diagrama del
proceso. La sustracción espectral se realiza en base a unas máscaras diseñadas para cada nota, a
partir de los datos de la fase de entrenamiento, de forma análoga a los patrones.
5.4.2.- MÁSCARAS
Las máscaras se obtienen a partir de unas “máscaras base” que son básicamente una réplica
de los patrones. Sin embargo, todos los parciales de las máscaras base deben tener amplitud
unidad, para que siempre exista cancelación total de esa componente espectral. Como ya se ha
indicado los parciales de los patrones tienen distintos niveles para ponderar la detección.
El espectro coincidente con el patrón de la nota detectada será eliminado de la señal antes de
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 214 Tesis Doctoral
Fig.131.-Se muestra el patrón 52 (nota C5) y la máscara progresivacorrespondiente. En el detalle se ve sólo el segundo parcial del patrón52 con ambas máscaras, la progresiva y la abrupta. La máscara semultiplica por el espectro para realizar la sustracción.
proceder a la siguiente detección. Para ello, y dado que el nivel de la máscara base indicada varía
entre 0 y 1, la sustracción espectral se realiza multiplicando punto a punto el espectro por la
función (1-mascara_base). Esta nueva función es la que denominaremos “máscara”. Así, la
sustracción se hace multiplicando el espectro por la máscara.
Una opción que implementa el método es que la eliminación sea progresiva, siguiendo la
máscara la misma forma que el patrón (curva tipo Hamming). Sin embargo, la máscara abrupta
es la que, en general, mejores resultados da al limpiar mejor el espectro tras la sustracción. La
máscara abrupta consiste en activar totalmente la máscara desde el primer valor no nulo de la
curva del patrón. La figura 131 muestra ambos tipos de máscaras para un cierto patrón.
Interesa ver qué diferencias hay en los resultados entre identificar con máscaras abruptas o
progresivas. Inicialmente lo veremos con independencia de si la detección realizada es correcta
o no. La siguiente tabla muestra las diferencias para 4 acordes distintos, cada uno ejecutado en las
7 octavas (1 a 7). Como cada nota se representa por un número entre 1 y 88, los valores de la
tabla indican directamente la diferencia entre las números identificativos de las notas identificadas.
Así, un error de 12 supone que con unas máscaras se ha detectado una nota una octava mayor o
menor que con las otras máscaras, pero sin entrar a valorar si alguna de esas detecciones es
correcta.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 215 Tesis Doctoral
Acorde C,E,G,A# Acorde C,D#,F#,A Acorde C,D#,G,A# Acorde C,E,G,B
oct1
oct2
oct3
oct4
oct5
oct6
oct7
0 0 0 -12
0 0 0 0
0 0 3 -3
0 0 0 -23
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 -6 6
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 3 -3
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 4
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 -28
En esta tabla, un 0 no significa que la detección sea correcta, sino que se obtiene la misma
usando máscaras abruptas o progresivas. Puede verse que, en los resultados prácticos, las
diferencias aparecen en las últimas notas, en las que el residuo puede llegar a ser apreciable. En
la práctica no hay efectos prácticos ni en todos los acordes ni en todas las octavas.
5.4.3.- LÍMITES EN LA IDENTIFICACIÓN DE NOTAS DENTRO DE UN ACORDE
La identificación de las notas no debería suponer ningún problema toda vez que tenemos un
algoritmo que las detecta sin error. Sin embargo sí surgen algunos problemas debido a dos
razones:
a) La sustracción espectral no siempre es perfecta.
b) Al existir varias notas simultáneamente, el cálculo de la métrica de los patrones se ve
afectado no sólo las componentes propias de una nota sino también las componentes
coincidentes de otras notas. Denominaremos esta situación como “espectro-multinota”.
Debe tenerse en cuenta que la segunda situación puede darse tanto para la identificación de
la primera nota en un acorde completo como para la identificación de la nota “n” en un espectro
con sustracciones previas.
5.4.3.1.- Sustracción Espectral
En cuanto al primer problema, a modo de ejemplo, en las figuras 132 y 133 se muestran la
identificación del acorde C,D#,G,A# (Do menor con séptima menor) de la octava 3 con aplicación
de máscaras progresivas y abruptas respectivamente, para la sustracción espectral.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 216 Tesis Doctoral
Fig.132.-Sustracción espectral mediante máscaras progresivas, durante la identificación del acorde C,D#,GA#. Seindican con flechas algunos de los residuos resultantes de una sustracción mejorable. En rojo se muestran lasmáscaras básicas, para facilitar la visualización de lo que se va a sustraer en cada paso. Las gráficas de detecciónestán normalizadas al valor de la componente espectral resultante más alto, para apreciar la importancia relativaentre ellas. Las gráficas del acorde y del residuo están en la misma escala original. Se indica el nivel del residuorespecto al nivel original del espectro del acorde en dB.
Estas figuras muestran cada uno de las 4 iteraciones necesarias para identificar un acorde de
cuatro notas. Para cada iteración se muestra el espectro de la señal que se somete a identificación,
la nota identificada en esa iteración (escrita en la cabecera de cada cuadro) y la máscara básica de
dicha nota. Esa máscara básica, que tiene mucho que ver con el patrón de la nota identificada,
indica la parte espectral que va a ser sustraída. Dicha sustracción da lugar al espectro que será
identificado en la siguiente iteración. Por último, tras la última iteración, persiste un espectro
residual de las diversas sustracciones. A mejor método de sustracción menos residuo existirá. Para
evaluar la calidad de la sustracción se indica en la figura el nivel del espectro residual respecto al
espectro original del acorde, expresado en dB.
Se ve que las máscaras progresivas (figura 132) son proclives a dejar residuos espectrales al
no coincidir perfectamente la máscara con el espectro.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 217 Tesis Doctoral
Fig.133.-Sustracción espectral mediante máscaras abruptas, durante la identificación del acorde C,D#,GA#. Eneste caso se consigue sustraer adecuadamente los espectros de las notas. El nivel de la señal residuo es 33dB inferioral nivel de la señal original. En rojo se muestran las máscaras básicas para facilitar la visualización de lo que seva a sustraer en cada paso. Las gráficas de detección están normalizadas al valor de la componente espectralresultante más alto, para apreciar la importancia relativa entre ellas. Las gráficas del acorde y del residuo están enla misma escala original.
Este primer aspecto se mejora optimizando el diseño de las máscaras usadas para sustracción
y usando principalmente máscaras abruptas. Puede verse la gran diferencia de nivel entre los dos
residuos (24dB). Sin embargo, como se verá en los resultados, no en todos los casos es mejor usar
máscaras abruptas frente a progresivas.
5.4.3.2.- Espectro multi-nota
Al existir varias notas simultáneamente, el cálculo de la métrica de los patrones se ve afectado
no sólo las componentes propias de una nota sino también las componentes coincidentes de otras
notas. Un ejemplo típico es lo que ocurre en un acorde Do,Mi,Sol (C,E,G) de la octava 4 (figura
134), en el que el fundamental del G4 (“Sol4”) coincide con el tercer parcial del C3(“Do3"),
puntuando también para ese patrón, lo que potencia la posibilidad de que la métrica del patrón C3
resulte puntuar más que la métrica del patrón C4 y por tanto identificar un C3(Do3) en vez del C4
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 218 Tesis Doctoral
Fig.134.-Posible error típico en la detección de la nota C4 al existirotras notas, concretamente G4, formando un acorde. Se indica laposición de los fundamentales de las cuatro notas del acorde. Puedeverse cómo el fundamental de G4 puntúa para el patrón de C3 de formadefinitiva para provocar el error. Ya se ha visto que si sólo estuvieseC4, la métrica del patrón C3 no superaría al del patrón C4, existiendodetección correcta de la nota. Si el fundamental de G4 hubiera sidosustraído antes de proceder a detectar C4, el error no tendría lugar.
(Do4) existente. La figura 134 muestra el acorde, los 2 patrones en conflicto: C3 y C4; y las
métricas acumuladas. Se puede ver perfectamente que el fundamental de G4 supone un incremento
considerable en la métrica de C3, que no existiría si las notas estuvieran solas o si el acorde no
incluyera a G4.
Este tipo de problemas se solucionan en parte con la predetección de octava (si se sabe que
el acorde es de octava 4, el patrón C3 no será tenido en cuenta aunque su métrica sea alta) y en
parte con la aplicación de técnicas adicionales de “evaluación de la detección”:
5.4.4.- EVALUACIÓN DE LA DETECCIÓN
Dado que puede comprobarse que la mera iteración con sustracción espectral no va
a estar carente de errores ( en el capítulo de resultados se muestran tablas con las identificaciones
fallidas), y teniendo en cuenta que si los patrones son suficientemente buenos para detectar notas,
deberían serlo para definir las máscaras de sustracción, resulta evidente que deben buscarse otras
razones para los fallos.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 219 Tesis Doctoral
La principal razón adicional ya se ha indicado y es el hecho de que el espectro que se analiza
tienen muchas más componentes que para una sola nota, y estas componentes pueden puntuar, de
forma errónea, en los cálculos de la métrica de ciertos patrones.
Por tanto, resulta imprescindible incluir técnicas que permitan confirmar si los resultados
detectados son válidos. Hemos desarrollado varias técnicas para la fase de “evaluación de la
detección” que aparece en la figura 1, que intentan validar la nota identificada.
5.5.- RECONOCIMIENTO DE ACORDES: VALIDACIÓN DE NOTAS
IDENTIFICADAS EN UN ACORDE
Se han probado 4 métodos de validación de la nota identificada. Estos métodos se basan en
que en los fallos obtenidos en las pruebas, se repiten tres hechos:
a) Los errores aparecen por exceso de espectro (multi-notas).
b) la nota identificada erróneamente es siempre inferior a la que realmente existe.
c) las componentes espectrales “en exceso” que provocan el error en la detección de una nota
del acorde siempre pertenecen a una nota de fundamental superior al de la nota errada.
Los métodos que vamos a presentar son:
1.-Validación de la última nota detectada
2.-Validación por ordenación de candidatos a ser detectados
3.-Validación por ordenación espectral de notas detectadas
4.-Validación mediante verificación del fundamental
5.5.1.- MÉTODO 1: VALIDACIÓN DE LA ÚLTIMA NOTA DETECTADA
Para eliminar el error por exceso de espectro, este método realiza el proceso completo de
detección de todas las notas del acorde y considera validada la última nota detectada. Esta última
nota es la que se ha detectado cuando el espectro restante de las sustracciones anteriores sólo
contiene una nota y por tanto está carente de multi-notas que induzcan a error.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 220 Tesis Doctoral
Una vez validada esta nota, se sustrae del espectro inicial y se vuelve a identificar todo el
acorde con una nota menos. De nuevo, la última nota se valida, se sustrae de este nuevo espectro
inicial y se vuelve a detectar. El acorde se reconoce en varios pasos, en cado uno de los cuales se
identifica y valida una nota.
Este método presupone que la última nota a ser detectada dentro del acorde no tendrá error
pues ya no existirá exceso de espectro al haber sido sustraído con las máscaras de las notas
detectadas previamente.
La limitación de este método radica en que al identificar un acorde completo pueden existir
errores antes de la última nota, por lo que las sustracciones realizadas no dejan sólo el espectro
de la ultima nota a identificar. Así, la última nota del acorde debe detectarse a partir de un
espectro que también tiene componentes adicionales que pueden provocar un error. Si esta última
nota, que va a ser automáticamente validada, se detecta erróneamente, la validación resultante no
es buena.
Este proceso no está reflejado en el esquema general de la figura 130 porque no consigue
disminuir mucho los errores.
5.5.2.- MÉTODO 2: VALIDACIÓN POR ORDENACIÓN DE CANDIDATOS
Si la nota errónea siempre es inferior a la verdadera, la superior debe ser considerada más
probable. Para ello, este método, que identifica el acorde en un sólo paso, consiste en evaluar para
cada nota a detectar dentro de un mismo acorde, los dos patrones con métricas más altas (los dos
candidatos) y elegir el de mayor frecuencia.
Esto funciona perfecto cuando los dos candidatos son el de la octava real y el de la octava
inferior. Por tanto, los acordes de la octava 2, al usarse subconjuntos de patrones gracias a la
predetección, tienen el éxito asegurado con este método.
La limitación que presenta este método es que en los casos en que uno de los dos candidatos
es de la octava superior, directamente queda validado, siendo una validación errónea. Esto
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 221 Tesis Doctoral
provoca, además, la aparición de un comportamiento distinto de los errores, ya que la nota
erróneamente identificada no es inferior a la nota real, como solía ocurrir.
Que el segundo candidato sea de la octava superior es una situación que ocurre, como se ve
en la figura 128, debido al uso de subconjuntos de patrones a raíz de la predetección. Este error
puede esperarse en notas de las octavas 1, 3 y 5 como se ve en dicha figura.
Sin embargo, dicha figura corresponde al análisis de notas sueltas. Cuando se tiene un acorde,
la situación cambia, pues, por ejemplo para acorde de la octava 1, los patrones inferiores puntúan
incluso más que los patrones de la octava 2, quedando de segundos candidatos. Así, son los
patrones de la octava 1, los mayores respecto a los de la octava inferior, los que quedan validados,
desapareciendo el error.
El resultado, para cuatro acordes de las octavas 1 y 2, se presenta en la tabla siguiente
Acordes Máscara abrupta Máscara progresiva
C,E,G,A#
C,D#,F#,A
C,D#,G,A#
C,E,G,B
oct1
oct2
oct1
oct2
oct1
oct2
oct1
oct2
'C1' 'A#1' 'E2' 'G1'
'G2' 'E2' 'A#2' 'C2'
'D#1' 'A1' 'F#1' 'C1'
'F#2' 'D#2' 'C2' 'A2'
'D#1' 'G1' 'A#1' 'C1'
'C2' 'D#2' 'A#2' 'G2'
'E1' 'G1' 'B1' 'C1'
'C2' 'E2' 'G2' 'B1'
'C1' 'E1' 'A#1' 'A#0'
'G2' 'E2' 'A#2' 'C1'
'D#1' 'F#1' 'A1' 'C1'
'F#2' 'D#2' 'C2' 'A2'
'D#1' 'C1' 'A#1' 'G1'
'C2' 'D#2' 'G2' 'A#2'
'E1' 'G1' 'B1' 'C1'
'C2' 'E2' 'G2' 'B1'
Acordes con fallo 2 3
Puede verse que los errores sólo aparecen en las últimas detecciones de cada acorde. En
ese sentido, es razonable el resultado de que la máscara progresiva de lugar a más errores, ya que
deja más residuos que pueden confundir. Además esto se une al hecho de que a la última nota
detectada no se le aplica el criterio de ordenación de candidatos y se toma siempre el primer
candidato. Esto se hace pues para la última nota, al no existir más que ella (supuestamente), el
primer candidato es correcto. Puede verse que la máscara progresiva hace que esto no sea así y
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 222 Tesis Doctoral
se incrementen los errores en la última nota.
5.5.3.- MÉTODO 3: VALIDACIÓN POR ORDENACIÓN ESPECTRAL DE NOTA
DETECTADA
Este método identifica los acordes en varios pasos. En cada paso, de las notas detectadas
dentro del acorde, se valida la de mayor frecuencia fundamental.
Se sustrae del espectro original la máscara correspondiente a la nota validada y se repite el la
detección del acorde con una nota menos.
Aunque parecido al primer método, sus resultados son muy distintos. Dado que sustraemos
primero las notas más altas, esto restará posibilidad de error a las notas más bajas, según el hecho
descrito c).
La limitación aparece cuando en una da las detecciones de acorde, que se realizan sin
validación ‘interna’, uno de los errores resulta ser la nota más alta, y por tanto queda validada.
La tabla siguiente muestra los resultados de este método para los cuatro acordes en las octavas
graves, y puede verse que dicho error puede ocurrir y que su aparición depende del tipo de
máscara usado.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 223 Tesis Doctoral
Acordes Masc. Abrupta-abrupta Masc. Abrupta-progresiva Masc.Progresiva-
progresiva
C,E,G,A#
C,D#,F#,A
C,D#,G,A#
C,E,G,B
oct1
oct2
oct1
oct2
oct1
oct2
oct1
oct2
'A#2' 'E1' 'C1' 'A#0'
'A#2' 'G2' 'E2' 'C2'
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'B1' 'G1' 'E1' 'C1'
'G2' 'E2' 'C2' 'B1'
'A#1' 'G1' 'E1' 'C1'
'A#2' 'G2' 'E2' 'C2'
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'B1' 'G1' 'E1' 'C1'
'G2' 'E2' 'C2' 'B1'
'A#1' 'E1' 'C1'
'A#0'
'A#2' 'G2' 'E2' 'C1'
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'G1' 'A#1' 'D#1'
'C1'
'A#2' 'G2' 'D#2'
'C2'
'B1' 'G1' 'E1' 'C1'
'G2' 'E2' 'C2' 'B1'
Acordes con fallo 2 1 3
Además, al tratarse de un método con varios pasos de detección de acordes, resulta que la
sustracción de las notas validadas, antes de empezar el siguiente paso, también puede realizarse
con máscara abrupta o progresiva.
El método da resultados muy buenos. Resulta interesante el hecho de que puede verse que en
algunos casos se ha validado antes (en un paso anterior) una nota de frecuencia inferior que otra
de frecuencia superior que también ha resultado validada (Los resultados se han transcrito a las
tablas en el orden en que son validados por el algoritmo), lo que iría en contra del método. Esto
parece indicar que en dicho paso, la nota superior no se detectó, lo que sin esta validación hubiera
supuesto un error irrecuperable.
El principal inconveniente de este método es que no resulta evidente cual es la combinación
de máscaras adecuada para identificar acordes de cualquier piano.
5.5.3.1.- Resumen de los 3 primeros métodos
Los resultados de estos métodos que se han presentado no pretenden ser más que
indicativos y por eso sólo se han tabulado ciertas octavas. Los cálculos se han realizado con todas
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 224 Tesis Doctoral
las octavas y aparecen ciertos errores también en otras, además de en la octava 1.
Para mejorar la evaluación de la detección y por tanto el proceso de validación de notas
detectadas que forman parte de un acorde, se ha desarrollado otro método de validación que se
presenta en el apartado siguiente. Sus resultados, infalibles para octavas 3 y siguientes, hacen que
sólo tenga sentido aplicar los métodos anteriormente descritos a las octavas 0,1 y 2, con los
resultados que ya se han indicado.
5.5.4.- MÉTODO 4: VALIDACIÓN MEDIANTE VERIFICACIÓN DEL
FUNDAMENTAL
El método resulta definitivo para las octavas 3 y superiores, eliminando todos los errores en
la detección, por lo que se aplicará a estas como único método de validación. En las octavas
graves presenta las limitaciones que se comentarán.
Se basa en que si no se realiza ningún otro método de validación, una vez que un patrón es
identificado como primer candidato, el posible error, ya se ha indicado, es que resulte ser un
patrón de una octava inferior a la nota real.
La validación consiste en extraer la parte del espectro del acorde que coincide con el patrón
candidato (mediante la multiplicación punto apunto del espectro y el patrón), y se analiza la zona
correspondiente al fundamental del patrón (se conoce pues se sabe cual es el patrón candidato).
Si el patrón candidato es una octava inferior a la nota real, en la zona de su fundamental no existirá
ninguna componente de la señal analizada. Si el patrón corresponde con la nota existente, en la
zona de su fundamental existirá componente espectral. Así, puede validarse una nota detectada.
Los resultados son (sólo se muestran los obtenidos con máscaras abruptas que son las que dan
mejores resultados en general):
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 225 Tesis Doctoral
Acordes Acordes
C,E,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A#1' 'E2' 'G2' 'B2'
'G2' 'E2' 'A#2' 'C2'
'C3' 'A#3' 'E3' 'G3'
'A#4' 'C4' 'G4' 'E4'
'C5' 'E5' 'G5' 'A#5'
'E6' 'A#6' 'C6' 'G6'
'E7' 'A#7' 'C7' 'E7'
C,D#,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A#1' 'D#2' 'G2' 'C2'
'C2' 'D#2' 'G2' 'A#2'
'C3' 'D#3' 'A#3' 'G3'
'C4' 'A#4' 'G4' 'D#4'
'C5' 'D#5' 'G5' 'A#5'
'D#6' 'G6' 'C6' 'A#6'
'D#7' 'G7' 'A#7' 'C7'
C,D#,F#,A oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A1' 'D#2' 'F#2' 'G2'
'F#2' 'C2' 'D#2' 'A2'
'C3' 'D#3' 'F#3' 'A3'
'A4' 'C4' 'F#4' 'D#4'
'C5' 'A5' 'D#5' 'F#5'
'F#6' 'D#6' 'C6' 'A6'
'D#7' 'F#7' 'C7' 'A7'
C,E,G,B oct1
oct2
oct3
oct4
oct5
oct6
oct7
'B1' 'G1' 'E2' 'C2'
'C2' 'E2' 'G2' 'B2'
'C3' 'G3' 'E3' 'B3'
'C4' 'G4' 'B4' 'E4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'G6' 'C6'
'E7' 'G7' 'C7' 'E7'
-Los errores E7, que repiten, se deben a que en ambos caos, la componente espectral de la nota que falta por
detectar tiene un nivel demasiado bajo y se confunde con el ruido tras la FFT.
-Sólo hay errores en la octava 1, y están claramente forzados al ser notas con un nivel muy bajo del
fundamental. No hay error con la nota A#1 que ya tiene nivel suficiente de fundamental.(Ver figura 135)
Las limitaciones del método son:
a) Las octavas 0 y 1 apenas presentan fundamental en su espectro, por lo que la aplicación del
métod de validación daría “no válido” incluso con candidatos correctos. Al dar no válido se pasa
al siguiente candidato, el cual es de la segunda octava, la cual sí presenta fundamental (aunque no
sea el parcial de máxima amplitud) y sí es validado. El resultado es un error de identificación de
notas en el que las notas de octava 0 y 1 se validan como notas de octava 2. Esto impide
totalmente la aplicación de este método en las señales predetectadas como banda 1 de la zona
baja.
b) De cara a ampliar la identificación a acordes genéricos, este método puede establecer cierta
limitación en la separación de notas del acorde. Las notas separadas justo una octava (acordes con
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 226 Tesis Doctoral
Fig.135.-Espectros de las notas G1 y A#1. Se indica la posición delfundamental. En el caso de G1 es casi inexistente. En A#1 sí esapreciable y puede superar el método de validación.
refuerzo) pueden presentar problemas, si bien la iteración con sustracción espectral los minimiza
al terminar dejando sola a la nota de menor octava.
5.6.- RECONOCIMIENTO DE ACORDES: ESTRATEGIA DEFINITIVA DE
VALIDACIÓN
La estrategia definitiva seleccionada para validar acordes hace uso de dos métodos
dependiendo de la octava, y es la que sigue:
a) Si la predetección ha indicado que se trata de acordes en las bandas 2 ó 3 (octavas 3 y
superiores), se utiliza la validación por verificación del fundamental.
b) Si la predetección indica que se trata de acordes en banda 1 (octavas 0,1 ó 2), se realizará
una validación basada en ordenación espectral de notas detectadas.
En cuanto al mejor método para las octavas graves, no parece fácil deducir si los errores que
aparecen, tan variables y sensibles al tipo de máscara, se deben a un mal diseño de los patrones (en
cuanto a anchos), a los errores de aproximación en los valores de afinación y coeficiente B
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 227 Tesis Doctoral
obtenidos por el modelo durante el entrenamiento o simplemente al hecho de que el piano
concreto presente unas componentes espectrales tan similares en dichas octavas que no sea posible
la diferenciación de ciertas notas entre sí, y estemos obligados a tener siempre algún error.
La solución más sofisticada que se puede deducir de nuestras medidas es la de aplicar
sustracción espectral con máscaras abruptas de notas validadas por ordenación espectral a partir
de unos acordes obtenidos mediante ordenación de candidatos con máscaras progresivas. Las
pruebas con estas últimas siempre han dado valores en la octava adecuada o en la inferior por lo
que no provocaría error en la ordenación espectral. Pero no es fácil establecer una razón sólida
para determinar que esto sea lo correcto con todos los pianos, por lo que se ha optado por
mantener el método de ordenación espectral en su implementación sencilla.
5.7.- IDENTIFICACIÓN DE ACORDES CORTOS
La aplicación del algoritmo definitivo a los acordes cortos da lugar a ciertas imprecisiones
en la identificación de acordes. Las más llamativas no afectan a la esencia del método de
identificación sino a la predetección y a la validación. Los espectros de los acordes cortos
presentan como se verá ciertas diferencias respecto a los de acordes largos, por lo que las
decisiones sobre los umbrales a usar en la predetección y en la validación por verificación del
fundamental, parámetros fuertemente influenciados por el espectro de los acordes, han sido
modificadas para tener en cuenta ambas posibilidades. Una vez resueltos estos aspectos, aunque
no en su totalidad en el caso del umbral de verificación de fundamental, siguen existiendo ciertos
errores que como se verá son atribuibles a defectos en las máscaras usadas para la sustracción
espectral, que deben ser ligeramente modificadas para la identificación de acordes cortos. Los
patrones, y en definitiva el modelo, no requieren modificación. En la tabla de resultados del
capítulo 6, puede verse que el comportamiento es sólo ligeramente inferior al caso de
identificación de acordes largos.
Las figuras 136, 137 y 138 muestran la comparación del espectro de un mismo acorde
ejecutado largo y corto para tres octavas distintas. Puede verse que las diferencias parecen
presentar varios efectos, entre los que destacan: mayor ruido ‘de fondo’ espectral, ensanchamiento
de pulsos y aparición marcada de componentes adicionales alrededor de la correspondiente al
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 228 Tesis Doctoral
Fig.136.-Espectros del acorde Do mayor de la octava 1 (C1,E1,G1) tocado “legato”(largo) y “stacatto” (corto). Se nota el ensanchamiento de los pulsos y la aparición decomponentes de muy baja frecuencia.
Fig.137.-Espectros para el acorde en octava 4 (fundamental de C4 en 261 Hz). Enacorde corto (‘stacatto’) aparecen componentes de frecuencia inferior a losfundamentales (evidentes productos de intermodulación). Las componentes espectralespresentan varios picos en vez de uno que podrían parecer los elementos del unísono,pero que están demasiado separados para serlo. Existe además más ruido espectralentre componentes.
acorde largo. Otra consecuencia apreciable es la modificación del reparto de niveles espectrales
entre los parciales. Cada figura muestra la misma información, con dos grados de detalle distintos.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 229 Tesis Doctoral
Fig.138.-Espectros para octava 6. El efecto de la ejecución en ‘stacatto’ no parece sertan apreciable salvo por la aparición de componentes a bajas frecuencias. En el detallese ve que sí hay pequeñas modificaciones en los pulsos.
Aunque puede pensarse que dichos efectos son distintos e independientes, vamos a verificar
mediante simulación que todos ellos son explicables por la corta duración de la señal y por la
existencia de productos de intermodulación de segundo y tercer orden debidos al mayor
comportamiento no lineal de la vibración en los acordes cortos. Esta segunda causa es la que más
modificaciones provoca en el espectro.
La excitación de la cuerda mediante el golpe del martillo está sometida a no linealidad (causada
por el comportamiento de la felpa que recubre el martillo), que da lugar a no linealidad en la
vibración [Hall 92]. Dicho comportamiento difiere según la fuerza y velocidad del martillo y por
tanto la no linealidad es distinta según se ejecute un ‘legato’ o un ‘stacatto’.
En principio, la no linealidad en un acorde de piano se analiza para cada nota por separado,
dado que se origina durante el golpe del martillo. La mezcla de todas las vibraciones tiene lugar
en el puente y este no presenta, en principio, efectos no lineales adicionales. Por tanto, los
productos de intermodulación a considerar no son los de las notas entre sí, sino sólo los debidos
a los parciales de cada nota por separado y luego juntados todos.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 230 Tesis Doctoral
Fig.139.-Se aprecia la gran cantidad de productos deintermodulación de segundo y tercer orden queaparecen en una señal de sólo tres parcialesinarmónicos (100, 205 y 320 Hz). Aparecen alrededorde las componentes, muy por debajo de ellas y porencima de ellas.
Fig.140.-Si los parciales originales son armónicos, lamayoría de los productos IM coinciden con ellos yentre sí, de forma que parece que son muchos menos.Aparentemente no afectan a los parciales originales.
La figura 139 muestra los productos de intermodulación de segundo y tercer orden de una
señal con tres componentes senoidales (fundamental y dos parciales más) inarmónicas entre sí. La
simulación se realiza con suficiente resolución espectral para distinguirlas.
Resulta evidente la aparición de componentes de menor frecuencia que el fundamental, pero
no el resto de efectos vistos anteriormente. Para ello realizaremos la simulación de una señal
compuesta por tres sinusoides en condiciones similares a las usadas en las medidas, es decir, dos
segundos muestreados a 44100Hz. La simulación de los acordes cortos se realiza tomando la señal
durante un segundo y rellenando de ceros hasta completar dos segundos.
Se tomarán fundamentales de notas pertenecientes a cuatro octavas y se calcularán los otros
parciales con un valor de inarmonicidad correspondiente a la octava, según las curvas del
coeficiente B del modelo desarrollado. Para mayor facilidad de identificación del efecto, las tres
sinusoides tiene la misma amplitud. En el caso de la octava 1 se usan diez sinusoides en lugar de
tres. Por último, en el caso de la octava 6 se incluye además el efecto cuando los parciales
superiores son muy inferiores al fundamental (caso real). Los resultados se presentan en las figuras
siguientes.
CAPÍTULO 5: RECONOCIMIENTO
Identificación Automática de Acordes Musicales 231 Tesis Doctoral
Fig.141.-Octava 6. Los productos IM aparecenclaramente diferenciados de los parciales y en grannúmero.
Fig.142.-Octava 4. Los productos IM aparecen comosi de los unísonos se tratara, pero no lo son. La notacorta aumenta el nivel de fondo, ensanchandoligeramente el pulso en su base. El aspecto muyensanchado lo da el conjunto del parcial con los IM.
Fig.143.-Octava 3. Los productos IM apenasmodifican el aspecto de los parciales. Sólo el hecho detrabajar con notas cortas ensancha ligeramente la basedel pulso. La bajísima inarmonicidad pega los IM a losparciales y apenas se distinguen.
Fig.144.-Octava 1. A pesar de la bajísimainarmonicidad, ahora los IM se distinguen entreparciales de baja frecuencia. Se ensancha claramenteel conjunto alrededor de cada parcial.
Las figuras anteriores reproducen bastante bien los efectos detectados en los espectros de
acordes cortos grabados, salvo en algún aspecto del nivel de los productos IM que en las medidas
son mayores que en la simulación. En cuanto a la simulación de la octava 6, la siguiente figura sí
tiene en cuenta que no tiene tres parciales al mismo nivel, y puede verse la gran similitud de la
simulación con la realidad, incluso considerando una inarmonicidad mayor, más propia de la
octava 7.
Identificación Automática de Acordes Musicales 232 Tesis Doctoral
Fig.145.-Octava 6 con el segundo parcial a 1/20 y el tercer parcial a1/100 del fundamental. El fundamental casi no cambia y aparece suarmónico con mayor nivel que el segundo parcial.
Como conclusión de este estudio simulado del efecto de la no linealidad, diremos que
consideramos adecuado seguir usando los mismos patrones para identificar las notas del acorde,
pero que las máscaras para limpiar el espectro deben eliminar dichos productos IM, por tanto
deberán ser más anchas que en el caso de identificación de acordes largos.
5.8.- IDENTIFICACIÓN DE ACORDES DE OTRO PIANO
Las diferencias de comportamiento en la fiabilidad de la identificación de acordes al aplicar el
algoritmo a un piano distinto, se centran básicamente en dos aspectos:
-Los umbrales de predetección pueden requerir modificación. Los coeficientes de predetección
se calculan a partir de los niveles del espectro de las señales y la distribución de dichos niveles,
son ligeramente distintos entre pianos, sobre todo al cambiar el tamaño, que afecta a la
radiación de la placa resonante en frecuencias de las octavas graves. Sin duda, la
determinación de un umbral general requiere un futuro estudio estadístico que use una amplia
base de datos de pianos.
-El error cometido en los valores entrenados y usados para generar los patrones no va a ser
el mismo, por lo que puede variarse el grado de fiabilidad, especialmente en las octavas graves.
Identificación Automática de Acordes Musicales 233 Tesis Doctoral
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
6.1.- INTRODUCCIÓN
En este capítulo se presentan los resultados de la aplicación del algoritmo de identificación
de acordes para todos los acordes probados y con diversos valores de ciertos parámetros.
En primer lugar se expresan los resultados en tablas que indican los acordes analizados y
los identificados.
También se incluye una colección de gráficas donde se muestran, para todos los acordes,
los pasos en la identificación así como el residuo espectral que queda. Aunque estas figuras sólo
muestran una parte del espectro suficiente para apreciar la sustracción espectral, los cálculos se
realizan en todo el espectro. esto es importante a la hora de analizar el dato de nivel de residuo
respecto al espectro original, que se expresa en dB y se calcula en toda la banda (0 a 22500Hz).
6.2.- ALGORITMO DEFINITIVO
El algoritmo de entrenamiento es único y se ejecuta el primero con el fin de generar los
patrones y las máscaras correspondientes a todas las 88 notas del piano. También se generan los
multipatrones para la octava 7 y nota C8.
Una vez se tienen los patrones y las máscaras, se procede a ejecutar el algoritmo de
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 234 Tesis Doctoral
identificación. Para poder comparar resultados, el algoritmo que se ha implementado para las
pruebas permite las siguientes opciones:
-Validación alta: se aplica validación por fundamental en las octavas 3 a 7 y validación
por ordenación espectral en las octavas graves 0,1 y 2.
-Validación media: se aplica validaciónpor ordenación espectral a todas las octavas.
-Validación nula: no se aplica validación alguna. Corresponde al método de detección sin
más.
A su vez, se puede elegir el tipo de sustracción que se realiza con las máscaras: progresiva
o abrupta. La selección puede ser del siguiente modo:
-Sin validación o con validación por fundamental: sólo existe un proceso de sustracción,
que es el que se tiene entre cada detección de nota con la métrica o con validación por
fundamental. La denominaremos sustracción o máscaras “intra”
-Con validación por ordenación espectral: existen dos procesos de sustracción. El primero
es el que, como antes, se da entre cada detección de nota con la métrica, para obtener el
conjunto de notas del acorde o residuo, antes de cada validación. El segundo es el que se
realiza una vez que se valida una nota antes de proceder a la siguiente detección multinota.
A esta nueva sustracción la llamaremos “inter”. Se puede resumir como pareja [inter-
validaciones e intra-acorde]
La nomenclatura que utilizaremos para identificar las máscaras o sustracciones usadas es
la de nombrar la pareja “inter-intra”. Por ejemplo, “abrupta-progresiva”(simplificada como [a,p])
significa que se ha usado sustracción abrupta inter (para los distintos pasos de identificación de
nota con validación) y progresiva intra (para las distintas notas de la señal multinota).
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 235 Tesis Doctoral
6.3.- ACORDES A IDENTIFICAR
Como ya se indicó, los acordes que se han grabado para probar la identificación son
diversos.
Los acordes cerrados o “en posición cerrada”son los que tienen todas sus notas en la
misma octava. Se han grabado 6 de ellos en cada una de las 7 octavas. Todos ellos son acordes
de Do en estado fundamental (no invertido), por lo que el Do es la nota de menor frecuencia, lo
que se corresponde con la posición cerrada. Tres de ellos son acordes de tres notas:
Acorde 1: Do Mayor (C,E,G)
Acorde 2: Do Menor (C,D#,G)
Los otros cuatro son acordes de cuatro notas:
Acorde 3: Do Mayor con séptima menor (C,E,G,A#)
Acorde 4: Do Menor con séptima disminuida (C,D#,F#,A)
Acorde 5: Do Menor con séptima menor (C,D#,G,A#)
Acorde 6: Do Mayor con séptima mayor (C,E,G,B)
Puede verse que tres de los acordes de cuatro notas contienen las mismas notas que
algunos acordes de 3 notas. Así podrán verificarse los efectos de sobrecarga de espectro por
comparación de resultados.
Para verificar el funcionamiento del sistema de identificación en condiciones de acordes
más genéricos, se ha grabado un acorde en posición abierta para todas las octavas de la 1 a la 6.
La posición abierta supone que una de las notas del acorde pertenece a la octava inmediatamente
superior. Por eso no ha sido grabado el acorde de la octava 7, pues de la octava 8 sólo existe la
nota C8. El acorde es uno de los usados anteriormente, para poder hacer comparaciones de
resultados, concretamente:
Acorde 7: Do Mayor con séptima menor abierto (C(n),G(n),A#(n),E(n+1)), o bien
(C,G,A#,E+)
Por último, para comparar el efecto del método de estimación del espectro que se intenta
identificar, y para adecuarse a la realidad de la duración de los acordes en un pasaje musical, las
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 236 Tesis Doctoral
grabaciones anteriores han sido realizadas con dos ejecuciones:
-Legato sin soltar la tecla hasta después de 3 s. Les llamaremos acordes largos
- “Stachatto” con pulsación rápida de la tecla, soltándola unas décimas de segundo más
tarde. Les llamaremos acordes cortos.
La única similitud entre las dos ejecuciones aparece en los acordes de la octava 7, en la que
al no estar dotado el piano de apagadores en las notas de dicha octava, apenas hay diferencia en
la duración de la nota, si bien sí la hay en la evolución temporal del inicio (el ataque
principalmente).
Otra importante diferencia entre ambas ejecuciones es que el “stachatto” produce más
distorsión no lineal.
6.4.- TABLAS DE RESULTADOS: ACORDES CERRADOS y LARGOS
El orden en que se presentan los resultados es empezando por el método de mejor
comportamiento , por lo que avanzar en las tablas supone empeorar. Sin embargo, es importante
disponer de los resultados peores para poder comparar y establecer las razones de las mejoras.
6.4.1.- ALGORITMO CON VALIDACIÓN ALTA
La identificación de acordes realizada usando validación por verificación del fundamental
en octavas altas y validación por ordenación espectral en octavas graves, da los siguientes
resultados, tanto para máscaras abruptas en ambas sustracciones (inter-validaciones y intra-
acorde), como para máscaras inter abruptas e intra progresivas. Ya se ha indicado en el capítulo
anterior que el uso de máscaras progresivas en el proceso “inter” no da mejores resultados.
Podrá verse que resulta evidente que los errores empiezan a aparecer por la variación de
la métrica ante exceso de componentes espectrales. Puede verse que el acorde de tres notas CEG
se detecta sin error, mientras que el acorde de cuatro notas CEGA# que contiene las mismas notas
más una adicional, presenta problemas para ciertas máscaras.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 237 Tesis Doctoral
Tabla de resultados 1: Acordes de 3 notas con validación por fundamental para octavas 3 a 7 y validación
por ordenación espectral para octavas 1 y 2. Sustracciones [a,a] y [a,p]
Acordes analizados Acordes identificados con
máscaras abrupta-abrupta
Acordes identificados con
máscaras abrupta-progresiva
C,E,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'E1' 'C1'
'G2' 'E2' 'C2'
'C3' 'G3' 'E3'
'C4' 'G4' 'E4'
'C5' 'E5' 'G5'
'E6' 'G6' 'C6'
'E7' 'G7' 'C7'
'G1' 'E1' 'C1'
'G2' 'E2' 'C2'
'C3' 'G3' 'E3'
'C4' 'G4' 'E4'
'C5' 'E5' 'G5'
'E6' 'G6' 'C6'
'E7' 'G7' 'C7'
C,D#,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'D#1' 'C1'
'G2' 'D#2' 'C2'
'C3' 'G3' 'D#3'
'C4' 'D#4' 'G4'
'C5' 'G5' 'D#5'
'G6' 'D#6' 'C6'
'D#7' 'G7' 'C7'
'G1' 'D#1' 'C1'
'G2' 'D#2' 'C2'
'C3' 'G3' 'D#3'
'C4' 'D#4' 'G4'
'C5' 'G5' 'D#5'
'G6' 'D#6' 'C6'
'D#7' 'G7' 'C7'
-No existe ningún error con ninguna de las combinaciones de máscaras.
Tabla de resultados 2: Acordes de 4 notas con validación por fundamental para octavas 3 a 7 y validación
por ordenación espectral para octavas 1 y 2. Sustracciones [a,a] y [a,p]
Acordes analizados Acordes identificados con
máscaras abrupta-abrupta
Acordes identificados con
máscaras abrupta-progresiva
C,E,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A#2' 'E1' 'C1' 'A#0'
'A#2' 'G2' 'E2' 'C2'
'C3' 'A#3' 'E3' 'G3'
'A#4' 'C4' 'G4' 'E4'
'C5' 'E5' 'G5' 'A#5'
'E6' 'A#6' 'C6' 'G6'
'E7' 'A#7' 'C7' 'E7'
'A#1' 'G1' 'E1' 'C1'
'A#2' 'G2' 'E2' 'C2'
'C3' 'A#3' 'G3' 'E3'
'A#4' 'C4' 'G4' 'E4'
'C5' 'E5' 'G5' 'A#5'
'E6' 'A#6' 'C6' 'G6'
'E7' 'A#7' 'C7' 'E7'
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 238 Tesis Doctoral
C,D#,F#,A oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'C3' 'D#3' 'F#3' 'A3'
'A4' 'C4' 'F#4' 'D#4'
'C5' 'A5' 'D#5' 'F#5'
'F#6' 'D#6' 'C6' 'A6'
'D#7' 'F#7' 'C7' 'A7'
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'C3' 'D#3' 'F#3' 'A3'
'A4' 'C4' 'F#4' 'D#4'
'C5' 'A5' 'D#5' 'F#5'
'F#6' 'D#6' 'C6' 'A6'
'D#7' 'F#7' 'C7' 'A7'
C,D#,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'C3' 'D#3' 'A#3' 'G3'
'C4' 'A#4' 'G4' 'D#4'
'C5' 'D#5' 'G5' 'A#5'
'D#6' 'G6' 'C6' 'A#6'
'D#7' 'G7' 'A#7' 'C7'
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'C3' 'D#3' 'A#3' 'G3'
'C4' 'A#4' 'G4' 'D#4'
'C5' 'D#5' 'G5' 'A#5'
'D#6' 'G6' 'C6' 'A#6'
'D#7' 'G7' 'A#7' 'C7'
C,E,G,B oct1
oct2
oct3
oct4
oct5
oct6
oct7
'B1' 'G1' 'E1' 'C1'
'G2' 'C2' 'G#1' 'E1'
'C3' 'G3' 'E3' 'B3'
'C4' 'G4' 'B4' 'E4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'G6' 'C6'
'E7' 'G7' 'C7' 'E7'
'B1' 'G1' 'E1' 'C1'
'G2' 'E2' 'C2' 'B1'
'C3' 'G3' 'E3' 'B3'
'C4' 'G4' 'B4' 'E4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'G6' 'C6'
'E7' 'G7' 'C7' 'E7'
-Los errores E7, que repiten, se deben a que en ambos caos, la componente espectral de la nota que falta por
detectar tiene un nivel demasiado bajo y se confunde con el ruido. Ante tal situación, el residuo de E7 resulta
tener suficiente nivel para volver a ser detectado.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 239 Tesis Doctoral
6.4.2.- ALGORITMO CON VALIDACIÓN MEDIA
La identificación de acordes realizada usando validación por ordenación espectral en todas
las octavas, da los siguientes resultados, para máscaras abruptas o progresivas en sustracción
inter-validaciones y máscaras abruptas o progresivas en la sustraccción intra-acorde.
Como los resultados se han trascrito a las tablas en el orden dado por el algoritmo, puede
verse que casi siempre están ordenadas las notas de mayor a menor. Si las notas se van validando
tomando la más alta, lo normal es que queden ordenadas de mayor a menor. Esto no siempre
ocuure como veremos y ya discutiremos la razón.
Al final de cada tabla se incluye una discusión específica de los resultados, incluyendo
conclusiones cuando corresponda.
Tabla de resultados 3: Acordes de 3 notas con validación por ordenación espectral en todas las octavas.
Sustracciones [a,a] y [a,p]
Acordes analizados Acordes identificados con
máscaras abrupta-abrupta
Acordes identificados con
máscaras abrupta-progresiva
C,E,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'E1' 'C1'
'G2' 'E2' 'C2'
'G3' 'E3' 'C3'
'B4' 'E4' 'C3'
'G5' 'E5' 'C5'
'G6' 'E6' 'C6'
'G7' 'E7' 'C7'
'G1' 'E1' 'C1'
'G2' 'E2' 'C2'
'G3' 'E3' 'C3'
'G4' 'E4' 'C4'
'G5' 'E5' 'C5'
'G6' 'E6' 'C6'
'G7' 'E7' 'C7'
C,D#,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'D#1' 'C1'
'G2' 'D#2' 'C2'
'G3' 'D#3' 'C3'
'G4' 'D#4' 'C4'
'G5' 'D#5' 'C5'
'G6' 'D#6' 'C6'
'G7' 'D#7' 'C7'
' G1' 'D#1' 'C1'
'G2' 'D#2' 'C2'
'G3' 'D#3' 'C3'
'G4' 'D#4' 'C4'
'G5' 'D#5' 'C5'
'G6' 'D#6' 'C6'
'G7' 'D#7' 'C7'
-Sólo existe un error en la combinación de máscaras [a,a]. Al fallar la validación de G4, y su sustracción,
aparece el error de C3 por C4.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 240 Tesis Doctoral
Tabla de resultados 4: Acordes de 3 notas con validación por ordenación espectral en todas las octavas
y sustracciones [p,a] [p,p]
Acordes analizados Acordes identificados con
máscaras progresiva-abrupta
Acordes identificados con
máscaras progresiva-progresiva
C,E,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'E1' 'C1'
'G2' 'E2' 'C2'
'G3' 'E3' 'C3'
'B4' 'E4' 'C3'
'G5' 'E5' 'C5'
'G6' 'E6' 'C6'
'G7' 'E7' 'C7'
'G1' 'E1' 'C1'
'G2' 'E2' 'C2'
'G3' 'E3' 'C3'
'G4' 'E4' 'C3'
'G5' 'E5' 'C5'
'G6' 'E6' 'C6'
'G7' 'E7' 'C7'
C,D#,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'D#1' 'C1'
'G2' 'D#2' 'C2'
'G3' 'D#3' 'C3'
'G4' 'D#4' 'C4'
'G5' 'D#5' 'C5'
'G6' 'D#6' 'C6'
'G7' 'D#7' 'C7'
'G1' 'D#1' 'C1'
'G2' 'D#2' 'C2'
'G3' 'D#3' 'C3'
'G4' 'D#4' 'C4'
'G5' 'D#5' 'C5'
'G6' 'D#6' 'C6'
'G7' 'D#7' 'C7'
-Aparece el mismo error que antes, por lo que es atribuible al uso de máscara intra tipo abrupto.
-Aparece un segundo error que afecta al mismo acorde en la misma octava pero al usar máscaras ambas
progresivas. La conclusión evidente es que la máscara inter-validaciones progresiva no ha sustraído bien los
espectros de G4 y E4 validados y se ha producido el error. Puede verse que en la misma octava, el otro acorde,
una vez validado G4 y sustraído, no provoca error en la detección de C4. Lo que indica que en el error también
colabora E4.
-La conclusión es que las máscaras progresivas inter-validaciones no son recomendables, y que las máscaras
abruptas intra-acordes no siempre son las mejores.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 241 Tesis Doctoral
Tabla de resultados 5: Acordes de 4 notas con validación por ordenación espectral en todas las octavas.
Sustracciones [a,a] y [a,p].
Acordes analizados Acordes identificados con
máscaras abrupta-abrupta
Acordes identificados con
máscaras abrupta-progresiva
C,E,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A#2' 'E1' 'C1' 'A#0'
'A#2' 'G2' 'E2' 'C2'
'A#3' 'G3' 'E3' 'C3'
'B4' 'A#4' 'E4' 'C3'
'A#5' 'G5' 'E5' 'C5'
'A#6' 'G6' 'E6' 'C6'
'A#7' 'E7' 'E7' 'C5'
'A#1' 'G1' 'E1' 'C1'
'A#2' 'G2' 'E2' 'C2'
'A#3' 'G3' 'E3' 'C3'
'A#4' 'E4' 'C3' 'B4'
'A#5' 'G5' 'E5' 'C5'
'A#6' 'G6' 'E6' 'C6'
'A#7' 'E7' 'E7' 'C5'
C,D#,F#,A oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'A3' 'F#3' 'D#3' 'C3'
'A4' 'F#4' 'D#4' 'C4'
'A5' 'F#5' 'D#5' 'C5'
'A6' 'F#6' 'D#6' 'C6'
'A7' 'F#7' 'D#7' 'C7'
' A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'A3' 'F#3' 'D#3' 'C3'
'A4' 'F#4' 'D#4' 'C4'
'A5' 'F#5' 'D#5' 'C5'
'A6' 'F#6' 'D#6' 'C6'
'A7' 'F#7' 'D#7' 'C7'
C,D#,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'A#3' 'G3' 'D#3' 'C3'
'A#4' 'G4' 'D#4' 'C4'
'A#5' 'G5' 'D#5' 'C5'
'A#6' 'D#6' 'C6' 'G6'
'A#7' 'G7' 'D#7' 'C7'
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'A#3' 'G3' 'D#3' 'C3'
'A#4' 'G4' 'D#4' 'C4'
'A#5' 'G5' 'D#5' 'C5'
'A#6' 'D#6' 'C6' 'G6'
'A#7' 'G7' 'D#7' 'C7'
C,E,G,B oct1
oct2
oct3
oct4
oct5
oct6
oct7
'B1' 'G1' 'E1' 'C1'
'G2' 'C2' 'G#1' 'E1'
'B3' 'G3' 'E3' 'C3'
'B4' 'G4' 'E4' 'C4'
'B5' 'G5' 'E5' 'C5'
'B6' 'E6' 'E5' 'C5'
'G7' 'E7' 'E7' 'C7'
'B1' 'G1' 'E1' 'C1'
'G2' 'E2' 'C2' 'B1'
'B3' 'G3' 'E3' 'C3'
'B4' 'G4' 'E4' 'C4'
'B5' 'G5' 'E5' 'C5'
'B6' 'E6' 'E5' 'C5'
'G7' 'E7' 'C7' 'E7'
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 242 Tesis Doctoral
-Puede verse que aparecen errores en octavas donde no existían para tres notas y en algunos acordes que
comparten notas con los de tres notas. No en todos los casos en que se comparten notas aparecen errores al tener
cuatro notas. Ocuure con C,E,G pero no con C,D#,G.
Tabla de resultados 6: Acordes de 4 notas con validación por ordenación espectral en todas las octavas y
y sustracciones [p,a] [p,p]
Acordes analizados Acordes identificados con
máscaras progresiva-abrupta
Acordes identificados con
máscaras progresiva-progresiva
C,E,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A#2' 'E1' 'C1' 'A#0'
'A#2' 'G2' 'E2' 'C1'
'A#3' 'G3' 'E3' 'C3'
'B4' 'A#4' 'E4' 'C3'
'A#5' 'G5' 'E5' 'C5'
'A#6' 'G6' 'E6' 'C6'
'A#7' 'E7' 'E7' 'C5'
'A#1' 'E1' 'C1' 'A#0'
'A#2' 'G2' 'E2' 'C1'
'A#3' 'G3' 'E3' 'C3'
'A#4' 'E4' 'C3' 'C3'
'A#5' 'G5' 'E5' 'C5'
'A#6' 'G6' 'E6' 'C6'
'A#7' 'E7' 'E7' 'C5'
C,D#,F#,A oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'A3' 'F#3' 'D#3' 'C3'
'A4' 'F#4' 'D#4' 'C4'
'A5' 'F#5' 'D#5' 'C5'
'A6' 'F#6' 'D#6' 'C6'
'A7' 'F#7' 'D#7' 'C7'
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'A3' 'F#3' 'D#3' 'C3'
'A4' 'F#4' 'D#4' 'C4'
'A5' 'F#5' 'D#5' 'C5'
'A6' 'F#6' 'D#6' 'C6'
'A7' 'F#7' 'D#7' 'C7'
C,D#,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'A#3' 'G3' 'D#3' 'C3'
'A#4' 'D#4' 'D#3' 'C3'
'A#5' 'G5' 'D#5' 'C5'
'A#6' 'D#6' 'C6' 'G6'
'A#7' 'G7' 'D#7' 'C7'
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'A#3' 'G3' 'D#3' 'C3'
'A#4' 'G4' 'D#4' 'C4'
'A#5' 'G5' 'D#5' 'C5'
'A#6' 'D#6' 'C6' 'G6'
'A#7' 'G7' 'D#7' 'C7
C,E,G,B oct1
oct2
oct3
oct4
oct5
oct6
oct7
'B1' 'G1' 'E1' 'C1'
'G2' 'C2' 'G1' 'E1'
'B3' 'G3' 'E3' 'C3'
'B4' 'G4' 'E3' 'C3'
'B5' 'G5' 'E5' 'C5'
'B6' 'B6' 'E6' 'C5'
'G7' 'E7' 'E7' 'C7'
'B1' 'G1' 'E1' 'C1'
'G2' 'E2' 'C2' 'B1'
'B3' 'G3' 'E3' 'C3'
'B4' 'G4' 'E3' 'C3'
'B5' 'G5' 'E5' 'C5'
'B6' 'E6' 'E5' 'C5'
'G7' 'E7' 'C7' 'C5'
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 243 Tesis Doctoral
-Se ve que una vez más, la máscara progresiva en la sustracción inter-validaciones genera más errores que la
máscara abrupta.
-También puede verse como resumen, que el acorde C,D#,F#,A es muy robusto, y se debe a que las relaciones
entre las notas del acorde (Do menor con séptima disminuida) no favorecen la compartición de parciales que
puedan equivocar a la métrica, por lo que las máscaras usadas tampoco resultan ser tan críticas.
6.4.3.- ALGORITMO SIN VALIDACIÓN
La identificación de acordes realizada sin validación en ninguna de las octavas, da los
siguientes resultados, en los que se ha considerado tanto máscaras abruptas como progresivas en
la única sustracción que tiene lugar, la intra-acorde.
Al final de cada tabla se incluye una discusión específica de los resultados, incluyendo
conclusiones cuando corresponda.
Tabla de resultados 7: Acordes de 3 notas sin validación
Acordes analizados Acordes identificados con
máscaras abruptas
Acordes identificados con
máscaras progresivas
C,E,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'C1' 'E1' 'G1'
'C1' 'E2' 'G2'
'C3' 'G3' 'E3'
'C3' 'E4' 'B4'
'C5' 'E5' 'G5'
'E6' 'G6' 'C6'
'E7' 'G7' 'C7'
'C1' 'E1' 'G1'
'C1' 'E2' 'G2'
'C3' 'G3' 'E3'
'C3' 'E4' 'G4'
'C5' 'E5' 'G5'
'E6' 'G6' 'C6'
'E7' 'G7' 'C7'
C,D#,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'C1' 'D#1' 'G1'
'C1' 'D#2' 'G2'
'C3' 'G3' 'D#3'
'C3' 'D#4' 'G4'
'C5' 'G5' 'D#5'
'G6' 'D#6' 'C6'
'D#7' 'G7' 'C7'
'C1' 'D#1' 'G1'
'C1' 'D#2' 'G2'
'C3' 'G3' 'D#3'
'C3' 'D#4' 'G4'
'C5' 'G5' 'D#5'
'G6' 'D#6' 'C6'
'D#7' 'G7' 'C7'
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 244 Tesis Doctoral
-Existen 4 acordes con errores y son los mismos para ambas máscaras. Básicamente se deben al efecto de la nota
G en la confusión de C3 por C4 y C1 por C2. No se da en el resto de los casos por la existencia de predetección.
Podría darse también entre C6 y C7, pero la marcada inarmonicidad en esas octavas las diferencia bien.
-Llama la atención el error de B4 por G4, debido muy seguramente a que al sustraer la máscara de la nota C3
primeramente detectada, se ha hecho desaparecer el fundamental de G4, dependiendo la identificación de G4
sólo de los parciales. La coincidencia de parciales de G4 con parciales de B4 completa la causa del error.
Tabla de resultados 8: Acordes de 4 notas sin validación.
Acordes analizados Acordes identificados con
máscaras abruptas
Acordes identificados con
máscaras progresivas
C,E,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'C1' 'A#0' 'E1' 'A#2'
'C1' 'E2' 'A#2' 'G2'
'C3' 'A#3' 'E3' 'G3'
'C3' 'A#4' 'E4' 'B4'
'C5' 'E5' 'G5' 'A#5'
'E6' 'A#6' 'C6' 'G6'
'E7' 'A#7' 'C5' 'E7'
'C1' 'A#0' 'E1' 'A#1'
'C1' 'E2' 'A#2' 'G2'
'C3' 'A#3' 'G3' 'E3'
'C3' 'A#4' 'E4' 'C3'
'C5' 'E5' 'G5' 'A#5'
'E6' 'A#6' 'C6' 'G6'
'E7' 'A#7' 'C5' 'E7'
C,D#,F#,A oct1
oct2
oct3
oct4
oct5
oct6
oct7
'C1' 'D#1' 'F#1' 'A1'
'B0' 'C2' 'A2' 'D#2'
'C3' 'D#3' 'F#3' 'A3'
'A4' 'C4' 'F#4' 'D#4'
'C5' 'A5' 'D#5' 'F#5'
'F#6' 'D#6' 'C6' 'A6'
'D#7' 'F#7' 'C7' 'A7'
'C1' 'D#1' 'F#1' 'A1'
'B0' 'C2' 'D#2' 'A2'
'C3' 'D#3' 'F#3' 'A3'
'A4' 'C4' 'F#4' 'D#4'
'C5' 'A5' 'D#5' 'F#5'
'F#6' 'D#6' 'C6' 'A6'
'D#7' 'F#7' 'C7' 'A7'
C,D#,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'D#1' 'C1' 'A#0' 'G1'
'C1' 'D#2' 'A#2' 'G2'
'C3' 'D#3' 'A#3' 'G3'
'C3' 'D#3' 'G4' 'A#4'
'C5' 'D#5' 'G5' 'A#5'
'D#6' 'C5' 'A#6' 'C6'
'D#7' 'G7' 'A#7' 'C7'
'D#1' 'C1' 'A#0' 'G1'
'C1' 'D#2' 'A#2' 'G2'
'C3' 'D#3' 'A#3' 'G3'
'C3' 'D#3' 'A#4' 'G4'
'C5' 'D#5' 'G5' 'A#5'
'D#6' 'C5' 'A#6' 'C6'
'D#7' 'G7' 'A#7' 'C7'
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 245 Tesis Doctoral
C,E,G,B oct1
oct2
oct3
oct4
oct5
oct6
oct7
'E1' 'C1' 'B1' 'G1'
'C1' 'E1' 'G2' 'C2'
'C3' 'G3' 'E3' 'B3'
'C3' 'E3' 'G4' 'B4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'C5' 'E5'
'E7' 'G7' 'C7' 'E7'
'E1' 'C1' 'B1' 'G1'
'C1' 'E1' 'G2' 'E2'
'C3' 'G3' 'E3' 'B3'
'C3' 'E3' 'G4' 'B4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'C5' 'E5'
'E7' 'G7' 'C7' 'C5'
-El número de errores sube hasta 13 acordes fallados de 28.
-El tipo de sustracción no impone diferencia en los acordes erróneos, sólo en algunas notas concretas.
-En las dos primeras octavas (graves) existe gran “sobrecarga” de espectro que incrementa el número de errores,
al haber más componentes con las que puntuar todos los patrones graves. Permanecen los problemas en la octava
4, pero con cierto incremento del número de notas erradas en el acorde fallido, y aparecen errores del mismo
tipo en las octavas más altas.
-Puede verse que el acorde C,D#,F#,A es el más robusto, aunque presenta error en la octava 2. Es un error
“raro” (B0 en vez de F#2) que se produce como primera identificación y por tanto se debe a una sobrecarga de
espectro con coincidencia de muchas componentes con los parciales superiores del patrón B0.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 246 Tesis Doctoral
6.5.- TABLAS DE RESULTADOS: ACORDES ABIERTOS
En este caso, directamente se muestran los resultados en el caso mejor que es con
validación alta y máscaras [abruptas-progresivas]. Los resultados para acordes abiertos y largos
son:
Tabla de resultados 9: Acorde de 4 notas abiertos con validación alta.
Acordes analizados Acordes identificados con
máscaras abruptas-progresivas
C,G,A#,E+ oct1
oct2
oct3
oct4
oct5
oct6
'E2' 'A#1' 'G1' 'C1'
'A#2' 'G2' 'E2' 'C2'
'C3' 'G3' 'A#3' 'E4'
'A#4' 'C4' 'G4' 'A#4'
'C5' 'G5' 'A#5' 'C5'
'A#6' 'G6' 'E7' 'C6'
-Aparecen 3 acordes erróneos. Ninguno de ellos era erróneo en la posición cerrada.
-El problema surge exclusivamente por la aplicación de la predetección de octava.
E2 por E3: si se predetecta banda grave, no se usan patrones de la octava 3 y no se puede obtener E3
A#4 por E5: lo mismo al predetectarse banda 2 (sólo patrones de octavas 3 y 4)
C5 por E6: lo mismo cuando se predetecta banda 3 con zona baja (sólo patrones octava 5)
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 247 Tesis Doctoral
6.6.- TABLAS DE RESULTADOS: ACORDES CORTOS
Si se aplica el algoritmo, con validación alta y máscaras abruptas-progresivas, a acordes
cortos, una vez modificado el algoritmo de predetección de manera compatible con los acordes
largos. Los resultados son los de la siguiente tabla. Se han puesto, para facilitar la comparación,
los resultados para los mismos acordes pero largos.
Tabla de resultados 10: Acordes cortos de 3 notas con validación alta y sustracción abrupta-progresiva
Acordes analizados Acordes cortos identificados Acordes largos identificados
C,E,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'E1' 'C1'
'E2' 'G1' 'C1'
'C3' 'G3' 'C3'
'G4' 'C4' 'C3'
'G5' 'C5' 'E5'
'G6' 'E6' 'C6'
'E7' 'G7' 'C7'
'G1' 'E1' 'C1'
'G2' 'E2' 'C2'
'C3' 'G3' 'E3'
'C4' 'G4' 'E4'
'C5' 'E5' 'G5'
'E6' 'G6' 'C6'
'E7' 'G7' 'C7'
C,D#,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'D#1' 'C1'
'D#2' 'G1' 'C1'
'C3' 'G3' 'D#3'
'G4' 'D#4' 'C4'
'G5' 'C5' 'D#5'
'G6' 'C6' 'D#6'
'D#7' 'G7' 'C7'
'G1' 'D#1' 'C1'
'G2' 'D#2' 'C2'
'C3' 'G3' 'D#3'
'C4' 'D#4' 'G4'
'C5' 'G5' 'D#5'
'G6' 'D#6' 'C6'
'D#7' 'G7' 'C7'
-Aparecen fallos especialmente inesperados en las octavas 3 y 4 en las que la validación por verificación del
fundamental parecía definitiva. La existencia de componentes IM y ruido que pueden confundir la verificación
del fundamental, queda patente en estos resultados
-En cuanto a errores en octavas graves, existen defectos debidos a que los componentes de intermodulación por
no linealidad, engordan el pulso a ser identificado por encima del ancho de los patrones. Eso hace a la métrica
muy sensible a la coincidencia exacta de los parciales de los patrones con las componentes espectrales del
acorde.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 248 Tesis Doctoral
Tabla de resultados 11: Acordes cortos de 4 notas con validación alta y sustracción abrupta-progresiva
Acordes analizados Acordes cortos identificados Acordes largos identificados
C,E,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A#1' 'G1' 'E1' 'C1'
'A#2' 'E2' 'C2' 'C#1'
'C3' 'A#3' 'E3' 'C3'
'A#4' 'C4' 'C3' 'E4'
'C5' 'G5' 'E5' 'A#5'
'E6' 'A#6' 'C6' 'E6'
'E7' 'A#7' 'C7' 'E7'
'A#1' 'G1' 'E1' 'C1'
'A#2' 'G2' 'E2' 'C2'
'C3' 'A#3' 'G3' 'E3'
'A#4' 'C4' 'G4' 'E4'
'C5' 'E5' 'G5' 'A#5'
'E6' 'A#6' 'C6' 'G6'
'E7' 'A#7' 'C7' 'E7'
C,D#,F#,A oct1
oct2
oct3
oct4
oct5
oct6
oct7
'F#1' 'A1' 'D#1' 'C1'
'D#2' 'D1' 'C1' 'B0'
'C3' 'D#3' 'F#3' 'A3'
'A4' 'D#4' 'C4' 'F#4'
'A5' 'F#5' 'C5' 'D#5'
'F#6' 'C6' 'A6' 'D#6'
'D#7' 'F#7' 'C7' 'A7'
'A1' 'F#1' 'D#1' 'C1'
'A2' 'D#2' 'F#2' 'C2'
'C3' 'D#3' 'F#3' 'A3'
'A4' 'C4' 'F#4' 'D#4'
'C5' 'A5' 'D#5' 'F#5'
'F#6' 'D#6' 'C6' 'A6'
'D#7' 'F#7' 'C7' 'A7'
C,D#,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A#1' 'G1' 'D#2' 'C1'
'D#2' 'A#1' 'G1' 'C1'
'C3' 'G3' 'D#3' 'A#3'
'A#4' 'D#4' 'C4' 'C3'
'C5' 'D#5' 'G5' 'A#5'
'A#6' 'G6' 'C6' 'D#6'
'D#7' 'G7' 'A#7' 'C7'
'G1' 'A#1' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C2'
'C3' 'D#3' 'A#3' 'G3'
'C4' 'A#4' 'G4' 'D#4'
'C5' 'D#5' 'G5' 'A#5'
'D#6' 'G6' 'C6' 'A#6'
'D#7' 'G7' 'A#7' 'C7'
C,E,G,B oct1
oct2
oct3
oct4
oct5
oct6
oct7
'B1' 'G1' 'C1' 'A0'
'E1' 'C2' 'C#1' 'A0'
'C3' 'G3' 'E3' 'B3'
'B4' 'C4' 'G4' 'E4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'G6' 'C6'
'E7' 'G7' 'C7' 'E7'
'B1' 'G1' 'E1' 'C1'
'G2' 'E2' 'C2' 'B1'
'C3' 'G3' 'E3' 'B3'
'C4' 'G4' 'B4' 'E4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'G6' 'C6'
'E7' 'G7' 'C7' 'E7'
-Aparecen errores en las octavas graves por la diferencia en ancho de patrones y espectros con IM
-La validación por fundamental falla en algunos casos de octavas medias por errores inducidos por mayor
nivel de ruido espectral y presencia de productos IM
-Permanecen errores de repetición de nota identificada, en las octavas más altas, por falta de nivel de alguna
nota. Crecen los casos ante mayor nivel de ruido espectral respecto a acordes largos
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 249 Tesis Doctoral
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 250 Tesis Doctoral
6.7.- TABLAS DE RESULTADOS: PIANO YAMAHA C3
En este apartado se incluyen los resultados obtenidos al aplicar todo el proceso de
entrenamiento e identificación a los acordes de un piano distinto. Se trata de la tercera grabación
realizada, según se explicó en el apartado de “Material y generalización de resultados” (página 28).
Tabla de resultados 12: Acordes de 3 notas con validación por fundamental para octavas 3 a 7 y validación
por ordenación espectral para octavas 1 y 2. Sustracción [a,p]. Piano distinto
Acordes analizados Acordes identificados con
máscaras abrupta-progresiva
C,E,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'E1' 'C1'
'G1' 'E2' 'C1'
'C3' 'G3' 'E3'
'C4' 'G4' 'E4'
'C5' 'E5' 'G5'
'E6' 'G6' 'C6'
'E7' 'G7' 'C7'
C,D#,G oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'D#1' 'C1'
'G2' 'D#2' 'C1'
'C3' 'G3' 'D#3'
'C4' 'D#4' 'G4'
'C5' 'D#5' 'G5'
'D#6' 'G6' 'C6'
'D#7' 'C7' 'G7'
-Existen 2 errores. La octava 2 mantiene problemas con la ambigüedad de octavas respecto a la octava 1. Estos
errores que no existían en las pruebas del piano Steinway, y que se dan en una octava de difícil validación y
cuyos resultados dependen mucho de la métrica entre el espectro y los patrones, pueden deberse a una menor
perfección en la coincidencia de los patrones con los espectros. Esta proviene, evidentemente, del proceso de
entrenamiento y depende de los errores cometidos en los cálculos de las aproximaciones de las curvas de
afinación y coeficiente de inarmonicidad B.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 251 Tesis Doctoral
Tabla de resultados 13: Acordes de 4 notas con validación por fundamental para octavas 3 a 7 y validación
por ordenación espectral para octavas 1 y 2. Sustracción [a,p]. Piano distinto
Acordes analizados Acordes identificados con
máscaras abrupta-progresiva
C,E,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'E1' 'C1' 'A#0'
'E2' 'G2' 'A#2' 'C1'
'C3' 'G3' 'A#3' 'E3'
'C4' 'A#4' 'E4' 'G4'
'C5' 'E5' 'G5' 'A#5'
'E6' 'A#6' 'C6' 'G6'
'E7' 'A#7' 'E7' 'C7'
C,D#,F#,A oct1
oct2
oct3
oct4
oct5
oct6
oct7
'A1' 'F#1' 'D#1' 'C1'
'A2' 'F#2' 'D#2' 'C1'
'C3' 'D#3' 'F#3' 'C3'
'A4' 'C4' 'F#4' 'D#4'
'C5' 'A5' 'D#5' 'F#5'
'F#6' 'D#6' 'C6' 'A6'
'D#7' 'C7' 'F#7' 'A7'
C,D#,G,A# oct1
oct2
oct3
oct4
oct5
oct6
oct7
'G1' 'F2' 'D#1' 'C1'
'A#2' 'G2' 'D#2' 'C1'
'C3' 'D#3' 'G3' 'A#3'
'C4' 'D#4' 'G4' 'A#4'
'C5' 'D#5' 'G5' 'A#5'
'D#6' 'C6' 'G6' 'A#6'
'D#7' 'C7' 'A#7' 'G7'
C,E,G,B oct1
oct2
oct3
oct4
oct5
oct6
oct7
'B1' 'G1' 'E1' 'C1'
'E2' 'G2' 'B2' 'C1'
'C3' 'G3' 'E3' 'C3'
'C4' 'G4' 'B4' 'E4'
'C5' 'E5' 'G5' 'B5'
'E6' 'B6' 'C6' 'G6'
'E7' 'E7' 'C7' 'G7'
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 252 Tesis Doctoral
-Podemos encontrar una vez más errores en las octavas inferiores y el error de repetición de nota en la octava
7 (E7). Todo ello como ocurre con el piano Steinway. En este otro piano (Yamaha) nos encontramos también
con un error de repetición de nota en la octava 3 (C3). Resulta evidente la conveniencia de incluir un detector
de repetición de nota validada en las futuras mejoras del algoritmo.
6.8.- FIGURAS DE PROCESOS DE IDENTIFICACIÓN DE ACORDES
Una vez que se han indicado los resultados obtenidos, se muestra una serie de figuras en
las que aparece el proceso de identificación de acordes del piano Steinway para cada paso de
validación y sustracción espectral, así como el espectro residual (residuo). Se indica también el
nivel de señal del espectro residuo respecto al espectro inicial expresado en dB. Esto permite
evaluar la bondad de la identificación y de la sustracción.
En algunos casos el valor de nivel residuo es elevado debido, no a un mal proceso de
sustracción, sino a la existencia de pobre relación S/N del acorde original. Si la relación es pobre,
al sustraer la parte correspondiente a señal, esta supondrá una pequeña proporción del total, y el
residuo seguirá teniendo mucho nivel. Eso ocurre especialmente en notas de las octavas más altas,
dado que apenas tienen más que dos parciales y suelen ir acompañadas de mucho ruido de bjas
frecuencias.
6.8.1.- FIGURAS DE IDENTIFICACIÓN DE ACORDES CERRADOS LARGOS CON
VALIDACIÓN ALTA Y SUSTRACCIÓN [A,P]
Esta colección de figuras están organizadas por acordes, cubriendo para cada uno las 7
octavas. En total son 42 figuras
En cada figura se visualiza el espectro original en una zona que sólo muestra los primeros
parciales, para facilitar la visualización. Las gráficas de cada etapa de detección incluyen el
espectro que se introduce a la etapa y la máscara base de la nota validada tras dicha etapa. Para
comparar el resultado de la sustracción, estas figuras están normalizadas al nivel máximo del
espectro de entrada al paso, que es el resultante de la sustracción del espectro anterior. Los
espectros original y residuo no se muestran normalizados sino a la misma escala original.
La indicación “sm” que aparece en algunas figuras hace referencia a que no se usa máscara
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 253 Tesis Doctoral
“inter”, lo que siempre ocurre en validación por fundamental (“vf”).
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 254 Tesis Doctoral
Fig.146.-Acorde 1. Octava 1
Fig.147.-Acorde 1. Octava 2
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 255 Tesis Doctoral
Fig.148.-Acorde 1. Octava 3
Fig.149.-Acorde 1. Octava 4
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 256 Tesis Doctoral
Fig.150.-Acorde 1. Octava 5
Fig.151.-Acorde 1. Octava 6
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 257 Tesis Doctoral
Fig.152.-Acorde 1. Octava 7
Fig.153.-Acorde 2. Octava 1
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 258 Tesis Doctoral
Fig.154.-Acorde 2. Octava 2
Fig.155.-Acorde 2. Octava 3
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 259 Tesis Doctoral
Fig.156.-Acorde 2. Octava 4
Fig.157.-Acorde 2. Octava 5
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 260 Tesis Doctoral
Fig.158.-Acorde 2. Octava 6
Fig.159.-Acorde 2. Octava 7
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 261 Tesis Doctoral
Fig.160.-Acorde 3. Octava 1
Fig.161.-Acorde 3. Octava 2
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 262 Tesis Doctoral
Fig.162.-Acorde 3. Octava 3
Fig.163.-Acorde 3. Octava 4
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 263 Tesis Doctoral
Fig.164.-Acorde 3. Octava 5
Fig.165.-Acorde 3. Octava 6
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 264 Tesis Doctoral
Fig.166.-Acorde 3. Octava 7
Fig.167.-Acorde 4. Octava 1
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 265 Tesis Doctoral
Fig.168.-Acorde 4. Octava 2
Fig.169.-Acorde 4. Octava 3
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 266 Tesis Doctoral
Fig.170.-Acorde 4. Octava 4
Fig.171.-Acorde 4. Octava 5
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 267 Tesis Doctoral
Fig.172.-Acorde 4. Octava 6
Fig.173.-Acorde 4. Octava 7
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 268 Tesis Doctoral
Fig.174.-Acorde 5. Octava 1
Fig.175.-Acorde 5. Octava 2
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 269 Tesis Doctoral
Fig.176.-Acorde 5. Octava 3
Fig.177.-Acorde 5. Octava 4
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 270 Tesis Doctoral
Fig.178.-Acorde 5. Octava 5
Fig.179.-Acorde 5. Octava 6
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 271 Tesis Doctoral
Fig.180.-Acorde 5. Octava 7
Fig.181.-Acorde 6. Octava 1
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 272 Tesis Doctoral
Fig.182.-Acorde 6. Octava 2
Fig.183.-Acorde 6. Octava 3
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 273 Tesis Doctoral
Fig.184.-Acorde 6. Octava 4
Fig.185.-Acorde 6. Octava 5
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 274 Tesis Doctoral
Fig.186.-Acorde 6. Octava 6
Fig.187.-Acorde 6. Octava 7
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 275 Tesis Doctoral
6.8.2.- NIVELES DE RESIDUOS
Puede comprobarse que todos los residuos de octavas 1 a 3 tienen al menos 20 dB menos
de nivel que el original.
Los de octavas 4 y 5 tienen entre 10 y 30 dB menos. La octava 6 entre 10 y 20 dB. Por
último, la octava 7 tiene niveles casi siempre inferiores a 10dB, aunque cercanos a este valor.
CAPÍTULO 6: RESULTADOS Y DISCUSIÓN
Identificación Automática de Acordes Musicales 276 Tesis Doctoral
Identificación Automática de Acordes Musicales 275 Tesis Doctoral
CAPÍTULO 7: CONCLUSIONES
En el trabajo presentado se ha demostrado que es posible la identificación de acordes de
piano usando un método de reconocimiento de patrones. Se han identificado diversos acordes de
3 y 4 notas en toda la gama tonal del piano (octavas 1 a 7), y los patrones usados se han obtenido
a partir de la aplicación de un modelo (Objetivo General)
Se ha comprobado que los patrones no pueden ser unos únicos comunes a todos los
pianos, por lo que es necesario entrenar el sistema para cada piano. Como resultado del
entrenamiento, se generan los patrones que se usarán para el reconocimiento.
El método presentado basa la identificación de acordes en la identificación iterativa de las
notas que lo componen. Se ha demostrado que es posible esta estrategia gracias a los procesos de
sustracción espectral y de validación de la nota identificada.
La sustracción se basa en el uso de máscaras, que deben ser generadas junto con los
patrones, para cada piano, como resultado del entrenamiento. En este trabajo se han presentado
resultados comparando el uso de dos tipos de máscaras: las abruptas y las progresivas. Si bien ha
quedado comprobado que las máscaras abruptas son las más adecuadas para la sustracción
espectral definitiva que sigue a la validación de la nota identificada, no ha podido establecerse una
conclusión tan evidente para las sustracciones previas a las validaciones.
CAPÍTULO 7: CONCLUSIONES
Identificación Automática de Acordes Musicales 276 Tesis Doctoral
La identificación de cada nota se ha conseguido mediante el uso de un método de
reconocimiento de patrones. Se ha comprobado que dicho método asegura una identificación libre
de errores cuando se trata de notas sueltas.
También se ha comprobado que en el caso de acordes, con varias notas simultáneas, se dan
situaciones espectrales que pueden confundir al método de identificación de notas, por lo que
se añade un método de validación de la nota identificada. Los resultados indican que dicha
validación disminuye dichos errores, eliminándolos totalmente para los acordes de octavas 3 y
superiores y disminuyéndolos en los acordes de las octavas 1 y 2. Los resultados también indican
que dichos errores pueden ser totalmente eliminados en el caso de ciertos acordes.
En cuanto al método de identificación de notas, se ha comprobado que tener unos buenos
patrones facilita la identificación, pero no es suficiente para asegurar la ausencia de errores. La
consecución de un método de identificación de notas libre de errores ha requerido el uso de
técnicas de predetección para optimizar el uso del conjunto de patrones. Los resultados obtenidos
usando predetección junto con preprocesado de limpieza de la señal demuestran que se ha
optimizado la identificación (Objetivo concreto nº 3)
Se ha comprobado que las técnicas de predetección, aplicadas de modo que la
comparación del espectro de la nota se realice sólo con respecto a un subconjunto de patrones,
son muy buenas para los resultados de la identificación de notas sueltas y acordes cerrados, pero
dificulta la identificación completa de acordes abiertos de ciertas octavas.
La predetección no puede solucionar la identificación de notas, sólo elimina ambiguedades
entre octavas organizadas en bandas. Para diferenciar notas pertenecientes a la misma banda
predetectada, es imprescindible contar con unos buenos patrones que distingan las notas y que
eliminen el clásico problema de la ambiguedad entre octavas adyacentes. En el trabajo que se ha
presentado, se ha demostrado que todo esto es posible, recayendo la precisión de los patrones
obtenidos en el modelo acústico, en el entrenamiento de éste y en el algoritmo de generación de
patrones. (Objetivo concreto nº 2)
CAPÍTULO 7: CONCLUSIONES
Identificación Automática de Acordes Musicales 277 Tesis Doctoral
Sin embargo, en algunos casos, octavas más agudas, la precisión de los patrones no
consigue ser suficiente y hay que recurrir al uso de multipatrones, de forma que una misma nota
se asocia a varios patrones que se solapan entre sí. Los resultados demuestran que el método es
satisfactorio, al desaparecer los errores existentes en la octava 7. (Objetivo concreto nº 2)
El algoritmo de generación de patrones establece el número de parciales de cada patrón
(distinto según la octava), los niveles relativos de dichos parciales (para ponderar la métrica de
comparación y eliminar la ambiguedad de octava) y genera el espectro completo de cada patrón
teniendo en cuenta para cada parcial su frecuencia y su ancho espectral.
En el trabajo presentado se ha desarrollado un modelo acústico que permite obtener los
valores de las frecuencias y la anchura de los parciales, que se usan para generar los patrones.
(Objetivo concreto nº 1)
Dicho modelo se basa en los aspectos acústicos del piano, pero debido a la variación de
estos entre pianos, se requiere un entrenamiento para cada piano. El trabajo presenta un algoritmo
de entrenamiento tras comparar varias estrategias y optimizar varias metodologías que resuelven
aspectos muy específicos del piano (inarmonicidad, distorsión no lineal,...) a la hora de extraer
parámetros espectrales. (Objetivo concreto nº5)
La validez del modelo para identificación de pianos distintos queda asegurada porque el
modelo definitivo no establece como fijo ninguno de los parámetros que pueden variar de un piano
a otro, siendo el entrenamiento el que los establece para cada piano a partir de las medidas
realizadas a las notas de entrenamiento.(Objetivo particular nº 4) .
Se ha demostrado que el modelo desarrollado en base a comprobaciones realizadas con
las grabaciones del piano Yamaha, ha podido ser usado por el piano Steinway, realizando el
entrenamiento y con éxito en las identificaciones.
CAPÍTULO 7: CONCLUSIONES
Identificación Automática de Acordes Musicales 278 Tesis Doctoral
Si bien se han cumplido los objetivos planteados para este trabajo y se ha comprobado que
el método permite identificaciones con buen grado de aciertos y en una amplia gama de sonidos,
todavía hay aspectos que pueden ser estudiados e incluidos en un sistema de identificación
automática de acordes con vistas a un sistema de transcripción. Entre ellos destacamos:
-Segmentación temporal automática del fragmento musical
-Identificación del tipo de ejecución de la nota (ataque) para ajustar la anchura espectral
de los patrones según se trate de acorde corto o largo.
-Detección fiable del número de notas existentes simultáneamente con reconocimiento de
si se tratan de notas de un mismo acorde o mezcla de notas ejecutadas anteriormente con
las actuales
-Métodos de estimación, del espectro del sonido a identificar, alternativos a la FFT,
especialmente en sonidos de muy corta duración.
-Separación de notas o acordes simultáneos que pertenecen a octavas claramente distintas
(ejecución de pasajes musicales a dos manos)
-Detección de la actuación del dispositivo apagador
Muchos de ellos suponen el uso de métodos centrados en el análisis de la evolución
temporal del sonido a identificar en vez de en su análisis espectral.
CAPÍTULO 7: CONCLUSIONES
Identificación Automática de Acordes Musicales 279 Tesis Doctoral
CAPÍTULO 7: CONCLUSIONES
Identificación Automática de Acordes Musicales 280 Tesis Doctoral
Identificación Automática de Acordes Musicales 281 Tesis Doctoral
ANEXOSNOTAS MUSICALES
Octava, índice en piano(1-88), denominación inglesa (absoluta) e italiana, frecuencia en escala temperada
Octava Índ. NotaFrecuencia f0
(Hz)
0
1 A0 La0 27,50
2 A#0 La#0 29,14
3 B0 Si0 30,87
1
4 C1 Do1 32,70
5 C#1 Do#1 34,65
6 D1 Re1 36,71
7 D#1 Re#1 38,89
8 E1 Mi1 41,20
9 F1 Fa1 43,65
10 F#1 Fa#1 46,25
11 G1 Sol1 49,00
12 G#1 Sol#1 51,91
13 A1 La1 55,00
14 A#1 La#1 58,27
15 B1 Si1 61,74
2
16 C2 Do2 65,41
17 C#2 Do#2 69,30
18 D2 Re2 73,42
19 D#2 Re#2 77,78
20 E2 Mi2 82,41
21 F2 Fa2 87,31
22 F#2 Fa#2 92,50
23 G2 Sol2 98,00
24 G#2 Sol#2 103,83
25 A2 La2 110,00
26 A#2 La#2 116,54
27 B2 Si2 123,47
Octava Índ. NotaFrecuencia f0
(Hz)
3
28 C3 Do3 130,81
29 C#3 Do#3 138,59
30 D3 Re3 146,83
31 D#3 Re#3 155,56
32 E3 Mi3 164,81
33 F3 Fa3 174,61
34 F#3 Fa#3 185,00
35 G3 Sol3 196,00
36 G#3 Sol#3 207,65
37 A3 La3 220,00
38 A#3 La#3 233,08
39 B3 Si3 246,94
4
40 C4 Do4 261,63
41 C#4 Do#4 277,18
42 D4 Re4 293,66
43 D#4 Re#4 311,13
44 E4 Mi4 329,63
45 F4 Fa4 349,23
46 F#4 Fa#4 369,99
47 G4 Sol4 392,00
48 G#4 Sol#4 415,30
49 A4 La4 440,00
50 A#4 La#4 466,16
51 B4 Si4 493,88
Identificación Automática de Acordes Musicales 282 Tesis Doctoral
Octava Índ. NotaFrecuencia f0
(Hz)
5
52 C5 Do5 523,25
53 C#5 Do#5 554,37
54 D5 Re5 587,33
55 D#5 Re#5 622,25
56 E5 Mi5 659,26
57 F5 Fa5 698,46
58 F#5 Fa#5 739,99
59 G5 Sol5 783,99
60 G#5 Sol#5 830,61
61 A5 La5 880,00
62 A#5 La#5 932,33
63 B5 Si5 987,77
6
64 C6 Do6 1046,50
65 C#6 Do#6 1108,73
66 D6 Re6 1174,66
67 D#6 Re#6 1244,51
68 E6 Mi6 1318,51
69 F6 Fa6 1396,91
70 F#6 Fa#6 1479,98
71 G6 Sol6 1567,98
72 G#6 Sol#6 1661,22
73 A6 La6 1760,00
74 A#6 La#6 1864,66
75 B6 Si6 1975,53
Octava Índ. NotaFrecuencia f0
(Hz)
7
76 C7 Do7 2093,00
77 C#7 Do#7 2217,46
78 D7 Re7 2349,32
79 D#7 Re#7 2489,02
80 E7 Mi7 2637,02
81 F7 Fa7 2793,83
82 F#7 Fa#7 2959,96
83 G7 Sol7 3135,96
84 G#7 Sol#7 3322,44
85 A7 La7 3520,00
86 A#7 La#7 3729,31
87 B7 Si7 3951,07
8 88 C8 Do8 4186,01
Identificación Automática de Acordes Musicales 283 Tesis Doctoral
ABREVIATURASSe incluyen una serie de abreviaturas usadas en el texto, ordenadas por temática con la que
se relacionan.
Características de materiales
ρ Densidad del material Kg/m3
E Módulo de Elasticidad de Young Pa ó N/m2
Gxy Módulo de cizallamiento (“Shear”) Pa
σ Relación de Poisson
Cuerdas
T Tensión de la cuerda N
L Longitud efectiva de la cuerda m
r Radio de la cuerda m
d Diámetro de la cuerda m
ρL Densidad lineal Kg/m
xe Punto de impacto del martillo en la cuerda m
s Coeficiente de escala en la ecuación de
longitudes de cuerdas
F Factor de carga de una cuerda con
entorchado (bordón)
R Radio exterior de la cuerda m
B Coeficiente de Inarmonicidad
J Coeficiente corregido de inarmonicidad. J=B/2.
Placa resonante
h grosor de la placa m
D Rigidez de la placa Nm
ρS Densidad superficial Kg/m2
SB Subíndice usado para referirse a la
placa resonante (“SoundBoard”)
Identificación Automática de Acordes Musicales 284 Tesis Doctoral
ZSB Impedancia mecánica vista en el extremo
de la cuerda, debida a la placa resonante Kg/s
M Masa Kg
R Resistencia mecánica Kg/s
S Rigidez (“Stiffness”)
o coeficiente de elasticidad Kg/s2 ó N/m
Isb Inarmonicidad debida al efecto de la
placa resonante
Propagación
γ Constante compleja de propagación
k Número de onda m-1
c Velocidad de propagación de una onda
o de una vibración m/s
c0 Velocidad de propagación de una onda
(vibración) transversal en cuerda flexible. m/s
cB Velocidad de propagación de una onda
de flexión en un medio exclusivamente
rígido (barra) m/s
λ Longitud de onda m
α Coeficiente de amortiguamiento
η Factor de pérdidas
Z0 Impedancia característica de un medio
de propagación de onda Ω
Variables y magnitudes de la vibración
f Frecuencia Hz
f0 Frecuencia teórica para cuerda flexible
en las condiciones de tensión, densidad
y longitud de la cuerda real. Hz
w Frecuencia angular rad/s
Identificación Automática de Acordes Musicales 285 Tesis Doctoral
w0 Frecuencia angular característica de un
modo de vibración (resonancia) rad/s
t Tiempo s
x Variable espacial unidimensional m
ó una de las dos variables espaciales
de un medio bidimensional (placa) m
y Desplazamiento de la vibración de cuerda m
ó una de las dos variables espaciales de
un medio bidimensional (placa) m
z Desplazamiento de la vibración de flexión
de una placa m
fL Fuerza en el extremo de la cuerda de
longitud L. N
uL Velocidad de la vibración en el
extremo de la cuerda de longitud L. m/s
V0 Velocidad inicial de la vibración en el
punto de excitación. m/s
Y0 Desplazamiento inicial de la vibración
en el punto de excitación. m
Ecuaciones y funciones
A,B,C,D Coeficientes genéricos reales de resolución de ecuaciones
Ac,Bc,Cc,Dc Coeficientes genéricos complejos de resolución de ecuaciones
sin seno
cos coseno
tg tangente
sh ó sinh seno hiperbólico
ch ó cosh coseno hiperbólico
th ó tanh tangente hiperbólica
W Función ventana en general (Hanning, Hamming, Kaiser, ...)
Identificación Automática de Acordes Musicales 286 Tesis Doctoral
Intervalos musicales
Octava Relación de frecuencias igual a 2
Semitono Relación de frecuencias igual a . Cada octava tiene 12 semitonos.2 1059463112 = .
Cada semitono supone el cambio de una nota en la escala temperada.
Cent Relación de frecuencias igual a . Cada semitono tiene 100 cents.2 1000577791200 = .
Identificación Automática de Acordes Musicales 287 Tesis Doctoral
REFERENCIAS BIBLIOGRÁFICAS
[Adachi 95] Adachi S. Sato M. “Time-domain simulation of sound production in the brass
instrument” J Acoust Soc Am 1995; 97(6): 3850-3861.
[Afinador] Comunicación particular con el afinador del Teatro Real de Madrid
[Askenfelt 90] Askenfelt A. Jansson E. “From touch to string vibrations. I: Timing in the grand
piano action”. J Acoust Soc Am 1990; 88(1): 52-63.
[Askenfelt 91] Askenfelt A. Jansson E.“From touch to string vibrations. II: The motion of the
key and hammer”. J Acoust Soc Am 1991; 90(5): 2383-212393.
[Askenfelt 93] Askenfelt A. Jansson E. “From touch to string vibrations. III: String motion and
spectra”. J Acoust Soc Am 1993; 93(4): 2181-2196.
[Backus 69] Backus J. The acoustical fundations of music. W.Norton and Co. New York
1969.
[Bank 2002] Bank B.,Poli G.,Sujbert L.”A multirate approach to instrument body modeling
for real time sound synthesis applications”. 112th Convention Audio
Eng. Soc. Munich, Germany, 2002
[Bello 00] Bello JP, Sandler M. “Blackboard system and top-down processing for the
transcription of simple polyphonic music”. Proceedings of the COST G-6
Conference on digital audio effects (DAFX-00), Verona, Italy, 2000:
135-139.
[Benade 76] Benade AH. Fundamentals of musical acoustics. Oxford University Press
1976. N.York 100-352.
[Beranek 71] Beranek LL. Noise and vibration control. McGraw-Hill 1971. Washington.
[Berg 82] Berg RE. The physics of sound. Prentice Hall 1982. N.Jersey 319-332.
[Bilhuber 40] Bilhuber P. Johnson C.A. “The influence of the soundboard on piano tone
quality”. J Acoust Soc Am 1940; 11: 311-320.
REFERENCIAS
Identificación Automática de Acordes Musicales 288 Tesis Doctoral
[Black 00] Black T.R, Donohue K.D. “Pitch determination of music signals using the
generalized spectrum” IEEE 2000: 104-109
[Brown 91] Brown JC.. “Calculation of a constant Q spectral transform”. J Acoust Soc Am
1991; 89(1): 425-434.
[Brown 91] Brown JC. Zhang B. “Musical frequency tracking using the methods of
conventional and narrowed autocorrelation”. J Acoust Soc Am 1991;
89(5): 2346-2354.
[Brown 96] Brown JC. “Frequency ratios of spectral components of musical sounds”. J
Acoust Soc Am 1996; 99(2): 1210-1218.
[Brown 99] Brown JC. “Computer identification of musical instruments using pattern
recognition with cepstral coefficients as features”. J Acoust Soc Am
1999; 105(3): 1933-1941.
[Brown 01] Brown JC. “Feature dependence in the automatic identification of musical
woodwind instruments”. J Acoust Soc Am 2001; 109(3): 1064-1072.
[Chong 99] Chong U.P., Kim K., Lim H. “Piano sound analysis using DSP technology”.
1999, Korus 99, IEEE. 705-708.
[Conklin 96a] Conklin HA. “Design and tone in the mechanoacoustic piano. Part I. Piano
hammers and tonal effects”. J Acoust Soc Am 1996; 99(6):3286-3296.
[Conklin 96b] Conklin HA. “Design and tone in the mechanoacoustic piano. Part II. Piano
structure”. J Acoust Soc Am 1996; 100(2): 695-708.
[Conklin 96c] Conklin HA. “Design and tone in the mechanoacoustic piano. Part III. Piano
strings and scale design”. J Acoust Soc Am 1996; 100(3): 1286-1298.
[Conklin 99] Conklin HA. “Generation of partials due to nonlinear mixing in a stringed
instrument”. J Acoust Soc Am 1999; 105(1): 536-545.
[Cremer 88] Cremer L, Heckl M, Ungar EE. Structure-Borne Sound. Springer-Verlag 1988.
N.York.
REFERENCIAS
Identificación Automática de Acordes Musicales 289 Tesis Doctoral
[Delfs 97] Delfs C. Jondral F. “Classification of piano sounds using time-frequency signal
analysis” Proc.1997 IEEE.
[Delfs 98] Delfs C. Jondral F. “Classification of transient time-varying signals using DFT
and wavelet packet based methods” Proc.1998 IEEE.
[Doyle 89] Doyle JF. Wave propagation in structures. Springer-Verlag 1989. N.York.
[Eronen 00] Eronen A, Klapuri A.. “Musical instrument recognition using cepstral
coefficients and temporal features”. IEEE Workshop on ASPAA. 2000;
753-756
[Eronen 01] Eronen A. “Comparison of features for musical instrument recognition”. IEEE
Workshop on ASPAA. New York. 2001; 19-22
[Fernández
-Cid 98 ] Fernández-Cid P, Casajús-Quirós FJ. “Multi-pitch estimation for polyphonic
musical signals”. Proc.IEEE ICASSP 1998; (6):3565-3568.
[Fletcher 64] Fletcher,H. “Normal vibration frequencies of a stiff piano string”. J.Acoust.
Soc. Am. 1964; 36:203-209.
[Fletcher 98] Fletcher N.H. The physics of musical instruments. Springer-Verlag 1998.
N.York
[Galembo 99] Galembo A, Askenfelt A. “Signal representation and estimation of spectral
parameters by inharmonic comb filters with application to the piano”.
IEEE Transactions on speech and audio processing 1999; 7(2): 197-203.
[Giordano 96] Giordano N, Korty AJ. ”Motion of a piano string: longitudinal vibrations and
the role of the bridge”. J Acoust Soc Am 1996; 100(6): 3899-3908.
[Giordano 97] Giordano N. “Simple model of a piano soundboard”. J Acoust Soc Am 1997;
102(2): 1159-1168.
[Giordano 98a] Giordano N. “Mechanical impedance of a piano soundboard”. J Acoust Soc Am
1998; 103(4): 2128- 2133.
REFERENCIAS
Identificación Automática de Acordes Musicales 290 Tesis Doctoral
[Giordano 98b] Giordano N. “Sound production by vibration piano soundboard: experiment”.
J Acoust Soc Am 1998; 104(3): 1648-1653.
[Gough 81] Gough C.E., “The theory of string resonances on musical instruments”.
Acustica.1981; Vol.49: 124-141
[Hainsworth 01] Hainsworth S.W, Macleod M.D, Wolfe P.J, “Analysis of reassigned
spectrograms for musical transcription”. IEEE Workshop on ASPAA.
New York 2001. 23-26
[Hall 86] Hall D. “Piano string excitation in the case of small hammer mass”. J Acoust
Soc Am 1986; 79(1): 141-147.
[Hall 87a] Hall D. “Piano string excitation II: General solution for a hard narrow
hammer”. J Acoust Soc Am 1987; 81(2): 535-546.
[Hall 87b] Hall D. “Piano string excitation III: General solution for a soft narrow
hammer”. J Acoust Soc Am 1987; 81(2): 547-555.
[Hall 87c] Hall D. Clark P. “Piano string excitation IV: The question of missing modes”.
J Acoust Soc Am 1987; 82(6): 1913-1918.
[Hall 88] Hall D. Askenfelt A. “Piano string excitation V: spectra for real hammers and
strings”. J Acoust Soc Am 1988; 83(4): 1627-1638.
[Hall 92] Hall D. “Piano string excitation. VI: Nonlinear modeling”. J Acoust Soc Am
1992; 92(1): 95-105.
[Keren 98a] Keren R.,Zeevi Y., Chazan D. “Automatic transcription of polyphonic music
using the multiresolution Fourier Transform” 1998. IEEE, 654-657.
[Keren 98b] Keren R.,Zeevi Y., Chazan D. “Multiresolution time-frequency analysis of
polyphonic music” 1998. IEEE, 565-568.
[Kinsler 88] Kinsler LE, Frey AR, Coppens AB, Sanders JV. Fundamentos de acústica.
Editorial Limusa 1988. Mexico.
[Kirk 59] Kirk R.E. “Tuning Preferences for piano unison groups”. J Acoust Soc Am
1959; 31(12): 1644-1648.
REFERENCIAS
Identificación Automática de Acordes Musicales 291 Tesis Doctoral
[Klapuri 99] Klapuri A. “Pitch estimation using multiple independent time-frequency
windows”. IEEE Workshop on ASPAA. New York 1999; 115-118.
[Klapuri 00] Klapuri A, Virtanen T, Holm JM. “Robust multi pitch estimation for the
analysis and manipulation of polyphonic musical signals”. Proceedings of
the COST G-6 Conference on digital audio effects (DAFX-00), Verona,
Italy, 2000:141-146.
[Klapuri 01] Klapuri A, Virtanen T, Eronen A., Seppanen J. “Automatic transcription of
musical recordings” 2001. Web page Tampere University of Technology.
www.cs.tut.fi
[Lambrou 98] Lambrou T. et al. “Classification of audio signals using statistical features on
time and wavelet transform domains”. 1998 IEEE.
[Laroche 94] Laroche, J; Meillier, J. (1994) Multichannel Excitation/Filter Modeling of
Percussive Sounds with Application to the Piano. IEEE Trans. Speech
Audio Process. 2, 329-344
[Lattard 93] Lattard J. “Influence of inharmonicity on the tuning of a piano: Measurements
and mathematical simulation”. J Acoust Soc Am 1993; 94(1): 46-53.
[Laurson 00] Laurson M, Erkut C, Välimäki V. “Methods for modeling realist playing in
plucked string synthesis: analysis, control and synthesis”. Proceedings of
the COST G-6 Conference on digital audio effects (DAFX-00), Verona,
Italy, 2000:183-188.
[Levine 98] Levine S., Verma T., Smith J. “Alias-free, multiresolution sinusoidal modeling
for polyphonic wideband audio” 1997 IEEE workshop on ASPAA.
[Mani 98] Mani R., Namid S. “Integration of DSP algorithms and musical constraints for
the separation of partials in polyphonic music”. 1997 IEEE workshop on
ASPAA.
[Marchand 01] Marchand S, “An efficient pitch-tracking algorithm using a combination of
Fourier transforms”.Proceedings of the COST G-6 Conference on digital
audio effects (DAFX-01), Limerick, Ireland, 2001.
REFERENCIAS
Identificación Automática de Acordes Musicales 292 Tesis Doctoral
[Marolt 00] Marolt M. “Transcription of polyphonic piano music with neural networks”.
Mediterranean Electrotechnical Conference, MeleCon 2000, Vol II.512-
515.
[Martin 47] Martin D.W. “Decay rates of piano tones” J Acoust Soc Am 1948; 19(4): 535-
541.
[Martin 61] Martin D.W.,Ward W.D.”Subjective evaluation of musical scale temperament
in pianos”. J Acoust Soc Am 1961; 33(5): 582-585.
[Martin 98] Martin K.D., “Musical Instrument Identification: a pattern recognition
approach”. 136th meeting of the Acoustical Society of America. 1998.
[Monti 00] Monti G, Sandler M. “Monophonic transcription with autocorrelation”.
Proceedings of the COST G-6 Conference on digital audio effects
(DAFX-00), Verona, Italy, 2000:257-260.
[Noll 67] Noll A.M., ”Cepstrum pitch determination”. J Acoust Soc Am 1967; 41(2):
293-309.
[Ortiz 99] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Application of Wavelet Transform
to a Lossy Compression Algorithm for Coding and Synthesis of Piano
Notes.” 6th Intl. Congress on Sound and Vibration. Dinamarca. July
1999: 359-366
[Ortiz 00] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Application of Wavelet Transform
to Modeling Piano Sound”. 7th Intl. Congress on Sound and Vibration.
Garmisch-Partenkirchen.Germany. July 2000: 3503-3510.
[Ortiz 01] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Identification of Piano Notes Using
Wavelet Transform”. 8th Intl. Congress on Sound and Vibration. Hong-
Kong. China. July 2001:2379-2384.
[Ortiz 02] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Pattern Recognition of Piano
Chords Based on Physical Model”. 112th Convention of the Audio
Engineering Soc. May 2002. Munich.Germany: Paper 5525, 1-5.
[Pielemeier 92] Pielemeier W., Wakefield G. “Time-frequency and time-scale analysis for
musical transcription” 1992. IEEE.
REFERENCIAS
Identificación Automática de Acordes Musicales 293 Tesis Doctoral
[Pielemeier 96] Pielemeier W., Wakefield G. “A high resolution Time-frequency representation
for musical instrument signals”. J Acoust Soc Am 1996; 99(4): 2382-
2396.
[Podlesak 88] Podlesak M. “Dispersion of waves in piano strings”. J Acoust Soc Am 1988;
83(1): 305-317.
[Privosnik 98] Provosnik M., Marolt M. “A system for automatic transcription of music based
on multiple-agents architecture”. 1998 IEEE. 169-172
[Rabiner 77] Rabiner L.R., “On the use of autocorrelation analysis for pitch detection”. IEEE
Transactions on Acoustics, speech and signal processing 1977 (ASSP-
25):24-33.
[Rossi 97] Rossi L. Girolami G. “Identification of polyphonic piano signals” Acustica-Acta
acustica 1997. 83: 1077-1084.
[Rossing 90] Rossing T.D. The science of sound. 2ªed. Addison Wesley. Massachusetts.
1990
[Rossing 95] Rossing T.D. and Fletcher N.H. Principles of vibration and sound. Springer-
Verlag. New York. 1995.
[Smith 95] Smith J. Duyne S. “Overview of the commuted piano synthesis technique” Proc
95 Int.Comp.Music Conf.(ICMC)
[Steinway] Catálogo de pianos de cola. “www.steinway.com”
[Stulov 95] Stulov A. “Hysteretic model of the grand piano hammer felt” J Acoust Soc Am
1995; 97(4): 2577-2585.
[Suzuki 86] Suzuki H. “Vibration and sound radiation of a piano soundboard” J Acoust Soc
Am 1986; 80(6): 1573-1582.
[Terada 94] Terada T. et al., ”Nonstationary waveform analysis and synthesis using
generalized harmonic analysis” IEEE 1994: 429-432.
REFERENCIAS
Identificación Automática de Acordes Musicales 294 Tesis Doctoral
[Walmsley 99] Walmsley P., Godsill S., Rayner P. “Polyphonic pitch tracking using joint
bayesian estimation of multiple frame parameters”. Proc.1999 IEEE
Workshop on ASPAA. New York: 119-122.
[Weinreich 77] Weinreich G. “Coupled piano strings” J Acoust Soc Am 1977; 62(6): 1474-
1484.
[Young 52] Young,R.W. “Inharmonicity of plain wire piano strings”. J Acoust Soc Am
1952; 24: 267- 273.
[Ystad 00] Ystad S. “Sound modeling applied to flute sounds” J.Audio Eng.Soc. 2000;
48;810-825