TESIS DOCTORAL IDENTIFICACIÓN AUTOMÁTICA DE ACORDES MUSICALESoa.upm.es/158/1/LUIS_I_ORTIZ_BERENGUER_2.pdf · 2.3.- revisiÓn sobre clasificaciÓn de sonidos e instrumentos musicales

UNIVERSIDAD POLITÉCNICA DE MADRID

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN

DEPARTAMENTO DE SEÑALES, SISTEMAS Y RADIOCOMUNICACIONES

TESIS DOCTORAL

IDENTIFICACIÓN AUTOMÁTICA DE ACORDES MUSICALES

Autor: Luis I. Ortiz Berenguer. Ingeniero de Telecomunicación

Director: Dr.Francisco Javier Casajús Quirós. Doctor Ingeniero de Telecomunicación por la

Universidad Politécnica de Madrid

Madrid, 2002

CALIFICACIÓN

Tesis Doctoral: IDENTIFICACIÓN AUTOMÁTICA DE ACORDES

MUSICALES

Autor: D. Luis I. Ortiz Berenguer

Director: Dr. Francisco Javier Casajús Quirós

El Tribunal nombrado para juzgar la Tesis Doctoral arriba indicada, compuesto por los

siguientes señores:

Presidente:

Vocales:

Secretario:

Acuerdan otorgarle la calificación de:

Madrid, a

El Secretario del Tribunal

RESUMEN

La identificación automática de acordes musicales es un eslabón en la cadena de la

transcripción automática. Si bien existen varios trabajos sobre identificación de notas (pitch y

fundamental) y sobre detección polifónica y separación de parciales, todavía queda bastante

por resolver, y esta Tesis supone una contribución a la resolución del problema muy especial

de la identificación de acordes de pianos.

El método planteado para la identificación es el del reconocimiento de patrones

espectrales. Hay dos aspectos muy específicos en el método presentado:

a) los patrones espectrales son espectros completos y no sólo parámetros espectrales.

b) los patrones se generan a partir de un modelo acústico simple del piano

Para asegurar la adecuación de los patrones así como la generalidad del método para

otros pianos, el modelo acústico se entrena para cada piano a identificar.

Las características especiales de las notas del piano, hacen que el algoritmo de análisis

usado para extraer los parámetros de entrenamiento, haya tenido que ser desarrollado

específicamente.

Los parámetros de entrenamiento, obtenidos de unas pocas notas, son usados por el

modelo acústico del piano para calcular los parámetros de todas las 88 notas del piano, de los

que se derivan los valores de frecuencia central y anchura espectral de los parciales de los

patrones a generar.

La señal que va a ser identificada se comparará con los patrones con una técnica de

reconocimiento de patrones mediante “pattern-matching”. La comparación se realiza con una

métrica simple consistente en el cálculo del producto interno del espectro de la señal y el

espectro patrón.

Previamente a la identificación, a la señal se le calcula la FFT, se limpia el espectro

mediante una umbralización simple y se realiza una predetección de la banda a la que pertenece

la señal.La predetección permite eliminar ciertas incertidumbres entre patrones de bandas

distintas que tienden a dar métricas altas y crean ambiguedad.

La identificación del acorde exige una identificación iterativa de las diversas notas que

lo componen. En cada iteración, la nota identificada sufre un proceso de validación. Una vez

validada se procede a sustraer su parte del espectro, mediante una máscara, para realizar la

siguiente iteración.

De esta manera se han realizado identificaciones correctas de diversos acordes de 3 y 4

notas pertenecientes a las octavas 1 a 7 del piano, con dos tipos de ejecución: “legato” y

“staccato”.

ABSTRACT

Automatic identification of chords is a part of the transcription problem. Several

contributions about note identification (pitch and fundamental), polyphonic detection and

partials separation have been presented up to today. However, there are still enough issues to

solve and this Thesis presents a contribution to resolve the very specific problem of identifying

piano chords.

The method proposed to carry out the identification is “spectral patterns recognition”.

There are two specific aspects in the method presented:

a) The spectral patterns are full spectra instead of simple spectral parameters

b) The pattern are generated from a simple acoustic model of the piano

The acoustic model is trained for every piano to be identified in order to assure the

fitting of the patterns and that the model is able to be applied to any piano.

The special characteristics of piano note sounds make necessary to develop an specific

analysis algorithm to extract the note parameters during the training.

Training parameters, obtained from a few notes only, are used by the acoustic model of

the piano to evaluate the parameters of the whole 88 notes, which, in turn, allow to calculate

the values of partials central frequency and partials spectral width of the patterns to be

generated.

The signal to be identified is compared to the patterns using pattern-matching.

Comparison is carried out using the inner product as a metric. The inner products of the signal

spectrum and the pattern spectra are performed

Previous to the identification, the FFT of the signal is calculated and its spectrum is

cleaned by a simple thresholding process. Also, a band predetection is evaluated in order to

avoid some ambiguity between bands that occurs in the metric calculation.

Chord identification is carried out by iterative identification of the notes componing to

the chord. During each iteration, the identified note undergoes a validation process. Once the

note is validated, a mask is used to remove the part of the spectrum corresponding to it, to

proceed with the next iteration.

Correct identifications of several three and four notes chords belonging to octaves 1 to

7 have been carried out with this method. Chords identified have been performed in both

“legato” and “staccato” manner.

“En tiempo de desolación nunca hacer mudanza, mas estar firme

y constante en los propósitos...”

S. Ignacio de LoyolaQuinta Regla de discernimiento

de las mociones que en el ánima se causan

Al tesón,

sin el que no es posible acabar una Tesis.

(¿por qué se escribirán casi igual?)

A María Jesús, Ignacio y a mí mismo,

porque al fin tendremos más tiempo para nosotros.

A mis padres,

porque siempre están orgullosos de los logros de sus hijos.

AGRADECIMIENTOS

A María Jesús y a Ignacio

por aguantarme y por muchas cosas más.

A Ricardo Cuenca

del Dpto. Técnico del Teatro Real de Madrid

por hacer posible las grabaciones y facilitarme los medios

A Javier Ortega y Manuel Sobreira

por su gran apoyo en esta Tesis y su amistad

A Vladi, Danilo, Pedrero y Constantino

por resolver mis dudas, y a los dos primeros

también por su labor de revisión y crítica.

A Javier Casajús,

por aceptar ser mi director

y tener las ideas tan claras.

A todos mis amigos, que me han apoyado, y a mis hermanos que no tendrán que seguir

preguntándome por la Tesis en las reuniones familiares.

Madrid, Julio 2002

IDENTIFICACIÓN AUTOMÁTICA DE

ACORDES MUSICALES

TESIS DOCTORAL

Identificación Automática de Acordes Musicales I Tesis Doctoral

ÍNDICE

CAPÍTULO 1: INTRODUCCIÓN . . . . . . . . . . . . . . . . . . 11.1.- PANORÁMICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2.- SOLUCIÓN QUE SE PROPONE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3.- DESCRIPCIÓN GENERAL DEL PROBLEMA . . . . . . . . . . . . . . . . . . . . . . 2

1.4.- DESCRIPCIÓN DEL PIANO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4.1.- ESTRUCTURA BÁSICA DEL PIANO . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.4.1.1.- Elementos vibrantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.4.1.2.- Elemento excitador: “actuador” y martillo . . . . . . . . . . . . . . . . 8

1.4.2.- ASPECTOS ESPECÍFICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.4.2.1.- Cuerdas triples (unísono) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.4.2.2.- Zona de excitación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.4.2.3.- Vibración y afinación del unísono . . . . . . . . . . . . . . . . . . . . . . 10

1.4.2.4.- Ruido de piano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.4.2.5.- Inarmonicidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.4.2.6.- Afinación del piano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4.2.7.- Efecto de carga de la placa resonante . . . . . . . . . . . . . . . . . . . 12

CAPÍTULO 2: REVISIÓN y OBJETIVOS . . . . . . . . . . 152.1.- INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.- REVISIÓN SOBRE HERRAMIENTAS PARA ANÁLISIS DE SEÑALES

MUSICALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.1.- TRANSFORMADA ESPECTRAL DE Q CONSTANTE . . . . . . . . . . 15

2.2.2.- REPRESENTACIÓN TIEMPO-FRECUENCIA DE ALTA

RESOLUCIÓN USANDO DISTRIBUCIÓN MODAL. . . . . . . . . . . . . 15

2.2.3.- “GENERALIZED HARMONIC ANALYSIS (GHA)” . . . . . . . . . . . . 16

2.2.4.- “REASSIGNED SPECTROGRAMS” . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.5.- TRANSFORMADA ONDICULAR (WAVELET) . . . . . . . . . . . . . . . 16

2.2.6.- TRANSFORMADA DE FOURIER . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Identificación Automática de Acordes Musicales II Tesis Doctoral

2.3.- REVISIÓN SOBRE CLASIFICACIÓN DE SONIDOS E INSTRUMENTOS

MUSICALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3.1.- RECONOCIMIENTO Y CLASIFICACIÓN DE LOS TIPOS DE

MÚSICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3.2.- RECONOCIMIENTO Y CLASIFICACIÓN DE INSTRUMENTOS

MUSICALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.4.- REVISIÓN SOBRE DETECCIÓN DEL PITCH Y DEL FUNDAMENTAL 18

2.5.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA . . . . . . . . . . . . . . . . . . . . 18

2.6.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA ESPECÍFICA DE

PIANO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.7.- REVISIÓN SOBRE MODELADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.8.- RESULTADOS PRESENTADOS EN LOS TRABAJOS REVISADOS . . . 23

2.9.- TRABAJO A REALIZAR EN ESTA TESIS . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.9.1.- OBJETIVO GENERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.9.2.- PLANTEAMIENTO DEL MÉTODO . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.9.2.1.- Patrones y Entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.9.2.2.- Identificación de Acordes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.9.2.3.- Acordes y Señales a Identificar . . . . . . . . . . . . . . . . . . . . . . . . 25

2.9.3.- OBJETIVOS CONCRETOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.9.4.- MATERIAL Y GENERALIZACIÓN DE RESULTADOS . . . . . . . . 28

2.9.4.1.- Pianos acústicos y salas de ensayo . . . . . . . . . . . . . . . . . . . . . . 28

2.9.4.2.- Grabación y procesado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.9.4.3.- Señales grabadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.9.4.4.- Generalidad del método: robustez frente a cambio de piano . 30

CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO . 33

3.1.- VIBRACIÓN DE CUERDAS FLEXIBLES . . . . . . . . . . . . . . . . 34

3.1.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN . . . . . . . . . . . . . 34

3.1.2.- SOLUCIONES GENERALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.1.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS Y

AMORTIGUAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Identificación Automática de Acordes Musicales III Tesis Doctoral

3.1.4.- MODOS PROPIOS PARA CUERDA CON EXTREMOS FIJOS . . 36

3.1.5.- EXTREMO IMPEDANTE: CUERDA FIJA-NO FIJA . . . . . . . . . . . 38

3.1.5.1.- Resolución para soporte con impedancia simple . . . . . . . . . . 40

3.1.5.1.1- Frecuencias de Modos propios para impedancia tipo masa 40

3.1.5.1.2- Frecuencia de Modos propios para impedancia resistiva . . 44

3.1.5.1.3- Frecuencia de Modos propios para impedancia tipo

elasticidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.1.5.2.- Frecuencias de Modos propios para impedancia genérica . . . 47

3.1.6.- FRECUENCIAS DE MODOS PROPIOS PARA CUERDA FIJA-

IMPEDANTE Y SOPORTE MULTIMODAL . . . . . . . . . . . . . . . . . . . . . . . . 48

3.1.6.1.- Isb calculado considerando Msb fijo y wosb/wt=1.3 . . . . . . . 52

3.1.6.2.- Isb calculado considerando Msb variable y dos valores de la

relación wosb/wt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.1.6.3.- Efecto de la rigidez ortotrópica en Isb . . . . . . . . . . . . . . . . . . 56

3.1.6.4.- Valores previsibles para la relación wosb/wt . . . . . . . . . . . . . 57

3.1.6.5.- Aplicación al modelo de patrones . . . . . . . . . . . . . . . . . . . . . . 58

3.1.7.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN

ESPECTRAL DE NIVELES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.1.7.1.- Soluciones ante condiciones iniciales simples . . . . . . . . . . . . . 60

3.1.7.1.1- Golpe del martillo “uniforme” e instantáneo . . . . . . . . . . . 61

3.1.7.1.2- Golpe del martillo no uniforme e instantáneo . . . . . . . . . . 62

3.1.7.2.- Condiciones iniciales no simples: Golpe del martillo no

uniforme y no instantáneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.2.- VIBRACIÓN DE CUERDAS CON RIGIDEZ . . . . . . . . . . . . . . 68

3.2.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN . . . . . . . . . . . . . 68

3.2.2.- SOLUCIONES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.2.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS . . . . . . . . . 71

3.2.3.1.- Soluciones para cuerda fija-fija con extremos apoyados en

bordes finos (“pinned by knife edges”) . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.2.3.2.- Soluciones para cuerda fija-fija con extremos abrazados

(“clamped”) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

Identificación Automática de Acordes Musicales IV Tesis Doctoral

3.3.- VIBRACIÓN DE FLEXIÓN DE BARRA RÍGIDA . . . . . . . . . . 74

3.3.1.- ECUACIÓN DIFERENCIAL Y SOLUCIONES . . . . . . . . . . . . . . . . . 74

3.3.2.- CONDICIONES DE CONTORNO: MODOS PROPIOS . . . . . . . . . 76

3.3.3.- VIBRACIÓN DE LA CUERDA CON EXTREMO IMPEDANTE . . 77

3.3.4.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN

ESPECTRAL DE NIVELES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

3.4.- VIBRACIÓN DE UNÍSONOS . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

3.4.1.- UNÍSONOS CON AMORTIGUAMIENTO . . . . . . . . . . . . . . . . . . . . 86

3.5.- VIBRACIÓN DE PLACAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

3.5.1.- PLACA ISÓTROPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

3.5.1.1.- Soluciones para panel infinito . . . . . . . . . . . . . . . . . . . . . . . . . 94

3.5.1.2.- Impedancia de entrada a una placa infinita: impedancia

característica de la placa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.5.1.3.- Soluciones para panel finito . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.5.1.4.- Impedancia de entrada a panel finito . . . . . . . . . . . . . . . . . . . 98

3.5.2.- PLACA ANISÓTROPA: PLACA ORTOTRÓPICA . . . . . . . . . . . . . 98

3.5.2.1.- Soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

3.5.3.- PLACA ORTOTRÓPICA CON COSTILLAS . . . . . . . . . . . . . . . . . 99

3.5.4.- MODOS PROPIOS EN PLACAS NO RECTANGULARES . . . . . 100

3.5.5.- IMPEDANCIA DE PLACAS REALES . . . . . . . . . . . . . . . . . . . . . . 101

3.5.6.- MODELO IMPEDANCIA PLACA . . . . . . . . . . . . . . . . . . . . . . . . . 104

3.5.6.1.- Modelo de “campo próximo aislado” . . . . . . . . . . . . . . . . . . 107

3.5.6.2.- Modelo de “campo próximo tonal” . . . . . . . . . . . . . . . . . . . . 109

3.5.7.- AMORTIGUAMIENTO DE LAS NOTAS Y COEFICIENTE “R”

DE LA PLACA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

Identificación Automática de Acordes Musicales V Tesis Doctoral

CAPÍTULO 4: MODELO . . . . . . . . . . . . . . . . . . . . . . 1154.1.- PARÁMETROS DE DISEÑO DE CUERDAS DEL PUENTE DE AGUDOS115

4.1.1.- COEFICIENTE DE INARMONICIDAD . . . . . . . . . . . . . . . . . . . . . 121

4.1.1.1.- Efecto de un B erróneo en el patrón generado: sensibilidad del

modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

4.1.2.- MODELOS ADAPTABLES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

4.1.3.- AFINACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

4.1.4.- ENTRENAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

4.1.5.- PATRONES ESPECTRALES A GENERAR PARA LA

IDENTIFICACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

4.2.- ALGORITMO DETECCIÓN NOTAS AGUDAS PARA

ENTRENAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

4.2.1.- DETECCIÓN DEL FUNDAMENTAL PARA DETERMINAR

AFINACIÓN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

4.2.2.- DETECCIÓN DEL SEGUNDO PARCIAL PARA CALCULAR B 141

4.2.3.- APLICACIÓN DEL ENTRENAMIENTO AL MODELO . . . . . . . 152

4.3.- MODELO PARA NOTAS GRAVES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

4.3.1.- LONGITUD DE LAS CUERDAS GRAVES . . . . . . . . . . . . . . . . . . 154

4.3.2.- FACTOR DE CARGA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

4.3.2.1.- Densidad lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

4.3.2.2.- Tensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

4.3.3.- INARMONICIDAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

4.3.4.- RADIO EXTERIOR DE LAS CUERDAS GRAVES . . . . . . . . . . . . 159

4.3.5.- ASIGNACIÓN DE VALORES DEL RADIO INTERNO Y

FACTOR DE CARGA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

4.3.6.- COEFICIENTE DE INARMONICIDAD CALCULADO POR EL

MODELO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

4.4.- ENTRENAMIENTO del MODELO DE NOTAS GRAVES . . . . . . . . . . . 164

4.4.1.- RESULTADOS Y VALIDACIÓN DEL ENTRENAMIENTO . . . . 166

4.5.- MEJORA DEL MODELO DE GRAVES . . . . . . . . . . . . . . . . . . . . . . . . . . 169

Identificación Automática de Acordes Musicales VI Tesis Doctoral

4.5.1.- AFINACIÓN DEL PRIMER MODO LONGITUDINAL . . . . . . . . 169

4.5.2.- MANTENIMIENTO DE LA CURVA DE “MASA VIBRANTE” . 171

4.5.3.- MODELO REVISADO: SIN HIPÓTESIS INICIAL DE CURVA

DE TENSIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

4.5.4.- RESULTADOS Y VALIDACIÓN DEL MODELO CON

ENTRENAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

4.6.- OPTIMIZACIÓN DEL ENTRENAMIENTO DEL MODELO DE

GRAVES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

4.6.1.- MODELO CON VARIACIÓN DE LA CURVA DE LONGITUD . 179

CAPÍTULO 5: RECONOCIMIENTO . . . . . . . . . . . . . 1835.1.- MÉTODO DE RECONOCIMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

5.2.- APLICACIÓN DEL MODELO: GENERACIÓN DE PATRONES . . . . . 186

5.2.1.- INARMONICIDAD, AFINACIÓN Y MEDIDA DE PARCIALES . 186

5.2.1.1.- Otras aproximaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

5.2.2.- EFECTO DE LA PLACA RESONANTE . . . . . . . . . . . . . . . . . . . . . 189

5.2.3.- ANCHURA DE PULSOS DE LOS PATRONES . . . . . . . . . . . . . . 190

5.2.4.- MULTIPATRONES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

5.2.5.- ESTRUCTURA DE NIVELES EN LOS PATRONES:

CANTIDAD Y PONDERACIÓN DE PARCIALES . . . . . . . . . . . . . . 195

5.3.- IDENTIFICACIÓN DE NOTAS SUELTAS . . . . . . . . . . . . . . . . . . . . . . . 198

5.3.1.- TÉCNICAS DE PREPROCESADO: LIMPIEZA DEL ESPECTRO

A ANALIZAR. UMBRALIZACIÓN DE NIVELES BAJOS . . . . . . . 198

5.3.2.- RESULTADOS APLICANDO MULTIPATRONES . . . . . . . . . . . . 200

5.3.3.- PREDETECCIÓN DE OCTAVA . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

5.3.3.1.- Predetección mediante transformada ondicular . . . . . . . . . . 204

5.3.3.2.- Predetección mediante zonas y bandas . . . . . . . . . . . . . . . . . 205

5.3.3.3.- Aplicación de la predetección . . . . . . . . . . . . . . . . . . . . . . . . 209

5.4.- RECONOCIMIENTO DE ACORDES: ITERACIÓN Y SUSTRACCIÓN

ESPECTRAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

5.4.1.- MÉTODO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

Identificación Automática de Acordes Musicales VII Tesis Doctoral

5.4.2.- MÁSCARAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

5.4.3.- LÍMITES EN LA IDENTIFICACIÓN DE NOTAS DENTRO DE

UN ACORDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

5.4.3.1.- Sustracción Espectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

5.4.3.2.- Espectro multi-nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

5.4.4.- EVALUACIÓN DE LA DETECCIÓN . . . . . . . . . . . . . . . . . . . . . . 217

5.5.-RECONOCIMIENTO DE ACORDES: VALIDACIÓN DE NOTAS

IDENTIFICADAS EN UN ACORDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

5.5.1.- MÉTODO 1: VALIDACIÓN DE LA ÚLTIMA NOTA

DETECTADA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

5.5.2.- MÉTODO 2: VALIDACIÓN POR ORDENACIÓN DE

CANDIDATOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

5.5.3.- MÉTODO 3: VALIDACIÓN POR ORDENACIÓN ESPECTRAL

DE NOTA DETECTADA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

5.5.3.1.- Resumen de los 3 primeros métodos . . . . . . . . . . . . . . . . . . . 222

5.5.4.-MÉTODO 4: VALIDACIÓN MEDIANTE VERIFICACIÓN

DEL FUNDAMENTAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

5.6.- RECONOCIMIENTO DE ACORDES: ESTRATEGIA DEFINITIVA

DE VALIDACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

5.7.- IDENTIFICACIÓN DE ACORDES CORTOS . . . . . . . . . . . . . . . . . . . . . . 226

5.8.- IDENTIFICACIÓN DE ACORDES DE OTRO PIANO . . . . . . . . . . . . . . 231

CAPÍTULO 6: RESULTADOS Y DISCUSIÓN . . . . . 2336.1.- INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233

6.2.- ALGORITMO DEFINITIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233

6.3.- ACORDES A IDENTIFICAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235

6.4.- TABLAS DE RESULTADOS: ACORDES CERRADOS y LARGOS . . . 236

6.4.1.- ALGORITMO CON VALIDACIÓN ALTA . . . . . . . . . . . . . . . . . . 236

6.4.2.- ALGORITMO CON VALIDACIÓN MEDIA . . . . . . . . . . . . . . . . . 239

6.4.3.- ALGORITMO SIN VALIDACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . 243

6.5.- TABLAS DE RESULTADOS: ACORDES ABIERTOS . . . . . . . . . . . . . . . 246

Identificación Automática de Acordes Musicales VIII Tesis Doctoral

6.6.- TABLAS DE RESULTADOS: ACORDES CORTOS . . . . . . . . . . . . . . . . 247

6.7.- TABLAS DE RESULTADOS: PIANO YAMAHA C3 . . . . . . . . . . . . . . . 249

6.8.- FIGURAS DE PROCESOS DE IDENTIFICACIÓN DE ACORDES . . . . 251

6.8.1.- FIGURAS DE IDENTIFICACIÓN DE ACORDES CERRADOS

LARGOS CON VALIDACIÓN ALTA Y SUSTRACCIÓN [A,P] . . . 251

6.8.2.- NIVELES DE RESIDUOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273

CAPÍTULO 7: CONCLUSIONES . . . . . . . . . . . . . . . . 275

ANEXOS: TABLA de NOTAS y ABREVIATURAS . . . . . 281

BIBLIOGRAFÍA: REFERENCIAS . . . . . . . . . . . . . . . . 287

Identificación Automática de Acordes Musicales 1 Tesis Doctoral

CAPÍTULO 1: INTRODUCCIÓN

1.1.- PANORÁMICA

La detección de señales musicales polifónicas está teniendo amplio tratamiento en los

últimos años [Klapuri 00][Bello 00][Marolt 00][ Brown 99][Fernandez-Cid 98 ]. Sin embargo el

éxito varía mucho con el instrumento y es especialmente complejo en el caso del piano. Es objetivo

de esta tesis aportar elementos a la solución de la identificación de acordes de piano.

La detección polifónica tiene una utilidad directa en la transcripción automática. Dicha

transcripción puede llegar a ser útil para sistemas de escritura musical automática, para sistemas

de conversión forma de onda a MIDI o incluso para identificación automática de fragmentos

musicales.

La escritura musical automática es útil para compositores y músicos pues facilita la

conversión de su tarea creativa a la formalización en papel pautado.

La conversión a MIDI permite obtener archivos reducidos para posterior generación

electrónica de dichos sonidos a partir de muestras del mismo tipo de instrumento o incluso permite

generar sonidos de otros instrumentos a partir de los sonidos del instrumento original. Puede

llegarse como cosa original a obtenerse generación electrónica de acordes de instrumentos cuya

ejecución física los impide (por ejemplo instrumentos de viento). Esto ya se puede hacer a partir



de la ejecución en un teclado MIDI, pero podría llegar a hacerse a partir de una grabación de

música de piano.

La identificación automática de fragmentos musicales tiene aplicación en sistemas de

clasificación automática con interés en generación automática de metadatos para trasmisión o

archivo.

1.2.- SOLUCIÓN QUE SE PROPONE

Se trata de obtener un sistema de identificación automática de acordes. Para ello lo que

se plantea es un sistema de identificación basado en reconocimiento de patrones. La identificación

del patrón más cercano se realizará evaluando medidas de similitud, como la del producto interno

entre la señal y cada uno de los patrones.

Los patrones serán espectrales, más concretamente, se compondrán del valor de las

frecuencias del fundamental y parciales, su anchura espectral y su nivel, lo que permitirá generar

un conjunto de espectros patrones, que serán comparados con el espectro real.

Los patrones se generarán a partir de un modelo. Dicho modelo generará los patrones a

partir de unos pocos parámetros. El modelo y los parámetros tienen en cuenta las ecuaciones y

valores físicos y acústicos del piano. Dichos parámetros podrán ajustarse mediante entrenamiento

para cada piano que vaya a identificarse. Se analizará la posibilidad de considerar parámetros con

variaciones típicas, de forma que se creen varios conjuntos de patrones, evitando así la necesidad

de entrenamiento previo.

Debido a la similitud en valor de frecuencias de parciales de notas separadas una octava,

aparece una fuente de posible confusión en la identificación de patrones, que se evitará mediante

métodos de predetección de octava o incluso de procesado previo de la señal.

1.3.- DESCRIPCIÓN GENERAL DEL PROBLEMA

Para entender el problema de la identificación de acordes de piano, tanto desde el punto

de vista de la complejidad y especificidad del espectro a identificar como de los aspectos a



Fig.1.-Partes del piano [Berg 82]

considerar para la generación de patrones mediante un modelo del piano, conviene presentar una

descripción de dicho instrumento.

1.4.- DESCRIPCIÓN DEL PIANO

El piano está compuesto de varios elementos ensamblados entre sí. La caja o estructura

soporte, la placa resonante, el marco de cuerdas y las cuerdas.

La estructura soporte o caja está hecha de madera de gran densidad e idealmente no



debería vibrar, sin embargo, su rigidez no es infinita y algo de vibración se transite a ella y de ella

se radia como sonido según sus modos propios. Dicha estructura soporte acoge al teclado y a los

mecanismos de acción de los martillos. También pertenece a ella el clavijero, que es una pieza de

madera sobre la que se atornillan las clavijas de tensar (afinar) las cuerdas. La tapa del piano

también es parte de la caja

La placa resonante es unos de los elementos esenciales en la generación y emisión del

sonido. Es una plancha de madera de pícea, un tipo de abeto, con un grosor de alrededor de 1cm.

La plancha se realiza ensamblando entre sí tableros de unos 15cm de ancho conservando la

dirección de la veta. Debido a que la madera tiene un comportamiento anisótropo en lo que a

rigidez se refiere, la dirección de la veta (una de las direcciones de la placa) presenta un módulo

de elasticidad de Young (del orden de 13GN/m2) mientras que la dirección perpendicular presenta

un módulo de elasticidad unas 60 veces inferior como media [Conklin 96b]. Para evitar esta gran

diferencia de valores la placa suele llevar unas costillas o nervios en la dirección perpendicular a

la veta para aumentar la rigidez en dicha dirección [Giordano 97]. Este comportamiento

anisótropo afecta a los valores de los modos propios de la placa.

La placa también lleva adherida a ella un listón de madera que recorre la placa

describiendo una curva. Este listón se denomina puente y es el que transmite la vibración de las

cuerdas a la placa resonante, ya que en la superficie superior tiene contacto con las cuerdas. Los

pianos tienen dos puentes, uno para las notas más graves, denominado “puente de graves” y otro

para las notas medias y agudas, denominado “puente de agudos”.

El marco es un elemento metálico realizado de aleaciones cuya finalidad es soportar las

cuerdas, y más concretamente aguantar la gran tensión que acumulan todas ellas una vez afinado

el piano. La tensión de las cuerdas es casi constante en todas ellas y del orden de 600 N a 800 N,

siendo mayor en las cuerdas de notas graves [Conklin 96b]. Debido a la existencia de 88 notas,

la mayoría de las cuales se producen con un unísono de tres cuerdas, la fuerza total que debe

aguantar el marco que sujete los extremos de las cuerdas es del orden de 200000N,

correspondiente a un peso de 20000kg. Los problemas de deformación son claves en su diseño.

El peso típico de un marco de cuerdas actual es de 170 kg [Conklin 96b].



En el marco también se encuentran las clavijas finales de las cuerdas. En el extremo más

lejano al teclado, esta clavija es fija y solidaria al marco. Además están las piezas donde apoyan

las cuerdas antes de llegar a la clavija y que hacen que la cuerda no roce la superficie del marco

al vibrar. En el extremo más cercano al teclado, las clavijas deben permitir la afinación, por lo que

no son solidarias con el marco sino que lo atraviesan para ir a “morder” la madera del clavijero

que se dispone por debajo de esa parte del marco. Al atravesar el marco por un agujero ceñido al

tamaño de la clavija, las fuerzas laterales debidas a tensión de la cuerda se transmiten al marco que

es quien sujeta la clavija. A este lado del marco también se disponen piezas que separan la cuerda

del marco y que además determinan el comienzo realmente vibrante de la cuerda (trastes y “capo

d’astro”).

Las cuerdas son de acero, la longitud y la densidad lineal varían de nota a nota para

permitir la vibración a la frecuencia adecuada. La densidad lineal se varía modificando la sección

de la cuerda de acero (densidad de material kg/m³ es constante). Por tanto, las cuerdas cambian

de longitud y de radio. La mayoría de las notas usan tres cuerdas. Las notas más graves usan sólo

2 o incluso 1 cuerda, pero son cuerdas con entorchado, un recubrimiento espiral metálico que

incrementa su masa (densidad lineal) sin hacer uso de cuerdas de mayor diámetro. El uso de varias

cuerdas permite conseguir varios aspectos[Benade76]: mayor impedancia de la cuerda con más

propagación de energía a la placa vibrante y obtención del doble decaimiento temporal de las notas

(muy típico del piano) al combinar la oscilación de una frecuencia con otra de frecuencia

ligeramente distinta. Para ello, una de las cuerdas se afina al sonido a conseguir y la otra u otras

dos se afinan ligeramente por encima (apenas unos pocos cents).

Las cuerdas se apoyan en el puente gracias al diseño de este, del marco y de la caja, de

modo que la cuerda queda a ras con él. Unas piezas metálicas permiten la unión firme de la cuerda

al puente de forma que la cuerda describe una ligera curva antes de seguir hacia la clavija fija del

marco. Esa curva permite minimizar la propagación de energía hacia el trozo restante de la cuerda.

Puede decirse por tanto que la longitud vibrante de la cuerda está delimitada por el traste del

marco cerca de las teclas y por el puente en el otro extremo. Esto no es del todo cierto y el

sobrante de cuerda posterior al puente suele amortiguarse con un trozo de fieltro.



Fig.2.-Elementos esenciales que establecen el principio de funcionamiento de un piano. Se muestra una seccióna lo largo de una cuerda. La izquierda corresponde a la zona cercana a las teclas del piano.

La cuerda es accionada por el martillo, que controlado por la tecla y el mecanismo

(denominado “acción” o “accionador”) impacta sobre el grupo de cuerdas de la nota provocando

la vibración al unísono de las dos o tres cuerdas. Se suele denominar “unísono” al conjunto de

cuerdas de una nota. El accionador incluye una pieza con fieltro (“apagador”) que se apoya sobre

las cuerdas una vez que la tecla se suelta y que provoca la extinción más rápida de la nota. Si dicha

pieza no apoyase, como ocurre al pisar el pedal de “sustain”, la cuerda seguiría vibrando incluso

después de soltar la tecla, permaneciendo su sonido durante el tiempo correspondiente.

1.4.1.- ESTRUCTURA BÁSICA DEL PIANO

La figura 2 muestra el principio básico de la estructura del piano.

1.4.1.1.- Elementos vibrantes

Una cuerda, realmente un hilo de acero, se fija por los dos extremos a un marco rígido de

metal. Uno de los extremos (el de la derecha en la figura 2) se une al marco de forma fija. El otro

extremo se une a un tornillo que está enroscado en una pieza de madera anexa al marco por debajo

de él, denominada clavijero. Este tornillo sirve para ajustar la tensión de la cuerda y así su

afinación. La cuerda queda apoyada, en este lado, en un punto del marco cercano al tornillo de

afinación que puede estar implementado de dos maneras, recibiendo en cada caso la denominación

de “agraffe” o de “capo d’astro”.

Cerca del extremo que está unido fijo al marco, se sitúa por debajo de la cuerda, una barra

de madera que está unida a la placa resonante del piano y que se denomina puente. La vibración

de la cuerda se transmite a través de ella a la placa, que actúa de diafragma emisor (placa



Fig.3.-Vista de un piano* con los elementos fundamentales reseñados

Fig.4.-Agraffe. Las notas graves y medias apoyan lacuerda al marco mediante unas piezas solidarias aeste, que disponen de agujeros por los que pasa lacuerda. Al estar a un nivel inferior que los tornillosde afinación, la cuerda se apoya en dichas piezas enla parte superior del agujero. La posible vibración deltramo de cuerda entre estas piezas y los tornillos seamortigua mediante un material absorbente (colorrojo)

Fig.5.-Capo d’astro. En las notas más agudas, elagraffe no existe y el apoyo se realiza en la parteinferior de la pieza del marco metálico quetrascurre por encima de las cuerdas. El materialamortiguador (color rojo) elimina la vibracióndel tramo de cuerda desde el capo d’astro hastael tornillo de afinación.

resonante o “soundboard”). Una pieza metálica con dos vástagos fijan el puente a la cuerda,

haciendo que el conjunto de cuerda y placa estén mecánicamente acoplados. Esa misma pieza

hace que el resto de la cuerda se comporte como una cuerda independiente, aunque acoplada a

la primera. La vibración de este segundo tramo de cuerda se amortigua. En definitiva, suele

considerarse que la cuerda acaba en el puente.

*Piano de cola Yamaha usado para la

grabación en el Teatro Real de Madrid.

Fotografías tomadas por el autor.



1.4.1.2.- Elemento excitador: “actuador” y martillo

La vibración es excitada mediante el golpe de un martillo de fieltro en la cuerda. La

amplitud de la vibración es proporcional a la velocidad con que el martillo golpea la cuerda, la que

a su vez es proporcional a la fuerza con que el pianista pulsa la tecla.

El martillo es una pieza de madera recubierta de fieltro que va pegado a aquella y que tiene

una forma redondeada por donde impacta con la cuerda.

El sonido producido depende de la forma concreta de dicha zona de impacto así como del

estado de la superficie del fieltro (más o menos rígido). Si la superficie es dura se acentúan los

armónicos superiores de la vibración de la cuerda y el sonido resultante es más brillante. La

superficie del fieltro se puede endurecer mediante el tratamiento del fieltro con un hierro caliente.

Si la superficie es blanda, los armónicos superiores se reducen de nivel y el sonido es más suave.

La superficie del fieltro se puede ablandar pinchándola con alfileres [Backus 69]. El mecanismo

del martillo debe permitir diversas funciones [Backus 69]:

-El martillo debe impactar la cuerda cuando el pianista pulse la tecla.

-Una vez excitada la cuerda, el martillo no debe seguir en contacto con la cuerda, pues

amortiguaría la vibración. Así pues, el martillo debe retroceder a su posición inicial.

-En el caso de que el pianista mantenga pulsada la tecla, el martillo que ha retrocedido, no

debe volver a impactar sobre la cuerda.

-Si el pianista vuelve a pulsar la tecla rápidamente, el martillo debe volver a impactar sobre

la cuerda. Esta acción debe poderse hacer incluso aunque la tecla no haya retrocedido a

su posición de reposo sino que bastará que la tecla haya subido la mitad de su recorrido.

- La vibración de la cuerda persistirá hasta que la tecla vuelva a su posición inicial (no

pulsada), en ese momento se extinguirá la vibración (más o menos rápidamente) mediante

un elemento amortiguador (denominado “apagador”)

La figura 6 muestra un mecanismo actuador (“action”) que consigue lo indicado

anteriormente. Este mecanismo está asociado a cada tecla y en un piano existen tantos como

teclas. La explicación del funcionamiento queda fuera del interés de este trabajo y puede

encontrarse en varios textos [Backus 69] [Askenfelt 90][Askenfelt 91].



Fig.6.-Mecanismo accionador o actuador de un piano de cola [Backus69]

1.4.2.- ASPECTOS ESPECÍFICOS

El piano presenta además ciertos aspectos muy específicos que conviene resaltar, de

momento de manera somera al tratarse de una introducción..

1.4.2.1.- Cuerdas triples (unísono)

Aunque la base es la excitación de una cuerda, la realidad es que la mayoría de las notas

de un piano se obtienen por la excitación simultánea de tres cuerdas con afinación muy parecida

pero no igual entre ellas (figura 7).

Las notas más graves son las que presentan una agrupación de sólo dos cuerdas o incluso

sólo una (figura 8). La agrupación de cuerdas en una nota se denomina unísono.

1.4.2.2.- Zona de excitación

La posición de la cuerda donde el martillo impacta también afecta a la vibración y por tanto

al sonido producido. La posición de excitación en los pianos suele situarse entre un séptimo y un

octavo de la longitud en gran parte del rango de las notas. La razón de la elección es simplemente

de calidad subjetiva del sonido obtenido frente a otras posiciones probadas por los fabricantes.



Fig.7.-Unísonos de notas medias y agudascon cuerdas triples. [Piano de cola Yamahadel Teatro Real de Madrid. Fotografías delautor]

Fig.8.- Unísonos de notas graves con cuerdassimples y dobles

Se sabe que los parciales cuya vibración defina un nodo en el punto de excitación, no serán

excitados. Por tanto, parece deducirse que el séptimo u octavo parcial no serían excitados. Sin

embargo, el martillo no excita un solo punto de la cuerda sino una cierta zona por lo que el

resultado real es que sí se excitan los parciales séptimo y octavo, aunque con menor nivel. Un

estudio detallado aparece en [Hall 87c]. También la dimensión del martillo afecta a que ciertos

parciales se exciten con menor nivel [Benade 76].

1.4.2.3.- Vibración y afinación del unísono

Si se deja que la vibración desaparezca por sí misma, es decir, si no se suelta la tecla y no

actúa el elemento apagador, una parte de la energía se disipa por fricción con el aire y la otra parte

se transmite a la placa resonante del piano [Backus 69]. También se sabe que la extinción de la

vibración se realiza en dos tramos, primero decrece rápidamente y luego más despacio [Weinreich

77]. Esta característica se debe a que la afinación de las tres cuerdas de cada nota se realiza para

conseguir dicho efecto. Si se afinara para obtener una única pendiente de caída, el sonido no

parecería de piano [Afinador 00]. Por tanto, la afinación de las tres cuerdas que pertenecen a cada

nota, se realiza de modo que haya una cierta diferencia de afinación entre cada una de las tres. Es

lo que se denomina la afinación del unísono. Esta afinación asegura el decrecimiento de niveles

indicado anteriormente y la prolongación de la duración de la vibración. Los test de escucha



seguidos indicaban que las cuerdas de una misma nota deben afinarse con una separación de pitch

entre 1 y 2 cents [Backus 69] [Kirk 59].

1.4.2.4.- Ruido de piano

La vibración del piano va acompañada de considerable cantidad de ruido. Dicho ruido se

debe principalmente al mecanismo: La pulsación de la tecla supone un ruido del dedo contra la

tecla y de la tecla contra el marco del teclado, el golpe del martillo sobre la cuerda no sólo la

excita sino que provoca un cierto ruido, el mecanismo actuador con sus diversas piezas provoca

ruidos durante su uso, a pesar de estar recubiertas de fieltro.

Este ruido no suele ser fácilmente identificable por el oyente, pero su ausencia en una señal

sintetizada, provoca una clara diferencia de sonido respecto al original [Backus 69].

1.4.2.5.- Inarmonicidad

Las cuerdas del piano no reaccionan como cuerdas perfectamente elásticas, cuya fuerza

recuperadora se debe sólo a la tensión. En realidad, la cuerda presenta una rigidez, especialmente

alta por estar fabricadas de acero. Al ser curvada por el choque del martillo, la fuerza de

recuperación no sólo depende de la tensión, sino también de la rigidez, lo que modifica la ecuación

diferencial de la vibración.

En general, la aportación de la rigidez incrementa la fuerza de recuperación, aumentando

la aceleración de la cuerda y aumentando así la frecuencia de la vibración de todos los parciales.

Además, la fuerza de recuperación debida a la rigidez es mayor a mayor curvatura de la cuerda,

lo que provoca que las oscilaciones de mayor frecuencia (al provocar una curvatura mayor que

las de baja frecuencia) presenten aún mayor frecuencia. Por eso, los distintos parciales van

incrementando su frecuencia respecto al valor de frecuencia armónica, lo que hace que la

distribución de parciales no sea armónica. Este comportamiento se denomina “inarmonicidad”.

La inarmonicidad es una característica inherente al sonido del piano, sin embargo no debe

llegar a ser excesiva. Se ha comprobado que la inarmonicidad depende de la longitud de la cuerda,

siendo mayor si la cuerda es más corta [Fletcher 63]. Así, hay diferencias de sonido entre pianos



de cola larga y otros pianos, especialmente en notas graves, debido a que los de cola tienen

cuerdas más largas, presentando menor inarmonicidad. El efecto sobre la percepción de las notas

más graves se acentúa si tenemos en cuenta que la frecuencia fundamental de dichas notas apenas

es radiada y además es percibida por el oido con menor sensibilidad, por lo que debe ser

reconstruirla por diferencia entre el segundo y tercer parcial (efecto no lineal del oido). A mayor

cantidad de inarmonicidad, menos se parecerá dicha resta al valor real del fundamental realmente

emitido.

1.4.2.6.- Afinación del piano

La existencia de inarmonicidad provoca que los parciales superiores de una nota no

coincidan con los fundamentales de notas más altas, lo que suele considerarse necesario para una

sensación de sonido armónico. Para remediar dicha situación las notas se afinan “desafinadas”

respecto al valor teórico de la escala temperada. Esta característica muy propia del piano es

dependiente de la inarmonicidad de las cuerdas, la cual a su vez depende de las longitudes, por lo

que la afinación suele ser distinta entre pianos [Afinador 00][Lattard 93].

1.4.2.7.- Efecto de carga de la placa resonante

Las cuerdas no están fijas en sus dos extremos. El extremo del puente presenta una

impedancia mecánica alta pero no infinita, lo que modifica las condiciones de vibración de las

cuerdas. El efecto es que la frecuencia de cada parcial depende también de la impedancia vista en

el puente. Dicha impedancia es fundamentalmente la de la placa resonante modificada en valor por

el efecto de adaptación de impedancias mecánicas producido por el propio puente

Una segunda consecuencia de que el extremo no sea fijo es que la impedancia que se ve

en el puente incluye el efecto de la impedancia presentada por el resto de las cuerdas.



CAPÍTULO 2: REVISIÓN Y OBJETIVOS


CAPÍTULO 2: REVISIÓN y OBJETIVOS

2.1.- INTRODUCCIÓN

En este capítulo se hace una presentación de documentación existente sobre aspectos

relevantes en Tesis que se presenta. Como conclusión se exponen las líneas del trabajo que se

realiza en esta Tesis, indicando los objetivos y los aspectos claves de los métodos.

2.2.- REVISIÓN SOBRE HERRAMIENTAS PARA ANÁLISIS DE

SEÑALES MUSICALES

2.2.1.- TRANSFORMADA ESPECTRAL DE Q CONSTANTE

Este método usa una transformada cuyo resultado equivale al uso de un banco de filtros

de hasta 1/24 de octava [Brown 91].

2.2.2.- REPRESENTACIÓN TIEMPO-FRECUENCIA DE ALTA RESOLUCIÓN

USANDO DISTRIBUCIÓN MODAL.

Partiendo de la idea de la distribución Wigner se obtiene una mejora del análisis de

transitorios frente a métodos con ventanas como transformadas de Fourier o transformadas de Q

constante [Pielemeier 96].



2.2.3.- “GENERALIZED HARMONIC ANALYSIS (GHA)”

Es un análsis tiempo-frecuencia. Resulta útil para señales no estacionarias. Presenta mayor

resolución espectral que transformada de Fourier con tramos cortos de señal, evitando el

efecto del enventanado.[Terada 1994]

2.2.4.- “REASSIGNED SPECTROGRAMS”

Realiza una extracción de características que permite clasificar los espectros como :

sinusoide, transitorio o ruido. De esta manera facilita la búsqueda de parciales.

[Hainsworth 2001].

2.2.5.- TRANSFORMADA ONDICULAR (WAVELET)

En la línea de transformadas de Q constante pero con más libertad de elegir la

transformación mediante la selección de la ondícula madre. La representación es tipo

tiempo-frecuencia pero con la salvedad de que la frecuencia viene representada

indirectamente por el término “escala”. Se han realizado aplicaciones en esta tesis para

analizar sonidos de piano, diseñando una ondícula madre a partir de un tramo de nota de

piano. [Ortiz 00] [Ortiz 01]

2.2.6.- TRANSFORMADA DE FOURIER

Es el método por defecto. Sus inconvenientes pueden ser despreciados si los tramos a

analizar son suficientemente largos para que la resolución espectral sea suficiente y la

ventana es adecuada a la aplicación que se busca. Si se requiere representación tiempo-

frecuencia se recurre a la implementación de STFT

2.3.- REVISIÓN SOBRE CLASIFICACIÓN DE SONIDOS E

INSTRUMENTOS MUSICALES

2.3.1.- RECONOCIMIENTO Y CLASIFICACIÓN DE LOS TIPOS DE MÚSICA

Se ha presentado un trabajo [Lambrau 98] usando para identificar tipos de música (rock,

jazz,..) usando transformada ondicular y una posterior extracción de características estadísticas

para realizar una clasificación usando reconocimiento de patrones de dichas características



obtenidas en entrenamiento previo.

2.3.2.- RECONOCIMIENTO Y CLASIFICACIÓN DE INSTRUMENTOS MUSICALES

El uso de coeficientes cepstrales para reconocimiento de instrumentos de viento-madera

ha sido presentado en varios trabajos [Brown 98][Brown 99] [Brown 01] incrementando cada uno

el número de instrumentos incluidos en el reconocimiento hasta llegar a incluir saxofón, oboe,

clarinete y flauta.

Una sofisticación en el reconocimiento de instrumentos es la identificación de entre varios

instrumentos distintos del mismo tipo. Así, en el caso del piano se han analizado diversos métodos

para identificar un piano respecto a otro. El entrenamiento establece patrones de cada piano para

su posterior reconocimiento. Se han realizado pruebas usando transformaciones tiempo-frecuencia

(STFT, wavelet, wavelet packet,...) [Delfs 97] y también extrayendo características del ataque

[Delfs 98].

La generalización del reconocimiento a cualquier instrumento supone un incremento de

posibilidades que sugiere el uso de un método jerarquizado. Se ha propuesto una metodología de

tres niveles [Martin 98]

Nivel 1: Identificar si es un instrumento tocado en pizzicato o en sostenido

Nivel 2: Identificar la familia

Nivel 3: Identificar el instrumento

No se incluye el intento de reconocer entre dos instrumentos iguales.

El uso de coeficientes cepstrales y características temporales tratados estadísticamente se

ha usado en un trabajo [Eronen 00] que ha entrenado e identificado 30 instrumentos distintos

incluso con distintos estilos de excitación. El resultado ha sido ampliado incluyendo predicción

lineal y coeficientes cepstrales mel-frecuencia [Eronen 01].



2.4.- REVISIÓN SOBRE DETECCIÓN DEL PITCH Y DEL

FUNDAMENTAL

Este es un problema ampliamente trabajado y resuelto con mayor o menor éxito

dependiendo del instrumento, siendo el piano el más complicado.

Los métodos más tradicionales son el uso de la autocorrelación [Rabiner 77] y el uso de

cepstrum [Noll 67].

El uso de análisis tiempo-frecuencia con transformadas enventanadas combinadas se ha

presentado [Klapuri 99 ] como método con suficiente precisión en las octavas 3 y siguientes,

mientras que presentan evidente limitaciones en octavas bajas al depender de la longitud de las

ventanas. Para la identificación del pitch, y de la nota en definitiva, se afirma que es suficiente

detectar la frecuencia del fundamental con un error inferior a un semitono.

Los métodos tradicionales de autocorrelación y cepstrum se han comparado con el uso de

Espectro Generalizado [Black 00] usando ventanas de sólo50ms con overlap de 50%, para

sonidos de tuba, flauta, violín y piano consistentes en una nota repetida durante 5 segundos (sólo

las notas C2,C3 y C4) y los resultados no han sido mejores para el espectro generalizado que para

los tradicionales

También se ha usado la autocorrelación como parte de algoritmos de detección

monofónica más sofisticados [Monti 00]

2.5.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA

El uso de métodos de identificación de pitch usados iterativamente para detectar 2 notas

simultáneas [Klapuri 98] [Klapuri 99] exige realizar una sustracción espectral de la primera nota

detectada antes de realizar la detección de la otra nota.

Otros métodos no usan la identificación iterativa pues ésta presenta problemas cuando

la sustracción espectral no es buena y permanecen parciales altos de las notas ya detectadas, que



a su vez parecen nuevas notas a ser detectadas.

La discriminación de parciales de más de una nota simultánea, cuya separación es inferior

a la que existe entre parciales de una misma nota o que incluso llegan a coincidir, es una de las

tareas a las que más esfuerzo se ha dedicado. Así, se han probado métodos como:

-La interpolación espectral para aumentar la resolución de una FFT [Mcleod 98]

-La detección de parciales cuyo orden es número primo para poder discriminar entre notas

relacionadas armónicamente [Klapuri 98],

-Transformada de Fourier Multiresolución que calcula varias representaciones tiempo-

frecuencia de la señal mediante transformada de Fourier (STFT) con longitud de ventana

variable [Keren 98]. El análisis conjunto de las diversas transformadas a distintas

resoluciones permite obtener conclusiones.

-El modelo sinusoidal multiescala [Fernández-Cid ] realiza una labor parecida pero las

diversas transformadas de Fourier se calculan sobre las salidas de un banco de filtros que

realiza una transformada ondicular (“wavelet”) de 4 escalas. Una vez más, la

discriminación de parciales y sus notas exige un análisis posterior de dichas medidas.

El tratamiento estadístico del problema tiene una referencia en el uso del modelo de

sinusoides armónicas con análisis Bayesiano y estimación de parámetros mediante MCMC

(“Markov Chain Monte Carlo”) [Walmsley 99]. Partiendo de la afirmación de que los métodos

con coeficientes cepstrales no son útiles para polifonía y considerando que las frecuencias útiles

para definir la nota existen a lo largo de mucho tiempo (no desaparecen pronto ni aparecen de

repente, no son transitorias sino estacionarias), se propone analizar su comportamiento estadístico

a lo largo de muchos “frames” de análisis tiempo-frecuencia. Dicho análisis puede hacerse con

probabilidades condicionadas a apariciones en frames anteriores mediante método bayesiano. Las

búsquedas del método persiguen obtener conclusiones según un orden, primero determinar el

número de notas que suenan, luego el número de armónicos de cada nota. Su ventaja es que se

puede intentar aplicar a cualquier instrumento.

En la línea de planteamientos de gran complejidad computacional y de sistemas

inteligentes, se han descrito:



-Análisis tiempo-frecuencia adaptativo para alta resolución. Cada valor asociado a un par

de las variables tiempo-frecuencia se obtiene mediante un filtro que maximiza una medida

de concentración de energía local tipo Kurtosis [Jones 90]. Este método presenta graves

problemas computacionales.

-Siguiendo con la idea anterior de adaptar filtros del análisis tiempo-frecuencia, se puede

recurrir a técnicas de inteligencia artifical tipo IPUS(“Integrated Processing and

Understanding of Signal” [Lesser 95]) para aplicar el conocimiento sobre sonidos

musicales al ajuste de los filtros. Se ha presentado un método con filtros gausianos de Q

constante aplicado a sonidos de 2 notas [Mani 98].

2.6.- REVISIÓN SOBRE DETECCIÓN POLIFÓNICA ESPECÍFICA DE

PIANO

El problema de identificación polifónica en pianos no sólo reside en el método de análisis

de la señal sino también en el proceso de decisión a partir de dichas medidas. Tener buenas

representaciones tiempo-frecuencia no es suficiente para realizar una buena detección de las notas

del sonido polifónico (por ejemplo, acorde)

La detección de notas y polifonía en piano haciendo uso de un método de identificación

respecto a bases de datos espectrales ha sido probada [Rossi 97], si bien la base de datos usada

requería el análisis previo de todas las notas del piano en concreto, por lo que se pierde toda

generalidad. Del análisis tiempo-frecuencia mediante transformada de Fourier (STFT) de todas

las notas se extraen los valores de las frecuencias de los parciales, lo que constituye la base de

datos. En la identificación, se calcula la STFT de la señal y se extraen los valores de frecuencia de

los máximos locales. Dichos valores son los que se comparan con la base de datos. Este tipo de

extracción de datos espectrales en función simplemente de máximos presenta serios errores para

notas de piano de octavas altas, como se explicará más adelante. Además, los datos de la base no

pueden considerarse suficientes para establecer un patrón espectral.

Estudios que persiguen la detección polifónica específica de piano y hacen uso de técnicas

de inteligencia artificial y redes neuronales son:



-El uso de multiagentes para implementar un mecanismo de percepción para el

reconocimiento de las notas [Privosnik 98]. Se aplica sobre los datos obtenidos en un

análisis tiempo-frecuencia previo. El estudio presentado no usaba un buen análisis tiempo-

frecuencia y propone mejorarlo mediante uso de transformada ondicular. Sólo presentaba

éxito con algunas notas del piano.

-Las redes neuronales se proponen en un trabajo [Marolt 00] con un método más

complicado de análisis espectral. Primero se realiza un análisis tiempo-frecuencia con un

modelo auditivo (modelo cloquear) que incluye filtrado multibanda. Las salidas de los

filtros atacan a unos osciladores adaptativos que emulan una señal lo más parecida pero

sólo con sinusoides. Esta fase es denominada “partial tracking”. Se usan 88 osciladores

cada uno delos cuales ataca a un circuito neuronal que es el que realiza el reconocimiento

en base a unos patrones desarrollados por él mismo durante la fase de entrenamiento.

Las bondades de este método son un 99% de aciertos en acordes de notas de octavas altas

y un 96% en acordes de notas graves. Los inconvenientes son: persisten los errores por

confusión entre octavas (notas separadas un número entero de octavas), se han requerido

400000 acordes para el entrenamiento, los osciladores adaptativos están ajustados a la

frecuencia teórica de las notas del piano ( es decir, no consideran la afinación tan específica

del piano que llega a suponer variaciones de hasta 40 cents en algunas notas) y que los

osciladores incluyen una serie de subosciladores que implementan los parciales que están

ajustados a frecuencias armónicas (es decir, no se tiene en cuenta la marcada

inarmonicidad de las notas del piano). Otro gran inconveniente es que el trabajo reconoce

que para el entrenamiento y los reconocimientos ha usado sonidos sampleados tomados

de un CD y que los acordes no estaban sampleados sino que los han compuesto

sintéticamente a partir de las notas sampleadas. En resumen, no se han hecho pruebas del

sistema con sonidos directos de un piano ni con acordes ejecutados como tales por un

pianista.



2.7.- REVISIÓN SOBRE MODELADO

El uso de modelos para generar patrones de diversos tipos para comparar con el sonido

a analizar y determinar las notas existentes es otra línea de solucionar el problema. Bien es cierto

que muchos de los modelos son presentados como modelos para síntesis de sonidos de un cierto

instrumento.

Sobre modelado de instrumentos de viento pueden resaltarse los trabajos sobre simulación

de la producción de sonido en el dominio temporal de los instrumentos de viento-metal (excitados

por la vibración de los labios) [Adachi 95] y el modelado de flauta [Ystad 00].

El modelado del piano ha tenido menos resultados debido a su gran complejidad. Existen

varios trabajos que describen el comportamiento físico y acústico del piano y de los que se pueden

sacar elementos para desarrollar un modelo. De ellos se irá dando cuenta a lo largo de la

explicación del modelo diseñado en esta Tesis. Trabajos que se refieran al uso de modelos para

síntesis (aplicables a generación de patrones) y para reconocimiento de piano son:

-Modelado tipo excitación múltiple y filtrado [Laroche 94]. No consigue buenos

resultados para piano ni siquiera considerando la existencia de sonidos tipo percusivos.

-Modelado tipo excitación y filtrado pero con la técnica de “conmutación” que permite

intercambiar la posición de excitadores y filtros del sistema resonante de modo que se

pueden tener excitaciones previamente filtradas formando una tabla de ondas [Smith 95].

La limitación es que al tener el martillo real un comportamiento no lineal, la conmutación

no puede realizarse tan “transparentemente”. El trabajo presentado indica la realización

de síntesis polifónica de hasta 2 notas.

El modelado espectral tampoco ha tenido mucha atención:

-Modelado del espectro de piano mediante pulsos con la forma de la función de

distribución de Cauchy [Chong 99].

Existen trabajos que desarrollan modelos parciales, referidos a ciertos detalles del piano,

a los que se irá haciendo referencia a lo largo de esta Tesis



2.8.- RESULTADOS PRESENTADOS EN LOS TRABAJOS REVISADOS

De los trabajos revisados, ninguno ha presentado resultados para el margen completo de

notas del piano ni para un amplio rango de acordes. Ninguno presenta pruebas con acordes de 4

notas y apenas unos pocos usan acordes de tres notas. La discriminación de tan sólo dos notas

parece ser un problema suficientemente complejo para la mayoría de los métodos presentados.

Por otro lado muy pocos trabajos con pruebas sobre sonidos de piano se han realizado con

sonidos de pianos grabados directamente por los investigadores. En muchos casos se ha recurrido

a archivos de muestras de notas sueltas. No queda claro si dichos archivos han sido previamente

limpiados, en base a decisión humana, de elementos que acompañan a sonidos reales y que pueden

suponer una fuente de confusión para los sistemas de reconocimiento automáticos “on-line”. En

algunos casos se reconoce incluso que los acordes no fueron ejecutados como tales sino

sintetizados mezclando varias notas sueltas.

Algunos métodos requieren entrenamiento excesivo (redes neuronales y otros de

inteligencia artifical), otros requieren de un entrenamiento razonable y algunos aparentemente no

requieren de entrenamiento, pero implementan en la etapa de decisión conocimientos previos,

sobre los sonidos musicales, desarrollados o conocidos por quien elabora el método.

Los únicos trabajos que han indicado claramente que usen diversos pianos para las pruebas

son los trabajos que intentan identificar un piano frente a otro, pero sin identificar notas ni acordes.

Los pianos muestran suficientes diferencias entre ellos que afectan a la distribución espectral de

los parciales de las notas, entre ellas las más notables: afinación y curvas de longitud y radio de

las cuerdas que afectan a la inarmonicidad.



2.9.- TRABAJO A REALIZAR EN ESTA TESIS

2.9.1.- OBJETIVO GENERAL

Se va a desarrollar un sistema de identificación de acordes de 3 y 4 notas aplicado

principalmente al piano, basado en un sistema de reconocimiento de patrones generados por un

modelo.

2.9.2.- PLANTEAMIENTO DEL MÉTODO

A continuación se describe el método que se propone usar para conseguir el objetivo

general.

2.9.2.1.- Patrones y Entrenamiento

Los patrones para identificar las notas y acordes, son generados por el propio sistema

durante una etapa de entrenamiento. Los patrones consisten en espectros de las notas con varios

parciales centrados en las frecuencias adecuadas y con los anchos adecuados. Dado que la bondad

del método depende del número de notas entrenadas, se ha intentado llegar a un compromiso pues

no resulta razonable plantear que el entrenamiento exija el uso de todas las notas.

Los patrones no se generarán simplemente a partir de los datos medidos durante el

entrenamiento, sino que dichos datos serán procesados mediante la aplicación de un modelo que

tendrá en cuenta aspectos físicos, acústicos y de diseño de pianos. De esta manera se podrá

obtener una extrapolación de los datos de unas pocas notas usadas en el entrenamiento, para

generar fiablemente los patrones de las 88 notas del piano.

La validez del proceso de entrenamiento podrá verificarse, opcionalmente, con la

identificación de notas sueltas, antes de proceder a la identificación de acordes. Así, el método

sirve para identificar tanto acordes (polifonía) como notas sueltas (monofonía)

El entrenamiento asegura la validez del método de identificación para pianos distintos. Se

estudiará el uso de un modelo único para intentar identificar acordes de varios pianos y se

comprobará si el entrenamiento es necesario.



2.9.2.2.- Identificación de Acordes

La identificación de acordes se realizará mediante una identificación iterativa de las

diversas notas que lo componen, realizando una sustracción espectral de cada nota identificada.

La sustracción espectral se realizará en base a una máscara calculada de forma análoga al

patrón correspondiente a la nota identificada. Esto puede dejar restos de parciales en la señal, pues

tanto las máscaras como los patrones usados para reconocer, tienen un número de parciales

suficiente pero no siempre completo (especialmente en graves). En caso de residuo excesivo, el

sistema generaría unas máscaras extendidas para realizar la sustracción espectral.

Para eliminar los problemas de ambigüedad entre octavas que aparecen al comparar una

señal con patrones de todas las octavas, se realiza una predetección del rango de la octava para

disminuir el número de patrones usados en el reconocimiento eliminando los que puedan causar

problemas de ambigüedad. Esta predetección puede crear problemas en la identificación de los

acordes abiertos (los que tienen las notas repartidas en dos octavas consecutivas).

2.9.2.3.- Acordes y Señales a Identificar

Las notas y los acordes a identificar serán de todas las octavas del rango del piano, tanto

de graves como de octavas altas. Se identificarán diversos tipos de acordes, entre ellos: mayores,

menores, con séptima disminuida, cerrados y abiertos. El uso de acordes de más de 4 notas es

poco frecuente y no se considera objetivo de esta Tesis. La polifonía debida a dos manos, típica

en el piano, tampoco será abordada.

Las señales usadas para entrenar y para identificar provendrán de pianos acústicos

grabados “in-situ” en salas de ensayo, con ejecución de las notas y de los acordes a usar por parte

de un pianista o estudiante de piano.

Las notas se usarán para el entrenamiento y los acordes directamente para la identificación.

Los acordes se ejecutarán de dos maneras: “stacatto” y “legato”. “Stacatto” supone un

ataque rápido de los dedos a las teclas desde una posición separada de ellas y una suelta rápida



de las teclas. Es la forma de ejecutar acordes de corta duración pues el apagador cae sobre la

cuerda apenas soltar la tecla. “Legato” supone pulsar las teclas de forma suave a partir de una

posición de la mano con los dedos apoyados en ellas, y sin soltar las teclas una vez pulsadas. Da

lugar a acordes de larga duración.

2.9.3.- OBJETIVOS CONCRETOS

Implementar el método descrito supone llevar a cabo una serie de objetivos concretos.

Son objetivos de esta tesis:

1-Desarrollar un modelo de piano que permita obtener patrones para reconocimiento.

A partir de las bases acústicas de la vibración de cuerdas y de documentación específica

sobre pianos, se acopian los detalles teóricos y prácticos de los aspectos que influyen en el

espectro de una nota de piano. Algunos se desarrollarán con más detalle del existente y se irá

comprobando su acercamiento a las medidas disponibles. Con los detalles suficientes se realizará

una simplificación del modelo para que pueda depender del menor número posible de parámetros.

Se realizará el ajuste del modelo en base a las medidas disponibles identificando cuales de

ellos son muy dependientes de los datos concretos, de modo que podamos establecer posibles

necesidades de aprendizaje del modelo al ser usado para identificar acordes de otro instrumento.

El modelo se elaborará en dos partes, que se integrarán posteriormente, una dedicada a

las notas medias y agudas y otra centrada en las notas graves, ya que presentan suficientes

diferencias en su implementación física.

Este modelo simplificado permitirá generar patrones espectrales de todas las notas del

piano. Estos patrones podrán tener en cuenta la distribución de amplitudes de los parciales o

simplemente su posición y anchura espectral, según resulte ser suficiente para la identificación. De

igual manera, el número de parciales generados en el modelo será suficiente para asegurar la

identificación.

El modelo permitirá generar patrones de notas sueltas.



2-Utilizar dichos patrones para la identificación de notas y acordes

El conjunto de patrones generados se compararán con la señal a identificar mediante

métricas sencillas. En los casos más complejos se podrá recurrir a generar patrones variables o

conjunto de patrones asociados a una única nota (“multipatrón”), para cubrir varias posibilidades

de algún parámetro del modelo.

3-Optimizar la identificación mediante predeterminación de octavas y procesado previo

de la señal.

Se desarrollará una transformada ondicular específica basada en una ondícula madre

obtenida a partir de la propia señal de piano. El análisis de la transformada ondicular diádica nos

consigue detalles en base a octavas, lo que nos permitirá por un lado aislar ciertas componentes

espectrales de la señal a identificar y tener más detalle para su análisis si fuese necesario, y por otro

predeterminar con cierto margen la octava a la que pertenece la señal (nota o acorde) a identificar,

lo que mejora notablemente el proceso de identificación.

La ondícula madre se escalará con cierto número de compresiones y expansiones

suficientes para cubrir el espectro de las señales.

A pesar del esfuerzo que se dedique a la predetección con transformada ondicular, no será

totalmente aplicada pues una predetección octava a octava presenta problemas con los acordes

abiertos. Se desarrollará una predetección más global basada en la transformada de Fourier, que

permita seleccionar zonas espectrales y bandas (de al menos 2 octavas cada una)

4-Comprobar la validez del modelo para identificación de otros pianos

La grabación de otros pianos para intentar identificar sus acordes, permitirá comprobar la

validez del modelo de generación de patrones con otros instrumentos y guiarnos en la

determinación de necesidades de adaptación del modelo mediante entrenamiento o mediante

patrones múltiples con parámetros variables dentro de un margen.

5-Valorar posibles estrategias de aprendizaje en el modelo.

De los aspectos que recomienden aprendizaje, se propondrán posibles métodos, basados



en la identificación previa de cierta cantidad de notas sueltas concretas. Se valorará la cantidad de

notas necesaria para el aprendizaje y la fiabilidad obtenida en la identificación.

2.9.4.- MATERIAL Y GENERALIZACIÓN DE RESULTADOS

2.9.4.1.- Pianos acústicos y salas de ensayo

Ya se ha indicado que las señales tanto para entrenar el modelo como para ser identificadas

se obtienen de pianos acústicos mediante grabación del sonido emitido, lo que supone que el

método funciona para situaciones reales, si bien algo controladas.

El sonido grabado es el que directamente se obtiene de un piano sin ningún procesamiento

de limpieza, y por tanto incluye ruidos mecánicos propios del piano.

La sala de ensayo presenta un tiempo de reverberación no despreciable, por lo que el

sonido grabado contiene cierto nivel de ella, si bien es poco pues el micrófono se posiciona cerca

de las cuerdas que en cada momento vibran y por tanto cerca de la placa resonante, primando el

campo acústico directo sobre el reverberante.

Además, la sala de ensayo usada, perteneciente al Teatro Real de Madrid, no presenta un

aislamiento perfecto respecto a ruidos exteriores de tráfico rodado, por lo que no es descartable

que en algunos casos se tenga grabado parte de ruido ajeno al piano.

En conclusión, aunque las condiciones de grabación se han cuidado, los sonidos pueden

no estar totalmente libres de elementos ajenos, lo que es más cercano a situaciones reales.

2.9.4.2.- Grabación y procesado

La grabación se realiza con micrófono de condensador de gama profesional de estudio de

grabación y se registra en cinta de audio digital DAT con muestreo de 44.1kHz y 16 bits de

cuantificación, consiguiendo así respetar un ancho de banda de audio completo y teniendo un

margen dinámico alto para poder tener señales con bajo ruido pero sin distorsiones no lineales

causadas al sistema de grabación. El equipo grabador DAT usado es también de gama profesional.



Así, las componentes no lineales que aparezcan serán debidas al piano y no al equipo de

grabación.

Las señales grabadas se transfieren al ordenador mediante una tarjeta digitalizadora, pues

no se disponía de una tarjeta con entrada digital directa, ajustada también para trabajar con

44.1kHz de frecuencia de muestreo y 16 bits de cuantificación.

La estimación del espectro de los sonidos grabados se realiza mediante el cálculo de la FFT

de dicha señal enventanada con ventana Hanning. Para ciertas pruebas se ha utilizado ventana

Kaiser, que aunque disminuye la resolución en frecuencia permite un mayor margen dinámico en

los valores obtenidos de la FFT.

2.9.4.3.- Señales grabadas

De cada uno de los pianos que se han grabado, se ha realizado el siguiente registro:

-Todas las 88 notas del piano con vibración libre y actuación tipo “legato”. Cada tecla se

ha pulsado suavemente y se ha mantenido durante 3 segundos. Después se ha soltado la

tecla y el apagador ha actuado sobre la cuerda. No se ha pulsado la siguiente tecla hasta

no haberse extinguido el sonido de la anterior.

Esta grabación es esencial para realizar el entrenamiento (aunque en ese caso sólo se usan

algunas de las notas y no todas) y para realizar la verificación de la detección de notas

sueltas. Esta verificación es importante para evaluar la bondad del entrenamiento, pero no

necesaria para realizarlo.

-6 acordes en cada una de las 7 octavas completas (42 acordes en total) con dos

ejecuciones distintas, una en “legato” manteniendo la nota tres segundos y luego soltando

las teclas; y otra en “stacatto” pulsando rápidamente las teclas y soltándolas apenas unas

décimas de segundo más tarde para que actúe el apagador. En total son 84 acordes.

Estos 6 acordes con dos de 3 notas y cuatro de 4 notas, todos ellos con las notas



dentro de la misma octava.

Esta grabación es la usada para identificar dichos acordes.

-1 acorde abierto en cada una de las octavas 1 a 6 con ambas ejecuciones. en total 12

acordes. Estos acordes abiertos tienen una de sus notas en la octava adyacente

inmediatamente superior.

Con esta grabación verificamos la validez del método ante notas pertenecientes a

octavas distintas, lo que es una de las problemáticas del uso de predetección de octava.

2.9.4.4.- Generalidad del método: robustez frente a cambio de piano

Para poder asegurar la generalidad del método y que sus resultados sean aplicables a

pianos en general, y dado que no se dispone de una amplia base de datos de grabaciones de pianos

acústicos en las condiciones descritas anteriormente, se ha desarrollado el trabajo de la siguiente

manera.

Se han grabado tres pianos de cola. Dos pianos de cola Yamaha iguales (marca y modelo)

pero grabados en momentos distintos, por lo que presentan diferencias de afinación aún siendo el

afinador de ambos la misma persona. El tercero es un piano de gran cola (casi 3 metros de

longitud) de marca distinta (Steinway), afinado por la misma persona.

La grabación del primer piano Yamaha se ha utilizado durante la fase de desarrollo y

validación del modelo de generación de patrones.

Para evitar que pudiera parecer que los patrones se ciñen “empíricamente” a las notas de

ese piano facilitando la identificación, no se ha procedido a identificar acordes de dicho piano.

En la segunda fase, el modelo ya diseñado, se ha entrenado con notas sueltas del piano

Steinway, claramente distinto al usado para desarrollar el modelo, y por tanto no sospechoso de

ceñirse “particularmente” a los patrones.



Como tercera fase, se ha procedido a identificar acordes del piano Steinway con los

patrones generados durante el entrenamiento de la fase anterior.

Durante esta tercera fase se han realizado ajustes en el algoritmo de identificación, pero

que no afectan al modelo de cálculo de patrones, sino a aspectos de número de parciales a usar

en los patrones y máscaras; y aspectos de la sustracción espectral.

Por último, se ha aplicado el método completo a las grabaciones del otro piano Yamaha.



CAPÍTULO 3: BASES ACÚSTICAS DEL MODELO

En este capítulo se describen las ecuaciones teóricas que rigen el comportamiento de

diversos elementos del piano, lo que nos permitirá presentar la interrelación entre ellos así como

la problemática de elaborar un modelo acústico completo, lo que nos llevará a desarrollar un

modelo simplificado.

El uso de modelos basados en aspectos físicos ya han sido usados por ciertos autores para

ciertos elementos del piano [Giordano 97]

En este capítulo se plantean las bases que se usarán en el modelo para generación de

patrones. Sin embargo, no todos los aspectos que aquí se tratan dan lugar a un método que incluir

en el modelo. Esto se debe a que no todos los comportamientos acústicos pueden ser modelados

de forma sencilla, ni siquiera como primera aproximación. El objetivo de este trabajo no es dar

solución a las cuestiones acústicas sino elaborar en base a ellas un modelo simple que facilite la

identificación de notas y acordes mediante patrones espectrales.

Quedarán en este capítulo justificadas muchas de las expresiones y aproximaciones que

se usarán en el desarrollo del modelo, presentado en el siguiente capítulo, así como algunas

decisiones que se aplicarán a éste. Especial relevancia tienen los desarrollos sobre el efecto del

extremo no fijo de la cuerda y el efecto de la rigidez de la cuerda sobre las frecuencias de



vibración. Dado que la vibración de la cuerda está influida por las características de la placa, es

inevitable su inclusión en el modelo, aunque sea de forma simplificada. Por tanto también se

presentan los aspectos sobre vibración de placas que justifican lo complicado que resulta su

inclusión en un modelo.

3.1.- VIBRACIÓN DE CUERDAS FLEXIBLES

La aproximación más sencilla a la vibración de cuerdas es la que supone que son flexibles

y por lo tanto la única fuerza restauradora que se involucra en el movimiento es la debida a la

tensión a la que está sometida la cuerda. A veces se les denomina “perfectamente elásticas”

indicando que no existe término de elasticidad en la ecuación diferencial.

3.1.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN

Para cuerdas flexibles, la ecuación diferencial obtenida es:

∂∂ ρ

∂∂

2

2

2

2

yt

T yxL

= (2)

La vibración tiene lugar según la dirección “y” y la propagación según la dirección perpendicular

“x”.

3.1.2.- SOLUCIONES GENERALES

La solución general compleja:

y Ce ex j t= γ ω (3)

aplicada a esta ecuación diferencial da como resultado γ=±jk, con k=ω/c. Cada solución tiene dos

términos.

La ecuación diferencial es por tanto cumplida por soluciones armónicas de la forma:

y(x, t) = Ae + Bej( t-kx) j( t+kx) ω ω (4)

que se corresponden con diversas ondas propagándose en sentidos contrarios con frecuencias “ω”

y con números de onda “k”. No debe perderse de vista que “k” no es independiente sino que es



función de la frecuencia: k=ω/c.

La velocidad de propagación es:

cT

L

=ρ

(5)

En la mayoría de los casos se tiene un número infinito de valores discretos de ωn y kn que

son característicos de los denominados “modos propios” de la vibración, y que permiten escribir

la ecuación (4) de la forma:

y x t A j t k x B j t k xn n nn

n n n( , ) [ exp( ( )) exp( ( ))]= − + +∑ ω ω (6)

Los valores de las frecuencias de los modos propios se obtienen particularizando estas

soluciones según las condiciones de contorno que se corresponden con los elementos de fijación

de los extremos de la cuerda. Además se suelen obtener ciertas relaciones entre los valores de An

y Bn. Los valores de An y Bn quedan establecidos al aplicar las condiciones iniciales establecidas

por la excitación de la cuerda.

Debe tenerse en cuenta que An y Bn pueden ser complejos, por lo que en realidad deben

obtenerse 4 valores de coeficientes, además de los valores de las frecuencias de los modos

propios.

3.1.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS Y AMORTIGUAMIENTO

Como se ha indicado, las condiciones de contorno hacen referencia a los aspectos de la

fijación de los extremos de la cuerda. Existen dos tipos de aspectos a tener en cuenta, que dan

lugar a al menos hasta 4 condiciones de contorno posibles.

El primer tipo de aspecto tiene que ver con el método de sujeción y afecta a la forma física

que puede tomar la cuerda en las cercanías de dicha sujeción. Así, si los soportes son tipo

mordaza (“clamped string”) la cuerda debe mantenerse horizontal en la cercanía del soporte, por

lo que la derivada de y(x,t) respecto a x (“pendiente”) debe ser nula [Esta condición de contorno



sólo puede darse en cuerdas con rigidez o en barras y no en las flexibles como se justificará]. Si

el soporte es tipo apoyo, ya sea en enganche (“hinged string”) o en borde (“knife edge”) [también

llamado traste o agraffe según el instrumento] la cuerda podrá moverse alrededor del apoyo y la

derivada primera anteriormente indicada no será nula. Sin embargo, la cuerda en la posición de

dicho apoyo sólo podrá tomar forma recta por lo que la segunda derivada respecto a “x” será nula.

Si la cuerda está libre en un extremo (caso que no ocurre en un instrumento, pero que puede

aproximarse si el apoyo vibra muy libremente), son la segunda y tercera derivadas respecto a “x”

las que se anulan, al no haber fuerzas de torque ni cizalladura.

El segundo tipo de aspecto tiene que ver con la impedancia mecánica que presenta el

elemento de sujeción a la cuerda. Si esta impedancia no es infinita, la cuerda y el elemento de

sujeción presentan vibración en esa posición. Esto impone normalmente una ecuación de la

velocidad de la vibración (derivada de y(x,t) respecto a t) en función de la impedancia mecánica

del soporte y de la fuerza aplicada por la cuerda. A su vez, la fuerza aplicada por la cuerda

depende, al ser flexible, de la tensión y de la forma que toma la cuerda en la zona del soporte.

La aplicación de dichas condiciones de contorno llevan, entre otros, al cálculo de los

modos propios y las frecuencias de vibración. También llevan, en el caso de extremos

impedantes, a introducir un factor de amortiguamiento de la vibración de la cuerda, adicional al

propio de la cuerda, debido a la transferencia de energía al soporte, y que normalmente es el que

resulta determinar el amortiguamiento efectivo de la vibración de la cuerda.

Veamos a continuación algunos casos.

3.1.4.- MODOS PROPIOS PARA CUERDA CON EXTREMOS FIJOS

La solución típica que se encuentra en la mayoría de los textos [Kinsler 88] es la que se

corresponde a las condiciones de extremos fijos. En dicho caso, la impedancia mecánica que ve

la cuerda en sus extremos (x=0 y x=L) es infinita por lo que no hay movimiento en dichos puntos.

Las condiciones son: y(0,t)=0 e y(L,t)=0 y dan lugar a:



A BA B j kL A j kL j kL

= −= − = ⇒ =exp( ) exp( ) exp( )2 2 2 1

(7)

En definitiva, debe cumplirse que:

2 2 1 2kL n k nL

con n

ck

n

n n

= ⇒ = =

=

ππ

ω

, , .....

(modos propios) (8)

y las ondas tendrán una ecuación de la forma:

y x t jA sen k x j t

C jD sen k x j t C y D reales

n nn

n n nn

n n

( , ) ( ) exp( )

( ) ( ) exp( )

= − =

= +

∑

∑

2 ω

ω (9)

La conclusión, de momento definitiva, de aplicar las condiciones de contorno es que los

modos propios de vibración, y por tanto las componentes espectrales, tienen como valor de

frecuencia:

f ncL

nL

Tn

L

= =2

12 ρ

(10)

donde se ha tenido en cuenta que la velocidad de propagación es la dada en la ecuación (5)

En cuanto al amortiguamiento, dado que la impedancia presentada por el soporte es

infinita, no existe cesión de energía desde la cuerda al soporte y por tanto la única causa de

amortiguamiento es el propio de la cuerda, que tiene valores extremadamente bajos. Puede

comprobarse que se suele evitar incluir en las ecuaciones diferenciales los términos

correspondientes al amortiguamiento y por tanto tampoco aparecen en las ecuaciones de las

soluciones. Sin embargo eso no impide que se pueda hacer referencia cualitativa a él.

Los textos que incluyen su tratamiento suelen imponer ciertas restricciones para poder

obtener soluciones a las ecuaciones [Kinsler 88]. Las situaciones más simples de



amortiguamiento imponen un decrecimiento exponencial con el tiempo de los coeficientes de

amplitud.

Por último comentar que no se ha especificado si los extremos fijos están abrazados

(“clamped”) o apoyados en enganche o sobre bordes (“hinged” “knife edge”). Si estuvieran

abrazados y no pudiera haber “pendiente” de la cuerda en los extremos, la vibración dejaría de

existir, pues al estar controlada por la tensión como fuerza recuperadora, la cuerda debe formar

ángulo para que exista componente vertical debida a la tensión. De hecho, si se aplican las

ecuaciones de contorno para dicho caso, saldría A=-B y A=B, lo que sólo puede cumplirse si

A=B=0, y no existiría vibración. Esto es conforme con la advertencia ya indicada de que la

condición de contorno tipo “clamped” no puede darse en cuerdas flexibles. Por tanto sólo cabe

la posibilidad de que estén apoyados.

3.1.5.- EXTREMO IMPEDANTE: CUERDA FIJA-NO FIJA

En el caso de que alguno de los extremos, en el caso del piano sólo uno de ellos, esté

fijado a un elemento que permita el movimiento, la impedancia mecánica no es infinita sino que

tendrá un cierto valor, por lo que diremos que el extremo es “impedante”.

La cuerda, al deformarse por la vibración, ejerce una fuerza sobre dicho elemento que

tiene la expresión (para el extremo derecho de la cuerda):

f TyxL x L= =

∂∂

(11)

que es controlada por la tensión de la cuerda y en la que se ha obviado el vector unitario pues la

dirección de la fuerza sigue la dirección del desplazamiento “y”. Si la cuerda tiende a subir en la

proximidad del extremo derecho, la pendiente es negativa y la fuerza lo es, pues la tensión hace

que la cuerda realice fuerza hacia abajo, contraponiéndose al movimiento.

Dado que la impedancia es una característica del elemento de sujeción, la cuerda se ve

obligada a moverse en dicho punto con una velocidad que es:



• = = − +

• = − − −

• = −• − − =

= − − − −

=

uyt

j j t A jkL B jkL

yx

jk j t A jkL B jkL

A B extremo fijojA j t jkL jkL

jkTA j tZ

jkL jkL extremo impedante

L

x L

SB

∂∂

ω ω

∂∂

ω

ω ωω

exp( )[ exp( ) exp( )]

exp( )[ exp( ) exp( )]

exp( )[exp( ) exp( )]exp( )

[ exp( ) exp( )]

(13)

uT

ZyxL

SB x L

= −=

∂∂

(12)

en la que la dirección del vector unitario de velocidad es contrario al de la fuerza ejercida por el

soporte sobre la cuerda y por eso aparece el signo negativo. La impedancia mecánica del soporte

se ha denominado “impedancia debida a la placa resonante ZSB (‘SoundBoard’)” dado que la placa

resonante (que ya hemos presentado en el capítulo de “Introducción”) es el elemento del piano

que determina principalmente esta impedancia.

La ecuación 12 es la condición de contorno para el extremo derecho de la cuerda. Si el

extremo izquierdo está fijo, su condición será y(0,t)=0, por lo que la solución general queda

particularizada teniendo en cuenta:

lo que lleva a que debe cumplirse que:

tg k L jTkZSB

( ) =ω

(14)

condición que determina el valor de los modos propios y cuya resolución no es sencilla por no

ser analítica y requerir de métodos gráficos o numéricos para calcular dichos modos propios.

Diversos textos presentan la resolución para situaciones particulares de ZSB, concretamente

para impedancia tipo masa con ZSB=jωM e impedancia real (resistiva) con ZSB=R [Kinsler 88].

Algunos muestran curvas que indican soluciones más genéricas pero sin entrar a resolverlas

[Rossing 95] referidas a trabajos previos, los cuales se basan, no en resolver la ecuación 14, sino



en evaluar el efecto de la placa resonante considerando que la cuerda, a frecuencias cercanas a

la de uno de sus modos propios, se podría comportar como un sistema de segundo orden [Gough

81].

Debe tenerse en cuenta que aunque en las condiciones de contorno aparezcan términos

debidos a efectos de elasticidad, esto no modifica el comportamiento de la cuerda en cuanto a

flexible.

En este apartado se van a resumir las resoluciones para el caso tipo masa, resistivo

y elástico dadas por Kinsler [Kinsler 88] por ser interesantes para incluir una discusión

simple (y por tanto con limitaciones para el caso del piano) destinada a adquirir cierta

“intuición” de la situación; y por último se va a presentar la resolución para un caso general

de impedancia de la placa resonante (que denominados caso de “soporte multimodal”).

Como podrá verse, se hace mucho hincapié en comparar la situación con la de cuerda fija-

fija pues esta última se considera básica como primera aproximación al problema de diseñar las

cuerdas del piano.

Debe tenerse en cuenta además que una placa resonante real presenta una distribución no

uniforme de modos propios, siendo muy distanciados en frecuencias bajas y muy densos en

frecuencias altas, por lo que la impedancia que presenta a bajas frecuencias puede en ocasiones

asumirse como predominantemente tipo masa (si la frecuencia de vibración es superior a un modo

propio de la placa y muy inferior al siguiente), elástica (si la frecuencia de la vibración es algo

inferior a un modo propio pero muy superior al modo propio anterior) o incluso resistiva (si la

frecuencia de vibración coincide con un modo propio de la placa).

Más adelante, en este capítulo, se presenta un modelo de la placa resonante en el que la

impedancia se modela como la suma de admitancias debidas a los diversos modos. También se

comentarán las posibilidades de incluirlo como parte del modelo total. Sin embargo, usar ese

planteamiento en estos cálculos iniciales se sale del intento de establecer un modelo simple y una

explicación sencilla del fenómeno a modelar.



Fig.10.-Resolución gráfica de los modos propios (k) para extremo tipomasa. El eje horizontal está marcado con dos escalas. Los puntos másgrandes corresponden a los valores de k para el caso fijo-fijo. Cadaparcial se resuelve con una recta distinta. Para primer parcial, si la masaes muy pequeña puede aparecer un modo inferior al fundamental fijo-fijo.En el caso de un piano, todas las rectas tienen pendientes muy pequeñasy la variación del valor del modo propio no es excesivamente grande.

3.1.5.1.- Resolución para soporte con impedancia simple

3.1.5.1.1- Frecuencias de Modos propios para impedancia tipo masa

La ecuación de los modos propios quedará:

tg k L jTkZ

jTk

j MTM

kSB SB SB

( )( )

= = =ω ω ω ω 2 (15)

Dado que k=ω/c, no se trata de variables independientes. La resolución típica de al ecuación

anterior es mediante método gráfico. En el eje de abscisa se pone “k” y se representa por un lado

las rectas con pendiente T/(ω2MSB) que serán tantas como valores de ω se quieran representar. Por

otro lado se representan las curvas de tg(kL). Los puntos de intersección serán las soluciones a

la ecuación. Sin embargo, cada valor de ω representado da un conjunto de intersecciones, pero

sólo serán solución las intersecciones de las rectas cuyo valor de ω se corresponda con el valor

de k obtenido, al no ser variables independientes. El método pues, no sólo es gráfico sino que

requiere cierta iteración. Se obtienen infinitos valores discretos de kn y ωn, que son los modos

propios.



Lo interesante es que con independencia de lo difícil que resulte el cálculo, puede

observarse en la figura 10, que los valores de kn (y por tanto de ωn) cumplen ciertos criterios:

-Para obtener kn=nπ/L, que coincide con los pasos por cero de la función tg(kL), la

pendiente de la recta debe ser 0, lo que exige masa infinita, es decir, soporte fijo.

-Como todas las pendientes son positivas, los cortes con la función tangente tienen lugar

a valores de k por encima del de cuerda fija-fija. Un extremo tipo masa eleva todas las

frecuencia de vibración.

-Cada parcial de la vibración tiene un ωn distinto, por lo que también es distinta la

pendiente de la recta que lo calcula. Así pues, no es una única recta con todos sus cortes

la que define todos los parciales de la vibración.

-A mayor parcial, menor es la pendiente que lo calcula y por tanto menos se separa su

valor del que tendría en el caso de cuerda fija-fija.

-Puede llegar a existir un primer modo inferior al fundamental en cuerdas fija-fija(k=π/L)

que se correspondería con vibración presentando un máximo en el soporte derecho

(L=λ/4).

Esta última afirmación describe una situación poco evidente ya que en la típica vibración

fija-fija no puede existir un modo que tenga menos de dos nulos (L=λ/2) y mucho menos que

además tenga un máximo de vibración en el extremo (caso de L=λ/4). Sin embargo al no estar

totalmente fijo el extremo, puede llegar a tener suficiente desplazamiento, que aunque no sea

necesariamente un máximo (cuerda vibrando con λ=4L), puede ser el desplazamiento

correspondiente a un punto del primer cuarto de longitud de onda de una vibración de muy baja

frecuencia. En el caso límite de que el extremo pudiera llegar a vibrar libremente (masa muy

pequeña), sí se tendría un máximo en dicho extremo. En tal caso además, los valores de k de los



modos propios serían múltiplos impares del fundamental k=π/2L, lo que significaría un cambio

radical respecto al caso de cuerda fija-fija

Para los instrumentos de cuerda con condiciones fijo-impedante, pueden aportarse varios

razonamientos para descartar la importancia de ese primer parcial, inferior al fundamental del

caso fijo-fijo, en el caso de que llegara a existir.

a) El extremo impedante no es muy libre, por lo que limita mucho la excursión de la

vibración provocando que dicho modo tenga muy bajo nivel espectral.

b) Tendría una frecuencia muy inferior a la mitad del fundamental fijo-fijo, lo que

supondría una disminución del tono en más de 1 octava. En los instrumentos musicales no se

aprecia una disminución de más de 1 octava en el tono de la cuerda, ni es necesario corregir la

tensión en más de 1.41 veces para compensar la bajada de frecuencia del fundamental cuando el

extremo tiene comportamiento tipo masa. Esto demuestra que dicho primer parcial no existe o

no afecta al sonido.

Por otra parte, aún existiendo dicho parcial, como la masa es alta, las pendientes de las

rectas del método gráfico (figura 10) son bajas, especialmente para parciales más altos (frecuencia

más alta). Como resultado, los valores de frecuencia calculada de los parciales 2 y siguientes

resultan ser algo superiores y cercanos a los parciales 1 y siguientes, respectivamente, del caso

fijo-fijo. Por tanto, podría seguir afirmándose que las frecuencias son las mismas que en el caso

fijo-fijo, pero ligeramente aumentadas de valor.

En definitiva, puede considerarse que en el caso de impedancia tipo masa dicha primera

componente sería, desde el punto de vista musical y en el caso de llegar a existir, una

componente de ruido sub-fundamental, con una importancia escasa dado su bajo nivel espectral.

Por último, indicar que existen otras posibilidades para acometer la resolución gráfica,

como por ejemplo manipular la ecuación 15 para obtener:

tg k L jTkZ

TM

kT

c M kSB SB SB

( ) = = =ω ω 2 2

1 (16)



en cuyo caso se tienen gráficas de tg(kL) y de hipérbola pero sin la iteración debida a ω .

La ecuación de la solución sigue siendo:

y x t jA sen k x j t

C jD sen k x j t C y D reales

n nn

n n nn

n n

( , ) ( ) exp( )

( ) ( ) exp( )

= − =

= +

∑

∑

2 ω

ω (17)

pues se sigue requiriendo que A=-B.

El uso de este cálculo para un piano requiere incluir el hecho de que Msb no es una

constante sino que varía como se indicará más adelante.

3.1.5.1.2- Frecuencia de Modos propios para impedancia resistiva

Esta situación lleva implícita que la masa es nula, por lo que el resultado se parecerá al

ya indicado de múltiplos impares de π/2L. Una vez más, si la vibración es limitada en excursión,

este fundamental podrá considerarse sub-fundamental y todas las frecuencias serán superiores al

caso fijo-fijo. Pero en este caso, la limitación de excursión sólo puede deberse al amortiguamiento

(resistencia mecánica) de la placa resonante. En situaciones reales de piano suele cumplirse que

este amortiguamiento es alto, sin embargo, las resoluciones teóricas como la expuesta por Kinsler

suele suponer que el amortiguamiento es pequeño, para obtener una solución analítica.

Así, para ZSB=R, la ecuación a resolver es

tg k L jTkZ

jTk

RSB

( ) = =ω ω

(18)

lo que exige que k sea complejo (pues la tangente de un número real jamás es compleja), y por

tanto deberá considerarse una frecuencia compleja pues la velocidad de propagación tampoco

puede ser compleja. Se tomará k’=k+jα y ω’=ω+jβ. Al sustituir en la solución general, α



determina la disminución (amortiguamiento) de amplitud con la distancia y β la disminución de

amplitud a lo largo del tiempo. Ambos son términos de amortiguamiento que modifican además

los valores de los modos propios. Además, al ser cuerda flexible Tk/ω=cρL, siendo ρL la densidad

lineal de la cuerda. La existencia de modos propios supone el cumplimiento de:

sen kL y th Lc

Ro bien

kL y th LRc

( ) ( )

cos( ) ( )

= =

= =

0

0

αρ

αρ

(19)

Si ahora se impone como es habitual en los textos teóricos la condición de

amortiguamiento suficientemente bajo: R<<ρLc , sólo puede cumplirse la segunda condición y

además podrá aproximarse th(αL)=αL, lo que nos lleva a:

αρ

≈ < <RcL

1 (20)

lo que hace que la parte imaginaria de k’ sea despreciable frente a la parte real, que determinará

los modos propios con valor:

kn

Ln =−( )1

2 π (21)

que son los mismos que para masa nula como se indicó al principio. Dado el bajo

amortiguamiento del soporte, la vibración no está limitada y la situación es similar a la de

extremo libre.

En estas condiciones, la ecuación del desplazamiento vibratorio es:

y x t Ae k x x k x j ttn n n

n

( , ) sin ( ) ( ) cos ( ) exp( )≈ +−∑ 2 2 2 2β α ω (22)

Esta típica resolución teórica no es aplicable al caso de pianos, pues el amortiguamiento



de la placa resonante no es pequeño. Puede verse que la condición anteriormente impuesta es

R<<ρLc , lo que supone que la resistencia mecánica de la placa sea mucho menor que la

impedancia característica de la cuerda (Zocuerda=ρLc). De hecho, la impedancia característica de las

cuerdas de piano no es la misma para todas, pero tiene valores que varían desde un valor del

orden de 1.7 Kg/s para las más agudas hasta unas 5 veces dicho valor para las graves [Conklin

96c]. El valor de R de una placa resonante es superior a 200 Kg/s, según se desprende de medidas

realizadas [Giordano 98a].

Resulta evidente que no sería posible diseñar una placa con una impedancia menor que

la impedancia característica de la cuerda. En un piano o en cualquier instrumento musical, es por

tanto necesario que la impedancia característica de la cuerda siempre sea menor que la

impedancia que impone la placa, porque así se evita que la energía de la vibración se transmita

rápidamente a la placa resonante, lo que extinguiría el sonido demasiado pronto. Esto incluye que

el valor de R (que es la menor impedancia que la placa presenta) sea mayor que la impedancia

característica de la cuerda.

Así, en piano, R>ρLc , y sería la primera condición de la ecuación 19 la que se cumpliría,

siendo α<1 y los modos propios kn=nπ/L como en el caso fijo-fijo.

A pesar de que pueden plantearse estas dos situaciones tan distintas en cuanto a relación

entre impedancia característica de la cuerda e impedancia de la placa, cabe resaltar que, aunque

sólo una es la realizable, ambas dan lugar a bajo amortiguamiento de la vibración. Además, del

primer caso expuesto, parecería deducirse que el bajo amortiguamiento de la vibración (α) está

asociado al hecho del bajo amortiguamiento del soporte (R). Sin embargo, el bajo

amortiguamiento de la vibración se corresponde realmente con el hecho de que la energía de la

onda de la cuerda no se transmita al soporte sino que permanezca en ella. Para ello el único

requerimiento es que exista una gran diferencia entre la impedancia característica de la cuerda y

la impedancia del soporte, así la onda siempre se refleja y no se transmite al soporte. Esto hace

que la vibración dure mucho tiempo, lo que se expresa como amortiguamiento (β y α) bajo.



Así, ambos valores extremos de R frente a ρLc, presentan el mismo resultado en cuanto

a amortiguamiento de la vibración, pero diferentes comportamientos respecto a modos propios.

En definitiva, un alto valor de R, como ocurre en pianos, supone tener unos modos propios

prácticamente iguales a los de la cuerda fija-fija y un amortiguamiento de la vibración bajo.

3.1.5.1.3- Frecuencia de Modos propios para impedancia tipo elasticidad

En este caso, ZSB=-jSSB/ω, por lo que la ecuación de modos propios es:

tg k L jTkZ

jTk

jST

Sk

SB SB SB

( ) = = − =−

ω ωω

(23)

que supone una situación muy distinta de cara a la resolución gráfica pues la recta es de pendiente

única.

Sin embargo, en el caso del piano, la elasticidad varía con la frecuencia, lo que será tenido

en cuenta en el modelo del soporte multimodal.

Como puede desprenderse de la figura, no existe un “sub-fundamental” y todos los modos

propios son de frecuencia más baja que en el caso fijo-fijo. Además, los parciales mayores se

separan más del valor fijo-fijo que los parciales menores.



Fig.11.-Resolución gráfica de los modos propios (k) para extremo tipoelasticidad. El eje horizontal está marcado con dos escalas. Los puntosmás grandes corresponden a los valores de k para el caso fijo-fijo. Todoslos parciales se resuelven con una única recta. En el caso de un piano,existirían varias rectas pues el valor de la elasticidad (que afecta a lapendiente de la recta) es distinta en la cercanía de la frecuencia de cadamodo, y volveríamos a tener una resolución gráfica iterativa.

3.1.5.2.- Frecuencias de Modos propios para impedancia genérica

Ha quedado visto que los valores de modos propios para extremo impedante tienden a

diferir respecto al caso fijo-fijo. El tipo de aspecto predominante en la impedancia determina el

sentido de la variación de las frecuencias: el predominio de masa eleva las frecuencias mientras

que el predominio de elasticidad las disminuye. El predominio de resistencia las mantiene

cercanas (casi iguales). Además, en los dos primeros casos, cuanto mayor es el parámetro del

soporte (masa o S), menores son las variaciones respecto al caso fijo-fijo, mientras que en le

tercer caso lo importante es que el parámetro R del soporte sea suficientemente alto.

El predominio de un aspecto u otro queda reflejado, en una curva cualquiera de

impedancia, por el hecho de que el valor a una frecuencia de interés sea real para resistivo,

complejo positivo (+jX) para másico o complejo negativo (-jX) para elástico.

Además, la ecuación de modos propios, con un extremo fijo y el otro impedante, puede

escribirse de la forma:



tg k L jTkZ

cjZ

ZjZSB

L

SB

cuerda

SB

( ) = = − = −ω

ρ 0 (24)

donde se ve la interrelación de las impedancias con la resolución de los modos propios y donde

debe tenerse presente que Z0cuerda es una cantidad real (y constante para una cierta cuerda) y “k”

aparece intrínsecamente en la ω de ZSB.

3.1.6.- FRECUENCIAS DE MODOS PROPIOS PARA CUERDA FIJA-IMPEDANTE Y

SOPORTE MULTIMODAL

En la situación real del piano, la placa resonante no se comporta como un único tipo de

carga, pues no es un sistema simple sino multimodal. Así, la impedancia depende de la frecuencia

de la vibración, variando de un parcial a otro no sólo su valor sino su efecto predominante. Así,

una nota puede tener para el fundamental una carga con impedancia tipo elástico mientras que

su parcial n-simo puede estar viendo una impedancia tipo masa o incluso resistiva. Esto hace que

en realidad, la resolución de la ecuación de modos propios deba realizarse independientemente

no solo para cada nota sino también para cada parcial de cada nota, al haber cambio en las

condiciones de contorno.

En todo caso, para cada frecuencia a estudiar, la impedancia de la placa tendrá un valor

concreto y podrá aplicarse la fórmula 24 para casos genéricos.

Como consideraciones generales se puede remarcar que:

1-Parece interesante conseguir que la ZSB sea siempre mucho mayor que Z0 cuerda, para que

no solo el amortiguamiento de la vibración sea bajo, sino que también las variaciones de

frecuencia tiendan a ser pequeñas.

2-La resolución de la ecuación debe plantearse de forma numérica para su resolución por

ordenador.

3-En un piano, cada cuerda tiene una velocidad de propagación distinta, lo que hace que

la resolución de los modos propios en términos de “k” no sea suficiente. Hay que

particularizar los valores de frecuencia para cada cuerda.

4-Es necesario establecer un modelo que permita conocer la impedancia de la placa



(incluido el efecto del puente). El puente actúa como adaptador mecánico de impedancias,

haciendo que la impedancia vista por la cuerda no sea exactamente la de la placa, aunque

sigamos denominándola como tal.

5-La evaluación de la impedancia en una zona con modos propios separados puede

realizarse como si se tratase de un sistema de orden 2. Llamaremos “sistema de orden 2"

a un sistema masa-resorte con un grado de libertad.

6-La evaluación de la impedancia en una zona con modos propios cercanos puede

realizarse calculando la movilidad (inverso de impedancia) resultante como suma de las

movilidades de varios sistemas de orden 2, cada uno correspondiente a un modo.

7-El modelo de cálculo de impedancia de la placa debe dar resultados conformes a las

medidas existentes de impedancias de placas resonantes reales [Giordano 98a].

La primera condición (ZSB>>Z0cuerda) no puede cumplirse en una cuantía excesiva, pues

impedir la transmisión de energía al soporte y a la placa resonante conllevaría la incapacidad del

piano para emitir sonido con alto nivel, ya que es la placa la principal responsable de la emisión

del sonido al actuar como un diafragma radiador [Martin 47]. De hecho, las mejoras introducidas

a partir del año 1940 por los fabricantes más importantes como Steinway, suponen la disminución

tanto de la masa como de la rigidez de la placa resonante, unidas a una disminución del

amortiguamiento de ésta, todo lo cual lleva a una considerable mejora en la calidad musical del

sonido radiado [Bilhuber 40].

Las dos últimas consideraciones se aplican en el modelo de impedancia de placa que

hemos desarrollado y que se presenta más adelante en el apartado de vibración de placas.

Sin embargo, en esta primera aproximación al problema de la variación de las frecuencias

de vibración de las cuerdas por el efecto de la placa resonante, vamos a considerar para los

cálculos, que el efecto de los modos propios de la placa son independientes entre sí

(frecuencia de los modos alejadas).

Así, para cada frecuencia en estudio, supondremos que la placa es un sistema único de

orden 2, ajustado al modo de la placa más cercano a la frecuencia en estudio, como si el resto de

modos de la placa no afectaran. Se han considerado los casos en que la frecuencia teórica (es



decir, para condición fija-fija) de la cuerda esté por encima, coincidente o por debajo de la del

modo de la placa y se han considerado diversos valores de masa de la placa(MSB). Además, se ha

considerado que la excitación de cada modo de la placa supone poner en movimiento inicial una

sección de ésta de un tamaño del orden de una longitud de onda al cuadrado, lo que supone que

la masa que ve la cuerda es menor a mayor modo de la placa (en definitiva a mayor frecuencia).

La rigidez para cada modo también varía, de forma que se obtiene la frecuencia de dicho modo

como:

ω 0SBSB

SB

SM

= (25)

En definitiva, se plantea resolver con todas estas consideraciones la ecuación:

tg kL jTkZ

Tk

MT

k jkRTSB

SBL

SB SBL

( ) = =−

−

ωρ

ωρ

202 (26)

Para una cuerda dada, la tensión y la densidad lineal son unas constantes. Cada modo de

la cuerda estará cerca de un modo de la placa, por lo que MSB y RSB deberán cambiar para calcular

cada modo.

La resolución de esta ecuación sólo es posible si k es complejo. La parte real especificará

la frecuencia de vibración y la parte imaginaria establece una medida de la transferencia de

energía a la placa y por tanto del amortiguamiento que sufre la vibración.

Para simplificar, y como primera aproximación, si consideramos que la mayor variación

de frecuencia debida a la placa existe cuando la parte reactiva de la impedancia de la placa es

mayor que la resistiva (efecto de masa o de elasticidad predominante), podemos proceder a

resolver la ecuación:



tg kL jTkZ

Tk

MT

kSBSB

LSB

( ) = =−

ωρ

ω202 (27)

que sí obtiene un valor real para k. Evidentemente esta resolución no es aplicable a frecuencias

de vibración cercanas al modo propio de la placa, pero sí permite acotar el efecto que puede llegar

a tener la placa sobre las frecuencias de vibración de la cuerda.

Este dato de acotación es muy importante para el modelo que vamos a desarrollar.

Debe tenerse en cuenta que es poco útil tener la resolución exacta de los modos propios de las

cuerdas con efecto de la placa pues en ningún caso de identificación, el modelo dispondrá de los

suficientes datos sobre la placa como para que el cálculo de la ecuación sea significativamente

aplicable a la generación de los patrones. Resulta más interesante tener una idea de la frecuencia

de la cuerda sin el efecto de la placa y luego aplicar un margen de variación máximo que

corresponda al efecto de la placa.

La resolución de la ecuación (27) se ha realizado para varios casos de valores de MSB.

También se ha incluido la consideración de que entre la frecuencia teórica fijo-fijo y la resonancia

de la placa existe una relación prefijada (relación wosb/wt). Esta consideración se debe a que al

no poder conocer los modos que realmente tiene la placa resonante (ω0SB), la ecuación no sería

resoluble. De este modo resolvemos la ecuación para cada nota, pero no de forma genérica sino

para el caso de que la resonancia de la placa sea una concreta (nótese que la frecuencia fijo-fijo

viene a ser una constante asociada a cada nota). Recalculando la ecuación para diversos valores

de esta relación, se podría componer una resolución más genérica. El valor de wosb/wt debe ser

suficientemente alto para asegurar que estemos suficientemente lejos del modo, y así la ecuación

27 tenga sentido. Tras varias pruebas, se ha elegido el valor 1.3, que como se justificará es

suficientemente alto.

Para que los resultados tengan más sentido, calculamos también la relación entre la

frecuencia real calculada resolviendo numéricamente la ecuación y la frecuencia teórica para el



caso fijo-fijo. A dicha relación la denominaremos Isb (“Inharmonicity due to Sound Board”)

Inarmonicidad debida a la placa resonante. La denominación inarmonicidad se debe a que los

parciales calculados no son exactamente armónicos del fundamental.

Se ha calculado para cada nota la variación de sus 10 primeros parciales. Sólo hemos

realizado el cálculo para notas por encima de C3 (fundamental hacia 130Hz), pues como se

justificará, son las que se puede asegurar siempre que estarán sometidas a cargas tipo masa o tipo

elasticidad con probabilidad variable, mientras que las notas inferiores a C3 suelen tener cargas

principalmente tipo elasticidad.

En un principio se realizaron estos cálculos usando para cada una de las notas unos

valores típicos de los parámetros de las cuerdas. Se calcularon pocas notas. Posteriormente, dado

que este aspecto bajo estudio no afecta al modelo usado durante el entrenamiento, hemos usado

el entrenamiento para extraer una aproximación de los parámetros de las cuerdas de un piano real.

Para aumentar la validez del cálculo de Isb, hemos aplicado a la resolución de cada nota los

valores de los parámetros concretos de sus cuerdas obtenidos a partir del entrenamiento. Los

resultados son los que se presentan en las figuras siguientes, en las que por sencillez sólo se

presentan los tres primeros parciales de cada nota.

3.1.6.1.- Isb calculado considerando Msb fijo y ωosb/ωt=1.3

Aunque se ha procurado ser lo más realista en los parámetros de la cuerda, no es tan fácil

serlo en los parámetros de la carga que supone el puente y la placa resonante en la cuerda. Como

primera aproximación hemos supuesto Msb fijo, con dos valores. Estos valores están dentro del

orden de magnitud de lo que se corresponde con calcular la masa de una sección de la placa del

tamaño de una longitud de onda al cuadrado.

Aunque se indique que la relación wosb/wt=1.3, eso sólo supondría una situación de

cargas tipo elasticidad, en realidad se calculan los casos wosb/wt=1.3 y wosb/wt=1/1.3.



Fig.12.-Isb en cents para wosb/wt=1.3 y Msb=0.4Kg. Se muestra paracada nota la variación de sus tres primeros parciales. Puede verse que amayor parcial menor variación. A mayor nota menor variación. Endefinitiva, a mayor frecuencia involucrada menor variación provoca laplaca, tanto si es tipo masa como elasticidad. por último, puede verse quela carga tipo masa provoca más variación que la tipo elasticidad, para lamisma nota y parcial

De las figuras 12 y 13 puede concluirse que a mayor Msb menor es la variación de las

frecuencias. Esto es importante pues como sabemos, la situación real no es de Msb constante sino

que aumenta al bajar2 la nota, lo que permite prever que las notas graves no tendrán tanta

variación en sus frecuencias como aparentan las figuras anteriores. También puede verse que la

variación es de unos pocos cents.



Fig.13.-Isb en cents para wosb/wt=1.3 y Msb=1 Kg. Puede verse que amayor parcial menor variación. A mayor nota menor variación. Puedeverse que la carga tipo masa provoca más variación que la tipoelasticidad, para la misma nota y parcial

3.1.6.2.- Isb calculado considerando Msb variable y dos valores de la relación wosb/wt

Una vez que se ha visto el efecto de Msb en Isb, interesa ver el efecto de la relación

wosb/wt. Para tener unos resultados más cercanos a la realidad vamos a introducir valores de Msb

adaptados a cada nota.

Para ello, se calcula la masa de una sección λ2 de una placa resonante típica. La λ se

calcula según la frecuencia teórica (fijo-fijo) de la nota. Para ello se consideran valores típicos

de la placa resonante y las fórmulas presentadas en el próximo apartado sobre “vibración de

placas”.

Realmente los cálculos incluyen una modificación que se debe a que la placa es realmente

ortotrópica, por lo que la rigidez no es igual en las dos direcciones perpendiculares y existen dos

longitudes de onda para cada frecuencia. La sección para el cálculo de masa es realmente λL* λT



Fig.14.-Isb calculado para Msb ajustado a nota y wosb/wt=1.3 y 1/1.3.se muestran tres parciales por nota. Isb decrece al subir nota o subirparcial. Msb ajustado a nota permite ver que las variaciones no son tangrandes en notas bajas.

Fig.15.-Isb calculado para Msb ajustado a nota y wosb/wt=1.5 y 1/1.5.se muestran tres parciales por nota. Isb decrece al subir nota o subirparcial. Una mayor relación wosb/wt supone menor variación.

De las gráficas 14 y 15 pueden sacarse varias conclusiones. Si bien sigue manteniéndose

la tendencia de mayor variación al bajar la nota o el parcial, los márgenes de variación son

menores por subir la masa Msb al bajar la nota o el parcial.



También puede verse que una mayor relación wosb/wt disminuye la variación. Esto último

supone que cuanto más lejos esté la frecuencia fijo-fijo de la cuerda respecto a un modo, menos

se modifica dicha frecuencia. Esto podría llevarnos a concluir que cuanto más cerca del modo

estemos, más se separa la frecuencia real de vibración de la frecuencia teórica fijo-fijo. Sin

embargo, sabemos que si la frecuencia teórica coincide con el modo, la frecuencia real coincide

con la teórica.

Podemos llegar a suponer, a falta de una resolución completa de la ecuación 26, que el

valor de Isb empieza creciendo al separarnos del modo y que a partir de un cierto valor de la

relación wosb/wt, Isb empieza a decrecer.

Ese punto de inflexión en la relación wosb/wt resulta importante para acotar los valores

de Isb. Sin embargo, conocerlo supone disponer de demasiados datos sobre la placa resonante o

incluso resolver la ecuación 26, y ninguna de las dos son factibles en una aplicación de

identificación de notas y acordes.

Como se verá más adelante, a lo largo de este capítulo sobre el modelo, la no exactitud

de esta acotación no resulta ser el elemento determinante en ciertas limitaciones que aparecen en

los patrones generados.

3.1.6.3.- Efecto de la rigidez ortotrópica en Isb

Si modificamos el valor de la relación entre la rigidez longitudinal y la transversal de una

placa resonante (esto se explica más adelante en el apartado de “placa ortotrópica con costillas”)

los resultados indican que Isb se incrementa al aumentar la diferencia entre los valores de rigidez

(figura 16).



Fig.16.- Mismo cálculo que el de la figura 14, pero modificación en larigidez transversal de la placa ortotrópica. El valor de Isb se haincrementado apreciablemente

Dado que al fabricar pianos se tiende a disminuir la diferencia entre los dos valores de

rigidez con el uso de las costillas [Giordano 97], podemos considerar que Isb tiende a disminuir.

3.1.6.4.- Valores previsibles para la relación ωosb/ωt

En la figura 17 se muestran los valores calculados como previsibles para la relación

ωosb/ωt. Para ello se ha realizado un cálculo de los modos propios de dos placas con dimensiones

1.8x1.4m y 2.8x1.4m y con dos valores de la relación de rigidez ortotrópica (0.2 y 0.1 veces) que

son los usados en cálculos anteriores (ver ecuaciones en el apartado de placa ortotrópica). Se ha

considerado que una frecuencia teórica pueda tener cualquier valor con precisión de 1Hz y se ha

calculado su relación respecto al modo más cercano.

Como puede verse, el valor de 1.3 apenas se da, por lo que los cálculos anteriores

permiten establecer una cota en cuanto a que no se van a dar relaciones mayores. En cuanto al

efecto de relaciones ωosb/ωt menores, ya se ha indicado que pueden suponer un Isb algo mayor

que el calculado para relación 1.3, pero según disminuya la relación acercándose a 1, Isb debe

tender a 0 cents.



Fig.17.-Relaciones wosb/wt calculadas para cuatro placas resonantes ortotrópicas. La relación unidad indicaexistencia de modo propio de la placa a dicha frecuencia. Existe un modo fundamental entre 65 y 130Hz según elcaso, por debajo del cual la relación crece determinando una carga tipo elasticidad. Puede verse que rara vez se llegaa la relación de 1.3 veces usada en los cálculos anteriores como valor límite. La gran densidad d emodos enfrecuencias medias y altas hace imposible que una frecuencia esté muy lejos de un modo.

Las placas usadas para el cálculo son placas de pianos de cola, por lo que los

fundamentales de placa indicados son los más bajos que suelen encontrarse en pianos.

El primer modo de las placas está entre 65 y 130 Hz, este margen de valores corresponde

aproximadamente a los fundamentales de las notas de la 2º octava del piano. Puede decirse por

tanto que las notas de la primera octava y alguna de la segunda, tienen su fundamental con efecto

elástico en todos los pianos. Algunas notas de la octava 2 tendrán siempre efecto tipo masa. Las

últimas notas de la octava 2 y las notas de las octavas superiores se encuentran a un lado u otro

de algún modo por lo que no puede asegurarse si tienden a tener efecto tipo masa o elasticidad.

Por esto es por lo que se han realizado cálculos sólo para notas por encima de C3.



Fig.18.-Diferencia en Hz correspondiente a los valores de Isb para cadanota. Si bien Isb disminuye con la nota, la diferencia en Hz (ancho de lavariación) aumenta. Para una relación wosbt/wt igual, no hay diferenciade ancho entre los parciales de una misma nota. Las notas de la octava 3sufrirían una variación de entre 2 y 3 Hz, mientras que las de la octava 7entre 12 y 19 Hz, de tener sus parciales teóricos a 1.3 veces la frecuenciade un modo de la placa.

3.1.6.5.- Aplicación al modelo de patrones

La existencia de Isb supone que los diversos parciales de cada nota no estarán centrados

en el valor teóricamente previsto, sino que sufrirán ciertas modificaciones hacia arriba o hacia

abajo según haya un modo cercano de la placa por debajo o por encima de ellos. Desde el punto

de vista de modelar un patrón que tenga en cuenta esto, el planteamiento que seguimos es

considerar que el ancho del pulso del patrón es suficiente como para incluir al parcial real se

encuentre donde se encuentre. Por ello, el valor de Isb se expresa como diferencia de frecuencias

real y teórica, y dicha diferencia será tenida en cuenta al calcular el ancho del patrón. Ya se

explicará en el apartado sobre patrones otros aspectos que afectan al cálculo de su anchura.

Llama la atención que no haya diferencia de anchos entre parciales de una misma nota.

Debe tenerse en cuenta que este resultado supone que todos los parciales de la nota se encuentran

a la misma relación respecto a un modo de la placa. Que esto ocurriera en la realidad sería una

coincidencia, por lo que no puede esperarse que en la realidad todos los parciales se separen la

misma cantidad de Hz de su valor teórico. De hecho en las pruebas llevadas a cabo, inicialmente

se usaron patrones con mismo ancho en todos los parciales y se comprobó que se obtenían

mejores resultados usando un ancho mayor a mayor parcial.



Como se ha visto en la figura 17, la relación wosb/wt “máxima” va decreciendo con la

frecuencia, por lo que según subimos en los parciales habría que esperar primero un incremento

en la cota de Isb y para frecuencias más altas un decrecimiento al bajar la relación hasta valores

muy cercanos a 1. Esto supone un incremento en la diferencia de frecuencias para los primeros

parciales y una disminución en los más altos. Como no es fácil conocer en qué parcial del patrón

empezar a disminuir el ancho, se ha decidido que los patrones se generen con un ancho mayor a

mayor parcial.

3.1.7.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN ESPECTRAL

DE NIVELES

La distribución espectral de niveles que se obtiene en una cuerda depende de la excitación

que se realiza. La cuerda de piano es golpeada por un martillo con forma redondeada y recubierto

de material blando. El estudio detallado ha sido realizado por varios autores, tanto con modelos

sencillos [Hall 86][Hall 87a][Hall 87b][Hall 87c][Hall 88] e incluso se han propuesto modelos

bastante complejos que incluyen no linealidad [Hall 92] e histéresis [Stulov 95].

En nuestro intento por obtener un modelo simple vamos a revisar algunas resoluciones

típicas, aunque insuficientes para explicar los espectros que se obtienen y una resolución basada

en un modelo sencillo de la excitación [Benade 76], que se aproxima bien a los resultados

medidos.

Sin duda que la existencia de una impedancia terminal no infinita debida a la placa

resonante también modifica en algo los niveles de las componentes espectrales, sin embargo,

inicialmente sólo se van a considerar las distribuciones para el caso de cuerda fija-fija.

3.1.7.1.- Soluciones ante condiciones iniciales simples

Las condiciones iniciales que suelen imponerse a las cuerdas tienen que ver con:

-Desplazamiento inicial en un punto para t=0, justo antes de empezar a vibrar.

-Velocidad inicial en un punto para t=0 con la que empieza a vibrar



La ecuación de la vibración es:

y x t jA sen k x j t C jD sen k x j t C y D realesn nn

n n nn

n n( , ) ( ) exp( ) ( ) ( ) exp( )= − = +∑ ∑2 ω ω (28)

3.1.7.1.1- Golpe del martillo “uniforme” e instantáneo

Si el golpe del martillo es instantáneo, la cuerda adquiere una velocidad en la zona del

golpe, pero no tiene desplazamiento inicial. Si consideramos que el golpe tiene lugar centrado en

la posición “xe” de la cuerda y con un ancho “a”, con la misma velocidad en todos esos puntos,

desde xe-a/2 hasta xe+a/2, las condiciones son:

y(xe,0)=0

u(xe,0)=0 para x<xe-a/2

V0 para xe-a/2# x #xe+a/2

0 para x>xe+a/2

La resolución lleva a valores de los coeficientes:

[ ]

CL

y x k x dx

DL

u x k x dxL

V k x dx

VcLk

k x a k x a

n n

L

nn

n

L

nnxe a

xe a

nn e n e

= ⋅ =

= ⋅ = =

= − − +

∫

∫ ∫ −

+

20 0

20

2

22 2

0

0 0 2

2

0

( , ) sin( )

( , ) sin( ) sin( )

cos ( / ) cos ( / )

/

/

ω ω (29)

que en el caso de fija-fija, sustituyendo kn=nπ/L, queda:

C

DV L

c nn

xeL

naL

n

n

=

== ⋅

02 0

2 2ππ πsin sin

(30)

lo que nos indica la importancia de la posición del golpe y del ancho de dicho golpe respecto a



la longitud de la cuerda. En general, la amplitud del modo decrece proporcionalmente con n2

(orden del parcial al cuadrado).

Nótese también que existe modificación espectral según el punto de impacto xe, debido

al término “sen (nπxe/L)” que incluso llega a cancelar algún modo. También hay cancelación para

modos en base al término “sen (nπa/L)” que considera el ancho de la excitación.

En teoría, un impacto instantáneo llevaría unida la cancelación total de todos los modos

que tuvieran un nodo en dicho punto de impacto. En la realidad, esto no ocurre de forma tan

drástica.

3.1.7.1.2- Golpe del martillo no uniforme e instantáneo

Algunos autores consideran que la velocidad que se imprime a la cuerda con un martillo

de piano sigue una ley tipo ventana Hanning alrededor del punto central del impacto [Benade 76],

si bien otros consideran que la velocidad que se reparte en forma exponencial en la zona de

impacto [Hall 87]. En cualquier caso, podemos considerar una función ventana de ancho w,

centrada en el punto central de impacto, quedando:

y(xe,0) = 0

u(xe,0) = 0 para x<xe-a/2

= V0*W(x-xe) para xe-a/2# x #xe+a/2

= 0 para x>xe+a/2

Los coeficientes quedan:

CL

y x k x dx

DL

u x k x dxcLk

V W x xe k x dx

n n

L

nn

n

L

nnxe a

xe a

= ⋅ =

= ⋅ = − ⋅

∫

∫ ∫ −

+

20 0

20

20

0 0 2

2

( , ) sin( )

( , ) sin( ) ( ) sin( )/

/

ω

(31)

En el caso de ventana Hanning, los resultados pueden verse en las figuras 19 y 20.



Fig.19.-Espectro evaluado para C1 con golpeinstantáneo del martillo y espectro real medido de lanota. El modelo de golpe instantáneo no es bueno. Sí seaprecia la cancelación por la posición del golpe respectoa la longitud total.

Fig.20.-Espectro evaluado para C4 para golpe delmartillo instantáneo y espectro real medido de la nota.Sí hay más parecido aunque no se corresponde lapendiente de disminución de niveles espectrales.

Puede verse que estas soluciones no se parecen a la realidad que se puede medir en el

piano, en el que los niveles espectrales de las notas graves no decrecen monótonamente sino que

sufren variación y no necesariamente el parcial de más nivel es el fundamental. Las notas agudas

sí tienen el fundamental como parcial de mayor nivel, pero tienen una variación de nivel algo

distinta a las vistas. El modelo de golpe del martillo instantáneo es muy limitado.

3.1.7.2.- Condiciones iniciales no simples: Golpe del martillo no uniforme y no instantáneo

Hemos desarrollado una solución para el caso de considerar que la cuerda no sólo tiene

velocidad inicial sino también desplazamiento inicial. La idea de este modelo simple reside en

el hecho de considerar que la vibración empieza cuando el martillo deja de estar en contacto con

la cuerda y retorna a su posición. El martillo retorna a su posición por dos posibles razones:

-El mecanismo tiene un tiempo prefijado de contacto tras el cual el martillo cae.

-La onda inicial creada ante el inicio del impacto, y con la forma de éste, y que se desplaza

hacia el extremo más cercano (“Agraffe”), rebota en este invertida y al llegar al martillo establece



una fuerza hacia abajo que ayuda a que este se separe de la cuerda. Esta fuerza tendrá que ser

igual a la fuerza que el martillo esté ejerciendo en ese momento. Existe un desarrollo más

elaborado con esta idea en [Askenfelt 93]

En nuestro modelo sencillo vamos a considerar que estas ondas iniciales no constituyen

parte de la vibración sino que son previas a esta y que sólamente afectan a la duración del

contacto entre el martillo y la cuerda previo al inicio de la vibración.

En el momento inicial de la vibración (t=0), podremos decir que:

-La cuerda tiene un desplazamiento inicial provocado por la aplicación de la fuerza del

martillo durante un cierto tiempo (previo al comienzo de la vibración). Este

desplazamiento además tiene la forma de la ventana de la fuerza aplicada.

y(x,0)=Y0*W(x-xe)

-La cuerda tiene una velocidad igual a la que crea la onda que hace bajar al martillo.

u(x,0)=-V0*W(x-xe)

de todas estas condiciones se obtienen los coeficientes como:

AYL

W x xe k x dx

BV

LckW x xe k x dx

n H nxe a

xe a

nn

H nxe a

xe a

= − ⋅

= − ⋅

−

+

−

+

∫

∫

2

2

0

2

2

0

2

2

( ) sin( )

( ) sin( )

/

/

/

/ (32)

En donde las integrales son iguales y el desplazamiento inicial Y0 es proporcional al tiempo que

dura el contacto entre martillo y cuerda (Tc), que es mayor a bajas frecuencias que a altas,

variando entre 0.5ms para C7 y 5ms para C1 [Askenfelt 90]. Durante este tiempo el

desplazamiento de la cuerda crece según la fuerza (y por tanto la velocidad) que el martillo

imprime en ella, quedando las ecuaciones:



Y udt V W t Tc dt V I

BA

I

Tc

H

Tc

nn

n

0 00 00= = − = ⋅

=

∫ ∫ ( )

ω

(33)

en donde se considera que la fuerza que hace el martillo no es uniforme a lo largo del tiempo sino

que también puede considerarse como una curva Hanning [Benade 76], debido a la poca rigidez

de la felpa que recubre el martillo.

Los coeficientes complejos Cn cuyo módulo expresa la amplitud de cada componente

espectral, se calculan como:

[ ]CYL I

W x xe k x dxnn

H nxe a

xe a= +

− ⋅

−

+

∫4

110

2

2 2 2 2

2 2

ω( ) sin( )

/

/ (34)

Las figuras siguientes muestran resultados de resolver dichas ecuaciones para valores

típicos de parámetros físicos, punto de golpe, tamaño y velocidad del martillo y tiempos de

excitación de 3 notas del piano extremas y central (C1,C4 y C7).



Fig.21.-Espectro evaluado y real de la nota C1. Elgolpe del martillo se considera de 5 ms. La cuerda esde 1.8m y se golpea a 20 cm del borde.

Fig.22.-Espectro evaluado y real de la nota C4, conuna cuerda de 63 cm

Fig.23.-Espectro evaluado y medido de la nota C7. Lacuerda es de 9.6 cm. El tiempo de impacto usado paraque la evaluación de un espectro algo parecido a larealidad es extremadamente corto para las medidasexistentes [Askenfelt 90].

Fig.24.-Efecto del tiempo de impacto del martillo.Existe un tiempo de impacto crítico que supone que elespectro tenga fundamental máximo o tenga menornivel de fundamental. Dicho tiempo crítico es distintosegún las características de la cuerda. Un impacto máslargo del crítico no sólo atenúa más el fundamental sinoque además aumenta el nivel de los modos superiores.La cancelación por la posición del punto de impactosigue manteniéndose.



Aunque puede verse que este modelo sencillo aproxima a grandes rasgos la distribución

espectral de las notas y nos puede permitir ciertos usos, lo cierto es que el modelado perfecto es

mucho más complejo y en él debe tenerse en cuenta variaciones debidas a la fuerza con que se

pulse la tecla [Askenfelt 93] (aspecto dependiente de la ejecución concreta de la nota o acorde a

identificar por parte del pianista) y otros aspectos del comportamiento del martillo y de las

reflexiones de la onda entre este y el extremo más cercano. Es por ello que hemos decidido evitar

el uso de este aspecto (distribución de niveles espectrales de las notas) en el proceso de

identificación, si bien puede ser usado para ajustar ciertos parámetros del algoritmo de

predetección de octavas.



3.2.- VIBRACIÓN DE CUERDAS CON RIGIDEZ

3.2.1.- ECUACIÓN DIFERENCIAL DE LA VIBRACIÓN

En el caso de tener una cuerda en la que se considere su rigidez, esta estará contemplada

mediante un término de fuerza recuperadora que es proporcional al módulo de elasticidad de

Young. La ecuación diferencial será [Rossing 95][Fletcher 64]:

ρ∂∂

∂∂

π∂∂L

yt

Ty

xE

r yx

2

2

2

2

4 4

44= − (35)

donde T es la tensión de la cuerda y E es el módulo de elasticidad de Young del material, y en la

que puede verse que el término debido a rigidez es proporcional a la derivada parcial cuarta del

desplazamiento.

La resolución de esta ecuación que es atribuida a Rayleigh es compleja incluso aunque

no contiene un término que contemple el amortiguamiento propio de la cuerda. En el caso del

piano, las cuerdas tienen muy poco amortiguamiento, por lo que bien puede considerarse correcta

la no inclusión de ese término. En todo caso, siempre puede contemplarse un posible

amortiguamiento incluyendo en el módulo de elasticidad una parte imaginaria.

3.2.2.- SOLUCIONES

La solución para cuerda infinita supone considerar una onda compleja del tipo:

y Ce ej t kx= ω (36)

donde C y k pueden ser complejos, como hace Fletcher en su artículo [Fletcher 64], aunque él

cambiara el signo a alguno de los exponentes y considerara un cambio de “escala” usando 2πk

en vez de k en la segunda exponencial. La existencia de esta solución lleva a una condición de

k que es una ecuación de orden 4 en k. Se tendrán infinitos modos propios, cada modo propio

definido por 4 números de onda. Los cuatro valores de k para cada modo, hace que la ecuación

tenga cuatro términos, por lo que la ecuación típica:

y C e e C e ej t jkx j t jkx= +−1 2

ω ω (37)

no es correcta en el caso de cuerda con rigidez, aunque también existan ondas progresiva y

reflejada.



Al aplicar la solución compleja 36 a la ecuación diferencial, se obtiene la condición para

los valores de k, en la que no tienen influencia las condiciones de contorno, por lo que se

cumplirán siempre. Además, las condiciones de contorno establecerán más restricciones para la

resolución de la ecuación de onda. La ecuación que siempre debe cumplirse es:

k kT

E r Erf4 2

4

2

224 16

0− − =π

π ρ (38)

como también aparece en [Podlesak 88].

Si se define:

BE r

TLf

LT

L

= =π

ρ

3 4

2 041

2 (39)

donde B es el coeficiente de inarmonicidad, y no debe confundirse con la denominación genérica

de un coeficiente B de una ecuación de onda, la ecuación puede reescribirse como [Fletcher 64]:

k kL B L Bf

f4 22

2

4

402

2 0− − =π π

(40)

Esta es una ecuación de cuarto orden con coeficientes pares, por lo que puede reducirse

una de segundo orden y tomar la raíz cuadrada de las soluciones. Así tendremos [Fletcher 64]:

k k y k jk

kBL

Bff

kBL

Bff

= ± = ±

= + +

= + −

1 2

12

2

2

2

02

22

2

2

2

02

21

41

21

41

siendo

π

π

(41)



debe recordarse que los valores de k obtenidos con esta fórmula son 2π veces más pequeños que

los reales.

Además de la relación evidente de los modos dos a dos, existe otra relación [Fletcher 64]:

k kBL

TE r1

222

2

2 4

4− = =

ππ

(42)

Si resolvemos la ecuación 38 sin introducir los parámetros B y f0, tendremos:

kT

E r E rT

rE fi = ± ± +

2 444

2

2 62 2

π π ππ ρ (43)

que dan los 4 valores (2 reales y 2 imaginarios)

Por tanto, para cada resolución de la ecuación que nos dé una frecuencia de modo propio,

existen realmente 4 números de onda relacionados entre sí. Esto significa que la ecuación de la

solución es un sumatorio de infinitos términos(modos propios) que deben incluir cada uno los 4

términos de número de onda relacionados entre sí. Esto lleva a tener que calcular hasta 4

coeficientes en el caso de una cuerda finita que siga una ecuación de vibración del tipo [Fletcher

64]:

[ ]y A k x B k x C k x D k x j tn n n n n n n nn

n= + + +∑ cosh sinh cos sin exp( )1 1 2 2 ω (44)

y no las inicialmente propuestas de onda progresiva y regresiva simples (no dispersivas). Ahora

bien, la ecuación de orden 4 para calcular k sigue siendo válida.

Puede comprobarse que aunque Fletcher usara el término k para las cuatro raices, lo cierto

es que k1 es un término asociado a una función de variación progresiva (crecimiento o

decrecimiento) a través de las funciones seno y coseno hiperbólicos, y no establece un patrón con

ondulación más propio de una vibración. Por ello, cada modo propio tendrá un valor de k2 que

define la frecuencia de vibración y un valor de k1 que define una variación progresiva con la

distancia, y al que muchos autores denominarían α.



Otra consecuencia de la ecuación 38 es que la velocidad de propagación es [Podlesak 88]:

cT T E r

fc c

BffL L L

= +

+ = + +

2 2 2 21 4

2 3 42 0

202

0

2

ρ ρπρ

(45)

El primer término es el que incluye la referencia citada e indica un resultado en función

de parámetros físicos de la cuerda. Puede verse que la velocidad varía con la frecuencia, siendo

una propagación dispersiva. Se confirma que a mayor frecuencia mayor velocidad. El segundo

término lo hemos derivado nosotros y muestra que la velocidad depende de la velocidad para

cuerda flexible (c0) y del coeficiente de inarmonicidad y que es mayor para parciales mayores (ya

que tienen mayor relación f/f0).

3.2.3.- CONDICIONES DE CONTORNO: MODOS PROPIOS

Además de las condiciones anteriores, las distintas condiciones de contorno permiten

resolver los modos propios y las frecuencias a las que resuenan dichos modos, que resultan ser

las frecuencias de vibración libre.

En el caso de cuerdas con rigidez, la resolución es complicada y se requieren métodos

numéricos en casi todos los casos. Sin embargo, las condiciones que permiten resolución analítica

puede considerarse buenas aproximaciones a la situación de las cuerdas del piano.

Revisamos a continuación un par de casos importantes. En ningún caso se considera que

los extremos tengan una impedancia mecánica distinta de infinito. El efecto conjunto de rigidez

y placa impedante será tratado posteriormente

3.2.3.1.- Soluciones para cuerda fija-fija con extremos apoyados en bordes finos (“pinned

by knife edges”)

Al ser extremos fijos, la vibración(desplazamiento) será 0. En cuanto a la pendiente que

puede tomar la cuerda es cualquiera, pero sólo con forma recta pues el apoyo no hace fuerza salvo

la de la tensión.



Por tanto y=δ2y/δx2=0, y las soluciones sólo tienen los términos de B y D con números

de onda k1 y k2. El término “vibrante” es el de k2=πn/L, lo que se corresponde con las frecuencias

de modos propios o de vibración dadas por [Fletcher 64]:

f nf n B nL

Tn

E dL T

nnL

= + = + =02 1 2 2

3 4

211

21

641 2 3( ) , , , .../

ρπ

(46)

que es una solución aproximada en la que Fletcher ha despreciado ciertos términos de un

desarrollo en serie. La ecuación de vibración resultante es:

[ ]y B k x D senk x j tn n n nn

n= +∑ sinh exp( )1 2 ω (47)

La ecuación de las frecuencias propias de vibración deja claro que los distintos parciales

son inarmónicos respecto al fundamental, y es normal referirse a dicha ecuación como “ecuación

de inarmonicidad”

Esta situación es la que más se corresponde con las cuerdas del piano. Las cuerdas reales

[Conklin 96b] están fijas en sus extremos a piezas metálicas (enganches). El del extremo más

cercano al teclado permite tensar la cuerda que se enrrolla en él (especie de tornillo que atraviesa

el marco metálico para atornillarse a la pieza de madera llamada “wrestplank”) y la del extremo

más lejano es una pieza solidaria al marco metálico que deja pasar la cuerda por un agujero para

luego trenzarse sobre sí misma asegurando que con la tensión no se va a soltar. Estas sujeciones

no son las que realmente determinan el tramo vibrante de la cuerda. En puntos cercanos a dichos

enganches existen las piezas donde la cuerda se apoya. Estas piezas (Agraffe, Capo D’astro,

apoyo posterior) funcionan como apoyos en borde fino . Estas piezas están a nivel distinto que

los tornillos, por lo que la tensión fuerza a que dichas piezas establezcan los extremos reales de

la cuerda vibrante.

En principio, no se está considerando el hecho de que el puente es impedante. La longitud

vibrante definitiva de la cuerda no suele considerarse hasta el apoyo final sino sólo hasta el

puente, el cual, para que esta solución fuese cierta, debería ser de impedancia infinita y actuar

como apoyo de borde fino. Lo primero se sabe que no es cierto, pero no se intenta resolver en este



apartado. Lo segundo es algo en lo que los algunos autores discrepan y suele indicarse que la

cuerda de piano está en una situación intermedia entre apoyada en borde fino y abrazada [Fletcher

64]. También podría considerarse que las cuerdas agudas están más cerca de la condición de

apoyo en borde fino mientras que las graves presentan una sujeción que podría asemejarse a

abrazada. Sin embargo, la casi totalidad de referencias a la ecuación de la inarmonicidad,

presentan la ecuación 46, indicada anteriormente, por lo que resulta más aceptada la situación de

apoyo en bordes finos (“Knife edge”).

3.2.3.2.- Soluciones para cuerda fija-fija con extremos abrazados (“clamped”)

Para comparar resultados, vamos a presentar esta otra situación. En este caso, la vibración

en los extremos es nula y también lo es la pendiente, ya que la abrazadera impide que la cuerda

se curve en su posición.

Las condiciones de contorno son: y=δy/δx=0, y las soluciones se complican. Con ciertas

hipótesis razonables, entre las que se encuentra que B es mucho menor que la unidad, se puede

llegar a una solución aproximada que sería [Fletcher 64]:

f nf n BB B

nn = + + +

=02

2

1 12 2

1 2 3π π

, , ... (48)

que como puede verse indica que las frecuencias de vibración son mayores de las del caso

anterior. El término adicional no es despreciable en absoluto, especialmente en cuerdas de notas

muy agudas en las que B tiene el valor más alto.

Si la impedancia en el puente de un piano fuese infinita, podrían medirse unos parciales

sólo controlados por estas ecuaciones y se podría comprobar cual de las dos condiciones de

contorno es más real. Algunos autores que han hecho pruebas con pianos con el puente

inmovilizado (impedancia terminal infinita) también hacen uso de la ecuación para extremos en

bordes finos, dándose a entender, aunque no se afirma, que las condiciones de contorno más

reales son las de apoyos en bordes finos [Conklin 96].



3.3.- VIBRACIÓN DE FLEXIÓN DE BARRA RÍGIDA

Para entender mejor el efecto de la rigidez sobre una cuerda, vamos a analizar la parte

debida exclusivamente a la rigidez. Esto no sólo permite repasar la vibración de una barra, lo que

no tiene demasiado interés de cara a una cuerda sino, más importante, determinar ciertas

similitudes respecto al caso ya descrito de la cuerda real, para deducir aproximaciones a ciertos

comportamientos de la cuerda real que no han sido descritos en su apartado.

3.3.1.- ECUACIÓN DIFERENCIAL Y SOLUCIONES

La ecuación diferencial para una barra cilíndrica delgada y vibración de flexión es

[Rossing 95][Fletcher 97]:

∂∂

πρ

∂∂

2

2

4 4

44y

tE r y

xL

= − (49)

donde “r” es el radio de la barra, ρL es la densidad lineal y E es el módulo de elasticidad de Young

del material.

La velocidad de propagación depende de la frecuencia, existiendo dispersión. La

velocidad de propagación es:

cr E

=ω

ρ2 (50)

siendo ρ la densidad del material.

Si se considera una solución genérica de propagación o vibración compleja tipo:

y Ae ex j t= γ ω (51)

donde A y γ son complejos, se tendrá que al sustituir en la ecuación diferencial se tiene que

cumplir que [Rossing 95]:

γωγ γ4

4

4Aec

Aex x= (52)



lo que supone que γ tiene cuatro valores para cada modo de vibración:

γω

γω

= ± = ±

= ± = ±

ck

jc

jk (53)

siendo el valor de k único, a diferencia de lo que pasa en una cuerda real. Esta situación coincide

con lo que pasaría en la ecuación de una cuerda real si la tensión fuese nula:

kT

E r E rT

rE f

kE r

E fr E

iT

Ti

= ± ± + →

→ = ± ± = ± ±

=

=

2 44

4 2

4

2

2 62 2 0

0 2 2

π π ππ ρ

ππ ρ

ω ρ (54)

por lo que se tienen los cuatro valores de k, todos iguales en magnitud, la cual a su vez, es igual

a ω/c. Pero como puede verse, de esta expresión no pueden obtenerse los valores de las

frecuencias de los modos propios, por lo que es esencial recurrir a las condiciones de contorno

como ya es sabido.

La ecuación para cada modo propio tendrá los cuatro términos, correspondientes a las

cuatro raíces vistas de ki y la de la vibración total será:

( )y x t A e B e C e D e ecnk x

cnk x

cnjk x

cnjk x j t

n

n n n n n( , ) = + + + ∗− −∑ ω (55)

en la que los subíndices “c” de los coeficientes indican que son complejos. Se puede reescribir

la ecuación en función de coeficientes reales [Kinsler 88]:

( )y x t A k x B k x C k x D k x j tn n n n n n n n nn

( , ) cosh( ) sinh( ) cos( ) sin( ) exp( )= + + + ∗∑ ω (56)

Aunque los coeficientes A, B, C, y D reciban el mismo nombre no son numéricamente iguales

a los Ac, Bc, Cc y Dc. No deben confundirse tampoco con los de la ecuación de la cuerda real



(cuerda con tensión y rigidez), pues allí hay dos valores distintos de “k” para cada modo “n”.

3.3.2.- CONDICIONES DE CONTORNO: MODOS PROPIOS

La resolución para el caso de ambos extremos apoyados en bordes finos (“pinned” or

“hinged”) supone que y=δ2y/δx2=0 en ambos extremos. Cumplirlo en x=0 nos lleva a A=C=0.

Cumplirlo en x=L nos lleva a que o bien D=0 o bien senkL=0. La segunda es la que interesa y

como resultado tenemos pues que la barra rígida sin tensión vibra a las frecuencias:

frL

En nn = =

πρ4

1 2 3 422 , , , , .... (57)

con ecuación:

( )y x t B k x D k x j tn n n n nn

( , ) sinh( ) sin( ) exp( )= + ∗∑ ω (58)

Esta ecuación es similar a la descrita para la cuerda real. Es interesante notar que en

ambos casos existe un término en “seno de kx” al igual que en el caso de la ecuación para cuerda

flexible, y que el término en “seno hiperbólico de kx” aparece en cuanto que se considera rigidez.

En los textos teóricos sobre barras rígidas, se impone también las condiciones en el

extremo finals

En cuanto a las frecuencias, puede verse que la ecuación elevada al cuadrado coincide con

la expresión:

f n f Bn2 4

02= (59)

donde B es el coeficiente de inarmonicidad. Lo que, junto a la expresión ya obtenida de las

frecuencias de vibración de la cuerda (46), permite establecer una interesante afirmación

publicada en [Benade 76] de que la frecuencia de vibración resultante en una cuerda real puede

calcularse como la suma cuadrática de las frecuencias de cada efecto por separado:

f f fncuerda nflexible nrigida= +2 2 (60)



lo que si se considera generalizable, nos permitiría aproximar ciertas soluciones en los casos más

complejos de otras condiciones.

Para otras condiciones de contorno, existen soluciones tabuladas que a veces pueden

ponerse en forma de ecuaciones pero con un parámetro que va tomando valores tabulados. Como

detalle interesante, las frecuencias de los modos propios de una barra fija-abrazada y totalmente

libre en el otro extremo son [Rossing 95]:

frL

Em m nn = = −

πρ16

1194 2 988 5 2 122 . , . , , ....., (61)

Sin entrar en el resto de los términos de la ecuación, puede verse que estas frecuencias son

en todos los casos menores que las correspondientes a apoyos de borde fino.

El interés, limitado, de este caso reside en que equivaldría al caso límite de un extremo

impedante con impedancia 0 (libre), marcando el límite inferior de frecuencia al que se podría

llegar por el efecto de la placa resonante si esta no tuviera amortiguamiento mayor que el de la

cuerda. Este valor de frecuencia se sumaría cuadráticamente a la de cuerda flexible para evaluar

la frecuencia menor de la cuerda real.

3.3.3.- VIBRACIÓN DE LA CUERDA CON EXTREMO IMPEDANTE

Vamos a presentar las conclusiones que se pueden obtener de todo lo dicho anteriormente

si se aplica a calcular el efecto de la placa resonante sobre la cuerda real con rigidez.

En cuanto a la velocidad de propagación de la cuerda, ya se ha descrito, sin embargo,

resulta interesante comprobar, que si analizamos dicha ecuación de la velocidad de propagación

en una cuerda real (45), teniendo en cuenta la ecuación de velocidad de propagación de la

vibración de flexión de una barra (50), que llamaremos cB, resulta que:

cc c

ccuerda B= +

+0

202 2

4

2 2 (62)



que indica que es una composición en la que influyen los valores de cuerda flexible y barra. Esta

ecuación será de ayuda a la hora de relacionar frecuencias y valores de k.

En cuanto a la ecuación genérica de la vibración:

[ ]y A k x B k x C k x D k x j tn n n n n n n nn

n= + + +∑ cosh sinh cos sin exp( )1 1 2 2 ω (63)

Conocemos que hay dos valores k1y k2, y que requerimos unas 4 condiciones de contorno, que

van a ser:

1ª y 2ª: Extremo x=0 apoyado en borde fino: y=δ2y/δx2=0.

3ª: Extremo en x=L apoyado en borde fino, pero no fijo: δ2y/δx2=0.

4ª: Extremo en x=L con movimiento: uT

ZyxL

SB x L

= −=

∂∂

Realmente la 4ª condición debería incluir un término de fuerza asociado a la rigidez

además del asociado a la tensión. Sin embargo, se puede considerar en primera aproximación que

la mayor aportación la hace la tensión. Esto está en consonancia con el hecho de que la

inarmonicidad (desviación de la frecuencia real respecto a la de cuerda flexible) existente no es

muy elevada.

Como resultado de las dos primeras, resultan los coeficientes A=C=0, lo que simplifica

mucho la resolución. No ocurriría así si el extremo en x=0 estuviera abrazado, pero como ya se

ha discutido, se acepta más la situación de apoyado.

La tercera condición establece una relación entre los coeficientes restantes B y D:

B Dk k Lk k L

= 22

2

12

1

sin( )sinh( )

(64)

La cuarta condición, junto con la anterior, lleva a:



− =+

+

jZT

kk

k Lk L

k k L

k Lkk

n SBω22

1

2

12 2

222

121

sin( )tanh( )

cos( )

sin( ) (65)

que es la ecuación a resolver para obtener las frecuencias de los modos de vibración. Se puede

considerar que k1>>k2 ya que como se vió:

k kBL

TE r

k kBL1

222

2

2 4 12

22

2

2

4− = = ⇒ = +

ππ

π (66)

y dado que L es siempre menor de 2m y B menor de 0.02, el segundo sumando siempre será

mayor de 123. Además k2 será del orden de magnitud de 2πn/L, es decir, pequeño, al menos en

los primeros parciales. Además, podemos deducir que k1L tiende a ser suficientemente alto como

para que tanh( k1L)=1. Como resultado, la ecuación de los modos propios queda:

tg k L jTk

Zn SB

( )22≈

ω (67)

que como puede recordarse es igual que la obtenida para cuerda flexible, salvo por el hecho de

aparecer k2. Además, existe una relación entre frecuencias y k distinta que en el caso de cuerda

flexible, por lo que los resultados no serán iguales.

Sin embargo, pueden darse las condiciones para que la velocidad de propagación no se

desvíe del valor de la flexible y que apenas haya diferencia en la resolución. Para que esto ocurra,

se puede deducir de la ecuación de velocidad que debe cumplirse:

f fLr E

<< 02

32π

ρ (68)

que para las cuerdas de un piano (acero) queda en:



f fLr

<< ⋅ ⋅−13 10 402

3

. (69)

Para valores típicos de longitud y radio de cuerdas de piano se tiene que:

Nota (f0) f<<

A0 (27.5 Hz) 1000 Hz

C4 (261.6 Hz) 3750 Hz

C8 (4186 Hz) 728 Hz

Si consideramos que la condición “mucho menor” se cumple con una relación “décima parte”,

es evidente que en la octava 4, sólo el fundamental puede considerarse libre del efecto de

dispersión. En las octavas más altas, ni siquiera el fundamental está libre del efecto de dispersión.

En las octavas más bajas podemos llegar a tener hasta 4 parciales sin efecto apreciable.

Debemos concluir por tanto que el efecto debe tenerse en cuenta.

Se puede realizar una aproximación a la resolución basada en un razonamiento. La forma

de resolver gráficamente los valores de k no cambia respecto al caso de cuerda flexible, de hecho,

en el caso de carga tipo elasticidad la resolución es la misma pues sólo aparecen términos en k

y ninguno más en ω:

tg k L jTkZ

jTk

jST

Sk

SB SB SB

( )22 2

2= = − =−

ω ωω

(70)

lo que da el mismo valor de k que en el caso de cuerda flexible, sólo que ahora, como la velocidad

de propagación es distinta (es más alta), la frecuencia resultante es menos baja (algo más alta) que

en el caso de cuerda flexible. Además, la relación entre frecuencias y valores de k que establece

la diferencia de velocidad en este cálculo, es la misma que establece en el cálculo de modos

propios para extremos de impedancia infinita. El resultado es por tanto equivalente a aplicar el

efecto de la placa calculado para el caso de cuerda flexible a los valores de frecuencias para

cuerda con rigidez y terminación infinita.



Si esta afirmación puede considerarse válida para una situación concreta de impedancia

de la placa resonante, vamos a considerarla válida también para el resto. Por tanto, nuestra

hipótesis de trabajo al respecto es que el efecto de la placa resonante sobre una cuerda real es el

mismo que el calculado respecto a una cuerda flexible, pero aplicado a los valores de frecuencias

reales de la cuerda real.

Si a dicho efecto le denominamos “Inarmonicidad debida a placa resonante (ISB)”,

podemos establecer que la frecuencia de vibración de una cuerda real de piano será:

f nf n B I f f nf n Bn SB n n= + ⋅ = +∞ ∞02 1 2

02 1 21 1( ) ( ) ( )/ /siendo (71)

en donde queda claro que el valor de ISB es el que corresponde a una frecuencia igual a la de la

cuerda con rigidez supuesta con terminación infinita. Los valores de ISB que se van a aplicar ya

fueron calculados y explicados con anterioridad.

3.3.4.- CONDICIONES INICIALES: EXCITACIÓN Y DISTRIBUCIÓN ESPECTRAL

DE NIVELES

Como ya se ha indicado, la situación más identificada con el piano es la de cuerda fija-fija

con extremos apoyados en bordes finos, lo que nos lleva a una ecuación de la vibración [Fletcher

64]:

[ ]y B k x D sen k x j tn n n nn

n= +∑ sinh( ) ( ) exp( )1 2 ω (72)

Las condiciones iniciales más cercanas a la realidad, dentro de un modelado simple, ya

han sido comentadas, sin embargo son sólo dos, mientras que estas ecuaciones requieren hasta

cuatro condiciones pues tanto Bn como Dn suelen ser complejos.

Una vez más, la realidad es muy difícil de modelar y los resultados que se puedan obtener

sólo aproximaran a grandes rasgos las distribuciones de niveles espectrales. Consideramos que

para la identificación de acordes, sin identificación de la fuerza con que se ejecutan, no es

necesario ni conveniente incluir cálculo por modelado de las distribuciones de niveles espectrales.



De hecho, como se ha podido verificar en las pruebas, ni siquiera resulta claramente útil

incluir la estructura espectral real medida durante el entrenamiento en los patrones usados para

identificar las notas y acordes.

3.4.- VIBRACIÓN DE UNÍSONOS

La vibración simultánea de dos o tres cuerdas afinadas a frecuencias muy parecidas y

fijadas al puente en el mismo punto, presenta una amplia serie de aspectos como puede verse en

[Weinreich 77]. Básicamente se pueden resumir sus efectos en dos aspectos: aparición de vibrato

(modulación de amplitud con moduladora de muy baja frecuencia) y clara modificación de la

velocidad de decrecimiento del nivel de la nota a lo largo de su duración.

Las tres cuerdas vibrantes se fijan al puente con una pieza metálica que une a las tres,

como si de un único punto de unión al puente se tratara. Mecánicamente, ese punto de anclaje

común se mueve con una velocidad que es la suma de las velocidades de las tres vibraciones. Esta

velocidad resultante es la que se aplica a la placa resonante, que según sus modos propios y su

característica de radiación las emitirá para ser captadas por nuestro micrófono. Como se trata de

vibraciones de frecuencias muy cercanas, la placa no tendrá un comportamiento muy distinto ante

ellas, por lo que los efectos atribuibles al unísono no quedan apenas modificados por la placa.

En una primera aproximación vamos a considerar que las cuerdas no interactúan entre sí

y que el golpe del martillo las pone en movimiento por igual, es decir, inician su vibración en fase

y con la misma amplitud.

Las figuras 26, 27, 28, 29 y 30 muestran la variación temporal de, respectivamente, una

nota con una sola cuerda (C1), una con 2 cuerdas (G2) y tres con 3 cuerdas pero de frecuencias

distintas (C4, C5 y C6), grabadas del piano de cola Yamaha. La escala de nivel es logarítmica



Fig.26.-Nota C1. Una sola cuerda. Fig.27.-Nota G2. Unísono de 2 cuerdas

Fig.28.-Nota C4. Unísono de 3cuerdas

Fig.29.-Nota C5. Unísono de 3cuerdas.

Fig.30.-Nota C6. Unísono de 3cuerdas

Puede verse que el comportamiento de la envolvente es muy distinto en los cuatro casos.

La nota de una cuerda tiene un decrecimiento uniforme. La nota de 2 cuerdas presenta un

decrecimiento uniforme pero con cierta modulación de muy baja frecuencia (vibrato),

especialmente visible en el primer segundo. Las notas de 3 cuerdas presentan una clara

modificación en sus pendientes de decrecimiento y una modulación de amplitud. En las notas de

octavas más altas, la modulación es tan profunda que hace más difícil apreciar a simple vista el

cambio de velocidad de decrecimiento.

La existencia de vibrato, o modulación de amplitud de muy baja frecuencia resulta

intuitiva para el caso de 2 cuerdas. El espectro resultante para cada parcial son dos componentes

(casi deltas) ligeramente separadas una distancia F. Es el mismo espectro que tendía una

modulación de amplitud DBL (Doble Banda Lateral) con una portadora de valor media aritmética



y moduladora senoidal de frecuencia F/2. Si la separación es de unos pocos Hz, la moduladora

es claramente de muy baja frecuencia. El inconveniente de este modelo de modulación es que se

maneja una frecuencia (la portadora) que realmente no existe en ninguna cuerda.

Otro inconveniente es su uso para unísonos de 3 cuerdas. Si la separación de los

componentes de las tres cuerdas fuese simétrica, podría llegar a decirse que un a de ellas es la

portadora y las otras dos las bandas laterales de una modulación de muy baja frecuencia. Sin

embargo, los unísonos de 3 cuerdas no tienen porque estar afinados de forma simétrica.

Por tanto, la existencia de vibrato debe plantearse mejor como el resultado del proceso

temporal siguiente: 2 vibraciones de frecuencias (periodos) ligeramente distintas se inician en

fase, según pasa el tiempo, la pequeña diferencia de periodo hace que los pasos por cero de una

de ellas se retrasen respecto a los de la otra. Progresivamente, ese desfasaje llega a provocar que

cuando un vibración pasa por cero subiendo la otro lo hace bajando y las dos señales están en

oposición de fase. Su suma casi se cancela. Pasado más tiempo, vuelven a quedar en fase y la

suma se potencia, y así sucesivamente.

Las figuras 31, 32 , 33 y 34 muestran el resultado de sumar dos sinusoides de frecuencia

ligeramente distinta, inicialmente en fase. Como se ve pueden ser aparentemente distintos.

Estos resultados pueden establecerse matemáticamente en cuanto a que la posición

temporal en que las dos señales están en contrafase y sus periodos se cancelan se corresponden

con:

sen T sen T Tn

f fn

fn( ) ( )

( )( )

( )( )

, , , ....ω ωδ1 0 2 0 0

2 1 1

2 12

2 12 1

1 2 3= − ⇒ =−−

=−

−= (73)

siendo f2=δAf1, y por tanto δ es la relación entre frecuencias, que puede expresarse en cents:

δ δ( )log

logcents =1200

2 (74)

La primera cancelación se obtiene para T0=1/2(f2-f1) y las restantes a intervalos 1/(f2-f1).



Fig.31.-Suma de dos senoides, una de 200Hz y otra de200.6 Hz (5 cents de diferencia), de igual amplitud einicialmente en fase. La amplitud está normalizada alvalor máximo.

Fig.32.-La diferencia de sólo 1cent a 200 Hz (200Hz y200.11 Hz), hace que la cancelación se tienda a realizaren un momento mayor que la duración de la nota, porlo que puede pasar desapercibido el efecto demodulación. La amplitud está normalizada al valormáximo

Fig.33.-Un mismo intervalo (5 cents) a mayorfrecuencia supone mayor distancia entre lascomponentes y mayor frecuencia moduladora. Se ve lacomposición de 600 Hz y 601.7 Hz.

Fig.34.-El detalle de la zona de cancelación muestracómo se cancela casi todo un ciclo correspondiente aambas señales en contrafase. Esta condición no semantiene mucho tiempo y la cancelación vadesapareciendo

Como ejemplo, la figura 34 tendrá la cancelación en T0=1/2(200.578457-200)=0.864 s., como de

hecho ocurre.



3.4.1.- UNÍSONOS CON AMORTIGUAMIENTO

El amortiguamiento de la vibración es un aspecto que no se ha incluido hasta ahora. El

amortiguamiento debido a la disipación interna en la cuerda es despreciable frente al causado por

la transferencia de energía a través del soporte al puente y la placa [Conklin 96c]. Además, no

resulta posible medir el amortiguamiento espacial, que es el que determina cómo se atenúa la

vibración a lo largo de la cuerda y sólo podemos medir el amortiguamiento temporal.

Como se ha podido ver en la figura 31, el amortiguamiento temporal de una nota con una

sola cuerda es prácticamente exponencial (lineal en escala logarítmica), lo que confirma que el

efecto de amortiguamiento por transmisión de energía a la placa puede considerarse proporcional

a la velocidad y modelable mediante un parámetro de Resistencia Acústica “R”, que estará

relacionado con el coeficiente de atenuación temporal α.

Podemos considerar pues que en el puente se cumple:

x t A e t

v t A e t A e t B e t

v t B e t B e t

v t B e t B e t B e t

i it

i

i i it

i it

i it

i

t t

t t t

( ) cos

( ) sin cos sin

( ) sin sin

( ) sin sin sin

=

= − − ≈

= +

= + +

−

− − −

− −

− − −

α

α α α

α α

α α α

ω

ω ω α ω ω

ω ω

ω ω ω

Para varias cuerdas:

2 cuerdas

cuerdas1 1 2 2

1 1 2 2 3 3 3

(75)

Para el caso de 2 cuerdas tenemos unas soluciones bastante parecidas al caso de sin

amortiguamiento, como puede verse en las figuras 35 a 40.

Puede verse que para notas de baja frecuencia y poca separación del unísono, casi no se

nota el efecto de éste. Dado que es característica del sonido del piano presentar doble

decrecimiento y algo de vibrato, los unísonos se afinarán con la suficiente separación.

Puede verse también que las cancelaciones siguen el mismo patrón visto sin



Fig.35.-Unísono de 2 cuerdas con amortiguamiento ypoca separación. El amortiguamiento enmascara elpoco efecto de vibrato.

Fig.36.-La figura de la izquierda con el eje logarítmico.Se aprecia el ligero efecto del unísono, pero elcomportamiento es parecido a una cuerda sola

Fig.37.-El efecto del unísono ya se aprecia al aparecerla cancelación en el momento previsto (0.864 s).Además, hasta ese momento, la amplitud decrece muyrápidamente. Tras la cancelación aparece un primerlóbulo. A partir de él el decrecimiento de la señal essimilar al caso de cuerda única. Existen 2 velocidadesde decrecimiento, lo que es típico del piano.

Fig.38.-La figura de la izquierda pero con escalalogarítmica. Se aprecia la caída inicial más rápida yal final como si fuera una cuerda única.

amortiguamiento y que todas las señales tienen algún punto que coincide con el caso de una

cuerda, al que tienden asintóticamente. A mayor separación de los unísonos (diferencia de

frecuencias), cada menos tiempo hay una cancelación y más lóbulos aparecen en el mismo

intervalo total de tiempo. Denominaremos primer lóbulo al que aparece después del primer

mínimo.



Fig.39.- Si el intervalo del unísono aumenta, aparecenmás cancelaciones y más lóbulos. Puede verse que entodos ellos hay algún punto tangente a la curvaenvolvente del caso de cuerda única. El vibrato cobraimportancia. Hasta el primer nulo la caída es másrápida y luego el nivel decrece más lentamente, comosi la cuerda fuera única, pero con un vibratoimportante.

Fig.40.-La misma figura que la izquierda pero conescala logarítmica. se aprecia muy bien el vibratopero no tanto el efecto de doble decrecimiento.

Las ecuaciones para la posición de los nulos y de los puntos tangentes son:

Tn

fn

Tm

fmg

01

1

2 11 3 5 7

12 4 6 8

=−

=

=−

=

( ), , , , .....

( ), , , .....tan

δ

δ

(76)

Puede verse que de un análisis temporal de señales de notas con 2 cuerdas pueden

extraerse ciertos parámetros identificativos útiles para un proceso de entrenamiento. Así, si se

detectan las cancelaciones, se puede saber la diferencia entre las frecuencias del unísono. Esto

tiene una aplicación muy limitada en el caso de nuestro modelo de patrones espectrales del piano

porque:

a)Sólo se puede aplicar en la fase de entrenamiento, en la que se sabe que la nota que se

está entrenando tiene 2 cuerdas.

b)No siempre se sabe lo anterior, pues si se entrena con grabaciones, sin ver el piano, no



Fig.41.-Unísono de 3 cuerdas. El primer mínimo, quees un nulo como en el caso de 2 cuerdas, lo marca elintervalo más alto (2 cents). No hay tangencia con elcaso de una cuerda. Se aprecia el doble decrecimiento.

Fig.42.-El primer mínimo lo marca el intervalo mayor(3 cents). La relación entre intervalos afecta a loslóbulos y al valor del mínimo. Hay tangencia en elsegundo lóbulo. Se aprecia el doble decrecimiento.

se puede saber con total seguridad si la nota tiene 2 cuerdas.

c)Las notas que suelen tener dos cuerdas son siempre notas graves que no pasan del C3.

Así, con 128.4 Hz de fundamental, un unísono de 4 cents, que ya es elevado para el gusto

de los afinadores y oyentes [Kirk 59] supone una diferencia de 0.3 Hz y dará una

cancelación a 1.66 s. Aún en el caso de detectarlo, el dato espectral obtenido es mucho

menor que la resolución de frecuencia que se va a utilizar, que es de 0.5 Hz.

Los resultados para unísonos de 3 cuerdas son mucho menos previsibles. Como se ve en

las figuras 41 a 45, los cálculos realizados muestran que los nulos desaparecen salvo en casos

concretos y los lóbulos no siempre presentan puntos de tangencia con el caso de cuerda única. Los

puntos de cancelación (aunque no sean nulos los seguiremos llamando así) son menos marcados.

Los unísonos se definen con la frecuencia de la nota como referencia y las otras dos frecuencias

están expresadas ambas respecto a la de referencia.



Fig.43.-El primer mínimo aparece antes por ser mayorel mayor intervalo (4 cents). Aparecen más lóbulos porello, pero los mínimos no son nulos y la tangenciaparece existir en el tercer lóbulo.

Fig.44.-El primer mínimo lo marca el intervalo mayor(4 cents) y es un nulo. Aparece una tangencia en elsegundo lóbulo. El doble decrecimiento sigue siendoevidente

Fig.45.-Caso poco usual en que ambas cuerdasadicionales se afinan iguales con un mismo intervalorespecto a la cuerda fundamental. El primer mínimo noes nulo pero lo ajusta la relación de 4 cents. Todos loslóbulos tienen tangencia

Se pueden extraer ciertas conclusiones de las simulaciones:

a) A mayor relación máxima antes aparece el mínimo, pero la posición de este no depende

sólo del máximo intervalo. El valor que se obtiene está entre los dos valores obtenidos

para ambos intervalos considerados por separado(fórmula para dos cuerdas). Está,



concretamente, por debajo de la media de dichos valores, y no una cantidad fija sino más

por debajo de esa media cuanto mayor sea el cociente entre los valores de los dos

intervalos y menor el valor del intervalo más pequeño.

b) Si las dos relaciones establecen un unísono simétrico (por ejemplo 1 y 2, 2 y 4), los

mínimos son nulos.

c) Existe punto de tangencia en el lóbulo cuyo orden coincide con la diferencia de los

intervalos. El orden de dicho lóbulo coincide con el número de mínimos que existen antes

de él.

d) Si los dos intervalos son iguales y las cuerdas adicionales están afinadas igual, la

situación no es como tener sólo dos cuerdas, pues los mínimos no se hacen nulos. Sin

embargo, existe tangencia en todos los lóbulos y no se cumple la conclusión c)

Resulta imposible en la práctica obtener los valores de las tres frecuencias midiendo los

puntos de cancelación, ya que serían necesario medir varios puntos de cancelación, los que no

siempre existen. Además, su suavidad provocaría errores de detección y errores en los cálculos

Por tanto, estas simulaciones que han permitido exponer los aspectos de doble

decrecimiento y de vibrato, no dan lugar a ninguna conclusión o método que pueda ser incluido

en el modelo de identificación de acordes.



3.5.- VIBRACIÓN DE PLACAS

3.5.1.- PLACA ISÓTROPA

La ecuación de la vibración de una placa isotrópica, cuya vibración se supone restringida

al eje perpendicular al plano de ella, es [Giordano97]

ρ∂∂

hz

tD z

2

24= − ∇ (77)

en la que “z” es el desplazamiento en vertical (vibración de flexión), h es el grosor de la placa (se

considera uniforme), ρ la densidad del material y D es la “rigidez” calculada como [Giordano 97]

Dh E

Nm=−

3

212 1( )( )

σ (78)

donde E es el módulo de elasticidad de Young y σ es la relación de Poisson. Mientras que el

primero expresa la relación entre el estrés(fuerza por unidad de superficie) y el “strain” (cambio

de longitud por unidad de longitud que se produce), el último parámetro expresa la relación entre

la expansión transversal por unidad de longitud de una barra circular y su acortamiento por unidad

de longitud. Su valor es de 0.3 para materiales duros y de 0.5 para materiales tipo goma, por lo

que suele usarse el valor de 0.3 casi como si de una constante se tratara para la madera de la placa.

Estamos suponiendo que la placa sólo vibra en el eje z, por lo que:

∇ = +22

2

2

2

∂∂

∂∂x y

(79)

3.5.1.1.- Soluciones para panel infinito

La onda de flexión de un panel infinito se propaga con una velocidad dada por [Beranek

71 ]:

cD

s

=ω

ρ

2

4 (80)

que es aplicable a cualquier caso sin más que particularizar el D adecuado a la dirección de



propagación considerada.

Puede verse que la propagación es dispersiva siendo la velocidad dependiente de la

frecuencia. Concretamente, las frecuencias altas se propagan más rápidamente.

Resulta típico incluir en las expresiones de vibración por flexión, la velocidad de

propagación longitudinal, de forma que quedan relacionadas. No deben confundirse ambas

velocidades al analizar las ecuaciones.

Normalmente, la inclusión de un término de amortiguamiento propio de la placa se realiza

considerando la rigidez compleja [Beranek 71] Dc=D(1+jη),siendo η el factor de pérdidas

(adimensional)

Por último, la radiación de sonido por parte de la placa vibrante infinita se hace

especialmente a partir de un frecuencia que se denomina “de corte” y que viene expresada por

[Beranek 71]:

fc

Dcs

c

=2

2πρ

(81)

3.5.1.2.- Impedancia de entrada a una placa infinita: impedancia característica de la placa

La impedancia característica de una propagación en una placa infinita, que coincide con

la impedancia de entrada que ve el elemento excitador en cualquiera de sus puntos, es:

Z D hc0 8= ρ (82)

3.5.1.3.- Soluciones para panel finito

Si consideramos el caso más simple, el de panel rectangular con todos sus bordes fijados

(sin movimiento ni curvatura), se cumplirá [Beranek 71]:



kmL

nL

fD m

LnL

m nm n x y

m nc

s x y

,,

,

= =

+

=

+

2

2

2 2

2 2

πλ

π π

πρ

π π (83)

debe observarse que la relación entre k y f no es lineal al ser propagación dispersiva.

Cada modo define una forma de deformación de la placa cuyo patrón de desplazamiento

para cada punto del plano es proporcional a:

ξπ π

( , ) sin sinx ym xL

n yLx y

= (84)

Si se establece una representación cartesiana de los valores de k en función de dos

componentes, uno dependiente de m (modos en eje x) y otro de n (modos en eje y), de forma que

se puede considerar a k como a un vector con dos componentes. Esta representación presenta las

siguientes ventajas [Beranek 71]:

-Para cada modo (valor de k) la dirección del vector k respecto a los ejes kx y ky es la

misma que la dirección de propagación de la onda directa (respecto a los ejes x e y de la

placa) que al combinarse con las reflexiones da lugar al modo.

-Para cada modo (valor de k), el módulo del vector k da una idea de la frecuencia que

excita al máximo dicho modo (resonancia). La frecuencia será'aquella cuyo valor de ke

coincida con el módulo de k. Esto supone que una frecuencia “f” excita principalmente

todos los modos que se encuentran en un arco de radio:

kf

cf

Dexcitacions

c

= =2

2 4π

πρ

(85)

lo que indica que toda frecuencia excita modos en todas las direcciones, que a mayor



frecuencia, al ser mayor el radio, mayor es el número de modos llevados a resonancia.

Debe recordarse que en principio, que un modo no sea llevado a situación de resonancia

no significa que no se excite en absoluto.

Un concepto interesante al analizar los modos propios de una placa es el de “Densidad

modal”, que expresa el número de modos que presentan resonancia en una cierta banda de

frecuencia con anchura de 1 rad/s. Así, el número de modos que presentan resonancia ( y por

tanto diremos que el número de modos propios) entre los valores de ω y ω+1 rad/s es [Beranek

71]:

[ ]n rad sL L

k rad s k

si k k

n fL L

D

x yexcit excit

excit

x y s

c

( ) * / ( / ) ( )

( )

ωπ

ω ω

ππ

ρ

14

1

24

2 2

11

= + −

≥

≈

(86)

puede verse que para modos muy superiores al primero, la densidad es alta e independiente de

la frecuencia, es decir, es constante [Beranek 71]. Esta última afirmación puede ser puesta en

duda si consideramos que Dc incluye un término de amortiguamiento(factor de pérdidas), que

suele variar con la frecuencia.

También puede deducirse que a más superficie y menor grosor de la placa, la densidad de

modos es mayor, lo cual es interesante pues es lo que se busca de una placa que servirá de

elemento radiador de la vibración de las cuerdas. Esto coincide con la realidad de la fabricación

de placas resonantes ya que dan mejor sonido las de pianos más grandes y además se las somete

a adelgazamiento en ciertas zonas (llamado “Tappering”) de forma que la sección de la placa no

es de grosor constante.

Esta fórmula es válida para cualquier forma de la placa resonante siempre que se aplique

a modos cuya longitud de onda sea mucho menor que la menor dimensión de la placa [Beranek



71]

3.5.1.4.- Impedancia de entrada a panel finito

La impedancia de entrada a panel finito no sigue la ley conocida para otros tipos de

propagaciones, como la de la cuerda, sin embargo puede ser intuitivo considerar que seguirá

existiendo una relación entre dicha impedancia, la impedancia característica, la impedancia

terminal en cada dirección y la distancia entre el punto de excitación (entrada) y dicha

terminación. Dicha relación será específica para cada modo de propagación o vibración a través

del parámetro k.

Así, es evidente que según la posición de excitación habrá diferencias en el valor de

impedancia incluso para la misma frecuencia de excitación.

Gracias a la existencia de diversas medidas realizadas en paneles finitos, pueden

desarrollarse modelos aproximados, cuyos resultados se asemejen a los medidos.

3.5.2.- PLACA ANISÓTROPA: PLACA ORTOTRÓPICA

Si consideramos que la rigidez de la placa, dada por el módulo de Young, no es la misma

para las dos direcciones principales (eje y perpendicular), la ecuación de la vibración de flexión

es [Giordano 97]:

ρ∂∂

∂∂

σ σ∂

∂ ∂∂∂

σ σ σ σ

hz

tD

zx

D D Dz

x yD

zy

Dh E

Dh E

Dh G

x x y y x xy y

xx

x yy

y

x yxy

xy

2

2

4

4

4

2 2 2 2

4

4

3 3 3

4

12 1 12 1 12

= − − + + −

=−

=−

=

( )

( ) ( )

siendo (87)

donde los parámetros están definidos para cada dirección y Gxy es el módulo de cizallamiento

(“shear”)



3.5.2.1.- Soluciones

La resolución es complicada y suele recurrirse a técnicas de elementos finitos, sin

embargo proponemos usar como primera aproximación:

fm D

L

n D

Lm ns

cx

x

cy

y, =

+

πρ

π π

21 4

24

2

(88)

3.5.3.- PLACA ORTOTRÓPICA CON COSTILLAS

La inclusión de costillas pretende incrementar la rigidez de la placa en aquella dirección

en que es demasiado baja, de modo que no sea tan alta la diferencia entre los módulos de

elasticidad de Young. Pero este efecto sólo se consigue a bajas frecuencias [Giordano 97]. Para

altas frecuencias la rigidez no se ve afectada por las costillas. Sin duda. La separación entre las

costillas determina la zona de frecuencias de “transición”.

La costilla es un listón de madera más rígida que la de la placa que se dispone a lo largo

del eje menos rígido. A falta de conocer el efecto global de las costillas en los parámetros físicos

de la placa, suele proponerse una resolución basada en diferencias finitas en las que la zona de

la costillas se considera homogénea (no mezclada con placa sin costillas), y en esa zona se

especifica [Giordano 97]:

Dh E

Dh h E

Dh h G

xribx

x yyrib

rib rib

x yxyrib

rib xy=−

=+

−=

+3 3 3

12 1 12 1 12( )( )

( )

( )

σ σ σ σ (89)

de forma que la costilla no sólo impone su mayor módulo de elasticidad sino que el segmento

debe considerarse más grueso, lo que también aumenta la rigidez. La costilla sí se considera

isótropa. Estas expresiones suponen otras aproximaciones en las que no vamos a entrar pues la

situación es ya suficientemente compleja de cara a presentar la problemática de la resolución de

la vibración de una placa resonante.

En cuanto a los parámetros físicos, mientras que E debe tomarse para cada dirección de

la propagación, sí se puede considerar un valor promedio de la densidad superficial [Beranek 71]:



Fig.46.-Foto de la parte inferior de un piano de cola. La placa se sitúapor encima del armazón de madera apoyados sus bordes en el marco dela caja. Las costillas atraviesan la placa fijadas a ésta por debajo.[Pianode cola Yamaha del Teatro Real de Madrid. Foto del autor]

ρ ρρ

s placaL t t

x y

hL nL L

Kg m= ∗ + cos cos ( / )2 (90)

Como primera aproximación podemos usar la fórmula 88 usando la densidad promediada

y la rigidez de las costillas (módulo de Young y grosor) en la dirección “y”.

3.5.4.- MODOS PROPIOS EN PLACAS NO RECTANGULARES

Es conocido que la forma rectangular mejora la distribución de los modos respecto a la

forma cuadrada, al evitar la existencia de diversos modos entran en resonancia con el mismo valor

de frecuencia. De igual manera, la forma no rectangular favorece la distribución de los modos,

de forma que existirán más modos en medias y altas frecuencias que en placa rectangular de las

mismas dimensiones. Esta afirmación puede compararse con lo que ocurre en sistemas

tridimensionales (salas de conciertos y de grabación), en las que se evitan que los bordes

(paredes) del sistema vibrante sean paralelas entre sí, para evitar que ciertos modos propios

tengan más energía, en detrimento de otros, que pueden llegar a no existir.

Si se analiza la fórmula de modos propios para placa rectangular, puede verse que diversas

combinaciones de m y n pueden dar el mismo valor de frecuencia, sobre todo si las dimensiones



se relacionan por números enteros. Eso significa que dicha frecuencia excitará diversos modos,

transfiriéndose más energía de esa frecuencia que de otras. Esta situación es inadecuada y la

primera medida que se debe tomar, incluso en placas rectangulares, es que las dimensiones no

tengan relaciones enteras.

Si alguna frecuencia a emitir no provoca resonancia de ningún modo, será débilmente

radiada. Lo ideal sería que toda frecuencia tuviera asociada un modo del que provoca la

resonancia. Esto se aproxima mejor con la forma claramente irregular de la placa resonante del

piano, cuya contrapartida es la dificultad a la hora de intentar analizarla.

Una placa real persigue tener una alta cantidad de modos propios con la mayor igualdad

de importancia, para lo que se recurre a formas de la placa que no permiten la resolución analítica

de las ecuaciones diferenciales. Aunque existen métodos numéricos para analizar la vibración de

placas tan complicadas, como el de los elementos finitos, no resulta imprescindible para nuestro

modelo simple. Por otro lado, algunos métodos publicados para considerar el efecto de la placa

en aplicaciones de síntesis, hacen uso de simulación mediante filtro FIR, en las que se requieren

hasta más de mil coeficientes [Bank 2002].

Resulta por tanto más razonable plantear un modelo sencillo cuyos resultados se

aproximen razonablemente a las medidas existentes. Al respecto de esto conviene indicar dos

aspectos:

-Los modos en baja frecuencia son pocos y deben poder ser bien aproximados. El efecto

de cada uno es claramente distinto a cada frecuencia de excitación cercana.

-Los modos en alta frecuencia son tantos y tan densos que más importante que sus valores

exactos es su efecto conjunto, pues ninguna frecuencia de excitación estará muy cerca de

uno y a la vez muy lejos de otro. Dicho “efecto conjunto”dependerá de la densidad de

modos propios.

3.5.5.- IMPEDANCIA DE PLACAS REALES



Fig.47.-Módulo y fase de la impedancia de una placasegún estudios de Wogram [Giordano 97]. Losvalores oscilan alrededor de 1000Kg/s y decrecenmonótonamente a partir de 1kHz.

Fig.48.-Módulo de la impedancia de una placa medidaen el punto del puente correspondiente a la cuerda dela nota G3 [Giordano 98a]. Los valores son algo másaltos de 1000 Kg/s y decrecen a partir de 3 kHz. Losmínimos corresponden con los modos de la placa.

Este parámetro es clave para analizar el efecto de la placa sobre la vibración de la cuerda

(frecuencias emitidas) así como para considerar la cantidad de energía que se transfiere de la

cuerda a la placa para su posterior radiación. Esta cantidad de energía no sólo afecta al nivel

espectral de cada parcial radiado sino también a la duración del mismo, pues si la energía se

transfiere rápidamente la vibración se apagará pronto.

En primer lugar, la impedancia depende de las características físicas de la placa. Además,

la impedancia depende del punto donde se excite la placa. Existen diversos estudios sobre

medidas de impedancia de la placa [Conklin 96b][Giordano 98a][Giordano 97]. En algunos casos

se prefiere caracterizar la movilidad (inverso de la impedancia mecánica).

En las figuras 47, 48, 49 y 50 se muestran medidas típicas de placas reales, obtenidas de

algunas de las referencias anteriores [Giordano 98a][Giordano 97] . Puede verse que no se

corresponden con un sistema sencillo, por lo que su modelado es complicado.



Fig.49.-Módulo de la impedancia de una placa medidaen el punto del puente correspondiente a la cuerda dela nota C4 [Giordano 98a]. Los valores están alrededorde 1000 kg/s y decrecen por encima de 3 kHz. Losmínimos corresponden a los modos de la placa y tienenla misma posición que en el caso de G3, sin embargo,sus valores son distintos.

Fig.50.-La fase de la impedancia medida en el puntodel puente de la cuerda G3 [Giordano 98a]. Indica si lavelocidad de desplazamiento del puente está en fase ono con la fuerza, mostrando si el comportamiento estipo masa, elasticidad o estamos en un modo de la placa(fase=0)

La impedancia de la placa es uno de los puntos de mejora en el diseño de pianos, pues

afecta críticamente al sonido como se ha indicado arriba. Téngase en cuenta que, por ejemplo, se

ha publicado que en cierta mejora introducida por un fabricante, la disminución de masa aplicada

llega al 7% mientras que la rigidez baja un 20%. La transmisión de energía a la placa aumenta una

media de 2.5dB. Sin embargo, el amortiguamiento de la vibración no solo no aumenta de manera

audible en octavas bajas, sino que en las notas más agudas (octavas 5 y superiores) disminuye,

alargándose la duración de la nota alrededor de un 30% [Bilhuber 40]. Esto se relaciona con una

mejora en la pendiente de la curva de impedancia a altas frecuencias que puede explicarse porque

al disminuir el amortiguamiento, cada modo es más independiente de los demás y el efecto

conjunto de modos densos no disminuye tan rápidamente la curva de impedancia.

Puede verse que todos los aspectos son tenidos en cuenta.

A pesar de la dificultad por modelar la placa, se incluye a continuación un modelo

suficientemente simple que nos permite acercarnos a los valores mostrados en las figuras xxx

anteriores



3.5.6.- MODELO IMPEDANCIA PLACA

Un modo es una forma de vibrar la placa. Las formas de vibrar son independientes de la

forma de excitarlas, la amplitud que adquieren no. Además, una vibración se puede expresar con

una ecuación, en la que existen términos o partes de la ecuación, que correspondan con la

descripción matemática de cada modo. Una excitación a una cierta frecuencia provoca una

vibración en la placa que puede ser representada por una combinación de las ecuaciones de los

modos propios. Si se requieren varios modos para expresar la vibración es que dicha frecuencia

ha provocado la excitación de varios modos.

Existe, en definitiva, una cierta independencia entre la frecuencia de la excitación y los

modos usados para la vibración, en cuanto a que una frecuencia puede llegar a excitar varios

modos y no sólo uno, de forma que la energía suministrada por la excitación puede distribuirse

entre varios modos.

Por otra parte, en la realidad, la placa no vibra como un sistema único y por eso no puede

decirse que sea un sistema de orden 2 (masa-resorte con un grado de libertad), sino que se trata

de un sistema en el que la vibración es el resultado de la propagación de una onda mecánica desde

el punto de excitación hacia el resto de la placa. Por tanto, los modos de vibración pueden

considerarse modos de propagación. Relacionar los modos con la propagación permite considerar

que hay dos procesos “separados”: el de la excitación y el de la propagación o vibración de la

placa. Este modelo es tanto más cierto cuanto menor sea la longitud de onda de la propagación

en la placa respecto a las dimensiones de esta.

Esta “separación” permite definir una zona de la placa asociada a la excitación y que

llamaremos “campo próximo”, que es la que determinará de forma simplificada las condiciones

de carga o impedancia de la placa vista por la cuerda. El planteamiento es análogo al usado para

estudiar la radiación de pistones y altavoces. Así, cada frecuencia que excita la placa ve una

impedancia equivalente a una impedancia de entrada a una línea de propagación (guia-onda)

bidimensional . Como dicha impedancia no es la misma si la frecuencia de excitación coincide

con un modo o no, dicha impedancia podrá expresarse en función de términos dependientes de

cada modo.



En cuanto al modelado de dicha impedancia de entrada, consideraremos que cada modo

propio a excitar provoca un efecto en el “campo próximo” que se puede modelar como un sistema

resonante de orden 2. Además, los distintos modos propios interaccionarán entre sí sumando

movilidades, es decir como un conjunto paralelo de circuitos resonadores orden 2 que reparten

corrientes (es decir velocidades) para la misma tensión (fuerza) aplicada. Esto se corresponde con

el hecho de que la fuerza aplicada como excitación a la placa reparte su energía entre diversos

modos de propagación. La energía transferida a cada modo da lugar a una vibración con cierta

amplitud y velocidad en cada modo. En teoría se podría decir que todos los modos se excitan ante

cualquier frecuencia, aunque si la amplitud va a ser cero, no tiene mucho sentido decir que se

excita. Para determinar hasta qué punto son muchos los modos que se excitan ante una misma

frecuencia, aunque cada uno lo haga con una amplitud distinta, es importante introducir el factor

de calidad de las resonancias de una placa de piano.

Este factor Q da una idea de lo ancha que es la respuesta de cada modo, y depende del

amortiguamiento interno de la placa para cada modo. El factor de calidad en placas de piano es

del orden de 200 [Conklin 96b], que es suficientemente bajo como para asegurar que en

frecuencias agudas con placas con densidad modal alta, existirán varios modos excitados

simultáneamente. Sin embargo a bajas frecuencias cada modo resulta bastante poco excitable por

frecuencias más cercanas a otros. En todo caso, en nuestro modelo es más sencillo calcular el

efecto de todas las ramas en paralelo aunque algunas den velocidad nula. El valor del Q debería

aplicarse al modelo incluyendo en cada circuito resonante (rama) un valor de R adecuado para

ese valor de Q. Sin embargo, no se hará así pues el valor de Q no es realmente el mismo (200)

para todos los modos.

En resumen, ante una cierta frecuencia de excitación, será más excitado el que tenga

frecuencia del modo más parecida a la de excitación, pero no será el único. Esto corresponde con

el hecho de que ese modo tendrá más velocidad que los otros, o su circuito equivalente más

corriente que los otros pues su impedancia será menor (admitancia mayor), pues tiene más

movilidad que los otros. Todos los modos excitados tendrán una velocidad según su movilidad

y la suma de ellas da la velocidad (energía) total. Por tanto la fuerza da lugar a una velocidad total



Fig.51.-Modos calculados para placa de 2.8mx1.4m y relaciónortotrópica longitudinal/transversal de 0.2. Existen unos 300 modos pordebajo de 10 kHz, la mayoría por encima de 1 kHz. Se han calculadounos 700 modos y se han ordenado por valor creciente de frecuencia y acada uno se le ha asignado un índice (número) para ordenar y contar.

que depende de la suma total de movilidades, que determinan la impedancia.

Veamos ahora los resultados de impedancia de placa calculados por este modelo y su

optimización.

En la figura 51 se muestran los modos que se calculan para una placa ortotrópica

rectangular con relación longitudinal/transversal de 0.2, con un ancho de 1.4m y un largo de 2.8m

(cierto parecido a placa de piano gran cola con costillas) . Puede verse que hasta 1 kHz apenas

hay 30 modos, mientras que hay casi 500 modos por debajo de 20 kHz, de los cuales 300 modos

están por debajo de 10 kHz. El modelo debe calcular el efecto combinado de al menos esos 300

nodos. El primer modo está cerca de 100Hz y el décimo modo está cerca de 400Hz, por lo que

están bastante separados.

En definitiva, se trata de modelar los valores de Rsbi y Msbi que la placa presenta para

cada modo y que permiten definir cada uno de los circuitos resonadores y realizar el cálculo del

efecto de todos en paralelo, para cada frecuencia de excitación. El valor de Ssbi viene fijado por

el valor de la frecuencia característica del modo y el valor de Msbi.



S MSBi i SBi= ω 02 * (91)

Para modelar los valores de Rsbi y Msbi proponemos dos alternativas, que llamaremos:

-Modelo de “campo próximo aislado”

-Modelo de “campo próximo tonal”.

3.5.6.1.- Modelo de “campo próximo aislado”

En los cálculos presentados en apartados anteriores sobre la variación de la frecuencia de

vibración de la cuerda “Isb”, en función de la impedancia de la placa, se había considerado que

cada frecuencia que se transmite a la placa hace vibrar, inicialmente, una sección de la placa de

tamaño similar a una “longitud de onda”, y aunque posteriormente esa vibración se transmitía por

toda la placa repartida en varios modos, eso no se tenía en cuenta. Esto equivalía a considerar que

cada frecuencia sólo excitaba el modo más cercano y que el sistema de orden 2 correspondiente

a dicho modo, viene impuesto sólo por las condiciones del “campo próximo” aislado, sin

considerar la propagación completa.

En este modelo vamos a considerar lo mismo, pero asignando valores de MSB y RSB a

todos los modos según su longitud de onda y calculando el efecto conjunto de todas las

admitancias.

La Msb viene calculada como:

MsbC

fC

fhBL BT= * * * ρ (92)

donde los dos primeros términos CB son las velocidades de propagación de la onda de flexión

(“Bending wave”) longitudinal y transversal, divididas por la frecuencia para obtener las

longitudes de onda; “h” es el grosor de la placa (del orden de 1cm) y ρ es la densidad del material

(400 Kg/m3). Como la propagación de la onda de flexión en una placa es dispersiva, las

velocidades de propagación dependen de la frecuencia según la ecuación 80, por lo que al final,

el modelo de la “campo próximo aislado” considera Msb inversamente proporcional a f.



Para mantener el modelo de orden 2 en cada modo, la rigidez tampoco será la misma para

todos ellos, sino que se ajustará para cada modo de cara a obtener la frecuencia de resonancia del

sistema de orden 2 igual a la del modo: SSB=MSB*ω20SB. Esto supone que la rigidez es mayor para

modos altos lo que concuerda con la idea física de que es más fácil doblar un listón largo que uno

corto.

Establecer el valor de R para cada modo es más complicado. La primera cuestión es que

a mayor tamaño de zona excitada mayor serán las pérdidas por rozamiento con el aire. La segunda

es que cualquier vibración de alta frecuencia suele estar más amortiguada que las de baja. La

tercera es que R no sólo debe indicar el amortiguamiento de la vibración de la placa, sino que

debe dar una idea de la transferencia de energía entre la cuerda y la placa (no debe ser muy baja

para no acortar la duración de la nota, ni muy alta pues supondría poca transmisión y por tanto

poco nivel de sonido a esa frecuencia). Aunque no puede predecirse la variación de R, la primera

aproximación más lógica es considerar que R crece con la frecuencia.

La figura 52 muestra los resultados calculados con este modelo de “campo próximo

aislado”. No son unos resultados muy similares a la impedancia medida (ver figura 49), por lo que

el modelo no es el más adecuado.

El comportamiento a bajas frecuencias, similar a las medidas, es razonable. Por un lado,

estos primeros modos hacen vibrar casi toda la superficie de la placa, funcionando casi como un

sistema concentrado. El efecto de la propagación no es tan notorio y no haberlo considerado no

afecta mucho. Por otro lado, al ser modos más separados, el efecto viene impuesto principalmente

por un modo y no por la conjunción de muchos. La realidad se parece bastante a este modelo en

bajas frecuencias.



Fig.52.-Módulo de la impedancia mecánica obtenida mediante el modelode “campo próximo aislado”. Msb decrece con la frecuencia (1/f) y Rcrece con la frecuencia (f1/2). Los modos corresponden con los mínimosde impedancia. La impedancia a bajas frecuencias sí se parece a lasmedidas.

3.5.6.2.- Modelo de “campo próximo tonal”

Si el efecto de la propagación sobre la impedancia que se ve en el punto de excitación para

cada modo no puede ser fácilmente previsto, pero debe ser considerado, lo que se propone es

establecer unas leyes razonables para los valores de Msbi y Rsbi, que permitan ajustar la curva

de impedancia calculada a la medida. Msbi y Rsbi no serán ya unas constantes para cada modo,

sino que variarán de valor con la frecuencia para cada modo. Por esa variación con la frecuencia

hemos considerado posible denominar al campo próximo “tonal”.

Si consideramos el efecto de propagación, sabemos que cada frecuencia de excitación

puede provocar propagación de varios modos, y que las características de propagación de cada

uno de esos modos no son las mismas para todas las frecuencias que lo excitan. Estos aspectos

generales de una propagación son más evidentes en técnicas de guía ondas (p.e. cálculos de

dispersiones), pero también pueden ser aplicados en propagaciones mecánicas.

Como resultado de este planteamiento, ya no se calculará el efecto de cada modo con un



Fig.53.-Módulo de la impedancia simulada con elmodelo de campo próximo tonal. R crece con lafrecuencia. No hay rizado en frecuencias altas.

Fig.54.-Impedancia simulada con el modelo decampo próximo tonal, con R creciendo con f hasta1kHz y luego se mantiene constante. Aumenta elrizado en las frecuencias altas.

Fig.55.-La simulación con el modelo de campopróximo tonal, considerando que R decrece a partirde 1kHz, exhibe un rizado excesivo respecto a lasmedidas.

Fig.56.-Módulo de impedancia medida para posiciónde la nota C4 [Giordano 98a ]

valor fijo de Msb y Rsb, sino que se considerará que dichos parámetros son una función de la

frecuencia. El efecto de cada modo se calculará en todo el margen de frecuencias con dichos

parámetros tomando valores según la frecuencia a la que se calcula el efecto (frecuencia de

excitación) y no según la frecuencia del modo que se calcula.

El resultado que se puede obtener aparece en las figuras 53, 54, 55 y 57, y puede verse una

buena similitud con la impedancia medida en figura 49 [Giordano 98a] , que se vuelve a

reproducir aquí por comodidad.



Fig.57.-Valores de Msb con la frecuencia deexcitación, usados para el cálculo de la movilidad decada modo. Nótese que por encima de 1kHz, el valordecrece rápidamente.

Fig.58.-Modos calculados para la placa de 2.8x1.4musada en la simulación del modelo de campo próximotonal y en otros resultados previos. El más bajo estáalrededor de 100Hz. Hasta 1kHz sólo hay unos 28modos. Sin embargo, la placa presenta unos 500modos hasta 20kHz.

Para llegar a estas soluciones se han tenido que ajustar las curvas de variación de Msb y

Rsb con la frecuencia, mediante diversas pruebas.

Para conseguir estos resultados, el ajuste de los parámetros Msb y Rsb es el que se

muestra en las figuras anteriores para Rsb y en la 57 para Msb. En esta última, puede verse que

existe una cierta relación entre la variación de Msb con la frecuencia, usada para el cálculo en

todos los modos, y el comportamiento de los valores de frecuencias características de los modos:

Los 10 primeros modos llegan hasta 400 Hz, que es hasta donde se mantiene constante Msb. De

400 Hz a 1kHz, Msb decrece ligeramente y a partir de 1kHz decrece rápidamente coincidiendo

con la zona de frecuencias en las que aparece la acumulación de modos.

Puede establecerse una relación, al menos aparentemente, entre los siguientes hechos:

-las frecuencias bajas se asocian a Msb altas, del orden de la masa de toda la placa.

2.8x1.4x0.01x400=16 kg (largo x ancho x grosor x densidad)

-los modos más excitados por dichas frecuencias movilizan la casi totalidad de la placa.

Esto se desprende de las medidas de vibración para los primeros modos de una placa

[Suzuki 86]



y también:

-las frecuencias altas se asocian a Msb cada vez menores.

-los modos más excitados por dichas frecuencias movilizan sólo partes de la placa

[Suzuki 86]

Ambas pueden llevar a considerar la posibilidad de relacionar Msb con la masa que

realmente se moviliza en la vibración de la placa.

La ecuación que cumple Msb es:

Msbf

=+

10

13000

2 (93)

En cuanto al parámetro R, que mide el amortiguamiento de la vibración, pueden verse en

las figuras tres casos:

- R creciendo con la frecuencia en todo el margen.

-R creciendo hasta 1 kHz y luego se mantiene constante

-R creciendo hasta 1kHz y luego decreciendo

El comportamiento de las tres curvas de impedancia es muy similar salvo por el “rizado”

a partir de 3kHz, que no existe en el primer caso y va creciendo en los otros. Dado que en las

medidas existe rizado, debemos concluir que el valor de R crece hasta una cierta frecuencia (1

kHz) para luego mantenerse constante o empezar a disminuir.

El comportamiento de una impedancia decreciente a partir de 3kHz es consistente con las

medidas de duración de notas. Al bajar la impedancia y acercarse más a la impedancia

característica de las cuerdas, la transmisión de energía es mayor y la vibración se extingue antes.

Esta disminución de la duración de las notas de frecuencias altas es conocida hace tiempo [Martin

47]

El resultado del modelo con “campo próximo tonal” es bueno y puede considerarse un



modelo sencillo con buena aproximación. Sin embargo hay aspectos que pueden ser mejorados.

Principalmente, no parece muy realista que el comportamiento de Msb y Rsb con la frecuencia

sea el mismo para todos los modos.

Otra de las limitaciones es derivada de que el ajuste a curva medida se hace sólo respecto

a una curva medida en la posición del puente de la nota C4. Sin duda en otros puntos del puente

la impedancia sufre una modificación en la forma

Por último, el aspecto que hace que este modelo no pueda ser fácilmente utilizado en la

identificación de notas y acordes, es el hecho de que no suelen ser conocidos los datos necesarios

sobre la placa resonante del piano que se está identificando. Una posibilidad que se apunta como

trabajo futuro es que, si se calcula, durante el entrenamiento del modelo, la longitud aproximada

de la cuerda más larga, se podría usar este dato como longitud de la placa. Y siendo el ancho un

valor casi siempre alrededor de 1.4m y considerando una relación ortotrópica típica, se podría

calcular la simulación de la impedancia según el modelo de campo próximo tonal.

En todo caso, si consideramos estos valores de Msb, el efecto sobre los cálculos de Isb

inicialmente presentados es que serán menores las variaciones de la frecuencia real de vibración

respecto a las teóricas en algunos casos, en los que se llegaban a considerar valores de Msb del

orden de 0.4 Kg y menores.

3.5.7.- AMORTIGUAMIENTO DE LAS NOTAS Y COEFICIENTE “R” DE LA PLACA

El amortiguamiento de una vibración es siempre un tema complicado puesto que existen

varios mecanismos simultáneos responsables del amortiguamiento, y no todos son proporcionales

a la velocidad [Beranek 71].

En el piano, el amortiguamiento de la vibración de la cuerda viene marcado casi

exclusivamente por la transferencia de energía a la placa.

Ya hemos tratado la existencia de amortiguamiento al analizar la vibración de unísonos,



pero no hemos entrado en su valoración.

El desarrollo teórico [Beranek 71] nos indica que para una vibración senoidal única, en

la que el amortiguamiento es proporcional a la velocidad de vibración, se tiene:

x t Ae t

ff

Q

Qf T

t( ) cos

.

=

≈ =

=

−α ω

α π ηπ

1

11

1 60

2 2

para amortiguamiento pequeño (94)

Donde α es la constante de atenuación, η es el “factor de pérdidas”, Q el “factor de

calidad” y T60 es el tiempo que tarda la vibración en disminuir 60dB su nivel.

Si se toman niveles logarítmicos, para cada nota podremos calcular:

log( ) log( ) log( ).

nivel nivel eT

f

nT n

n

2 12 3

− = =−

=

−α α

ηα

π

(95)

siendo T el tiempo que pasa entre los dos puntos cuyo nivel se mide. Si consideramos que para

valores de T superiores a 2 s. el unísono tiende a ser tangente con el caso de una cuerda,

podremos obtener el amortiguamiento equivalente a una única cuerda y serán aplicables las

fórmulas anteriores.

Si además se usa el parámetro “R” (Resistencia mecánica) para simbolizar el coeficiente

de amortiguamiento en la ecuación diferencial de un sistema de orden 2 correspondiente a la

carga de la placa en el extremo de la cuerda, se podrá calcular:



Fig.59.-Valores medidos de R en las grabaciones del piano de muestray una aproximación polinómica. Ambas muestran un comportamientoinicialmente creciente con la frecuencia, para posteriormente empezar adecrecer.

R M fSB n= η π2 (96)

Aplicando la ecuación de Msb ajustada en el apartado del modelo de impedancia de placa

con parámetros ajustados, el valor que se obtiene de R a partir de las medidas, para el piano

Yamaha, y su aproximación polinómica aparecen en la figura 59

Estos resultados confirman que en el caso de considerar válida la ecuación de variación

de Msb que permite ajustar las curvas medidas de impedancia de placa, la curva de variación de

R debe ser creciente hasta un valor cercano a 1 kHz, para luego decrecer no tan rápidamente como

había crecido. Se trata de un caso intermedio entre los dos simulados en las figuras 54 y 55


CAPÍTULO 4: MODELO

En este capítulo se desarrollan los aspectos correspondientes al modelo acústico usado

para generar los patrones espectrales. se incluyen los aspectos de entrenamiento y de extrapolación

de los valores entrenados al resto de las 88 notas del piano.

El modelo se completa a partir de dos submodelos. El primero es el de las cuerdas del

puente de agudos y el segundo es el de las cuerdas del puente de graves. Ambos difieren en

diversos aspectos de las cuerdas. Cada uno de ellos se entrena por separado, pero el modelo de

las notas del puente de graves requiere ciertos datos obtenidos del modelo de las notas del puente

de agudos, por lo que el orden en el entrenamiento y modelado es primero el puente de agudos

y después el de graves.

La transición entre el puente de agudos y el de graves se denomina “salto a graves” (“Bass-

break”) y tiene lugar entre dos notas que no son las mismas en todos los pianos. Dichas notas

suelen ser más bajas cuanto más largo es el piano.

4.1.- PARÁMETROS DE DISEÑO DE CUERDAS DEL PUENTE DE

AGUDOS

Todos los fabricantes hacen uso de unas reglas de diseño de la longitud de las cuerdas que

presentan pocas variaciones de unos a otros.

CAPÍTULO 4: MODELO


La primera cuerda que se diseña es la más corta, correspondiente a la nota 88,

concretamente C8. Esta cuerda tiene entre 5.0 y 5.4 cm [Conklin 96c]. El resto de las cuerdas se

calcula a partir de la 88 con la fórmula:

L n L s n( ) = ⋅ −88 88 (98)

en la que L88 es la longitud de la cuerda 88 y ‘s’ es un coeficiente que decide cada fabricante y

que varía entre 1<s<1.06.

La mayor longitud de cuerda que se admite en el puente de agudos debe evitar que la

posición del puente esté muy cercana al borde de la placa vibrante (lo que supondría una mala

excitación de los primeros modos de la placa, disminuyendo la amplitud radiada de las

componentes graves de la nota), por lo que el tamaño de la placa vibrante, y por tanto del piano,

determinan la longitud máxima de cuerda en el puente de agudos. La nota inferior a esa deberá

estar situada en el puente de graves y diseñarse con entorchados. Las cuerdas del puente de

agudos son de acero sin entorchado.

El diámetro de las cuerdas del puente de agudos varía entre los valores de 0.787mm y

1.6mm (0.031" y 0.063"), tomando valores en saltos de 25.4 µm (0.001"), salvo a partir de

1.295mm (0.051") que los saltos son de 50.8 µm (0.002") [Conklin 96c]. En el caso de la nota 88,

el diámetro es alguno de los tres primeros: 0.787 mm, 0.813mm ó 0.838 mm (0.031",0.032" ó

0.033").

Otro aspecto importante en el que coinciden todos los autores es en que la tensión de las

cuerdas del puente de agudos es prácticamente constante. Las diferencias reales se deben a ajustes

de la afinación. Por tanto, el modelo considerará la tensión constante.

En cuanto a la afinación, las notas más altas presentan una afinación por encima del valor

de la frecuencia temperada que llega a 35 cents en la nota 88 [Backus 69]. Esto supondría un

incremento en la tensión, respecto a la necesaria para afinación a frecuencia temperada, de sólo

un 4%. Por tanto, el cálculo de las cuerdas se realizará considerando las fórmulas de afinación a

frecuencia temperada, ya que las variaciones para afinación real son pequeñas.

CAPÍTULO 4: MODELO


Fig.61.-Tensiones calculadas para diversos valores de r88 y L88, paraafinar a f0.

La figura 61 muestra los valores de tensión que se corresponden con la cuerda 88 para

diversos valores de L88 y r88. La fórmula usada es:

f fc

L L

TT L f rflexible

L0 1 88

20 882

882

2

1

288 4= = = ⇒ =− ρ

ρπ( ) ( ) (99)

y puede verse que los posibles valores de la tensión varían entre 660 N y 875 N.

La figura 62 muestra posibles curvas de L según el valor de L88 y ‘s’ seleccionados.

Aparece clara la necesidad de adecuar el valor de ‘s’ al tamaño del piano, pues si no, estaríamos

forzando un salto a graves muy alto con una gran cantidad de cuerdas en el puente de graves. La

figura 63 es un detalle de la anterior, limitado a longitudes de 2m que es el orden de magnitud de

la cuerda más larga que suelen tener los pianos de gran cola de 2.74cm de longitud exterior

[Steinway].

Puede verse que es inevitable que el puente de graves exista y contenga al menos las

cuerdas de unas 15 notas.

Una vez que el fabricante ha elegido un conjunto L88, r88 y T, el valor de T se mantiene

CAPÍTULO 4: MODELO


Fig.62.-Longitud de las cuerdas para valores de L88 de 5.0cm y 5.4cm,y tres valores de ‘s’ típicos (1.052,1.054,1.057)

para el resto de las cuerdas y es fácil calcular el radio ‘r’ de cada una de ellas.

r notaT

L f

T

L s f

r

snota nota notanota

nota

nota( )( )

( )

= = =⋅

− −−

−

−22 2

2

088

880 88

88

12

88

88

12

88ρπρπ

(100)

CAPÍTULO 4: MODELO


Fig.63.-Detalle de la longitud de las cuerdas del puente de agudos. Eltamaño del piano limita la longitud máxima provocando el cambio alpuente de graves (‘bass-break’).

La figura 64 muestra posibles curvas del radio de las cuerdas. Debe considerarse que los

radios altos no son preferidos pues suponen una mayor inarmonicidad en la cuerda, lo que

deteriora la calidad del sonido

Puede verse que los valores altos de ‘s’ consiguen cuerdas de menor radio y menor

inarmonicidad, si bien requieren longitudes mayores.

Puede concluirse pues que de todos los posibles valores, sólo algunos son normalmente

elegidos para pianos de calidad y estos dependen a su vez del tamaño del piano. En general, un

piano mayor permite mayores longitudes de cuerda y menores radios lo que lleva a cuerdas con

menor inarmonicidad y a un puente de agudos que contenga la mayoría de las cuerdas.

CAPÍTULO 4: MODELO


Fig.64.-Diámetros de cuerda calculados. Nótese que a mayor ‘s’menores radios se necesitan. Resulta claro que valores de ‘s’ iguales oinferiores a 1.052 no son recomendables.

Puede verse que los valores altos de ‘s’ consiguen cuerdas de menor radio y menor

inarmonicidad, si bien requieren longitudes mayores.

Puede concluirse pues que de todos los posibles valores, sólo algunos son normalmente

elegidos para pianos de calidad y estos dependen a su vez del tamaño del piano. En general, un

piano mayor permite mayores longitudes de cuerda y menores radios lo que lleva a cuerdas con

menor inarmonicidad y a un puente de agudos que contenga la mayoría de las cuerdas.

Ahora bien, todos los pianos tienen suficiente tamaño como para poderse asegurar que por

encima de la nota C4 hay pocas diferencias en la longitud de cada cuerda entre diversos pianos

[Conklin 96c]. Lo que lleva a considerar valores de L88 y ‘s’ que se equilibren entre sí y a

considerar un modelo promedio o típico que pueda ser adaptado o entrenado en cada caso.

De la figura 63 resulta evidente que para que la longitud de la nota C4 (nota 40) no varíe

mucho entre pianos, tampoco deberá existir entre pianos mucha variación en los valores de ‘s’

usados para el diseño.

CAPÍTULO 4: MODELO


4.1.1.- COEFICIENTE DE INARMONICIDAD

El modelo persigue evaluar correctamente el coeficiente de inarmonicidad para poder

generar un patrón espectral lo más real posible.

La ecuación que determina el coeficiente de inarmonicidad es:

BE r

L T=

π 3 4

24 (101)

E es el módulo de elasticidad de Young. En nuestro caso del puente de agudos, T es

constante y lo que importa es la relación r/L. Aunque aparentemente ‘r’ afecta más, y normalmente

se analiza diciendo que a mayor ‘r’ mayor es la inarmonicidad, ocurre que el margen de variación

de ‘L’ es mayor que el de ‘r’, lo que lleva a situaciones en las que cuerdas menos gruesas pero con

poca longitud presentan más inarmonicidad que otras más gruesas pero con mucha más longitud.

Es lo que ocurre en el puente de agudos, en el que la inarmonicidad crece con la nota aunque el

radio disminuya con ella. Así, la nota con más inarmonicidad es C8.

Si usamos las ecuaciones 98 y 100, podremos decir que en el puente de agudos:

BE r

L T

E r

L T s

nota

= =

−

π π3 4

2

3884

882

13

6

88

4 4

2 (102)

donde se ve que mientras s>1.039, el valor de B crecerá con la nota, hasta alcanzar el valor:

BE r

L T( )88

4

3884

882=

π (103)

Si ocurriese que s<1.039, B crecería al disminuir la nota, pero por encima del valor B(88)

indicado, lo que daría valores muy altos de inarmonicidad.

La ecuación de B(88) no debe confundir nuestro análisis, pues haciendo uso de la ecuación

99, que liga r88 y L88, se llega a:

CAPÍTULO 4: MODELO


BE

f

T

L( )

( )

8864 2

0 884

886=

πρ

(104)

lo que indica que no interesa ni tensiones muy altas ni L88 bajas.

También es fácil comprobar que las distintas combinaciones de L88 y r88 dan lugar a

variaciones muy apreciables en B(88), lo que tendrá consecuencias en nuestro modelo.

Concretamente, para diámetros entre 0.787 mm y 0.838 mm (0.031" y 0.033") y longitudes entre

5.0cm y 5.4cm, el coeficiente de inarmonicidad de la cuerda de la nota 88 varía 1.5 veces entre

sus valores menor y mayor.

Otra ecuación genérica del coeficiente de inarmonicidad, que se puede derivar de la

ecuación 101, teniendo en cuenta que la tensión se relaciona con la frecuencia fundamental

temperada, es:

BE r

L f=

πρ

2 2

40216

(105)

La figura 65 muestra posibles valores de B, calculados a partir de los dos valores extremos

de r88 y de los dos extremos de L88, para tres valores de ‘s’ alrededor de los típicos. Las

siguientes dos figuras 66 y 67, muestran detalles hasta la nota 64 (C6) y hasta la nota 30 (D3). La

figura 66 muestra que a partir de la nota C6 la inarmonicidad varía mucho de un caso a otro, e

incluso en la nota C6, la variación total puede llegar a 3.5 veces. La figura 67 muestra los valores

que tendrían las notas más graves si se pudieran montar en el puente de agudos y el orden de

magnitud de las notas previas al ‘salto a graves’.

CAPÍTULO 4: MODELO


Fig.65.-Coeficiente de inarmonicidad B para 4 valores extremos decuerda 88 y 3 valores de ‘s’. Existe gran variación de valores entre lasnotas de octavas graves y agudas. Existe variación en las octavas agudasdependiendo de los parámetros iniciales de diseño.

Fig.66.-Coeficiente de inarmonicidad B para 4 valores extremos decuerda 88 y 3 valores de ‘s’. Ya existe mucha variación en la nota 64,según las condiciones iniciales de diseño.

CAPÍTULO 4: MODELO


Fig.67.-Coeficiente de inarmonicidad B para 4 valores extremos decuerda 88 y 3 valores de ‘s’. Orden de magnitud en la zona del ‘salto agraves’.

Las pruebas realizadas para identificar notas, indican que la predicción del valor de B en

las octavas bajas y medias del puente de agudos (octavas 3 a 5 del piano) usando un modelo

promedio, es suficiente para la generación de los patrones y la identificación. Sin embargo existen

diferencias demasiado significativas en las octavas 6 y 7 que de hecho provocaban inicialmente

errores en la identificación.

4.1.1.1.- Efecto de un B erróneo en el patrón generado: sensibilidad del modelo

Es interesante calcular la variación de frecuencia que existiría en los parciales primero,

quinto y décimo respecto al valor armónico (es decir, la inarmonicidad), para las dos curvas

extremas anteriores de B. La relación de la inarmonicidad entre ambos casos extremos nos permite

analizar lo sensible que será la generación de patrones a errores en la predicción del valor de B en

el modelo. La figura 68 muestra este margen de variación. Los casos extremos son r88=0.838 mm

(0.033"), L88=5.0cm, s=1.052 para el B mayor y r88=0.787 mm (0.031"), L88=5.4cm, s=1.057

para el B menor.

Puede verse que el fundamental (primer parcial) es poco sensible a un error en el valor de

B, salvo en las octavas superiores 6 y 7, en las que la variación de frecuencias expresada en Hz,

CAPÍTULO 4: MODELO


Fig.68.-Variación de la inarmonicidad entre los casos máximo ymínimo anteriores, para los parciales 1,5 y 10. Se evalúa la sensibilidadal usar un valor de B no real.

como aparece en la figura 69, es apreciable, llegando hasta 15Hz en la nota 88. El parcial 5

empieza a presentar serios problemas a partir de la octava 5, por lo que debe controlarse bien la

evaluación de B para no tener errores en la identificación de notas a partir de dicha octava. El

parcial 10 puede ser problemático en todo el margen de notas del puente de agudos, por lo que

el uso de tantos parciales para la identificación, y por tanto para la generación de patrones, deberá

hacerse con un control bastante alto del valor de B asignado por el modelo.

A la vista de la figura 69, resulta evidente que todos los parciales superiores presentan

problemas a partir de alguna nota. Las notas más altas sólo presentan dos parciales en su espectro,

por lo que el patrón podría reducirse a sólo dos parciales, pero puede verse que incluso el segundo

parcial es crítico en esas notas altas. El algoritmo de identificación usa patrones con 10 parciales,

y resulta evidente que la situación es crítica para todas las notas del puente de agudos.

Esto nos lleva a la necesidad de despreciar un modelo fijo con un valor de B típico, y nos

requiere plantear un modelo adaptable. Esto puede realizarse por dos métodos:

-Entrenamiento previo

-Modelo con patrones múltiples

CAPÍTULO 4: MODELO


Fig.69.-Diferencia de frecuencias para inarmonicidades máxima ymínima anteriores, correspondientes a parciales 1,2,5 y 10. Resultaevidente el problema ante una elección errónea de B en el modelo.

Ni siquiera se podría plantear un modelo fijo en el caso de suponer que todos los pianos

se fabrican con un margen de variación del parámetro ‘s’ mucho más estrecho, concretamente

1.054<s<1.056. La figura 70 muestra la variación para los casos extremos.

Nótese que el ancho de los parciales de los patrones deberá ser suficientemente estrecho

para que el producto interno de cualquier par de ellos sea lo menor posible, nulo idealmente, lo

que supondría ortogonalidad entre los patrones. En las notas más bajas este ancho no puede ser

alto pues la separación entre el fundamental de una nota y la siguiente, aproximadamente un

semitono, es de unos pocos Hz.

CAPÍTULO 4: MODELO


Fig.70.-Diferencia de frecuencias para inarmonicidades máxima ymínima en caso de margen reducido de valores de ‘s’. El parcial 10supera los 10Hz de diferencia entre casos extremos en casi todo elmargen de notas del puente de agudos.

4.1.2.- MODELOS ADAPTABLES

La primera solución: entrenamiento previo, supone el uso de algunas notas sueltas para

evaluar el valor real de B en las octavas más altas, tras lo cual recalcular el modelo, regenerando

los patrones. El método es evidente pero presenta un gran problema al tratarse de notas tan altas:

el espectro de la nota apenas contiene el fundamental y un segundo parcial, que se atenúa

rápidamente. Además, las altas frecuencias que se miden con una resolución inferior a 1Hz

permiten la distinción de las tres componentes del unísono, por lo que habría que distinguir entre

ellas en el algoritmo de entrenamiento.

Una primera solución es promediar valores para obtener una valoración suficientemente

aproximada de B. Para ello se utilizará una ventana cuya convolución disminuya la resolución

espectral reduciendo el grupo unísono a un único máximo. Tras las primeras pruebas se ha

descartado esta solución pues el máximo resultante queda desplazado hacia arriba en frecuencia.

En el siguiente capítulo se describe el entrenamiento y la medida del fundamental y del parcial.

CAPÍTULO 4: MODELO


La segunda solución: modelo con patrones múltiples, pretende evitar lo anterior, utilizando

directamente un juego de patrones generados con distintos valores de B, que cubran todo el

margen debido a la posible variación de L88. Así, se realizarán varias métricas, una para cada

conjunto de patrones, y la que de máximo se usará para detectar la nota, e iterativamente, el

acorde.

A priori se esperan ciertos problemas de fiabilidad en este método dado que al abarcar

diversas posibilidades de patrones en frecuencias altas, algunas notas de la octava inferior tendrán

parciales que muy probablemente coincidirán con patrones de algunas de las posibilidades,

pudiendo establecer falsos máximos. Esto puede minimizarse si se sabe a priori si la nota pertenece

a esas octavas o no, lo que nos lleva al uso de la predetección.

Una tercera solución que se propone es realizar un entrenamiento aplicando un modelo

variable. El modelo variable elimina la necesidad de medir el valor de B pues se trataría de

seleccionar el valor de B que corresponda al conjunto de patrones que de el máximo en el

entrenamiento. Además, al ser entrenamiento, sabemos seguro que la nota pertenece a esas

octavas.

Como se verá a continuación, las soluciones de entrenamiento con patrones necesitan

partir de un dato que es realmente incógnita: la frecuencia del fundamental. Esta no es la

temperada sino que está modificada por la afinación , la cual a su vez varía con la curva de B que

tenga el piano.

Con tantas posibilidades, los métodos de patrones múltiples y variables elevan la carga

computacional de su implementación como método tipo ”fuerza bruta”.

Como se explicará se usa un método de medida directa de afinación y B pero con el uso

de patrones múltiples, pero no patrones de toda la nota sino patrones del unísono y sólo para

ciertas octavas.

CAPÍTULO 4: MODELO


Fig.71.-Curva de afinación promedio de Railsback y curva de afinaciónde un piano concreto durante las pruebas de Martin y Ward [Martin 61]

4.1.3.- AFINACIÓN

Resulta evidente que es necesario conocer la curva de afinación para poder generar unos

patrones espectrales fiables en octavas altas. La afinación real provoca una modificación en las

frecuencias fundamentales de hasta 86 Hz en las octavas más altas (35 cents a 4186 Hz). La figura

71 muestra la curva promedio de afinación estudiada por Railsback así como una curva con la

afinación concreta de un piano [Martin 61]. La desviación típica por afinación es de tan sólo 1

Hz en C5 (unos 3 cents) y va creciendo hasta C8. Es importante por tanto en octavas altas.

En octavas bajas también es importante. Si bien los fundamentales graves no sufren mucha

variación en Hz (30 cents a 30 Hz supone sólo 0.5 Hz), los parciales de orden 20 de dichas notas

sí difieren mucho si no se considera la afinación.

Existen dos aspectos de la afinación que se tienen en cuenta:

-Afinación del A4, que puede ser a 440Hz o subir a 442Hz.

-La curva de afinación de todo el piano

La primera puede obtenerse por entrenamiento con la nota A4. La segunda deberá estar

referida a la escala temperada modificada por la afinación del A4, indicándose los cents de

separación. El modelo parte de la curva Railsback, de modo que la octava 4 se considera sin

modificación , la octava 5 se le asigna una afinación pequeña del orden de 3 cents, y a las octavas

6 y 7 , en las que la desviación puede ser considerable, se les asigna una afinación conforme a la

calculada en el entrenamiento. A las octavas 0,1 y 2 también se les asigna según se calcula en el

CAPÍTULO 4: MODELO


entrenamiento.

La forma de realizar la afinación presenta una ventaja para nuestras medidas, y es que el

fundamental siempre presenta el valor que debe tener, con independencia de todos los efectos que

físicamente modifican la frecuencia de vibración. Así, si la frecuencia del fundamental se separa

de la temperada, es sólo por la afinación. Por supuesto que la frecuencia ‘flexible’ f0 sí diferirá

bastante de la del fundamental, evidenciando los efectos de inarmonicidad e impedancia de la

placa.

Podrían obtenerse unas curvas de afinación teórica, si consideramos que el criterio de

afinación sea eliminar el batido entre el fundamental de la nota que se está afinando y el segundo

parcial de la nota de la octava inferior. Para ello se usa cálculo iterativo a partir de la ecuación

que relaciona la frecuencia fundamental a que debe afinarse una nota respecto a la fundamental

de la nota de la octava inferior, para :

f fB

Bnota octava nota octava

nota octava

nota octava1 1 1 2

1 4

1, , , ,

,

,+ = ⋅

+

+ (106)

Si partimos como aproximación de una octava 4 sin modificación de afinación respecto

a la escala temperada, el resultado de la iteración para las octavas superiores aparece en la figura

72 para las dos curvas extremas de B que hemos considerando. Se confirma que pueden existir

apreciables diferencias en la afinación de las octavas 6 y 7.

CAPÍTULO 4: MODELO


Fig.72.-Curvas de afinación calculadas teóricamente considerando 0cents en toda las octava 4. Se muestran las dos curvas extremasconsideradas en el modelo. La octava 5 apenas presenta unos pocoscents de variación entre ambos casos. La 6 y la 7 sí presentandiferencias apreciables.

4.1.4.- ENTRENAMIENTO

En definitiva, el entrenamiento en octavas altas tiene dos fases:

1.-Entrenamiento con medida del fundamental para ajustar la curva de afinación. Incluye

la medida del A4.

2.-Entrenamiento con medida del segundo parcial o bien con patrones variables para

ajustar el valor de B en las octavas más altas.

Como se explicará en el capítulo de entrenamiento de agudos, el espectro de esas notas

presentan ciertas singularidades que podrían dar falsas identificaciones con patrones variables si

no se realiza un procesado previo de limpieza, que se explica más adelante

4.1.5.- PATRONES ESPECTRALES A GENERAR PARA LA IDENTIFICACIÓN

En la vibración real existen otros aspectos que modifican la frecuencia de cada parcial, lo

que lleva a tener espectros algo distintos de los patrones generados considerando sólo

CAPÍTULO 4: MODELO


inarmonicidad. Estos otros aspectos quedan considerados en el patrón mediante el uso de

ensanchamiento de los pulsos espectrales para incluir dichos márgenes de variación, siempre que

se justifique que dicho margen de variación es suficientemente pequeño. Principalmente tenemos:

error en la medida de la afinación, efecto de la impedancia de la placa resonante y variación de

anchura por valores de amortiguamiento distintos.

Se ha establecido un algoritmo de selección de la anchura del pulso espectral de los

patrones, que tiende a hacerlos más anchos al subir las notas y mantiene un mínimo al bajar las

notas. En todo caso deben ser más estrechos que la separación entre dos notas consecutivas que

es del orden de un semitono.

4.2.- ALGORITMO DETECCIÓN NOTAS AGUDAS PARA

ENTRENAMIENTO

Como ya se ha indicado, el entrenamiento con notas agudas de las octavas 6 y 7

persigue la obtención de valores tanto de la curva de afinación como del coeficiente de

inarmonicidad que permitan establecer la curva de B general de toda la zona aguda del piano a

analizar. Con estas curvas de afinación y de B se podrán generar los patrones que servirán para

identificar notas y acordes.

La detección del fundamental es importante para evaluar la afinación, aunque

aparentemente no sería significativo para evaluar el valor de B, pues la nota se afina al valor de

frecuencia de la escala temperada a oído, es decir, ya teniendo en cuenta el efecto de la

inarmonicidad del primer parcial.

Así, la valoración de B exige la detección de al menos el segundo parcial de la nota, lo

que supone un problema en algunos casos como indicaremos y solucionaremos.

4.2.1.- DETECCIÓN DEL FUNDAMENTAL PARA DETERMINAR AFINACIÓN.

Ya hemos indicado que la afinación supone variaciones del orden de varios cents en la

octava 6, llegando a varias decenas de cents en la octava 7.

CAPÍTULO 4: MODELO


El primer algoritmo aplicado para detectar el fundamental durante el entrenamiento de

una nota conocida consiste en segmentar la zona alrededor de la cual se espera tener al

fundamental y aplicar en ella una detección de máximo.

No presenta fallos de funcionamiento y siempre detecta un máximo. Ahora bien, el

espectro del fundamental de una nota de octava alta presenta claramente la estructura del

unísono (fig73).

Cualquiera de los componentes del unísono puede ser el máximo, pero sólo uno de ellos tiene

la frecuencia que caracteriza la nota en la afinación.

La afinación se realiza en dos etapas [Afinador 2001]. En la primera el afinador

bloquea la vibración de las cuerdas exteriores del unísono y afina sólo la cuerda central. Esta

determina la afinación de la nota. En una segunda fase, libera la vibración de las cuerdas

exteriores y las afina ligeramente por encima y por debajo hasta obtener la adecuada duración y

doble velocidad de decrecimiento del nivel característico del piano [Martin 47]. Este proceso

no implica que las cuerdas exteriores queden afinadas simétricamente respecto a la cuerda

central.

La afinación de ambas cuerdas extremas hacia abajo o bien a ambos lados de la central

produce un sonido poco interesante como puede demostrar cualquier afinador [Afinador].

Existen estudios sobre preferencias de separación de los unísonos [Kirk 59], en las que se han

hecho pruebas con afinaciones con las cuerda principal centrada en frecuencia respecto a las

exteriores, a pesar de que se reconoce que la tendencia es a afinar las dos cuerdas exteriores

ambas por encima de la central. Las preferencias obtenidas en dicho estudio limitan la variación

entre frecuencias de cuerdas externas a 2 cents, si bien se admite como máximo tolerable hasta

6 cents. El autor admite no haber hecho pruebas en las dos octavas más altas del piano (6 y 7),

pero aún así consideraremos los resultados como orientativamente válidos.

CAPÍTULO 4: MODELO


Fig.73.-Espectro de la nota E6 que muestra los componentes delunísono. El máximo no se tienen en le componente central que es el quemarca la afinación.

Con esta hipótesis, y teniendo en cuenta que la frecuencia temperada de la nota C6

(Do6) es del orden de 1046 Hz, la separación entre componentes del unísono llegará a ser del

orden de entre 1.2Hz a 3.5Hz, que son perfectamente diferenciables por un algoritmo con

resolución de 0.5Hz.

Así pues, según cual de los tres componentes del unísono sea el de máxima amplitud

(no tiene porqué serlo el central, y no suele serlo), el cálculo de la afinación puede sufrir

errores de unos pocos cents.

Este error se puede asumir de cara a la simple generación de patrones para

identificación sin más que ensanchar el pulso del patrón para englobar esos pocos cents de

variación.

El algoritmo mejorado que hemos desarrollado para detección del fundamental, es de

necesaria aplicación debido a un aspecto que se explicará en la detección del segundo parcial.

CAPÍTULO 4: MODELO


En todo caso, su uso da resultados más precisos.

Se trata de generar un patrón que emule el espectro de un unísono con sus tres

componentes separadas una cierta cantidad. A los pulsos se les asigna un ancho ajustable entre

varios valores.

Aunque existen varias posibilidades para modelar los pulsos, el primer candidato es el

pulso Hanning. Cuando se calcula una FFT de una sinusoide con ventana, el resultado ya se

sabe que es un pulso en vez de la teórica delta. Si la ventana es Hanning, la forma del pulso es

exactamente sen2, es decir, Hanning. Por ello, dado que el algoritmo de identificación calcula la

FFT de la señal a identificar usando ventana Hanning, lo mejor para identificar sus

componentes es usar un pulso con forma Hanning.

Sin embargo, nos permitimos la pequeña modificación de usar pulsos Hamming, que

tienen una cola un poco más duradera que los pulsos Hanning, lo que se corresponde más con

la realidad del espectro de las notas. Las pruebas realizadas muestran mejores resultados de

identificación usando Hamming que Hanning. Algunos autores proponen usar pulsos con

forma de distribución de Cauchy [Chong 99] basándose en experimentos de síntesis.

Los anchos se varían tomando tres valores: 1.5, 2.5 y 3.5 Hz. que consideramos

significativos tras analizar los espectros de varias notas del piano de muestra. Las separaciones

se varían en saltos de 0.5Hz desde un valor igual a la anchura menos 0.5Hz (para que los tres

pulsos no queden totalmente solapados, lo que no corresponde con la realidad), hasta un valor

que asegure que ninguno de los patrones generados en cada caso supere los 25Hz de anchura

total. Esta anchura de 25Hz no ha sido medida en ninguna de las notas del piano de muestra y

supone una relación entre frecuencias del orden de 40cents, lo que invita a considerar que

nunca se dará..

Para cada uno de los posibles patrones generados tomando varios valores de anchura y

separación, se calcula la convolución con la parte del espectro que contiene el fundamental de

la nota. Para ello, primero se segmenta la zona del espectro alrededor del fundamental como se

CAPÍTULO 4: MODELO


Fig.74.-Resultados de convoluciones para identificar un fundamentalcon su estructura de unísono

hacía en el algoritmo anterior . Después se calculan las convoluciones (La figura 74 muestra un

ejemplo). La que da valor máximo determina la anchura de pulsos, la separación del unísono y

el desplazamiento del patrón hasta coincidencia máxima. Con ellos se puede calcular la

frecuencia central del unísono (considerado simétrico, aunque en la realidad no lo sea del

todo), que será tomada como frecuencia del fundamental.

Como se dispone además de la separación del unísono y del ancho de los pulsos, se

puede generar un patrón del fundamental muy ceñido a este (figuras 75 y 76 ) o bien un patrón

simple basado en pulso único tipo Hanning, suficiente para el reconocimiento.

CAPÍTULO 4: MODELO


Fig.75.-Patrones de fundamental obtenidos mediante convoluciones conpatrones de unísonos. El resultado es muy ceñido al espectro real.

Fig.76.- Patrones de fundamental obtenidos mediante convoluciones conpatrones de unísonos. El resultado es muy ceñido al espectro real.

Las figuras 77 y 78 muestra los valores obtenidos de afinación para las notas de la

octava 6 del piano de muestra. La primera es la diferencia entre el fundamental medido y el

valor temperado y la segunda muestra la relación entre ellos en cents. Puede verse que los

valores pueden aproximarse por una curva de orden 2 ó 3, lo que permitirá un entrenamiento

CAPÍTULO 4: MODELO


Fig.77.-Medida de la afinación. Los fundamentales de las notas altas seafinan varios Hz por encima del valor temperado.

Fig.78.-Afinación: Medida de la afinación en cents para las notas de laoctava 6.

con sólo unos pocos valores.

La figura 79 muestra la comparación entre el resultado de la medida de la afinación que

se obtiene usando el método de la convolución de patrones o simplemente la detección del

máximo en el espectro. Además, la figura 80 muestra la separación entre unísonos y

fundamental correspondiente a los patrones que dan máxima convolución.

CAPÍTULO 4: MODELO


Fig.79.-Afinación: Comparación de los dos métodos de medida delfundamental. Aunque no hay grandes diferencias, el uso de convolucióncon patrones de unísono permite obtener más información que el métododel máximos, para otros cálculos.

Fig.80.-Separación del unísono detectada con el método de convolucióncon patrones de unísono. Aunque algunos superan los valores preferidosen los estudios existentes [Kirk 59], no resultan excesivos y justifican elmargen de valores posibles de dicho parámetro usado en el algoritmo dedetección.

CAPÍTULO 4: MODELO


Fig.81.-Error en la medida del fundamental.

Para comprobar la validez de los resultados de las medidas, hemos medido

directamente los valores de frecuencia fundamental y los otros componentes del unísono en el

espectro y hemos obtenido que el error máximo cometido en la evaluación del fundamental es

inferior a 1.5cents. concretamente, para la octava 6 del piano de muestra se tienen los errores

que muestra la figura 81, todos ellos inferiores a 1.5 cents.

En cuanto a la separación de los unísonos, estos no suelen ser simétricos en la realidad

por lo que un modelo con unísonos simétricos tiene que dar resultados con cierto error. Sin

embargo, a la vista de la figura 82, en la que se muestra el valor de separación del unísono más

alejado para las notas de la octava 6, puede verse que los resultados obtenidos en la evaluación

con el método de la convolución con patrón del unísono, son muy cercanos a la realidad, con

apenas algún Hz de diferencia, lo que justifica su validez.

CAPÍTULO 4: MODELO


Fig.82.-Separación respecto al fundamental, del unísono más separado,medido directamente en el espectro del piano de muestra. Sonligeramente mayores que los obtenidos al considerar unísonossimétricos, expuestos en la figura 80

4.2.2.- DETECCIÓN DEL SEGUNDO PARCIAL PARA CALCULAR B

Las figuras 83, 84 y 85 muestran un ejemplo de espectro de nota de octava alta . El

segundo parcial es muy pequeño frente al fundamental. El tercer parcial es prácticamente

inexistente por encima de la nota D6 (Re6). En la zona del segundo parcial aparece una

estructura espectral que indica la existencia de más tonos que los que corresponderían al

segundo parcial (que sólo sería un unísono de tres). Además existe nivel espectral de ruido que

puede llegar a ser superior al del segundo parcial.

Evidentemente, la medida del segundo parcial exige un algoritmo más elaborado.

En primer lugar, al usar un algoritmo sencillo de detección de máximos, tras la

segmentación de la zona de búsqueda, los valores obtenidos presentan tres posibles análisis:

CAPÍTULO 4: MODELO


Fig.83.-Espectro nota A6. Apenas el fundamental y un segundo parcialpoco destacado

Fig.84.-El espectro anterior con el eje logarítmico. Se aprecia aún mejorlo poco destacado que está el segundo parcial. Tiene más nivel elsegundo armónico de no linealidad (2f0). El tercer parcial puedeapreciarse separado del tercer armónico no lineal. Sus niveles son muybajos.

a)El valor es correcto aunque no sea el central del unísono

b)El valor no es correcto aunque corresponde a una estructura tipo tonos

c)El valor no es correcto y corresponde a una zona de ruido

CAPÍTULO 4: MODELO


Fig.85.-Detalle del espectro de A6 mostrando la zona del segundoparcial. Previamente y con mayor nivel se distingue el segundoarmónico no lineal del fundamental. El ruido en la banda 3000-3200Hzsupera en nivel al segundo parcial.

El segundo caso suele detectarse por el hecho de que el valor de B calculado a partir de

él no tiene ninguna posibilidad de ser real. No sólo porque se salga de las curvas tipo

desarrolladas en la introducción teórica del modelo, sino porque a veces dan valores de B

nulos o incluso ligeramente negativos (fig 86).

CAPÍTULO 4: MODELO


Fig.86.-Valores calculados de B a partir del valor de segundo parcialdetectado por máximos para toda la octava 6. La tendencia real estámarcada por la línea creciente, pero aparecen ciertos valores cercanosa 0 o incluso negativos, que son erróneos

Al comprobar la zona en la que se ha producido la detección, puede verse que es la

inicial de la estructura de tonos y que sus valores de frecuencia son prácticamente iguales al

doble del fundamental o algo menos, lo que justifica los valores nulos o negativos de B.

Resulta evidente que nos encontramos ante la réplica de segundo armónico del fundamental

debida a la no linealidad de la vibración.

Hasta ahora, se había considerado que el único efecto notable de la no linealidad eran

los productos de intermodulación de segundo orden correspondientes a la suma de parciales

anteriores [Conklin 99]. En el caso de notas agudas, debido al bajo nivel del segundo parcial, el

armónico del fundamental es claramente notorio.

La primera solución para el algoritmo es la comprobación de si lo detectado pertenece

a esa zona (verificando si la frecuencia no es suficientemente superior al doble del

fundamental) y en caso positivo, suprimir dicha zona del espectro y volver a evaluar el

máximo. Esta técnica ha funcionado salvo en los casos en que el ruido espectral es superior a

CAPÍTULO 4: MODELO


Fig.87.-B calculado a partir del valor de segundo parcial detectado pormáximos pero con comprobación de que no se trata de segundoarmónico no lineal.

la estructura tonal del espectro. La figura 87 muestra estos resultados.

Existen ciertas diferencias de valor de B. El algoritmo indica en sus datos de salida que

existe detección de valor de armónico no lineal y consiguientes acciones en las notas 7,8,10 y

11. Así, diferencias en notas distintas a estas se deben al cambio de usar detección de máximos

a usar convoluciones (p.e. primeras notas). La nota 7 incrementa ligeramente el valor de B

tras eliminar el armónico. La mejora no es muy grande porque la eliminación de armónico que

se realiza en este algoritmo no es muy sofisticada. Las notas 8,10 y 11 muestran el mayor

defecto de este algoritmo: Puede verse que la nueva B es incluso más negativa que antes, lo

que quiere decir que en la segunda detección se detectan frecuencias más bajas que incluso el

armónico no lineal. Esto se debe al ruido espectral existente por debajo de dicho armónico y

que tiene más nivel que el propio segundo parcial, por lo que el algoritmo de convolución da

máximos en esa zona

La solución definitiva desarrollada consiste en un algoritmo sofisticado de limpieza del

armónico no lineal y del ruido. Para limpiar el armónico no lineal es esencial tener muy bien

delimitado el fundamental, y para eso es esencial el algoritmo mejorado usado en la detección

del fundamental y explicado anteriormente.

CAPÍTULO 4: MODELO


Una vez bien evaluado el patrón del fundamental, con los tres pulsos del unísono

definidos por su anchura y separación, se procede a generar un patrón del armónico no lineal

centrado en una frecuencia doble, con separación del unísono doble y con anchura de pulsos

doble, lo que se corresponde con las conclusiones matemáticas sobre la distorsión no lineal.

Además, dadas las colas espectrales que en la realidad muestran tanto los

fundamentales como sus productos no lineales, el patrón para aislamiento del armónico no

lineal se ha generado en base a pulsos Kaiser con parámetro $=13, en vez de pulsos Hamming.

Esto permite modelar el espectro con pulsos cuya base sea hasta tres veces más ancha que la

anchura del pulso en puntos mitad (HAD), pareciéndose más a la forma real de los pulsos

espectrales de la nota.

Los pulsos resultante se normalizan a amplitud unidad.

El resultado puede verse en las figuras 88 y ? que muestran los espectros y los patrones

del armónico no lineal de orden 2 para diversas notas de la octava 6. Los armónicos debidos a

no linealidad quedan claramente marcados por los patrones de componentes no lineales, lo que

permitirá su eliminación con éxito.

La aplicación de estos patrones de armónico no lineal es evidente en las notas más

altas, en las que existe separación evidente entre las dos zonas espectrales (no lineal y parcial).

Basta con definir una máscara que anule los valores del espectro en el ancho del pulso del

armónico no lineal. Sin embargo esto es muy drástico en las notas más bajas (C6 a E6) en las

que la separación no es total y se pueden eliminar componentes propias del segundo parcial.

La decisión final ha sido establecer una máscara que con valores nulos en la mitad

inferior del pulso y con valores complementarios al pulso (1-p) en la mitad superior (fig.89).

El problema del ruido de nivel mayor que el segundo parcial, y que siempre aparece en

la zona anterior al armónico no lineal se resuelve también mediante una máscara adicional que

elimine esa zona del proceso de detección del parcial.

CAPÍTULO 4: MODELO


Fig.88.-Espectros de la zona de segundo parcial y patrones generadoscorrespondientes a segundo armónico no lineal. Notas C6,C#6 y D6

Fig.89.-Generación de la máscara de limpieza a partir del patrón delsegundo armónico no lineal

CAPÍTULO 4: MODELO


Fig.90.-Espectro con segundo armónico no lineal y segundo parcialcercanos y la máscara que los separa.

Fig.91.-Espectro con segundo armónico no lineal y segundo parcialsuficientemente separados y la máscara que los separa.

Así, se ha desarrollado un algoritmo que incluye ambos aspectos, el del armónico no

lineal y el del ruido, para generar una máscara para limpieza del espectro previa a la detección

del segundo parcial. Las figuras 90, 91, 92 y 93 muestran el espectro de dos notas (C6 y A6),

las máscaras calculadas y dicho espectro antes y después de la limpieza.

CAPÍTULO 4: MODELO


Fig.92.-Espectro antes y después de la limpieza con la máscara deeliminación de ruido y no linealidad, en una nota en que no están muyseparados segundo armónico no lineal y segundo parcial.

Fig.93.-Espectro antes y después de la limpieza con la máscara deeliminación de ruido y no linealidad, en una nota en que estánseparados segundo armónico no lineal y segundo parcial, y en la que elruido supera al segundo parcial.

Una vez realizada la limpieza, se aplica un algoritmo de detección al espectro

resultante. Una vez más podría usarse un algoritmo de máximos, pero también en esta ocasión

CAPÍTULO 4: MODELO


Fig.94.-Comparación de métodos para medir segundo parcial de cara alcálculo de B. Dos de ellos coinciden completamente y son los quepresentan menos variabilidad en los resultados. Se seleccionan para elalgoritmo de entrenamiento definitivo.

ha sido descartado. Se utiliza un algoritmo por convolución con patrones posibles del unísono

de segundo parcial análogo al usado para detectar el fundamental. Se han probado cuatro

posibilidades:

a) patrones con pulsos del unísono de anchura fija a 1.5Hz

b) patrones con pulsos del unísono de anchura igual a la calculada para el fundamental

c) patrones con pulsos del unísono de anchura doble que los pulsos del fundamental

d) patrones con pulsos del unísono de anchura variable.

La figura 94 muestra los valores de B obtenidos a partir de los valores medidos en cada

caso. Puede verse que el caso a) presenta mucha variación y que el caso c) presenta valores

demasiado altos en las notas bajas de la octava 6, sin respetar las curvas previsibles de B

(fig.95).

CAPÍTULO 4: MODELO


Fig.95.-Curvas de valores de B correspondientes a diversas situaciones reales límite. Losescalonamientos de las curvas se deben a considerar sólo valores del radio de las cuerdasestandarizados [Conklin 96c].

Los casos b) y d) dan el mismo resultado y es el mejor, al presentar una menor

variación y una variación más parecida a la esperada. De hecho puede comprobarse que en el

modelo de anchura variable, los anchos que dan máxima convolución para el segundo parcial

coinciden con los obtenidos para el fundamental, lo que está en consonancia con el hecho de

no relacionarse con este por una relación no lineal sino con el hecho de ser una vibración

adicional, linealmente independiente, con un amortiguamiento (factor Q y ancho de pulso

espectral) similar.

CAPÍTULO 4: MODELO


4.2.3.- APLICACIÓN DEL ENTRENAMIENTO AL MODELO

Una vez que se ha podido establecer con bastante precisión el valor de afinación y de B

para las notas agudas, se puede establecer un conjunto mínimo de notas a entrenar que

permitan interpolar los valores de afinación y B del resto de notas.

Además, la medida del coeficiente B de ciertas notas significativas, nos permitirá

localizar con cierta precisión el piano en entrenamiento dentro de las curvas de B, lo que nos

puede llevar a considerar como más probables ciertos valores de r88,L88 y ‘s’ y así delimitar

las posibles curvas de B, lo que disminuirá el número de patrones variables a usar en la

identificación. Concretamente, las notas de la octava 7 permiten fácilmente descartar

posibilidades, como puede verse en la figura 95 donde aparecen curvas de B en casos límites

de ‘s’ para las 4 combinaciones de r88 y L88 (curvas con mismo color son los límites para

valores extremos de s).

4.3.- MODELO PARA NOTAS GRAVES

Las notas graves son aquellas cuyas cuerdas transmiten su vibración a la placa

resonante a través del puente de graves. El puente de graves es más alto que el puente de

agudos, lo que permite que las cuerdas graves pasen por encima de algunas de las cuerdas

agudas sin tocarse, aprovechando más el espacio disponible en la estructura del piano.

Al contrario que las notas agudas, para las que existe mucha documentación sobre las

ecuaciones usadas para diseñar la longitud de sus cuerdas, las notas graves no disponen de

tanta documentación, siendo sus longitudes muy distintas de un piano a otro. La longitud de la

cuerda más larga (nota más grave) está limitada por el tamaño del piano. Dicho tamaño

también limita la longitud de la cuerda más larga del puente de agudos, por lo que la transición

del puente agudo al grave no siempre se realiza en la misma nota, aunque suele ocurrir entre la

20 y la 26 en los pianos de cola.

En general, la transición entre puentes, denominada “Salto a graves” supone una

disminución de golpe en la longitud de la cuerda, que luego sigue creciendo al bajar la nota

CAPÍTULO 4: MODELO


Fig.96.-Extremo final de las cuerdas en un piano de cola. El puente de agudos continúa por debajo de las cuerdasde notas graves. Las cuerdas se cruzan a dos niveles distintos. Aunque no resulte muy evidente, la primera cuerdadel puente de graves (a la izquierda en la foto) es más corta que las últimas del puente de agudos (a la derecha) quellegan con bastante ángulo. También se ven las piezas metálicas que fijan al puente las cuerdas de cada unísono,los pines finales que fijan la cuerda al marco metálico y el material absorbente (rojo) que elimina la vibración deese tramo de cuerda. También se aprecia el entorchado de las cuerdas del puente de graves frente a las simplescuerdas del puente de agudos.

hasta alcanzar la cuerda más larga (figura 96). La longitud de la cuerda más larga del puente de

agudos suele tener un valor intermedio entre la longitud de la cuerda más larga y la primera del

puente de graves.

Esta disminución repentina de la longitud supone una ruptura en la secuencia de valores

correspondientes a la vibración fundamental de la cuerda, lo que debe ser compensado con un

incremento de la densidad lineal de estas. Este incremento puede realizarse mediante cambio

del material (incremento de la densidad), aumento de la sección transversal de la cuerda o

incremento de la masa mediante cuerdas entorchadas (bordones). Esta última es la elegida para

evitar cambios muy abruptos en las características tímbricas del piano.

CAPÍTULO 4: MODELO


El modelado mínimo de las cuerdas graves supone la consideración de los siguientes

parámetros: longitud, tensión, radio del núcleo del bordón, radio total de la cuerda o su factor

de carga. Con ellos se puede prever el valor del coeficiente de inarmonicidad que resulta clave

para la generación de patrones espectrales.

Se va a explicar el desarrollo de un modelo de graves. Este modelo desarrollado,

realmente son tres modelos, cada uno de los cuales va superando las limitaciones del anterior.

4.3.1.- LONGITUD DE LAS CUERDAS GRAVES

A falta de ecuaciones típicas, consideraremos los valores medidos en el piano de

prueba. A partir de estos valores se obtendrá una ecuación. La hipótesis del modelo es que

dicha ecuación es común a la mayoría de los pianos y se considerará que sólo difieren en un

factor correspondiente a la longitud de la cuerda más larga.

La ecuación será del mismo tipo que la usada para el puente de agudos, apareciendo la

nota como exponente de una constante específica. La ecuación obtenida para el piano de

prueba es:

Lg

.a

sa*s nota

con a. *s

s y s .

= +

− −

=−

− − =

1427

0 412

1 24 0 974478

(107)

La ecuación normalizada para aplicar la hipótesis al modelo será la anterior dividida por la

longitud de la cuerda más larga, es decir, 1.427 m.

La figura 97 muestra el resultado de dicha ecuación. Puede verse que es algo menos

curva que la forma del puente de graves, lo que es debido a que el agraffe de graves también

cambia de posición al descender la nota, aumentando la longitud de las cuerdas.

CAPÍTULO 4: MODELO


Fig.97.-Curva normalizada de longitudes de cuerdas del puente degraves, usada para el modelo.

4.3.2.- FACTOR DE CARGA

El factor de carga evalúa el incremento de la densidad lineal de la cuerda debido al uso

de entorchado. Si la cuerda de acero que sirve de núcleo al bordón tiene una densidad lineal

expresada por ‘DLC’, entonces la frecuencia fundamental de vibración transversal del bordón

supuesto perfectamente flexible sería:

fL

T

F L

T

LC L0

1

2

1

2=

⋅=

ρ ρ (108)

siendo T la tensión, lo que nos lleva a que ρL , la densidad lineal del bordón, que controla la

frecuencia de vibración, puede expresarse como:

ρ ρ πL c cr F= 2 (109)

es decir, la densidad lineal del núcleo por el factor de carga ( ρc es la densidad del material del

núcleo, acero) .

Las ecuaciones del factor de carga según el entorchado son las siguientes [Conklin

96c], refiriéndose sus parámetros físicos a la figura 98.

CAPÍTULO 4: MODELO


Fig.98.-Cuerdas entorchadas. Parámetros para cuerdas con entorchadosimple y doble [Conklin 96c]

( )F 1d d d

d 1 entorchado simplew

c

w2

w c

c2

w

c

= ++

= + + =π

ρρ

πρρ

∆ ∆ ∆2 w

c

dd

; ; (110)

( ) ( )F 1

d 2d d d d d d d

d

c

w2

w u w c w u2

u c u

c2= +

+ + + +

πρ

ρ ρentorchado doble (111)

( )[ ]F = 1+ entorchadodoble

con mismo material

w

c

πρρ

ψ ψ ψδ

δ1 11

+ = +

= =; ; ;∆ ∆

dd

dd

w

c

w

u (112)

D d 2d 2d Diametro exteriorc w u= + + (113)

Tanto el entorchado simple como el doble se realiza con hilo de cobre. Los límites

recomendados para la ejecución de estos bordones son )#1.2 y *$2 [Conklin 96c], lo que

nos lleva a que los valores del factor de carga F serán menores de 10.4 para bordones simples

y menores de 19 para bordones dobles.

En los bordones simples, las condiciones anteriores obligan a R#3.4Ar.

CAPÍTULO 4: MODELO


Para ambos tipos de bordones (entorchado simple y doble) se puede llegar a la

ecuación para el factor de carga:

F .R

r.=

+0 892 0108

2

(114)

siendo R el radio exterior y r el radio del núcleo del bordón (cuerda de acero). Las constantes

de la ecuación se obtienen si se considera que las densidades del acero y del cobre son

respectivamente 7750 y 8800 kg/m3.

4.3.2.1.- Densidad lineal

La densidad lineal resultante del bordón se obtiene de (109) y (114) como:

ρ L D d= ⋅ +543 10 6583 2 2. (115)

Dado que el segundo término de la suma tiene valores inferiores a 10-4 para todo el margen de

valores del diámetro del núcleo, se propone la aproximación [Fletcher 64]:

ρ L D≈ ⋅55 103 2. (116)

4.3.2.2.- Tensión

La tensión es el tercer parámetro que afecta a la frecuencia de vibración. De la

ecuación (108) es fácil deducir que:

T f L dc cF= 02 2 2π ρ (117)

Ya se vio que para las cuerdas del puente de agudos, la tensión se mantenía

prácticamente constante para todas las cuerdas. Sin embargo, en el puente de graves se opta

por incrementar progresivamente la tensión al decrecer la nota [Conklin 96b], lo que como se

justificará a continuación, disminuye la inarmonicidad de las cuerdas más graves, que en caso

contrario tiende a subir.

4.3.3.- INARMONICIDAD

CAPÍTULO 4: MODELO


Existen otros aspectos que limitan la libertad a la hora de diseñar un piano y que por

tanto afectan al modelo. Se trata de la inarmonicidad, que también relaciona algunos de estos

parámetros. La inarmonicidad de los bordones puede ser aproximada con la fórmula [Fletcher

64]:

Bd

D L f= 4 6 106

4

2 402. * (118)

Esta fórmula se obtiene de considerar la aproximación de la ecuación (116) y un valor de

E=195GPa para el acero. Si consideramos la ecuación de inarmonicidad de una cuerda simple

que tenga la misma densidad lineal que el bordón, pero el mismo tamaño que la del núcleo, se

obtiene:

BEr

L f

Er

L f D

d

L f Dc

LB

c= = =π

ρπ3 4

402

3 4

402 3 2

64

402 216 16 55 10

4 3 10( . • • )

. • • (119)

por lo que la inarmonicidad de un bordón resulta ser igual a la de una cuerda del tamaño de la

del núcleo, con la densidad lineal del bordón, pero incrementada en un 7%, pues 4.6/4.3=1.07.

Además, la ecuación de la densidad (109) y la de la tensión(117) nos permiten indicar:

BEr

L f

Er

L f F

Er

L Tc

LB

c

c

c= = =107

16

107

16

107

4

3 4

402

2 2

402

3 4

2

. • . • . •πρ

πρ

π (120)

que coincide con la inarmonicidad del propio núcleo, incrementada un 7%.[Conklin 96c]

Si tenemos en cuenta las ecuaciones de inarmonicidad (120), de tensión (117) y de F

(114), hemos podido comprobar que resulta imposible establecer una secuencia decreciente de

los valores de B al bajar la nota. Además hemos comprobado que intentar mantener B

constante por debajo de la nota 26 e igual al valor para dicha nota, supondría ir incrementando

la tensión al bajar la nota desde un valor de unos 600N hasta casi 7000N en la nota más grave,

CAPÍTULO 4: MODELO


lo que resulta inviable. La conclusión evidente es que el sistema del puente de graves debe

asumir un incremento de la inarmonicidad B al bajar la nota, pero que dicho incremento puede

ser controlado si incrementamos la tensión al bajar la nota hasta valores admisibles entre

1500N y 2000N. Estas conclusiones están de acuerdo con los gráficos típicos de tensión e

inarmonicidad de graves en pianos de cola descritos en [Conklin96b, Conklin96c].

Nuestro modelo toma las conclusiones anteriores como base para su desarrollo.

4.3.4.- RADIO EXTERIOR DE LAS CUERDAS GRAVES

En una primera aproximación al problema, nos planteamos una curva de tensión que

tuviera una forma parecida a la descrita por Conklin [Conklin 96b], lo que nos llevó a:

T s snota= − =−2000 20 0 85• . (121)

Teniendo en cuenta las ecuaciones de tensión y de factor de carga F, resulta que:

r F R rT

L fc

2 2 22

020 892 0108

4= + =. .

ρ π (122)

Hemos observado que para todos los posibles valores de r (radio del núcleo), que varían entre

0.394 mm (0.0155") y 0.8 mm (0.0315"), y respetando que los valores de F sean inferiores a

19, cada nota exige un valor de R casi invariable con independencia del valor de r. Esto se

debe a que evidentemente r2F>>0.108r2. El resultado puede observarse en la figura 99 y puede

exponerse con dos ecuaciones:

r F R2 20892= . • (123)

DLf

T

c

=1

0 8920 . • ρ π (124)

Lo que indica que el diseño especifica una secuencia de diámetros exteriores de los bordones y

que posteriormente se debe decidir las secuencias de r y F que lo cumpla.

CAPÍTULO 4: MODELO


Fig.99.-Curvas de R exterior para todos los valores de r. Puede decirseque cada nota tiene un único valor posible de R exterior.

Si bien parece evidente que a partir de los valores de f0, de los valores de L

considerados y de la curva de T supuesta, se pueden calcular los valores del radio exterior de

todas las cuerdas graves, lo cierto es que la curva de T propuesta puede no ser la única, por lo

que es necesario comprobar cómo variarían los valores de D para otros valores de T.

Si consideramos varias curvas de tensión de modo que todas tengan una forma similar

pero con distintos valores en las cuerdas más graves, podemos proponer la ecuación:

T T m mT

y Tnota= − =−

=−−0

026 0085

600

0851000 2000• . ;

.... (125)

en la que se considera que la tensión en la nota 26 (última del puente de graves en el piano de

prueba usado) es del orden de 600N, que es un valor promedio como ya se justificó en el

modelo del puente de agudos. La figura 100 muestra la variación de los radios exteriores en

función de la tensión en las notas más graves.

CAPÍTULO 4: MODELO


Fig.100.-R exterior para las notas graves según la tensión en la notamás grave. Se consideran las curvas de L y T del modelo.

La tendencia es que los pianos tengan la mayor tensión posible para disminuir la

inarmonicidad, por lo que son más realistas las conclusiones si usamos las curvas de mayor

tensión. Concretamente, el valor de 1500N está dado para pianos de cola de 2.74 m [Conklin

96b], que son de los mayores. Cualquier otro piano menor tendrá cuerdas más cortas, lo que le

exige mayor R exterior (al exigir mayor r y/o F para vibrar a la frecuencia correspondiente) y

llevará a usar tensiones algo mayores para compensar la inarmonicidad.

Como consecuencia de que las curvas para tensiones mayores no muestran gran

variación en el valor de los radios exteriores, hemos decidido que nuestro modelo parta de una

curva de R exterior promedio y calcule la curva de tensiones. El ajuste a cada piano podrá

realizarse por un proceso de entrenamiento previo al de reconocimiento. Se realiza una

aproximación a las curvas de R exterior siendo la aproximación cuadrática suficientemente

buena. Se considera la aproximación a la curva de 1750N un buen promedio y se genera la

curva aproximada. Dicha curva se normaliza respecto al radio exterior de la nota más grave de

nuestro piano. Así, cualquier otro piano podrá modelarse inicialmente en función del radio

exterior de su nota más baja (A0) y de la curva promedio normalizada. Estos datos físicos

inicialmente necesarios para el modelo deberán tenerse disponibles antes de la identificación o

en su ausencia deberán sustituirse por un mayor número de notas en el entrenamiento.

CAPÍTULO 4: MODELO


Fig.101.-Curva normalizada de Radios exteriores usada por el modelo.

El uso de esta curva normalizada, junto con el dato del radio de la cuerda más grave

también permite evaluar aproximadamente la posición del “salto a graves” puesto que el

diámetro exterior de la cuerda de la nota más alta del puente de graves suele ser mayor que el

diámetro de la cuerda de la nota más baja del puente de agudos.

4.3.5.- ASIGNACIÓN DE VALORES DEL RADIO INTERNO Y FACTOR DE

CARGA

Para la evaluación de la inarmonicidad, y la consecuente generación de patrones

espectrales, es necesario conocer los valores de los radios internos y las tensiones o bien de los

radios internos y los radios externos, según la ecuación del coeficiente de inarmonicidad B que

se quiera usar.

El modelo desarrollado usa un algoritmo de asignación que empieza por asignar a la

nota más alta un diámetro de núcleo del orden de 0.838 mm (0.033"), que es uno de los más

bajos que suelen usarse [Conklin 96c], y luego se calcula el valor de F. El método se aplica

iterativamente para el resto de las cuerdas. Interesa mantener el radio del núcleo lo menor

posible para minimizar la inarmonicidad. Los criterios que marcan la obligación de incrementar

el radio del núcleo según vamos bajando en las notas son que debe cumplirse que:

CAPÍTULO 4: MODELO


Fig.102.-Curva B calculada por el modelo y aproximacionespolinómicas de orden 4 a la curva y a sólo 6 puntos de la curva

rR

y F≥ ≤34

19.

(126)

como ya se explicó anteriormente.

4.3.6.- COEFICIENTE DE INARMONICIDAD CALCULADO POR EL MODELO

Los valores de radio de núcleo obtenidos con el algoritmo anterior, así como la curva

de tensiones nos permite evaluar el coeficiente de inarmonicidad B con la fórmula 120.

El resultado se muestra en la figura 102 y se corresponde con la tendencia real de

disminuir ligeramente B para luego ir creciendo al disminuir la nota. Ya se justificó que era

imposible mantener constante o incluso disminuir B al bajar las notas, manteniendo un margen

de tensiones realistas. La misma figura 102 muestra diversas aproximaciones a dicha curva de

B.

La primera aproximaciones realizada es con un polinomio de orden 4, que permite

reproducir la curva con mucha precisión. Para ello se parte de los 26 datos de la curva. La

segunda aproximación es por tramos lineales, y muestra el caso de usar sólo 6 puntos de la

CAPÍTULO 4: MODELO


curva original. Hemos comprobado que 6 puntos distribuidos son los mínimos para que se

tenga un parecido suficiente. La última aproximación, que es la que más nos interesa, es un

polinomio de orden 4 calculado a partir de esos 6 puntos. Puede comprobarse que este

polinomio es muy parecido al anterior y más parecido a la curva original que la aproximación

por tramos lineales.

La conclusión importante de estas aproximaciones es que si consideramos que la curva

B calculada por el modelo se corresponde suficientemente bien con la realidad, esta realidad

puede ser ajustada a cada piano concreto mediante un entrenamiento que utilice tan sólo 6

notas bien repartidas a lo largo del puente de graves. De este modo, el modelo puede ser

entrenado para generar los patrones de 26 notas, a partir de tan solo 6 notas.

Hasta este punto, el modelo es capaz de calcular, a partir de ciertos valores físicos del

piano, la curva completa de inarmonicidad. Falta verificar si dicha curva es la real y en caso

contrario ajustarla. Para ello se mide la inarmonicidad real de ciertas notas y se compara con la

del modelo. A partir de ahí se realizan ajustes a los parámetros del modelo para minimizar el

error del coeficiente B calculado respecto al medido. Este proceso es el entrenamiento. Si el

modelo no puede ajustarse suficientemente, deberá mejorarse

4.4.- ENTRENAMIENTO del MODELO DE NOTAS GRAVES

El entrenamiento se realiza midiendo el coeficiente de inarmonicidad de las notas de

entrenamiento.

Medir el coeficiente B tiene varios problemas. Primero hay que medir las frecuencias

exactas de varios parciales. Esto es fácil con un algoritmo de análisis espectral, sobre todo si el

algoritmo conoce el valor del fundamental de la nota. Esto no es difícil pues al ser un

entrenamiento, la nota será una preestablecida y conocida por el algoritmo. Además, podrá

obtenerse la resolución que se requiera, ajustando el método y el tiempo de análisis de la nota

de entrenamiento.

Segundo, los valores medidos de frecuencia de cada parcial se deben tanto a la

CAPÍTULO 4: MODELO


inarmonicidad como al efecto de la placa resonante y están afectados también por la afinación,

lo que dificulta la evaluación de la inarmonicidad.

En cuanto al efecto de la placa resonante, si los parciales son muy altos, no sólo

muestran mejor el efecto de la inarmonicidad sino que suelen estar menos afectados por el

efecto de la placa resonante ya que a mayores frecuencias, los modos de la placa son más

densos y su efecto se suaviza.

El efecto de la afinación en el puente de graves supone una disminución de la

frecuencia respecto a la de la escala temperada en una cantidad que llega a alcanzar 35 cents en

las notas más bajas. Esto implica que el fundamental no coincide con un valor de la escala

temperada, lo que no supone ningún problema si la fórmula de cálculo del coeficiente de

inarmonicidad B no considera dichos valores teóricos sino sólo los valores reales medidos. Por

otra parte, la afinación también afecta a los valores exactos de los parciales, que disminuyen.

Esto es tenido en cuenta en el algoritmo de determinación de los límites de búsqueda de cada

parcial (segmentación del espectro).

En el caso de la medida de los fundamentales, dado que las notas del puente de graves

se extienden hasta valores del fundamental temperado de tan solo 116.5Hz, la variación

absoluta de frecuencia debida a la afinación es inferior a 1Hz (de hecho inferior a 0.6Hz según

hemos calculado a partir de la curva promedio de afinación [Backus 69]). Dado que el

algoritmo trabaja con una resolución de 0.5 ó 1Hz al analizar frecuencias, podemos considerar

despreciable el efecto de afinación para segmentar la zona del fundamental, y se usa el valor

temperado (dato conocido a priori) para controlar la segmentación. De hecho, los

fundamentales medidos coinciden con los valores de la escala temperada redondeados a los

valores de enteros de Hz (para resoluciones de 1Hz) o a múltiplos de 0.5Hz (para resoluciones

de 0.5Hz).

Como consecuencia de lo indicado, nuestra decisión ha sido:

a) Evaluar la inarmonicidad sólo a partir de los parciales 15 a 20.

CAPÍTULO 4: MODELO


b) Calcularla usando la ecuación:

f nf n B nfn B

BB

f

fn

nf

f

n

n

n

= + =+

+⇒ =

−

−

02

1

21

2

2

4

1

211

1 (127)

en cuyo cálculo se usan los valores medidos del fundamental y de cada uno de los

parciales 15 a 20

c) El valor elegido como coeficiente B de cada nota será el valor medio de los 5 ó 6

calculados.

El último punto supone asumir la hipótesis de que los parciales usados tienen

frecuencias que provocan que el efecto de la placa resonante esté distribuido alrededor de este

valor medio. esto equivale a suponer que dichas frecuencias se encuentran unas veces por

encima y otra por debajo de un modo propio de la placa resonante. Dado que los parciales

altos están en zona de alta densidad de modos propios de la placa, es razonable asumir dicha

hipótesis.

4.4.1.- RESULTADOS Y VALIDACIÓN DEL ENTRENAMIENTO

Al realizar el entrenamiento con el piano de prueba, hemos detectado que los valores

de B en las notas altas del puente de graves es mayor que el previsto por el modelo. Tras

proceder a entrenar todas las notas para tener una medida de todos los valores de B, se ha

comprobado que no era un error de algunas medidas sino una discrepancia entre el modelo y

las medidas (figura 103). Antes de proceder a los ajustes del modelo para mejorar la

predicción, hemos querido verificar si el entrenamiento ha sido correcto, pues las discrepancias

son altas.

CAPÍTULO 4: MODELO


Fig.103.-Validación del modelo inicial: el entrenamiento con 6 notasmostró discrepancias en las notas altas y al analizar con unentrenamiento de todas las notas se puede comprobar la necesidad deajustar el modelo con las notas entrenadas.

Fig.104.-Aproximaciones polinómicas a los valores entrenados y curvacompleta medida. Como los valores entrenados han resultado ser los devalor alto (máximos locales), la aproximación queda ligeramente alta.La de orden 5 al tener más ondulaciones se acerca más a la curvamedida.

Para ello, se han aproximado los 5 puntos medidos (sólo 5 ya que la prueba se hace

desde la nota C1) con un polinomio de orden 4 y de orden 5. En la figura 104 pueden verse

dichas aproximaciones y los valores de B de las notas que se usan para entrenar. También se

incluye para comprobación toda la curva de valores de B medidos en un entrenamiento de

todas las notas

CAPÍTULO 4: MODELO


Fig.105.-El modelo, donde ajusta, puede aproximar con menos error quela aproximación polinómica

Ambas aproximaciones se han usado para generar los patrones espectrales de las 26

notas de graves para los dos casos. Se ha realizado una comprobación del resultado de la

métrica de detección de cada patrón con todas y cada una de las 26 notas del piano de prueba

(“todos contra todos”).

Las figuras son muy densas para mostrar aquí. Los resultados muestran que mientras

que la aproximación de orden 4 presenta ciertas incertidumbres en la detección pues asigna

valores altos de similitud a varios patrones para la misma nota, la aproximación de orden 5 ha

sido infalible en este test, marcando claramente máximos de similitud sólo en los patrones

correspondientes a cada nota.

Como conclusión, el algoritmo de medida de B usado en el entrenamiento es bueno, y

parece suficiente entrenar con 6 notas para obtener unos patrones correctos, incluso con una

aproximación polinómica no muy buena. Por tanto, el modelo de piano no se ha ceñido

perfectamente a todos los valores de B entrenados y debe ajustarse, obteniéndose una

aproximación mejor que la polinómica.

De hecho, en la zona en que el modelo presenta un ajuste evidente en la figura 103, el

error en esas notas es menor que con las aproximaciones polinómicas (figura 105)

CAPÍTULO 4: MODELO


Aunque la aproximación polinómica parece ser suficiente para resolver el problema de

la curva del coeficiente B, no renunciamos a contar con un modelo que no sólo minimice el

error en la aproximación, sino que además permita obtener ciertos datos físicos sobre el piano

que se está entrenando.

4.5.- MEJORA DEL MODELO DE GRAVES

Aunque el modelo anteriormente descrito es suficiente para generar una secuencia de

valores de r y F aplicable a un piano, las medidas realizadas sobre el piano de prueba muestran

que, en las notas altas del puente de graves, la inarmonicidad se corresponde con cuerdas de

núcleo mayor que el asignado por este algoritmo. Es decir, el modelo no predice con suficiente

precisión la inarmonicidad en las notas más altas del puente de graves y se depende

completamente del entrenamiento para asegurar la fiabilidad del modelo.

Si no se fuera a realizar un entrenamiento, o bien se quisiera controlar que los valores

obtenidos del entrenamiento están dentro de un orden de magnitud adecuado, sería

conveniente sofisticar el modelo incluyendo criterios como los que se indican a continuación:

-Afinación del primer modo de vibración longitudinal de la cuerda

-Mantenimiento de la curva de “masa vibrante” o de impedancias de las cuerdas

-Elaborar un modelo que no requiera curva de tensión aproximada inicial

4.5.1.- AFINACIÓN DEL PRIMER MODO LONGITUDINAL

La vibración longitudinal de las cuerdas graves es parte integrante del sonido que

producen, y los fabricantes de pianos procuran afinarlo para que su frecuencia sea la de alguna

nota concreta de octavas superiores y no suponga un sonido disonante. La frecuencia del

primer modo longitudinal es:

fL

E

FLMc

1

1

2=

ρ (128)

que resulta ligeramente modificada por el efecto de carga del puente (extremo no

CAPÍTULO 4: MODELO


completamente fijo) y que como puede verse no se modifica al variar la tensión que afina el

modo transversal de la cuerda. Se puede elegir que la frecuencia del modo longitudinal

coincida con algún número entero (k) de semitonos respecto al fundamental transversal, en

cuyo caso:

E r

Tc kπ 2

122= / (129)

Esta ecuación indica que la relación entre las frecuencias de lo dos modos es inversamente

proporcional al estrés sufrido por la cuerda (estrés=tensión/sección), por lo que no puede ser

muy pequeña porque la cuerda se rompería. Según el caso elegido, tenemos un nuevo criterio

para elegir ya sea ‘r’ o ‘F’.

Hemos calculado para nuestro modelo, considerando la curva de longitudes obtenida

del piano de prueba, la frecuencia del primer modo longitudinal para cada posible valor de F, y

la hemos comparado con la frecuencia fundamental teórica (f0). La figura 106 muestra la gama

de posibilidades en cuanto a posibles valores de ‘k’, si bien lo normal es que se elijan valores

correspondientes a un número entero de octavas. Se ha documentado [Conklin 96c] que las

relaciones de frecuencias más interesantes se eligen en saltos de 100cents (saltos de semitono)

y que suelen restringirse al margen entre 4200 y 5200 cents, siendo preferidos los valores de

4800 cents (4 octavas), 4700, 4600 y 4300 cents. Se desaconseja la relación de 4400 cents y se

permite una ligera subida para adecuarse a la frecuencia fundamental real de la nota,

ligeramente incrementada debido al “estiramiento (‘stretching’) de la afinación. En la figura

106, el valor en cents puede obtenerse multiplicando el valor de ‘k’ por 100.

CAPÍTULO 4: MODELO


Fig.106.-Relación entre el primer modo longitudinal y el fundamentalde cada nota para varios valores de F. Se indican las relaciones de 4800y 4300 cents

Si los valores de F para un ‘k’ concreto no pudieran ser enteros, se puede reajustar

ligeramente la longitud de la cuerda para permitir un F entero para la frecuencia del modo

longitudinal buscada.

Este criterio no disminuye los grados de libertad sino que incrementa las posibles

variables a considerar. Además, no podemos afirmar que todos los pianos estén construidos

considerando esta afinación de modos longitudinales. Por eso hemos resuelto no incluirlo en el

algoritmo del modelo.

4.5.2.- MANTENIMIENTO DE LA CURVA DE “MASA VIBRANTE”

La masa de la longitud de la cuerda que vibra es la “masa vibrante” (M).

M L r FLL c c= =ρ ρ π• 2 (130)

Se ha comprobado [Conklin 96c] que dicha masa sigue una ley continua a lo largo de

todas las notas del piano, de modo que el logaritmo de la masa decrece linealmente con el

logaritmo de la frecuencia, sin presentar saltos de valor en el “salto a graves”. En dicho

artículo se ve también que apenas existen diferencias de masas vibrantes entre pianos de cola y

de pared, y que la variación es del orden de 2.15 veces por octava.

CAPÍTULO 4: MODELO


La impedancia que presenta cada cuerda de una nota se relaciona con la masa vibrante:

Z fMcuerda = 2 (131)

Sin embargo, la variación con la frecuencia así como el cambio del número de cuerdas

en ciertas notas concretas, hace que la curva de impedancia de cada nota no siga una ley tan

simple como las masas vibrantes.

Como puede verse, la curva de las masas puede usarse para ajustar la curva de radios

exteriores.

M r FL R Lc c c= =ρ π ρ π2 20 892. (132)

Los resultados que se obtienen para masas vibrantes típicas (200g en nota C1) implican

radios exteriores superiores a los considerados por defecto en el modelo descrito. Esto lleva,

junto con los valores de F admisibles para la afinación del modo longitudinal, a valores del

radio de núcleo más altos y por tanto con mayor inarmonicidad. Esta situación coincide más

con la realidad medida.

Sin embargo, al incluir este criterio en el modelo, se obtiene una curva de R exterior

que nos lleva a una curva de tensiones excesivamente elevadas para concordar con la hipótesis

de curva de tensión usada inicialmente. Por ello, hemos desestimado la inclusión de este

criterio en el modelo.

4.5.3.- MODELO REVISADO: SIN HIPÓTESIS INICIAL DE CURVA DE TENSIÓN

Este que ahora se describe es el modelo que se ha establecido como definitivo

(realmente es el segundo de los tres desarrollados). Las hipótesis básicas para su desarrollo

son:

-las longitudes de las cuerdas graves siguen la curva normalizada usada anteriormente.

-considerar que se intenta mantener la tendencia decreciente (`pendiente’) del

coeficiente de inarmonicidad al bajar las notas, hasta que se pueda. Para notas

inferiores a ese límite, ‘B’ crecerá rápidamente.

Este modelo no parte de una curva de tensión y por lo tanto no define una curva de ‘R’

CAPÍTULO 4: MODELO


exterior. Directamente establece un algoritmo de selección de valores de ‘r’ interior y ‘F’

basado en una serie de criterios:

-‘F’ tomará valores enteros. El más pequeño será 2 y el mayor 18. La cuerda de la nota

más alta siempre usará F=2.

-‘r’ tomará valores de entre los existentes en la realidad, partiendo de un valor inicial

que se usa para la nota más alta. El valor inicial de ‘d’ interior se encuentra entre 1.016

mm y 1.346 mm (0.040" y 0.053"). El valor concreto permite ajustarse al factor de

inarmonicidad ‘B’ medido en el entrenamiento para esa nota. El valor máximo de ‘d’

será de 1.524 mm (0.060") [Conklin 96c].

-Los valores de ‘r’ y ‘F’ de cada nota, se eligen aproximando lo más posible el factor

de inarmonicidad ‘B’ correspondiente al valor previsto. Todo ello forzando un

incremento controlado en el valor de ‘r’ al bajar la nota y el consiguiente incremento de

‘F’. Esto se hace porque corresponde con la realidad de los pianos, que no presentan

cambios bruscos de una nota a otra.

-El valor previsto de ‘B’ se calcula a partir de los valores medidos en el entrenamiento,

considerando la relación de disminución (‘pendiente’). Sólo se aplica a las notas

superiores del puente de graves.

-Una vez que se alcanza un valor de F preestablecido (no tiene porqué ser el máximo

18), se ha llegado al límite en que B sigue decreciendo. F se mantendrá constante para

las cuerdas inferiores y ‘r’ tenderá a incrementarse, aumentando ‘B’. Este valor lo

denominaremos Fmax.

-Para controlar el aumento de ‘B’, los valores de ‘r’ no se incrementan de cualquier

modo sino que se recalculan para mantener el comportamiento de la curva de R

exterior calculada a partir de las notas superiores. Como ya sabemos, tienden a existir

curvas típicas de R exterior ( o bien curvas típicas de tensión) que pueden aproximarse

con polinomios de orden 2 ó 3. Esto permite aproximar la curva con datos de las notas

superiores y calcular el valor que le correspondería a la nota actual.

-Si los cálculos anteriores requieren un valor de ‘r’ que supere su máximo, entonces se

mantendrá ese máximo y se incrementará F, siempre sin superar el valor de 18.

CAPÍTULO 4: MODELO


Indicar que este algoritmo de modelo de graves requiere sólo 3 datos iniciales: la

longitud de la cuerda de A0, el valor límite de ‘F’ (Fmax) y el valor inicial de ‘r’. Existe un

cuarto parámetro que se considera fijo y que se extrae del entrenamiento de las notas agudas y

es la tendencia de variación de B en la cercanía del ‘salto a graves’ (‘pendiente’).

Las comprobaciones iniciales realizadas muestran que Fmax no puede ser menor de 13,

pues las curvas del coeficiente de inarmonicidad B calculadas muestran comportamientos

anómalos.

4.5.4.- RESULTADOS Y VALIDACIÓN DEL MODELO CON ENTRENAMIENTO

A partir de los datos obtenidos durante el entrenamiento de las 6 notas, se ha aplicado

el algoritmo del modelo, realizando ajustes a los tres parámetros: longitud A0, r inicial y F

límite.

Se han ajustado en el orden indicado, minimizando el error de la curva calculada por el

modelo respecto a los valores medidos durante el entrenamiento. En vez de minimizar un error

promedio, cada parámetro se ajusta para minimizar el error en unas notas concretas.

Las figuras 107 y 108 muestran la aproximación que se obtiene con el ajuste del

modelo a las notas de entrenamiento y el error cometido a lo largo de las 23 notas, comparado

con el error de la aproximación polinómica de orden 5.

CAPÍTULO 4: MODELO


Fig.107.-El modelo ajustado durante el entrenamiento reproduce conbuena aproximación el comportamiento del coeficiente deinarmonicidad en las notas graves.

Fig.108.-El error del modelo tiene un mejor comportamiento que elerror de la aproximación polinómica de orden 5 que permitió laidentificación de todas las notas

Puede verse que aunque los valores máximos absolutos de los errores son del mismo

orden de magnitud (aunque en notas distintas), el modelo ajustado produce un error con una

media más cercana a cero (0.28e-5 frente a -0.68e-5) y dado que la desviación de valores es

CAPÍTULO 4: MODELO


similar (0.14e-4 frente a 0.15e-4) el error está más repartido. Además, la suma cuadrática de

ambos errores es mucho menor en el caso de usar el modelo (0.43e-8 frente a 0.6e-8).

En conclusión, el modelo demuestra que al ser bien ajustado permite obtener una mejor

aproximación a la curva del coeficiente de inarmonicidad B

Posteriormente se han generado los patrones a partir de dicha curva calculada por el

modelo y se ha comprobado la métrica en un “todos contra todos”, obteniéndose una

identificación inequívoca de todas las notas del puente de graves.

En conclusión, el modelo es capaz de ajustarse a los 6 valores entrenados y calcular

una curva del coeficiente de inarmonicidad B para el resto de las cuerdas, que usada para

generar patrones espectrales permite la identificación de todas las notas. Es por tanto un

modelo definitivo bajo las hipótesis establecidas.

4.6.- OPTIMIZACIÓN DEL ENTRENAMIENTO DEL MODELO DE

GRAVES

Todo el modelo definido hasta ahora mantiene una hipótesis inicial que no se ha

modificado y que es que la curva de longitudes sigue una ley concreta. Basta conocer la

longitud de la cuerda más larga (nota A0) para obtener la curva de longitudes que es base del

algoritmo del modelo. Dicha longitud puede ser calculada iterativamente por el propio modelo

al ajustarse al valor de inarmonicidad de la nota A0 durante el entrenamiento.

Si al modelo, que ya ha sido validado con el piano de muestra, se le modifican los

parámetros, puede comprobarse que todos ellos tienden a modificar sólo una parte de la curva

del coeficiente de inarmonicidad con la nota. Muchos de ellos modifican zonas coincidentes,

pero puede comprobarse (figura 109) que ninguno modifica el valor de inarmonicidad de la

nota A0 (salvo la propia longitud de la cuerda A0) ni la forma de la curva en las primeras notas

siguientes a A0.

CAPÍTULO 4: MODELO


Fig.109.-Valores de B calculados por el modelo para varios valores delos parámetros, manteniendo fija la longitud de A0. Las primeras notasno se ven afectadas por el resto de parámetros. Las restantes sufrenefecto combinado, si bien se aprecia cierto predominio de algunosparámetros en algunas notas. En total hay representadas 18 curvas(combinación de 3 valores de Fmax, 3 valores de pendiente y 2 valoresde diámetro inicial). Muchas de ellas coinciden en ciertas zonas,indicando la independencia respecto ciertos parámetros

Puede verse que en las notas superiores (de la 20 en adelante) tiene predominio el

efecto de los parámetros radio inicial y pendiente, siendo independientes de Fmax. Las notas

intermedias son las que más notan el efecto del valor de Fmax, sin ser independientes del

efecto de los otros parámetros.

Así, pueden establecerse dos interesantes hipótesis de trabajo adicionales con el

modelo:

1.- La inarmonicidad medida para la nota A0 permite calcular el valor de la longitud de

dicha cuerda.

2.-La invariabilidad de la forma de la curva para las primeras notas está asociada a la

forma de la curva de longitudes considerada estándar por el modelo.

Mediante la aplicación del modelo para distintos valores de la longitud de A0 se puede

obtener una tabla de asignación longitud-coeficiente de inarmonicidad que permita durante

CAPÍTULO 4: MODELO


Fig.110.-Valor de B calculado por el modelo para 121 valores delongitud de A0 entre 80 cm y 200 cm. Dichos valores se obtienen conindependencia de los valores del resto de los parámetros introducidos almodelo. La curva puede aproximarse por polinomio de orden 7.

cualquier entrenamiento calcular la longitud al medir el coeficiente de inarmonicidad. En la

figura 110 puede verse que dicha relación puede establecerse mediante un polinomio de orden

7 en vez de usar una tabla.

Por otro lado, la existencia de una curva estándar para las longitudes de las cuerdas de

graves es una suposición que ha resultado útil para desarrollar un modelo interesante, pero que

resulta poco realista. Con independencia de la longitud del piano de cola, su ancho es

invariable ya que todos tienen 88 notas y las teclas tienen una ancho similar en todos. De ese

modo, cuanto más largo es el piano, mayor gradiente tendrá la curva de longitudes de las

cuerdas del puente de graves. Este gradiente puede quedar ligeramente compensado por el

hecho de que al ser más largo el piano, el “salto a graves” se hace en notas más bajas pues se

pueden instalar cuerdas más largas en el puente de agudos. Los pianos de cola más largos

presentan el salto a graves alrededor de la nota 20, como ha podido comprobarse por

observación de varios pianos.

El hecho es que el uso del modelo para ajustar la curva de inarmonicidad de todo el

CAPÍTULO 4: MODELO


puente de graves a partir de los datos de 6 notas durante el entrenamiento presenta errores si el

piano es más largo o más corto que el usado de muestra. Esto ha podido comprobarse al

entrenar otro piano distinto.

La optimización del proceso de entrenamiento del modelo, que permite ganar

generalidad, supone:

a)Calcular la longitud de la cuerda A0 a partir de la medida de su coeficiente de

inarmonicidad, en base a la curva anteriormente descrita.

b)Incluir en el modelo la variabilidad de la curva de longitudes, que se ajustará

considerando la zona de las primeras notas del coeficiente de inarmonicidad (2 de las

notas de entrenamiento), de forma que la curva modelada obtenga el mínimo error para

las notas medidas.

c)Establecer, como consecuencia de lo anterior, la curva de longitudes que usará el

modelo.

d) Se podrá buscar un ajuste más fino del modelo, realizando varias pruebas con

distintos valores del radio inicial (el de la cuerda de la nota más alta) y con distintos

valores del valor límite de F. Estos parámetros afectan principalmente a la zona de

notas intermedias (F límite) y de notas altas (r inicial) del puente de graves. Se elegirá

la combinación que suponga menor error en el coeficiente de inarmonicidad para las

notas entrenadas.

4.6.1.- MODELO CON VARIACIÓN DE LA CURVA DE LONGITUD

La curva de longitud va a seguir una ecuación análoga a la usada para el modelo inicial:

Lg

LAa

sa*s nota

con aLA *s rel

sbb bb nota mayor rel

L

LA

bbbb

= +

− −

=−

− −= =

0

0 11 1 0

( ); ;

(133)

CAPÍTULO 4: MODELO


Fig.111.-Efecto de considerar curvas de longitud de cuerdas gravesdistintas pero con igual relación entre la longitud de las notas extremas.

La figura 111 muestra el efecto, en el cálculo realizado por el modelo, al modificar las

curvas de longitud de manera que cambie el parámetro “s” pero no la relación entre longitudes.

Se calcula para dos valores de longitud de A0 (1.4m y 2m). El resto de parámetros del modelo

se dejan fijos. Puede verse que existe cierta alteración en la zona de la curva de las primeras

notas. Existen también evidentes efectos en el resto de notas, por lo que este ajuste deberá

realizarse con anterioridad a otros al aplicar este modelo a la aproximación de la curva de B.

También puede observarse que la pendiente de la curva B no sólo depende del

parámetro “s” de la curva de longitudes sino que es menor para menor inarmonicidad de la

nota A0.

El efecto de variar la relación de longitudes del puente de graves incluso manteniendo

un valor fijo de “s” puede verse en la figura 112. Para relaciones menores de las usadas en la

figura (mayor diferencia entre las longitudes del extremo del puente), la zona ascendente

empieza en notas aún más inferiores, pero aunque parece dar más libertad para ajustar curvas,

no tiene sentido pues lleva a pianos con gran inarmonicidad en graves. Por otro lado, aunque

puede verse que los pianos de mayor cuerda A0 (menor inarmonicidad en nota A0) pueden

usar una relación menor que otros, sin embargo, es previsible que la relación se haga mayor

para mejorar la inarmonicidad global de los graves. Esta situación lleva a pensar que lo que se

suela mantenerse constante al incrementar la dimensión del piano es la diferencia y no la

CAPÍTULO 4: MODELO


Fig.112.-Efecto de modificar la curva de longitudes variando la relaciónpara una misma “s”. A menor relación mayor inarmonicidad.

relación entre las longitudes del extremo del puente.

Esta última afirmación, unida a la posible variación de valores de “s”, concuerda con el

hecho de que el número de cuerdas del puente varía de un piano a otro al aumentar sus

dimensiones.



CAPÍTULO 5: RECONOCIMIENTO

En este capítulo se presentan los aspectos relativos al método usado para la identificación

de las notas y acordes. Se define la métrica usada para comparación y se establecen los aspectos

concretos para la generación de los patrones de identificación.

Se utilizan los resultados de identificación de notas sueltas como fase de validación del

método de generación de patrones y se explican los métodos de optimización de la identificación,

entre los que se encuentran algunos de procesado previo de la señal a identificar.

Finalmente se presenta el método de reconocimiento de acordes en el que se incluyen

técnicas de validación de las identificaciones.

Para facilitar el seguimiento, se incluye en el anexo una tabla con indicación del índice de

la nota (numeración identificativa de la nota del piano de 1 a 88), nombre de la nota tanto en

notación inglesa como en denominación española, y el valor de frecuencia teórica (fundamental

según escala temperada).

5.1.- MÉTODO DE RECONOCIMIENTO

Se usa un reconocimiento de patrones por similitud (“pattern-matching”). La máxima

similitud se evalúa mediante una métrica.



La métrica usada para determinar si una nota es más cercana a un patrón u a otro es el

producto interno del espectro de la señal con todo los patrones. El producto interno más alto es

el que describe al patrón candidato más parecido y determina que sea la nota correspondiente a

dicho patrón la que se considere identificada.

metrica m espectro n patron nmn

( ) ( ) * ( )= ∑ (135)

Cada patrón “m” se compara con el espectro para obtener una métrica. La comparación

supone sumar los productos punto a punto del espectro y del patrón. La suma total es la métrica.

Las componentes espectrales de la señal que coincidan con las componentes de los

patrones sumarán (“puntuarán”) en el cálculo del producto interno.

El inconveniente de dicha métrica es que existen varios patrones que puntúan ante la

misma estructura espectral de la señal y que incluso puede haber falsas detecciones. Es típico que

una cierta componente espectral pueda puntuar como segundo parcial de un patrón, como

fundamental de un patrón de doble frecuencia o como tercer parcial de un patrón de frecuencia

mitad. Así, ante ciertas componentes espectrales, aparecen varios patrones candidatos separados

octavas enteras. Esta ambigüedad de octava se minimiza como se explicará en adelante.

En la figura 114 se aprecia un caso de falsa detección en el que el patrón de la nota 21

(puntúa más que el patrón de la nota 9 que es la verdaderamente existente. Para ello, la figura

muestra no sólo el espectro de la señal y los dos patrones comparados, sino también la “métrica

acumulada”.

La métrica acumulada en un punto del espectro es el valor de la suma de productos punto

a punto del espectro y el patrón hasta ese punto. La métrica acumulada permite ver la evolución

del cálculo de la métrica y ver cómo afectan los distintos parciales a la métrica final

metrica acumulada m N espectro n patron nmn

N

_ ( , ) ( ) * ( )==

∑0

(136)



Fig.114.-Se muestra el espectro de la nota 9 y los patrones 9 y 21,separados una octava. También se muestra como van puntuando lasmétricas. Puede verse que la métrica del patrón 21 supera a la del 9,provocando un error de identificación.

La ventaja de esta métrica radica en que permite una definición más simple de los patrones.

Si se hubiera elegido una métrica consistente en el error cuadrático medio entre el espectro a

analizar y los patrones, estos últimos deberían generarse teniendo en cuenta la estructura de

amplitudes del espectro. Como ya se explicó en el apartado de fundamentos acústicos, la

distribución de niveles espectrales depende de la excitación, la cual varía mucho con la forma de

tocar el piano y la forma de interpretar una pieza musical. Si se intentase dotar a los patrones de

una estructura de niveles, esta se correspondería con la de las notas tocadas durante el

entrenamiento. Pero no se correspondería bien con los niveles espectrales de las notas tocadas en

un pasaje o como parte de un acorde. Los errores serían mayores.

El algoritmo de entrenamiento diseñado, incluye la extracción de la estructura de niveles,

y se ha llegado a generar unos patrones teniendo en consideración dicha estructura. Podría

pensarse que incluso la métrica de producto interno se beneficiaría de usar patrones con estructura

de niveles en base a la señal entrenada, pero el resultado de la identificación, incluso ante notas

sueltas, no ha sido mejor que con patrones que no consideraban la estructura de niveles.



5.2.- APLICACIÓN DEL MODELO: GENERACIÓN DE PATRONES

5.2.1.- INARMONICIDAD, AFINACIÓN Y MEDIDA DE PARCIALES

La inarmonicidad que existe en una nota viene incluida en la fórmula que expresa la

frecuencia de vibración real de cada uno de los parciales de una cuerda con rigidez:

f nota nf n Bn nota nota( ) _= +021 (137)

en la que se indica la frecuencia real de vibración respecto a f0, que es la de vibración si la cuerda

fuese perfectamente flexible. Esta fórmula se denomina en muchas ocasiones como ‘ecuación de

inarmonicidad’

Para muchos cálculos es buena aproximación considerar que la frecuencia ‘flexible’ f0

coincide con el valor correspondiente a la escala temperada.

Sin embargo, la realidad de los instrumentos es que su fundamental (primer parcial real)

debe tener una frecuencia igual a la de la escala temperada, por lo que los cálculos y medidas

reales más precisas deben considerar no que f0(nota)=fT(nota) sino que f1(nota)=fT(nota). Esto

lleva a reescribir la ecuación de inarmonicidad como:

f nota nfn B

Bn notanota

nota

( ) _=+

+1

21

1 (138)

en la que f1 tomaría los valores de la escala temperada.

Lo anterior equivale a decir que la frecuencia ‘flexible’ f0 es algo menor, en todas las notas,

que los valores de la escala temperada, y consecuentemente debería introducirse en el modelo de

los puentes de graves y agudos. El resultado sería calcular partiendo de tensiones ligeramente más

bajas. La variación es tan pequeña que una vez más puede asumirse que se realizará en los ajustes

de afinación y que no merece ser incluida en los cálculos del diseño de las cuerdas, en los que



como ya se vió, se considera que f0(nota)=fT(nota).

El valor más alto de B, que es B(88) impondría la máxima disminución de frecuencia

‘flexible’. Concretamente, si consideramos el caso máximo de B(88)=0.02, que aparece en la

figura 65 en el capítulo 4, tendremos f0(88)=0.99015fT. Esto supone disminuir la tensión en 0.9804

veces, que supone un 2% de disminución, aplicable a todas las notas al ser un diseño de T

constante. Estas pequeñas disminuciones de frecuencia y tensión son asumibles para el diseño de

cuerdas e incluso para considerar en la generación de patrones que f0(nota)=f1(nota)=fT(nota).

Sin embargo, en la generación de patrones se usará f1(nota)=fT(nota).

Una segunda consideración a tener en cuenta en la afinación del piano, es el hecho de que

la escala temperada típica supone que la nota A4 tiene su fundamental a 440Hz. Sin embargo, cada

vez es más común que las orquestas afinen sus instrumentos respecto a una escala temperada con

A4 a 442Hz. Esto supone que en cada caso debe usarse una escala temperada u otra.

La tercera consideración sobre afinación, especialmente importante en el caso del piano,

tiene que ver con la existencia de inarmonicidad. Ya se ha explicado que para disminuir los batidos

entre el fundamental de una nota y el segundo parcial de la nota una octava inferior, las notas van

afinándose con fundamentales cada vez mayores respecto al valor de la escala temperada. Ya no

se trata de adecuar la escala temperada a una referencia distinta, sino al hecho de no trabajar con

escala temperada.

El ajuste se realiza tomando la octava 4 como referencia (pues se empieza por afinar el

fundamental de A4 al valor establecido de 440 ó 442 Hz) y se incrementa el fundamental, respecto

a los valores temperados, en las octavas mayores y se reduce el fundamental, respecto a los valores

temperados, en las menores.

En definitiva, el fundamental real f1 tiene una frecuencia que se obtiene a partir de:

a) Frecuencia de A4

b) Frecuencia temperada calculada a partir de a)

c) Modificación por la afinación para disminuir batidos (‘curva de afinación’).



Como las curvas de afinación se miden como desviación del fundamental real respecto al

valor temperado, puede decirse que para la cancelación de batidos, matemáticamente debe

cumplirse que:

f fB

Bnota oct nota oct

nota oct

nota oct1 1 2

1 4

1_ _ _sup _ _ _inf

_ _inf

_ _inf

= ⋅ ⋅+

+ (139)

por lo que queda claro que la curva de afinación teórica es el término de raíz cuadrada. Esta curva

depende de los valores del coeficiente B que tengan las cuerdas. Por eso, las curvas de afinación

reales pueden ser muy distintas, al igual que lo son las curvas de B. Además, no todos los

afinadores considerarán que la eliminación total del batido es el criterio perfecto de afinación,

puesto que dicha operación se realiza a oído por parte de los mejores afinadores. Por último, esta

fórmula no considera el efecto de la placa resonante sobre el segundo parcial de la nota de octava

inferior.

Un estudio más detallado de la cancelación de batidos, aunque con una ecuación más

simple para el efecto de la inarmonicidad en al afinación se tiene en [Lattard 93].

5.2.1.1.- Otras aproximaciones

Algunos autores [Benade 76][Lattard 93] proponen un cálculo más sencillo basado en la

aproximación de la ecuación de inarmonicidad por los dos primeros términos del desarrollo en

serie de la raíz cuadrada, quedando:

( )f nota nf nB

nf n Jn notanota

nota( ) _ _= +

= +0

20

212

1 (140)

Esta aproximación ha sido evitada en la aplicación de los modelos, pues provoca errores

apreciables en parciales altos de notas altas. Como ejemplo, una nota 64 (C6) con un B=2A10-3

tendría su quinto parcial 1.0003 veces más alto con esta aproximación que con la fórmula original.

La diferencia en frecuencias sería casi 2Hz. Es evidente que para notas superiores a C6, la

diferencia empieza a ser apreciable en una generación de patrones con precisión de 0.5Hz y



anchura de pulsos de unos cuantos Hz.

5.2.2.- EFECTO DE LA PLACA RESONANTE

Ya se ha indicado que la placa resonante y el puente establecen una impedancia en la

terminación de la cuerda que no es infinita, por lo que la frecuencia real de vibración no es la que

se obtiene con las fórmulas para cuerdas fija-fija.

Una vez más, puede incluirse un término en la ecuación de la frecuencia, que incluya esta

variación. Este término es complicado y en este trabajo se han aportado soluciones para

implementar este término.

Igual que con la afinación, el efecto de la placa sobre el fundamental no es apreciable pues

en la afinación se ha asegurado que el fundamental real tenga el valor concreto indicado en el

apartado de la afinación, y esto incluyendo el efecto de la placa. Sin embargo, los restantes

parciales sí sufren una variación respecto a los valores previstos anteriormente.

El planteamiento usado para tener en consideración el efecto de la placa resonante ha sido

el de acotar su efecto y considerar las posibles variaciones en el valor de la frecuencia de los

parciales de cada nota. Esa variación supone una banda de incertidumbre que va a ser cubierta

mediante el ensanchamiento del pulso del patrón espectral.

Las notas usadas para entrenar presentan el efecto de la placa. Los valores de los parciales

medidos son tales que al calcular el coeficiente de inarmonicidad para cada parcial, con respecto

al fundamental, no se obtiene un valor fijo, cosa que ocurriría si no existiese efecto de la placa.

Esto hace que la medida del coeficiente de inarmonicidad durante el entrenamiento no sea

totalmente real.

Los cálculos realizados sobre el efecto de la placa resonante así como los resultados de las

medidas invitan a realizar la hipótesis de que los valores de las frecuencias de los parciales se

distribuyen alrededor del valor que tendrían si no existiese el efecto de la placa. Por tanto, se ha

considerado en este trabajo que el valor del coeficiente de inarmonicidad es el valor medio de los



obtenidos para cada parcial al aplicar la fórmula de la inarmonicidad.

Asimismo, al generar los patrones, se considera que el valor del parcial obtenido por

aplicación del coeficiente de inarmonicidad es el valor central de todos los posibles.

5.2.3.- ANCHURA DE PULSOS DE LOS PATRONES

El ancho del pulso es inicialmente seleccionado en base a un criterio de similitud con el

ancho real. El ancho real está determinado por el amortiguamiento de la cuerda, y el ancho que

se puede medir depende también del efecto de la ventana usada al calcular el espectro. Una serie

de análisis iniciales sobre la anchura de los pulsos de los espectros del piano de muestra nos ha

permitido establecer una curva empírica de anchos de pulsos para cada nota. Ese es el valor inicial

del ancho de cada pulso, pero en la mayoría de los casos, el pulso del patrón es más ancho que

este valor inicial.

El primer aspecto que impone un ensanchamiento del pulso es le hecho de incluir el

unísono completo como un único elemento a identificar. Para ello, el pulso debe ser tan ancho

como el unísono. En notas graves, el unísono es indistinguible con la resolución de frecuencia

usada por el método (0.5Hz), pero en notas agudas sí lo es. El algoritmo de entrenamiento de

agudos evalúa el ancho del unísono completo y dicho dato se usa, aplicado también a las notas del

entorno de la entrenada, para calcular el nuevo ancho. En este punto, ya se verifica claramente que

el ancho de los unísonos es mayor no solo a mayor nota sino también a mayor parcial, debido a

la inarmonicidad.

El efecto de la placa resonante ya ha sido comentado. Simplemente indicar que aunque las

curvas del efecto decrecen con la frecuencia y con el parcial, dichas curvas son de relación de

frecuencias, por lo que en notas altas, aunque la variación porcentual es menor, el ensanchamiento

no es tan pequeño. Sin embargo, dado que a notas altas la separación entre ellas es mucho mayor,

el ensanchamiento necesario puede ser mayor sin afectar mucho a los resultados, en cuanto a

poder causar errores de identificación por solapamiento de patrones.

El resto de ensanchamientos se debe a la corrección de errores de medida y aproximación



Fig.115.-Curva de afinación promedio de Railsback y variacionesencontradas en un estudio sobre afinación de pianos [Martin 61]

durante el entrenamiento, concretamente, errores en la aproximación de la afinación y errores en

la medida de B por falta de resolución de frecuencia.

En cuanto al error de aproximación de la curva de afinación, se ha calculado dichos errores

respecto a las notas que se entrenan. Como no se puede asegurar cual será el error en el resto de

las notas, se incluye un porcentaje de error adicional basado en la dispersión de valores de

afinación de notas presentados entre la curva “Railsback” y ciertos valores de afinación existente

en pianos reales que resultan no presentar diferencia audible con la curva Railsback [Martin 61]

5.2.4.- MULTIPATRONES

Las notas de las octavas altas tienen un contenido espectral limitado casi exclusivamente

al fundamental y segundo parcial. Los patrones usados en octavas 6, 7 y 8 tienen únicamente dos

parciales pues añadir un tercer parcial al patrón no supone mejora en los resultados de la métrica

a la hora de diferenciar una nota de otra.

El error inevitable de aproximación en la curva de afinación calculada durante el

entrenamiento hace que para algunas notas el fundamental del patrón esté descentrado respecto

al fundamental real de la nota. Aunque el patrón incluye un ensanchamiento para asumir dichos

errores, como se ha explicado, estos han sido calculados en base a las notas que se entrenan y no



Fig.116.-Error en nota de octava 6 provocado por falta de centrado delpatrón propio (C6) y por mejor centrado de un parcial alto de patrón denota más baja(C2). Los parciales altos de patrones bajos deberíanponderarse y debería asegurarse que los patrones de notas altas seajustan mejor mediante multipatrones por nota.

se puede asegurar que alguna nota no tenga un error mayor.

La figura 116 muestra un error encontrado en las primeras implementaciones del algoritmo

de reconocimiento. La nota 64 (C6, Do6) era identificada como la nota 16 (C2,Do2) varias

octavas más baja. El hecho de que uno de los parciales muy altos de un patrón de la segunda

octava coincidiera con el fundamental de la nota C6 mejor que el fundamental del patrón de la

propia nota C6, hace que la métrica puntúa más, incluso considerando la aportación del segunda

parcial de la nota que sólo puntúa para el patrón 64. Además, los residuos o colas espectrales

también aportan puntuación en la métrica del patrón de la nota 16.

Estos detalles plantean sin dudas tres líneas de mejoras en el método de reconocimiento:

a) Patrones con barrido o multipatrones para las notas de octavas altas: Asegurar que

alguno esté bien centrado en el fundamental de la nota.

b) Ponderar la importancia de los parciales dentro de un patrón: Dotar al patrón de

estructura de niveles destinada a minimizar errores de octava

c) Predetección de octava o banda para evitar que patrones tan distintos puedan analizar

una nota.



Los multipatrones consisten simplemente en generar más de un patrón para cada una de

las notas de octavas altas. Alguno de esos N patrones por nota estará debidamente centrado y

obtendrá la máxima métrica. De todas las posibilidades, hemos seleccionado una que ha resultado

dar suficiente robustez al método.

Los patrones de las octavas 6, 7 y 8 se han hecho triples: el calculado originalmente, y dos

versiones de este, una hacia frecuencias mayores y otra hacia frecuencias menores, una cantidad

que asegure un solapamiento del 50%, dado que no se espera que el “descentramiento” original

sea muy elevado. Se ha considerado que se solapa un 50% cuando la posición de la nueva

frecuencia del parcial del patrón se diferencia de la original en la mitad (50%) del ancho total del

pulso.

Los patrones adicionales no son meros desplazamientos del original, pues el segundo

parcial debe recalcularse pues se desplazan una cantidad distinta a la del fundamental debido al

coeficiente de inarmonicidad. El ancho de los pulsos de los patrones adicionales es el mismo que

en el patrón original.

Debe indicarse que con todas las estrategias incorporadas, la octava 6 no requiere de

multipatrones. Sólo las octavas 7 y 8 los requieren al ser en las que se tienen mayores errores de

“centrado” por la aproximación de la curva de afinación. Puede verse en la figura 117 el error

entre la nota E7 y su patrón generado originalmente.



Fig.117.-Error en el patrón de la nota E7. Puede verse que un patrónadicional inferior solapado un 50%, se ceñiría adecuadamente alespectro de la nota.

Fig.118.-Multipatrón para la detección de la nota E7. El originalpresenta un gran error, pero el adicional inferior se ajusta al espectro.

La figura 118 muestra dos patrones del multipatrón triple de E7, y ahora se ve que uno de

ellos cuadra con la nota..

Otro aspecto que afecta al uso de los multipatrones es que no pueden llegar a crear

ambigüedad por solapamiento con multipatrones de notas adyacentes. En la figura 119 puede

verse que los patrones adicionales para los fundamentales de 11 notas de la octava 7 son



Fig.119.-Patrones adicionales generados para multipatróncorrespondientes a 11 notas de la octava 7. Se muestran losfundamentales y sólo los 2 patrones extremos de cada nota. Puede verseque no hay ambigüedad entre patrones adyacentes.

perfectamente distinguibles entre sí, sin existir solapamiento entre multipatrones de notas

adyacentes..

5.2.5.- ESTRUCTURA DE NIVELES EN LOS PATRONES: CANTIDAD Y

PONDERACIÓN DE PARCIALES

Ya se ha indicado que el hecho de que todos los parciales de los patrones tengan nivel

unidad, es decir, no tengan ponderación, facilita la existencia de errores en la detección. Estos

errores son especialmente probables entre patrones separados un número entero de octavas.

Se han realizado varias pruebas para determinar qué número de parciales deben incluir los

patrones y para determinar la ponderación. En cuanto al número de parciales, deben ser suficientes

para distinguir bien unas notas de otras, y para que se aprecie la utilidad del modelo con

inarmonicidad.

Esto último es importante pues la existencia de inarmonicidad facilita la eliminación de la

ambigüedad entre octavas dado que dos notas separadas una octava presentarán un coeficiente

de inarmonicidad distinto y los parciales, que típicamente coinciden en notas sin inarmonicidad,

no serán tan coincidentes. La única excepción a esta regla ocurre en octavas bajas en las que se



vió que el coeficiente de inarmonicidad presenta un mínimo, permitiendo que dos notas de las

octavas más bajas puedan tener el mismo coeficiente de inarmonicidad. No queda más remedio

que considerar que es poco probable que eso ocurra con dos notas separadas justo una octava.

Por otro lado no tiene sentido usar más parciales de los necesarios en base a la realidad

espectral de cada octava. Así las octavas graves generan sonidos con gran cantidad de parciales

significativos, mientras que las más agudas sólo presentan 2 ó 3 parciales con nivel significativo.

En cuanto a la ponderación, de ella depende en gran manera la disminución de la

ambigüedad entre octavas que hemos conseguido. Es un compromiso ponderar los parciales

superiores. Si se está calculando la métrica de una nota de octavas superiores, conviene que

tengan ponderación, así, si se está detectando un C4, conviene que el segundo parcial del patrón

de C3 tenga ponderación para no puntuar mucho. Sin embargo, eso haría que cuando se esté

intentado detectar la nota C3, su patrón no puntúe mucho en el segundo parcial.

Tras varias pruebas en las que hemos comprobados errores y márgenes en los valores de

las métricas obtenidas, hemos llegado a un compromiso, que sin poder asegurar que sea el óptimo,

sí es suficiente para dar un resultado con un número reducido de errores. La existencia de errores

residuales, será combatida con técnicas adicionales.

Como resultado de las pruebas, se ha decidido que el modelo genere patrones según la

tabla:

Octava Número de parciales Ponderación

0

1

23 NO

2 20 10 primeros parciales a 1

5 siguientes a 0.5

5 restantes a 0.3

3 12 3 primeros a 1

9 restantes a 0.5



Fig.120.-Patrón identificado (métrica máxima) y segundo candidatopara notas sueltas usando los patrones generados con ponderación.También se muestra la diferencia de valores de las métricas (margen).Sólo unas pocas notas no se identifican como primera o segunda opción.

4 10 NO

5 7 1 primer parcial a 1

6 restantes a 0.5

6 2 1 primer parcial a 1

1 restante a 0.5

7

8

2 1 primer parcial a 1

1 restante a 0.5

Las octavas 0 y 1 se consideran juntas puesto que la octava 0 sólo tiene 3 notas (desde A0)

y comparten muchos aspectos espectrales. De igual modo, la octava 8 sólo tiene la nota C8 y se

la consideramos una extensión de la octava 7.

Este modelo de patrones, sin ninguna técnica adicional, generados tras el entrenamiento

del piano, consiguen el siguiente resultado de identificación de notas sueltas:

Existen 27 fallos de identificación. Sin embargo, el número de notas que son calculadas

correctamente ya sea como primera o como segunda candidata son 80. Es decir, de aquellas 61

notas que han sido falladas, la mayoría (53) han sido consideradas como segunda candidata por



el algoritmo. A falta de aplicar otras técnicas de ayuda en el reconocimiento, podemos decir que

la métrica usada y los patrones generados son suficientemente buenos. Sólo 8 notas se escapan

claramente a la detección (notas 34, 45, 62, 64, 80, 82, 86, 87). Por eso se ha considerado

suficiente la definición de los patrones. El resto de mejoras hasta la detección sin errores se realiza

mediante técnicas de ayuda.

De los 27 fallos de identificación, la nota identificada resulta ser un número entero de

octavas inferior en 14 casos. Por lo que la ambigüedad de octavas no es la única causa de error

en la identificación. Esto es especialmente cierto en las 8 notas que no se aciertan ni como primera

ni como segunda candidatas, de las cuales 4 son de la octava 7 (que requerirá multipatrón) y sólo

2 de las 8 han sido confundida con una nota un número entero de octavas inferior (las notas 34

y 80).

Puede verse en la figura 120 que un aspecto que llama la atención es que ninguna de las

falsas detecciones se corresponden con notas superiores a las analizadas, siempre son notas

inferiores. Esta es una consecuencia directa del diseño del número de parciales y ponderación

usada.

Otro aspecto es que los errores sólo aparecen para notas a partir de la octava 3. Las notas

graves se detectan bien y con amplio margen, salvo el margen de la nota 9.

5.3.- IDENTIFICACIÓN DE NOTAS SUELTAS

Haciendo uso de los patrones generados en base a las consideraciones anteriores, se valida

el modelo realizando identificación de todas las notas del piano una a una.

Como resultado de esta fase, se establecen aspectos adicionales que optimizan la

identificación de notas sin modificar la generación de patrones ni el modelo.

5.3.1.- TÉCNICAS DE PREPROCESADO: LIMPIEZA DEL ESPECTRO A ANALIZAR.

UMBRALIZACIÓN DE NIVELES BAJOS

La primera técnica de ayuda que se introduce, que corresponde a preprocesado de la señal



Fig.121.-Patrón identificado (métrica máxima) y segundo candidatopara notas sueltas usando los patrones generados con ponderación ylimpieza previa del espectro a analizar. También se muestra ladiferencia de valores de las métricas (margen). Hay más deteccionescorrectas. Sólo unas pocas notas no se identifican como primera osegunda opción.

a analizar, es la de eliminar niveles espectrales existentes entre componentes significativas de la

señal. Cualquier parcial de cualquier patrón que estuviera entre dos componentes significativas de

la señal, puntuaría una cierta cantidad debido al nivel espectral no nulo que se obtiene en esas

zonas al calcular la FFT.

Para ello se realiza una umbralización parcial, de modo que los niveles inferiores a un

cierto umbral se anulan totalmente y los superiores se dejan como están. El umbral que se

implementa en el algoritmo es seleccionable. El valor que se está usando como umbral es 1/50

veces el valor máximo del espectro.

Se consigue el siguiente resultado de identificación de notas sueltas:

Existen aún 19 fallos de identificación, son menos que antes, como resulta evidente de la

gráfica. Además, el número de notas que son calculadas correctamente ya sea como primera o

como segunda candidata ha subido hasta 82. Sólo 6 notas se escapan claramente a la detección

(notas 34, 45, 62, 80, 86 y 87). Las dos notas mejoradas de este grupo, han pasado a ser segundas

candidatas. Sólo la 34 y la 80 siguen siendo confundidas con una nota de un número entero de



Fig.122.-Notas identificadas con y sin limpieza. Se indican las mejorasen los márgenes. Salvo una nota que ahora se falla, hay varias que ahorase aciertan. La mayoría de las nuevas que se aciertan van acompañadasde un aumento en el margen, lo que indica que la limpieza tiene granefecto en el método. Algunos de los márgenes que disminuyen secorresponden a notas que ahora se aciertan, por lo que se puedeconsiderar una mejora de la limpieza. Se incluye un gráfico indicadorde las notas acertadas para facilitar al análisis de la curva de mejora.

octavas inferior.

De los 19 fallos de identificación, la nota identificada resulta ser un número entero de

octavas inferior en 12 casos. Por eso, cambiar las ponderaciones de los patrones no serviría de

mucho.

En cuanto a los márgenes conseguidos en ambos casos, existen claras mejoras al usar

limpieza. La figura 122 muestra ambas identificaciones así como la mejora del margen.

Puede verse que algunos márgenes han bajado, pero a cambio se ha obtenido una

identificación correcta. Los márgenes calculados no consideran si la detección es correcta o no

y sólo indican una diferencia de métrica entre el primer y segundo candidato.

5.3.2.- RESULTADOS APLICANDO MULTIPATRONES

Si se incluye el uso de multipatrones para la octava 7 (y nota C8) en la identificación, los

resultados son los que aparecen en la figura 123. Puede verse que la octava 7 ya no tiene errores



de identificación.

Ya sólo existen 15 fallos, de los cuales son de octava 11. De esos once, 10 dan como

detectada la nota sólo 1 octava inferior, y 1 da la nota 2 octavas inferior. Es interesante hacer

notar que todas las notas erróneamente asignadas a esas 11, corresponden a la octava 2. Es

evidente que el gran número de parciales en los patrones de la octava 2 es causante de

puntuaciones altas en octavas superiores, aún estando ponderados sus parciales. Como se verá

esto se resuelve con otro proceso previo de las señal a analizar, que denominamos “predetección

de octava”. Los errores que no son de octava reparten sus candidatos entre las octavas 1 y 2.

De todos los 15 fallos, los fallos que tampoco son considerados correctamente como

segunda opción, son ahora sólo 3 notas: 34, 45 y 62. Es curioso notar que es una de cada una de

las octavas medias (3, 4 y 5). De ellas sólo la 34 es detectada como una nota de una octava

inferior (nota 22 de la segunda octava). Las otras son confundidas con notas de la primera octava

(notas 14 y 10 respectivamente).



Fig.123.-Identificación de señal limpiada con patrones múltiples en octava 7. Puede verse que los patronesmúltiples resuelven todos los errores que existían en la octava 7. Se muestra qué patrones múltiples han dadomáxima métrica y por tanto son directos responsables de una identificación y cuales han puntuado como segundacandidatura.

La coincidencia de identificación y segundo candidato en ciertas notas de la octava 7

simplemente indican que ambas métricas se obtienen con alguno de los tres multipatrones que

corresponden a la misma nota. Se muestra además en la figura qué notas puntúan gracias a los

patrones adicionales del multipatrón, y si dicho multipatrón puntúa como primer o segundo

candidato. En los casos en que puntúa como segundo candidato, dado que no hay error, está claro

que la identificación se debe al patrón original.

Por otro lado, la asignación de primer y segundo candidato a dos patrones del mismo

multipatrón, justifica la reducción en el valor del margen existente en dichas notas, pues ambas

métricas suelen ser muy parecidas, salvo en algunos casos.

La mejora frente al caso de no usar multipatrones se muestra en la figura 124



Fig.124.-Notas identificadas con y sin multipatrón. Donde coinciden lascurvas azul y roja, sólo se ve la roja. Sólo se usa multipatrón en octava7 y 8 (notas 76 a 88). Se indican las mejoras en los márgenes. Elmultipatrón no afecta a otras octavas, pero permite identificar sinerrores en las octavas 7 y 8. Los márgenes son más bajos pero a favorde la nota adecuada. Se incluye un gráfico indicador de las notasacertadas para facilitar al análisis de la curva de mejora. La rectahorizontal se corresponde con la nota 27 (Si2). Todos los errores marcancomo primera candidata a notas de las octavas 1 y 2.

Como puede observarse, las únicas fuentes de error que restan son las asociadas al hecho

de que las octavas 0, 1 y 2 usan patrones con gran número de parciales. Disminuirlos o

ponderarlos más llevaría a errores en la detección entre las notas de dichas octavas. Parece

evidente que la aplicación de la mejora indicada como “predetección de octava” resulta necesaria

y deberá ser suficiente.

Aparentemente, las notas 34, 45 y 62 no se beneficiarán de la predetección pues ni siquiera

su segundo candidato es el adecuado. Sin embargo, en los tres casos dicho segundo candidato

también resulta pertenecer a las octavas 1 y 2. Resulta evidente que si el sistema de predetección

lleva asociado el hecho de eliminar los patrones graves de la métrica durante la identificación de

notas de octavas 3 y superiores, no sólo se resolverán los errores de las notas con segundo

candidato correcto, sino también estas tres notas tendrán más oportunidades de tener primer

candidato correcto, como de hecho ocurre.



5.3.3.- PREDETECCIÓN DE OCTAVA

Se ha visto que los patrones de las octavas 0, 1 y 2 provocan errores en el método al

obtener métricas más elevadas que el patrón de la propia nota a identificar. Si se desarrolla un

método de análisis previo de la señal que determine el orden de la octava a la que pertenece la

nota, se puede deshacer el error.

Para ello es posible modificar el proceso de identificación de dos maneras:

a)Descartando una nota una vez identificada, si no corresponde a la octava predetectada

b)limitando el proceso de identificación a un conjunto de patrones correspondientes a la

octava predetectada

Cada manera tiene sus ventajas y sus inconvenientes. La segunda ha sido elegida pues

además de romper la incertidumbre en los casos en que el error estaba en la primera candidata

pero no en la segunda, también permite resolver, más directamente, el problema de las tres notas

que no eran acertadas ni siquiera en segunda candidatura. En el caso de elegir la primera, esas tres

notas requerirían de dos descartes. La ventaja de la primera respecto a la segunda es la de no

limitar (no la de asegurar) la identificación de ciertas notas de acordes con notas en octavas

contiguas.

5.3.3.1.- Predetección mediante transformada ondicular

Se han realizado algoritmos para realizar detección de octavas y notas usando

transformada ondicular en base a una ondícula madre específica, diseñada a partir de una nota de

piano [Ortiz 00].



Fig.125.-Ondícula madre específica basada en un tramo de nota C4 deun piano de cola.

La aplicación de la transformada ondicular, según la fórmula de transformada contínua:

CWT (a,b) x(t) (t) dt (t),x(t)x a,b*

a,b*= ⋅ ⋅ =

−∞

∞

∫ ψ ψ (141)

es equivalente a la realización de un filtrado por bandas no excluyentes, cuyas respuestas en

frecuencia aparecen en la figura 126. El resultado de la transformada ondicular de la nota

(procesada en el dominio temporal) da lugar a la obtención del orden de la octava concreta de una

nota, siempre que la nota pertenezca a octavas superiores a la 3. Para ello se calcula una métrica

que equivale a la norma de los datos a la salida de cada uno de los filtros. Según las diferencias

de valor y los “cambios” bruscos de la métrica se obtiene la identificación de la octava [Ortiz 01].

Como se expone en el siguiente apartado, la no determinación de las octavas inferiores así

como el hecho de que no resulta necesario concretar mucho la octava de la nota, hizo que se

desarrollase otro método de predetección, por lo que el de la transformada ondicular no se ha

depurado ni se ha probado con acordes. Esto último es importante pues no se ha podido

comprobar si un grupo de notas cercanas (acorde) de la misma octava, provocan en las salidas de

los filtros un comportamiento similar al de una sola nota.



Fig.126.-Respuesta de los filtros equivalentes a la transformadaondicular con la ondícula madre específica (escala 0), sus expansionesy contracciones. Se analizan un total de 7 escalas. Cada escala dejapasar bien octavas anteriores, pero atenúa rápidamente notas superiores.

5.3.3.2.- Predetección mediante zonas y bandas

Si bien la detección de octava por transformada ondicular permite determinar la octava

concreta para octavas superiores a la octava 3 , una predetección tan precisa puede no ser

necesaria. Además, está pendiente el hecho de detectar si la nota es de octavas altas o bajas.

Se ha desarrollado otro método basado en lo que se ha denominado zonas y bandas. Se

define que una nota es de zona alta si la frecuencia de su parcial de mayor nivel es superior a

700Hz.

Hasta la octava 3 incluida es normal que el parcial de mayor nivel no sea el fundamental.

En las notas bajas de la octava 4 puede ocurrir en situaciones poco frecuentes, pero encontradas

en nuestra medidas, que el segundo parcial tenga el máximo nivel, con algo más de nivel que el

fundamental. En las octavas 5 y superiores el fundamental es el que tienen mayor nivel.

Cualquier nota que tenga su máximo nivel en un parcial por encima de 524Hz (fundamental

temperado del C5) puede ser una nota de octava 5 o superior o bien una nota de octava 4 con el

segunda parcial con mayor nivel que el fundamental.



Hemos considerado que cualquier máximo mayor de 700Hz se corresponderá con notas

de las octavas 5 a 8. Si bien algunas notas bajas de la octava 5 tendrán su máximo algo por debajo

de 700Hz, es poco probable que una nota de la octava 4 tenga su segundo parcial como máximo

si éste supera el valor de 700Hz (notas superiores a F4). F4 es la nota 45 y se encuentra en la zona

media del piano, donde los estudios sobre la excitación y el espectro obtenido [Askenfelt 93] [Hall

88] indican que el primer parcial siempre es el de mayor nivel para diversas situaciones de

excitación.

Ahora bien, un máximo menor de 700Hz puede corresponderse con cualquier nota entre

A0 y F5. De esta forma, el criterio de zona separa notas dejando un margen de solapamiento para

las notas de la octava 5. En resumen, el criterio de zona permite una primera predetección de

forma que:

-Si máximo nivel en parcial >700 Hz, la nota está entre C5 y C8 (Zona alta)

-Si máximo nivel en parcial <700 Hz, la nota está entre A0 y C6 (Zona baja)

Este criterio no es suficiente pues se requiere detectar si una nota está por encima o por

debajo de C3, es decir, si es de octavas 0,1,2 o superiores. Para ello se incluye el concepto

adicional de “Banda”. En cada banda se realiza un análisis adicional, calculando la métrica:

CPniN

xN

= ∑12

2 (142)

donde “x” es el valor de cada componente del espectro de la nota dentro de la banda “i”. CPn

responde a “Coeficiente de Predetección normalizado”. Para cada nota se calculan los CPn de las

tres bandas.

Se definen las bandas:

Banda 1 64 a 128 Hz Incluye Fundamentales de C2 a B2 (octava 2)

Banda 2 128 a 510 Hz Incluye fundamentales de C3 a B4 (octavas 3 y 4)

Banda 3 510 a 5000Hz Incluye fundamentales de C5 en adelante

La limitación a 5000Hz responde a no incluir datos espectrales no significativos, que no



Fig.127.-Coeficientes de predetección de cada banda calculados paratodas las notas del piano. Se puede apreciar el efecto de corte de lasbandas 1 y 2 para notas mayores de C3 y C5 respectivamente.

mejoran los resultados de cara a la predetección. Las pruebas realizadas considerando otros límites

superiores así lo han confirmado.

Tal y como están definidas, se cumple los siguiente:

a)Cualquier nota de las octavas 1 y 2 tiene métrica en las 3 bandas

b)Las notas de octavas 3 y 4 no presentan métrica en la banda 1

c)Las notas de octavas 5,6,7 y 8 no presentan métrica ni en la banda 1 ni en la banda 2.

La figura 127 se muestran los coeficientes de predetección de cada banda obtenidos para

todas las notas de uno de los pianos usados.

Realmente, la obtención de estos resultados exige dos consideraciones en el algoritmo de

cálculo:

a) El espectro de la nota se umbraliza eliminando valores inferiores a 1/6 del máximo,

considerándose por tanto sólo los componentes espectrales claramente significativos en

el cálculo de la predetección.

b) Si la zona detectada era la alta, antes de calcular los coeficientes se procede filtrar paso

alto, eliminando todos los datos espectrales inferiores a 300Hz. Esto se hace pues las notas

agudas presentan en su espectro un contenido de bajas frecuencias con alto nivel,

justificable como ruido, y que no debe ser tenido en cuenta para la predetección pues llega



a provocar fallos en ella.

Se desprende de lo anterior, que los cálculos de zona y de bandas están unidos. Y veremos

que su aplicación también.

Puede observarse que los coeficientes de las bandas 1 y 2 presentan un valor muy bajo a

partir de las notas C3 y C5 respectivamente. Esta zona que denominaremos de corte presenta un

valor muy bajo, existiendo un amplio margen entre los valores de los coeficientes antes y después

del corte. este margen facilita establecer un umbral y considerar que será válido para muchos

pianos distintos. El umbral elegido ha sido -40dB.

Cada nota presenta un comportamiento respecto a los tres coeficientes que permite

establecer un criterio de predetección de octavas de la siguiente manera:

Una vez calculados, para una nota a predetectar, sus tres coeficientes,

podremos decir que el fundamental de esa nota está dentro de una de las tres

bandas según el criterio:

if CPn1<umbral & CPn2<umbral

banda=3; (LA NOTA PERTENECE A OCTAVAS 5, 6, 7 ú 8)

elseif CPn1<umbral & CPn2>umbral

banda=2; (LA NOTA PERTENECE A OCTAVAS 3 ó 4)

elseif CPn1>umbral & CPn2>umbral

banda=1; (LA NOTA PERTENECE A OCTAVAS 0, 1 ó 2)

end

Como se ve, el coeficiente de la tercera banda no es utilizado pues no establece diferencias

claras.

5.3.3.3.- Aplicación de la predetección

El dato de la predetección se utiliza en el algoritmo de reconocimiento para limitar el conjunto

de patrones con los que se realiza la comparación de la señal. Además permite en algunos casos

activar un filtrado paso alto para disminuir el efecto de los ruidos de baja frecuencia en la

identificación de notas agudas.



Fig.128.-Identificación con limpieza, multipatrón y predetección porzonas y bandas. La identificación no presenta ningún error. La curvaroja sobreescribe la azul en las notas en que coinciden, que son las queidentifican gracias al multipatrón

Así, el algoritmo usado para reconocimiento utiliza de este modo la predetección:

Si zona es alta (C5 a C8)

y banda =3 (C5 en adelante)

Patrones desde 52 a 88 (C5

a C8)

Multipatrones también se

incluyen

No puede darse que zona sea

alta y banda distinta de 3. Si

ocurre se debe a ruido de

baja frecuencia y se filtra

paso alto a 400Hz.

Si zona es baja (A0 a C6)

y banda =3 (C5 en adelante)

Patrones 52 a 63 La nota sólo puede ser de

octava 5


y banda=2 (C3 a B4)

Patrones 28 a 51 Nota de octavas 3 ó 4


y banda=1 (A0 a B2)

Patrones 1 a 27 Nota de octavas 0, 1 ó 2.

Los resultados obtenidos en la identificación de notas al usar la predetección aparecen en la

figura 128

Puede verse que la identificación es correcta, sin fallos. Por lo que la identificación de notas



Fig.129.-Comparación de identificación con predetección de zonas ybandas respecto a usar sólo limpieza y multipatrón en octava 7. No haypérdidas de márgenes ni en las notas que ahora se identifican. Todasmejoran o se quedan igual en cuanto a margen. Todas se identificancorrectamente.

está resuelta con éxito y puede acometerse la identificación de acordes.

Ahora los segundos candidatos ya no son sólo de notas inferiores pues al limitar el conjunto

de patrones, se tienen que encontrar entre ellos. Así, la octava 3 sólo puede tener candidatos

parecidos en la octava superior, pues la banda 2 incluye sólo octavas 3 y 4. En cuanto a las notas

de la octava 5 (zona baja, banda 3) sólo se comparan con notas de esa octava y las diferencias son

muy apreciables, de ahí que los segundos candidatos sean cercanos (notas de la misma octava 5)

y los márgenes muy altos (las métricas difieren bastante entre notas de la misma octava). La octava

6 también se beneficia de usar conjuntos de patrones, mientras que las octavas 0,1,2,7 y 8

presentan un comportamiento similar a no usar predetección, dependiendo su éxito del diseño de

los patrones en las octavas 0,1 y 2, y del multipatrón en las octavas 7 y 8.

La comparación entre usar predetección o no usarla, respecto al uso de limpieza y multipatrón,

aparece en la figura 129

Pueden realizarse dos comentarios al respecto de esta estrategia. El primero es que bastaría

con identificar si se trata de nota en octavas graves o en las otras pues todos los errores existentes



antes de usar la predetección se debían a patrones de las octavas graves (0,1 y 2). El segundo es

que cuantas más subconjuntos de patrones se usen, más difícil será la identificación de acordes con

notas repartidas en octavas contiguas.



Fig.130.-Esquema del proceso de identificación de acordes. En unaprimera fase, el entrenamiento, se obtienen los patrones y las máscarasespectrales. En la segunda fase, identificación, se detectaniterativamente las notas que forman un acorde.

5.4.- RECONOCIMIENTO DE ACORDES: ITERACIÓN Y SUSTRACCIÓN

ESPECTRAL

5.4.1.- MÉTODO

El reconocimiento de acordes se realiza identificando cada una de sus notas de forma iterativa.

Una vez identificada una nota, se procede a la sustracción espectral de sus componentes, tras lo

cual se procede a detectar otra nota. La siguiente detección empieza por recalcular la métrica del

espectro resultante respecto al conjunto de patrones. La figura 130 muestra el diagrama del

proceso. La sustracción espectral se realiza en base a unas máscaras diseñadas para cada nota, a

partir de los datos de la fase de entrenamiento, de forma análoga a los patrones.

5.4.2.- MÁSCARAS

Las máscaras se obtienen a partir de unas “máscaras base” que son básicamente una réplica

de los patrones. Sin embargo, todos los parciales de las máscaras base deben tener amplitud

unidad, para que siempre exista cancelación total de esa componente espectral. Como ya se ha

indicado los parciales de los patrones tienen distintos niveles para ponderar la detección.

El espectro coincidente con el patrón de la nota detectada será eliminado de la señal antes de



Fig.131.-Se muestra el patrón 52 (nota C5) y la máscara progresivacorrespondiente. En el detalle se ve sólo el segundo parcial del patrón52 con ambas máscaras, la progresiva y la abrupta. La máscara semultiplica por el espectro para realizar la sustracción.

proceder a la siguiente detección. Para ello, y dado que el nivel de la máscara base indicada varía

entre 0 y 1, la sustracción espectral se realiza multiplicando punto a punto el espectro por la

función (1-mascara_base). Esta nueva función es la que denominaremos “máscara”. Así, la

sustracción se hace multiplicando el espectro por la máscara.

Una opción que implementa el método es que la eliminación sea progresiva, siguiendo la

máscara la misma forma que el patrón (curva tipo Hamming). Sin embargo, la máscara abrupta

es la que, en general, mejores resultados da al limpiar mejor el espectro tras la sustracción. La

máscara abrupta consiste en activar totalmente la máscara desde el primer valor no nulo de la

curva del patrón. La figura 131 muestra ambos tipos de máscaras para un cierto patrón.

Interesa ver qué diferencias hay en los resultados entre identificar con máscaras abruptas o

progresivas. Inicialmente lo veremos con independencia de si la detección realizada es correcta

o no. La siguiente tabla muestra las diferencias para 4 acordes distintos, cada uno ejecutado en las

7 octavas (1 a 7). Como cada nota se representa por un número entre 1 y 88, los valores de la

tabla indican directamente la diferencia entre las números identificativos de las notas identificadas.

Así, un error de 12 supone que con unas máscaras se ha detectado una nota una octava mayor o

menor que con las otras máscaras, pero sin entrar a valorar si alguna de esas detecciones es

correcta.



Acorde C,E,G,A# Acorde C,D#,F#,A Acorde C,D#,G,A# Acorde C,E,G,B

oct1

oct2

oct3

oct4

oct5

oct6

oct7

0 0 0 -12

0 0 0 0

0 0 3 -3

0 0 0 -23

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 -6 6

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 3 -3

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 4

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 -28

En esta tabla, un 0 no significa que la detección sea correcta, sino que se obtiene la misma

usando máscaras abruptas o progresivas. Puede verse que, en los resultados prácticos, las

diferencias aparecen en las últimas notas, en las que el residuo puede llegar a ser apreciable. En

la práctica no hay efectos prácticos ni en todos los acordes ni en todas las octavas.

5.4.3.- LÍMITES EN LA IDENTIFICACIÓN DE NOTAS DENTRO DE UN ACORDE

La identificación de las notas no debería suponer ningún problema toda vez que tenemos un

algoritmo que las detecta sin error. Sin embargo sí surgen algunos problemas debido a dos

razones:

a) La sustracción espectral no siempre es perfecta.

b) Al existir varias notas simultáneamente, el cálculo de la métrica de los patrones se ve

afectado no sólo las componentes propias de una nota sino también las componentes

coincidentes de otras notas. Denominaremos esta situación como “espectro-multinota”.

Debe tenerse en cuenta que la segunda situación puede darse tanto para la identificación de

la primera nota en un acorde completo como para la identificación de la nota “n” en un espectro

con sustracciones previas.

5.4.3.1.- Sustracción Espectral

En cuanto al primer problema, a modo de ejemplo, en las figuras 132 y 133 se muestran la

identificación del acorde C,D#,G,A# (Do menor con séptima menor) de la octava 3 con aplicación

de máscaras progresivas y abruptas respectivamente, para la sustracción espectral.



Fig.132.-Sustracción espectral mediante máscaras progresivas, durante la identificación del acorde C,D#,GA#. Seindican con flechas algunos de los residuos resultantes de una sustracción mejorable. En rojo se muestran lasmáscaras básicas, para facilitar la visualización de lo que se va a sustraer en cada paso. Las gráficas de detecciónestán normalizadas al valor de la componente espectral resultante más alto, para apreciar la importancia relativaentre ellas. Las gráficas del acorde y del residuo están en la misma escala original. Se indica el nivel del residuorespecto al nivel original del espectro del acorde en dB.

Estas figuras muestran cada uno de las 4 iteraciones necesarias para identificar un acorde de

cuatro notas. Para cada iteración se muestra el espectro de la señal que se somete a identificación,

la nota identificada en esa iteración (escrita en la cabecera de cada cuadro) y la máscara básica de

dicha nota. Esa máscara básica, que tiene mucho que ver con el patrón de la nota identificada,

indica la parte espectral que va a ser sustraída. Dicha sustracción da lugar al espectro que será

identificado en la siguiente iteración. Por último, tras la última iteración, persiste un espectro

residual de las diversas sustracciones. A mejor método de sustracción menos residuo existirá. Para

evaluar la calidad de la sustracción se indica en la figura el nivel del espectro residual respecto al

espectro original del acorde, expresado en dB.

Se ve que las máscaras progresivas (figura 132) son proclives a dejar residuos espectrales al

no coincidir perfectamente la máscara con el espectro.



Fig.133.-Sustracción espectral mediante máscaras abruptas, durante la identificación del acorde C,D#,GA#. Eneste caso se consigue sustraer adecuadamente los espectros de las notas. El nivel de la señal residuo es 33dB inferioral nivel de la señal original. En rojo se muestran las máscaras básicas para facilitar la visualización de lo que seva a sustraer en cada paso. Las gráficas de detección están normalizadas al valor de la componente espectralresultante más alto, para apreciar la importancia relativa entre ellas. Las gráficas del acorde y del residuo están enla misma escala original.

Este primer aspecto se mejora optimizando el diseño de las máscaras usadas para sustracción

y usando principalmente máscaras abruptas. Puede verse la gran diferencia de nivel entre los dos

residuos (24dB). Sin embargo, como se verá en los resultados, no en todos los casos es mejor usar

máscaras abruptas frente a progresivas.

5.4.3.2.- Espectro multi-nota

Al existir varias notas simultáneamente, el cálculo de la métrica de los patrones se ve afectado

no sólo las componentes propias de una nota sino también las componentes coincidentes de otras

notas. Un ejemplo típico es lo que ocurre en un acorde Do,Mi,Sol (C,E,G) de la octava 4 (figura

134), en el que el fundamental del G4 (“Sol4”) coincide con el tercer parcial del C3(“Do3"),

puntuando también para ese patrón, lo que potencia la posibilidad de que la métrica del patrón C3

resulte puntuar más que la métrica del patrón C4 y por tanto identificar un C3(Do3) en vez del C4



Fig.134.-Posible error típico en la detección de la nota C4 al existirotras notas, concretamente G4, formando un acorde. Se indica laposición de los fundamentales de las cuatro notas del acorde. Puedeverse cómo el fundamental de G4 puntúa para el patrón de C3 de formadefinitiva para provocar el error. Ya se ha visto que si sólo estuvieseC4, la métrica del patrón C3 no superaría al del patrón C4, existiendodetección correcta de la nota. Si el fundamental de G4 hubiera sidosustraído antes de proceder a detectar C4, el error no tendría lugar.

(Do4) existente. La figura 134 muestra el acorde, los 2 patrones en conflicto: C3 y C4; y las

métricas acumuladas. Se puede ver perfectamente que el fundamental de G4 supone un incremento

considerable en la métrica de C3, que no existiría si las notas estuvieran solas o si el acorde no

incluyera a G4.

Este tipo de problemas se solucionan en parte con la predetección de octava (si se sabe que

el acorde es de octava 4, el patrón C3 no será tenido en cuenta aunque su métrica sea alta) y en

parte con la aplicación de técnicas adicionales de “evaluación de la detección”:

5.4.4.- EVALUACIÓN DE LA DETECCIÓN

Dado que puede comprobarse que la mera iteración con sustracción espectral no va

a estar carente de errores ( en el capítulo de resultados se muestran tablas con las identificaciones

fallidas), y teniendo en cuenta que si los patrones son suficientemente buenos para detectar notas,

deberían serlo para definir las máscaras de sustracción, resulta evidente que deben buscarse otras

razones para los fallos.



La principal razón adicional ya se ha indicado y es el hecho de que el espectro que se analiza

tienen muchas más componentes que para una sola nota, y estas componentes pueden puntuar, de

forma errónea, en los cálculos de la métrica de ciertos patrones.

Por tanto, resulta imprescindible incluir técnicas que permitan confirmar si los resultados

detectados son válidos. Hemos desarrollado varias técnicas para la fase de “evaluación de la

detección” que aparece en la figura 1, que intentan validar la nota identificada.

5.5.- RECONOCIMIENTO DE ACORDES: VALIDACIÓN DE NOTAS

IDENTIFICADAS EN UN ACORDE

Se han probado 4 métodos de validación de la nota identificada. Estos métodos se basan en

que en los fallos obtenidos en las pruebas, se repiten tres hechos:

a) Los errores aparecen por exceso de espectro (multi-notas).

b) la nota identificada erróneamente es siempre inferior a la que realmente existe.

c) las componentes espectrales “en exceso” que provocan el error en la detección de una nota

del acorde siempre pertenecen a una nota de fundamental superior al de la nota errada.

Los métodos que vamos a presentar son:

1.-Validación de la última nota detectada

2.-Validación por ordenación de candidatos a ser detectados

3.-Validación por ordenación espectral de notas detectadas

4.-Validación mediante verificación del fundamental

5.5.1.- MÉTODO 1: VALIDACIÓN DE LA ÚLTIMA NOTA DETECTADA

Para eliminar el error por exceso de espectro, este método realiza el proceso completo de

detección de todas las notas del acorde y considera validada la última nota detectada. Esta última

nota es la que se ha detectado cuando el espectro restante de las sustracciones anteriores sólo

contiene una nota y por tanto está carente de multi-notas que induzcan a error.



Una vez validada esta nota, se sustrae del espectro inicial y se vuelve a identificar todo el

acorde con una nota menos. De nuevo, la última nota se valida, se sustrae de este nuevo espectro

inicial y se vuelve a detectar. El acorde se reconoce en varios pasos, en cado uno de los cuales se

identifica y valida una nota.

Este método presupone que la última nota a ser detectada dentro del acorde no tendrá error

pues ya no existirá exceso de espectro al haber sido sustraído con las máscaras de las notas

detectadas previamente.

La limitación de este método radica en que al identificar un acorde completo pueden existir

errores antes de la última nota, por lo que las sustracciones realizadas no dejan sólo el espectro

de la ultima nota a identificar. Así, la última nota del acorde debe detectarse a partir de un

espectro que también tiene componentes adicionales que pueden provocar un error. Si esta última

nota, que va a ser automáticamente validada, se detecta erróneamente, la validación resultante no

es buena.

Este proceso no está reflejado en el esquema general de la figura 130 porque no consigue

disminuir mucho los errores.

5.5.2.- MÉTODO 2: VALIDACIÓN POR ORDENACIÓN DE CANDIDATOS

Si la nota errónea siempre es inferior a la verdadera, la superior debe ser considerada más

probable. Para ello, este método, que identifica el acorde en un sólo paso, consiste en evaluar para

cada nota a detectar dentro de un mismo acorde, los dos patrones con métricas más altas (los dos

candidatos) y elegir el de mayor frecuencia.

Esto funciona perfecto cuando los dos candidatos son el de la octava real y el de la octava

inferior. Por tanto, los acordes de la octava 2, al usarse subconjuntos de patrones gracias a la

predetección, tienen el éxito asegurado con este método.

La limitación que presenta este método es que en los casos en que uno de los dos candidatos

es de la octava superior, directamente queda validado, siendo una validación errónea. Esto



provoca, además, la aparición de un comportamiento distinto de los errores, ya que la nota

erróneamente identificada no es inferior a la nota real, como solía ocurrir.

Que el segundo candidato sea de la octava superior es una situación que ocurre, como se ve

en la figura 128, debido al uso de subconjuntos de patrones a raíz de la predetección. Este error

puede esperarse en notas de las octavas 1, 3 y 5 como se ve en dicha figura.

Sin embargo, dicha figura corresponde al análisis de notas sueltas. Cuando se tiene un acorde,

la situación cambia, pues, por ejemplo para acorde de la octava 1, los patrones inferiores puntúan

incluso más que los patrones de la octava 2, quedando de segundos candidatos. Así, son los

patrones de la octava 1, los mayores respecto a los de la octava inferior, los que quedan validados,

desapareciendo el error.

El resultado, para cuatro acordes de las octavas 1 y 2, se presenta en la tabla siguiente

Acordes Máscara abrupta Máscara progresiva

C,E,G,A#

C,D#,F#,A

C,D#,G,A#

C,E,G,B

oct1

oct2

oct1

oct2

oct1

oct2

oct1

oct2

'C1' 'A#1' 'E2' 'G1'

'G2' 'E2' 'A#2' 'C2'

'D#1' 'A1' 'F#1' 'C1'

'F#2' 'D#2' 'C2' 'A2'

'D#1' 'G1' 'A#1' 'C1'

'C2' 'D#2' 'A#2' 'G2'

'E1' 'G1' 'B1' 'C1'

'C2' 'E2' 'G2' 'B1'

'C1' 'E1' 'A#1' 'A#0'

'G2' 'E2' 'A#2' 'C1'

'D#1' 'F#1' 'A1' 'C1'

'F#2' 'D#2' 'C2' 'A2'

'D#1' 'C1' 'A#1' 'G1'

'C2' 'D#2' 'G2' 'A#2'

'E1' 'G1' 'B1' 'C1'

'C2' 'E2' 'G2' 'B1'

Acordes con fallo 2 3

Puede verse que los errores sólo aparecen en las últimas detecciones de cada acorde. En

ese sentido, es razonable el resultado de que la máscara progresiva de lugar a más errores, ya que

deja más residuos que pueden confundir. Además esto se une al hecho de que a la última nota

detectada no se le aplica el criterio de ordenación de candidatos y se toma siempre el primer

candidato. Esto se hace pues para la última nota, al no existir más que ella (supuestamente), el

primer candidato es correcto. Puede verse que la máscara progresiva hace que esto no sea así y



se incrementen los errores en la última nota.

5.5.3.- MÉTODO 3: VALIDACIÓN POR ORDENACIÓN ESPECTRAL DE NOTA

DETECTADA

Este método identifica los acordes en varios pasos. En cada paso, de las notas detectadas

dentro del acorde, se valida la de mayor frecuencia fundamental.

Se sustrae del espectro original la máscara correspondiente a la nota validada y se repite el la

detección del acorde con una nota menos.

Aunque parecido al primer método, sus resultados son muy distintos. Dado que sustraemos

primero las notas más altas, esto restará posibilidad de error a las notas más bajas, según el hecho

descrito c).

La limitación aparece cuando en una da las detecciones de acorde, que se realizan sin

validación ‘interna’, uno de los errores resulta ser la nota más alta, y por tanto queda validada.

La tabla siguiente muestra los resultados de este método para los cuatro acordes en las octavas

graves, y puede verse que dicho error puede ocurrir y que su aparición depende del tipo de

máscara usado.



Acordes Masc. Abrupta-abrupta Masc. Abrupta-progresiva Masc.Progresiva-

progresiva

C,E,G,A#

C,D#,F#,A

C,D#,G,A#

C,E,G,B

oct1

oct2

oct1

oct2

oct1

oct2

oct1

oct2

'A#2' 'E1' 'C1' 'A#0'

'A#2' 'G2' 'E2' 'C2'

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'B1' 'G1' 'E1' 'C1'

'G2' 'E2' 'C2' 'B1'

'A#1' 'G1' 'E1' 'C1'

'A#2' 'G2' 'E2' 'C2'

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'B1' 'G1' 'E1' 'C1'

'G2' 'E2' 'C2' 'B1'

'A#1' 'E1' 'C1'

'A#0'

'A#2' 'G2' 'E2' 'C1'

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'G1' 'A#1' 'D#1'

'C1'

'A#2' 'G2' 'D#2'

'C2'

'B1' 'G1' 'E1' 'C1'

'G2' 'E2' 'C2' 'B1'

Acordes con fallo 2 1 3

Además, al tratarse de un método con varios pasos de detección de acordes, resulta que la

sustracción de las notas validadas, antes de empezar el siguiente paso, también puede realizarse

con máscara abrupta o progresiva.

El método da resultados muy buenos. Resulta interesante el hecho de que puede verse que en

algunos casos se ha validado antes (en un paso anterior) una nota de frecuencia inferior que otra

de frecuencia superior que también ha resultado validada (Los resultados se han transcrito a las

tablas en el orden en que son validados por el algoritmo), lo que iría en contra del método. Esto

parece indicar que en dicho paso, la nota superior no se detectó, lo que sin esta validación hubiera

supuesto un error irrecuperable.

El principal inconveniente de este método es que no resulta evidente cual es la combinación

de máscaras adecuada para identificar acordes de cualquier piano.

5.5.3.1.- Resumen de los 3 primeros métodos

Los resultados de estos métodos que se han presentado no pretenden ser más que

indicativos y por eso sólo se han tabulado ciertas octavas. Los cálculos se han realizado con todas



las octavas y aparecen ciertos errores también en otras, además de en la octava 1.

Para mejorar la evaluación de la detección y por tanto el proceso de validación de notas

detectadas que forman parte de un acorde, se ha desarrollado otro método de validación que se

presenta en el apartado siguiente. Sus resultados, infalibles para octavas 3 y siguientes, hacen que

sólo tenga sentido aplicar los métodos anteriormente descritos a las octavas 0,1 y 2, con los

resultados que ya se han indicado.

5.5.4.- MÉTODO 4: VALIDACIÓN MEDIANTE VERIFICACIÓN DEL

FUNDAMENTAL

El método resulta definitivo para las octavas 3 y superiores, eliminando todos los errores en

la detección, por lo que se aplicará a estas como único método de validación. En las octavas

graves presenta las limitaciones que se comentarán.

Se basa en que si no se realiza ningún otro método de validación, una vez que un patrón es

identificado como primer candidato, el posible error, ya se ha indicado, es que resulte ser un

patrón de una octava inferior a la nota real.

La validación consiste en extraer la parte del espectro del acorde que coincide con el patrón

candidato (mediante la multiplicación punto apunto del espectro y el patrón), y se analiza la zona

correspondiente al fundamental del patrón (se conoce pues se sabe cual es el patrón candidato).

Si el patrón candidato es una octava inferior a la nota real, en la zona de su fundamental no existirá

ninguna componente de la señal analizada. Si el patrón corresponde con la nota existente, en la

zona de su fundamental existirá componente espectral. Así, puede validarse una nota detectada.

Los resultados son (sólo se muestran los obtenidos con máscaras abruptas que son las que dan

mejores resultados en general):



Acordes Acordes

C,E,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A#1' 'E2' 'G2' 'B2'

'G2' 'E2' 'A#2' 'C2'

'C3' 'A#3' 'E3' 'G3'

'A#4' 'C4' 'G4' 'E4'

'C5' 'E5' 'G5' 'A#5'

'E6' 'A#6' 'C6' 'G6'

'E7' 'A#7' 'C7' 'E7'

C,D#,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A#1' 'D#2' 'G2' 'C2'

'C2' 'D#2' 'G2' 'A#2'

'C3' 'D#3' 'A#3' 'G3'

'C4' 'A#4' 'G4' 'D#4'

'C5' 'D#5' 'G5' 'A#5'

'D#6' 'G6' 'C6' 'A#6'

'D#7' 'G7' 'A#7' 'C7'

C,D#,F#,A oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A1' 'D#2' 'F#2' 'G2'

'F#2' 'C2' 'D#2' 'A2'

'C3' 'D#3' 'F#3' 'A3'

'A4' 'C4' 'F#4' 'D#4'

'C5' 'A5' 'D#5' 'F#5'

'F#6' 'D#6' 'C6' 'A6'

'D#7' 'F#7' 'C7' 'A7'

C,E,G,B oct1

oct2

oct3

oct4

oct5

oct6

oct7

'B1' 'G1' 'E2' 'C2'

'C2' 'E2' 'G2' 'B2'

'C3' 'G3' 'E3' 'B3'

'C4' 'G4' 'B4' 'E4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'G6' 'C6'

'E7' 'G7' 'C7' 'E7'

-Los errores E7, que repiten, se deben a que en ambos caos, la componente espectral de la nota que falta por

detectar tiene un nivel demasiado bajo y se confunde con el ruido tras la FFT.

-Sólo hay errores en la octava 1, y están claramente forzados al ser notas con un nivel muy bajo del

fundamental. No hay error con la nota A#1 que ya tiene nivel suficiente de fundamental.(Ver figura 135)

Las limitaciones del método son:

a) Las octavas 0 y 1 apenas presentan fundamental en su espectro, por lo que la aplicación del

métod de validación daría “no válido” incluso con candidatos correctos. Al dar no válido se pasa

al siguiente candidato, el cual es de la segunda octava, la cual sí presenta fundamental (aunque no

sea el parcial de máxima amplitud) y sí es validado. El resultado es un error de identificación de

notas en el que las notas de octava 0 y 1 se validan como notas de octava 2. Esto impide

totalmente la aplicación de este método en las señales predetectadas como banda 1 de la zona

baja.

b) De cara a ampliar la identificación a acordes genéricos, este método puede establecer cierta

limitación en la separación de notas del acorde. Las notas separadas justo una octava (acordes con



Fig.135.-Espectros de las notas G1 y A#1. Se indica la posición delfundamental. En el caso de G1 es casi inexistente. En A#1 sí esapreciable y puede superar el método de validación.

refuerzo) pueden presentar problemas, si bien la iteración con sustracción espectral los minimiza

al terminar dejando sola a la nota de menor octava.

5.6.- RECONOCIMIENTO DE ACORDES: ESTRATEGIA DEFINITIVA DE

VALIDACIÓN

La estrategia definitiva seleccionada para validar acordes hace uso de dos métodos

dependiendo de la octava, y es la que sigue:

a) Si la predetección ha indicado que se trata de acordes en las bandas 2 ó 3 (octavas 3 y

superiores), se utiliza la validación por verificación del fundamental.

b) Si la predetección indica que se trata de acordes en banda 1 (octavas 0,1 ó 2), se realizará

una validación basada en ordenación espectral de notas detectadas.

En cuanto al mejor método para las octavas graves, no parece fácil deducir si los errores que

aparecen, tan variables y sensibles al tipo de máscara, se deben a un mal diseño de los patrones (en

cuanto a anchos), a los errores de aproximación en los valores de afinación y coeficiente B



obtenidos por el modelo durante el entrenamiento o simplemente al hecho de que el piano

concreto presente unas componentes espectrales tan similares en dichas octavas que no sea posible

la diferenciación de ciertas notas entre sí, y estemos obligados a tener siempre algún error.

La solución más sofisticada que se puede deducir de nuestras medidas es la de aplicar

sustracción espectral con máscaras abruptas de notas validadas por ordenación espectral a partir

de unos acordes obtenidos mediante ordenación de candidatos con máscaras progresivas. Las

pruebas con estas últimas siempre han dado valores en la octava adecuada o en la inferior por lo

que no provocaría error en la ordenación espectral. Pero no es fácil establecer una razón sólida

para determinar que esto sea lo correcto con todos los pianos, por lo que se ha optado por

mantener el método de ordenación espectral en su implementación sencilla.

5.7.- IDENTIFICACIÓN DE ACORDES CORTOS

La aplicación del algoritmo definitivo a los acordes cortos da lugar a ciertas imprecisiones

en la identificación de acordes. Las más llamativas no afectan a la esencia del método de

identificación sino a la predetección y a la validación. Los espectros de los acordes cortos

presentan como se verá ciertas diferencias respecto a los de acordes largos, por lo que las

decisiones sobre los umbrales a usar en la predetección y en la validación por verificación del

fundamental, parámetros fuertemente influenciados por el espectro de los acordes, han sido

modificadas para tener en cuenta ambas posibilidades. Una vez resueltos estos aspectos, aunque

no en su totalidad en el caso del umbral de verificación de fundamental, siguen existiendo ciertos

errores que como se verá son atribuibles a defectos en las máscaras usadas para la sustracción

espectral, que deben ser ligeramente modificadas para la identificación de acordes cortos. Los

patrones, y en definitiva el modelo, no requieren modificación. En la tabla de resultados del

capítulo 6, puede verse que el comportamiento es sólo ligeramente inferior al caso de

identificación de acordes largos.

Las figuras 136, 137 y 138 muestran la comparación del espectro de un mismo acorde

ejecutado largo y corto para tres octavas distintas. Puede verse que las diferencias parecen

presentar varios efectos, entre los que destacan: mayor ruido ‘de fondo’ espectral, ensanchamiento

de pulsos y aparición marcada de componentes adicionales alrededor de la correspondiente al



Fig.136.-Espectros del acorde Do mayor de la octava 1 (C1,E1,G1) tocado “legato”(largo) y “stacatto” (corto). Se nota el ensanchamiento de los pulsos y la aparición decomponentes de muy baja frecuencia.

Fig.137.-Espectros para el acorde en octava 4 (fundamental de C4 en 261 Hz). Enacorde corto (‘stacatto’) aparecen componentes de frecuencia inferior a losfundamentales (evidentes productos de intermodulación). Las componentes espectralespresentan varios picos en vez de uno que podrían parecer los elementos del unísono,pero que están demasiado separados para serlo. Existe además más ruido espectralentre componentes.

acorde largo. Otra consecuencia apreciable es la modificación del reparto de niveles espectrales

entre los parciales. Cada figura muestra la misma información, con dos grados de detalle distintos.



Fig.138.-Espectros para octava 6. El efecto de la ejecución en ‘stacatto’ no parece sertan apreciable salvo por la aparición de componentes a bajas frecuencias. En el detallese ve que sí hay pequeñas modificaciones en los pulsos.

Aunque puede pensarse que dichos efectos son distintos e independientes, vamos a verificar

mediante simulación que todos ellos son explicables por la corta duración de la señal y por la

existencia de productos de intermodulación de segundo y tercer orden debidos al mayor

comportamiento no lineal de la vibración en los acordes cortos. Esta segunda causa es la que más

modificaciones provoca en el espectro.

La excitación de la cuerda mediante el golpe del martillo está sometida a no linealidad (causada

por el comportamiento de la felpa que recubre el martillo), que da lugar a no linealidad en la

vibración [Hall 92]. Dicho comportamiento difiere según la fuerza y velocidad del martillo y por

tanto la no linealidad es distinta según se ejecute un ‘legato’ o un ‘stacatto’.

En principio, la no linealidad en un acorde de piano se analiza para cada nota por separado,

dado que se origina durante el golpe del martillo. La mezcla de todas las vibraciones tiene lugar

en el puente y este no presenta, en principio, efectos no lineales adicionales. Por tanto, los

productos de intermodulación a considerar no son los de las notas entre sí, sino sólo los debidos

a los parciales de cada nota por separado y luego juntados todos.



Fig.139.-Se aprecia la gran cantidad de productos deintermodulación de segundo y tercer orden queaparecen en una señal de sólo tres parcialesinarmónicos (100, 205 y 320 Hz). Aparecen alrededorde las componentes, muy por debajo de ellas y porencima de ellas.

Fig.140.-Si los parciales originales son armónicos, lamayoría de los productos IM coinciden con ellos yentre sí, de forma que parece que son muchos menos.Aparentemente no afectan a los parciales originales.

La figura 139 muestra los productos de intermodulación de segundo y tercer orden de una

señal con tres componentes senoidales (fundamental y dos parciales más) inarmónicas entre sí. La

simulación se realiza con suficiente resolución espectral para distinguirlas.

Resulta evidente la aparición de componentes de menor frecuencia que el fundamental, pero

no el resto de efectos vistos anteriormente. Para ello realizaremos la simulación de una señal

compuesta por tres sinusoides en condiciones similares a las usadas en las medidas, es decir, dos

segundos muestreados a 44100Hz. La simulación de los acordes cortos se realiza tomando la señal

durante un segundo y rellenando de ceros hasta completar dos segundos.

Se tomarán fundamentales de notas pertenecientes a cuatro octavas y se calcularán los otros

parciales con un valor de inarmonicidad correspondiente a la octava, según las curvas del

coeficiente B del modelo desarrollado. Para mayor facilidad de identificación del efecto, las tres

sinusoides tiene la misma amplitud. En el caso de la octava 1 se usan diez sinusoides en lugar de

tres. Por último, en el caso de la octava 6 se incluye además el efecto cuando los parciales

superiores son muy inferiores al fundamental (caso real). Los resultados se presentan en las figuras

siguientes.



Fig.141.-Octava 6. Los productos IM aparecenclaramente diferenciados de los parciales y en grannúmero.

Fig.142.-Octava 4. Los productos IM aparecen comosi de los unísonos se tratara, pero no lo son. La notacorta aumenta el nivel de fondo, ensanchandoligeramente el pulso en su base. El aspecto muyensanchado lo da el conjunto del parcial con los IM.

Fig.143.-Octava 3. Los productos IM apenasmodifican el aspecto de los parciales. Sólo el hecho detrabajar con notas cortas ensancha ligeramente la basedel pulso. La bajísima inarmonicidad pega los IM a losparciales y apenas se distinguen.

Fig.144.-Octava 1. A pesar de la bajísimainarmonicidad, ahora los IM se distinguen entreparciales de baja frecuencia. Se ensancha claramenteel conjunto alrededor de cada parcial.

Las figuras anteriores reproducen bastante bien los efectos detectados en los espectros de

acordes cortos grabados, salvo en algún aspecto del nivel de los productos IM que en las medidas

son mayores que en la simulación. En cuanto a la simulación de la octava 6, la siguiente figura sí

tiene en cuenta que no tiene tres parciales al mismo nivel, y puede verse la gran similitud de la

simulación con la realidad, incluso considerando una inarmonicidad mayor, más propia de la

octava 7.


Fig.145.-Octava 6 con el segundo parcial a 1/20 y el tercer parcial a1/100 del fundamental. El fundamental casi no cambia y aparece suarmónico con mayor nivel que el segundo parcial.

Como conclusión de este estudio simulado del efecto de la no linealidad, diremos que

consideramos adecuado seguir usando los mismos patrones para identificar las notas del acorde,

pero que las máscaras para limpiar el espectro deben eliminar dichos productos IM, por tanto

deberán ser más anchas que en el caso de identificación de acordes largos.

5.8.- IDENTIFICACIÓN DE ACORDES DE OTRO PIANO

Las diferencias de comportamiento en la fiabilidad de la identificación de acordes al aplicar el

algoritmo a un piano distinto, se centran básicamente en dos aspectos:

-Los umbrales de predetección pueden requerir modificación. Los coeficientes de predetección

se calculan a partir de los niveles del espectro de las señales y la distribución de dichos niveles,

son ligeramente distintos entre pianos, sobre todo al cambiar el tamaño, que afecta a la

radiación de la placa resonante en frecuencias de las octavas graves. Sin duda, la

determinación de un umbral general requiere un futuro estudio estadístico que use una amplia

base de datos de pianos.

-El error cometido en los valores entrenados y usados para generar los patrones no va a ser

el mismo, por lo que puede variarse el grado de fiabilidad, especialmente en las octavas graves.


CAPÍTULO 6: RESULTADOS Y DISCUSIÓN

6.1.- INTRODUCCIÓN

En este capítulo se presentan los resultados de la aplicación del algoritmo de identificación

de acordes para todos los acordes probados y con diversos valores de ciertos parámetros.

En primer lugar se expresan los resultados en tablas que indican los acordes analizados y

los identificados.

También se incluye una colección de gráficas donde se muestran, para todos los acordes,

los pasos en la identificación así como el residuo espectral que queda. Aunque estas figuras sólo

muestran una parte del espectro suficiente para apreciar la sustracción espectral, los cálculos se

realizan en todo el espectro. esto es importante a la hora de analizar el dato de nivel de residuo

respecto al espectro original, que se expresa en dB y se calcula en toda la banda (0 a 22500Hz).

6.2.- ALGORITMO DEFINITIVO

El algoritmo de entrenamiento es único y se ejecuta el primero con el fin de generar los

patrones y las máscaras correspondientes a todas las 88 notas del piano. También se generan los

multipatrones para la octava 7 y nota C8.

Una vez se tienen los patrones y las máscaras, se procede a ejecutar el algoritmo de



identificación. Para poder comparar resultados, el algoritmo que se ha implementado para las

pruebas permite las siguientes opciones:

-Validación alta: se aplica validación por fundamental en las octavas 3 a 7 y validación

por ordenación espectral en las octavas graves 0,1 y 2.

-Validación media: se aplica validaciónpor ordenación espectral a todas las octavas.

-Validación nula: no se aplica validación alguna. Corresponde al método de detección sin

más.

A su vez, se puede elegir el tipo de sustracción que se realiza con las máscaras: progresiva

o abrupta. La selección puede ser del siguiente modo:

-Sin validación o con validación por fundamental: sólo existe un proceso de sustracción,

que es el que se tiene entre cada detección de nota con la métrica o con validación por

fundamental. La denominaremos sustracción o máscaras “intra”

-Con validación por ordenación espectral: existen dos procesos de sustracción. El primero

es el que, como antes, se da entre cada detección de nota con la métrica, para obtener el

conjunto de notas del acorde o residuo, antes de cada validación. El segundo es el que se

realiza una vez que se valida una nota antes de proceder a la siguiente detección multinota.

A esta nueva sustracción la llamaremos “inter”. Se puede resumir como pareja [inter-

validaciones e intra-acorde]

La nomenclatura que utilizaremos para identificar las máscaras o sustracciones usadas es

la de nombrar la pareja “inter-intra”. Por ejemplo, “abrupta-progresiva”(simplificada como [a,p])

significa que se ha usado sustracción abrupta inter (para los distintos pasos de identificación de

nota con validación) y progresiva intra (para las distintas notas de la señal multinota).



6.3.- ACORDES A IDENTIFICAR

Como ya se indicó, los acordes que se han grabado para probar la identificación son

diversos.

Los acordes cerrados o “en posición cerrada”son los que tienen todas sus notas en la

misma octava. Se han grabado 6 de ellos en cada una de las 7 octavas. Todos ellos son acordes

de Do en estado fundamental (no invertido), por lo que el Do es la nota de menor frecuencia, lo

que se corresponde con la posición cerrada. Tres de ellos son acordes de tres notas:

Acorde 1: Do Mayor (C,E,G)

Acorde 2: Do Menor (C,D#,G)

Los otros cuatro son acordes de cuatro notas:

Acorde 3: Do Mayor con séptima menor (C,E,G,A#)

Acorde 4: Do Menor con séptima disminuida (C,D#,F#,A)

Acorde 5: Do Menor con séptima menor (C,D#,G,A#)

Acorde 6: Do Mayor con séptima mayor (C,E,G,B)

Puede verse que tres de los acordes de cuatro notas contienen las mismas notas que

algunos acordes de 3 notas. Así podrán verificarse los efectos de sobrecarga de espectro por

comparación de resultados.

Para verificar el funcionamiento del sistema de identificación en condiciones de acordes

más genéricos, se ha grabado un acorde en posición abierta para todas las octavas de la 1 a la 6.

La posición abierta supone que una de las notas del acorde pertenece a la octava inmediatamente

superior. Por eso no ha sido grabado el acorde de la octava 7, pues de la octava 8 sólo existe la

nota C8. El acorde es uno de los usados anteriormente, para poder hacer comparaciones de

resultados, concretamente:

Acorde 7: Do Mayor con séptima menor abierto (C(n),G(n),A#(n),E(n+1)), o bien

(C,G,A#,E+)

Por último, para comparar el efecto del método de estimación del espectro que se intenta

identificar, y para adecuarse a la realidad de la duración de los acordes en un pasaje musical, las



grabaciones anteriores han sido realizadas con dos ejecuciones:

-Legato sin soltar la tecla hasta después de 3 s. Les llamaremos acordes largos

- “Stachatto” con pulsación rápida de la tecla, soltándola unas décimas de segundo más

tarde. Les llamaremos acordes cortos.

La única similitud entre las dos ejecuciones aparece en los acordes de la octava 7, en la que

al no estar dotado el piano de apagadores en las notas de dicha octava, apenas hay diferencia en

la duración de la nota, si bien sí la hay en la evolución temporal del inicio (el ataque

principalmente).

Otra importante diferencia entre ambas ejecuciones es que el “stachatto” produce más

distorsión no lineal.

6.4.- TABLAS DE RESULTADOS: ACORDES CERRADOS y LARGOS

El orden en que se presentan los resultados es empezando por el método de mejor

comportamiento , por lo que avanzar en las tablas supone empeorar. Sin embargo, es importante

disponer de los resultados peores para poder comparar y establecer las razones de las mejoras.

6.4.1.- ALGORITMO CON VALIDACIÓN ALTA

La identificación de acordes realizada usando validación por verificación del fundamental

en octavas altas y validación por ordenación espectral en octavas graves, da los siguientes

resultados, tanto para máscaras abruptas en ambas sustracciones (inter-validaciones y intra-

acorde), como para máscaras inter abruptas e intra progresivas. Ya se ha indicado en el capítulo

anterior que el uso de máscaras progresivas en el proceso “inter” no da mejores resultados.

Podrá verse que resulta evidente que los errores empiezan a aparecer por la variación de

la métrica ante exceso de componentes espectrales. Puede verse que el acorde de tres notas CEG

se detecta sin error, mientras que el acorde de cuatro notas CEGA# que contiene las mismas notas

más una adicional, presenta problemas para ciertas máscaras.



Tabla de resultados 1: Acordes de 3 notas con validación por fundamental para octavas 3 a 7 y validación

por ordenación espectral para octavas 1 y 2. Sustracciones [a,a] y [a,p]

Acordes analizados Acordes identificados con

máscaras abrupta-abrupta

Acordes identificados con

máscaras abrupta-progresiva

C,E,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'E1' 'C1'

'G2' 'E2' 'C2'

'C3' 'G3' 'E3'

'C4' 'G4' 'E4'

'C5' 'E5' 'G5'

'E6' 'G6' 'C6'

'E7' 'G7' 'C7'

'G1' 'E1' 'C1'

'G2' 'E2' 'C2'

'C3' 'G3' 'E3'

'C4' 'G4' 'E4'

'C5' 'E5' 'G5'

'E6' 'G6' 'C6'

'E7' 'G7' 'C7'

C,D#,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'D#1' 'C1'

'G2' 'D#2' 'C2'

'C3' 'G3' 'D#3'

'C4' 'D#4' 'G4'

'C5' 'G5' 'D#5'

'G6' 'D#6' 'C6'

'D#7' 'G7' 'C7'

'G1' 'D#1' 'C1'

'G2' 'D#2' 'C2'

'C3' 'G3' 'D#3'

'C4' 'D#4' 'G4'

'C5' 'G5' 'D#5'

'G6' 'D#6' 'C6'

'D#7' 'G7' 'C7'

-No existe ningún error con ninguna de las combinaciones de máscaras.


por ordenación espectral para octavas 1 y 2. Sustracciones [a,a] y [a,p]





C,E,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A#2' 'E1' 'C1' 'A#0'

'A#2' 'G2' 'E2' 'C2'

'C3' 'A#3' 'E3' 'G3'

'A#4' 'C4' 'G4' 'E4'

'C5' 'E5' 'G5' 'A#5'

'E6' 'A#6' 'C6' 'G6'

'E7' 'A#7' 'C7' 'E7'

'A#1' 'G1' 'E1' 'C1'

'A#2' 'G2' 'E2' 'C2'

'C3' 'A#3' 'G3' 'E3'

'A#4' 'C4' 'G4' 'E4'

'C5' 'E5' 'G5' 'A#5'

'E6' 'A#6' 'C6' 'G6'

'E7' 'A#7' 'C7' 'E7'



C,D#,F#,A oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'C3' 'D#3' 'F#3' 'A3'

'A4' 'C4' 'F#4' 'D#4'

'C5' 'A5' 'D#5' 'F#5'

'F#6' 'D#6' 'C6' 'A6'

'D#7' 'F#7' 'C7' 'A7'

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'C3' 'D#3' 'F#3' 'A3'

'A4' 'C4' 'F#4' 'D#4'

'C5' 'A5' 'D#5' 'F#5'

'F#6' 'D#6' 'C6' 'A6'

'D#7' 'F#7' 'C7' 'A7'

C,D#,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'C3' 'D#3' 'A#3' 'G3'

'C4' 'A#4' 'G4' 'D#4'

'C5' 'D#5' 'G5' 'A#5'

'D#6' 'G6' 'C6' 'A#6'

'D#7' 'G7' 'A#7' 'C7'

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'C3' 'D#3' 'A#3' 'G3'

'C4' 'A#4' 'G4' 'D#4'

'C5' 'D#5' 'G5' 'A#5'

'D#6' 'G6' 'C6' 'A#6'

'D#7' 'G7' 'A#7' 'C7'

C,E,G,B oct1

oct2

oct3

oct4

oct5

oct6

oct7

'B1' 'G1' 'E1' 'C1'

'G2' 'C2' 'G#1' 'E1'

'C3' 'G3' 'E3' 'B3'

'C4' 'G4' 'B4' 'E4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'G6' 'C6'

'E7' 'G7' 'C7' 'E7'

'B1' 'G1' 'E1' 'C1'

'G2' 'E2' 'C2' 'B1'

'C3' 'G3' 'E3' 'B3'

'C4' 'G4' 'B4' 'E4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'G6' 'C6'

'E7' 'G7' 'C7' 'E7'

-Los errores E7, que repiten, se deben a que en ambos caos, la componente espectral de la nota que falta por

detectar tiene un nivel demasiado bajo y se confunde con el ruido. Ante tal situación, el residuo de E7 resulta

tener suficiente nivel para volver a ser detectado.



6.4.2.- ALGORITMO CON VALIDACIÓN MEDIA

La identificación de acordes realizada usando validación por ordenación espectral en todas

las octavas, da los siguientes resultados, para máscaras abruptas o progresivas en sustracción

inter-validaciones y máscaras abruptas o progresivas en la sustraccción intra-acorde.

Como los resultados se han trascrito a las tablas en el orden dado por el algoritmo, puede

verse que casi siempre están ordenadas las notas de mayor a menor. Si las notas se van validando

tomando la más alta, lo normal es que queden ordenadas de mayor a menor. Esto no siempre

ocuure como veremos y ya discutiremos la razón.

Al final de cada tabla se incluye una discusión específica de los resultados, incluyendo

conclusiones cuando corresponda.

Tabla de resultados 3: Acordes de 3 notas con validación por ordenación espectral en todas las octavas.

Sustracciones [a,a] y [a,p]





C,E,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'E1' 'C1'

'G2' 'E2' 'C2'

'G3' 'E3' 'C3'

'B4' 'E4' 'C3'

'G5' 'E5' 'C5'

'G6' 'E6' 'C6'

'G7' 'E7' 'C7'

'G1' 'E1' 'C1'

'G2' 'E2' 'C2'

'G3' 'E3' 'C3'

'G4' 'E4' 'C4'

'G5' 'E5' 'C5'

'G6' 'E6' 'C6'

'G7' 'E7' 'C7'

C,D#,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'D#1' 'C1'

'G2' 'D#2' 'C2'

'G3' 'D#3' 'C3'

'G4' 'D#4' 'C4'

'G5' 'D#5' 'C5'

'G6' 'D#6' 'C6'

'G7' 'D#7' 'C7'

' G1' 'D#1' 'C1'

'G2' 'D#2' 'C2'

'G3' 'D#3' 'C3'

'G4' 'D#4' 'C4'

'G5' 'D#5' 'C5'

'G6' 'D#6' 'C6'

'G7' 'D#7' 'C7'

-Sólo existe un error en la combinación de máscaras [a,a]. Al fallar la validación de G4, y su sustracción,

aparece el error de C3 por C4.



Tabla de resultados 4: Acordes de 3 notas con validación por ordenación espectral en todas las octavas

y sustracciones [p,a] [p,p]


máscaras progresiva-abrupta


máscaras progresiva-progresiva

C,E,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'E1' 'C1'

'G2' 'E2' 'C2'

'G3' 'E3' 'C3'

'B4' 'E4' 'C3'

'G5' 'E5' 'C5'

'G6' 'E6' 'C6'

'G7' 'E7' 'C7'

'G1' 'E1' 'C1'

'G2' 'E2' 'C2'

'G3' 'E3' 'C3'

'G4' 'E4' 'C3'

'G5' 'E5' 'C5'

'G6' 'E6' 'C6'

'G7' 'E7' 'C7'

C,D#,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'D#1' 'C1'

'G2' 'D#2' 'C2'

'G3' 'D#3' 'C3'

'G4' 'D#4' 'C4'

'G5' 'D#5' 'C5'

'G6' 'D#6' 'C6'

'G7' 'D#7' 'C7'

'G1' 'D#1' 'C1'

'G2' 'D#2' 'C2'

'G3' 'D#3' 'C3'

'G4' 'D#4' 'C4'

'G5' 'D#5' 'C5'

'G6' 'D#6' 'C6'

'G7' 'D#7' 'C7'

-Aparece el mismo error que antes, por lo que es atribuible al uso de máscara intra tipo abrupto.

-Aparece un segundo error que afecta al mismo acorde en la misma octava pero al usar máscaras ambas

progresivas. La conclusión evidente es que la máscara inter-validaciones progresiva no ha sustraído bien los

espectros de G4 y E4 validados y se ha producido el error. Puede verse que en la misma octava, el otro acorde,

una vez validado G4 y sustraído, no provoca error en la detección de C4. Lo que indica que en el error también

colabora E4.

-La conclusión es que las máscaras progresivas inter-validaciones no son recomendables, y que las máscaras

abruptas intra-acordes no siempre son las mejores.



Tabla de resultados 5: Acordes de 4 notas con validación por ordenación espectral en todas las octavas.

Sustracciones [a,a] y [a,p].





C,E,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A#2' 'E1' 'C1' 'A#0'

'A#2' 'G2' 'E2' 'C2'

'A#3' 'G3' 'E3' 'C3'

'B4' 'A#4' 'E4' 'C3'

'A#5' 'G5' 'E5' 'C5'

'A#6' 'G6' 'E6' 'C6'

'A#7' 'E7' 'E7' 'C5'

'A#1' 'G1' 'E1' 'C1'

'A#2' 'G2' 'E2' 'C2'

'A#3' 'G3' 'E3' 'C3'

'A#4' 'E4' 'C3' 'B4'

'A#5' 'G5' 'E5' 'C5'

'A#6' 'G6' 'E6' 'C6'

'A#7' 'E7' 'E7' 'C5'

C,D#,F#,A oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'A3' 'F#3' 'D#3' 'C3'

'A4' 'F#4' 'D#4' 'C4'

'A5' 'F#5' 'D#5' 'C5'

'A6' 'F#6' 'D#6' 'C6'

'A7' 'F#7' 'D#7' 'C7'

' A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'A3' 'F#3' 'D#3' 'C3'

'A4' 'F#4' 'D#4' 'C4'

'A5' 'F#5' 'D#5' 'C5'

'A6' 'F#6' 'D#6' 'C6'

'A7' 'F#7' 'D#7' 'C7'

C,D#,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'A#3' 'G3' 'D#3' 'C3'

'A#4' 'G4' 'D#4' 'C4'

'A#5' 'G5' 'D#5' 'C5'

'A#6' 'D#6' 'C6' 'G6'

'A#7' 'G7' 'D#7' 'C7'

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'A#3' 'G3' 'D#3' 'C3'

'A#4' 'G4' 'D#4' 'C4'

'A#5' 'G5' 'D#5' 'C5'

'A#6' 'D#6' 'C6' 'G6'

'A#7' 'G7' 'D#7' 'C7'

C,E,G,B oct1

oct2

oct3

oct4

oct5

oct6

oct7

'B1' 'G1' 'E1' 'C1'

'G2' 'C2' 'G#1' 'E1'

'B3' 'G3' 'E3' 'C3'

'B4' 'G4' 'E4' 'C4'

'B5' 'G5' 'E5' 'C5'

'B6' 'E6' 'E5' 'C5'

'G7' 'E7' 'E7' 'C7'

'B1' 'G1' 'E1' 'C1'

'G2' 'E2' 'C2' 'B1'

'B3' 'G3' 'E3' 'C3'

'B4' 'G4' 'E4' 'C4'

'B5' 'G5' 'E5' 'C5'

'B6' 'E6' 'E5' 'C5'

'G7' 'E7' 'C7' 'E7'



-Puede verse que aparecen errores en octavas donde no existían para tres notas y en algunos acordes que

comparten notas con los de tres notas. No en todos los casos en que se comparten notas aparecen errores al tener

cuatro notas. Ocuure con C,E,G pero no con C,D#,G.

Tabla de resultados 6: Acordes de 4 notas con validación por ordenación espectral en todas las octavas y

y sustracciones [p,a] [p,p]


máscaras progresiva-abrupta


máscaras progresiva-progresiva

C,E,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A#2' 'E1' 'C1' 'A#0'

'A#2' 'G2' 'E2' 'C1'

'A#3' 'G3' 'E3' 'C3'

'B4' 'A#4' 'E4' 'C3'

'A#5' 'G5' 'E5' 'C5'

'A#6' 'G6' 'E6' 'C6'

'A#7' 'E7' 'E7' 'C5'

'A#1' 'E1' 'C1' 'A#0'

'A#2' 'G2' 'E2' 'C1'

'A#3' 'G3' 'E3' 'C3'

'A#4' 'E4' 'C3' 'C3'

'A#5' 'G5' 'E5' 'C5'

'A#6' 'G6' 'E6' 'C6'

'A#7' 'E7' 'E7' 'C5'

C,D#,F#,A oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'A3' 'F#3' 'D#3' 'C3'

'A4' 'F#4' 'D#4' 'C4'

'A5' 'F#5' 'D#5' 'C5'

'A6' 'F#6' 'D#6' 'C6'

'A7' 'F#7' 'D#7' 'C7'

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'A3' 'F#3' 'D#3' 'C3'

'A4' 'F#4' 'D#4' 'C4'

'A5' 'F#5' 'D#5' 'C5'

'A6' 'F#6' 'D#6' 'C6'

'A7' 'F#7' 'D#7' 'C7'

C,D#,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'A#3' 'G3' 'D#3' 'C3'

'A#4' 'D#4' 'D#3' 'C3'

'A#5' 'G5' 'D#5' 'C5'

'A#6' 'D#6' 'C6' 'G6'

'A#7' 'G7' 'D#7' 'C7'

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'A#3' 'G3' 'D#3' 'C3'

'A#4' 'G4' 'D#4' 'C4'

'A#5' 'G5' 'D#5' 'C5'

'A#6' 'D#6' 'C6' 'G6'

'A#7' 'G7' 'D#7' 'C7

C,E,G,B oct1

oct2

oct3

oct4

oct5

oct6

oct7

'B1' 'G1' 'E1' 'C1'

'G2' 'C2' 'G1' 'E1'

'B3' 'G3' 'E3' 'C3'

'B4' 'G4' 'E3' 'C3'

'B5' 'G5' 'E5' 'C5'

'B6' 'B6' 'E6' 'C5'

'G7' 'E7' 'E7' 'C7'

'B1' 'G1' 'E1' 'C1'

'G2' 'E2' 'C2' 'B1'

'B3' 'G3' 'E3' 'C3'

'B4' 'G4' 'E3' 'C3'

'B5' 'G5' 'E5' 'C5'

'B6' 'E6' 'E5' 'C5'

'G7' 'E7' 'C7' 'C5'



-Se ve que una vez más, la máscara progresiva en la sustracción inter-validaciones genera más errores que la

máscara abrupta.

-También puede verse como resumen, que el acorde C,D#,F#,A es muy robusto, y se debe a que las relaciones

entre las notas del acorde (Do menor con séptima disminuida) no favorecen la compartición de parciales que

puedan equivocar a la métrica, por lo que las máscaras usadas tampoco resultan ser tan críticas.

6.4.3.- ALGORITMO SIN VALIDACIÓN

La identificación de acordes realizada sin validación en ninguna de las octavas, da los

siguientes resultados, en los que se ha considerado tanto máscaras abruptas como progresivas en

la única sustracción que tiene lugar, la intra-acorde.

Al final de cada tabla se incluye una discusión específica de los resultados, incluyendo

conclusiones cuando corresponda.

Tabla de resultados 7: Acordes de 3 notas sin validación


máscaras abruptas


máscaras progresivas

C,E,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'C1' 'E1' 'G1'

'C1' 'E2' 'G2'

'C3' 'G3' 'E3'

'C3' 'E4' 'B4'

'C5' 'E5' 'G5'

'E6' 'G6' 'C6'

'E7' 'G7' 'C7'

'C1' 'E1' 'G1'

'C1' 'E2' 'G2'

'C3' 'G3' 'E3'

'C3' 'E4' 'G4'

'C5' 'E5' 'G5'

'E6' 'G6' 'C6'

'E7' 'G7' 'C7'

C,D#,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'C1' 'D#1' 'G1'

'C1' 'D#2' 'G2'

'C3' 'G3' 'D#3'

'C3' 'D#4' 'G4'

'C5' 'G5' 'D#5'

'G6' 'D#6' 'C6'

'D#7' 'G7' 'C7'

'C1' 'D#1' 'G1'

'C1' 'D#2' 'G2'

'C3' 'G3' 'D#3'

'C3' 'D#4' 'G4'

'C5' 'G5' 'D#5'

'G6' 'D#6' 'C6'

'D#7' 'G7' 'C7'



-Existen 4 acordes con errores y son los mismos para ambas máscaras. Básicamente se deben al efecto de la nota

G en la confusión de C3 por C4 y C1 por C2. No se da en el resto de los casos por la existencia de predetección.

Podría darse también entre C6 y C7, pero la marcada inarmonicidad en esas octavas las diferencia bien.

-Llama la atención el error de B4 por G4, debido muy seguramente a que al sustraer la máscara de la nota C3

primeramente detectada, se ha hecho desaparecer el fundamental de G4, dependiendo la identificación de G4

sólo de los parciales. La coincidencia de parciales de G4 con parciales de B4 completa la causa del error.

Tabla de resultados 8: Acordes de 4 notas sin validación.


máscaras abruptas


máscaras progresivas

C,E,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'C1' 'A#0' 'E1' 'A#2'

'C1' 'E2' 'A#2' 'G2'

'C3' 'A#3' 'E3' 'G3'

'C3' 'A#4' 'E4' 'B4'

'C5' 'E5' 'G5' 'A#5'

'E6' 'A#6' 'C6' 'G6'

'E7' 'A#7' 'C5' 'E7'

'C1' 'A#0' 'E1' 'A#1'

'C1' 'E2' 'A#2' 'G2'

'C3' 'A#3' 'G3' 'E3'

'C3' 'A#4' 'E4' 'C3'

'C5' 'E5' 'G5' 'A#5'

'E6' 'A#6' 'C6' 'G6'

'E7' 'A#7' 'C5' 'E7'

C,D#,F#,A oct1

oct2

oct3

oct4

oct5

oct6

oct7

'C1' 'D#1' 'F#1' 'A1'

'B0' 'C2' 'A2' 'D#2'

'C3' 'D#3' 'F#3' 'A3'

'A4' 'C4' 'F#4' 'D#4'

'C5' 'A5' 'D#5' 'F#5'

'F#6' 'D#6' 'C6' 'A6'

'D#7' 'F#7' 'C7' 'A7'

'C1' 'D#1' 'F#1' 'A1'

'B0' 'C2' 'D#2' 'A2'

'C3' 'D#3' 'F#3' 'A3'

'A4' 'C4' 'F#4' 'D#4'

'C5' 'A5' 'D#5' 'F#5'

'F#6' 'D#6' 'C6' 'A6'

'D#7' 'F#7' 'C7' 'A7'

C,D#,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'D#1' 'C1' 'A#0' 'G1'

'C1' 'D#2' 'A#2' 'G2'

'C3' 'D#3' 'A#3' 'G3'

'C3' 'D#3' 'G4' 'A#4'

'C5' 'D#5' 'G5' 'A#5'

'D#6' 'C5' 'A#6' 'C6'

'D#7' 'G7' 'A#7' 'C7'

'D#1' 'C1' 'A#0' 'G1'

'C1' 'D#2' 'A#2' 'G2'

'C3' 'D#3' 'A#3' 'G3'

'C3' 'D#3' 'A#4' 'G4'

'C5' 'D#5' 'G5' 'A#5'

'D#6' 'C5' 'A#6' 'C6'

'D#7' 'G7' 'A#7' 'C7'



C,E,G,B oct1

oct2

oct3

oct4

oct5

oct6

oct7

'E1' 'C1' 'B1' 'G1'

'C1' 'E1' 'G2' 'C2'

'C3' 'G3' 'E3' 'B3'

'C3' 'E3' 'G4' 'B4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'C5' 'E5'

'E7' 'G7' 'C7' 'E7'

'E1' 'C1' 'B1' 'G1'

'C1' 'E1' 'G2' 'E2'

'C3' 'G3' 'E3' 'B3'

'C3' 'E3' 'G4' 'B4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'C5' 'E5'

'E7' 'G7' 'C7' 'C5'

-El número de errores sube hasta 13 acordes fallados de 28.

-El tipo de sustracción no impone diferencia en los acordes erróneos, sólo en algunas notas concretas.

-En las dos primeras octavas (graves) existe gran “sobrecarga” de espectro que incrementa el número de errores,

al haber más componentes con las que puntuar todos los patrones graves. Permanecen los problemas en la octava

4, pero con cierto incremento del número de notas erradas en el acorde fallido, y aparecen errores del mismo

tipo en las octavas más altas.

-Puede verse que el acorde C,D#,F#,A es el más robusto, aunque presenta error en la octava 2. Es un error

“raro” (B0 en vez de F#2) que se produce como primera identificación y por tanto se debe a una sobrecarga de

espectro con coincidencia de muchas componentes con los parciales superiores del patrón B0.



6.5.- TABLAS DE RESULTADOS: ACORDES ABIERTOS

En este caso, directamente se muestran los resultados en el caso mejor que es con

validación alta y máscaras [abruptas-progresivas]. Los resultados para acordes abiertos y largos

son:

Tabla de resultados 9: Acorde de 4 notas abiertos con validación alta.


máscaras abruptas-progresivas

C,G,A#,E+ oct1

oct2

oct3

oct4

oct5

oct6

'E2' 'A#1' 'G1' 'C1'

'A#2' 'G2' 'E2' 'C2'

'C3' 'G3' 'A#3' 'E4'

'A#4' 'C4' 'G4' 'A#4'

'C5' 'G5' 'A#5' 'C5'

'A#6' 'G6' 'E7' 'C6'

-Aparecen 3 acordes erróneos. Ninguno de ellos era erróneo en la posición cerrada.

-El problema surge exclusivamente por la aplicación de la predetección de octava.

E2 por E3: si se predetecta banda grave, no se usan patrones de la octava 3 y no se puede obtener E3

A#4 por E5: lo mismo al predetectarse banda 2 (sólo patrones de octavas 3 y 4)

C5 por E6: lo mismo cuando se predetecta banda 3 con zona baja (sólo patrones octava 5)



6.6.- TABLAS DE RESULTADOS: ACORDES CORTOS

Si se aplica el algoritmo, con validación alta y máscaras abruptas-progresivas, a acordes

cortos, una vez modificado el algoritmo de predetección de manera compatible con los acordes

largos. Los resultados son los de la siguiente tabla. Se han puesto, para facilitar la comparación,

los resultados para los mismos acordes pero largos.

Tabla de resultados 10: Acordes cortos de 3 notas con validación alta y sustracción abrupta-progresiva

Acordes analizados Acordes cortos identificados Acordes largos identificados

C,E,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'E1' 'C1'

'E2' 'G1' 'C1'

'C3' 'G3' 'C3'

'G4' 'C4' 'C3'

'G5' 'C5' 'E5'

'G6' 'E6' 'C6'

'E7' 'G7' 'C7'

'G1' 'E1' 'C1'

'G2' 'E2' 'C2'

'C3' 'G3' 'E3'

'C4' 'G4' 'E4'

'C5' 'E5' 'G5'

'E6' 'G6' 'C6'

'E7' 'G7' 'C7'

C,D#,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'D#1' 'C1'

'D#2' 'G1' 'C1'

'C3' 'G3' 'D#3'

'G4' 'D#4' 'C4'

'G5' 'C5' 'D#5'

'G6' 'C6' 'D#6'

'D#7' 'G7' 'C7'

'G1' 'D#1' 'C1'

'G2' 'D#2' 'C2'

'C3' 'G3' 'D#3'

'C4' 'D#4' 'G4'

'C5' 'G5' 'D#5'

'G6' 'D#6' 'C6'

'D#7' 'G7' 'C7'

-Aparecen fallos especialmente inesperados en las octavas 3 y 4 en las que la validación por verificación del

fundamental parecía definitiva. La existencia de componentes IM y ruido que pueden confundir la verificación

del fundamental, queda patente en estos resultados

-En cuanto a errores en octavas graves, existen defectos debidos a que los componentes de intermodulación por

no linealidad, engordan el pulso a ser identificado por encima del ancho de los patrones. Eso hace a la métrica

muy sensible a la coincidencia exacta de los parciales de los patrones con las componentes espectrales del

acorde.



Tabla de resultados 11: Acordes cortos de 4 notas con validación alta y sustracción abrupta-progresiva

Acordes analizados Acordes cortos identificados Acordes largos identificados

C,E,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A#1' 'G1' 'E1' 'C1'

'A#2' 'E2' 'C2' 'C#1'

'C3' 'A#3' 'E3' 'C3'

'A#4' 'C4' 'C3' 'E4'

'C5' 'G5' 'E5' 'A#5'

'E6' 'A#6' 'C6' 'E6'

'E7' 'A#7' 'C7' 'E7'

'A#1' 'G1' 'E1' 'C1'

'A#2' 'G2' 'E2' 'C2'

'C3' 'A#3' 'G3' 'E3'

'A#4' 'C4' 'G4' 'E4'

'C5' 'E5' 'G5' 'A#5'

'E6' 'A#6' 'C6' 'G6'

'E7' 'A#7' 'C7' 'E7'

C,D#,F#,A oct1

oct2

oct3

oct4

oct5

oct6

oct7

'F#1' 'A1' 'D#1' 'C1'

'D#2' 'D1' 'C1' 'B0'

'C3' 'D#3' 'F#3' 'A3'

'A4' 'D#4' 'C4' 'F#4'

'A5' 'F#5' 'C5' 'D#5'

'F#6' 'C6' 'A6' 'D#6'

'D#7' 'F#7' 'C7' 'A7'

'A1' 'F#1' 'D#1' 'C1'

'A2' 'D#2' 'F#2' 'C2'

'C3' 'D#3' 'F#3' 'A3'

'A4' 'C4' 'F#4' 'D#4'

'C5' 'A5' 'D#5' 'F#5'

'F#6' 'D#6' 'C6' 'A6'

'D#7' 'F#7' 'C7' 'A7'

C,D#,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A#1' 'G1' 'D#2' 'C1'

'D#2' 'A#1' 'G1' 'C1'

'C3' 'G3' 'D#3' 'A#3'

'A#4' 'D#4' 'C4' 'C3'

'C5' 'D#5' 'G5' 'A#5'

'A#6' 'G6' 'C6' 'D#6'

'D#7' 'G7' 'A#7' 'C7'

'G1' 'A#1' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C2'

'C3' 'D#3' 'A#3' 'G3'

'C4' 'A#4' 'G4' 'D#4'

'C5' 'D#5' 'G5' 'A#5'

'D#6' 'G6' 'C6' 'A#6'

'D#7' 'G7' 'A#7' 'C7'

C,E,G,B oct1

oct2

oct3

oct4

oct5

oct6

oct7

'B1' 'G1' 'C1' 'A0'

'E1' 'C2' 'C#1' 'A0'

'C3' 'G3' 'E3' 'B3'

'B4' 'C4' 'G4' 'E4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'G6' 'C6'

'E7' 'G7' 'C7' 'E7'

'B1' 'G1' 'E1' 'C1'

'G2' 'E2' 'C2' 'B1'

'C3' 'G3' 'E3' 'B3'

'C4' 'G4' 'B4' 'E4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'G6' 'C6'

'E7' 'G7' 'C7' 'E7'

-Aparecen errores en las octavas graves por la diferencia en ancho de patrones y espectros con IM

-La validación por fundamental falla en algunos casos de octavas medias por errores inducidos por mayor

nivel de ruido espectral y presencia de productos IM

-Permanecen errores de repetición de nota identificada, en las octavas más altas, por falta de nivel de alguna

nota. Crecen los casos ante mayor nivel de ruido espectral respecto a acordes largos





6.7.- TABLAS DE RESULTADOS: PIANO YAMAHA C3

En este apartado se incluyen los resultados obtenidos al aplicar todo el proceso de

entrenamiento e identificación a los acordes de un piano distinto. Se trata de la tercera grabación

realizada, según se explicó en el apartado de “Material y generalización de resultados” (página 28).


por ordenación espectral para octavas 1 y 2. Sustracción [a,p]. Piano distinto



C,E,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'E1' 'C1'

'G1' 'E2' 'C1'

'C3' 'G3' 'E3'

'C4' 'G4' 'E4'

'C5' 'E5' 'G5'

'E6' 'G6' 'C6'

'E7' 'G7' 'C7'

C,D#,G oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'D#1' 'C1'

'G2' 'D#2' 'C1'

'C3' 'G3' 'D#3'

'C4' 'D#4' 'G4'

'C5' 'D#5' 'G5'

'D#6' 'G6' 'C6'

'D#7' 'C7' 'G7'

-Existen 2 errores. La octava 2 mantiene problemas con la ambigüedad de octavas respecto a la octava 1. Estos

errores que no existían en las pruebas del piano Steinway, y que se dan en una octava de difícil validación y

cuyos resultados dependen mucho de la métrica entre el espectro y los patrones, pueden deberse a una menor

perfección en la coincidencia de los patrones con los espectros. Esta proviene, evidentemente, del proceso de

entrenamiento y depende de los errores cometidos en los cálculos de las aproximaciones de las curvas de

afinación y coeficiente de inarmonicidad B.




por ordenación espectral para octavas 1 y 2. Sustracción [a,p]. Piano distinto



C,E,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'E1' 'C1' 'A#0'

'E2' 'G2' 'A#2' 'C1'

'C3' 'G3' 'A#3' 'E3'

'C4' 'A#4' 'E4' 'G4'

'C5' 'E5' 'G5' 'A#5'

'E6' 'A#6' 'C6' 'G6'

'E7' 'A#7' 'E7' 'C7'

C,D#,F#,A oct1

oct2

oct3

oct4

oct5

oct6

oct7

'A1' 'F#1' 'D#1' 'C1'

'A2' 'F#2' 'D#2' 'C1'

'C3' 'D#3' 'F#3' 'C3'

'A4' 'C4' 'F#4' 'D#4'

'C5' 'A5' 'D#5' 'F#5'

'F#6' 'D#6' 'C6' 'A6'

'D#7' 'C7' 'F#7' 'A7'

C,D#,G,A# oct1

oct2

oct3

oct4

oct5

oct6

oct7

'G1' 'F2' 'D#1' 'C1'

'A#2' 'G2' 'D#2' 'C1'

'C3' 'D#3' 'G3' 'A#3'

'C4' 'D#4' 'G4' 'A#4'

'C5' 'D#5' 'G5' 'A#5'

'D#6' 'C6' 'G6' 'A#6'

'D#7' 'C7' 'A#7' 'G7'

C,E,G,B oct1

oct2

oct3

oct4

oct5

oct6

oct7

'B1' 'G1' 'E1' 'C1'

'E2' 'G2' 'B2' 'C1'

'C3' 'G3' 'E3' 'C3'

'C4' 'G4' 'B4' 'E4'

'C5' 'E5' 'G5' 'B5'

'E6' 'B6' 'C6' 'G6'

'E7' 'E7' 'C7' 'G7'



-Podemos encontrar una vez más errores en las octavas inferiores y el error de repetición de nota en la octava

7 (E7). Todo ello como ocurre con el piano Steinway. En este otro piano (Yamaha) nos encontramos también

con un error de repetición de nota en la octava 3 (C3). Resulta evidente la conveniencia de incluir un detector

de repetición de nota validada en las futuras mejoras del algoritmo.

6.8.- FIGURAS DE PROCESOS DE IDENTIFICACIÓN DE ACORDES

Una vez que se han indicado los resultados obtenidos, se muestra una serie de figuras en

las que aparece el proceso de identificación de acordes del piano Steinway para cada paso de

validación y sustracción espectral, así como el espectro residual (residuo). Se indica también el

nivel de señal del espectro residuo respecto al espectro inicial expresado en dB. Esto permite

evaluar la bondad de la identificación y de la sustracción.

En algunos casos el valor de nivel residuo es elevado debido, no a un mal proceso de

sustracción, sino a la existencia de pobre relación S/N del acorde original. Si la relación es pobre,

al sustraer la parte correspondiente a señal, esta supondrá una pequeña proporción del total, y el

residuo seguirá teniendo mucho nivel. Eso ocurre especialmente en notas de las octavas más altas,

dado que apenas tienen más que dos parciales y suelen ir acompañadas de mucho ruido de bjas

frecuencias.

6.8.1.- FIGURAS DE IDENTIFICACIÓN DE ACORDES CERRADOS LARGOS CON

VALIDACIÓN ALTA Y SUSTRACCIÓN [A,P]

Esta colección de figuras están organizadas por acordes, cubriendo para cada uno las 7

octavas. En total son 42 figuras

En cada figura se visualiza el espectro original en una zona que sólo muestra los primeros

parciales, para facilitar la visualización. Las gráficas de cada etapa de detección incluyen el

espectro que se introduce a la etapa y la máscara base de la nota validada tras dicha etapa. Para

comparar el resultado de la sustracción, estas figuras están normalizadas al nivel máximo del

espectro de entrada al paso, que es el resultante de la sustracción del espectro anterior. Los

espectros original y residuo no se muestran normalizados sino a la misma escala original.

La indicación “sm” que aparece en algunas figuras hace referencia a que no se usa máscara



“inter”, lo que siempre ocurre en validación por fundamental (“vf”).



Fig.146.-Acorde 1. Octava 1




















































































6.8.2.- NIVELES DE RESIDUOS

Puede comprobarse que todos los residuos de octavas 1 a 3 tienen al menos 20 dB menos

de nivel que el original.

Los de octavas 4 y 5 tienen entre 10 y 30 dB menos. La octava 6 entre 10 y 20 dB. Por

último, la octava 7 tiene niveles casi siempre inferiores a 10dB, aunque cercanos a este valor.




CAPÍTULO 7: CONCLUSIONES

En el trabajo presentado se ha demostrado que es posible la identificación de acordes de

piano usando un método de reconocimiento de patrones. Se han identificado diversos acordes de

3 y 4 notas en toda la gama tonal del piano (octavas 1 a 7), y los patrones usados se han obtenido

a partir de la aplicación de un modelo (Objetivo General)

Se ha comprobado que los patrones no pueden ser unos únicos comunes a todos los

pianos, por lo que es necesario entrenar el sistema para cada piano. Como resultado del

entrenamiento, se generan los patrones que se usarán para el reconocimiento.

El método presentado basa la identificación de acordes en la identificación iterativa de las

notas que lo componen. Se ha demostrado que es posible esta estrategia gracias a los procesos de

sustracción espectral y de validación de la nota identificada.

La sustracción se basa en el uso de máscaras, que deben ser generadas junto con los

patrones, para cada piano, como resultado del entrenamiento. En este trabajo se han presentado

resultados comparando el uso de dos tipos de máscaras: las abruptas y las progresivas. Si bien ha

quedado comprobado que las máscaras abruptas son las más adecuadas para la sustracción

espectral definitiva que sigue a la validación de la nota identificada, no ha podido establecerse una

conclusión tan evidente para las sustracciones previas a las validaciones.



La identificación de cada nota se ha conseguido mediante el uso de un método de

reconocimiento de patrones. Se ha comprobado que dicho método asegura una identificación libre

de errores cuando se trata de notas sueltas.

También se ha comprobado que en el caso de acordes, con varias notas simultáneas, se dan

situaciones espectrales que pueden confundir al método de identificación de notas, por lo que

se añade un método de validación de la nota identificada. Los resultados indican que dicha

validación disminuye dichos errores, eliminándolos totalmente para los acordes de octavas 3 y

superiores y disminuyéndolos en los acordes de las octavas 1 y 2. Los resultados también indican

que dichos errores pueden ser totalmente eliminados en el caso de ciertos acordes.

En cuanto al método de identificación de notas, se ha comprobado que tener unos buenos

patrones facilita la identificación, pero no es suficiente para asegurar la ausencia de errores. La

consecución de un método de identificación de notas libre de errores ha requerido el uso de

técnicas de predetección para optimizar el uso del conjunto de patrones. Los resultados obtenidos

usando predetección junto con preprocesado de limpieza de la señal demuestran que se ha

optimizado la identificación (Objetivo concreto nº 3)

Se ha comprobado que las técnicas de predetección, aplicadas de modo que la

comparación del espectro de la nota se realice sólo con respecto a un subconjunto de patrones,

son muy buenas para los resultados de la identificación de notas sueltas y acordes cerrados, pero

dificulta la identificación completa de acordes abiertos de ciertas octavas.

La predetección no puede solucionar la identificación de notas, sólo elimina ambiguedades

entre octavas organizadas en bandas. Para diferenciar notas pertenecientes a la misma banda

predetectada, es imprescindible contar con unos buenos patrones que distingan las notas y que

eliminen el clásico problema de la ambiguedad entre octavas adyacentes. En el trabajo que se ha

presentado, se ha demostrado que todo esto es posible, recayendo la precisión de los patrones

obtenidos en el modelo acústico, en el entrenamiento de éste y en el algoritmo de generación de

patrones. (Objetivo concreto nº 2)



Sin embargo, en algunos casos, octavas más agudas, la precisión de los patrones no

consigue ser suficiente y hay que recurrir al uso de multipatrones, de forma que una misma nota

se asocia a varios patrones que se solapan entre sí. Los resultados demuestran que el método es

satisfactorio, al desaparecer los errores existentes en la octava 7. (Objetivo concreto nº 2)

El algoritmo de generación de patrones establece el número de parciales de cada patrón

(distinto según la octava), los niveles relativos de dichos parciales (para ponderar la métrica de

comparación y eliminar la ambiguedad de octava) y genera el espectro completo de cada patrón

teniendo en cuenta para cada parcial su frecuencia y su ancho espectral.

En el trabajo presentado se ha desarrollado un modelo acústico que permite obtener los

valores de las frecuencias y la anchura de los parciales, que se usan para generar los patrones.

(Objetivo concreto nº 1)

Dicho modelo se basa en los aspectos acústicos del piano, pero debido a la variación de

estos entre pianos, se requiere un entrenamiento para cada piano. El trabajo presenta un algoritmo

de entrenamiento tras comparar varias estrategias y optimizar varias metodologías que resuelven

aspectos muy específicos del piano (inarmonicidad, distorsión no lineal,...) a la hora de extraer

parámetros espectrales. (Objetivo concreto nº5)

La validez del modelo para identificación de pianos distintos queda asegurada porque el

modelo definitivo no establece como fijo ninguno de los parámetros que pueden variar de un piano

a otro, siendo el entrenamiento el que los establece para cada piano a partir de las medidas

realizadas a las notas de entrenamiento.(Objetivo particular nº 4) .

Se ha demostrado que el modelo desarrollado en base a comprobaciones realizadas con

las grabaciones del piano Yamaha, ha podido ser usado por el piano Steinway, realizando el

entrenamiento y con éxito en las identificaciones.



Si bien se han cumplido los objetivos planteados para este trabajo y se ha comprobado que

el método permite identificaciones con buen grado de aciertos y en una amplia gama de sonidos,

todavía hay aspectos que pueden ser estudiados e incluidos en un sistema de identificación

automática de acordes con vistas a un sistema de transcripción. Entre ellos destacamos:

-Segmentación temporal automática del fragmento musical

-Identificación del tipo de ejecución de la nota (ataque) para ajustar la anchura espectral

de los patrones según se trate de acorde corto o largo.

-Detección fiable del número de notas existentes simultáneamente con reconocimiento de

si se tratan de notas de un mismo acorde o mezcla de notas ejecutadas anteriormente con

las actuales

-Métodos de estimación, del espectro del sonido a identificar, alternativos a la FFT,

especialmente en sonidos de muy corta duración.

-Separación de notas o acordes simultáneos que pertenecen a octavas claramente distintas

(ejecución de pasajes musicales a dos manos)

-Detección de la actuación del dispositivo apagador

Muchos de ellos suponen el uso de métodos centrados en el análisis de la evolución

temporal del sonido a identificar en vez de en su análisis espectral.






ANEXOSNOTAS MUSICALES

Octava, índice en piano(1-88), denominación inglesa (absoluta) e italiana, frecuencia en escala temperada

Octava Índ. NotaFrecuencia f0

(Hz)

0

1 A0 La0 27,50

2 A#0 La#0 29,14

3 B0 Si0 30,87

1

4 C1 Do1 32,70

5 C#1 Do#1 34,65

6 D1 Re1 36,71

7 D#1 Re#1 38,89

8 E1 Mi1 41,20

9 F1 Fa1 43,65

10 F#1 Fa#1 46,25

11 G1 Sol1 49,00

12 G#1 Sol#1 51,91

13 A1 La1 55,00

14 A#1 La#1 58,27

15 B1 Si1 61,74

2

16 C2 Do2 65,41

17 C#2 Do#2 69,30

18 D2 Re2 73,42

19 D#2 Re#2 77,78

20 E2 Mi2 82,41

21 F2 Fa2 87,31

22 F#2 Fa#2 92,50

23 G2 Sol2 98,00

24 G#2 Sol#2 103,83

25 A2 La2 110,00

26 A#2 La#2 116,54

27 B2 Si2 123,47


(Hz)

3

28 C3 Do3 130,81

29 C#3 Do#3 138,59

30 D3 Re3 146,83

31 D#3 Re#3 155,56

32 E3 Mi3 164,81

33 F3 Fa3 174,61

34 F#3 Fa#3 185,00

35 G3 Sol3 196,00

36 G#3 Sol#3 207,65

37 A3 La3 220,00

38 A#3 La#3 233,08

39 B3 Si3 246,94

4

40 C4 Do4 261,63

41 C#4 Do#4 277,18

42 D4 Re4 293,66

43 D#4 Re#4 311,13

44 E4 Mi4 329,63

45 F4 Fa4 349,23

46 F#4 Fa#4 369,99

47 G4 Sol4 392,00

48 G#4 Sol#4 415,30

49 A4 La4 440,00

50 A#4 La#4 466,16

51 B4 Si4 493,88



(Hz)

5

52 C5 Do5 523,25

53 C#5 Do#5 554,37

54 D5 Re5 587,33

55 D#5 Re#5 622,25

56 E5 Mi5 659,26

57 F5 Fa5 698,46

58 F#5 Fa#5 739,99

59 G5 Sol5 783,99

60 G#5 Sol#5 830,61

61 A5 La5 880,00

62 A#5 La#5 932,33

63 B5 Si5 987,77

6

64 C6 Do6 1046,50

65 C#6 Do#6 1108,73

66 D6 Re6 1174,66

67 D#6 Re#6 1244,51

68 E6 Mi6 1318,51

69 F6 Fa6 1396,91

70 F#6 Fa#6 1479,98

71 G6 Sol6 1567,98

72 G#6 Sol#6 1661,22

73 A6 La6 1760,00

74 A#6 La#6 1864,66

75 B6 Si6 1975,53


(Hz)

7

76 C7 Do7 2093,00

77 C#7 Do#7 2217,46

78 D7 Re7 2349,32

79 D#7 Re#7 2489,02

80 E7 Mi7 2637,02

81 F7 Fa7 2793,83

82 F#7 Fa#7 2959,96

83 G7 Sol7 3135,96

84 G#7 Sol#7 3322,44

85 A7 La7 3520,00

86 A#7 La#7 3729,31

87 B7 Si7 3951,07

8 88 C8 Do8 4186,01


ABREVIATURASSe incluyen una serie de abreviaturas usadas en el texto, ordenadas por temática con la que

se relacionan.

Características de materiales

ρ Densidad del material Kg/m3

E Módulo de Elasticidad de Young Pa ó N/m2

Gxy Módulo de cizallamiento (“Shear”) Pa

σ Relación de Poisson

Cuerdas

T Tensión de la cuerda N

L Longitud efectiva de la cuerda m

r Radio de la cuerda m

d Diámetro de la cuerda m

ρL Densidad lineal Kg/m

xe Punto de impacto del martillo en la cuerda m

s Coeficiente de escala en la ecuación de

longitudes de cuerdas

F Factor de carga de una cuerda con

entorchado (bordón)

R Radio exterior de la cuerda m

B Coeficiente de Inarmonicidad

J Coeficiente corregido de inarmonicidad. J=B/2.

Placa resonante

h grosor de la placa m

D Rigidez de la placa Nm

ρS Densidad superficial Kg/m2

SB Subíndice usado para referirse a la

placa resonante (“SoundBoard”)


ZSB Impedancia mecánica vista en el extremo

de la cuerda, debida a la placa resonante Kg/s

M Masa Kg

R Resistencia mecánica Kg/s

S Rigidez (“Stiffness”)

o coeficiente de elasticidad Kg/s2 ó N/m

Isb Inarmonicidad debida al efecto de la

placa resonante

Propagación

γ Constante compleja de propagación

k Número de onda m-1

c Velocidad de propagación de una onda

o de una vibración m/s

c0 Velocidad de propagación de una onda

(vibración) transversal en cuerda flexible. m/s

cB Velocidad de propagación de una onda

de flexión en un medio exclusivamente

rígido (barra) m/s

λ Longitud de onda m

α Coeficiente de amortiguamiento

η Factor de pérdidas

Z0 Impedancia característica de un medio

de propagación de onda Ω

Variables y magnitudes de la vibración

f Frecuencia Hz

f0 Frecuencia teórica para cuerda flexible

en las condiciones de tensión, densidad

y longitud de la cuerda real. Hz

w Frecuencia angular rad/s


w0 Frecuencia angular característica de un

modo de vibración (resonancia) rad/s

t Tiempo s

x Variable espacial unidimensional m

ó una de las dos variables espaciales

de un medio bidimensional (placa) m

y Desplazamiento de la vibración de cuerda m

ó una de las dos variables espaciales de

un medio bidimensional (placa) m

z Desplazamiento de la vibración de flexión

de una placa m

fL Fuerza en el extremo de la cuerda de

longitud L. N

uL Velocidad de la vibración en el

extremo de la cuerda de longitud L. m/s

V0 Velocidad inicial de la vibración en el

punto de excitación. m/s

Y0 Desplazamiento inicial de la vibración

en el punto de excitación. m

Ecuaciones y funciones

A,B,C,D Coeficientes genéricos reales de resolución de ecuaciones

Ac,Bc,Cc,Dc Coeficientes genéricos complejos de resolución de ecuaciones

sin seno

cos coseno

tg tangente

sh ó sinh seno hiperbólico

ch ó cosh coseno hiperbólico

th ó tanh tangente hiperbólica

W Función ventana en general (Hanning, Hamming, Kaiser, ...)


Intervalos musicales

Octava Relación de frecuencias igual a 2

Semitono Relación de frecuencias igual a . Cada octava tiene 12 semitonos.2 1059463112 = .

Cada semitono supone el cambio de una nota en la escala temperada.

Cent Relación de frecuencias igual a . Cada semitono tiene 100 cents.2 1000577791200 = .


REFERENCIAS BIBLIOGRÁFICAS

[Adachi 95] Adachi S. Sato M. “Time-domain simulation of sound production in the brass

instrument” J Acoust Soc Am 1995; 97(6): 3850-3861.

[Afinador] Comunicación particular con el afinador del Teatro Real de Madrid

[Askenfelt 90] Askenfelt A. Jansson E. “From touch to string vibrations. I: Timing in the grand

piano action”. J Acoust Soc Am 1990; 88(1): 52-63.

[Askenfelt 91] Askenfelt A. Jansson E.“From touch to string vibrations. II: The motion of the

key and hammer”. J Acoust Soc Am 1991; 90(5): 2383-212393.

[Askenfelt 93] Askenfelt A. Jansson E. “From touch to string vibrations. III: String motion and

spectra”. J Acoust Soc Am 1993; 93(4): 2181-2196.

[Backus 69] Backus J. The acoustical fundations of music. W.Norton and Co. New York

1969.

[Bank 2002] Bank B.,Poli G.,Sujbert L.”A multirate approach to instrument body modeling

for real time sound synthesis applications”. 112th Convention Audio

Eng. Soc. Munich, Germany, 2002

[Bello 00] Bello JP, Sandler M. “Blackboard system and top-down processing for the

transcription of simple polyphonic music”. Proceedings of the COST G-6

Conference on digital audio effects (DAFX-00), Verona, Italy, 2000:

135-139.

[Benade 76] Benade AH. Fundamentals of musical acoustics. Oxford University Press

1976. N.York 100-352.

[Beranek 71] Beranek LL. Noise and vibration control. McGraw-Hill 1971. Washington.

[Berg 82] Berg RE. The physics of sound. Prentice Hall 1982. N.Jersey 319-332.

[Bilhuber 40] Bilhuber P. Johnson C.A. “The influence of the soundboard on piano tone

quality”. J Acoust Soc Am 1940; 11: 311-320.

REFERENCIAS


[Black 00] Black T.R, Donohue K.D. “Pitch determination of music signals using the

generalized spectrum” IEEE 2000: 104-109

[Brown 91] Brown JC.. “Calculation of a constant Q spectral transform”. J Acoust Soc Am

1991; 89(1): 425-434.

[Brown 91] Brown JC. Zhang B. “Musical frequency tracking using the methods of

conventional and narrowed autocorrelation”. J Acoust Soc Am 1991;

89(5): 2346-2354.

[Brown 96] Brown JC. “Frequency ratios of spectral components of musical sounds”. J

Acoust Soc Am 1996; 99(2): 1210-1218.

[Brown 99] Brown JC. “Computer identification of musical instruments using pattern

recognition with cepstral coefficients as features”. J Acoust Soc Am

1999; 105(3): 1933-1941.

[Brown 01] Brown JC. “Feature dependence in the automatic identification of musical

woodwind instruments”. J Acoust Soc Am 2001; 109(3): 1064-1072.

[Chong 99] Chong U.P., Kim K., Lim H. “Piano sound analysis using DSP technology”.

1999, Korus 99, IEEE. 705-708.

[Conklin 96a] Conklin HA. “Design and tone in the mechanoacoustic piano. Part I. Piano

hammers and tonal effects”. J Acoust Soc Am 1996; 99(6):3286-3296.

[Conklin 96b] Conklin HA. “Design and tone in the mechanoacoustic piano. Part II. Piano

structure”. J Acoust Soc Am 1996; 100(2): 695-708.

[Conklin 96c] Conklin HA. “Design and tone in the mechanoacoustic piano. Part III. Piano

strings and scale design”. J Acoust Soc Am 1996; 100(3): 1286-1298.

[Conklin 99] Conklin HA. “Generation of partials due to nonlinear mixing in a stringed

instrument”. J Acoust Soc Am 1999; 105(1): 536-545.

[Cremer 88] Cremer L, Heckl M, Ungar EE. Structure-Borne Sound. Springer-Verlag 1988.

N.York.

REFERENCIAS


[Delfs 97] Delfs C. Jondral F. “Classification of piano sounds using time-frequency signal

analysis” Proc.1997 IEEE.

[Delfs 98] Delfs C. Jondral F. “Classification of transient time-varying signals using DFT

and wavelet packet based methods” Proc.1998 IEEE.

[Doyle 89] Doyle JF. Wave propagation in structures. Springer-Verlag 1989. N.York.

[Eronen 00] Eronen A, Klapuri A.. “Musical instrument recognition using cepstral

coefficients and temporal features”. IEEE Workshop on ASPAA. 2000;

753-756

[Eronen 01] Eronen A. “Comparison of features for musical instrument recognition”. IEEE

Workshop on ASPAA. New York. 2001; 19-22

[Fernández

-Cid 98 ] Fernández-Cid P, Casajús-Quirós FJ. “Multi-pitch estimation for polyphonic

musical signals”. Proc.IEEE ICASSP 1998; (6):3565-3568.

[Fletcher 64] Fletcher,H. “Normal vibration frequencies of a stiff piano string”. J.Acoust.

Soc. Am. 1964; 36:203-209.

[Fletcher 98] Fletcher N.H. The physics of musical instruments. Springer-Verlag 1998.

N.York

[Galembo 99] Galembo A, Askenfelt A. “Signal representation and estimation of spectral

parameters by inharmonic comb filters with application to the piano”.

IEEE Transactions on speech and audio processing 1999; 7(2): 197-203.

[Giordano 96] Giordano N, Korty AJ. ”Motion of a piano string: longitudinal vibrations and

the role of the bridge”. J Acoust Soc Am 1996; 100(6): 3899-3908.

[Giordano 97] Giordano N. “Simple model of a piano soundboard”. J Acoust Soc Am 1997;

102(2): 1159-1168.

[Giordano 98a] Giordano N. “Mechanical impedance of a piano soundboard”. J Acoust Soc Am

1998; 103(4): 2128- 2133.

REFERENCIAS


[Giordano 98b] Giordano N. “Sound production by vibration piano soundboard: experiment”.

J Acoust Soc Am 1998; 104(3): 1648-1653.

[Gough 81] Gough C.E., “The theory of string resonances on musical instruments”.

Acustica.1981; Vol.49: 124-141

[Hainsworth 01] Hainsworth S.W, Macleod M.D, Wolfe P.J, “Analysis of reassigned

spectrograms for musical transcription”. IEEE Workshop on ASPAA.

New York 2001. 23-26

[Hall 86] Hall D. “Piano string excitation in the case of small hammer mass”. J Acoust

Soc Am 1986; 79(1): 141-147.

[Hall 87a] Hall D. “Piano string excitation II: General solution for a hard narrow

hammer”. J Acoust Soc Am 1987; 81(2): 535-546.

[Hall 87b] Hall D. “Piano string excitation III: General solution for a soft narrow

hammer”. J Acoust Soc Am 1987; 81(2): 547-555.

[Hall 87c] Hall D. Clark P. “Piano string excitation IV: The question of missing modes”.

J Acoust Soc Am 1987; 82(6): 1913-1918.

[Hall 88] Hall D. Askenfelt A. “Piano string excitation V: spectra for real hammers and

strings”. J Acoust Soc Am 1988; 83(4): 1627-1638.

[Hall 92] Hall D. “Piano string excitation. VI: Nonlinear modeling”. J Acoust Soc Am

1992; 92(1): 95-105.

[Keren 98a] Keren R.,Zeevi Y., Chazan D. “Automatic transcription of polyphonic music

using the multiresolution Fourier Transform” 1998. IEEE, 654-657.

[Keren 98b] Keren R.,Zeevi Y., Chazan D. “Multiresolution time-frequency analysis of

polyphonic music” 1998. IEEE, 565-568.

[Kinsler 88] Kinsler LE, Frey AR, Coppens AB, Sanders JV. Fundamentos de acústica.

Editorial Limusa 1988. Mexico.

[Kirk 59] Kirk R.E. “Tuning Preferences for piano unison groups”. J Acoust Soc Am

1959; 31(12): 1644-1648.

REFERENCIAS


[Klapuri 99] Klapuri A. “Pitch estimation using multiple independent time-frequency

windows”. IEEE Workshop on ASPAA. New York 1999; 115-118.

[Klapuri 00] Klapuri A, Virtanen T, Holm JM. “Robust multi pitch estimation for the

analysis and manipulation of polyphonic musical signals”. Proceedings of

the COST G-6 Conference on digital audio effects (DAFX-00), Verona,

Italy, 2000:141-146.

[Klapuri 01] Klapuri A, Virtanen T, Eronen A., Seppanen J. “Automatic transcription of

musical recordings” 2001. Web page Tampere University of Technology.

www.cs.tut.fi

[Lambrou 98] Lambrou T. et al. “Classification of audio signals using statistical features on

time and wavelet transform domains”. 1998 IEEE.

[Laroche 94] Laroche, J; Meillier, J. (1994) Multichannel Excitation/Filter Modeling of

Percussive Sounds with Application to the Piano. IEEE Trans. Speech

Audio Process. 2, 329-344

[Lattard 93] Lattard J. “Influence of inharmonicity on the tuning of a piano: Measurements

and mathematical simulation”. J Acoust Soc Am 1993; 94(1): 46-53.

[Laurson 00] Laurson M, Erkut C, Välimäki V. “Methods for modeling realist playing in

plucked string synthesis: analysis, control and synthesis”. Proceedings of

the COST G-6 Conference on digital audio effects (DAFX-00), Verona,

Italy, 2000:183-188.

[Levine 98] Levine S., Verma T., Smith J. “Alias-free, multiresolution sinusoidal modeling

for polyphonic wideband audio” 1997 IEEE workshop on ASPAA.

[Mani 98] Mani R., Namid S. “Integration of DSP algorithms and musical constraints for

the separation of partials in polyphonic music”. 1997 IEEE workshop on

ASPAA.

[Marchand 01] Marchand S, “An efficient pitch-tracking algorithm using a combination of

Fourier transforms”.Proceedings of the COST G-6 Conference on digital

audio effects (DAFX-01), Limerick, Ireland, 2001.

REFERENCIAS


[Marolt 00] Marolt M. “Transcription of polyphonic piano music with neural networks”.

Mediterranean Electrotechnical Conference, MeleCon 2000, Vol II.512-

515.

[Martin 47] Martin D.W. “Decay rates of piano tones” J Acoust Soc Am 1948; 19(4): 535-

541.

[Martin 61] Martin D.W.,Ward W.D.”Subjective evaluation of musical scale temperament

in pianos”. J Acoust Soc Am 1961; 33(5): 582-585.

[Martin 98] Martin K.D., “Musical Instrument Identification: a pattern recognition

approach”. 136th meeting of the Acoustical Society of America. 1998.

[Monti 00] Monti G, Sandler M. “Monophonic transcription with autocorrelation”.

Proceedings of the COST G-6 Conference on digital audio effects

(DAFX-00), Verona, Italy, 2000:257-260.

[Noll 67] Noll A.M., ”Cepstrum pitch determination”. J Acoust Soc Am 1967; 41(2):

293-309.

[Ortiz 99] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Application of Wavelet Transform

to a Lossy Compression Algorithm for Coding and Synthesis of Piano

Notes.” 6th Intl. Congress on Sound and Vibration. Dinamarca. July

1999: 359-366

[Ortiz 00] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Application of Wavelet Transform

to Modeling Piano Sound”. 7th Intl. Congress on Sound and Vibration.

Garmisch-Partenkirchen.Germany. July 2000: 3503-3510.

[Ortiz 01] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Identification of Piano Notes Using

Wavelet Transform”. 8th Intl. Congress on Sound and Vibration. Hong-

Kong. China. July 2001:2379-2384.

[Ortiz 02] Ortiz-Berenguer L.I., Casajús-Quirós F.J., “Pattern Recognition of Piano

Chords Based on Physical Model”. 112th Convention of the Audio

Engineering Soc. May 2002. Munich.Germany: Paper 5525, 1-5.

[Pielemeier 92] Pielemeier W., Wakefield G. “Time-frequency and time-scale analysis for

musical transcription” 1992. IEEE.

REFERENCIAS


[Pielemeier 96] Pielemeier W., Wakefield G. “A high resolution Time-frequency representation

for musical instrument signals”. J Acoust Soc Am 1996; 99(4): 2382-

2396.

[Podlesak 88] Podlesak M. “Dispersion of waves in piano strings”. J Acoust Soc Am 1988;

83(1): 305-317.

[Privosnik 98] Provosnik M., Marolt M. “A system for automatic transcription of music based

on multiple-agents architecture”. 1998 IEEE. 169-172

[Rabiner 77] Rabiner L.R., “On the use of autocorrelation analysis for pitch detection”. IEEE

Transactions on Acoustics, speech and signal processing 1977 (ASSP-

25):24-33.

[Rossi 97] Rossi L. Girolami G. “Identification of polyphonic piano signals” Acustica-Acta

acustica 1997. 83: 1077-1084.

[Rossing 90] Rossing T.D. The science of sound. 2ªed. Addison Wesley. Massachusetts.

1990

[Rossing 95] Rossing T.D. and Fletcher N.H. Principles of vibration and sound. Springer-

Verlag. New York. 1995.

[Smith 95] Smith J. Duyne S. “Overview of the commuted piano synthesis technique” Proc

95 Int.Comp.Music Conf.(ICMC)

[Steinway] Catálogo de pianos de cola. “www.steinway.com”

[Stulov 95] Stulov A. “Hysteretic model of the grand piano hammer felt” J Acoust Soc Am

1995; 97(4): 2577-2585.

[Suzuki 86] Suzuki H. “Vibration and sound radiation of a piano soundboard” J Acoust Soc

Am 1986; 80(6): 1573-1582.

[Terada 94] Terada T. et al., ”Nonstationary waveform analysis and synthesis using

generalized harmonic analysis” IEEE 1994: 429-432.

REFERENCIAS


[Walmsley 99] Walmsley P., Godsill S., Rayner P. “Polyphonic pitch tracking using joint

bayesian estimation of multiple frame parameters”. Proc.1999 IEEE

Workshop on ASPAA. New York: 119-122.

[Weinreich 77] Weinreich G. “Coupled piano strings” J Acoust Soc Am 1977; 62(6): 1474-

1484.

[Young 52] Young,R.W. “Inharmonicity of plain wire piano strings”. J Acoust Soc Am

1952; 24: 267- 273.

[Ystad 00] Ystad S. “Sound modeling applied to flute sounds” J.Audio Eng.Soc. 2000;

48;810-825

Documents

TESIS DOCTORAL IDENTIFICACIÓN AUTOMÁTICA DE ACORDES MUSICALESoa.upm.es/158/1/LUIS_I_ORTIZ_BERENGUER_2.pdf · 2.3.- revisiÓn sobre clasificaciÓn de sonidos e instrumentos musicales