184
Realizzazione di una camera d’ascolto per la riproduzione della realtà virtuale acustica Aurore della ricerca: Daniele Brini Scopo della ricerca: La seguente trattazione si occupa dell’ottimizzazione della qualità acustica delle sale d’ascolto e dei sistemi per la registrazione e riproduzione del suono in tre dimensioni. Questi sistemi devono avere la capacità di captare un fenomeno acustico tridimensionale, in cui gli stimoli sonori possono provenire da tutte le direzioni, e riprodurlo in un ambiente diverso, mantenendo tutte le caratteristiche spaziali del fenomeno acustico originale. Questo significa realizzare la realtà virtuale in campo sonoro. La realizzazione di questi sistemi è stata possibile grazie a uno studio approfondito della percezione uditiva dell’uomo e in particolare dell’ascolto direzionale. L’obiettivo di questa trattazione è mettere in rilievo una tecnologia chiamata Ambisonic, che per le sue solide basi teoriche permette un’espansione futura del sistema con una crescita significativa delle prestazioni. L’ascolto delle registrazioni effettuate con questo sistema, necessita di un ambiente con caratteristiche acustiche particolari: la camera d’ascolto. Oggetto di questo lavoro è la realizzazione di una sala d’ascolto, con particolare riferimento alla spazialità del campo sonoro. Il presente lavoro è stato diviso in due parti, nelle quali la prima è preliminare alla seconda e necessariamente più teorica. La prima parte illustra le caratteristiche della percezione direzionale dell’udito ed esamina con sguardo critico i sistemi elettroacustici di registrazione e riproduzione sonora, dai primi esperimenti significativi fino agli sviluppi tecnologici più recenti. I

Realizzazione di una camera d’ascolto per la riproduzione della realtà virtuale acustica

Embed Size (px)

Citation preview

Indice

Realizzazione di una camera dascolto per la riproduzione della realt virtuale acustica

Aurore della ricerca: Daniele Brini

Scopo della ricerca:

La seguente trattazione si occupa dellottimizzazione della qualit acustica delle sale dascolto e dei sistemi per la registrazione e riproduzione del suono in tre dimensioni. Questi sistemi devono avere la capacit di captare un fenomeno acustico tridimensionale, in cui gli stimoli sonori possono provenire da tutte le direzioni, e riprodurlo in un ambiente diverso, mantenendo tutte le caratteristiche spaziali del fenomeno acustico originale.

Questo significa realizzare la realt virtuale in campo sonoro.

La realizzazione di questi sistemi stata possibile grazie a uno studio approfondito della percezione uditiva delluomo e in particolare dellascolto direzionale.

Lobiettivo di questa trattazione mettere in rilievo una tecnologia chiamata Ambisonic, che per le sue solide basi teoriche permette unespansione futura del sistema con una crescita significativa delle prestazioni.

Lascolto delle registrazioni effettuate con questo sistema, necessita di un ambiente con caratteristiche acustiche particolari: la camera dascolto.

Oggetto di questo lavoro la realizzazione di una sala dascolto, con particolare riferimento alla spazialit del campo sonoro.

Il presente lavoro stato diviso in due parti, nelle quali la prima preliminare alla seconda e necessariamente pi teorica.

La prima parte illustra le caratteristiche della percezione direzionale delludito ed esamina con sguardo critico i sistemi elettroacustici di registrazione e riproduzione sonora, dai primi esperimenti significativi fino agli sviluppi tecnologici pi recenti.

La seconda parte descrive il trattamento acustico effettuato e rappresenta lapplicazione pratica delle teorie esposte in precedenza.

Avvalendosi delle pi moderne teorie acustiche, che permettono di valutare la qualit del suono percepito in base ai risultati di una serie di parametri, si cercato di migliorare la qualit acustica dellambiente a nostra disposizione, indirizzando il lavoro verso la diminuzione del tempo di riverberazione attraverso un trattamento acustico.

La scelta di utilizzare il programma di simulazione acustica Ramsete ha consentito di valutare le possibilit di intervento acustico attraverso numerose simulazioni, prima di procedere con lapplicazione dei materiali alle pareti e al soffitto.

Una volta confrontati i parametri acustici con quelli precedenti al trattamento, sono state effettuate le prove dascolto.

La realizzazione della camera dascolto stata portata a termine secondo le modalit previste e lintervento di fonoassorbimento stato veramente efficace.

Il tempo di riverberazione stato abbassato fino a soddisfare e persino migliorare i valori previsti inizialmente (0,3 0,4 sec. intorno alla regione di frequenze di 1000 Hz), e presenta un andamento lineare.

Sono assolutamente soddisfacenti le prove dascolto effettuate con la riproduzione dei brani di musica classica, in cui si pu avvertire con una grande sensazione di realismo, lampiezza del palcoscenico e la dislocazione spaziale degli strumenti dellorchestra.

Lascoltatore pu godere pienamente della sensazione di realismo offerta dal sistema Ambisonic.

Indice

Prefazione ....1

Introduzione ....2

1 Il suono lo spazio e ludito direzionale .41.1 I meccanismi delludito direzionale ....4

1.2 La differenza interaurale dei tempi .6

1.3 La differenza interaurale dampiezza 7

1.4 Le modificazioni dellorecchio esterno ...8

1.5 Capacit direzionale del singolo padiglione auricolare ...9

1.6 Altri fattori ...11

1.7 La legge del primo fronte acustico ..11

1.8 Precisione direzionale del sistema uditivo ...12

2 Modelli danalisi spaziale dei sistemi elettroacustici .142.1 Il modello binaurale .15

2.2 Il modello geometrico 16

2.3 Il modello delle armoniche sferiche .19

3 I sistemi elettroacustici binaurali ..223.1 La simulazione binaurale e la conversione transaurale ..24

3.2 I sistemi elettroacustici ibridi 28

3.3 I limiti dei sistemi basati sul modello binaurale 32

4 I sistemi elettroacustici geometrici ...35

4.1 I sistemi elettroacustici con un canale dinformazione 36

4.2 Sistemi elettroacustici a due canali dinformazione ..37

4.2.1 La registrazione stereofonica coincidente .38

4.2.2 La registrazione stereofonica non coincidente ..40

4.2.3 La registrazione stereofonica polimicrofonica ..42

4.2.4 Apprezzamenti soggettivi delle registrazioni stereofoniche44

4.2.5 Il trattamento del segnale stereofonico ..45

4.3 Sistemi elettroacustici a pi canali dinformazione ..47

4.3.1 Il Dolby Stereo e il Dolby Surround .50

4.3.2 La codidfica microfonica per il Dolby Surround ..54

4.3.3 I processori numerici dambiente ..56

4.3.4 La registrazione e la riproduzione tetraedrica ... 58

5 Il sistema Ambisonic ...615.1 Il microfono di tipo Soundfield .66

5.2 Manipolazione del segnale attraverso il sistema Ambisonic 70

5.3 Manipolazione digitale dei campi sonori Ambisonic 76

5.4 Performance del sistema Ambisonic 78

5.5 Un assemblaggio esaedrico per la riproduzione

sonora tridimensionale ..80

5.6 Un sistema di registrazione tridimensionale

con microfoni ultradirezionali ...82

5.7 Compatibilit tra i sistemi di spazializzazione

sonora tridimensionale ..87

5.7.1 La conversione dellinformazione tra i sistemi .89

5.7.2 Le installazioni multi-sistema ...94

6 Caratteristiche del suono della sala da concerto ..96

6.1 Principi psicoacustici fondamentali nel realismo

della riproduzione sonora ...97

6.2 Principi psicoacustici delle sale da concerto ..98

6.3 Interaural Cross Correlation (IACC) .....101

6.4 La riverberazione ...105

6.5 IRT e EDT ......107

6.6 La percezione della profondit ...107

7 La ricostruzione dellambiente ..109

7.1 La diafonia .........109

7.2 Head-Related Transfer Function (HTRF) ..113

7.3 La percezione direzionale alle frequenze acute .116

7.4 Lo Stereo Dipole 119

7.5 Ricostruzione dellambiente attraverso la risposta allimpulso ..

122

7.6 La convoluzione .123

7.7 Il sistema di Klayman .126

7.8 Sviluppi recenti sulla creazione di riverberazione .128

8 Il sistema Ambiophonic ...130

8.1 Principi fondamentali del metodo Ambiophonic ...130

8.2 Requisiti del sistema Ambiophonic ...134

8.3 Ottimizzazione della camera dascolto per Ambiophonic .136

9 Trattamento acustico della camera dascolto ...138

9.1 Le riflessioni della stanza ..138

9.2 Lambiente acustico: stanza e altoparlanti 139

9.3 I pannelli fonoassorbenti ...141

9.4 Muri inclinati verso lesterno

142

9.5 Il tempo di riverberazione .142

9.6 Il rumore di fondo .143

9.7 Comportamento della basse frequenze ..144

9.8 Sistemi di correzione della stanza .145

10 Misure sperimentali e

Simulazioni acustiche .148

10.1 Misurazioni sperimentali .14810.2 Modelli numerici .154

10.3 Metodologia utilizzata .155

10.4 Taratura del modello ...157

11 Realizzazione della camera dascolto .....161 11.1 Descrizione del materiale e della stanza ......

161

11.2 Confronto delle misure effettuate prima e dopo

lintervento acustico 166

11.3 Prove dascolto 170

Conclusioni .173

Sviluppi futuri ...175

Ringraziamenti 176

Bibliografia 177

Prefazione

La seguente trattazione si occupa dellottimizzazione della qualit acustica delle sale dascolto e dei sistemi per la registrazione e riproduzione del suono in tre dimensioni.

In primo luogo questi sistemi devono avere la capacit di captare e simulare un fenomeno acustico tridimensionale, dove gli stimoli sonori possono provenire da tutte le direzioni attorno ad un ascoltatore reale o virtuale.

In secondo luogo questi sistemi devono riprodurre in un ambiente diverso, il fenomeno acustico originale in tutte le sue caratteristiche spaziali.

La realizzazione di questi sistemi stata possibile grazie a uno studio approfondito della percezione uditiva delluomo e in particolare dellascolto direzionale. Il nostro sistema uditivo permette di determinare con diversi gradi di precisione la direzione e la distanza delle sorgenti sonore nello spazio tridimensionale che ci circonda.

Sono stati stabiliti due modelli di descrizione spaziale dei fenomeni acustici.

Il modello binaurale si basa sulla capacit e sulla modalit della percezione uditiva umana. Il modello geometrico si basa sullo studio, attraverso la geometria euclidea, dellutilizzo di trasduttori nei sistemi di registrazione e riproduzione sonori tridimensionali. Questi due modelli permetteranno un insieme di differenti tecniche di registrazione, simulazione e riproduzione sonora, e unanalisi oggettiva delle loro capacit riguardo alla spazializzazione del suono. Lobiettivo illustrare quali sono i principi teorici su cui si fonda la realizzazione e il funzionamento delle tecnologie esistenti che quindi si adattano ai due modelli studiati.

Il risultato di questa trattazione mettere in rilievo una tecnologia chiamata Ambisonic, che risponde perfettamente al modello geometrico e che per le sue solide basi teoriche, permette unespansione futura del sistema con una crescita significativa delle prestazioni.

Lascolto delle registrazioni effettuate con questo sistema, necessita di un ambiente con caratteristiche acustiche particolari: la camera dascolto.

Introduzione

Oggetto di questo lavoro la realizzazione di una camera dascolto, con particolare riferimento alla spazialit del campo sonoro.

Il presente lavoro stato diviso in due parti, nelle quali la prima preliminare alla seconda e necessariamente pi teorica. La prima parte illustra le caratteristiche della percezione direzionale delludito e i principi teorici su cui si fonda la realizzazione e il funzionamento delle tecnologie esistenti.

La seconda parte descrive il trattamento acustico effetttuato e rappresenta lapplicazione pratica delle teorie esposte in precedenza.

Avvalendosi delle pi moderne teorie acustiche, che permettono di valutare la qualit del suono percepito in base ai risultati di una serie di parametri, si cercato di migliorare la qualit acustica dellambiente a nostra dispozizione, indirizzando il lavoro verso la diminuzione del tempo di riverberazione attraverso un trattamento acustico.

stato possibile prevedere il tipo di intervento pi idoneo, utilizzando il computer per effettuare delle simulazioni acustiche, prima di procedere con lapplicazione dei materiali fonoassorbenti.

Una volta confrontati i parametri acustici con quelli precedenti al trattamento, sono state effettuate le prove dascolto.

La camera dascolto dotata di 8 casse ed attrezzata per utilizzare la tecnologia Ambisonic, che permette di realizzare una fedele riproduzione della spazializzazione del campo sonoro.

Contrariamente a quello che si constatato per la percezione visiva, che emisferica, il nostro campo di percezione uditiva molto pi vasto: esso totalmente sferico. Sembra che gli attuali sistemi elettroacustici non tengano in considerazione questa caratteristica della nostra percezione uditiva e offrendo allascoltatore una parziale riproduzione dello spazio sonoro.

I microfoni e i sistemi di altoparlanti, uniti agli ambienti in cui essi sono inseriti, costituiscono gli elementi pi critici dellintera catena di ripresa-riproduzione sonora.

In gran parte ci dovuto al fatto che entrambi sono dei trasduttori, dei dispositivi, cio, aventi il compito di trasformare una forma di energia in unaltra: da sonora in elettrica i microfoni e viceversa gli altoparlanti. La tecnologia ha fatto molto per minimizzare tali cause di distorsione, tuttavia, allo stato attuale dellarte, i risultati allascolto, pur essendo giunti a livelli credibili, non convincono ancora completamente.

In particolare, ottimizzate la timbrica, la dinamica, le distorsioni lineari e non, il compito pi difficile rimane quello di ricreare unimmagine sonora che, confrontata con levento reale, non sia semplicemente unillusione del posizionamento originario degli esecutori e degli strumenti.

Tuttavia ora possibile registrare un evento acustico nelle tre dimensioni dello spazio cartesiano e riprodurre levento originale con le sue tre dimensioni in un altro luogo. Questa riproduzione cerca di soddisfare la percezione uditiva sferica dellascoltatore. Prima necessario esaminare i vari aspetti che concernono la nostra sensibilit uditiva dello spazio sonoro tridimensionale e i sistemi di registrazione e riproduzione acustica in tre dimensioni.

fondamentale studiare quali sono le nostre capacit di riconoscere la direzione di emissione della sorgente sonora, in un universo in cui i suoni provengono da tutte le direzioni.

Esistono due modelli di descrizione sonora spaziale che permettono di valutare e comparare tutti i sistemi elettroacustici. Questi due modelli sono il modello binaurale e il modello geometrico. Si dimostrer in seguito che i sistemi basati sul modello geometrico comportano un certo numero di vantaggi rispetto ai sistemi basati sul modello binaurale.

Esiste un sistema elettroacustico chiamato Ambisonic che risponde il pi fedelmente possibile al modello geometrico.

Il sistema Ambisonic pi di un sistema ad architettura aperta: permette di intravedere le possibilit di espansione e utilizzazione futura offerte dal sistema. Con la guida dei due modelli sopra citati verranno esaminati con sguardo critico i sistemi elettroacustici di registrazione e riproduzione sonora, dai primi esperimenti significativi fino agli sviluppi tecnologici pi recenti.CAPITOLO 1

IL SUONO, LO SPAZIO E L UDITO DIREZIONALE

Luniverso attorno a noi ci presenta degli stimoli sonori che possono provenire da tutte le direzioni. Ugualmente nello spazio sonoro limitato e controllato di una sala da concerto, gli stimoli sonori provenienti direttamente dalla sorgente e dalle riflessioni delle pareti, presentano agli ascoltatori un insieme di direzioni, ampiezze e frequenze varie, costituendo cos uno spazio veramente tridimensionale.

La letteratura scientifica sullascolto direzionale concorda nellaffermare che la percezione spaziale delluomo pu essere rappresentato come un campo di percezione sferico in cui il centro la testa. A diversi gradi di precisione noi possiamo identificare la posizione di una sorgente sonora attorno a noi.

La capacit delludito umano di riconoscere la direzione e la posizione di una fonte sonora, giustificano la creazione di un sistema di riproduzione sonora tridimensionale.

1.1 I meccanismi delludito direzionale

Ludito direzionale delluomo dipende da molteplici meccanismi che sono difficili da riassumere in un solo modello; questo perch ludito direzionale il risultato di due o tre meccanismi principali che contribuiscono maggiormente al processo di localizzazione sonora. Verranno ora descritti nei dettagli questi meccanismi.

Il sistema di riferimento spaziale che sar utilizzato in questa descrizione e illustrato dalla Figura 1.1.

Figura 1.1 Sistema di rappresentazione sferico dello spazio in rapporto

alla testa, dove r la distanza, langolo di elevazione e

lazimut

Noi vediamo che le tre dimensioni nel posizionamento spaziale in rapporto alla testa sono le seguenti: lasse x descrive le posizioni dal davanti al dietro, lasse y descrive le posizioni da sinistra a destra e lasse z descrive le posizioni dallalto al basso.

In questo sistema le direzioni dei suoni in rapporto alla testa saranno date in coordinate polari.

1.2 La differenza interaurale dei tempi

La distanza che separa i due orecchi il fattore fisico principalmente responsabile della differenza, nel momento della percezione di un dato suono. Questa differenza temporale varier a seconda dellazimut della sorgente sonora. Non ci sar differenza temporale se la fonte situata a 0 o 180 dazimut, cio se perfettamente davanti o dietro lascoltatore.

Se la sorgente si sposta dal piano orizzontale a partire da 0 o 180, la differenza temporale aumenter progressivamente e raggiunger il suo massimo allazimut 90 o 270.

Per questi valori dell azimut, stabilendo una distanza tra i due orecchi di 21,5cm e la velocit del suono di 344m/s, la massima differenza temporale sar approssimativamente di 630 microsecondi. Questo valore non assoluto poich la distanza tra gli orecchi varia da un individuo allaltro e la velocit del suono cambia con la temperatura dellaria.

La differenza interaurale dei tempi sar pi o meno importante nella qualit della localizzazione a seconda dellinviluppo del suono e delle armoniche che lo costituiscono. Cos per i suoni che hanno attacchi rapidi, la differenza dei tempi potr essere direttamente utilizzata dal cervello per la localizzazione spaziale, ma nel caso di un suono continuo o avente un attacco lento la differenza di fase che sar interpretata per localizzare la fonte sonora.

La qualit dellinterpretazione della differenza di fase decresce rapidamente a partire da 180 fino a 360. Ad esempio per una differenza di fase di 360, non si pu stabilire se si tratta di una differenza di 0, 360 o 720, e cos per tutte le differenze superiori a 360.

La massima differenza di fase di 180 esister solo con la pi alta frequenza utile determinata dalla sua mezza lunghezza donda, corrispondente alla distanza tra i due orecchi o determinata dal suo semiperiodo che corrisponde alla differenza temporale massima tra i due orecchi. Per le frequenze la cui mezza lunghezza donda 21,5cm o pi, e cio le frequenze al di sotto degli 800 Hz, ci sar una differenza di fase che varia tra 0 e 180.

Queste frequenze saranno utili per determinare il posizionamento orizzontale delle sorgenti sonore. Al di sopra degli 800 Hz ci sar una differenza che varia tra 180 e 360 e la qualit dellinterpretazione decresce rapidamente per diventare assolutamente nulla per le frequenze la cui lunghezza donda uguale o inferiore alla distanza tra gli orecchi e cio al di sopra dei 1600 Hz.

1.3 La differenza interaurale dampiezza

Per le frequenze al di sopra dei 2000 Hz la testa si presenta gradualmente come un ostacolo acustico sempre maggiore e lassenza di diffrazione per queste frequenze d luogo a differenze dampiezza tra i due orecchi, che variano col variare dellazimut della sorgente sonora. Come nella differenza interaurale dei tempi, la differenza interaurale dampiezza nulla quando la fonte sonora situata agli azimut 0 e 180. Nello stesso modo la differenza interaurale dampiezza raggiunge il suo massimo quando la sorgente situata agli azimut 90 e 270. difficile dare cifre precise su questa differenza dampiezza, per la semplice ragione che la distanza della sorgente diventa anchessa un fattore. Infatti la legge del quadrato inverso spiega che lampiezza di una sorgente sonora sferica decresce di 6dB per ogni raddoppio di distanza. Quindi ci sar minore differenza interaurale dampiezza per una sorgente lontana, rispetto a una vicina con lo stesso azimut.

Una differenza di circa 15-20dB dar limpressione di uno spostamento laterale completo che corrisponde agli azimut 90 e 270.

Queste cifre rappresentano un caso estremo ottenuto in laboratorio con dei suoni sinusoidali di alta frequenza. La maggioranza delle ricerche sulludito direzionale sono state compiute utilizzando suoni sinusoidali che rappresentano un caso estremo; la maggioranza dei suoni sono onde complesse formate dallinsieme dei suoni costituenti e raramente il riconoscimento della direzione dovuto unicamente alla differenza interaurale dei tempi o alla differenza interaurale dampiezza. Tuttavia anche nelle migliori condizioni questi due meccanismi non sono sufficienti per spiegare la nostra capacit di decretare laltezza (langolo di elevazione) di una fonte sonora.

1.4 Le modificazioni dellorecchio esternoDopo la seconda met del XX secolo le ricerche sulludito direzionale hanno prestato unattenzione particolare alla funzione dellorecchio esterno nella valutazione direzionale di un suono. Acusticamente il padiglione funziona come un filtro lineare la cui funzione di trasferimento dipende dalla direzione e dalla distanza della sorgente sonora. Il padiglione decodifica le caratteristiche spaziali del campo sonoro in caratteristiche temporali e spettrali. Per le frequenze superiori a circa 2000 Hz ogni variazione angolare nel piano meridiano risulta dalla modificazione della risposta in frequenza dovuta alle creste e alle gobbe del padiglione.

Per esempio nel caso in cui il suono provenga direttamente davanti o dietro lascoltatore (0 o 180 dazimut) con unelevazione arbitraria, non ci sar alcuna differenza di interaurale di tempo o dampiezza e ci sar solo lorecchio esterno a fornire informazioni sulla posizione della fonte sonora rispetto al piano meridiano.

Per descrivere in maniera pi visuale il funzionamento del padiglione dellorecchio, nella localizzazione sonora, immaginiamo di dividere il piano meridiano con tante rette passanti per il centro. Consideriamo queste rette le direzioni delle possibili sorgenti sonore e costatiamo che gli ostacoli che ciascuna di esse incontrer, da una parte allaltra del centro non saranno mai simmetrici. La discriminazione angolare avviene a 360 e non si avr mai confusione con lelevazione di una fonte sonora data e la sua elevazione collineare corrispondente a 180. Quindi il padiglione concorre anche nella localizzazione avanti-dietro, che una conseguenza della discriminazione angolare dellelevazione.

Essendo un cacciatore-predatore, per l'animale ha la massima importanza sentire la direzione dello spezzarsi di un ramoscello, il sibilo di un serpente, il barrito di un elefante, il richiamo degli uccelli, ecc. e probabilmente ha meno importanza sentire la direzione di frequenze pi basse come il tuono, il sospiro del vento o la direzione dei tamburi.

La dimensione della testa umana mostra chiaramente che luomo maggiormente sensibile ai suoni di frequenza superiore a 700 Hz.

La complessit della struttura non-lineare dell'orecchio esterno implica che la sua esatta funzione troppo complessa e troppo soggettiva per essere spiegata con formule matematiche. Le creste e le cavit dell'orecchio sono cos numerose e cos differenziate da assicurare una grande sensibilit alle frequenze acute. Non importa da quali frequenze acute un suono sia costituito e da che direzione provenga, il padiglione e la testa insieme, o anche il singolo padiglione, produrranno un modello distintivo che il cervello pu imparare a riconoscere per localizzare un determinato suono.

L'orecchio esterno essenzialmente un convertitore meccanico che individua le direzioni di arrivo dei suoni in base a dei modelli di risposta in frequenza prestabiliti.

1.5 Capacit direzionale del singolo padiglione auricolare

Un esperimento molto semplice dimostra labilit del singolo padiglione auricolare di sentire la direzione nel piano orizzontale alle frequenze acute. Basta sistemare un metronomo direttamente di fronte a se. Chiudere gli occhi e localizzare la sorgente del suono usando entrambe le orecchie. Poi tenendo gli occhi chiusi, chiudere il pi possibile unorecchio e stimare quanto si spostata la posizione apparente del suono, nella direzione dellorecchio ancora aperto. Molti esperti di audio si aspetterebbero che il suono sentito solo nellorecchio destro sembri provenire dallestrema destra, ma in questo esperimento lo spostamento raramente pi di 5 gradi, e se si ha un grande padiglione auricolare la sorgente potrebbe non muoversi per niente.

Una variante di questo esperimento girare attorno con gli occhi chiusi e poi vedere quanto si arriva vicino alla collocazione della sorgente sonora.

In questo caso leffetto dellombra acustica della testa aiuta il padiglione auricolare nel processo finch non ci si trova di fronte alla sorgente.

Questi sono i casi in cui il singolo sistema di ricerca direzionale del padiglione dellorecchio pi forte della differenza interaurale dellintensit e spiega perch individui che sentono da un solo orecchio possono ancora individuare le posizioni delle sorgenti sonore.

Se adesso passiamo a una sorgente di musica con tutta le frequenze, come una piccola radio, e si ripete lesperimento descritto sopra, si sente una grande immagine che si sposta, dal momento che lorecchio esterno e la testa sono meno importanti per la localizzazione del suono, quando esso scende sotto i 400 Hz.

Ci sono state molte discussioni nella letteratura se labilit umana di localizzazione per primo un fenomeno monaurale o binaurale. Probabilmente il cervello identifica e fa stime della posizione del suono attraverso ogni singolo input uditivo e poi combina il risultato monaurale con i meccanismi binaurali.

Ogni sistema di riproduzione che non tiene conto della sensibilit del padiglione auricolare alla direzione dellincidenza della musica non produrr un suono naturale o realistico. Due localizzazioni sentite non sono superiori a una localizzazione sentita; entrambe devono accordarsi a tutte le frequenze per una riproduzione realistica.

1.6 Altri fattori

Ci sono altri fattori che entrano in gioco in ci che concerne ludito direzionale. In particolare sono importanti i movimenti della testa che hanno la funzione di riposizionare la sorgente sonora in un settore della percezione spaziale in cui la precisione direzionale sar maggiore e di diminuire cos lincertezza della localizzazione di tale sorgente.

Questi movimenti della testa sono riflessi involontari. importante considerare anche la conduttivit della struttura ossea del corpo, specialmente della testa e delle riflessioni sonore causate principalmente dal torace.

Gli indici di localizzazione forniti da questi meccanismi non sono necessariamente di buona qualit: per esempio i vestiti che noi portiamo modificano probabilmente la capacit riflessiva del torace, avendo cos una buona riflessione invece che lassorbimento totale di certe frequenze alte.

Tra tutti i meccanismi delludito direzionale essi sono i pi vulnerabili alle variabili esterne.

1.7 La legge del primo fronte acustico

Questo un fenomeno che stato osservato quando ci sono due sorgenti sonore fisse e identiche, ma non simultanee. Se la differenza temporale tra le due sorgenti non superiore a 37millisecondi il nostro il nostro sistema uditivo interpreter la direzione del fenomeno acustico come quella della prima sorgente udita.

Al di sopra del limite di 37ms, la seconda sorgente non si fonder pi con la prima e sar chiaramente percepita come un eco.

Questo un processo di interpretazione mentale indipendente dalla differenza interaurale dei tempi.

Ad esempio due sorgenti che si trovano in una posizione speculare di azimut rispetto al piano frontale, creano una differenza interaurale dei tempi identica luna rispetto allaltra.

In questo caso entrer in causa la legge del primo fronte acustico e la sorgente che ha la priorit temporale sar la sola ad essere percepita nella valutazione direzionale.

1.8 Precisione direzionale del sistema uditivo

Laccuratezza della precisione direzionale del nostro sistema uditivo dipende generalmente dalla larghezza della banda spettrale della sorgente sonora.

Pi questa banda sar ampia e pi la direzione dellevento udito sar corrisponder alla direzione reale della sorgente sonora.

Cos i suoni complessi che coprono diverse ottave saranno sempre facilmente localizzabili. Questi suoni faranno appello alla differenza interaurale dei tempi, alla differenza interaurale dampiezza e alle modificazioni del padiglione auricolare per consentire la localizzazione.

Questa congiunzione di meccanismi porter una ridondanza di informazioni di localizzazione e creer un evento uditivo in cui la corrispondenza spaziale rispetto alla sorgente originale sar assai elevata.

Al contrario, nel caso dei suoni puri, come le onde sinusoidali senza attacco preciso, sar utilizzato un solo meccanismo di localizzazione.

Lassenza di ridondanza nelle informazioni di localizzazione contribuisce ad aumentare limprecisione nella spazializzazione dellevento udito.

La zona critica di frequenze dove limprecisione maggiore, attorno ai 2000 Hz. Poich la differenza interaurale di fase diminuisce gradualmente di efficacia a partire da 800 Hz e poich la differenza interaurale dampiezza non veramente funzionale sopra i 2000 Hz, c una mancanza di sovrapposizione di zone coperte efficacemente da questi meccanismi di localizzazione. La nostra mancanza di discriminazione direzionale attorno ai 2000 Hz, spiega in parte la nostra maggiore sensibilit allampiezza acustica che si trova proprio in questo settore di frequenze.

Questo confermato dalle curve isofone adottate dallInternational Organization for Standardization (ISO) nel 1987.

CAPITOLO 2

MODELLI DANALISI SPAZIALE

DEI SISTEMI ELETTROACUSTICI

Noi abbiamo la capacit di registrare e riprodurre i suoni da circa un centinaio danni. Durante questo periodo, una moltitudine di tipi di supporto sono stati utilizzati per la trasmissione e la conservazione dellinformazione sonora, i cambiamenti di tecnologia erano generalmente giustificati per laumento della fedelt nel sistema. Riguardo alla fedelt spettrale e dinamica, abbiamo raggiunto un altissimo livello di realismo.

La fedelt spaziale s progredita, ma coloro che si occupano del settore e il grande pubblico non hanno i mezzi per apprezzare, comparare e descrivere le capacit di spazializzazione dei differenti sistemi.

Si distinguono due filosofie di concepimento dei sistemi elettroacustici riguardo alla loro capacit di spazializzazione sonora. Tutti i sistemi che utilizzano dei trasduttori di ricezione e di riproduzione nascono da una o dallaltra di queste due filosofie. Quando si tratta di registrazione e riproduzione tridimensionale, esse non sono realmente in contrasto poich procedono dalla stessa constatazione di partenza: la stereofonia attuale non soddisfacente per ci che concerne la spazializzazione e il posizionamento tridimensionale dei suoni.

Il primo approccio considera il sistema uditivo umano come lultimo anello della catena elettroacustica. La conseguenza principale di questa presa di posizione che non si pu concepire altro che un sistema elettroacustico che pu utilizzare solo due canali dinformazione, sostenendo che in una condizione normale dascolto il cervello ottiene una quantit e una qualit sufficienti di informazioni, per il posizionamento spaziale dei suoni, con un massimo di due canali.

La seconda filosofia, che, in certi casi, deriva dallesperienza pratica, pi che da una vera riflessione scientifica, considera come punto finale della catena elettroacustica, la sala, lo spazio acustico in cui ha luogo levento sonoro. Questo approccio, che resta per il momento il pi sfruttato, non ha tuttavia stimolato la pratica scientifica necessaria.

Da queste due filosofie derivano due modelli di registrazione e riproduzione sonora. Questi due modelli serviranno allanalisi comparativa delle differenti teorie dei differenti sistemi. Il primo modello, basato sulla filosofia del sistema uditivo come punto finale della catena, sar chiamato modello binaurale.

Il secondo modello, basato sulla filosofia dello spazio di riproduzione come punto finale della catena, sar chiamato modello geometrico.

Un sistema unidimensionale potr captare e riprodurre i suoni su un asse dato. Un sistema bidimensionale potr captare e riprodurre i suoni su piano dato e un sistema tridimensionale potr captare e riprodurre i suoni in uno spazio o in un volume dato.2.1 Il modello binaurale

Sviluppato dalle ricerche sulludito direzionale, il modello binaurale di registrazione e riproduzione sonora cerca di ottenere una replica dei fattori fisici pi significativi che sono responsabili delludito direzionale umano. Due trasduttori disposti ai lati di un separatore chiamato generalmente baffle, di volume considerevole (simula lostacolo rappresentato dalla testa) e dei filtri acustici, fisicamente asimmetrici, adiacenti ai trasduttori (come i padiglioni auricolari) formano la struttura portante di questo modello.

necessario utilizzare, per la riproduzione meccanica o elettronica del modello, due canali dinformazione che producano dei segnali analogici che stimolino i nostri timpani. Se il modello rispettato, questi canali producono delle differenze fra loro di tempo e dampiezza, per la codifica delle differenze direzionali verticali.

Poich il timpano un trasduttore che risponde ai cambiamenti assoluti di pressione, i trasduttori di un microfono binaurale devono essere dello stesso tipo per seguire fedelmente il modello. Dallaltra parte della catena, i trasduttori di riproduzione devono portare direttamente ai due canali uditivi linformazione decodificata, in modo che sia convertita dal nostro sistema uditivo interno e codificata in maniera appropriata dal cervello.

2.2 Il modello geometrico

Il modello geometrico ha una genesi un po meno definita del modello binaurale e solo tardivamente, verso la fine degli anni settanta, stato esposto chiaramente.

Nel modello geometrico, i trasduttori audio, microfoni e altoparlanti, sono considerati come punti di ricezione e di emissione nello spazio.

Questa riduzione dei trasduttori a dei punti una convenzione generalmente accettata e fa evidentemente riferimento alle caratteristiche fisiche e elettriche dei microfoni e degli altoparlanti, oltre che alle caratteristiche di ricezione e di emissione sonora.

Questi trasduttori sono quindi considerati come punti nello spazio tridimensionale e interpretati secondo le leggi della geometria euclidea.

Un punto nello spazio definito dalla sua posizione; cos un microfono nella registrazione e un altoparlante nella riproduzione sono definiti dalla loro posizione nello spazio. Due punti definiscono una retta; due microfoni e due diffusori definiscono una dimensione dello spazio. Tre punti non allineati possono definire un piano; tre microfoni e tre altoparlanti non allineati possono definire due dimensioni dello spazio. Infine quattro punti che non si trovano sullo stesso piano possono definire un volume e ugualmente quattro microfoni e quattro diffusori situati non sullo stesso piano, possono definire le tre dimensioni dello spazio.

Nella geometria analitica quattro punti equidistanti che non si trovano sullo stesso piano, formano il tetraedro, il pi semplice poliedro regolare inscrivibile nella sfera, come si vede nella Figura 2.1.

Figura 2.1Riassumendo, il numero e la posizione dei trasduttori gli uni rispetto agli altri, alla registrazione e alla riproduzione, avr una conseguenza diretta sulle possibilit di codifica e decodifica delle caratteristiche spaziali del fenomeno acustico originale.

Il modello geometrico nato dagli esperimenti compiuti indipendentemente in Francia, in Inghilterra e negli Stati Uniti dopo gli anni cinquanta.

Nel 1952, Pierre Scheaffer si dedic a una serie di esperimenti per la riproduzione tridimensionale della musica elettroacustica, proponendo di disporre i diffusori in modo che formassero un tetraedro. Alla fine degli anni sessanta si fecero esperimenti, soprattutto in Inghilterra, sulla registrazione basata sul tetraedro.

Il modello geometrico fu proposto negli Stati Uniti da Peter Scheiber, ma illustrato solo in modo teorico, spiegando la codifica bidimensionale a tre canali e la codifica tridimensionale a quattro canali.

In Inghilterra, il matematico Michael Gerzon speriment lintegrazione della registrazione bidimensionale e tridimensionale nello stesso modello geometrico. Fece test sulla registrazione e riproduzione bidimensionale a tre trasduttori e quella tridimensionale a quattro trasduttori.

Gerzon afferm in seguito, che le conclusioni alle quali giunse erano basate sulle ricerche del matematico inglese Stokes nel 1952 e del matematico francese Poincar nel 1892.

Le caratteristiche direzionali dei trasduttori nel modello geometrico, possono essere omnidirezionali, unidirezionali o bidirezionali. Nella riproduzione, i diffusori unidirezionali o bidirezionali, devono essere avere il campo di emissione con polarit positiva, diretto verso il centro di massa della figura geometrica che essi delineano.

Lo spazio di riproduzione deve essere il meno riverberante possibile, fino a essere idealmente anecoico. Infatti in uno spazio riverberante, le diverse riflessioni sulle pareti pregiudicano la qualit della riproduzione direzionale. In una camera anecoica o con poca riverberazione, gli altoparlanti unidirezionali sono preferibili.

Per la registrazione, lutilizzo di microfoni omnidirezionali esige una certa distanza o lutilizzo di un baffle tra i microfoni. La distanza o il baffle creer le differenze tra i canali, dampiezza e di tempo, necessari per la codifica direzionale. Se si utilizzano dei microfoni unidirezionali, bisogna calcolare lorientamento verso lesterno della figura geometrica disegnata dalla disposizione dei trasduttori, le rette definite dal centro di massa e i vertici della figura. Inoltre necessaria la coincidenza spaziale dei microfoni, cio la pi grande vicinanza possibile tra loro. Una registrazione che utilizza dei microfoni unidirezionali descrive lo spazio attraverso la variazione assoluta di pressione e attraverso i gradienti di pressione; i microfoni cardioidi sono un misto tra gli omnidirezionali e i bidirezionali. Se una registrazione utilizza solamente dei microfoni bidirezionali coincidenti, la descrizione dello spazio sar incompleta perch includer solo dei gradienti di pressione.

Per essere bidimensionale o tridimensionale, una registrazione con microfoni bidirezionali dovr includere anche la variazione assoluta di pressione. Questo sar assicurato dalla presenza di un microfono omnidirezionale coincidente ai microfoni bidirezionali. Inoltre i microfoni bidirezionali devono essere idealmente disposti in modo da fare una registrazione ortogonale dello spazio acustico. Un ultimo caso, un po particolare e complesso, di microfoni bidirezionali, che introduce un altro modello, che si pu considerare una variante del modello geometrico: il modello delle armoniche sferiche.

2.3 Il modello delle armoniche sferiche

Finora abbiamo parlato della direzionalit dei trasduttori in termini generali, classificandoli come omnidirezionali, unidirezionali, o bidirezionali.

Se storicamente queste caratteristiche sono state ottenute in maniera empirica, esiste tuttavia, un modello matematico che permette di spiegare e immaginare caratteristiche direzionali ancora pi complesse. Per comprendere meglio fermiamoci a riflettere su unanalogia. Si pu scomporre lo spettro in frequenza di un fenomeno sonoro complesso, nelle componenti di frequenza (armoniche) che lo costituiscono.

I suoni complessi sono formati da un insieme di armoniche, legate tra loro da una relazione matematica. Allo stesso modo, la direzionalit nello spazio di tutti i fenomeni demissione e ricezione sonora pu essere scomposta nelle sue componenti primarie, chiamate armoniche sferiche.

Il modello delle armoniche sferiche si applica si applica a un insieme di fenomeni fisici elettromagnetici, elettrodinamici, atomici e acustici. Osserviamo i primi tre ordini di armoniche sferiche semplici, come mostrato in Figura 2.2.

Il microfono che corrisponde allarmonica di ordine zero conosciuto con il nome di omnidirezionale e il microfono che corrisponde allarmonica di primo ordine chiamato bidirezionale o figura otto. Le due sfere dellarmonica sferica di primo ordine, avranno una polarit differente.

La polarit dei lobi alterner sempre da un lobo allaltro: un lobo positivo sar sempre seguito da un lobo negativo, che a sua volta sar seguito da un lobo positivo e cos via.

Figura 2.2

Nellarmonica di secondo ordine, i lobi che puntano a 0 e 180 saranno positivi, mentre il lobo che si trova sullasse 90-270 sar negativo.

La funzione matematica che descrive larmonica di ordine zero e

lEq. (1), la funzione dellarmonica sferica di primo ordine lEq. (2) e la funzione dellarmonica sferica di secondo ordine lEq. (3).

(1) Y0 (q) = 1

(2) Y1 (q) = cos

(3) Y2 (q) = cosq2 1

Le armoniche sferiche semplici possono combinarsi linearmente per creare quelle che chiameremo armoniche sferiche complesse. Si possono combinare per semplice addizione i segnali dei microfoni alle propriet sferiche semplici e ottenere dei microfoni virtuali alle propriet sferiche complesse.

Per ottenere risultati che implicano una previsione matematica semplice, bisogna assicurare la coincidenza spaziale dei microfoni di base e lallineamento delle loro assi di rotazione, cio lasse perpendicolare al diaframma passante per il centro. Si deve assicurare la coincidenza spaziale su due assi, X e Y per esempio, in modo da garantire lintegrit della risposta direzionale del microfono virtuale nel piano determinato dai due assi.

Il microfono virtuale avr, sempre nel piano dove c la coincidenza, le qualit di risposta in frequenza dei microfoni che lo costituiscono.

Per esempio combinando in un rapporto 1:1 il segnale di un microfono di ordine zero coincidente a un microfono di primo ordine semplice, in modo che i loro guadagni rispettivi siano identici per lazimut 0, si ottiene un microfono di primo ordine complesso. Il guadagno uguale e con la stessa polarit di ogni microfono a 0 avr ampiezza doppia per questo valore dellazimut a causa della combinazione dei rispettivi segnali. Cos il guadagno uguale, ma con polarit opposta a 180, creer lannullamento completo per questo valore dellazimut a causa della combinazione dei segnali. Allo stesso modo per tutti i valori dellazimut, il segnale risultante dovuto alla combinazione dei segnali dei rispettivi microfoni. Il microfono virtuale cos ottenuto viene chiamato unidirezionale o cardioide.

Affinch il modello geometrico sia valido, la codifica della direzionalit acustica deve sempre includere un ordine dato di armoniche sferiche e tutti gli ordini che gli sono inferiori. Quindi se si riprende lo spazio con dei microfoni bidirezionali, si tratta di una registrazione di primo ordine; si deve allora includere lordine zero, cio lomnidirezionale. per questa ragione che una registrazione con dei cardioidi di primo ordine completa poich questi microfoni sono una combinazione lineare dellarmonica di ordine zero e di primo ordine.

CAPITOLO 3

I SISTEMI ELETTROACUSTICI BINAURALI

La distinzione tra un sistema stereofonico convenzionale e un sistema binaurale non evidente e si fa spesso confusione tra i due, quando non c una totale ignoranza riguardo al secondo procedimento.

In un sistema che segue il modello binaurale, dobbligo lutilizzo di due canali poich si tratta di un processo di simulazione del sistema uditivo umano. La produzione di un segnale audio binaurale si effettua con la registrazione attraverso la testa di un manichino.

I tratti generali del manichino possono essere una grossolana approssimazione, ma le orecchie devono essere una replica esatta del padiglione auricolare per poter ottenere dei risultati soddisfacenti.

I microfoni sono posizionati generalmente allinizio del canale uditivo. Poich le modificazioni dellorecchio esterno saranno gi incluse nel segnale audio registrato dal procedimento binaurale, necessario lutilizzo di un casco dascolto. Infatti il segnale audio sar modificato una seconda volta dal padiglione auricolare, se la registrazione binaurale viene ascoltata tramite degli altoparlanti.

Figura 3.1

Il microfono binaurale Neumann KU 100 e il microfono binaurale Bruel & Kjaer 4128

Le prestazioni di questo sistema possono essere stupefacenti, ma queste dipendono molto dallintegrit spettrale di tutta la catena di registrazione e riproduzione. Poich il padiglione dellorecchio apporta delle modificazioni spettrali che vengono utilizzate dal cervello per riconoscere la posizione della fonte sonora, il filtraggio non desiderato produce delle aberrazioni spaziali. Inoltre lutilizzo di un casco dascolto costituisce un problema nella riproduzione delle frequenze basse.

La piccola superficie dei diaframmi e la loro zona descursione piuttosto limitata costituiscono le ragioni principali nella mancanza dampiezza di queste frequenze.

Un altro inconveniente lassenza di trasmissioni meccaniche del suono sulle altre parti del corpo: lo schiocco di certi inviluppi di suoni dagli attacchi molto rapidi, come certi strumenti a percussione, che vengono percepiti in maniera quasi tattile, e la trasmissione delle basse frequenze attraverso la struttura interna del corpo.

3.1 La simulazione binaurale e la conversione transaurale

Nelle migliori dimostrazioni, sembra che ci sia un certo consenso sulla qualit dellillusione tridimensionale ottenuta con una buon registratore binaurale, a patto che si utilizzi un casco dascolto. Questo successo ottenuto, ma le sue frustranti limitazioni, pongono due quesiti fondamentali sui sistemi binaurali: possibile codificare dei segnali sonori monofonici, che provengono da un nastro multitraccia o da una presa polimicrofonica ad esempio, per conferire loro un carattere binaurale?

possibile codificare un segnale binaurale per rendere compatibile il suo ascolto attraverso degli altoparlanti?

Le ricerche su questi due aspetti hanno avuto uno sviluppo indipendente e apparentemente senza fini commerciali. Alcune imprese hanno comunque nutrito un certo interesse nellunire questi due aspetti della ricerca sulla registrazione binaurale, per sviluppare dei prodotti che rispondano alle esigenze dellindustria della musica. Il missaggio stereofonico di nastri multitraccia esiste gi da un certo periodo di tempo e diventa spontaneo chiedersi se il missaggio di questi nastri si possa fare con tecniche binaurali. La conoscenza delle caratteristiche della percezione direzionale delludito umano e lo sviluppo tecnologico dei calcolatori lasciano intravedere la possibilit che si costruiscano apparecchi che apportano su suoni monofonici, un certo numero di modificazioni parametriche che simulano la registrazione binaurale. La documentazione pubblicata dalle compagnie di ricerca rimane per il momento piuttosto scarsa. Un gruppo di ricerca delle NASA in California ha studiato il procedimento dividendo il campo sferico di ricezione in 144 posizioni. Il metodo di misurazione delle posizioni di riferimento molto semplice, ma molto noioso e ripetitivo.

Si diffondono in condizioni anecoiche degli impulsi di rumore rosa nelle posizioni predeterminate. Questi impulsi saranno captati da un sistema di microfoni binaurali basati su un modello statistico medio di misurazione delle orecchie, della testa e del tronco.

Per ogni posizione, si misura la differenza interaurale dei tempi e dampiezza e si confronta la modificazione spettrale assoluta di ogni orecchio.

Queste misure sono immagazzinate in un calcolatore che, a seconda delle capacit e dellinterfaccia usata, applicher le modificazioni binaurali ai suoni monofonici. Idealmente queste modificazioni dovrebbero essere compiute in tempo reale, e permettere delle modificazioni dinamiche nella localizzazione dei suoni, cio la dislocazione dei suoni. La dislocazione, permettendo allascoltatore di confrontare le posizioni in tempo reale, rinforza la certezza di impressione della spazializzazione. Se si desidera simulare un suono dato, senza dislocazione del suono, non pi possibile avere il confronto delle caratteristiche che indicano la posizione del suono. Risulta un aumento del flusso di localizzazione e cio una direzione completamente errata. La condizione implicita dei sistemi binaurali che lintera catena di trasmissione dellinformazione sia neutra quanto allintegrit della risposta in frequenza dei diversi suoni. Il problema che non si pu garantire questa neutralit e che certe modificazioni spettrali, volute o no, possono causare un posizionamento spaziale non desiderato.

Un modo di risolvere questo problema sarebbe quello di prendere come punto di partenza le misure individuali del posizionamento spaziale. Il gruppo di ricerca della NASA ha utilizzato un simulatore binaurale, ma per ogni soggetto che lha testato, sono state prese delle misure binaurali individuali.

Solo cos il sistema efficace e attualmente non possibile la sua commercializzazione, ma questa squadra di ricercatori spera tuttavia di riuscire a sviluppare un modello statistico medio soddisfacente.

Per quel che concerne la questione di adattare una registrazione binaurale allascolto su degli altoparlanti, bisogna innanzitutto ricordare che la caratteristica fondamentale del segnale binaurale la funzione di trasferimento da un sistema uditivo esterno (le orecchie, la testa e il torace). La conseguenza evidente che questo segnale non pu subire unaltra modificazione da parte dellorecchio esterno e questo spiega incompatibilit con lascolto attraverso dei diffusori.

Inoltre, poich il segnale binaurale deve stimolare direttamente i timpani, esso non pu tollerare alcuna forma di diafonia: quando un segnale binaurale ascoltato attraverso degli altoparlanti, una parte dellinformazione destinata esclusivamente allorecchio sinistro verr udita anche da quello destro e viceversa. Si ha quindi, diafonia acustica tra i canali.

I problemi principali, che rendono incompatibile lascolto del segnale binaurale con gli altoparlanti, sono due: la reinterpretazione da un sistema binaurale di un segnale che ha gi stato modificato da questa funzione di trasferimento e la diafonia acustica.

Per risolvere questi problemi necessaria una trasformazione del segnale in modo da renderlo compatibile con lascolto mediante dei diffusori.

Questo processo di trasformazione del segnale binaurale chiamato conversione transaurale.

La soluzione al problema della reinterpretazione del segnale relativamente semplice da realizzare. Lascolto mediante diffusori sempre realizzato pressappoco nella stessa maniera: gli altoparlanti sono angolati di circa 30 da ogni lato rispetto allasse dascolto, sono idealmente alzate a un metro dal suolo e sono posizionate di fronte allascoltatore.

Il suono che proviene dai diffusori interpretato dal sistema binaurale come due sorgenti discrete a posizione fissa. Misurando le modificazioni binaurali per le posizioni abituali degli altoparlanti in ascolto stereofonico, si pu calcolare una funzione di trasferimento binaurale media per questo tipo dascolto stereofonico mediante diffusori. Si pu allora applicare linverso di questa funzione al segnale binaurale, prima che esca dagli altoparlanti.

La funzione di trasferimento inverso e quella di trasferimento dellascoltatore si annullano e il suono recupera la sua neutralit frequenziale.

David Griesinger della compagnia Lexicon, suggerisce di utilizzare una funzione di trasferimento media molto pi globale e parla di rendere lineare la risposta in frequenza media per lemisfero frontale.

I risultati degli esperimenti compiuti da Lexicon sono stati utilizzati nella costruzione di certi modelli di processori audio di calcolo numerico prodotti da questa compagnia.

La soluzione al problema della diafonia acustica, teoricamente non pi complessa, ma necessita di una elaborazione dellinformazione in tempo reale molto pi importante. Come sappiamo, il segnale destinato esclusivamente a un orecchio in particolare udito anche dallorecchio opposto, ma con un certo ritardo e una certa diminuzione dampiezza. Se si diffonde nellaltoparlante corrispondente allorecchio opposto un segnale identico a quello della diafonia, cio con lo stesso ritardo e diminuzione dampiezza, ma con polarit inversa, questo nuovo segnale dovrebbe eliminare la diafonia. Evidentemente il segnale dannullamento sar udito anche dallorecchio opposto a quello a cui il segnale era destinato; noi abbiamo cos un nuovo problema di diafonia e un nuovo segnale dannullamento deve essere generato per eliminare il primo segnale dannullamento. Questo processo deve essere ripetuto il numero di volte necessario e in maniera continua in tempo reale sui canali sinistro e destro per funzionare adeguatamente. La mole del processo di elaborazione del segnale enorme.

Problematica la posizione dascolto: alle frequenze alte una dislocazione di qualche centimetro rovina leffetto, poich la simmetria del rapporto tra i diffusori e lascoltatore non pi assicurata. Le frequenze basse sono molto meno sensibili alla posizione dascolto: la loro grande lunghezza donda assicura una certa tolleranza. Esperimenti compiuti negli Stati Uniti e in Europa, dimostrano che pi la sala dascolto riverberante e pi grande la quantit di elaborazione necessaria. In condizioni dascolto anecoico, in cui si pu ridurre la mole di trattamento, sono stati ottenuti risultati eccellenti duranti gli anni ottanta.

La simulazione binaurale e la conversione transaurale, si articolano attorno a due punti: trovare un modello statistico medio soddisfacente della funzione di trasferimento del sistema uditivo umano e aumentare la quantit di elaborazione informatica, per permettere una migliore definizione del campo uditivo e uneliminazione della diafonia pi efficace.

Da qualche anno c una crescente comparsa di sistemi di simulazione binaurale: il CAP-340M dellAKG, il Qsound della Qsound Corporation, il Roland Sound Space (RSS) e i differenti apparecchi di Spatializer Audio Laboratories, per nominarne alcuni. La Roland afferma che i meccanismi di funzionamento dellRSS sono basati sui risultati della ricerca psicoacustica in ci che concerne ludito direzionale. E interessante constatare che lapparecchio diviso in due blocchi: il simulatore binaurale e il convertitore transaurale. La revisione di uno solo dei due settori sar sempre possibile e migliorer senza alcun dubbio la performance globale del sistema.

3.2 I sistemi elettroacustici ibridi

Da qualche anno, sono nati nuovi strumenti di registrazione e la loro classificazione diventa difficile. In effetti i loro principi di funzionamento e la metodologia di elaborazione del segnale fanno riferimento sia al modello binaurale che al modello geometrico. Appartengono a questa categoria di sistemi di registrazione ibridi il Stereo Ambient Sampling System (SASS) della compagnia americana Crown e la Sfera della compagnia tedesca Schoeps, come mostrato in Figura 3.2.

Figura 3.2 Il SASS della Crown e la Sfera della Schoeps

Questi sistemi utilizzano un baffle di forma complessa e di volume considerevole, per simulare certe caratteristiche della testa umana.

La presenza di questo baffle risponde alla prima esigenza del modello binaurale. Nello stesso tempo lassenza di filtri acustici adiacenti ai trasduttori, che simulano il padiglione dellorecchio, si rif al modello geometrico.

La sfera stata sviluppata in seguito allelaborazione del modello teorico di Gunther Theile che afferma che si deve inserire in una registrazione stereofonica delle modificazioni di segnale corrispondenti a quelle apportate dal sistema uditivo umano, in particolare a quelle conseguenti agli effetti acustici della testa. La sfera costituita da un baffle sferico di 200 mm di diametro, sul quale sono montati ai due antipodi due capsule omnidirezionali. Si ottiene dunque una codifica quasi binaurale; evitando volontariamente le modificazioni spettrali e temporali del padiglione dellorecchio, il segnale stereofonico prodotto dalla Sfera, non ha i problemi di compatibilit delle registrazioni binaurali con lascolto con gli altoparlanti. Il baffle attenua sufficientemente le frequenze acute degli stimoli sonori opposti (captati direttamente da una delle due capsule e per diffrazione dallaltra) affinch il problema del filtraggio a pettine (comb filtering) delle onde in opposizione di fase venga attenuato. Tutte le altre particolarit importanti di codifica direzionale prodotte dalla testa sono ugualmente prodotte dalla Sfera.

Le caratteristiche fisiche della Sfera la rendono conforme al modello Spectral Stereo di Cooper, che un modello dascolto basato su un baffle sferico.

Non si pu pretendere di produrre un informazione spaziale completa con la Sfera; la sua ricezione completa negli assi X (avanti/dietro) e Z (alto/basso).

La ricezione della Sfera, essendo discriminante solo sullasse Y (sinistra/destra), unidimensionale. Poich questa codifica direzionale sullasse Y avviene rispettando il modello dassociazione, si pretende che produca un segnale stereofonico pi soddisfacente riguardo allimpressione spaziale, senza perdere gli attributi di sensibilit con i suoni coincidenti. Osserviamo che la Sfera ha un antenato francese, il registratore che lingegner Charlin ha sviluppato alla fine degli anni cinquanta. Questa palla ricoperta da una fasciatura aveva anchessa due microfoni omnidirezionali posizionati in maniera identica alla Sfera. La compatibilit mono/stereo determin il successo di questo sistema che non rendeva obsoleti i giradischi monofonici. Pi recentemente, con le ricerche di Theile, il registratore con un baffle sferico ha trovato le sue giustificazioni teoriche e unincarnazione commerciale pi valida.

Le qualit di registrazione della Sfera si trovano anche nel SASS. Sviluppato includendo certi meccanismi binaurali per contrastare i difetti di presa di posizione dei suoni stereofonici coincidenti, ma con la cura della compatibilit del suono monofonico e dascolto con i diffusori, il SASS un vero sistema di registrazione ibrido.

I suoi inventori hanno ricordato che il SASS risponde perfettamente alle esigenze dei modelli di Cooper e Theile. Il modo in cui il SASS risponde a queste esigenze leggermente diverso da quello della Sfera. La differenza maggiore nelle caratteristiche del baffle: di forma pi complesssa, lanalisi visuale della simmetria delle traiettorie delle rette collineari sul baffle, ci fa notare che il SASS permette una codifica direzionale sia sullasse Y (sinistra/destra) che sullasse X (avanti/dietro).

Lefficacia della codifica sullasse Y sperimentata, ma non si pu sapere a priori se la codifica sullasse X sar di una qualit soddisfacente con lascolto con gli altoparlanti o almeno con il casco dascolto.

Malgrado la differente costruzione, la Sfera e il SASS utilizzano gli stessi meccanismi per la codifica sullasse Y. I due sistemi utilizzano delle capsule omnidirezionali; a basse frequenze il baffle non efficace e la diffrazione avr pertanto una pressione acustica quasi uguale sui due diaframmi, qualunque sia la direzione del suono.

invece la distanza tra le due capsule e la differenza di fase che sar cos introdotta che permette di codificare la direzione a basse frequenze. Al di l di una certa zona di frequenze, circa 1000 Hz, a causa della presenza del baffle, la direzionalit delle capsule aumenta e la differenza dampiezza tra i canali assicura la codifica direzionale.

Nelle frequenze acute la grandezza del baffle abbastanza importante per prevenire il filtraggio a pettine nella somma monofonica. Lassenza totale di discriminazione sullasse Z assicura un ascolto compatibile con i diffusori.

Parliamo infine di un altro sistema, non commercializzato, che pu essere aggiunto a questa categoria di registratori stereofonici ibridi. Si tratta del Matrixed Pressure Triplet (MPT) del belga Andr Defossez. Tre capsule omnidirezionali sono disposte in maniera equidistante sulla superficie curva di un baffle cilindrico, avendo cos una differenza di 120 tra loro. La capsula A diretta a 0, la capsula B a 120 a sinistra e la capsula C 120 a destra.

I segnali per i diffusori sono prodotti da un decodificatore matrix, cio attraverso un missaggio prestabilito di canali discreti di una console. La capsula A alimenta congiuntamente i canali sinistro e destro, la capsula B alimenta il canale sinistro e, con un attenuazione di 18dB e con inversione di polarit, il canale destro. Avviene la stessa cosa con la capsula C che alimenta direttamente il canale destro e, con lattenuazione di 18dB e inversione di polarit, quello sinistro.

Linventore dellMPT piazza la sua invenzione in un settore ancora inesplorato: la registrazione stereo non coincidente con un decodificatore matrix. Se questa tecnica pu sembrare a prima vista temeraria, bisogna ricordare che il baffle assicura unattenuazione sufficiente delle frequenze acute e controlla il filtraggio a pettine.

LMPT risponde sicuramente a un certo numero di criteri del modello di associazione di Theile, ma ragionevole credere che il rispetto del modello sarebbe sicuramente pi completo se il baffle fosse di forma sferica piuttosto che cilindrica. Il cilindro rappresenta un ostacolo acustico differente dalla sfera o dalla testa e pu portare delle modificazioni spettrali che possono essere falsate al momento della riproduzione. Linformazione spaziale codificata su due assi, X e Y, e lMPT potrebbe essere considerato come un registratore bidimensionale.

3.3 I limiti dei sistemi basati sul modello binaurale

Per aspirare alla commercializzazione, i sistemi basati sul modello binaurale fanno fronte ad importanti insidie tecnologiche. Delle ricerche recenti hanno sviluppato dei modelli teorici di riproduzione binaurale con pi di due altoparlanti e per pi di un ascoltatore, ma non sono ancora stati pubblicati risultati sperimentali.

Per il momento non si pu fare altro che estrapolare sullapplicazione della transauralit per pi ascoltatori. Altro problema che la riproduzione binaurale pu essere interpretata solo da una posizione fissa. Questo accade anche con il casco dascolto: se lascoltatore gira la testa, tutto il campo sonoro segue il movimento.

In una situazione acustica reale, quando si gira la testa, i suoni cambiano posizione nel nostro campo di percezione.

Solo il sistema della NASA permette lo spostamento dellascoltatore allinterno dello spazio in cui ha luogo levento sonoro.

La registrazione originale multitraccia e ad ogni elemento sonoro che costituisce levento, viene assegnata una posizione assoluta nello spazio in cui ha luogo lesperienza e una relativa alla posizione dellascoltatore.

Questultimo, con il suo casco dascolto, pu posizionarsi nello spazio sonoro virtuale mentre il calcolatore aggiusta il segnale a seconda dei suoi spostamenti. Questa filosofia di riproduzione binaurale molto simile al concetto di realt virtuale nel mondo informatico.

Non si possono che ammirare i numerosi sforzi per migliorare la tecnologia, ma bisogna interrogarsi davanti alla possibilit di sfruttamento commerciale di un tale sistema.

I metodi che esige la registrazione si adattano abbastanza bene se ci si occupa di musica pop, ma non corrispondono a pratiche usuali nella musica classica o in manifestazioni musicali acustiche. Inoltre la registrazione multitraccia non pu essere mixata: ogni elemento sonoro deve rimanere discreto perch gli si possa applicare il trattamento binaurale adeguato per lascolto.

Si parla di un formato per consumatori da almeno venti piste. pur vero che con i continui e rapidi sviluppi tecnologici difficile prevedere il futuro, ma un formato di questo tipo non pu essere preso in considerazione se non tra una decina danni.

Il problema principale di tutti i sistemi basati sul modello binaurale che essi devono tendere verso la formulazione di un archetipo delludito direzionale.

Questo archetipo, definendo le caratteristiche standard fisiche della testa e delle orecchie, nega le caratteristiche fisiche individuali dellascoltatore.

Al di l delle variazioni che si constatano nelle particolarit della testa, le variazioni nelle particolarit del padiglione auricolare sono ancora pi grandi da un individuo a un altro. lecito credere, in base agli studi sulludito direzionale, che lascolto con le orecchie di unaltra persona avrebbe un effetto devastante sulla qualit della percezione spaziale. Il modello binaurale studiato per un ascoltatore adulto.

La forma e la grandezza della testa e delle orecchie cambiano durante la crescita verso lo stadio adulto. La presentazione di un segnale binaurale adulto a un bambino, darebbe come risultato una cattiva decodifica del segnale. Non solo sarebbero inesatte le modificazioni spettrali apportate dal padiglione dellorecchio, ma sarebbero difficilmente interpretabili anche le differenze interaurali dei tempi e dampiezza.

Inoltre la sensibilit allampiezza sonora non simmetrica tra lorecchio sinistro e destro e questa sensibilit rovesciata nei mancini. Si dovr allora costruire un modello binaurale destro e uno mancino? Favorendo un modello standard non verranno soddisfatti tutti i possibili fruitori.

CAPITOLO 4

I SISTEMI ELETTROACUSTICI GEOMETRICI

Lo sviluppo iniziale dei sistemi elettroacustici stato fortemente legato allo sviluppo della telefonia. Noi lo abbiamo dimenticato perch oggigiorno si fa una distinzione basata sul diverso utilizzo. Questa distinzione tra telefonia e la catena stereofonica non esisteva alla fine del XIX secolo e allinizio del XX secolo. In effetti, a parte la tappa di fissare linformazione su un supporto, lo scopo del telefono e della catena stereofonica lo stesso: captare uninformazione sonora in un luogo dato e diffondere questinformazione in un altro luogo. Pu forse sorprendere che la prima registrazione stereofonica utilizzando due microfoni sia stata trasmessa attraverso due linee telefoniche?

cos che nel quadro dellEsposizione internazionale dellelettricit di Parigi, nel 1881, linventore Clement Ader compiva la trasmissione stereofonica a distanza dei concerti che avevano luogo nellOpra di Parigi.

Gi a questepoca era chiaro che la codifica delle caratteristiche direzionali di un evento acustico rendeva necessario lutilizzo di pi di un canale dinformazione.

Ma due canali erano sufficienti? Nel 1898, il grammofono Multiplex Graphophone Grand utilizzava tre cornette per la registrazione e riproduzione, che scrivevano e leggevano tre solchi su un cilindro.

Con un costo proibitivo di mille dollari, questapparecchio non ha sicuramente trovato molti acquirenti.

Alla luce di questi due esempi, vediamo che allinizio della telefonia, da pi di centanni, le qualit direzionali di un evento acustico, non erano riproducibili con un solo microfono e un solo altoparlante.

Tuttavia ancora attuale lutilizzo in radio e in telediffusione della registrazione e trasmissione, utilizzando un unico canale dinformazione.

4.1 I sistemi elettroacustici con un canale dinformazione

La registrazione e riproduzione con un unico canale dinformazione meglio conosciuta con il nome di monofonia. Nella monofonia, linformazione sonora catturata ed emessa da un solo punto nello spazio; un sistema che non neppure unidimensionale.

Lutilizzo di microfoni dalle propriet sferiche differenti, non cambia nulla: al massimo si pu cambiare il raggio tra il suono che proviene direttamente dalla sorgente e il suono riflesso dalle pareti.

Nella riproduzione, a parte posizionare fisicamente la fonte di emissione, cio laltoparlante, non possibile alcun posizionamento spaziale se non quello della sorgente sonora. Se la monofonia non nemmeno unidimensionale, come si fa al momento della riproduzione, a valutare le caratteristiche acustiche del luogo di registrazione, come il riverbero o leco?

Un fenomeno sonoro come la riverberazione fornisce informazioni sullacustica del luogo di registrazione fornendo una descrizione spaziale e una descrizione temporale di questa acustica.

La registrazione monofonica non permette la codifica delle caratteristiche spaziali e di riverberazione, ma permette di codificare le caratteristiche temporali. Queste caratteristiche temporali sono delle variazioni nel tempo dellampiezza globale e del raggio dampiezza delle frequenze del suono riflesso che arrivano al microfono.

Al momento della riproduzione, la nostra esperienza uditiva ci permette di interpretare i descrittori temporali e di valutare le caratteristiche acustiche del luogo di ricezione. Si pu allora parlare di dimensione spaziale, captata e riprodotta dal sistema elettroacustico, quando essa esiste solamente nellestrapolazione mentale basata su una parte degli elementi descrittori?

per questi motivi che la monofonia non nemmeno unidimensionale.

4.2 Sistemi elettroacustici a due canali dinformazione

I sistemi elettroacustici che utilizzano due canali dinformazione sono comunemente raggruppati sotto il termine di stereofonia.

Letimologia della parola stereo deriva dal greco stereos che significa solido, nel senso geometrico del termine; la stereofonia sarebbe quindi il suono in tre dimensioni. Il termine stereofonia costituisce, considerando la sua etimologia e il suo utilizzo corrente per designare esclusivamente i sistemi elettroacustici a due canali, un abuso del linguaggio storico. Nella consuetudine odierna questo termine viene usato per designare una registrazione trasmessa attraverso due canali e riprodotta con due diffusori o un casco dascolto. Come nella telefonia, anche nel campo dei sistemi elettroacustici lutilizzo di due canali per la trasmissione e riproduzione sonora appariva come un netto miglioramento rispetto alla monofonia.

Bisognava aspettare ancora una quarantina danni, prima che il perfezionamento delle componenti meccaniche e elettriche permettessero sperimentazioni pi approfondite e una possibile commercializzazione della stereofonia. Nel 1931, delle domande di brevetto sullincisione di un solco a due canali su un disco o su un cilindro, furono depositate in Inghilterra e negli Stati Uniti.

Le condizioni sfavorevoli e la crisi economica impedirono tuttavia gli investimenti necessari alla commercializzazione di questi brevetti.

Gli anni cinquanta, con il boom economico del dopoguerra, offrirono un contesto pi favorevole alluscita sul mercato di questi prodotti.

Nel caso degli Stati Uniti, questa domanda proveniva dai Laboratori Bell, in cui si facevano da qualche tempo, delle registrazioni stereofoniche a due o tre microfoni. In Inghilterra, la domanda di brevetto proveniva da Alan Dower Blumlein, che lavorava per la compagnia EMI. Ci che era interessante nel brevetto di Blumlein, che egli non parla solo dellincisione, ma di un sistema stereofonico completo, dalla registrazione alla riproduzione.

Dopo la lettura di questo brevetto, risulta evidente che molte delle tecniche di produzione utilizzate al giorno doggi in stereofonia vengono direttamente da Blumlein.

La registrazione stereofonica di base con due microfoni, ci offre una moltitudine di possibilit quanto a combinazioni funzionali dei microfoni.

Si pu raggruppare questa combinazione di microfoni in due classi: la registrazione coincidente e la registrazione non coincidente. Queste tecniche utilizzano sia la differenza dampiezza tra i canali, sia una combinazione di differenza intercanale dampiezza e di differenza intercanale di fase, per codificare il posizionamento dei suoni.

4.2.1 La registrazione stereofonica coincidente

Nella registrazione coincidente del suono, due capsule direzionali occupano teoricamente lo stesso punto nello spazio, ma con gli assi di rotazione puntati in direzioni differenti. Il suono arriva cos nello stesso istante ai due microfoni, ma con unampiezza che varia in funzione della direzione del suono. Quindi in una registrazione coincidente, la codifica della posizione di una sorgente sonora data, dipende unicamente dalla differenza intercanale dampiezza. Evidentemente con due microfoni omnidirezionali coincidenti, non si avrebbe teoricamente alcuna differenza dampiezza nella direzione dei suoni. Lutilizzo di coincidente di microfoni aventi lo stesso diagramma polare sono generalmente chiamati X-Y. Si possono utilizzare due cardioidi, due ipercardioidi o due figura-otto.

Gli angoli di separazione variano generalmente tra 90 e 180; gli angoli pi larghi sono preferiti con i cardioidi e con gli ipercardioidi, mentre langolo di 90 preferito con i figura-otto.

I figura-otto a 90 sono stati proposti da Blumlein nel 1931 e questo spiega perch questassemblaggio conosciuto anche con il nome del suo inventore. Nella realt pratica, occupare lo stesso spazio con due microfoni non fisicamente possibile; essi vengono posizionati abitualmente uno sopra laltro, occupando cos in un piano orizzontale parallelo al loro asse di rotazione, lo stesso punto nello spazio.

La forza principale di questa tecnica risiede nella possibilit di creare microfoni virtuali, variando la combinazione della somma monofonica e della differenza stereofonica prodotta dai microfoni originali. La somma si ottiene addizionando i segnali dei due microfoni, e la differenza si ottiene addizionando ancora il segnale, ma invertendo la polarit del segnale di uno dei due microfoni. Si possono anche utilizzare direttamente dei microfono aventi caratteristiche sferiche analoghe alla somma mono e alla differenza stereo. Questa tecnica viene denominata M-S che significa Middle-Side o Mono-Stereo.

Come proposto da Blumlein nel suo brevetto, il microfono M punta direttamente verso il centro della sorgente con angolo 0 e il microfono S orientato a 90 dazimut. Il microfono M generalmente un cardioide, ma pu essere anche un figura-otto o un microfono direzionale di ordine superiore o eccezionalmente un omnidirezionale. Invece il microfono S deve essere sempre un figura-otto. Addizionando e sottraendo i segnali di M e di S (M+S e M-S) si ottengono dei nuovi microfoni virtuali che hanno lorientamento e le caratteristiche sferiche di un X-Y. Cambiando il rapporto tra M e S si pu variare langolo di separazione dei microfoni virtuali.

La separazione dei microfoni direttamente legata alle loro caratteristiche sferiche: pi si allontanano i microfoni e pi si aumenta la proporzione dellarmonica sferica di primo ordine, il microfono S figura-otto. Analizzando con il modello delle armoniche sferiche le tecniche X-Y e M-S sembrerebbe lecito affermare che esse sono equivalenti, ma nella realt pratica certi ingegneri preferiscono la tecnica M-S perch permette una somma monofonica di qualit migliore nelle caratteristiche frequenziali e sferiche.

Le tecniche coincidenti sono teoricamente intercambiabili, ma evidentemente le caratteristiche sferiche e langolo di separazione dei microfoni hanno un impatto determinante sulla funzione di panoramica.

I figura-otto a 90 e i cardioidi a 180 sono le sole registrazioni ad avere una funzione di panoramica regolare, cio non favoriscono nessun quadrante a discapito di un altro. Le altre combinazioni ottenute in X-Y e in M-S favoriscono il quadrante frontale o i quadranti sinistro e destro.

Il fattore comune che lega tutte le tecniche coincidenti che utilizzano solo due microfoni il carattere unidimensionale della loro capacit di codifica spaziale.

4.2.2 La registrazione stereofonica non coincidente

Contrariamente a ci che si fa nelle tecniche coincidenti, lutilizzo di microfoni omnidirezionali consigliato nella registrazione del suono non coincidente.

Questa classe raggruppa linsieme di tecniche in cui i due microfoni non occupano lo stesso posto nello spazio. Il microfono omnidirezionale utilizzato in un assemblaggio denominato generalmente A-B, in cui la distanza tra i due microfoni pu variare da qualche decina di centimetri a qualche metro a seconda della situazione e delle preferenze soggettive.

La distanza tra i microfoni e la differenza intercanale dampiezza, crea una differenza intercanale di fase poich i suoni giungono ai microfoni in momenti differenti. Quando la separazione dei due microfoni supera qualche metro, consigliata laggiunta di un terzo microfono omnidirezionale, posizionato in maniera equidistante rispetto ai microfoni principali diretto al centro dellimmagine stereofonica. Questa pratica si ispira direttamente alle esperienze sulla stereofonia realizzate nei Laboratori Bell durante gli anni trenta. Daltra parte, quando la distanza tra i microfoni piuttosto piccola, meno di trenta centimetri, i microfoni omnidirezionali non sono pi necessariamente una buona scelta poich la differenza intercanale dampiezza comincia a essere molto lieve. Se si decide di utilizzare un omnidirezionale per le sue qualit spettrali, preferibile lutilizzo di un baffle.

LOptimal Stereo System (OSS) ne un esempio: Due capsule omnidirezionali distanziate di 16,5 cm e separate da un baffle circolare di 28 cm di diametro. Si tratta anche in questo caso di una delle tecniche stereofoniche brevettate da Blumlein.

Per le distanze itermicrofoniche inferiori a 30 cm, luso di microfoni direzionali diventa una scelta assai utilizzata. La letteratura specializzata identifica spesso questo tipo di registrazione come facente parte di un raggruppamento a parte e lo definisce quasi coincidente.

Lassemblaggio francese ORTF senza dubbio il pi comune di questa famiglia. Esso utilizzza due cardioidi distanziati di 17 cm e con 110 di angolo. La tecnica olandese NOS utilizza anchessa due cardioidi, ma separati di 30 cm e con 90 di angolo. Il montaggio britannico Faulkner, sicuramente il meno conosciuto, utilizza due figura-otto spaziati di 18-20 cm, ma con gli assi di rotazione paralleli luno allaltro e diretti verso la sorgente.

A questi assemblaggi si potr sempre apportare qualche modifica.

La compagnia AKG utilizza un baffle circolare di 35 cm, simile a quello del sistema OSS, per migliorare le prestazioni del sistema ORTF.

Nelle tecniche quasi coincidenti luso del baffle opzionale; si dovr tuttavia utilizzarlo se si ha lintenzione di preservare una grande compatibilit monofonica. Infatti si avranno, per certe lunghezze donda che corrispondono alla distanza tra i microfoni, una sfasatura di 180 causando lannullamento di queste frequenze nella riproduzione monofonica.

Unanalisi delle armoniche sferiche dei montaggi quasi coincidenti senza baffle, rivela linsorgere di fenomeni acustici dinterferenza, poich unarmonica sferica di secondo o terzo ordine, variando a seconda della lunghezza donda, costituisce una perdita importante del microfono virtuale che corrisponde alla somma monofonica.

Quindi il baffle, diminuendo lampiezza dei segnali che giungono ai due microfoni, ma in opposizione di fase, assicurer la compatibilit monofonica. Le registrazioni non coincidenti sono unidimensionali nella loro codifica spaziale, proprio come le registrazioni coincidenti.

Nel caso della tecnica A-B, poich laggiunta potenziale del microfono supplementare si fa sulla stessa linea dei microfoni principali, si migliora la definizione della linea. La tecnica A-B dunque unidimensionale come le altre.

4.2.3 La registrazione stereofonica polimicrofonica

Le registrazioni polimicrofoniche con microfoni monofonici, utilizzano principalmente la differenza intercanale dampiezza, per posizionare i suoni monofonici a sinistra e a destra, sia in tempo reale che in differita su due piste. Il controllo della panoramica sulla console si ottiene cambiando lampiezza del segnale in un canale rispetto allaltro.

Le registrazioni polimicrofoniche con microfoni stereofonici, possono utilizzare differenti combinazioni di microfoni stereo principali e microfoni mono dappoggio. Il missaggio potr preservare o no le caratteristiche di codifica direzionale dei diversi assemblaggi di microfoni, mantenendo o diminuendo la separazione dei canali in questi differenti assemblaggi.

La differenza intercanale di fase non ancora utilizzata usualmente per posizionare i suoni in un missaggio su due piste. Finora gli apparecchi periferici che producevano questi delay servivano soprattutto per creare delle impressioni spaziali con posizionamento diffuso; laccostamento con la registrazione del suono non coincidente abbastanza semplice da fare.

Larte del missaggio stereo di una registrazione polimicrofonica si recentemente arricchita di nuove sperimentazioni.

La questione del trattamento temporale dei microfoni dappoggio stata studiata con differenti ipotesi e diverse sperimentazioni.

La tecnica polimicrofonica odierna consiste nel registrare levento con un montaggio stereofonico e dei microfoni monofonici di sostegno per gli strumenti in cui si vuole compensare la debolezza del rispettivo segnale. Eseguita in questo modo questa tecnica comporta un importante problema:

i suoni captati dai microfoni dappoggio saranno percepiti davanti ai suoni captati dal montaggio stereo. Il risultato sar lillusione che linformazione del montaggio stereo costituisca le prime riflessioni e che i microfoni dappoggio costituiscano i suoni diretti. Se si aggiunge della riverberazione artificiale, si produce una modificazione dellacustica originale.

Per contrastare lanticipo temporale dei segnali dei microfoni dappoggio, la prassi normale compensare con dei delay equivalenti alla distanza tra i microfoni dappoggio e il montaggio stereo.

Questa tecnica di correzione crea dei nuovi problemi di filtraggio frequenziale quando la sorgente di un microfono di sostegno spostata lateralmente, in quanto la relazione temporale tra il montaggio stereo e il microfono dappoggio assume delle proporzioni differenti.

Rimane unultima soluzione, abbastanza promettente, che consiste nellintrodurre nei canali dei microfoni di sostegno un delay superiore a quello corrispondente alla distanzza tra i microfoni dappoggio e il montaggio stereo. Questo delay manda i segnali monofonici nella zona temporale delle prime riflessioni e non distrugge limmagine prodotta dallassemblaggio stereo. Questa tecnica di missaggio ancora pi efficace se, per una data sorgente, sono simulate pi riflessioni.

4.2.4 Apprezzamenti soggettivi delle registrazioni stereofoniche

Quali sono le differenze udibili e apprezzabili tra le varie tecniche di registrazione stereofoniche coincidenti e non coincidenti?

Queste differenze sono di tipo psicoacustico; il giudice finale che misura lapporto della codifica direzionale di questi meccanismi e determina quindi il successo di queste tecniche rimane il nostro orecchio. Inoltre sembra che la precisione nella riproduzione direzionale dei suoni non sia il solo criterio di per apprezzare la qualit del posizionamento spaziale di una registrazione stereo.

Carl Ceoen, della Radiodiffusion-Tlvision Belge, ha compiuto nel 1971 un test dascolto comparativo delle differenti tecniche stereofoniche dello stesso evento musicale. I criteri della valutazione, e in pi della precisione direzionale (stage continuity), erano i seguenti: liveness, intimacy, perspective, extra-width, dynamic range, warmth e brillance. Oltre sessanta persone hanno ascoltato lestratto delle Danze slave di Dvorak registrato simultaneamente in X-Y (cardioidi), Blumlein, M-S (cardioide/figura-otto), ORTF, NOS e polimicrofonia (cinque cardioidi panoramici con una console di missaggio).

La maggioranza delle persone interrogate hanno indicato che la tecnica ORTF sembrerebbe essere il compromesso migliore tra tutti i criteri, con la registrazione M-S come seconda scelta. Questa preferenza per la non coincidenza, spiega Griesinger, dovuta al fatto che queste registrazioni ottengono una migliore impressione spaziale. Questimpressione solo una parte dellinformazione spaziale codificata da una registrazione stereofonica; non si ritrova uninformazione direzionale precisa, ma piuttosto uninformazione sullacustica del luogo originale.

Theile afferma che limpressione spaziale comprende due attributi dellimmagine sonora: la riverberanza, cio la diffusione temporale degli eventi sonori causata dalle riflessioni tardive e dalla riverberazione e l'areazione spaziale, cio la diffusione spaziale degli eventi sonori, causata dalle prime riflessioni.

Questa informazione sullimpressione spaziale contenuta nel microfono figura-otto, reale o virtuale, corrispondente al segnale di differenza stereofonica della registrazione. Lorientamento di questo microfono lo rende particolarmente adatto a captare le prime riflessioni della sala che danno riferimenti importanti sul volume della sala originale.

La distanza tra i microfoni di un montaggio non coincidente, assicura una scarsa correlazione intercanale e contribuisce cos a produrre un segnale di differenza stereo, ricco dal punto di vista psicoacustico. La preferenza per le tecniche non coincidenti unindicazione abbastanza forte di difetti inerenti alla stereofonia convenzionale quanto alla sua capacit di dare unimpressione credibile dello spazio acustico dellevento.

4.2.5 Il trattamento del segnale stereofonico

Gli assemblaggi coincidenti permettono generalmente una variazione uniforme della differenza intercanale dampiezza, ma lassenza della differenza intercanale di fase produce una differenza stereo con una forte correlazione e restituisce in maniera spenta limpressione spaziale.

Griesinger suggerisce la correzione in piano (shelf filtering) della somma e della differenza stereo di una registrazione del suono coincidente, per aumentarne limpressione spaziale. Aumentando di 4 dB le frequenze al di sotto dei 700 Hz nella differenza stereo, e in certi casi riducendo di 4 dB questa zona di frequenze nella somma monofonica, sembra esserci una migliore impressione nella riproduzione dellambiente.

Questo tipo di trattamento, in cui le modificazioni sono apportate ai segnali di somma e di differenza, piuttosto che ai segnali sinistro e destro, stata proposto da Blumlein.

Si cominciano cos a scoprire le virt di un trattamento stereofonico essenzialmente simmetrico: una modifica alla somma o alla differenza si ripercuote sempre in maniera identica nel canale sinistro e destro.

Non bisogna stupirsi se il tipo di correzione spaziale proposto da Griesinger simile al trattamento del segnale che si ritrova nella tecnica di produzione Stereosonic.

Utilizzato negli anni cinquanta e sessanta dalla EMI, Stereosonic era la versione commerciale del brevetto di Blumlein. Le ricerche di Blumlein e Griesinger hanno trovato interesse per la compagnia Hughes Aircraft.

Mentre Griesinger suggeriva una correzione spaziale statica, il Sound Retrieval System (SRS) della Hughes applica una correzione spaziale dinamica che varia in funzione del segnale stereo che lo alimenta. Innanzitutto il segnale stereofonico sinistro e destro ricomposto in somma monofonica e in differenza stereofonica. LSRS procede in seguito a unanalisi dei segnali per determinare la quantit di trattamento da applicare.

Ci sono poche informazioni nella letteratura specializzata su questa parte del sistema, ma si presume che lanalisi venga eseguita seguendo dei parametri fissi: si guarda la proporzione dellampiezza della somma e della differenza per tutta la banda passante e per dei settori di frequenze in particolare.

Si modificano poi le ampiezze di certe zone di frequenza che possono creare una buona impressione spaziale.

Per la ricostruzione del segnale stereo sinistro e destro, si lascia al fruitore la possibilit di modificare, entro certi limiti, il rapporto tra la somma mono e la differenza stereo. Il Bedini Audio Spatial Environment (B.A.S.E) funziona esattamente sullo stesso principio dellSRS.

Questi due sistemi diventano particolarmente interessanti nel caso in cui i diffusori sono ravvicinati: correttori spaziali procedono a un aumento dellimpressione spaziale del segnale stereofonico.

Da qui le affermazioni da parte delle due compagnie di un sistema di riproduzione sonoro tridimensionale.

Un altro trattamento post-registrazione usato recentemente la conversione Blumlein, che consiste nel convertire la differenza intercanale di fase di una registrazione non coincidente in differenza intercanale dampiezza.

Leffetto principale di questa conversione di rendere pi compatibile lascolto c