elementi di psicoacustica

L'orecchio umano percepisce le frequenze che vanno dai 20 Hz ai 20 kHz, ed è più sensibile tra i 2 e i 4 kHz. Il range dinamico, dal suono più basso al più alto percepito, è di 96 dB (Decibel). Il range della voce umana varia dai 500 Hz ai 2 kHz. Preciseremo nei tre punti seguenti il significato di queste osservazioni.

la definizione di decibel

Via via che un livello sonoro aumenta, ciascuna unità di aumento produce un effetto differente sull'orecchio. Partendo da un livello sonoro molto basso, una prima addizionale unità di suono sembra che apporti una grande differenza nella sensazione uditiva. Però le successive addizioni della stessa unità di suono divengono progressivamente meno efficaci, e si raggiunge infine un punto in cui l'orecchio non rileva alcun aumento di sensazione malgrado la misura fisica dell'intensità del suono evidenzi un aumento di potenza.
Il comportamento dell'orecchio umano può essere definito dicendo che le variazioni di sensazione sono proporzionali ai rapporti di potenza acustica.
In pratica, un aumento - misurato strumentalmente - da 1 mW a 2 mW viene percepito dall'orecchio come un raddoppio dell'intensità sonora; tuttavia, per ottenere un ulteriore, equivalente aumento della percezione sonora, occorre passare da 2 mW a 4 mW, e poi da 4 MW a 8 mW. Questo comportamento dell'orecchio è illustrato efficacemente nella sottostante tabella animata.

terzo aumento di sensazione
secondo aumento di sensazione
primo aumento di sensazione
sensazione iniziale

Per esprimere quantitativamente il comportamento dell'orecchio umano, convenzionalmente si ricorre al decibel (dB), Un aumento di un dato numero di decibel, generalmente, indica lo stesso aumento di sensazione, indipendentemente dall'intensità iniziale presa come riferimento. Una variazione di 3 dB corrisponde ad un raddoppio dell'intensità della sensazione uditiva. Questa variazione si considera generalmente come la prima variazione avvertibile.

le curve di Fletcher-Munsen

Un'altra caratteristica dell'orecchio umano consiste nel fatto che percepisce i suoni in modo non lineare: è sensibile in misura differente alle varie frequenze. D'altra parte, le differenze tendono a ridursi all'aumentare della pressione sonora.
Questo fatto viene rappresentato dalle curve di Fletcher-Munsen. Esaminando il diagramma sottostante, si vede che una intensità di pressione sonora di circa 80 decibel per una frequenza di 1000 Hz (curva indicata in colore rosso), produce nell'orecchio una risposta contenuta per tutto l'intervallo delle frequenze udibili tra +15 e -5 dB.

In realtà, un'orchestra sinfonica (ci si riferisce a questa in quanto è la più complessa per contenuti musicali, e dunque se l'orecchio l'ascolta con gradimento, ascolterà altri tipi di musiche altrettanto bene), in un auditorio presenta una pressione di 90 dB, per la quale, la curva di risposta è anch'essa contenuta in + 15, -5 dB, sebbene presenti una maggior linearità nella regione tra 200 e 300 kHz. Tuttavia, la riproduzione del suono tra le pareti domestiche non può raggiungere i 90 dB in quanto gli ambienti sono troppo piccoli e la pressione sonora risulterebbe eccessiva. Per questa ragione, si accetta la pressione di 78 dB come capace di produrre una buona riproduzione musicale.
Se invece, consideriamo un ascolto più da sottofondo, come per esempio la curva di pressione a 60 dB, si vede che è compresa tra +25 dB, -5 dB.

cuve di Fletcher-Munsen

Come è chiaro, a basse pressioni acustiche, si hanno due possibilità: accettare le diminuite capacità percettive dell'orecchio, oppure intervenire per compensare la diminuzione nelle alte e basse frequenze. Poiché in questo caso, ognuno ha una sua opinione personale, è preferibile lasciare la scelta della correzione all'utilizzatore. La correzione fisiologica a bassi livelli d'ascolto si ottiene inserendo il loudness (controllo di sonorità). D'altra parte, alcuni costruttori prevedono il controllo fisiologico del volume in modo che la compensazione avvenga automaticamente, senza possibilità di esclusione.

campo di dinamica

La gamma dinamica di un'immagine sonora è la differenza tra il livello sonoro più alto ed il minimo livello sonoro che può essere avvertito. Per esempio, la gamma dinamica di un'orchestra sinfonica è circa 90 dB, ove si consideri che l'ascolto avviene in un luogo dove il minimo bisbiglio può arrecare disturbo.
Come abbiamo discusso, il livello ottimale per l'ascolto in ambiente domestico - vicini permettendo - è di circa 78 dB. D'altra parte, il livello del rumore (in un'abitazione silenziosa) è tipicamente stimato in 30 dB. Dunque, la tipica gamma dinamica è in realtà di 48 dB (78dB - 30 dB). Questo significa che durante l'ascolto della riproduzione orchestrale, i pianissimi verrano mascherati dal rumore di fondo dell'ambiente.

taglio delle frequenzeUn problema legato alla dinamica riguarda i sistemi di trasmissione e registrazione. Per esempio, a sinistra è schematizzata un'onda con dinamica di 100 dB, che quando viene registrata su un supporto capace di soli 60 dB, viene tagliata a meno di ridurne l'ampiezza. Per la musica sinfonica, questa riduzione - essendo applicata a tutto il messaggio musicale - si traduce in un perdita dei passaggi più deboli in quanto vengono a trovarsi coperti dal rumore intrinseco del supporto.
dinamica di trasmissioni e registrazioniIl diagramma a destra, mostra un confronto fra la dinamica di varie tipologie di esecuzioni musicali. Si faccia attenzione che la dinamica non corrisponde al livello di pressione sonora, bensì alla differnza tra il massimo e il minimo suono percepibile. Per esempio, la musica rock ha una dinamica limitata a 30 dB; tuttavia, l'esecuzione musicale comprende strumenti che raggiungono elevate pressioni sonore molto superiori al rumore di fondo. Al contrario, l'orchestra sinfonica con una dinamica di 75-78 dB, presenta problemi per le registrazioni su disco vinilico e su nastro magnetico, e la riproduzione richiede ambienti abbastanza silenziosi.

La figura mostra anche come gli unici sistemi in grado di restituire la completa dinamica di un'orchestra sinfonica oltre alla registrazione digitale, sono i sistemi di registrazione professionale. Mentre con i sistemi amatoriali (esclusi i CD audio), la dinamica durante la registrazione è ristretta a circa 60 dB.
I produttori dei dischi vinilici risolvono parzialmente questo problema (legato anche alle caratteristiche del supporto utilizzato) correggendo la curva di risposta (enfasi) in modo che durante il playback, un'opposta correzione (deenfasi) restituisca un'immagine sonora con una dinamica sufficiente. Un intervento più incisivo, in grado di restituire alla grande orchestra una dinamica simile all'esecuzione originale, richiede (per i dischi vinilici e le registrazioni magnetiche) l'uso di costosi espansori di dinamica.

nemesi

Questo articolo può essere liberamente pubblicato su qualsiasi rivista interamente o in estratto, purché sia citata la fonte e l'indirizzo di questo sito. Copyright Marcello Guidotti, 2001