MP3: PROVE "STATICHE"

 

Ho deciso di fare delle prove per valutare (con i miei modesti mezzi) la fedeltà dei file MP3.

Non ho tenuto conto dei tempi necessari alla compressione, in quanto m'interessava la qualità del risultato, non il tempo impiegato per ottenerlo.

In pratica si tratta di una prova "statica".

Per la precisione ho voluto valutare i limiti di frequenza raggiungibili con i diversi gradi di compressione ed inoltre volevo vedere se l'ampiezza dell'onda poteva subire variazioni durante la conversione, magari in concomitanza con determinate frequenze critiche.

Questo prendendo come riferimento i file WAV campionati in stereo, 16 bit a 44.100 Hz, l'equivalente dei CD.

Per fare ciò ho creato dei file WAV con delle onde sinusoidali a partire da 20 Hz fino a 20.000 Hz, più un campione di rumore bianco, quindi li ho utilizzati per i test. Tutti i campioni hanno un'ampiezza dell'onda pari al 50%, cioè -6dB, in modo di far lavorare il compressore in un campo di volume intermedio.

Alcuni test si sono spinti oltre il limite dei 20.000 Hz, infatti teniamo presente che la frequenza massima teorica che può venire riprodotta è pari alla metà della frequenza di campionamento, quindi 22.050 Hz, un pochino sopra il minimo (20.000 Hz) per venir considerata alta fedeltà.

Per quanto riguarda invece la frequenza minima non ci sono limiti teorici, ma l'HI-FI stabilisce che dev'essere 20 Hz oppure inferiore. Comunque non ho approfondito. Mi sono accontentato di vedere che i 20 Hz siano tenuti bene.

Ho quindi cominciato a fare le mie prove.

Queste ultime si basano per la maggior parte sul compressore Fraunhofer IIS disponibile come plugin per CoolEdit Pro, ma anche il compressore Fraunhofer di Nero Burning Rom mi ha dato risultati analoghi.

Le prove (ove non diversamente indicato) sono state eseguite impostando la qualità media.

In tutti i casi la conversione in MP3 non ha mostrato ne produzione di armoniche (quindi assenza di distorsione) ne variazioni di ampiezza dell'onda, partendo dalla frequenza più bassa fino ad un certo limite. Quale? Vediamo in dettaglio.

 

MP3 stereo a 128Kbit

MP3 stereo a 128Kbit, il valore di compressione forse più usato, permette di ottenere un file MP3 di dimensione pari a circa 1/10 - 1/11 dell'equivalente in formato WAV.

L'onda fino a 15.000 Hz è perfetta, ma a 15.500 Hz è ridotta ad una porzione minuscola (-27,27 dB - vedi la figura qui sotto), per arrivare a circa -80 dB a 16.000 Hz. Inutile dire che a 20.000 Hz non esiste più nulla.

La cosa è confermata analizzando lo spettrogramma del rumore bianco:

mentre quest'ultimo copre tutta la gamma audio in modo pressoché uniforme nel file WAV, nel file MP3 vediamo che si ferma a circa 15.500 Hz, poi restano solo tracce.

Un test più accurato ha rivelato che 15.300 è il limite massimo per un MP3 stereo a 128 Kbit, un pochino scarso se consideriamo che l'HI-FI richiede almeno una banda passante (+/-3 dB) 20-20.000 Hz.

MP3 stereo a 160Kbit

Questo valore di compressione consente di raggiungere finalmente i 20.000 Hz, a prezzo però di una maggiore dimensione del file.

L'analisi dello spettro del rumore bianco ci mostra però delle irregolarità, cioè lo spettro non è uniforme come quello dell'equivalente WAV. Il che significa che il segnale non è ancora perfetto.

L'analisi dell'onda sinusoidale a 20.000 Hz ci conferma questo, infatti l'ampiezza media è calata (-8,89 dB), inoltre ci sono delle ondulazioni sull'ampiezza, il che significa che il limite è stato passato.

L'onda a 19.500 Hz è invece perfetta. Un test più accurato ha trovato come limite 19.800 Hz.

MP3 stereo a 192Kbit

Finalmente si raggiungono i 20.000 Hz pieni! L'esame dello spettro del rumore bianco è pressoché uniforme ed anche l'onda sinusoidale a 20.000 Hz tiene.

Confrontando però lo spettrogramma dell'onda a 20.000 Hz con l'originale rileviamo delle piccole sbavature, c'è quindi una piccola distorsione, che però non dovrebbe pregiudicare la qualità del segnale.

Confortato dal risultato tutto sommato positivo provo a salire a 20.500 Hz: niente da fare, l'onda cala a -38,12 dB.

Il limite massimo trovato è 20.200 Hz.

MP3 stereo a 256Kbit

Questa volta sono partito con 21.000 Hz, convinto che si sarebbero potuti raggiungere. Infatti l'onda viene riprodotta, ma ha un leggero calo di dimensione e presenta un'ondulazione sull'ampiezza che dimostra che siamo sul punto di crisi.

Un test più accurato ha trovato 20.900 Hz come limite massimo.

MP3 stereo a 320Kbit

E' il massimo consentito dal formato MP3, almeno nei compressori che ho visto. Questo formato consente la massima fedeltà, ma anche (purtroppo) i file sono molto più grandi.

Questo nelle prove ha tenuto fino a 21.600 Hz, per poi cedere (-42,4 dB) a 22.000 Hz.

Siamo comunque assai vicini al limite teorico, per cui (almeno dal punto di vista della banda passante) posso dire che MP3 stereo a 320Kbit è molto prossimo alla qualità del WAV.

I diagrammi relativi alle vare risposte in frequenza dell'encoder Fraunhofer li trovate a questa pagina.


A questo punto ho voluto provare il compressore LAME utilizzando CDex.

Le opzioni sono differenti rispetto a quelle del Fraunhofer IIS di CoolEditPro, comunque credo che l'opzione J-stereo corrisponda alla MSstereo del Fraunhofer, in quanto attivandola si riesce ad ottenere la stessa risposta in frequenza, altrimenti questa risulta ridotta come il Fraunhofer 128kbit in stereo puro.

 

I diagrammi dell'encoder Lame li trovate a questa pagina.


<==indietro