Indietro Torna alla pagina Università Avanti

CELP (Codebook Excited Linear Prediction)

Per prima cosa diciamo che viene usato un filtro LPC (Linear Prediction Coding) per modellare il tratto vocale. Il  filtro LPC ha come funzione di trasferimento quella del corrispondente predittore del processo casuale (voce).  L'accuratezza con cui il tratto vocale (filtro) viene riprodotto dipende dall'ordine (numero di coefficienti) del modello. Di solito sono sufficienti pochi coefficienti, per caratterizzare il filtro, ma devono essere quantizzati con accuratezza . I coefficienti del filtro vengono aggiornati ogni 10-20 ms (dimensioni pari circa a quelle di un fonema). Quindi un filtro LTP (Long Time Predictor ) ha il compito di eliminare la periodicità introdotta poiché la voce è presa per blocchi separati (con periodo chiamato pitch). Quest'ultimo risulta indispensabile per codificatori a basso bit rate come quello che stiamo considerando.

Ora determinati i coefficienti del filtro che modella il tratto vocale, dobbiamo decidere quale segnale deve eccitare questo filtro per restituire la voce! Si utilizza un catalogo di segnali o Codebook, dove vengono raccolte tutte le possibili eccitazioni e viene trasmesso l'indice nel catalogo che produce la migliore qualità (minimizzazione dell'errore quadratico) più un termine di guadagno relativo ad esso. La ricerca nel  catalogo si attua con una tecnica di analysis-by-synthesis  . Il parlato è sintetizzato per tutte le entry del catalogo. Man mano la entry che produce il minor errore è scelta come eccitazione. La misura dell'errore è pesata percettivamente in modo tale che la parola di codice scelta produca il suono migliore.

Come viene compressa la voce nel GSM?

IL GSM usa un codificatore a 3 stadi LPC(Linear Prediction Coding)-LTP(Long Time Prediction)-RPE(Regular Pulse Excitation, che non descrivo) in grado di fornire una qualità di poco inferiore a quella dello standard PCM e superiore a quella media dei sistemi telefonici cellulari analogici con soli 13kbit/s. Tale codificatore è in grado di sfruttare sia le correlazioni di breve periodo tra campioni successivi del segnale vocale (filtro LPC), sia quelle tra segmenti di parlato adiacenti, periodi di pitch (filtro LTP).
Viene inserito un filtro di pre-enfasi allo scopo di esaltare le frequenze più alte del segnale. Il segnale così filtrato viene segmentato in tratti di 20ms per poter essere utilizzato nei predittori di breve e lungo termine. 

In pratica ogni 20 ms bisogna determinare tutti i parametri dei filtri più ricercare quale segnale tra quelli del codebook va meglio. Non è stupido il vostro telefonino, vero? 

E' da notare che il metodo usato nei GSM dual band è migliorato (la qualità percepita è pari a quella del telefono fisso), e si parla di EFR (Enhanced Full-Rate). Per chi ha spulciato il libretto di istruzioni del suo GSM dual band, si è imbattuto magari anche nel termine HR (Half-Rate). In questo caso in GSM funziona con un rate di 5.6 Kbit/s! Solo da qualche mese e solo in alcune zone un operatore in Italia ha iniziato ad utilizzare questo metodo. Cosa comporta? La qualità della voce è peggiore (e infatti non viene pubblicizzato), ma in compenso l'operatore è felice in quanto riesce a sopportare il doppio delle telefonate (doppio guadagno), senza dover investire in infrastrutture!

Ascoltate gli esempi di GSM EFR e GSM HR, con un po' di attenzione noterete le differenze:

        gsmefr.mp3 (16 KB)

        gsmhr.mp3 (16 KB)

 

Indietro Torna alla pagina Università Avanti