Compressione audio digitale
La compressione audio è una tecnica che permette di ridurre le dimensioni di un file audio o la banda passante richiesta per una trasmissione audio, anche di molto.
Un file è una sequenza di cifre binarie (bit) utilizzata come veicolo di informazione. Comprimere significa ridurre il numero delle cifre che costituiscono la sequenza mantenendo l'informazione in un intorno dell'informazione originaria (ossia facendo in modo che la nuova informazione approssimi quella precedente).
I motivi della compressione sono:
- occupare minor spazio in fase di immagazzinamento
- impiegare minor tempo in fase di trasferimento bruto.
Il costo è l'aumento dei tempi di lettura/scrittura legati rispettivamente a tempi di decompressione/compressione. Nel caso di file audio si ha un costo anche in termini di qualità dell'audio.
Esistono due tipi di compressione:
- con perdita (lossless):quando l'informazione contenuta nel file compresso è identica a quella contenuta nel file di origine
- senza perdita (lossy): quando l'informazione contenuta nel file compresso non è identica a quella contenuta nel file di origine
La prima permette compressioni maggiori, ma a scapito della qualità sonora.
Compressione senza perdita
Usando un algoritmo di compressione senza perdita, dal risultato della compressione si può riottenere tutta l'informazione originaria. In questo caso la riduzione massima generalmente ottenibile, utilizzando algoritmi studiati appositamente per l'audio è all'incirca del 60%, ma solo con alcuni tipi di suono. Si possono utilizzare gli stessi algoritmi generali di compressione (come per esempio ZIP o Gzip) ma i risultati in termine di riduzione sono inferiore.
Compressione con perdita
Dal risultato della compressione audio con perdita non si può più ottenere un suono identico all'originale ma la riduzione ottenibile è molto spinta: con rapporti di compressione di 10 a 1, il risultato è quasi indistinguibile dall'originale ma ci si può spingere anche oltre a discapito della qualità.
Gli studi di psicoacustica hanno permesso di accertare che l'uomo non è sensibile nello stesso modo a tutte le frequenze e che un suono ad alta intensità ne maschera uno con frequenza vicina ma intensità più bassa. Sfruttando queste ed altre considerazioni, si può pensare di eliminare l'informazione che non verrebbe comunque percepita ed ottenere quindi un buon rapporto di compressione.
Esempi:
- mp3 (MPEG-1 Layer III) è stato introdotto negli anni 80 ed è un formato lossy. ...
- Ogg Vorbis E' probabilmente il più popolare codec dopo l'mp3 e rispetto ad esso ha due vantaggi: una più efficiente compressione e il fatto di essere opensource (quindi niente royality) ...
- AAC è stato reso popolare dalla Apple. Apple's iTunes Music Store fa uso di file compressi con 128Kbps CBR AAC e lo standard video MPEG4 raccomanda l'uso dell'AAC audio nei prossimi apparecchi e software.
- Windows Media Audio (wma)
- Dolby Digital (ac3)
- MPC Musepack
Bitrate
I file multimediali sono per loro natura connessi al tempo che scorre. In altri termini ad ogni secondo è associato un certo contenuto informativo e quindi una certa sottosequenza di cifre binarie. Il numero di cifre binarie che compongono queste sottosequenze è detto bitrate. In altre parole il bitrate è il numero di cifre binarie impiegate per immagazzinare un secondo di informazione. Questo può essere costante per tutta la durata del file o variare all'interno di esso. Ad esempio i cd musicali necessitano ogni secondo (bitrate costante) di una sequenza di 1411.000 cifre binarie, ossia hanno un bitrate di 1411.000 bit al secondo ossia 1411 Kbit/s. La compressione, diminuendo la lunghezza globale del file, diminuirà di conseguenza la lunghezza media delle sottosequenze ossia diminuirà il bitrate medio. Il bitrate medio diventa dunque in questi casi l'indice dell'entità della compressione. A desempio se il file di origine possedesse un bitrate di 1411 Kbit/s e il file compresso possedesse un bitrate medio di 320 Kbit/s, allora avremmo compressatto di un fattore pari a circa 4.5.