MPEG-1: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riferimenti esterni: --> collegam.
m top: sistemazione fonti, smistamento lavoro sporco e fix vari
 
(75 versioni intermedie di 42 utenti non mostrate)
Riga 1:
{{F|formati di file|agosto 2020|Assenza totale delle fonti}}
'''MPEG-1''' è uno [[standard]] introdotto nel [[1991]] da [[MPEG]] (Moving Pictures Experts Group).
{{Formato file
|nome = Moving Picture Experts Group Phase 1 (MPEG-1)
|logo = <!-- solo nome file -->
|icona = <!-- solo nome file -->
|immagine = <!-- solo nome file -->
|didascalia =
|estensione = .dat, .mpg, .mpeg, .mp1, .mp2, .mp3, .m1v, .m1a, .m2a, .mpa, .mpv
|magic_number =
|mime = audio/mpeg, video/mpeg
|uniform_type_identifier =
|typecode =
|sviluppatore = [[MPEG]]
|proprietario =
|licenza =
|data_pubblicazione = 6 dicembre 1991
|ultima_versione = ISO/IEC TR 11172-5
|data_ultima_versione = ottobre 1998
|nota_ultima_versione =
|genere = [[Codec video]]
|compressione = <!-- inserire "lossy" o "lossless" -->
|estensione_di = [[JPEG]], [[H.261]]
|esteso_a = [[MPEG-2]]
|standard = ISO/IEC 11172
|aperto = sì
|sito = <!-- senza http:// -->
}}
'''MPEG-1''' ('''Moving Pictures Experts Group Phase 1''') è uno [[norma tecnica|standard]] introdotto nel [[1991]] da [[MPEG]] (Moving Pictures Experts Group).
 
Originariamente è stato ottimizzato per le applicazioni video a basso ''[[bitrate]]'' con una [[Risoluzioni standard|risoluzione]] video di [[standard TV|352x240352×240]] [[pixel]] con 30 [[quadri al secondo|fotogrammi al secondo]] per lo standard tv [[NTSC]] oppure di [[standard TV|352x288352×288]] [[pixel]] con 25 [[quadri al secondo|fotogrammi al secondo]] per lo standard tv [[PAL (televisione)|PAL]]. Questi formati sono comunemente definiti come SIF (''Source Input Format''). MPEG-1 non è strutturalmente limitato a questi formati in quanto può raggiungere ad esempio i 4095x40954095×4095 pixel con 60 fotogrammi al secondo, ma nelle applicazioni ha condotto il gioco la velocità di trasmissione e quindi il sistema è stato ottimizzato per un bit rate di 1,5 Mbit/s. Il limite più importante del sistema MPEG-1 è dovuto all’impossibilitàall'impossibilità di trattare [[Scansione interlacciata|immagini interlacciate]] come quelle impiegate nel [[broadcast]] TV Europeo che richiedono un doppio processo di [[codifica]].
 
I [[Video CD]] utilizzano il formato MPEG-1. La qualità dell'[[Input/output|output]] ai ''bitrate'' tipici di un Video CD è quella di un videoregistratore [[VCRVHS]].
 
'''MPEG-1 layer 3''' è il nome completo del famoso formato audio [[MP3]].
 
MPEG-1 è suddiviso in varie parti:
 
# [[Sincronizzazione]] e [[Multiplazione|multiplexaggiomultiplazione]] (multiplexing) dei flussi video e audio.
# [[Codec]] di [[Compressione video|compressione]] per i [[segnale video|segnali video]] non [[Interlacciamento|interlacciati]].
# Codec di compressione dei [[segnale audio|segnali audio]]. Lo standard definisce tre livelli di codifica audio.
# Procedure per verifiche di conformità.
# [[Software]] di riferimento.
 
==Compressione video in MPEG-1==
===Struttura del fotogramma===
L'algoritmo di compressione video in MPEG-1 opera su sequenze di fotogrammi (o ''frame''), ciascuno dei quali è rappresentato come una [[matrice]] di [[pixel]]. Ad ogni pixel è associata una terna di valori (Y,Cb,Cr) che ne descrive le coordinate nello [[spazio di colori]] [[YCbCr]]. Le componenti di crominanza (Cb e Cr) sono [[sottocampionamento della crominanza|sottocampionate]] nello spazio di un fattore 4:1, per ridurre l'occupazione di banda risultante dal processo di compressione. La componente di luminanza (Y), invece, non è sottocampionata poiché molto più rilevante ai fini della qualità del segnale video.
Per procedere alla compressione, ciascun fotogramma viene scomposto in macro-blocchi di 16×16 ''pixel'', ognuno dei quali conterrà 4 blocchi 8×8 di campioni di luminanza (Y) e 2 blocchi 8×8 per le componenti di crominanza (Cb e Cr).
 
===Tipologie dei frame===
Tre sono le tipologie di ''frame'' previste in MPEG-1: I (''Intra''), P (''Predicted'') e B (''Bidirectionally predicted''). Per ciascuna di esse viene utilizzata una differente procedura di compressione. Un ''frame'' di tipo I viene elaborato sulla base di tecniche [[Intra-frame]], ovvero avvalendosi esclusivamente delle informazioni contenute nel fotogramma stesso. I ''frame'' di tipo P e B, invece, sono compressi mediante tecniche ''inter-frame'', ovvero processati a partire da una predizione ottenuta dai frame temporalmente precedenti e/o successivi. La sequenza video è scomposta in ''Group Of Picture'' (GOP) in cui si alternano, in successione regolare, le differenti tipologie di ''frame''. Ad esempio, un GOP potrebbe essere rappresentato come successione di tipo IBBBPBBBP. La struttura del GOP è tipicamente configurabile sulla base delle esigenze specifiche dell'applicazione in cui il contenuto video viene calato. Rispetto ai ''frame'' P o B, i fotogrammi I garantiscono una maggiore immunità alla propagazione degli errori (poiché sono decodificati senza far riferimento a nessun altro frame) ma richiedono un maggior numero di bit (dato che non si avvalgono di tecniche di predizione ''inter-frame'').
 
===Compressione dei frame I===
I frame di tipo I sono compressi senza ausilio di tecniche di predizione ''inter-frame''. L'algoritmo di compressione si applica a ciascuno dei blocchi 8x8 componenti il frame I (ed indipendentemente per ciascuna delle coordinate Y, Cb e Cr) e si articola nei seguenti passi:
#'''Trasformata [[Trasformata discreta del coseno|DCT]]''': il blocco 8×8 viene rappresentato nel dominio trasformato con una matrice 8×8 di coefficienti DCT. Questa trasformazione è molto utile perché, a differenza dei ''pixel'' componenti il blocco, i coefficienti DCT sono tra loro incorrelati (o poco correlati) e pertanto possono essere processati indipendentemente l'uno dall'altro. Inoltre, la DCT tende a concentrare in pochi coefficienti nel dominio trasformato (tipicamente alle basse frequenze spaziali) l'energia contenuta nel segnale, rendendo così possibile il raggiungimento di un elevato fattore di compressione. Tra i coefficienti DCT distingueremo il termine DC che è proporzionale al valor medio della componente Y o Cb o Cr del blocco processato, dagli altri termini AC.
#'''[[Quantizzazione (elettronica)|Quantizzazione]]''': i coefficienti DCT sono rappresentati su un dominio discreto di valori. Questa operazione comporta una perdita di informazione. Essa tuttavia non è applicata allo stesso modo a tutti i coefficienti DCT. Infatti, i coefficienti alle basse frequenze vengono quantizzati in modo più fine rispetto agli altri, poiché maggiormente rilevanti ai fini della qualità del segnale video. Inoltre, la più grossolana quantizzazione applicata ai coefficienti alle alte frequenze, renderà ancor maggiore il numero di essi con valori prossimi allo zero e pertanto ininfluenti alla determinazione del bitrate complessivo.
#'''Codifica differenziale del coefficiente DC''' ([[Pulse-Code Modulation#Pulse Code Modulation|DPCM]]): il coefficiente DC è rappresentato in modo differenziale rispetto al blocco precedente.
#'''Zig-zag scan''': i coefficienti DCT quantizzati vengono rappresentati in successione, per frequenze crescenti.
#'''[[Run-length encoding]]''': la sequenza di coefficienti DCT quantizzati, essendo tipicamente composta da un considerevole numero di zeri, viene rappresentata come successione di coppie di valori (x,y), dove x rappresenta il valore del coefficiente non nullo ed y il numero di zeri che lo precedono. L'ultima sequenza di zeri viene rappresentata con un codice ad hoc definito EOB (''End Of Block'').
#'''[[Codificazione entropica|Codifica entropica]]''': ciascuna coppia di valori (x,y) determinata al precedente punto viene rappresentata con un'opportuna sequenza di bit, derivante da una tabella di valori standardizzati ed ottenuti con un approccio basato su [[codifica di Huffman]].
 
===Compressione dei frame P e B===
La compressione di un frame P si ottiene da una predizione dello stesso, realizzata a partire da un frame temporalmente precedente nel medesimo GOP. La predizione viene calcolata stimando e compensando lo spostamento di ciascun macroblocco del frame di riferimento (rispetto al frame da comprimere) in una finestra di ± 15 pixel (in orizzontale e verticale). In questo modo, la predizione si ottiene traslando ed integrando i macroblocchi dell'immagine di riferimento. Successivamente, il frame da comprimere viene confrontato (mediante sottrazione) con il frame predetto ottenendo l'immagine differenza, la quale viene compressa mediante tecniche ''intra-frame''.
Nel caso di frame B, la procedura è analoga, ma la predizione è ottenuta combinado due predizioni, derivanti rispettivamente da un frame precedente e da uno successivo del GOP.
 
== Bibliografia ==
* {{cita libro|lingua=en|autore=Joan L. Mitchell|autore2=William B. Pennebaker|autore3=Chad E. Fogg|autore4=Didier J. LeGall|titolo=MPEG video compression standard|url=https://archive.org/details/mpegvideocompres0000unse|città=New York|editore=Chapman & Hall|anno=1997|ISBN=0-412-08771-5}}
 
== Voci correlate ==
* [[da:MPEG-12]]
* [[de:MPEG-14]]
* [[en:MPEG-17]]
* [[es:MPEG-121]]
* [[MP3]]
 
== Altri progetti ==
{{interprogetto|s=Codifica numerica del segnale audio/Capitolo 7#7_2_4}}
 
== Collegamenti esterni ==
* {{FOLDOC}}
*[http://www.chiariglione.org/mpeg/standards/mpeg-1/mpeg-1.htm ISO/IEC JTC1/SC29/WG11]
* {{cita web|lingua=en|url=https://mpeg.chiariglione.org/standards/mpeg-1|titolo=MPEG-1|sito=MPEG}}
 
{{Norme IEC}}
{{Formati di compressione}}
{{portale|informatica}}
 
[[Categoria:Codec video]]
[[Categoria:Codec audio]]
[[Categoria:Compressione dei dati]]
 
[[caCategoria:MPEG-1]]
[[Categoria:Standard ISO/IEC|11172]]
[[da:MPEG-1]]
[[de:MPEG-1]]
[[en:MPEG-1]]
[[es:MPEG-1]]
[[et:MPEG-1]]
[[fi:MPEG-1]]
[[fr:MPEG-1]]
[[ja:MPEG-1]]
[[pl:MPEG-1]]
[[ru:MPEG-1]]
[[sv:MPEG-1]]
[[tr:MPEG-1]]
[[zh:MPEG-1]]