UTF-8: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
ZeroBot (discussione | contributi)
m Bot: Sostituzione automatica fix un altro/un'altra
ZeroBot (discussione | contributi)
m Bot: Sostituzione automatica fix vari
Riga 12:
Brevemente, i bit che compongono un carattere Unicode vengono suddivisi in gruppi, che vengono poi ripartiti tra i bit meno significativi all'interno dei byte che formano la codifica UTF-8 del carattere.
 
I caratteri il cui valore unicode e'è inferiore a U+0080 vengono rappresentati con un singolo byte contenente il loro valore; essi corrispondono esattamente ai 128 caratteri ASCII.
 
In tutti gli altri casi sono necessari fino a 4 byte, ognuno di questi con il bit più significativo impostato a 1, in modo da distinguerli dalla rappresentazione dei caratteri dell'alfabeto ASCII a 7 bit, in particolare quelli il cui codice unicode è inferiore a U+0020, tradizionalmente utilizzati come caratteri di controllo.