Versione delle 20:38, 3 mag 2007 modifica ZeroBot (discussione \| contributi) 506 141 modifiche m Bot: Sostituzione automatica fix un altro/un'altra ← Differenza precedente		Versione delle 17:38, 8 mag 2007 modifica annulla ZeroBot (discussione \| contributi) 506 141 modifiche m Bot: Sostituzione automatica fix vari Differenza successiva →
Riga 12: Brevemente, i bit che compongono un carattere Unicode vengono suddivisi in gruppi, che vengono poi ripartiti tra i bit meno significativi all'interno dei byte che formano la codifica UTF-8 del carattere. I caratteri il cui valore unicode e'è inferiore a U+0080 vengono rappresentati con un singolo byte contenente il loro valore; essi corrispondono esattamente ai 128 caratteri ASCII. In tutti gli altri casi sono necessari fino a 4 byte, ognuno di questi con il bit più significativo impostato a 1, in modo da distinguerli dalla rappresentazione dei caratteri dell'alfabeto ASCII a 7 bit, in particolare quelli il cui codice unicode è inferiore a U+0020, tradizionalmente utilizzati come caratteri di controllo.

UTF-8: differenze tra le versioni