UTF-8: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
→Collegamenti esterni: Aggiunto il template "FOLDOC" |
mNessun oggetto della modifica |
||
(Una versione intermedia di un altro utente non mostrate) | |||
Riga 1:
{{Tabella Unicode}}▼
'''UTF-8''' (Unicode Transformation Format, 8 bit) è una [[codifica di caratteri]] [[Unicode]] in sequenze di lunghezza variabile di byte, creata da [[Rob Pike]] e [[Ken Thompson]]. UTF-8 usa gruppi di byte per rappresentare i caratteri [[Unicode]], ed è particolarmente utile per il trasferimento tramite sistemi di [[posta elettronica]] a 8-[[Bit (informatica)|bit]].
Line 19 ⟶ 18:
I caratteri il cui valore unicode è inferiore a U+0080 vengono rappresentati con un singolo byte contenente il loro valore; essi corrispondono esattamente ai 128 caratteri ASCII. In tutti gli altri casi sono necessari fino a 4 byte, ognuno di questi con il bit più significativo impostato a 1, in modo da distinguerli dalla rappresentazione dei caratteri dell'alfabeto ASCII a 7 bit, in particolare quelli il cui codice unicode è inferiore a U+0020, tradizionalmente utilizzati come caratteri di controllo.
{| class="wikitable"
|-
|-
|0x000000-0x00007F
Line 46 ⟶ 44:
|Confronto tra UTF-16 e UTF-8: UTF-16 richiede l'uso di coppie surrogate: viene sottratto il valore esadecimale 0x10000, in modo che la sequenza dei bit non coincida con quella usata da UTF-8
|}
Per esempio, il carattere [[aleph|alef]] (א), corrispondente all'Unicode U+05D0, viene rappresentato in UTF-8 con questo procedimento:
Line 117 ⟶ 114:
* [[UTF-32]]
* [[UTF-7]]
== Altri progetti ==
{{interprogetto}}
== Collegamenti esterni ==
Riga 127:
* {{cita web|http://www.utf-8.com/|UTF-8}}
▲{{Tabella Unicode}}
{{portale|informatica}}
|