UTF-8: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m Annullate le modifiche di 78.15.153.104 (discussione), riportata alla versione precedente di 79.22.249.43
Descrizione tecnica: tabella più chiara
Riga 21:
 
<small>
{| class="wikitable"
{| border=1
|-
|Intervallo Unicode<br />[[esadecimale]]
Riga 28:
|Note
|-
|0x000000 - 0x00007F
|00000000 0xxxxxxx&nbsp;0XXXXXXX
|0XXXXXXX
|0xxxxxxx
| Caratteri equivalenti al codice ASCII; I byte iniziano con 0 e da soli indicano un carattere
|-
|0x000080 - 0x0007FF
|00000XXX&nbsp;XXXXXXXX
|00000xxx xxxxxxxx
|110XXXXX&nbsp;10XXXXXX
|110xxxxx 10xxxxxx
| rowspan=2 align=top| il primo byte inizia per 110 o 1110, il successivo(i) con 10 e devono essere concatenati per formare un carattere
|-
|0x000800 - 0x00FFFF
|XXXXXXXX&nbsp;XXXXXXXX
|xxxxxxxx xxxxxxxx
|1110XXXX&nbsp;10XXXXXX&nbsp;10XXXXXX
|1110xxxx 10xxxxxx 10xxxxxx
|-
|0x010000 - 0x10FFFF
|110110XX&nbsp;XXXXXXXX<br/>110111XX&nbsp;XXXXXXXX
|110110xx xxxxxxxx <br />110111xx xxxxxxxx
|11110XXX&nbsp;10XXXXXX&nbsp;10XXXXXX&nbsp;10XXXXXX
|11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
|Confronto tra UTF-16 e UTF-8: UTF-16 richiede l'uso di coppie surrogate: viene sottratto il valore esadecimale 0x10000, in modo che la sequenza dei bit non coincida con quella usata da UTF-8
|}