Versione delle 14:47, 17 mar 2018 modifica LittleWhites (discussione \| contributi) Rollbacker 70 376 modifiche Annullata la modifica 95444972 di 151.38.101.214 (discussione) Etichetta: Annulla ← Differenza precedente		Versione delle 13:33, 4 set 2018 modifica annulla Lucarosty (discussione \| contributi) Amministratori 121 116 modifiche m Errori di Lint: Tag annidati male Differenza successiva →
Riga 20: I caratteri il cui valore unicode è inferiore a U+0080 vengono rappresentati con un singolo byte contenente il loro valore; essi corrispondono esattamente ai 128 caratteri ASCII. In tutti gli altri casi sono necessari fino a 4 byte, ognuno di questi con il bit più significativo impostato a 1, in modo da distinguerli dalla rappresentazione dei caratteri dell'alfabeto ASCII a 7 bit, in particolare quelli il cui codice unicode è inferiore a U+0020, tradizionalmente utilizzati come caratteri di controllo. <div style="font-size: smaller"> ~~<small>~~ {\| class="wikitable" \|- Riga 47: \|Confronto tra UTF-16 e UTF-8: UTF-16 richiede l'uso di coppie surrogate: viene sottratto il valore esadecimale 0x10000, in modo che la sequenza dei bit non coincida con quella usata da UTF-8 \|} </~~small~~div> Per esempio, il carattere [[aleph\|alef]] (א), corrispondente all'Unicode U+05D0, viene rappresentato in UTF-8 con questo procedimento:

UTF-8: differenze tra le versioni