UTF-8: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m robot Aggiungo: lv |
m SunBot: Cambio (-[[Linguaggio C +[[C (linguaggio)) |
||
Riga 92:
* Una sequenza di byte che codifica un carattere non può apparire come parte di una sequenza più lunga che codifica un altro carattere, come succedeva per codifiche a lunghezza variabile meno recenti (vedi la sezione precedente).
* Il primo byte di una sequenza è sufficiente a determinarne la lunghezza (è sufficiente contare il numero di bit più significativi con valore uno). Questo rende molto semplice estrarre una sotto-stringa da una stringa più lunga, senza bisogno di decodificare la sequenza di byte UTF-8
* La maggioranza del [[software]] esistente (inclusi i [[Sistema_operativo|sistemi operativi]]) è stata scritta senza tener conto di Unicode, e l'uso di Unicode creerebbe problemi di compatibilità. Per esempio la libreria standard del [[
* UTF-8 è la codifica predefinita per il formato [[XML]].
|