Versione delle 00:03, 8 lug 2020 modifica Z-angel (discussione \| contributi) 178 modifiche m Annullata la modifica 113044631 di 2001:B07:5D38:4036:546C:C715:A8F5:85ED (discussione) Etichetta: Annulla ← Differenza precedente		Versione delle 14:10, 4 ott 2021 modifica annulla 128.116.176.73 (discussione) →Svantaggi Etichetta: Modifica visuale Differenza successiva →
Riga 101: == Svantaggi == * UTF-8 usa sequenze di lunghezza variabile, cioè singoli caratteri ~~differenti~~possono ~~vengono~~venire rappresentati con sequenze di byte di lunghezze diverse. La gravità del problema tuttavia potrebbe essere limitata creando un'interfaccia astratta che lavori con le stringhe UTF-8, e rendendola completamente trasparente all'utente. Inoltre anche UTF-16 usa sequenze di lunghezza variabile, anche se molti non lo sanno (o non sono interessati ai caratteri al di fuori del ''Basic Multilingual Plane''). * Gli ideogrammi vengono rappresentati in UTF-8 con tre byte, mentre ne richiedono solo due in UTF-16. Di conseguenza i testi in [[Lingua cinese\|Cinese]] / [[Lingua giapponese\|Giapponese]] / [[Lingua coreana\|Coreano]], oltre ad alcuni gruppi di caratteri Unicode meno noti, occupano più spazio ~~quando~~rispetto ~~vengono~~alla ~~codificati~~codifica ~~con~~in UTF-816.▼ * Un ''decoder'' mal programmato (e non conforme alle ultime versioni dello standard) potrebbe accettare diverse pseudo-codifiche UTF-8 e convertirle nello stesso carattere Unicode, scavalcando in questo modo eventuali controlli di sicurezza progettati per lavorare su rappresentazioni dei dati a 8 bit. ▲* Gli ideogrammi vengono rappresentati in UTF-8 con tre byte, mentre ne richiedono solo due in UTF-16. Di conseguenza i testi in [[Lingua cinese\|Cinese]] / [[Lingua giapponese\|Giapponese]] / [[Lingua coreana\|Coreano]], oltre ad alcuni gruppi di caratteri Unicode meno noti, occupano più spazio quando vengono codificati con UTF-8. == Note ==

UTF-8: differenze tra le versioni