UTF-8: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Omega Bot (discussione | contributi)
m Bot: orfanizzo template:Avvisounicode come da discussione
LauBot (discussione | contributi)
m Bot: passaggio degli url da HTTP a HTTPS
Riga 60:
 
== UTF-8 Modificato ==
Il [[linguaggio di programmazione Java]], che usa UTF-16 come rappresentazione interna dei caratteri, usa per la loro serializzazione su file una variazione non standard di UTF-8<ref>{{cita web|url=httphttps://download.oracle.com/javase/6/docs/api/java/io/DataInput.html#modified-utf-8|titolo=Documentazione della classe <code>java.io.DataInput</code>, sezione "Modified UTF-8"|accesso=4 maggio 2011}}</ref>.
 
Ci sono due differenze tra la codifica UTF-8 standard e quella modificata. La prima differenza è che il carattere nullo (U+0000) viene rappresentato con due byte anziché uno, nello specifico come 11000000 10000000 (0xC0 0x80). In questo modo ci si assicura che nessuna stringa codificata venga troncata prematuramente perché contenente il byte ''null'' (0x00), interpretato da alcuni linguaggi di programmazione (ad esempio il [[Linguaggio C|C]]) come terminatore della stringa.
Riga 120:
 
== Collegamenti esterni ==
* {{cita web|httphttps://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt|Rob Pike racconta la creazione di UTF-8}}
* {{cita web |1=http://www.cs.bell-labs.com/sys/doc/utf.pdf |2=L'articolo originale su UTF-8 |accesso=2 dicembre 2004 |urlarchivio=https://web.archive.org/web/20050505032430/http://www.cs.bell-labs.com/sys/doc/utf.pdf# |dataarchivio=5 maggio 2005 |urlmorto=sì }}
* RFC 3629, Lo standard UTF-8