ASCII: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m Annullate le modifiche di 37.156.168.226 (discussione), riportata alla versione precedente di Mtarch11
Etichetta: Rollback
Riga 16:
Lo standard successore di ASCII è l'[[UTF-8]], che è diventato la codifica principale di [[Unicode]] per internet secondo il [[W3C]], che pur non impedendo altre codifiche (purché correttamente dichiarate), lo consiglia e lo usa quasi sistematicamente negli esempi del suo sito<ref>{{Cita web|url = https://www.w3.org/International/O-charset.en.php|titolo = Character encodings|sito = W3C|accesso = 22 giugno 2015|lingua = en}}</ref>, fornendo anche le istruzioni per convertire i documenti (cosa che non fornisce per tutte le codifiche)<ref>{{Cita web|url = https://www.w3.org/International/questions/qa-changing-encoding|titolo = Changing an HTML page encoding to UTF-8|sito = W3C|accesso = 22 giugno 2015|lingua = en}}</ref>. Questa codifica di [[Unicode]], che ormai è universalmente accettata da ogni nuovo programma, offre caratteristiche interessanti grazie al fatto di sfruttare il bit di controllo del vecchio ASCII in modo più efficiente. Se da una parte lo prepara per la pensione, UTF-8 in un certo senso ha reso molto più longevo l'ASCII, inglobandolo in una codifica più adatta alle esigenze attuali. Infatti le comunicazioni sono in centinaia di lingue, ed inoltre diverse lingue possono convivere in uno stesso documento, o in uno stesso programma: si pensi ai [[software]] di [[messaggistica istantanea]] che possono contenere contatti da varie parti del mondo dei quali visualizzare correttamente i nomi.
 
UTF-8 infatti si distingue dalle altre codifiche Unicode perché sfrutta il vecchio bit di parità di ASCII, non come bit di controllo, bensì come indicatore: analizza ogni byte, e se al posto del vecchio bit di parità c'è 0, allora il byte sarà letto come ASCII a 7 bit e teoricamente compatibile anche dacon programmi obsoleti; se però il byte corrente inizia con 1, allora sarà concatenato al byte successivo (o ai successivi, in realtà il meccanismo è un poco più complesso). In tal modo riesce ad includere tutti gli alfabeti delle lingue viventi, di alcune morte e potenzialmente può essere esteso per rappresentarne ancora altri (infatti spesso viene aggiornato).
 
Il vantaggio è che è possibile scrivere un testo in Italiano ed usare un numero di byte di poco maggiore rispetto ad una codifica di ASCII esteso (solo le lettere accentate occuperanno 4 byte); un testo in lingua Cinese avrà ogni carattere di tre byte, con numeri, lettere, punteggiatura ed altri eventuali caratteri ASCII presenti nel testo di un solo byte.