ASCII esteso: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m corretto "rilasciato"
 
(38 versioni intermedie di 31 utenti non mostrate)
Riga 1:
{{F|informatica|febbraio 2014}}
Il termine '''ASCII esteso''' (in inglese '{{Inglese|'''extended ASCII''''}} o '''''high ASCII''''') designa una codifica a [[8 bit]] o più, in grado di rappresentare molti altri caratteri oltre ai tradizionali 128 dell'[[ASCII]] a 7 bit. L'utilizzo di questo termine è stato spesso criticato in quando potrebbe lasciar intendere (erroneamente) che l'ASCII originario sia stato aggiornato o che si tratti della stessa codifica.
 
L'utilizzo di questo termine è stato spesso criticato in quanto potrebbe lasciar intendere (erroneamente) che l'[[ASCII]] sia stato aggiornato o che si tratti della stessa codifica.
==Ragioni per l'espansione==
 
== Storia ==
{{Vedi anche|Unicode}}
Una nuova codifica chiamata [[Unicode]] fu sviluppata nel [[1991]] per poter codificare più caratteri in modo standard e permettere di utilizzare più set di caratteri estesi (es. greco e cirillico) in un unico documento; questo set di caratteri è oggi largamente diffuso.
 
Una nuova codifica chiamata [[Unicode]] fu sviluppata nel [[1991]] per poter codificare più caratteri in modo standard e permettere di utilizzare più set di caratteri estesi (es. greco e cirillico) in un unico documento; questo set di caratteri è oggi largamente diffuso. Inizialmente prevedeva 65.536 caratteri (''code points'') ed è stato in seguito esteso a 1.114.112 (= 2<sup>20</sup> + 2<sup>16</sup>) e finora ne sono stati assegnati circa 101.000. I primi 256 ''code pointspoint'' ricalcano esattamente quelli dell'[[ISO- 8859|ISO- 8859-1]]. La maggior parte dei codici sono usati per codificare lingue come il [[Lingua cinese|cinese]], il [[Lingua giapponese|giapponese]] ed il [[Lingua coreana|coreano]].
 
== I motivi alla base ==
Poiché il numero dei simboli usati nelle lingue naturali è di molto più grande dei caratteri codificabili col vecchio [[ASCII]] è stato necessario espanderne il set di codifica. Negli anni nei paesi che non utilizzano l'[[alfabeto latino]] (o comunque caratteri non presenti nel set ASCII), come i paesi dell'estremo oriente o nel mondo slavo, sono nati metodi di codifica per i caratteri non-standard afflitti però da seri problemi di compatibilità verso gli altri set.
 
Poiché la codifica ASCII utilizza 7 [[Bit (informatica)|bit]] molti dei set di estensione usavano i 128 caratteri aggiuntivi codificabili usando l'ottavo bit disponibile in ogni [[byte]].
 
==Estensioni proprietarie==
Varie estensioni proprietarie nacquero sui [[mainframe]] non-[[EBCDIC]] mainframe e sui mini-computer, specialmente nelle università. La [[Commodore]] ad esempio aggiunse molti simboli non-ASCII alla sua codifica denominata [[PETSCII]], basata sullo standard originario del [[1963]]. L'[[IBM]] introdusse una codifica a 8 bit sui suoi [[IBM PC]] con varianti per i diversi paesi. L'[[IBM]] produsse codifiche ASCII-compatibili, poiché i primi 128 caratteri del set mantenevano il valore originario ([[ASCII|US-ASCII]]), le varie codifiche vennero divise in ''pagine'' (code page).
 
==ISO 8859 e adattamenti proprietari==
FinalmenteIn seguito al proliferare di codifiche proprietarie, l'[[International Organization for Standardization|ISO]] rilasciòpubblicò uno standard denominato [[ISO 8859]] contenente un'estensione a 8 bit del set ASCII. Il più importante fu l{{'}}''[[ISO 8859-1]]'', chiamatodetto anche ''ISO Latin1'', contenente i caratteri per i linguaggi dell'[[Europa Occidentale]].
Furono standardizzate codifiche per gli altri linguaggi: [[ISO 8859-2]] per i linguaggi dell'Europa Orientale, [[ISO 8859-5]] per i [[Alfabeto cirillico|caratteri cirillici]] e molti altri.
La particolarità dell'ISO 8859 rispetto agli altri caratteri estesi è che i caratteri dal 128 al 159, che corrispondono ai caratteri di controllo del vecchio ASCII, non sono usati per non creare problemi di compatibilità.
La [[Microsoft]] successivamente creò la [[code page 1252]], un set compatibile con l'ISO 8859-1 molto più esteso, che divenne lo standard per le versioni europee di [[Microsoft Windows|Windows]].
 
LaUna particolarità dell'ISO 8859 rispetto agli altri caratteri estesi è che i caratteri dal 128 al 159, chei cui 7 bit più bassi corrispondono ai caratteri di controllo del vecchio ASCII, non sono usati per non creare problemi di compatibilità. [[Microsoft]] successivamente creò la [[Windows-1252|code page 1252]], un set compatibile con l'ISO 8859-1 che riempie anche questi 32 caratteri, che divenne lo standard per le versioni europee di [[Microsoft Windows|Windows]].
==Unicode==
Una nuova codifica chiamata [[Unicode]] fu sviluppata nel [[1991]] per poter codificare più caratteri in modo standard e permettere di utilizzare più set di caratteri estesi (es. greco e cirillico) in un unico documento; questo set di caratteri è oggi largamente diffuso. Inizialmente prevedeva 65.536 caratteri (''code points'') ed è stato in seguito esteso a 1.114.112 (= 2<sup>20</sup> + 2<sup>16</sup>) e finora ne sono stati assegnati circa 101.000. I primi 256 code points ricalcano esattamente quelli dell'[[ISO-8859|ISO-8859-1]]. La maggior parte dei codici sono usati per codificare lingue come il [[Lingua cinese|cinese]], il [[Lingua giapponese|giapponese]] ed il [[Lingua coreana|coreano]].
 
== Voci correlate ==
* [[ja:拡張ASCII]]
* [[Stanford Extended ASCII]]
==* [[Unicode==]]
 
== Altri progetti ==
[[Categoria:Repertori di caratteri]]
{{interprogetto|preposizione=sull'}}
[[Categoria:Acronimi]]
 
== Collegamenti esterni ==
[[es:ASCII extendido]]
* {{Collegamenti esterni}}
[[ja:拡張ASCII]]
 
[[ru:Октеты со старшим битом 1]]
{{portale|informatica}}
[[sv:Utökad ASCII]]
 
[[zh:EASCII]]
[[Categoria:Repertori di caratteri]]
[[Categoria:AcronimiASCII]]