Unicode: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m wikilink
 
(296 versioni intermedie di oltre 100 utenti non mostrate)
Riga 1:
[[File:New Unicode logo.svg|miniatura|Logo dell'[[Unicode Consortium]]]]
{{nota disambigua|informazioni sulla gestione dei caratteri Unicode in [[Wikipedia]]|la [[Aiuto:Unicode|relativa pagina di aiuto]]}}
'''Unicode''' è un sistema di [[codifica]] che assegna un [[numero]] univoco ad ogni [[Grafema|carattere]] usato per la scrittura di testi, in maniera indipendente dalla [[Lingua (linguistica)|lingua]], dalla [[piattaforma (informatica)|piattaforma informatica]] e dal [[Programma (informatica)|programma]] utilizzato.
 
È stato compilato e viene aggiornato e pubblicizzato dallo ''Unicode Consortium''<ref>{{en}} [https://www.unicode.org/consortium/consort.html Pagina ufficiale di Unicode Consortium]</ref>, un consorzio internazionale di aziende interessate alla interoperabilità nel trattamento informatico dei testi in lingue diverse.
{{Tabella Unicode}}
 
== Storia==
'''Unicode''' è un sistema di codifica che assegna un numero (o meglio, una combinazione di [[bit]]) a ogni carattere in maniera indipendente dal [[Programma (informatica)|programma]], piattaforma e dalla [[Lingua_(idioma)|lingua]] (e dal suo [[sistema di scrittura]]).
Unicode è stato creato per risolvere i limiti dei tradizionali schemi di codifica dei caratteri. Ad esempio, sebbene i caratteri definiti nella ISO 8859-1 siano ampiamente utilizzati in paesi diversi, spesso si verificano incompatibilità tra paesi diversi. Molti metodi di codifica tradizionali hanno un problema comune, ovvero consentono ai computer di gestire un ambiente bilingue (di solito utilizzando lettere latine e le loro lingue native), ma non possono supportare un ambiente multilingue allo stesso tempo (riferendosi a una situazione in cui più lingue possono essere mescolate contemporaneamente).
 
La codifica Unicode contiene caratteri con stili di scrittura diversi, come " ɑ / a ", "强 / 强", "casa / famiglia / 戸". Tuttavia, c'è stata una controversia sull'identificazione del polimorfismo nei caratteri cinesi. Per i dettagli si vedano gli ideogrammi unificati di [[Cina]], [[Giappone]] e [[Corea]].
Unicode si basa sulla codifica [[ISO 8859|ISO/IEC 8859-1]] (o ''ISO Latin-1'', nota anche col nomignolo ''ASCII esteso'', che indica però molte altre codifiche a 8 bit basate sul vecchio standard [[ASCII]]), che consentiva la rappresentazione di 256 caratteri ed era sufficiente per gli alfabeti dell'Europa Occidentale e del Nord America.<br />Unicode va molto oltre, codificando i caratteri usati in quasi tutte le lingue vive e in alcune lingue morte, nonché simboli matematici e chimici, cartografici, l'alfabeto Braille, ideogrammi etc. L'ASCII, l'ISO/IEC 8859-1, e tutti gli altre codifiche precedentemente in uso, non possedevano un numero di caratteri sufficienti per tutte le lingue e per le necessità di comunicazione in qualsiasi ambito disciplinare.<br /> Per ciascuna esigenza, era necessario utilizzare una codifica apposita, molto spesso proprietaria.
 
In termini di elaborazione testi, Unicode definisce un codice univoco (cioè un numero intero) per ogni carattere anziché un glifo. In altre parole, Unicode elabora i caratteri in modo astratto (cioè i numeri) e lascia il lavoro di deduzione visiva (come dimensione del carattere, forma dell'aspetto, forma del carattere, stile, ecc.) ad altri software, come la navigazione web o l'elaboratore di testi.
Attualmente lo standard Unicode non rappresenta ancora tutti i caratteri in uso nel mondo; essendo ancora in evoluzione, però, forse in futuro arriverà a coprire tutti i caratteri rappresentabili.
 
Al momento, quasi tutti i sistemi informatici supportano l'alfabeto latino di base e ciascuno supporta diversi altri metodi di codifica. Per essere compatibili con loro, i primi 256 caratteri di Unicode sono riservati ai caratteri definiti da ISO 8859-1, in modo che la conversione delle lingue esistenti dell'Europa occidentale non richieda una considerazione speciale; e un gran numero degli stessi caratteri viene ripetuto in diversi. Nel codice carattere, il vecchio complicato metodo di codifica può essere convertito direttamente tra la codifica Unicode senza perdere alcuna informazione. Ad esempio, la sezione del formato full-form contiene il formato full-form delle principali lettere latine. Nei glifi cinesi, giapponesi e coreani, questi caratteri sono presentati in full-form invece che nella comune forma half-form, che ha un effetto importante sul testo verticale e sul testo a spaziatura fissa.
 
Quando si rappresenta un carattere Unicode, di solito è rappresentato da "U +" seguito da un insieme di cifre esadecimali. Nel piano multilingue di base: (piano multilingue di base in inglese tutti i caratteri. BMP abbreviato noto anche come "piano zero", piano 0) all'interno, si utilizzano quattro cifre (ovvero 2 byte, per un totale di 16 bit, Come U + 4AE0, che supporta un totale di oltre {{formatnum:60000}} caratteri); per i caratteri al di fuori del piano zero si devono utilizzare cinque o sei cifre. La vecchia versione dello standard Unicode utilizza metodi di marcatura simili, ma con alcune piccole differenze: in Unicode 3.0, "U-" viene utilizzato seguito da otto cifre e "U +" deve essere seguito da quattro cifre.
__TOC__
Unicode era stato originariamente pensato come una codifica a 16 bit che dava la possibilità di codificare al più 65.536 caratteri, e tanto si riteneva essere sufficiente per rappresentare i caratteri impiegati in tutte le lingue scritte del mondo. Ora invece lo standard Unicode (e l'[[ISO 10646|ISO/IEC 10646]], che con Unicode condivide il repertorio di caratteri) supporta un repertorio di codici numerici che possono rappresentare circa un milione di caratteri. Ciò appare sufficiente a coprire anche i fabbisogni di codifica di scritti del patrimonio storico dell'umanità, nelle diverse lingue e negli svariati sistemi di segni utilizzati. Concretamente, questo repertorio di codici numerici è [[Serializzazione|serializzato]] mediante diversi schemi, che prevedono l'uso di unità da [[UTF-8|8]] bit (''[[byte]]''), [[UTF-16|16]] bit (''[[word]]'') e [[UTF-32|32]] bit (''[[double word]]'').
 
== Struttura del codice ==
L'Unicode viene supportato dai moderni standard della [[programmazione]] e del [[markup]] come [[XML]], [[Linguaggio di programmazione Java|Java]], [[JavaScript]], [[Lightweight Directory Access Protocol|LDAP]], [[CORBA]] 3.0, e da vari sistemi operativi.
Unicode era stato originariamente pensato come una codifica a 16 bit (quattro cifre esadecimali) che dava la possibilità di codificare 65.535 (2<sup>16</sup> − 1) caratteri. Tanto si riteneva essere sufficiente per rappresentare i caratteri impiegati in tutte le lingue scritte del mondo.
Ora invece lo standard Unicode, che tendenzialmente è perfettamente allineato con la norma [[ISO 10646|ISO/IEC 10646]], prevede una codifica fino a 21 bit e supporta un repertorio di codici numerici che possono rappresentare circa un milione di caratteri.
Ciò appare sufficiente a coprire anche i fabbisogni di codifica di scritti del patrimonio storico dell'umanità, nelle diverse lingue e negli svariati sistemi di segni utilizzati.
 
Al 2009, solo una piccolissima parte di questa disponibilità di codici è assegnata. Per lo sviluppo dei codici sono infatti previsti 17 "piani" ("planes", in inglese), da 00 a 10<small>[[esadecimale|hex]]</small>, ciascuno con 65.536 posizioni (quattro cifre esadecimali), ma solo i primi tre e gli ultimi tre piani sono ad oggi assegnati<ref>Piani assegnati (2009):<br />1 '''00-BMP''' Piano di base Multilinguistico<br />2 '''01-SMP''' piano supplementare multilinguistico<br />3 '''02-SIP''' piano supplementare ideografico<br />15 '''0E-SSP''' piano supplementare per scopi speciali<br />16 '''0F-PUA''' riservato ad aree di uso privato<br />17 '''10-PUA''' riservato ad aree di uso privato</ref>, e di questi il primo, detto anche BMP, è praticamente sufficiente a coprire tutte le lingue più usate.
== Sistemi di scrittura rappresentati ==
 
Concretamente, questo repertorio di codici numerici è [[Serializzazione|serializzato]] mediante diversi schemi di ricodifica, che consentono l'uso di codici più compatti per i caratteri usati più di frequente. È previsto l'uso di codifiche con unità da 8 bit (''[[byte]]''), 16 bit (''[[word]]'') e 32 bit (''[[double word]]''), descritte rispettivamente come [[UTF-8]], [[UTF-16]] e [[UTF-32]].
Unicode comprende quasi tutti i sistemi di scrittura attualmente utilizzati, fra i quali:
 
{| class="wikitable"
! Piano !! Intervallo !! Descrizione !! Abbreviazione
|-
| 0 ||000000-00FFFF
|| '''Basic Multilingual Plane'''
|align="center"|BMP
|-
| 1 ||010000-01FFFF
|| '''Supplementary Multilingual Plane'''
|align="center"|SMP
|-
| 2 ||020000-02FFFF
|| '''Supplementary Ideographic Plane'''
|align="center"|SIP
|-
| 3 ||030000-03FFFF
|| Designato preliminarmente come '''Tertiary Ideographic Plane''' (TIP), ma nessun carattere gli è stato assegnato al momento<ref>{{Cita web|url=https://www.unicode.org/roadmaps/tip/|titolo=Roadmap to the TIP|sito=www.unicode.org|accesso=2022-09-13}}</ref>.
|align="center"|TIP
|-
| 4-13 ||040000-0DFFFF
|align="center"| ''Attualmente non assegnati''
|align="center"|
|-
| 14 ||0E0000-0EFFFF
||'''Supplementary Special-purpose Plane'''
|align="center"|SSP
|-
| 15 ||0F0000-0FFFFF
||'''Supplementary Private Use Area-A'''
|align="center"|
|-
| 16 ||100000-10FFFF
||'''Supplementary Private Use Area-B'''
|align="center"|
|}
 
=== Basic Multilingual Plane (BMP) ===
{| width="96%"
Il piano 0, il ''Basic Multilingual Plane'' (lett. "Piano multilinguistico di base") o BMP, è quello in cui sono stati assegnati la maggior parte dei caratteri. Il BMP contiene caratteri per quasi tutti i moderni linguaggi e un grande numero di caratteri speciali. La maggioranza dei codici assegnati ai caratteri nel BMP sono stati usati per codificare quelli cinesi, giapponesi e coreani ([[Caratteri CJK|CJK]]).
|-----
<!-- TABELLA DA AGGIORNARE
|
{| class="wikitable"
* [[Alfabeto Arabo]]
! Intervallo !! Descrizione
* [[Alfabeto Armeno]]
|-
* [[Alfabeto Bengali]]
|0000-007F||C0 Controls and Basic Latin
* [[Alfabeto Braille|Alfabeto Braille]]
|-
* [[Alfabeto Sillabico Aborigeno Canadese]]
|0080-00FF||C1 Controls and Latin-1 Supplement
* [[Alfabeto Sillabico Cherokee]]
|-
* [[Alfabeto Copto]]
|0100-017F||Latin Extended-A
* [[Alfabeto Cirillico]]
|-
* [[Alfabeto Devanagari]]
|0180-024F||Latin Extended-B
* [[Alfabeto Etiopico]]
|-
* [[Alfabeto Georgiano]]
|0250-02AF||IPA Extensions
* [[Alfabeto Greco]]
|-
* [[Alfabeto Gujarati]]
|02B0-02FF||Spacing Modifier Letters
|
|-
* [[Alfabeto Gurmukhi]] ([[Lingua punjabi]])
|0300-036F||Combining Diacritical Marks
* [[Alfabeto Cinese Han]] ([[Ideogrammi Hanzi]] e [[Ideogrammi Hanja]])
|-
* [[Alfabeto Hangul]] ([[Lingua coreana]])
|0370-03FF||Greek and Coptic
* [[Alfabeto Ebraico]]
|-
* [[Alfabeto Hiragana]] e [[Alfabeto Katakana]], [[Ideogrammi Kanji]] ([[Lingua giapponese]])
|0400-04FF||Cyrillic
* [[Alfabeto Fonetico Internazionale]] (IPA)
|-
* [[Alfabeto Khmer]] (Cambogiano)
|0500-052F||Cyrillic Supplement
* [[Alfabeto Kannada]]
|-
* [[Alfabeto Lao]]
|0530-058F||Armenian
* [[Alfabeto Latino]] (base ed esteso)
|-
* [[Alfabeto Limbu]]
|0590-05FF||Hebrew
* [[Alfabeto Malayalam]]
|-
* [[Alfabeto Mongolo]]
|0600-06FF||Arabic
|
|-
* [[Alfabeto Myanmar]] (Burmese)
|0700-074F||Syriac
* [[Alfabeto N'Ko]]
|-
* [[Alfabeto Oriya]]
|0750-077F||Arabic Supplement
* [[Alfabeto Osmanya]]
|-
* [[Alfabeto Sylheti Nagari]]
|0780-07BF||Thaana
* [[Alfabeto Siriaco]]
|-
* [[Alfabeto Tamil]]
|07C0-07FF||N'Ko
* [[Alfabeto Telugu]]
|-
* [[Alfabeto Tailandese]]
|0900-097F||Devanagari
* [[Alfabeto Tibetano]]
|-
* [[Alfabeto Tifinagh]]
|0980-09FF||Bengali
* [[Alfabeto Yi]]
|-
* [[Alfabeto Zhuyin]] (Bopomofo)
|0A00-0A7F||Gurmukhi
|-
|0A80-0AFF||Gujarati
|-
|0B00-0B7F||Oriya
|-
|0B80-0BFF||Tamil
|-
|0C00-0C7F||Telugu
|-
|0C80-0CFF||Kannada
|-
|0D00-0D7F||Malayalam
|-
|0D80-0DFF||Sinhala
|-
|0E00-0E7F||Thai
|-
|0E80-0EFF||Lao
|-
|0F00-0FFF||Tibetan
|-
|1000-109F||Myanmar
|-
|10A0-10FF||Georgian
|-
|1100-11FF||Hangul Jamo
|-
|1200-137F||Ethiopic
|-
|13A0-13FF||Cherokee
|-
|1400-167F||Unified Canadian Aboriginal Syllabics
|-
|1680-169F||Ogham
|-
|16A0-16FF||Runic
|-
|1700-171F||Tagalog
|-
|1720-173F||Hanunoo
|-
|1740-175F||Buhid
|-
|1760-177F||Tagbanwa
|-
|1780-17FF||Khmer
|-
|1800-18AF||Mongolian
|-
|1900-194F||Limbu
|-
|1950-197F||Tai Le
|-
|19E0-19FF||Khmer Symbols
|-
|1D00-1D7F||Phonetic Extensions
|-
|1E00-1EFF||Latin Extended Additional
|-
|1F00-1FFF||Greek Extended
|-
|2000-206F||General Punctuation
|-
|2070-209F||Superscripts and Subscripts
|-
|20A0-20CF||[[Simboli di valuta|Currency Symbols]]
|-
|20D0-20FF||Combining Diacritical Marks for Symbols
|-
|2100-214F||Letterlike Symbols
|-
|2150-218F||Number Forms
|-
|2190-21FF||Arrows
|-
|2200-22FF||Mathematical Operators
|-
|2300-23FF||Miscellaneous Technical
|-
|2400-243F||Control Pictures
|-
|2440-245F||Optical Character Recognition
|-
|2460-24FF||Enclosed Alphanumerics
|-
|2500-257F||Box Drawing
|-
|2580-259F||Block Elements
|-
|25A0-25FF||Geometric Shapes
|-
|2600-26FF||Miscellaneous Symbols
|-
|2700-27BF||Dingbats
|-
|27C0-27EF||Miscellaneous Mathematical Symbols-A
|-
|27F0-27FF||Supplemental Arrows-A
|-
|2800-28FF||Braille Patterns
|-
|2900-297F||Supplemental Arrows-B
|-
|2980-29FF||Miscellaneous Mathematical Symbols-B
|-
|2A00-2AFF||Supplemental Mathematical Operators
|-
|2B00-2BFF||Miscellaneous Symbols and Arrows
|-
|2E80-2EFF||CJK Radicals Supplement
|-
|2F00-2FDF||Kangxi Radicals
|-
|2FF0-2FFF||Ideographic Description Characters
|-
|3000-303F||CJK Symbols and Punctuation
|-
|3040-309F||Hiragana
|-
|30A0-30FF||Katakana
|-
|3100-312F||Bopomofo
|-
|3130-318F||Hangul Compatibility Jamo
|-
|3190-319F||Kanbun
|-
|31A0-31BF||Bopomofo Extended
|-
|31F0-31FF||Katakana Phonetic Extensions
|-
|3200-32FF||Enclosed CJK Letters and Months
|-
|3300-33FF||CJK Compatibility
|-
|3400-4DBF||CJK Unified Ideographs Extension A
|-
|4DC0-4DFF||Yijing Hexagram Symbols
|-
|4E00-9FFF||CJK Unified Ideographs
|-
|A000-A48F||Yi Syllables
|-
|A490-A4CF||Yi Radicals
|-
|AC00-D7AF||Hangul Syllables
|-
|D800-DB7F||High Surrogates
|-
|DB80-DBFF||High Private Use Surrogates
|-
|DC00-DFFF||Low Surrogates
|-
|E000-F8FF||Private Use Area
|-
|F900-FAFF||CJK Compatibility Ideographs
|-
|FB00-FB4F||Alphabetic Presentation Forms
|-
|FB50-FDFF||Arabic Presentation Forms-A
|-
|FE00-FE0F||Variation Selectors
|-
|FE20-FE2F||Combining Half Marks
|-
|FE30-FE4F||CJK Compatibility Forms
|-
|FE50-FE6F||Small Form Variants
|-
|FE70-FEFF||Arabic Presentation Forms-B
|-
|FF00-FFEF||Halfwidth and Fullwidth Forms
|-
|FFF0-FFFF||Specials
|}
-->
 
== Sistemi di scrittura rappresentati ==
In aggiunta a quelli citati, sono disponibili [[glifo|glifi]] appartenenti a molte lingue morte:
Unicode comprende quasi tutti i sistemi di scrittura attualmente utilizzati, fra i quali:
{{div col}}
* [[Alfabeto arabo]]
* [[Alfabeto armeno]]
* [[Alfabeto bengalese]]
* [[Scrittura Braille]]
* [[Sillabario aborigeno canadese]]
* [[Sillabario cherokee]]
* [[Alfabeto copto]]
* [[Alfabeto cirillico]]
* [[Alfabeto devanagari]]
* [[Alfabeto ebraico]]
* [[Alfabeto dell'esperanto]]
* [[Alfabeto geʽez]]
* [[Alfabeti georgiani]]
* [[Alfabeto greco]]
* [[Alfasillabario gujarati]]
* [[Alfabeto gurmukhi]] ([[lingua punjabi]])
* [[Scrittura hanzi]] ([[lingua cinese]])
* [[Alfabeto hangŭl]] e [[scrittura hanja]] ([[lingua coreana]])
* [[Scrittura hiragana]] e [[katakana]] e [[scrittura kanji]] ([[lingua giapponese]])
* [[Alfabeto fonetico internazionale]] (IPA)
* [[Alfabeto khmer]] ([[lingua cambogiana]])
* [[Scrittura kannada]]
* [[Alfabeto lao]]
* [[Alfabeto latino]] (base ed esteso)
* [[Scrittura limbu]]
* [[Alfabeto malayalam]]
* [[Scrittura mongola]]
* [[Alfabeto birmano]]
* [[Alfabeto N'Ko]]
* [[Scrittura odia]]
* [[Ol Chiki]]
* [[Alfabeto osmanya]]
* [[Scrittura sylheti]]
* [[Alfabeto siriaco]]
* [[Scrittura tamil]]
* [[Scrittura telugu]]
* [[Alfabeto tailandese]]
* [[Alfabeto tibetano]]
* [[Scrittura tifinagh]]
* [[Sillabario yi]]
* [[Alfabeto bopomofo]]
{{div col end}}
 
In aggiunta a quelli citati, sono disponibili [[glifo|glifi]] appartenenti a sistemi di scrittura più particolari, come quelli delle [[Lingua estinta|lingue estinte]]:
{| width="96%"
|-----
|
* [[Alfabeto Cuneiforme]]
* [[Alfabeto Deseret]]
* [[Alfabeto Lineare B]]
* [[Alfabeto Kharoshti]]
|
* [[Alfabeto Ogham]]
* [[Alfabeto Antico Italico]] (Etrusco, Osco e Umbro)
* [[Alfabeto Antico Persiano]]
* [[Alfabeto Fenicio]]
|
* [[Alfabeto Runico]]
* [[Alfabeto Shavian]]
* [[Alfabeto Ugaritico]]
|}
 
{{div col}}
Infine, lo Unicode comprende anche molti simboli, come quelli [[matematica|matematici]] e [[Semiografia musicale|musicali]].
* [[Scrittura cuneiforme]]
* [[Alfabeto deseret]]
* [[Scrittura lineare B]]
* [[Scrittura kharoshthi]]
* [[Alfabeto ogamico]]
* [[Alfabeto etrusco]] ([[lingua etrusca]], [[Lingua osca|osca]] e [[Lingua umbra|umbra]])
* [[Scrittura cuneiforme persiana antica]]
* [[Alfabeto fenicio]]
* [[Alfabeto gotico]]
* [[Alfabeto runico]]
* [[Alfabeto shaviano]]
* [[Alfabeto ugaritico]]
{{div col end}}
 
Infine, lo Unicode comprende anche molti simboli, come quelli [[Notazioni matematiche|matematici]] e [[Semiografia musicale|musicali]].
== Versioni Unicode ==
Negli ultimi anni una nuova versione è stata rilasciata praticamente ad ogni inizio anno a seguito di una media di
oltre 1.000 richieste di cambiamenti all'anno.
 
== Cronologia delle versioni ==
*DP 10646 [[1989]] (Proposta di bozza della norma ISO&nbsp;10646, indipendente dall'Unicode)
Negli ultimi anni una nuova versione è stata pubblicata praticamente ogni anno a seguito di una media di oltre 1.000 richieste di cambiamenti all'anno.
*DIS-1 10646 [[1990]] (Prima bozza della norma ISO&nbsp;10646, indipendente dall'Unicode)
*Unicode 1.0.0 Ottobre [[1991]]
*Unicode 1.0.1 Giugno [[1992]] (Modificato per un eventuale allineamento alla norma ISO&nbsp;10646)
*Unicode 1.1.0 Giugno [[1993]] (Unicode e ISO unificate per la prima volta: i due codici sono identici alla norma ISO&nbsp;10646-1: 1993)
*Unicode 1.1.5 Giugno [[1995]]
*Unicode 2.0.0 Luglio [[1996]] (Allineata alla norma ISO&nbsp;10646 estesa)
*Unicode 2.1.2 Maggio [[1998]] (Fra gli altri, introduzione del carattere ''euro'': €)
*Unicode 2.1.5 Agosto [[1998]]
*Unicode 2.1.8 Dicembre [[1998]]
*Unicode 2.1.9 Aprile [[1999]]
*Unicode 3.0.0 Settembre [[1999]] (Allineata alla norma ISO&nbsp;10646-1: 2000)
*Unicode 3.0.1 Agosto[[2000]]
*Unicode 3.1.0 Marzo [[2001]] (Allineata alla norma ISO&nbsp;10646-2: 2001)
*Unicode 3.1.1 Agosto [[2001]]
*Unicode 3.2.0 Marzo [[2002]]
*Unicode 4.0.0 Aprile [[2003]] (Allineata alla norma ISO&nbsp;10646: 2003)
*Unicode 4.0.1 Marzo [[2004]]
*Unicode 4.1.0 Marzo [[2005]]
*Unicode 5.0.0 Luglio [[2006]] oltre 99.000 glifi <ref>Unicode Consortium: ''[http://www.unicode.org/press/pr-ucd5.0.html Unicode Character Database 5.0 Released]'', 18 luglio 2006</ref>
 
* DP 10646 1989 (Proposta di bozza della norma ISO&nbsp;10646, indipendente dall'Unicode)
==Note==
* DIS-1 10646 1990 (Prima bozza della norma ISO&nbsp;10646, indipendente dall'Unicode)
* Unicode 1.0.0 ottobre 1991
* Unicode 1.0.1 giugno 1992 (Modificato per un eventuale allineamento alla norma ISO&nbsp;10646)
* Unicode 1.1.0 giugno 1993 (Unicode e ISO unificate per la prima volta: i due codici sono identici allo standard ISO&nbsp;10646-1: 1993)
* Unicode 1.1.5 giugno 1995
* Unicode 2.0.0 luglio 1996 (Allineata allo standard ISO&nbsp;10646 estesa)
* Unicode 2.1.2 maggio 1998 (Fra gli altri, introduzione del carattere ''euro'': €)
* Unicode 2.1.5 agosto 1998
* Unicode 2.1.8 dicembre 1998
* Unicode 2.1.9 aprile 1999
* [https://www.unicode.org/Public/3.0-Update/UnicodeData-3.0.0.txt Unicode 3.0.0] settembre 1999 (Allineata allo standard ISO&nbsp;10646-1: 2000)
* [https://www.unicode.org/Public/3.0-Update1/UnicodeData-3.0.1.txt Unicode 3.0.1] agosto 2000
* [https://www.unicode.org/Public/3.1-Update/UnicodeData-3.1.0.txt Unicode 3.1.0] marzo 2001 (Allineata allo standard ISO&nbsp;10646-2: 2001)
* [https://www.unicode.org/Public/3.0-Update1/UnicodeData-3.0.1.txt Unicode 3.1.1] agosto 2001
* [https://www.unicode.org/Public/3.2-Update/UnicodeData-3.2.0.txt Unicode 3.2.0] marzo 2002
* [https://www.unicode.org/Public/4.0-Update/UnicodeData-4.0.0.txt Unicode 4.0.0] aprile 2003 (Allineata allo standard ISO&nbsp;10646: 2003)
* [https://www.unicode.org/Public/4.0-Update1/UnicodeData-4.0.1.txt Unicode 4.0.1] marzo 2004
* [https://www.unicode.org/Public/4.1.0/ucd/UnicodeData.txt Unicode 4.1.0] 31 marzo 2005
* [https://www.unicode.org/Public/5.0.0/ucd/UnicodeData.txt Unicode 5.0.0] 14 luglio 2006 oltre 99.000 glifi<ref>Unicode Consortium: ''[https://www.unicode.org/press/pr-ucd5.0.html Unicode Character Database 5.0 Released] {{Webarchive|url=https://web.archive.org/web/20110805032051/http://www.unicode.org/press/pr-ucd5.0.html |data=5 agosto 2011 }}'', 18 luglio 2006</ref>
* [https://www.unicode.org/Public/5.1.0/ucd/UnicodeData.txt Unicode 5.1.0] 4 aprile 2008
* [https://www.unicode.org/Public/5.2.0/ucd/UnicodeData.txt Unicode 5.2.0] 1º ottobre 2009
* [https://www.unicode.org/Public/6.0.0/ucd/UnicodeData.txt Unicode 6.0.0] 10 ottobre 2010
* [https://www.unicode.org/Public/6.1.0/ucd/UnicodeData.txt Unicode 6.1.0] 26 gennaio 2012
* [https://www.unicode.org/Public/6.2.0/ucd/UnicodeData.txt Unicode 6.2.0] 26 settembre 2012
* [https://www.unicode.org/Public/6.3.0/ucd/UnicodeData.txt Unicode 6.3.0] 30 settembre 2013
* [https://www.unicode.org/Public/7.0.0/ucd/UnicodeData.txt Unicode 7.0.0] 16 giugno 2014
* [https://www.unicode.org/Public/8.0.0/ucd/UnicodeData.txt Unicode 8.0.0] 17 giugno 2015
* [https://www.unicode.org/Public/9.0.0/ucd/UnicodeData.txt Unicode 9.0.0] 21 giugno 2016
* [https://www.unicode.org/Public/10.0.0/ucd/UnicodeData.txt Unicode 10.0.0] 20 giugno 2017
* [https://www.unicode.org/Public/11.0.0/ucd/UnicodeData.txt Unicode 11.0.0] 5 giugno 2018
* [https://www.unicode.org/Public/12.0.0/ucd/UnicodeData.txt Unicode 12.0.0] 5 marzo 2019
* [https://www.unicode.org/Public/12.1.0/ucd/UnicodeData.txt Unicode 12.1.0] 7 maggio 2019
* [https://www.unicode.org/Public/13.0.0/ucd/UnicodeData.txt Unicode 13.0.0] 10 marzo 2020
*[https://www.unicode.org/Public/14.0.0/ucd/UnicodeData.txt Unicode 14.0.0] 14 settembre 2021
* [https://www.unicode.org/Public/15.0.0/ucd/UnicodeData.txt Unicode 15.0.0] 13 settembre 2022
* [https://www.unicode.org/Public/16.0.0/ucd/UnicodeData.txt Unicode 16.0.0] 10 settembre 2024<ref>{{Cita web|url=https://www.unicode.org/versions/Unicode16.0.0/|titolo=Unicode 16.0.0|sito=www.unicode.org|accesso=2025-02-16}}</ref>
* [https://www.unicode.org/Public/draft/ucd/UnicodeData.txt Unicode 17.0.0] 5 febbraio 2025
 
== Note ==
<references />
 
== Voci correlate ==
* [[ASCII]]
* [[ConScript Unicode Registry]]
* [[ASCII esteso]]
* [[Charset]]
* [[ConScript Unicode Registry]]
* [[UTF]]
* [[Ordine dei byte]] ([[Lingua inglese|inglese]] ''Endianness'')
* [[Aiuto:Unicode]]
* [[Operatori matematici Unicode]]
 
== Altri progetti ==
{{interprogetto|wikt|preposizione=sullo}}
 
== Collegamenti esterni ==
* {{Collegamenti esterni}}
* {{it}} [http://www.unicode.org/standard/translations/italian.html Cos'è Unicode? ] Dal sito di Unicode
* {{lingue|de|en}} [httphttps://www.decodeunicodeunicode.org/standard/translations/italian.html DecodeUnicode -Cos'è Unicode? WIKI] 51.000Dal gifssito di Unicode
* {{en}} [https://www.unicode.org/ The Unicode Consortium]
* http://www.linkas.it/docs/unicode_e_UTF-8_v1_5Uni.html
* {{lingue|en}} {{cita web|url= http://www.fileformat.info/info/unicode/char/a.htm|titolo= Indice dei dati Unicode e dei dati Java|accesso= 20 Maggio 2018}}
* {{en}} http://www.unicode.org/
* {{lingue|de|en}} [https://web.archive.org/web/20140312143430/http://www.decodeunicode.org/ DecodeUnicode - Unicode WIKI] 98.884 gifs
* {{en}} http://www.joelonsoftware.com/articles/Unicode.html Joel on software: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets
* {{cita web | 1 = http://www.linkas.it/docs/unicode_e_UTF-8_v1_5Uni.html | 2 = Semplice HowTo su Unicode e UTF-8 | accesso = 16 aprile 2005 | dataarchivio = 3 aprile 2005 | urlarchivio = https://web.archive.org/web/20050403163621/http://www.linkas.it/docs/unicode_e_UTF-8_v1_5Uni.html | urlmorto = sì }}
* {{en}} [http://www.joelonsoftware.com/articles/Unicode.html Joel on software: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets]
 
{{Tabella Unicode}}
[[Categoria:Repertori di caratteri]]
{{Controllo di autorità}}
{{portale|informatica}}
 
[[Categoria:Unicode| ]]
{{Link AdQ|ru}}
[[Categoria:Repertori di caratteri]]
 
[[als:Unicode]]
[[ar:يونيكود]]
[[bg:Уникод]]
[[bn:ইউনিকোড]]
[[br:Unicode]]
[[bs:Unikod]]
[[ca:Unicode]]
[[chr:Unicode/Cherokee]]
[[cs:Unicode]]
[[da:Unicode]]
[[de:Unicode]]
[[el:Unicode]]
[[en:Unicode]]
[[eo:Unikodo]]
[[es:Unicode]]
[[et:Unicode]]
[[fa:یونی‌کد]]
[[fi:Unicode]]
[[fr:Unicode]]
[[gl:Unicode]]
[[he:יוניקוד]]
[[hi:यूनिकोड]]
[[hr:Unicode]]
[[hu:Unicode]]
[[ia:Unicode]]
[[id:Unicode]]
[[ja:Unicode]]
[[ka:უნიკოდი]]
[[kn:ಯುನಿಕೋಡ್]]
[[ko:유니코드]]
[[ks:यूनिकोड]]
[[ku:Unicode]]
[[lt:Unicode]]
[[lv:Unikods]]
[[ml:യുണിക്കോഡ്]]
[[ne:युनिकोड]]
[[new:युनिकोड]]
[[nl:Unicode]]
[[nn:Unicode]]
[[no:Unicode]]
[[pl:Unicode]]
[[pt:Unicode]]
[[ro:Unicode]]
[[ru:Юникод]]
[[sh:Unikod]]
[[sk:Unicode]]
[[sl:Unicode]]
[[sq:Unicode]]
[[sr:Уникод]]
[[sv:Unicode]]
[[ta:ஒருங்குறி]]
[[tg:Юникод]]
[[th:ยูนิโคด]]
[[tr:Unicode]]
[[uk:Юнікод]]
[[vi:Unicode]]
[[wa:Unicôde]]
[[zh:Unicode]]
[[zh-min-nan:Thong-iōng-bé]]
[[zh-yue:統一碼]]