Internationalized Resource Identifier: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
Robertiki (discussione | contributi)
m Svantaggi: Errore ortografico
 
(17 versioni intermedie di 13 utenti non mostrate)
Riga 1:
'''IRI''' è l'acronimo di '''Internationalized Resource Identifier''' ed è attualmente uno standard proposto [[IETF]]<ref>{{Cita web|url=https://www.w3.org/International/O-URL-and-ident.html|titolo=Internationalized Resource Identifiers (IRIs)|accesso=28 ottobre 2021}}</ref>.
{{a|Sorta di redirect|informatica|aprile 2009}}
 
Un IRI è una forma generale di [[Uniform Resource Identifier]] costituita, a differenza di una [[Uniform Resource Identifier|URI]], da una sequenza di caratteri appartenenti all'''Universal Character Set'' ([[Unicode]]/[[ISO 10646]]), e ciò significa che al suo interno possono occorrere caratteri non appartenenti all'insieme [[ASCII]]<ref>{{Cita web|url=https://www.w3c.it/pr/2005/uri-iri-pressrelease-it.html|titolo=Il W3C sostiene lo standard URI e lo standard proposto IRI|accesso=28 ottobre 2021}}</ref>.
IRI è l'acronimo di '''Internationalized Resource Identifier'''.
Un IRI è una forma generale di [[Uniform Resource Identifier]] costituita, a differenza di una [[Uniform Resource Identifier|URI]], da una sequenza di caratteri appartenenti all'''Universal Character Set'' ([[Unicode]]/[[ISO 10646]]).
 
Un IRI può essere convertita in [[Uniform Resource Identifier|URI]] seguendo delle precise regole<ref name="gangemi">{{Cita pubblicazione|cognome1=Gangemi|nome1=Aldo|cognome2=Presutti|nome2=Valentina|data=2006|titolo=The bourne identity of a web resource|url=http://ra.ethz.ch/CDstore/www2006/www.ibiblio.org/hhalpin/irw2006/vpresutti.pdf|rivista=Proceedings of Identity Reference and the Web Workshop (IRW)|serie=Laboratory for Applied Ontology|p=3|citazione=Notice that IRIs (Internationalized Resource Identifier) [11] are supposed to replace URIs in next future.}}</ref><ref>{{Cita web|url=https://tools.ietf.org/html/rfc3987#section-1.3|titolo=Internationalized Resource Identifiers (IRIs)|cognome=Suignard|nome=Michel|sito=tools.ietf.org|lingua=en|accesso=9 giugno 2018|citazione=This document defines a new protocol element, the Internationalized Resource Identifier (IRI), as a complement to the Uniform Resource Identifier (URI). An IRI is a sequence of characters from the Universal Character Set (Unicode/ISO 10646). A mapping from IRIs to URIs is defined, which means that IRIs can be used instead of URIs, where appropriate, to identify resources. The approach of defining a new protocol element was chosen instead of extending or changing the definition of URIs.}}</ref><ref>{{Cita web|url=https://tools.ietf.org/html/rfc3987#page-3|titolo=Internationalized Resource Identifiers (IRIs)|cognome=Suignard|nome=Michel|sito=tools.ietf.org|lingua=en|accesso=9 giugno 2018|}}</ref>.
== Bibliografia ==
 
== Descrizione ==
*[http://www.ietf.org/rfc/rfc3987.txt RFC3987] (in inglese)
Sebbene gli URI siano limitati a un sottoinsieme del set di caratteri US-ASCII (i caratteri al di fuori di tale set devono essere mappati a [[Ottetto (matematica)|ottetti]] in base a una codifica di caratteri non specificata, quindi codificata in percentuale), gli IRI possono inoltre contenere la maggior parte dei caratteri dell'Universal Character Set (Unicode/ISO 10646), compresi i caratteri cinesi, giapponesi, coreani e cirillici<ref>{{Cita web|url=http://tools.ietf.org/html/rfc3987|titolo=Internationalized Resource Identifiers (IRIs)|cognome=Suignard|nome=Michel|sito=tools.ietf.org|lingua=en|accesso=9 giugno 2018}}</ref><ref>{{Cita web|url=https://tools.ietf.org/html/rfc3987#section-1.3|titolo=Internationalized Resource Identifiers (IRIs)|cognome=Suignard|nome=Michel|sito=tools.ietf.org|lingua=en|accesso=9 giugno 2018}}</ref>.
 
Gli IRI estendono gli URI usando l'Universal Character Set, dove gli URI erano limitati ad ASCII, con molti meno caratteri. Gli IRI possono essere rappresentati da una sequenza di ottetti ma per definizione sono definiti come una sequenza di caratteri, perché gli IRI possono essere pronunciati o scritti a mano<ref name="rfc39873">{{Cita pubblicazione|cognome1=Duerst|nome1=M.|titolo=RFC 3987|rivista=Network Working Group|data=2005|volume=Standards Track|url=http://tools.ietf.org/html/rfc3987|accesso=12 ottobre 2014}}</ref>.
 
== Compatibilità ==
Gli IRI sono mappati agli URI per mantenere la compatibilità con le versioni precedenti con i sistemi che non supportano il nuovo formato<ref name="rfc39873"/>.
 
=== Mappatura di IRI in URI ===
La mappatura ha due scopi<ref name="rfc39873" />:
[[File:Schema-IRI-URI-URL-URN.png|alt=Schema IRI-URI-URL-URN|thumb|upright=1.2|Schema IRI-URI-URL-[[Uniform Resource Name|URN]]]]
'''Sintattico.''' Molti schemi e componenti URI definiscono particolari restrizioni sintattiche. Le restrizioni specifiche dello schema vengono applicate agli IRI convertendo gli IRI in URI e verificando gli URI rispetto alle restrizioni specifiche dello schema stesso.
 
'''Identificazione delle risorse.''' Quando l'IRI viene utilizzato esclusivamente a fini identificativi, non è necessario mappare l'IRI su un URI. Tuttavia, quando un IRI viene utilizzato per una risorsa rappresentata come una sequenza di caratteri indipendente dai caratteri dell'UCS normalizzata secondo il modulo di normalizzazione C (NFC).
 
Per applicazioni e protocolli che non consentono il consumo diretto di IRI, l'IRI deve essere prima convertito in [[Unicode]] utilizzando la normalizzazione della composizione canonica (NFC), se non già in formato Unicode.
 
Tutti i punti di codice non ASCII nell'IRI devono essere successivamente codificati come UTF-8 e i byte risultanti codificati in percentuale per produrre un URI valido.
 
=== Esempio ===
L'IRI
 
<code><nowiki>https://en.wiktionary.org/wiki/Ῥόδος</nowiki></code>
 
diventa l'URI
<nowiki>https://en.wiktionary.org/wiki/%E1%BF%AC%CF%8C%CE%B4%CE%BF%CF%82</nowiki>
I punti di codice ASCII che sono caratteri URI non validi possono essere codificati allo stesso modo, a seconda dell'implementazione<ref name="rfc39873"/>.
 
Questa conversione è facilmente reversibile; per definizione, convertire un IRI in un URI e viceversa produrrà un IRI che è semanticamente equivalente all'IRI originale, anche se può differire nella rappresentazione esatta<ref>{{Cita libro|cognome1=Hendler|nome1=Hrsg. Dieter Fensel; Hrsg. John Domingue; Hrsg. James A.|titolo=Handbook of Semantic Web Technologies|data=2010|editore=Springer-Verlag GmbH|città=Berlin|isbn=978-3-540-92912-3|edizione=1. Aufl.|url=https://books.google.com/books?id=sdEFvSb9WNsC|accesso=12 ottobre 2014}}</ref>.
 
Alcuni protocolli possono imporre ulteriori trasformazioni, ad esempio [[Punycode]] per le etichette DNS<ref>{{Cita web|url=https://www.ionos.it/digitalguide/domini/gestione-dei-domini/punycode/|titolo=Punycode|sito=IONOS Digitalguide|lingua=it|accesso=28 ottobre 2021}}</ref>.
 
== Vantaggi ==
Ci sono motivi per vedere gli URI visualizzati in lingue diverse; per lo più, lo rende più facile per gli utenti che non hanno familiarità con l'alfabeto latino (A–Z). Supponendo che non sia troppo difficile per chiunque replicare Unicode arbitrario sulle proprie tastiere, questo può rendere il sistema URI più accessibile<ref>{{cita web|cognome1=Clark|nome1=Kendall|titolo=Internationalizing the URI|url=http://www.xml.com/pub/a/2003/05/07/deviant.html|editore=O’Reilly Media, Inc.|accesso=12 ottobre 2014|data=7 maggio 2003}}</ref>.
 
== Svantaggi ==
[[File:IDN homograph attack 1.svg|alt=Un esempio di un omografo IDN che attacca la "e" e la "a" vengono scambiate con lettere cirilliche invece dell'amato latino.|miniatura|Un esempio di un omografo IDN che attacca la "e" e la "a" vengono scambiate con lettere ciriliche invece dell'amato latino.]]
La combinazione degli IRI e gli URI ASCII può rendere molto più semplice eseguire attacchi di [[phishing]] che inducono qualcuno a credere di trovarsi su un sito diverso da quello che realmente sono. Ad esempio, si può sostituire un ASCII "a" <code>www.myfictionalbank.com</code>con il sosia Unicode "α" per ottenere <code>www.myfictionαlbank.com</code>e puntare quell'IRI a un sito dannoso. Questo è noto come attacco [[Omografia (linguistica)|omografo]] IDN<ref name="rfc39873" />.
 
Sebbene un URI non fornisca alle persone un modo per specificare le risorse Web utilizzando i propri alfabeti, un IRI non chiarisce come è possibile accedere alle risorse Web con tastiere che non sono in grado di generare i caratteri internazionalizzati richiesti. Ciò significa che gli IRI sono ora gestiti in un modo molto simile a molti altri software che potrebbero richiedere l'uso di un metodo di input non tramite tastiera quando si tratta di testi in varie lingue<ref name="rfc39873" />.
 
== Note ==
 
<references />
 
== Bibliografia ==
*RFC 3987 (in inglese)
 
{{Web semantico}}
{{portale|internet}}
 
[[Categoria:Standard Internet]]
[[Categoria:Uniform Resource Identifier]]