Internationalized Resource Identifier: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m smistamento lavoro sporco e fix vari
Robertiki (discussione | contributi)
m Svantaggi: Errore ortografico
 
(3 versioni intermedie di 3 utenti non mostrate)
Riga 1:
'''IRI''' è l'acronimo di '''Internationalized Resource Identifier''' ed è attualmente uno standard proposto [[IETF]]<ref>{{Cita web|url=https://www.w3.org/International/O-URL-and-ident.html|titolo=Internationalized Resource Identifiers (IRIs)|sito=www.w3.org|accesso=28 ottobre 2021}}</ref>.
 
Un IRI è una forma generale di [[Uniform Resource Identifier]] costituita, a differenza di una [[Uniform Resource Identifier|URI]], da una sequenza di caratteri appartenenti all'''Universal Character Set'' ([[Unicode]]/[[ISO 10646]]), e ciò significa che al suo interno possono occorrere caratteri non appartenenti all'insieme [[ASCII]]<ref>{{Cita web|url=https://www.w3c.it/pr/2005/uri-iri-pressrelease-it.html|titolo=Il W3C sostiene lo standard URI e lo standard proposto IRI|sito=www.w3c.it|accesso=28 ottobre 2021}}</ref>.
 
Un IRI può essere convertita in [[Uniform Resource Identifier|URI]] seguendo delle precise regole<ref name="gangemi">{{Cita pubblicazione|cognome1=Gangemi|nome1=Aldo|cognome2=Presutti|nome2=Valentina|data=2006|titolo=The bourne identity of a web resource|url=http://ra.ethz.ch/CDstore/www2006/www.ibiblio.org/hhalpin/irw2006/vpresutti.pdf|rivista=Proceedings of Identity Reference and the Web Workshop (IRW)|serie=Laboratory for Applied Ontology|p=3|citazione=Notice that IRIs (Internationalized Resource Identifier) [11] are supposed to replace URIs in next future.}}</ref><ref>{{Cita web|url=https://tools.ietf.org/html/rfc3987#section-1.3|titolo=Internationalized Resource Identifiers (IRIs)|cognome=Suignard|nome=Michel|sito=tools.ietf.org|lingua=en|accesso=9 giugno 2018|citazione=This document defines a new protocol element, the Internationalized Resource Identifier (IRI), as a complement to the Uniform Resource Identifier (URI). An IRI is a sequence of characters from the Universal Character Set (Unicode/ISO 10646). A mapping from IRIs to URIs is defined, which means that IRIs can be used instead of URIs, where appropriate, to identify resources. The approach of defining a new protocol element was chosen instead of extending or changing the definition of URIs.}}</ref><ref>{{Cita web|url=https://tools.ietf.org/html/rfc3987#page-3|titolo=Internationalized Resource Identifiers (IRIs)|cognome=Suignard|nome=Michel|sito=tools.ietf.org|lingua=en|accesso=9 giugno 2018|}}</ref>.
 
== Descrizione ==
Riga 14:
 
=== Mappatura di IRI in URI ===
La mappatura ha due scopi<ref name="rfc39873" />:
[[File:Schema-IRI-URI-URL-URN.png|alt=Schema IRI-URI-URL-URN|thumb|upright=1.2|Schema IRI-URI-URL-[[Uniform Resource Name|URN]]]]
'''SintassicoSintattico.''' Molti schemi e componenti URI definiscono particolari restrizioni sintattiche. Le restrizioni specifiche dello schema vengono applicate agli IRI convertendo gli IRI in URI e verificando gli URI rispetto alle restrizioni specifiche dello schema stesso.
 
'''Identificazione delle risorse.''' Quando l'IRI viene utilizzato esclusivamente a fini identificativi, non è necessario mappare l'IRI su un URI. Tuttavia, quando un IRI viene utilizzato per una risorsa rappresentata come una sequenza di caratteri indipendente dai caratteri dell'UCS normalizzata secondo il modulo di normalizzazione C (NFC).
Riga 24:
Tutti i punti di codice non ASCII nell'IRI devono essere successivamente codificati come UTF-8 e i byte risultanti codificati in percentuale per produrre un URI valido.
 
=== '''Esempio:''' ===
L'IRI
 
Riga 41:
 
== Svantaggi ==
[[File:IDN homograph attack 1.svg|alt=Un esempio di un omografo IDN che attacca la "e" e la "a" vengono scambiate con lettere cirilichecirilliche invece dell'amato latino.|miniatura|Un esempio di un omografo IDN che attacca la "e" e la "a" vengono scambiate con lettere ciriliche invece dell'amato latino.]]
La combinazione degli IRI e gli URI ASCII può rendere molto più semplice eseguire attacchi di [[phishing]] che inducono qualcuno a credere di trovarsi su un sito diverso da quello che realmente sono. Ad esempio, si può sostituire un ASCII "a" <code>www.myfictionalbank.com</code>con il sosia Unicode "α" per ottenere <code>www.myfictionαlbank.com</code>e puntare quell'IRI a un sito dannoso. Questo è noto come attacco [[Omografia (linguistica)|omografo]] IDN<ref name="rfc39873" />.