Internationalized Resource Identifier: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Ripetizione Etichette: Modifica visuale Modifica da mobile Modifica da web per mobile |
m smistamento lavoro sporco e fix vari |
||
Riga 1:
'''IRI''' è l'acronimo di '''Internationalized Resource Identifier''' ed è attualmente uno standard proposto [[IETF]]<ref>{{Cita web|url=https://www.w3.org/International/O-URL-and-ident.html|titolo=Internationalized Resource Identifiers (IRIs)|sito=www.w3.org|accesso=
Un IRI è una forma generale di [[Uniform Resource Identifier]] costituita, a differenza di una [[Uniform Resource Identifier|URI]], da una sequenza di caratteri appartenenti all'''Universal Character Set'' ([[Unicode]]/[[ISO 10646]]), e ciò significa che al suo interno possono occorrere caratteri non appartenenti all'insieme [[ASCII]]<ref>{{Cita web|url=https://www.w3c.it/pr/2005/uri-iri-pressrelease-it.html|titolo=Il W3C sostiene lo standard URI e lo standard proposto IRI|sito=www.w3c.it|accesso=
Un IRI può essere convertita in [[Uniform Resource Identifier|URI]] seguendo delle precise regole<ref name="gangemi">{{
== Descrizione ==
Sebbene gli URI siano limitati a un sottoinsieme del set di caratteri US-ASCII (i caratteri al di fuori di tale set devono essere mappati a [[Ottetto (matematica)|ottetti]] in base a una codifica di caratteri non specificata, quindi codificata in percentuale), gli IRI possono inoltre contenere la maggior parte dei caratteri dell'Universal Character Set (Unicode/ISO 10646), compresi i caratteri cinesi, giapponesi, coreani e cirillici<ref>{{
Gli IRI estendono gli URI usando l'Universal Character Set, dove gli URI erano limitati ad ASCII, con molti meno caratteri. Gli IRI possono essere rappresentati da una sequenza di ottetti ma per definizione sono definiti come una sequenza di caratteri, perché gli IRI possono essere pronunciati o scritti a mano<ref name="
== Compatibilità ==
Gli IRI sono mappati agli URI per mantenere la compatibilità con le versioni precedenti con i sistemi che non supportano il nuovo formato<ref name="
=== Mappatura di IRI in URI ===
La mappatura ha due scopi<ref name="rfc39873" />:
[[File:Schema-IRI-URI-URL-URN.png|alt=Schema IRI-URI-URL-URN|
'''Sintassico.''' Molti schemi e componenti URI definiscono particolari restrizioni sintattiche. Le restrizioni specifiche dello schema vengono applicate agli IRI convertendo gli IRI in URI e verificando gli URI rispetto alle restrizioni specifiche dello schema stesso.
'''Identificazione delle risorse.''' Quando l'IRI viene utilizzato esclusivamente a fini identificativi, non è necessario mappare l'IRI su un URI. Tuttavia, quando un IRI viene utilizzato per una risorsa rappresentata come una sequenza di caratteri indipendente dai caratteri dell'UCS normalizzata secondo il modulo di normalizzazione C (NFC).
Per applicazioni e protocolli che non consentono il consumo diretto di IRI, l'IRI deve essere prima convertito in [[Unicode]] utilizzando la normalizzazione della composizione canonica (NFC), se non già in formato Unicode.
Riga 25:
=== '''Esempio:''' ===
L'IRI
<code><nowiki>https://en.wiktionary.org/wiki/Ῥόδος</nowiki></code>
diventa l'URI
<nowiki>https://en.wiktionary.org/wiki/%E1%BF%AC%CF%8C%CE%B4%CE%BF%CF%82</nowiki>
I punti di codice ASCII che sono caratteri URI non validi possono essere codificati allo stesso modo, a seconda dell'implementazione<ref name="rfc39873"
Questa conversione è facilmente reversibile; per definizione, convertire un IRI in un URI e viceversa produrrà un IRI che è semanticamente equivalente all'IRI originale, anche se può differire nella rappresentazione esatta<ref>{{
Alcuni protocolli possono imporre ulteriori trasformazioni, ad esempio [[Punycode]] per le etichette DNS<ref>{{Cita web|url=https://www.ionos.it/digitalguide/domini/gestione-dei-domini/punycode/|titolo=Punycode|sito=IONOS Digitalguide|lingua=it|accesso=
== Vantaggi ==
Ci sono motivi per vedere gli URI visualizzati in lingue diverse; per lo più, lo rende più facile per gli utenti che non hanno familiarità con l'alfabeto latino (A–Z). Supponendo che non sia troppo difficile per chiunque replicare Unicode arbitrario sulle proprie tastiere, questo può rendere il sistema URI più accessibile<ref>{{
== Svantaggi ==
[[File:IDN homograph attack 1.svg|alt=Un esempio di un omografo IDN che attacca la "e" e la "a" vengono scambiate con lettere ciriliche invece dell'amato latino.|miniatura|Un esempio di un omografo IDN che attacca la "e" e la "a" vengono scambiate con lettere ciriliche invece dell'amato latino.]]
La combinazione degli IRI e gli URI ASCII può rendere molto più semplice eseguire attacchi di [[phishing]] che inducono qualcuno a credere di trovarsi su un sito diverso da quello che realmente sono. Ad esempio, si può sostituire un ASCII "a" <code>www.myfictionalbank.com</code>con il sosia Unicode "α" per ottenere <code>www.myfictionαlbank.com</code>e puntare quell'IRI a un sito dannoso. Questo è noto come attacco [[Omografia (linguistica)|omografo]] IDN<ref name="rfc39873" />.
Sebbene un URI non fornisca alle persone un modo per specificare le risorse Web utilizzando i propri alfabeti, un IRI non chiarisce come è possibile accedere alle risorse Web con tastiere che non sono in grado di generare i caratteri internazionalizzati richiesti. Ciò significa che gli IRI sono ora gestiti in un modo molto simile a molti altri software che potrebbero richiedere l'uso di un metodo di input non tramite tastiera quando si tratta di testi in varie lingue<ref name="rfc39873" />.
Riga 54:
{{Web semantico}}
{{portale|
[[Categoria:Standard Internet]]
| |||