Ruby markup
Il ruby markup (o annotazioni ruby o semplicemente ruby (ルビ?, rubi)) sono brevi sequenze di testo affiancate al testo base, tipicamente utilizzate nei documenti dell'Asia orientale per indicare la trascrizione fonetica di parole cinesi (pinyin) o giapponesi (furigana) o per fornire brevi annotazioni. Il nome deriva dall'omonima unità di misura tipografica corrispondente a 5 punti.
Esempi
Ecco un esempio di caratteri rubini giapponesi (chiamati furigana) per Tokyo ("東京"):
Hiragana | Katakana | Romaji | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
|
A Taiwan, il sillabario principale utilizzato per i caratteri rubini cinesi è Zhuyin fuhao (noto anche come Bopomofo); nella Cina continentale viene utilizzato principalmente il pinyin. In genere, a differenza dell'esempio mostrato sopra, zhuyin viene utilizzato con una scrittura tradizionale verticale e zhuyin è scritto sul lato destro dei caratteri. Nella Cina continentale, viene utilizzata la scrittura orizzontale e i caratteri Ruby (pinyin) sono scritti sopra i caratteri cinesi.
I libri con guide fonetiche (soprattutto pinyin) sono popolari tra i bambini e gli stranieri che imparano il cinese.
Di seguito è riportato un esempio dei caratteri rubini coreani per la Corea ("韓國"):
Zhuyin | Pinyin | ||||||||
---|---|---|---|---|---|---|---|---|---|
|
|
A Taiwan, il sillabario principale utilizzato per i caratteri rubini cinesi è Zhuyin fuhao (noto anche come Bopomofo); nella Cina continentale viene utilizzato principalmente il pinyin. In genere, a differenza dell'esempio mostrato sopra, zhuyin viene utilizzato con una scrittura tradizionale verticale e zhuyin è scritto sul lato destro dei caratteri. Nella Cina continentale, viene utilizzata la scrittura orizzontale e i caratteri Ruby (pinyin) sono scritti sopra i caratteri cinesi.
I libri con guide fonetiche (soprattutto pinyin) sono popolari tra i bambini e gli stranieri che imparano il cinese.
Di seguito è riportato un esempio dei caratteri rubini coreani per la Corea ("韓國"):
Hangul | Romaja | ||||||||
---|---|---|---|---|---|---|---|---|---|
|
|
Il Romaja è normalmente usato nei libri di testo stranieri fino all'introduzione dell'Hangul. I caratteri Ruby possono essere abbastanza comuni sui cartelli in alcune parti della Corea del Sud.
Ecco un esempio dei caratteri Ruby vietnamiti (Chữ Quốc Ngữ) per Hanoi ("河內"):
Chữ Quốc ngữ | ||||
---|---|---|---|---|
|
I caratteri cinesi e le sue derivazioni (Chữ Hán e Chữ Nôm) con il popolo vietnamita Kinh sono caduti in disuso a favore della scrittura latina Chữ Quốc ngữ durante il periodo coloniale francese, quando divenne parte dell'istruzione obbligatoria (1920 in poi). Attualmente ancora utilizzato dalla gente di Gin.
Uses
Ruby può essere utilizzato per diversi motivi:
- perché il carattere è raro e la pronuncia sconosciuta a molti: i caratteri del nome personale spesso rientrano in questa categoria;
- perché il carattere ha più di una pronuncia e il contesto non è sufficiente per determinare quale usare;
- perché i lettori del testo stanno ancora imparando la lingua e non ci si aspetta che conoscano sempre la pronuncia o il significato di un termine;
- perché l'autore sta usando una pronuncia non standard per un carattere o un termine
Inoltre, il Ruby può essere usato per mostrare il significato, piuttosto che la pronuncia, di una parola forse non familiare (di solito straniera) o gergale. Viene generalmente utilizzato con il dialogo parlato e si applica solo alle pubblicazioni giapponesi. La forma più comune di Ruby è chiamata furigana o yomigana e si trova nei libri didattici giapponesi, nei giornali, nei fumetti e nei libri per bambini.
In giapponese, alcuni caratteri, come il sokuon (促 音) (tsu,っminuscolo) che indica una pausa prima della consonante che precede, sono normalmente scritti a circa la metà delle dimensioni dei caratteri normali[1].
Dove non viene utilizzato lo zhuyin, vengono impiegati altri sistemi fonetici cinesi come il pinyin.
In ambienti accademici, il testo vietnamita scritto in chữ Hán o chữ Nôm può essere glossato con chữ quốc ngữ ruby per i lettori moderni.
A volte le glosse interlineari sono visivamente simili al Ruby e appaiono sopra o sotto il testo principale in caratteri più piccoli. Tuttavia, questa è una pratica distinta utilizzata per aiutare gli studenti di una lingua straniera dando glosse per le parole in un testo, al contrario della pronuncia di caratteri meno conosciuti.
L'annotazione Ruby può essere utilizzata anche nella scrittura a mano.
Storia
Nella tipografia britannica, Ruby era originariamente il nome del carattere con un'altezza di 5,5 punti, che le stampanti usavano per le annotazioni interlineari nei documenti stampati. In giapponese, invece di riferirsi a una dimensione del carattere, la parola è diventata il nome per la composizione furigana. Quando sono stati traslitterati di nuovo in inglese, alcuni testi hanno reso la parola rubi, (una tipica romanizzazione della parola giapponeseル ビ, invece diル ビrub (rubī), la traslitterazione prevista del Ruby). Tuttavia, l'ortografia "Ruby" è diventata più comune da quando il W3C ha pubblicato una raccomandazione permarkup Ruby. Negli Stati Uniti, la dimensione del carattere era stata chiamata " agata ", un termine in uso dal 1831 secondo l' Oxford English Dictionary.
Markup HTML
Nel 2001, il W3C ha pubblicato la specifica Ruby Annotation per integrare XHTML con il markup ruby[2]. Il markup di Ruby è incorporato nelle specifiche XHTML 1.1 e in HTML5[3].
Per i browser che non supportano Ruby in modo nativo, il supporto Ruby può essere aggiunto più facilmente utilizzando le regole CSS disponibili sul web[4][5].
Il markup di Ruby è strutturato in modo tale che un rendering di fallback, costituito dai caratteri ruby tra parentesi immediatamente dopo il testo principale, appare se il browser non supporta ruby.
Esempi di markup
Di seguito sono riportati alcuni esempi di markup ruby. Il markup viene mostrato per primo e successivamente viene mostrato il markup renderizzato, seguito dalla versione non contrassegnata. I browser Web lo visualizzano con le dimensioni e il posizionamento corretti come mostrato negli esempi basati su tabelle sopra, oppure utilizzano il rendering di riserva con i caratteri ruby tra parentesi:
XHTML | CSS 2[6] | ||
---|---|---|---|
Markup | <ruby>
<rb>東京</rb><rp>(</rp>
<rt>とうきょう</rt><rp>)</rp>
</ruby>
|
<ruby>
<rb>北</rb><rp>(</rp><rt>ㄅㄟˇ</rt><rp>)</rp>
<rb>京</rb><rp>(</rp><rt>ㄐ丨ㄥ</rt><rp>)</rp>
</ruby>
|
<ruby>
<rbc><rb>振</rb><rb>り</rb><rb>仮</rb><rb>名</rb><rp>(</rp></rbc>
<rtc><rt>ふ</rt><rt>り</rt><rt>が</rt><rt>な</rt><rp>)</rp></rtc>
</ruby>
|
Rendered |
|
|
Per impostazione predefinita, il codice sopra avrà l'effetto di seguito. Per ottenere questo effetto, potrebbe essere necessario un ulteriore stile CSS. |
Unmarked | 東京(とうきょう) | 北(ㄅㄟˇ)京(ㄐ丨ㄥ) | 振り仮名(ふりがな) |
Notare che il testo in Ruby cinese viene normalmente visualizzato in colonne verticali a destra di ogni carattere. Al momento questo approccio non è in genere supportato nei browser.
Questo è un esempio basato su tabella di colonne verticali:
瓶 | ㄆ ㄧ ㄥˊ |
子 | ˙ ㄗ |
Markup Ruby complesso
Il markup ruby complesso rende possibile associare più di un testo ruby a un testo base, o parti del testo ruby con parti del testo base.[7]
Unicode
Unicode e il suo standard complementare, Universal Character Set, supportano ruby tramite questi caratteri di annotazione interlineari:
- Punto codice
FFF9
(esadecimale): ancora di annotazione interlineare, contrassegna l'inizio del testo annotato - Punto di codice
FFFA
(esadecimale): separatore di annotazione interlineare: contrassegna l'inizio dei caratteri di annotazione - Punto di codice
FFFB
(esadecimale): terminatore di annotazione interlineare: contrassegna la fine del testo annotato
Poche applicazioni implementano questi caratteri. Unicode Technical Report # 20 chiarisce che questi caratteri non sono destinati ad essere esposti agli utenti di linguaggi di markup e applicazioni software. Suggerisce di utilizzare invece il markup ruby, ove appropriato[8].
ANSI
ISO / IEC 6429 (noto anche come ECMA -48) che definisce i codici di escape ANSI ha anche fornito un meccanismo per il testo Ruby per l'uso da terminali di testo, sebbene pochi terminali ed emulatori di terminale lo implementino. Il codice di escape PARALLEL TEXTS (PTX) accettava sei valori di parametro fornendo le seguenti sequenze di escape per contrassegnare il testo Ruby:
CSI 0 \
(o semplicementeCSI \
poiché 0 è usato come valore predefinito per questo controllo) - fine dei testi paralleliCSI 1 \
- inizio di una stringa di testo parallelo principaleCSI 2 \
- inizio di una stringa di testo parallelo supplementareCSI 3 \
- inizio di una stringa di annotazioni fonetiche giapponesi supplementariCSI 4 \
- inizio di una stringa di annotazioni fonetiche cinesi supplementariCSI 5 \
- fine di una serie di annotazioni fonetiche supplementari
Bibliografia
- (EN) Ken Lunde, Ruby Glyphs, in CJKV Information Processing, O'Reilly Media, 1999, ISBN 978-0-596-51447-1.
Collegamenti esterni
- (EN) Ruby Markup, su W3C, 14 giugno 2016.
- (EN) Use Cases & Exploratory Approaches for Ruby Markup, su W3C, 8 ottobre 2013.
- (EN) CSS Ruby Layout Module Level 1, su W3C, 5 agosto 2014.
Note
- ^ Ruby Annotation, in W3C Recommendation, World Wide Web Consortium, 31 maggio 2001.
- ^ Ruby Annotation, in W3C Recommendation, World Wide Web Consortium, 31 maggio 2001.
- ^ W3C Ruby Markup Reference, su w3.org.
- ^ CSS Ruby Support Archiviato il 28 febbraio 2007 in Internet Archive.—Works in all modern browsers
- ^ CSS Ruby Annotation Layout Module Level 1, su drafts.csswg.org.
- ^ CSS Ruby Annotation Layout Module Level 1, su drafts.csswg.org.
- ^ Complex ruby markup
- ^ Unicode in XML and other Markup Languages, su unicode.org, W3C and Unicode Consortium, 16 maggio 2007.