SSML: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m migrazione automatica di 6 collegamenti interwiki a Wikidata, d:q1971947 |
m Bot: overlinking giorni e mesi dell'anno e modifiche minori |
||
Riga 6:
== Caratteristiche ==
I [[Tag HTML|tag]] definiti in SSML sono in grado di controllare la resa di un sistema di sintesi durante tutte le sei fasi fondamentali del processo tipico di elaborazione
# Scansione dell'XML (''[[parsing]]''): in questa fase il file SSML viene esaminato per estrarre la parte dei contenuti. Il markup controlla la resa di quelle che il sistema di sintesi considererà entità singole (''[[token (testo)|token]]''); per esempio: ''anno<nowiki><break /></nowiki>nuovo'' farà in modo che le due parole "''anno''" e "''nuovo''" vengano considerate come due parole completamente staccate tra di loro invece che due parole legate tra loro e separate solo da una breve pausa.
# Analisi della struttura: in questa fase il markup controlla la suddivisione in [[paragrafo|paragrafi]] e [[frase|frasi]], consentendo così di controllare gli stacchi tra parti diverse del testo.
# Normalizzazione del testo: in questa fase il sistema di sintesi risolve e prepara per la resa costrutti particolari come abbreviazioni e numeri, basandosi sul contesto e in funzione della lingua finale. Il markup viene usato per controllare e risolvere ambiguità, indicando direttamente al sistema di sintesi come deve esser
# Conversione testo-[[fonema]]: in questa fase il sistema di sintesi deve elaborare la pronuncia corretta, in base ai fonemi specifici di una determinata lingua. Il markup può essere usato per controllare in modo esplicito la pronuncia desiderata e in questa fase risulta particolarmente utile per [[acronimo|acronimi]] o [[abbreviazione|abbreviazioni]] che il sistema di sintesi non è stato in grado di risolvere durante la fase di normalizzazione.
# Analisi della [[prosodia]]: in questa fase il sistema di sintesi genera e controlla tutta una serie di parametri che servono per rendere la sintesi il più vicina possibile al discorso parlato di un essere umano: [[intonazione]], [[ritmo]], [[pausa|pause]], [[velocità]], [[enfasi]] eccetera. Il markup in questa fase è particolarmente efficace in quanto consente il controllo diretto di alcuni di questi parametri.
# Generazione dell'audio: il markup in questa fase consente di selezionare il tipo di voce (maschile, femminile), le sue caratteristiche specifiche (es. donna giovane, uomo anziano) e anche l'eventuale inserimento di elementi di audio pre-registrato.
== Evoluzione ==
La versione 1.0 di SSML, attualmente in forza, ha introdotto tutti gli elementi di base. Tuttavia, in seguito sia al miglioramento delle tecniche di sintesi che soprattutto all'emergere di nuove realtà industriali ed economiche, soprattutto in [[Asia]], è sorta la necessità di estendere e migliorare il controllo tramite markup
Da queste esigenze è partita la definizione della versione 1.1, che estende praticamente tutte le funzionalità di markup della versione 1.0. Tra le principali funzionalità aggiunte ci sono:
Riga 25:
* controlli più estesi per la resa di audio registrato ([[intensità|volume]], velocità, ripetizione continua)
Il W3C ha pubblicato la versione 1.1 in fase "raccomandazione candidata" una prima volta<ref>[http://www.w3.org/TR/2008/CR-speech-synthesis11-20081107/ Speech Synthesis Markup Language Version 1.1 - W3C Candidate Recommendation 7th November 2008] paragrafo ''Status of this document''</ref> il
== Esempio ==
|