SSML: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 8:
 
#Scansione dell'XML (''parsing''): in questa fase il file SSML viene esaminato per estrarre la parte dei contenuti. Il markup controlla la resa di quelle che il sistema di sintesi considererà entità singole (''token''); per esempio: ''anno<break/>nuovo'' farà in modo che le due parole "anno" e "nuovo" vengano considerate come due parole completamente staccate tra di loro invece che due parole legate tra loro e separate solo da una breve pausa.
#Analisi della struttura: in questa fase il markup controlla la suddivisione in [[paragrafo|paragrafi]] e [[frase|frasi]], consentendo così di controllare gli stacchi tra parti diverse del testo.
#Normalizzazione del testo: in questa fase il sistema di sintesi risolve e prepara per la resa costrutti particolari come abbreviazioni e numeri, basandosi sul contesto e in funzione della lingua finale. Il markup viene usato per controllare e risolvere ambiguità di resa, indicando direttamente al sistema di sintesi come deve esser resa la parte specifica: per esempio, consente di indicare se il testo "1/2" deve essere reso come "un mezzo", "metà", "uno di due", "uno o due". Questo è particolarmente utile per le lingue orientali, dove la pronuncia del singolo carattere può cambiare di molto in base al contesto o al sistema usato. Un esempio è la [[lingua giapponese]] dove, in caso di ambibuità tra [[Kanji]] e [[Kana]], si può indicare tramite il markup indicare la corretta resa fonetica, per es. se 今日は va pronunciato きょうは ("kyou wa" = "oggi") o こんにちは ("konnichiwa" = "ciao").
#Conversione testo-[[fonema]]: in questa fase il sistema di sintesi deve elaborare la pronuncia corretta, in base ai fonemi specifici di una determinata lingua. Il markup può essere usato per controllare in modo esplicito la pronuncia desiderata e in questa fase risulta particolarmente utile per [[acronimo|acronimi]] o [[abbreviazione|abbreviazioni]] che il sistema di sintesi non è stato in grado di risolvere durante la fase di normalizzazione.
#Analisi della [[prosodia]]: in questa fase il sistema di sintesi genera e controlla tutta una serie di parametri che servono per rendere la sintesi il più vicina possibile a unal discorso parlato di un essere umano: [[intonazione]], [[ritmo]], [[pausa|pause]], [[velocità]], [[enfasi]] eccetera. Il markup in questa fase è particolarmente efficace in quanto consente il controllo diretto di enfasi, pause e altri elementi di prosodia.
#Generazione dell'audio: il markup in questa fase consente di controllare il tipo di voce (maschile, femminile), caratteristiche specifiche del tipo di voce (es. donna giovane, uomo anziano) e anche l'inserimento di elementi di audio registrato.