Versione delle 16:26, 1 apr 2009 modifica Superspritz (discussione \| contributi) Commissione arbitrale, Check user, Amministratori 268 944 modifiche →Come funziona ← Differenza precedente		Versione delle 16:49, 1 apr 2009 modifica annulla Superspritz (discussione \| contributi) Commissione arbitrale, Check user, Amministratori 268 944 modifiche Sistemo e aggiusto fraseologia e alcune imprecisioni tecniche Differenza successiva →
Riga 1: ~~{{W\|informatica\|maggio 2008}}~~ {{S\|informatica}} '''VoiceXML''' ('''VXML''') acronimo di '''V'''oice e'''X'''ensible '''M'''arkup '''L'''anguage, ~~rappresenta~~definito ~~lo standard~~dal [[~~W3C~~World Wide Web Consortium]] (W3C), rappresenta lo standard in formato [[XML]], per la creazione di dialoghi interattivi tra una persona e un computer. ~~La piattaforma VoiceXML lavora in modo analogo a un browser HTML.~~ ~~Come~~La piattaforma VoiceXML lavora in modo analogo a un browser [[HTML]]: ~~carica~~i documenti VoiceXML vengono scaricati da un ~~Server~~server ~~Web~~web e liinterpretati ~~interpreta,~~e ~~analogamente~~trasformati ilin ~~Voice~~voce ~~Gateway~~da ~~carica~~un ~~gli~~Voice ~~script~~Gateway ~~VoiceXML~~residente ~~dal~~sul ~~Server Web e~~computer lidell'utente ~~interpreta~~finale. == A cosa serve == VoiceXML si candida come linguaggio ~~ideale~~ per ~~verticalizzare~~realizzare diun ~~applicazioni~~nuovo ~~Web~~metodo ~~esistenti~~di ~~creando~~presentazione ~~così~~basato ~~nuovo~~sulla ~~layer~~voce die ~~presentazione,~~denominato '''Voice User Interface''' (VUI), ein ~~una~~italiano ~~nuova~~''interfaccia ~~via~~utente divocale'') ~~accesso~~accedendo ai dati: ilattraverso linee ~~telefono~~telefoniche. VoiceXML permette la creazione di logiche di dialogo uomo-macchina in linguaggio naturale attraverso l'integrazione con diverse tecnologie, tra cui: [[DTMF\|Dual-Tone Multi-Frequency]] [[Riconoscimento vocale~~\|Automatic Speech Recognition~~]] [[Sintesi vocale~~\|Text-to-Speech~~]] ''Speaker Verification'' * Video in streaming o preregistrati Una delle caratteristiche del linguaggio VoiceXML è quella di essere costruito per sviluppare applicazioni ~~voice-enabled~~basate sulla voce e orientate al Web: questo ~~implica, infatti, la possibilità~~consente di produrre ~~pagine~~documenti VoiceXML anche in modo dinamico, attraverso linguaggi server side (ASP, ASP.NET, JSP, PHP, ecc.), così come avviene per le pagine web. == Caratteristiche == Alcune delle caratteristiche del linguaggio VoiceXML sono: * ''Linguaggio di markup ~~ideale~~concepito per creare applicazioni vocali'': VoiceXML è stato progettato appositamente per la creazione di applicazioni vocali, la gestione dei dialoghi, e l'integrazione con le funzioni di '''ASR''' e '''TTS'''. * ''Separazione del codice per le interazioni utente dal codice dell'applicazione'': la separazione delle logiche di programmazione da quelle di presentazione è un requisito fondamentale, sia per la verticalizzazione di applicazioni esistenti, sia per lo sviluppo in team di applicazioni vocali. * ''~~Una struttura~~Struttura modulare'': la struttura stessa del linguaggio permette la creazione di dialoghi, grammatiche e logiche di interazione che possono essere resi modulari. Questi elementi possono essere conservati separatamente e riutilizzati in altre applicazioni. * ''Portabilità e semplicità di sviluppo'': VoiceXML è stato creato per essere utilizzato indipendentemente dalle piattaforme e per nascondere al programmatore le logiche di più basso livello;. loLo sviluppatore di applicazioni vocali , infatti, non dovrà preoccuparsi ~~sulla~~della gestione del motori di riconoscimento o sintesi vocale, ma si potrà ~~concentare~~concentrare sulla creazione dell'interfaccia utente. == Come funziona == L'utente si connette tramite il proprio telefono (senza dover usare un particolare browser o plugin) ad un Voice Gateway attraverso la [[PSTN\|rete telefonica ordinaria]].▼ ▲L'utente si connette tramite il proprio telefono (senza dover usare un particolare browser o plugin) ad un Voice Gateway attraverso la [[PSTN]]. [[Immagine:Archi3 wiki.jpg\|600px]] Il Voice Gateway svolge le seguenti funzioni: * interpreta il ~~file~~documento VoiceXML; * produce un messaggio vocale attraverso la sintesi vocale (TTS); * riceve ed interpreta gli input dall'utente (tramite la tastiera a toni, via DTMF o ~~ASR~~tramite comandi vocali, via riconoscimento vocale); * dialoga con il ~~Web~~server ~~Server~~web attraverso il [[Hyper Text Transfer Protocol\|protocollo HTTP]]. Il server ~~Web~~web, ~~riceve~~una volta ricevute le richieste dal Voice Gateway e, rende disponibili i ~~file~~documenti VoiceXML per la loro interpretazione. ~~loro interpretazione.~~ == Esempio == Esempio di un documento VoiceXML: Line 63 ⟶ 58: </source> L'interpretazione di questa pagina VoiceXML da parte del Voice Gateway ~~produrrà~~fa lapronunciare ~~pronuncia da parte del TTS delle~~le parole " '''Ciao Mondo!'''" "tramite un sistema integrato di sintesi vocale. Esempi di applicazioni possibili sono: posta elettronica, informazioni ~~sul~~di ~~meteo,~~servizio ~~informazioni~~di ~~sul~~pubblic utilità (meteo, traffico...), quotazioni di borsa~~, oroscopo~~, call center, gestione delle scorte, ~~ecc..~~servizi di tempo libero (oroscopi, eccetera) == Storia del linguaggio == Un primo linguaggio di markup per interazioni vocali via telefono, il ''Phone Markup Language'' (PML) fu sviluppato dai [[Bell Laboratories]] di AT&T. Lo sviluppo proseguì anche quando i Bell Laboratories furono scorporati da AT&T e integrati in [[Alcatel-Lucent\|Lucent Technology]]. Nel frattempo anche [[IBM]] e [[Motorola]] svilupparono i loro linguaggi di markup vocali, denominati rispettivamente SpeechML e VoxML. ~~AT&T Bell Labs svilupparono il Phone Markup Language (PML).~~ ~~In seguito AT&T si divise in AT&T e Lucent che portarono avanti separatamente lo svilppo del linguaggio PML.~~ ~~IBM sviluppò il linguaggio SpeechML, Motorola il linguaggio VoxML.~~ ~~Nel Marzo 1999 IBM, AT&T, Lucent e Motorola si unirono nel VoiceXML Forum e crearono (nell'Agosto 1999) il linguaggio VoiceXML.~~ Nel marzo [[1999]] IBM, AT&T, Lucent e Motorola decisero di unificare gli sviluppi su una base comune, dando vita al VoiceXML Forum che nell'agosto 1999 inizò le specifiche del linguaggio VoiceXML, pubblicando la versione 1.0 nel [[marzo]] [[2000]]. Il nuovo linguaggio di markup, grazie anche alle somiglianze con l'HTML, ebbe subito un'ampia diffusione. ~~La '''versione 1.0''' fu pubblicata nel Marzo del 2000.~~ ~~VoiceXML 1.0 venne largamente adottata, grazie anche alla sua somiglianza con HTML.~~ ~~'''VoiceXML 2.0''' divento ''Recommendatio'' W3C a Marzo 2004.~~ Nel marzo [[2004]], la versione 2.0 di VoiceXML divenne una raccomandazione ufficiale del W3C, che ne cura gli sviluppi e le evoluzioni. ~~'''VoiceXML 2.1''', diventata ''Reccomendation'' W3C nel'Ottobre 2007, aggiunge alcune caratteristiche addizionali alla versione precedente con cui è retro-compatibile.~~ A ottobre [[2007]] il W3C ha rilasciato la versione 2.1 di VoiceXML, che presenta una serie di estensioni garantendo la compatibilità all'indietro con la versione precedente. == Standard collegati ==▼ ▲== Standard collegati == ~~Il W3C ha separato la struttura dell'interfaccia vocale in altri diversi linguaggi:~~ Nel quadro delle attività collegate alle applicazioni vocali, il W3C ha ulteriormente separato il controllo delle interfacce vocale definendo diversi linguaggi di markup, ognuno orientato verso aspetti specifici. === SRGS e SISR=== ''Speech Recognition Grammar Specification (SRGS)'' è il linguaggio utilizzato per scrivere le grammatiche (insiemi di regole) utilizzate dal riconoscitore vocale per riconoscere gli input utente. ''Semantic Interpretation for Speech Recognition(SISR)'' ~~gli~~viene ~~sviluppatori~~utilizzato ~~usano~~per controllare l'interpretazione semantica, inserendo le opportune istruzioni nelle grammatiche, per manipolare i risultati ottenuti dal riconoscimento vocale in base al contesto applicativo. === PLS === ''[[Pronunciation Lexicon Specification]] (PLS)'' viene utilizzato sia dal riconoscitore vocale sia ~~dalla~~dal ~~sintesi~~sintetizzatore per ~~definire~~controllare la corretta pronuncia di una parola, soprattutto in applicazioni multilingue. === SSML === ''[[Speech Synthesis Markup Language]] ([[SSML]])'' viene usato per migliorare la prosodia delle frasi ~~per~~controllando ~~esempio~~aspetti ~~aumentando~~quali oenfasi, ~~diminuendo~~timbro lavocale, volume sonoro e velocità di lettura. === CCXML === ''Call ~~Cantrol~~Control eXensible Markup Language (CCXML)'' ~~linguaggio~~ viene usato per la gestione delle telefonate. Permette di accettare una chiamata in entrata, effettuare una chiamata in uscita, ~~disconnettere~~terminare una chiamata e ~~connettere insieme~~collegare più chiamate in conferenza. {{Portale\|Informatica}}

VoiceXML: differenze tra le versioni