Computer Aided Transcription: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m →Storia: Aggiunto vari collegamenti |
|||
(8 versioni intermedie di 6 utenti non mostrate) | |||
Riga 1:
{{F|fonetica|arg2=software|maggio 2012}}
{{W|informatica|gennaio 2009}}
{{Organizzare|Voce pesante e prolissa, senza fonti.|informatica|maggio 2012}}
Si tratta di una particolare categoria di [[software]] che permettono la traduzione in chiaro ed in tempo reale del parlato ripreso da una [[Tastiera (informatica)|tastiera]] stenografica. In particolare, i dati inviati dalla tastiera sono confrontati con quelli contenuti in un dizionario in formato elettronico che associa ad ogni combinazione di tasti o sequenza di combinazioni [[Stenografia|stenografiche]] corrispondenti al sistema abbreviativo utilizzato un determinato record, che può essere una parola, un [[acronimo]], un nome o un comando di formattazione.
==
Anche se studi e applicazioni in materia sono stati effettuati in diversi Paesi e su svariate tastiere stenografiche, l'esperienza degli [[Stati Uniti d'America|Stati Uniti]] - forse per la notevole diffusione della tastiera "Stenotype" (ideata da Ward Stone Ireland nel 1906 e brevettata nel 1911) nell'ambito delle corti giudiziarie - è stata di primaria importanza per l'evoluzione del settore della trascrizione stenografica assistita dal computer.
Le prime esperienze in materia risalgono ai primi [[Anni 1960|anni Sessanta]], quando la più grande azienda del settore, l'americana "Stenograph", fu chiamata dal governo statunitense ad offrire il proprio contributo allo sviluppo di un sistema di traduzione computerizzata delle lingue straniere, proseguendo una ricerca avviata dall'esercito e dall'IBM già nel corso degli anni Cinquanta. Il progetto includeva lo sviluppo di una tastiera stenografica per la lingua russa e l'addestramento di resocontisti [[Bilinguismo|bilingue]] al fine di copiare documenti in russo. Con tale sistema le note stenografiche impresse su una normale striscia di carta venivano lette da uno [[Scanner (informatica)|scanner]] ottico, che produceva dati digitali successivamente trattati da un apposito [[computer]]. Il computer traduceva le combinazioni steno nei fonemi della lingua russa e poi nei fonemi della lingua inglese; questi ultimi venivano successivamente trascritti in lingua inglese. Il sistema non era impeccabile, ma fu di grande aiuto al Governo ed all'esercito statunitense. Da questa applicazione cominciò a svilupparsi l'idea della trascrizione computerizzata delle note stenografiche. A metà degli anni Sessanta arrivarono sul mercato i primi computer con [[Memoria magnetica|memorie magnetiche]] e la Stenograph decise di avviare insieme
Dalla metà degli [[Anni 1980|anni Ottanta]] fanno la loro comparsa i primi personal computer e con essi i primi software per la stenografia in grado di funzionare su tali sistemi; sul finire degli anni Ottanta, si registra
==Principio di funzionamento==
Riga 12 ⟶ 14:
Il principio di base su cui si basano tutti i software CAT è pressoché il medesimo: l'utilizzo di un dizionario, cioè di un elenco che associa ad ogni combinazione di tasti o sequenza di combinazioni stenografiche un determinato record, che può essere una parola, un acronimo, un nome o anche un comando per il computer.
Le combinazioni sillabiche digitate sulla tastiera stenografica sono trasferite senza elaborazione alcuna al software di trascrizione, che svolge, di fatto, tutto il lavoro di traduzione ed elaborazione. Ogni combinazione, a partire dalla prima pervenuta, viene cioè confrontata con i record del dizionario che cominciano con quella medesima combinazione, partendo da quello contenente una sequenza di sillabe più lunga fino ad arrivare ai singoli monosillabi. Qualora il software identifichi un'equivalenza, la sillaba o la successione di sillabe verrà immediatamente tradotta (verrà cioè sostituita con il record presente nel dizionario); in caso di esito negativo, il programma passerà ad analizzare la sillaba successiva.
È piuttosto agevole intuire che un siffatto processo, rigidamente basato sul criterio gerarchico "della sillaba più lunga", sebbene in grado di interpretare correttamente buona parte delle sequenze sillabiche, non è esente da possibili ambiguità. Tali ambiguità interpretative vengono comunemente definite "conflitti".
I conflitti possibili sono di due categorie: conflitti di interpretazione ('translation conflicts') e conflitti di confine ('boundary conflicts'). I primi derivano dalle modalità abbreviative del sistema stenografico usato; i secondi sono invece una conseguenza
I conflitti di interpretazione ricorrono tutte le volte che l'operatore per indicare termini diversi usa la medesima abbreviazione o sequenza di stenogrammi. Ad esempio, per il sistema Stenotype americano: "MAID = made\maid"; DAOE-VAOIS = device\devise"; SAOER-YAL = serial\cereal".
I conflitti di confine sono invece maggiormente correlati al principio di funzionamento del programma, quello cioè della "sillaba più lunga", che opta sempre per il record che comprende il maggior numero di sillabe, il quale in alcuni casi può produrre ambiguità circa
Per eliminare tali problemi - la cui incidenza e tipologia varia notevolmente a seconda della teoria abbreviativa utilizzata - sono possibili due soluzioni: la prima è quella di modificare alcuni criteri abbreviativi; la seconda prevede
{{Portale|informatica}}
[[Categoria:Fonetica]]
|