Computer Aided Transcription: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m apostrofo tipografico
Pil56-bot (discussione | contributi)
m smistamento lavoro sporco e fix vari
Riga 1:
{{F|fonetica|arg2=software|maggio 2012}}
{{W|informatica|gennaio 2009}}
{{F|software|maggio 2012}}
{{Organizzare|Voce pesante e prolissa, senza fonti.|informatica|maggio 2012}}
 
Si tratta di una particolare categoria di software che permettono la traduzione in chiaro ed in tempo reale del parlato ripreso da una tastiera stenografica. In particolare, i dati inviati dalla tastiera sono confrontati con quelli contenuti in un dizionario in formato elettronico che associa ad ogni combinazione di tasti o sequenza di combinazioni stenografiche corrispondenti al sistema abbreviativo utilizzato un determinato record, che può essere una parola, un acronimo, un nome o un comando di formattazione.
 
Si tratta di una particolare categoria di software che permettono la traduzione in chiaro ed in tempo reale del parlato ripreso da una tastiera stenografica. In particolare, i dati inviati dalla tastiera sono confrontati con quelli contenuti in un dizionario in formato elettronico che associa ad ogni combinazione di tasti o sequenza di combinazioni stenografiche corrispondenti al sistema abbreviativo utilizzato un determinato record, che può essere una parola, un acronimo, un nome o un comando di formattazione.
 
==Cenni storici==
Riga 15 ⟶ 14:
Il principio di base su cui si basano tutti i software CAT è pressoché il medesimo: l'utilizzo di un dizionario, cioè di un elenco che associa ad ogni combinazione di tasti o sequenza di combinazioni stenografiche un determinato record, che può essere una parola, un acronimo, un nome o anche un comando per il computer.
Le combinazioni sillabiche digitate sulla tastiera stenografica sono trasferite senza elaborazione alcuna al software di trascrizione, che svolge, di fatto, tutto il lavoro di traduzione ed elaborazione. Ogni combinazione, a partire dalla prima pervenuta, viene cioè confrontata con i record del dizionario che cominciano con quella medesima combinazione, partendo da quello contenente una sequenza di sillabe più lunga fino ad arrivare ai singoli monosillabi. Qualora il software identifichi un'equivalenza, la sillaba o la successione di sillabe verrà immediatamente tradotta (verrà cioè sostituita con il record presente nel dizionario); in caso di esito negativo, il programma passerà ad analizzare la sillaba successiva.
 
È piuttosto agevole intuire che un siffatto processo, rigidamente basato sul criterio gerarchico "della sillaba più lunga", sebbene in grado di interpretare correttamente buona parte delle sequenze sillabiche, non è esente da possibili ambiguità. Tali ambiguità interpretative vengono comunemente definite "conflitti".
 
I conflitti possibili sono di due categorie: conflitti di interpretazione ('translation conflicts') e conflitti di confine ('boundary conflicts'). I primi derivano dalle modalità abbreviative del sistema stenografico usato; i secondi sono invece una conseguenza dell'applicazione del principio gerarchico.
 
I conflitti di interpretazione ricorrono tutte le volte che l'operatore per indicare termini diversi usa la medesima abbreviazione o sequenza di stenogrammi. Ad esempio, per il sistema Stenotype americano: "MAID = made\maid"; DAOE-VAOIS = device\devise"; SAOER-YAL = serial\cereal".