Text Encoding Initiative: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m Errori di Lint: Tag non chiusi |
m sistemazione fonti, smistamento lavoro sporco e fix vari |
||
(11 versioni intermedie di 9 utenti non mostrate) | |||
Riga 1:
{{F|linguaggi di programmazione|aprile 2022}}
[[File:Text Encoding
La '''Text Encoding Initiative''' (TEI) è un [[consorzio]] di istituzioni internazionali, di ambito linguistico e letterario, che ha sviluppato uno standard per la rappresentazione dei testi in
== Storia ==
Riga 8 ⟶ 9:
Dalla codifica digitale si ottengono anche altri benefici, come la '''portabilità''' dei testi, la '''facilità di archiviazione''' e la '''facilità di gestione''' attraverso gli strumenti informatici.
In quell'anno, per mettere ordine tra i molti modelli e linguaggi di rappresentazione esistenti, venne organizzato un incontro al [[Vassar College]], [[New York]], in modo da poter affrontare questi problemi. L'incontro, che riunì gruppi di studiosi di varie discipline e rappresentanti di società professionali, biblioteche, archivi, e progetti in un certo numero di paesi in [[Europa]], [[Nord America]] e [[Asia]], fu la base per la fondazione della Text Encoding Initiative (TEI).
Fu così che le tre maggiori associazioni mondiali che utilizzavano tecnologie digitali negli studi sulle scienze umane, l{{'}}''Association for Computers and the Humanities (ACH)'', l{{'}}''Association for Computational Linguistics (ACL)'' e l{{'}}''Association for Literary and Linguistic Computing (ALLC)'' si riunirono per sponsorizzare il progetto. Ad esso iniziarono a collaborare gruppi di studiosi provenienti da diversi paesi.
Dal [[2000]] la TEI è diventata un consorzio, ospitato e finanziato da alcuni enti ed [[università]] tra cui:
* Il Research Technologies Service dell'[[università di Oxford]];
Riga 23 ⟶ 24:
== Il Progetto ==
La fase iniziale ha portato alla creazione di un primo progetto, noto come "P1" (la lettera P sta per
== Le linee guida del progetto ==
Le linee guida TEI fanno raccomandazioni sui modi di rappresentazione adeguati, in grado di mettere in evidenza determinate caratteristiche di un testo, al fine di facilitarne l'elaborazione su un [[computer]], indipendentemente dalla piattaforma utilizzata, descrivendo uno schema di codifica che può essere espresso in diversi linguaggi formali. Sono esplicitamente orientate alla creazione e allo scambio di informazioni testuali, ma considerano anche altre tipologie di informazioni (quali immagini e suoni). In particolare, vengono specificati una serie di marcatori ([[Tag HTML|tag]]) che possono essere inseriti nel testo, al fine di contrassegnarne la struttura con le caratteristiche di interesse. Lo schema di codifica o linguaggio di markup indica l'insieme completo di norme connesse con l'uso di un linguaggio di marcatura in un determinato contesto. Lo schema di codifica TEI è particolarmente utile per facilitare lo scambio di dati tra utenti o gruppi di ricerca che utilizzano programmi e sistemi informatici diversi. Contiene un inventario con le caratteristiche più utilizzate per rappresentare testi. Le linee guida si applicano a qualsiasi tipo di testo, indipendentemente dalla data e dal genere letterario, senza restrizioni sulla forma o contenuto. Pur rivolgendosi principalmente alle esigenze della comunità accademica, questi orientamenti possono essere utili anche per bibliotecari, editori o per chiunque voglia creare o distribuire un testo elettronico. Anche se si concentrano sul problema di come rappresentare testi cartacei in forma elettronica, le linee guida sono applicabili anche su testi già digitalizzati. Come stabilito durante la conferenza al [[Vassar College]], le linee guida devono avere determinate caratteristiche. In particolare devono:
* essere semplici, chiare e concrete;
* essere di semplice utilizzazione da parte degli utenti e ricercatori, senza dover ricorrere a [[software]] specializzati;
Riga 32 ⟶ 33:
* essere conformi agli standard esistenti o in procinto di essere adottati.
* consentire estensioni definite dall'utente;
Le norme e le raccomandazioni sono espresse con il linguaggio di marcatura più diffuso per le risorse digitali di tutti i tipi: L'Extensible Markup Language (XML) e come insieme di caratteri è stato adottato l'[[ISO 646]]. Lo schema di codifica TEI non dipende da questo linguaggio, infatti originariamente fu formulato in SGML (ISO Standard Generalized Markup Language), un predecessore di XML. Le linee guida definiscono circa 500 diversi componenti testuali e concetti. L'attuale versione delle linee guida TEI è stata
P5 è una revisione importante del progetto e offre numerose funzionalità nuove e altre migliorate. Con il rilascio di quest'ultimo, le linee guida sono cambiate di nuovo. Alcune delle modifiche più significative sono architettoniche: le linee guida sono scritte e memorizzate utilizzando una tecnologia diversa dalle precedenti e gli schemi TEI sono espressi non solo come DTD, ma anche nella lingua RELAX schema NG. Alcune delle modifiche riguardano il vocabolario e le limitazioni del linguaggio di codifica TEI, con l'aggiunta di nuovi elementi e migliorie ai modelli. Pur rompendo la compatibilità a ritroso con le precedenti versioni, è stata aggiornata in modo significativo la struttura di base degli elementi, suddividendoli in classi, per consentire una più facile e maggiore personalizzazione. Le linee guida TEI per loro natura, richiedono un continuo sviluppo e ricerca, poiché cercano di descrivere un dominio testuale che ancora è oggetto di studio e in costante evoluzione. Questo porta alla creazione di tag del tutto nuovi per specificare caratteristiche che erano state totalmente trascurate o affinare e aggiornare i moduli esistenti. Nella documentazione di P5, dove si preferisce utilizzare schema a scapito delle DTD, vengono fornite tutte le istruzioni per poter migrare al nuovo sistema dal precedente P4. Il consorzio mette a disposizione anche strumenti per la formazione degli utenti, come tutorial e documentazioni.
Riga 47 ⟶ 48:
Oggi il TEI è riconosciuto come uno strumento di fondamentale importanza al livello internazionale, sia per la conservazione a lungo termine dei dati elettronici, che in altri ambiti disciplinari. È lo schema di codifica scelto per la creazione di documenti come critiche, testi scientifici e letterari, e per la gestione e produzione di [[metadati]] dettagliati associati a testi elettronici. Il successo della TEI ha aperto la strada per una migliore conservazione e distribuzione del nostro patrimonio culturale. Esso infatti potrà essere disponibile nel mondo della rete, per studenti e persone comuni. Le raccomandazioni del consorzio sono state approvate da molte organizzazioni, tra cui il National Endowment for the Humanities, Arts del Regno Unito e l'Humanities Research Board, Modern Language Association e molte altre agenzie di tutto il mondo per promuovere una sorta di biblioteca digitale e progetti di testo elettronico.
Le linee guida TEI sono il prodotto più significativo del lavoro del Consorzio TEI, che si è impegnata a diffonderle nel modo più ampio. Per aumentare e sostenere l'utilizzo delle linee guida, il consorzio ha messo in atto varie attività di formazione e sensibilizzazione per gli utenti. Questi programmi di formazione sono svolti da vari gruppi all'interno della comunità TE. Sono messi a disposizione anche tutorial, documentazioni di progetto.
== Bibliografia ==
* {{cita web|url=http://www.tei-c.org/|titolo=Sito ufficiale Text Encoding Initiative|lingua=en}}▼
== Voci correlate ==
* [[Linguaggi di markup]]
* [[Metadati]]
▲* {{cita web|http://www.tei-c.org/|Sito ufficiale Text Encoding Initiative|lingua=en}}
== Collegamenti esterni ==
* {{cita web|url=http://www.tei-c.org/|titolo=Sito ufficiale Text Encoding Initiative|lingua=en}}
* {{cita web|url=http://www.tei-c.org/Guidelines/|titolo=TEI Guidelines|lingua=en|accesso=19 febbraio 2010|urlarchivio=https://web.archive.org/web/20140703122400/http://www.tei-c.org/Guidelines/|urlmorto=sì}}
* {{cita web | url = http://www.tei-c.org/Vault/P4/Lite/teiu5_it.html | titolo = Documentazione TEI Lite | accesso = 6 novembre 2013 | urlarchivio = https://web.archive.org/web/20130727155410/http://www.tei-c.org/Vault/P4/Lite/teiu5_it.html | urlmorto = sì }}
* {{cita web|url=http://www.ach.org/|titolo=Association for Computers and the Humanities (sito ufficiale)|lingua=en}}
* {{cita web|url=http://www.aclweb.org/|titolo=Association for Computational Linguistics (sito ufficiale)|lingua=en}}
* {{cita web|url=http://www.allc.org/|titolo=Association for Literary and Linguistic Computing (sito ufficiale)|lingua=en}}
{{Controllo di autorità}}
Riga 69:
[[Categoria:XML]]
[[Categoria:Standard informatici basati su XML]]
[[Categoria:Informatica umanistica]]
|