Lexical Markup Framework: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Recupero di 1 fonte/i e segnalazione di 0 link interrotto/i.) #IABot (v2.0.1
Paolomacina (discussione | contributi)
mNessun oggetto della modifica
 
(3 versioni intermedie di 3 utenti non mostrate)
Riga 1:
'''Lexical Markup Framework''' ('''LMF''') è un progetto in corso all'interno dell'Organizzazione Internazionale per la Standardizzazione (International Organisation for Standardisation - ISO), e più in particolare all'interno di [[ISO]]/TC37, allo scopo di definire uno standard per la rappresentazione di [[dizionario|dizionari]] elettronici e [[lessico|lessici]] computazionali per il trattamento automatico della lingua (TAL).
Scopo del progetto è la standardizzazione dei principi e dei metodi relativi alle risorse linguistiche nel contesto della comunicazione multilingue e della [[diversità culturale]].
 
==Obiettivi di LMF==
Riga 10:
 
==Stato attuale==
Il numero ISO è 24613. La specifica di LMF è attualmente (Dicembre 2007) allo stato di DIS (Draft for International Standard). Il programma prevede di raggiungere lo stadio di FDIS (Final Draft for International Standard) in Febbraiofebbraio 2008 e la pubblicazione finale in Settembresettembre 2008.
LMF e gli altri membri della famiglia di standard ISO/TC37
Gli standard ISO/TC37 sono attualmente elaborati come specifiche di alto livello e trattano la segmentazione delle parole (ISO 24614), annotazioni (ISO 24611 o MAF, ISO 24612 o LAF, ISO 24615 o SynAF, e ISO 24617-1 o SemAF/Time), feature structures (ISO 24610), contenitori multimediali (ISO 24616 o MLIF), and lessici (ISO 24613). Questi standard sono basati su specifiche di basso livello dedicate a costanti, ovvero data categories (revisione di ISO 12620), codici linguistici (ISO 639), scripts codes (ISO 15924), country codes (ISO 3166) e [[Unicode]] (ISO 10646).
Questa organizzazione a due livelli costituisce una famiglia coerente di standard con regole comuni e semplici:
0. La specifica di alto livello fornisce gli elementi strutturali che sono integrati dalle costanti standardizzate;
Riga 19:
==Standard usati da LMF==
Le costanti linguistiche come /feminine/ (“femminile”) o /transitive/ (“transitivo”) non sono definite all'interno di LMF ma sono registrate nel Registro di Data Categories (Data Category Registry, DCR), che viene mantenuto come risorsa globale da ISO/TC37 in conformità con ISO/IEC 11179-3:2003 [1]. Queste costanti sono usate per integrare gli elementi strutturali di alto livello.
La specifica LMF è conforme ai principi di modellazione di UML ([[Unified Modeling Language]]), così come definiti da OMG ([[Object Management Group]]). La struttura è specificata per mezzo di diagrammi di classi UML. Gli esempi sono presentati da diagrammi di esempi (o oggetti) UML. Una DTD XML è inoltre fornita in un annesso del documento LMF.
 
==Modello strutturale==
Riga 36:
Con alcune informazioni aggiuntive come dtdVersion e feat, gli stessi dati possono essere espressi dal seguente frammento XML:
 
<sourcesyntaxhighlight lang="xml">
<LexicalResource dtdVersion="14">
<GlobalInformation>
Riga 59:
</Lexicon>
</LexicalResource>
</syntaxhighlight>
</source>
 
Nonostante questo esempio sia piuttosto semplice, LMF può rappresentare descrizioni linguistiche molto più complesse; in tal caso, la rappresentazione XML cresce in complessità.