Lexical Markup Framework: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m →Un esempio: tag source deprecati, replaced: <source lang= → <syntaxhighlight lang=, </source> → </syntaxhighlight> |
mNessun oggetto della modifica |
||
(2 versioni intermedie di 2 utenti non mostrate) | |||
Riga 1:
'''Lexical Markup Framework''' ('''LMF''') è un progetto in corso all'interno dell'Organizzazione Internazionale per la Standardizzazione (International Organisation for Standardisation - ISO), e più in particolare all'interno di [[ISO]]/TC37, allo scopo di definire uno standard per la rappresentazione di [[dizionario|dizionari]] elettronici e [[lessico|lessici]] computazionali per il trattamento automatico della lingua (TAL).
Scopo del progetto è la standardizzazione dei principi e dei metodi relativi alle risorse linguistiche nel contesto della comunicazione multilingue e della [[diversità culturale]].
==Obiettivi di LMF==
Riga 10:
==Stato attuale==
Il numero ISO è 24613. La specifica di LMF è attualmente (Dicembre 2007) allo stato di DIS (Draft for International Standard). Il programma prevede di raggiungere lo stadio di FDIS (Final Draft for International Standard) in
LMF e gli altri membri della famiglia di standard ISO/TC37
Gli standard ISO/TC37 sono attualmente elaborati come specifiche di alto livello e trattano la segmentazione delle parole (ISO 24614), annotazioni (ISO 24611 o MAF, ISO 24612 o LAF, ISO 24615 o SynAF, e ISO 24617-1 o SemAF/Time), feature structures (ISO 24610), contenitori multimediali (ISO 24616 o MLIF), and lessici (ISO 24613). Questi standard sono basati su specifiche di basso livello dedicate a costanti, ovvero data categories (revisione di ISO 12620), codici linguistici (ISO 639), scripts codes (ISO 15924), country codes (ISO 3166) e [[Unicode]] (ISO 10646).
Questa organizzazione a due livelli costituisce una famiglia coerente di standard con regole comuni e semplici:
0. La specifica di alto livello fornisce gli elementi strutturali che sono integrati dalle costanti standardizzate;
Riga 19:
==Standard usati da LMF==
Le costanti linguistiche come /feminine/ (“femminile”) o /transitive/ (“transitivo”) non sono definite all'interno di LMF ma sono registrate nel Registro di Data Categories (Data Category Registry, DCR), che viene mantenuto come risorsa globale da ISO/TC37 in conformità con ISO/IEC 11179-3:2003 [1]. Queste costanti sono usate per integrare gli elementi strutturali di alto livello.
La specifica LMF è conforme ai principi di modellazione di UML ([[Unified Modeling Language]]), così come definiti da OMG ([[Object Management Group]]). La struttura è specificata per mezzo di diagrammi di classi UML. Gli esempi sono presentati da diagrammi di esempi (o oggetti) UML. Una DTD XML è inoltre fornita in un annesso del documento LMF.
==Modello strutturale==
|