Lexical Markup Framework: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Paolomacina (discussione | contributi)
mNessun oggetto della modifica
 
(5 versioni intermedie di 5 utenti non mostrate)
Riga 1:
'''Lexical Markup Framework''' ('''LMF''') è un progetto in corso all'interno dell'Organizzazione Internazionale per la Standardizzazione (International Organisation for Standardisation - ISO), e più in particolare all'interno di [[ISO]]/TC37, allo scopo di definire uno standard per la rappresentazione di [[dizionario|dizionari]] elettronici e [[lessico|lessici]] computazionali per il trattamento automatico della lingua (TAL).
Scopo del progetto è la standardizzazione dei principi e dei metodi relativi alle risorse linguistiche nel contesto della comunicazione multilingue e della [[diversità culturale]].
 
==Obiettivi di LMF==
Riga 10:
 
==Stato attuale==
Il numero ISO è 24613. La specifica di LMF è attualmente (Dicembre 2007) allo stato di DIS (Draft for International Standard). Il programma prevede di raggiungere lo stadio di FDIS (Final Draft for International Standard) in Febbraiofebbraio 2008 e la pubblicazione finale in Settembresettembre 2008.
LMF e gli altri membri della famiglia di standard ISO/TC37
Gli standard ISO/TC37 sono attualmente elaborati come specifiche di alto livello e trattano la segmentazione delle parole (ISO 24614), annotazioni (ISO 24611 o MAF, ISO 24612 o LAF, ISO 24615 o SynAF, e ISO 24617-1 o SemAF/Time), feature structures (ISO 24610), contenitori multimediali (ISO 24616 o MLIF), and lessici (ISO 24613). Questi standard sono basati su specifiche di basso livello dedicate a costanti, ovvero data categories (revisione di ISO 12620), codici linguistici (ISO 639), scripts codes (ISO 15924), country codes (ISO 3166) e [[Unicode]] (ISO 10646).
Questa organizzazione a due livelli costituisce una famiglia coerente di standard con regole comuni e semplici:
0. La specifica di alto livello fornisce gli elementi strutturali che sono integrati dalle costanti standardizzate;
0. Le specifiche di basso livello forniscono le costanti standardizzate come metadati.
 
==Standard usati da LMF==
Le costanti linguistiche come /feminine/ (“femminile”) o /transitive/ (“transitivo”) non sono definite all'interno di LMF ma sono registrate nel Registro di Data Categories (Data Category Registry, DCR), che viene mantenuto come risorsa globale da ISO/TC37 in conformità con ISO/IEC 11179-3:2003 [1]. Queste costanti sono usate per integrare gli elementi strutturali di alto livello.
La specifica LMF è conforme ai principi di modellazione di UML ([[Unified Modeling Language]]), così come definiti da OMG ([[Object Management Group]]). La struttura è specificata per mezzo di diagrammi di classi UML. Gli esempi sono presentati da diagrammi di esempi (o oggetti) UML. Una DTD XML è inoltre fornita in un annesso del documento LMF.
 
==Modello strutturale==
Riga 35 ⟶ 36:
Con alcune informazioni aggiuntive come dtdVersion e feat, gli stessi dati possono essere espressi dal seguente frammento XML:
 
<sourcesyntaxhighlight lang="xml">
<LexicalResource dtdVersion="14">
<GlobalInformation>
Riga 58 ⟶ 59:
</Lexicon>
</LexicalResource>
</syntaxhighlight>
</source>
 
Nonostante questo esempio sia piuttosto semplice, LMF può rappresentare descrizioni linguistiche molto più complesse; in tal caso, la rappresentazione XML cresce in complessità.
Riga 64 ⟶ 65:
==Collegamenti esterni==
===Siti web correlati===
*{{cita web | 1 = http://www.lexicalmarkupframework.org/ | 2 = Sito web di LMF | accesso = 23 gennaio 2008 | urlarchivio = https://web.archive.org/web/20170715122452/http://www.lexicalmarkupframework.org/ | dataarchivio = 15 luglio 2017 | urlmorto = sì }}
*{{cita web|http://lirics.loria.fr/|Sito web di LIRICS}}
===Comunicazioni scientifiche su LMF===
Riga 75 ⟶ 76:
 
[[Categoria:XML]]
[[Categoria:Standard informatici basati su XML]]
[[Categoria:Standard ISO]]