Lexical Markup Framework: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica |
|||
(32 versioni intermedie di 20 utenti non mostrate) | |||
Riga 1:
'''Lexical Markup Framework''' ('''LMF''') è
Scopo del progetto è la standardizzazione dei principi e dei metodi relativi alle risorse linguistiche nel contesto della comunicazione multilingue e della [[diversità culturale]].
==Obiettivi di LMF==
Gli scopi di LMF sono: fornire un modello comune per la creazione e
Tipi di singole istanziazioni di LMF possono includere risorse lessicali monolingui, bilingui o multilingui. Le stesse specifiche possono essere usate per lessici di piccole o grandi dimensioni, semplici o complessi, e per rappresentazioni lessicali scritte o parlate. Le descrizioni linguistiche comprendono informazioni [[morfologia (linguistica)|morfologiche]], sintattiche, semantiche e multilingui. Le lingue coperte non si limitano alle lingue europee ma coprono tutte le lingue naturali. La gamma di applicazioni di NLP non è limitata. LMF è in grado di rappresentare la maggior parte dei lessici, inclusi WordNet, EDR e PAROLE.▼
▲Gli scopi di LMF sono: fornire un modello comune per la creazione e l’uso di risorse lessicali; gestire lo scambio di dati tra queste risorse; consentire la fusione di risorse elettroniche singole per formare una vasta rete a livello globale.
▲Tipi di singole istanziazioni di LMF possono includere risorse lessicali monolingui, bilingui o multilingui. Le stesse specifiche possono essere usate per lessici di piccole o grandi dimensioni, semplici o complessi, e per rappresentazioni lessicali scritte o parlate. Le descrizioni linguistiche comprendono informazioni morfologiche, sintattiche, semantiche e multilingui. Le lingue coperte non si limitano alle lingue europee ma coprono tutte le lingue naturali. La gamma di applicazioni di NLP non è limitata. LMF è in grado di rappresentare la maggior parte dei lessici, inclusi WordNet, EDR e PAROLE.
==Storia di LMF==
In passato, la standardizzazione dei lessici è stata studiata e sviluppata da una serie di progetti come GENELEX, EDR, EAGLES, MULTEXT, PAROLE, SIMPLE e ISLE. Successivamente, le delegazioni nazionali di ISO/TC37 hanno deciso di trattare standards dedicati alla rappresentazione di lessici elettronici e per TAL. Il lavoro su LMF è cominciato
==Stato attuale==
Il numero ISO è 24613. La specifica di LMF è attualmente (Dicembre 2007) allo stato di DIS (Draft for International Standard). Il programma prevede di raggiungere lo stadio di FDIS (Final Draft for International Standard) in
LMF e gli altri membri della famiglia di standard ISO/TC37
Gli standard ISO/TC37 sono attualmente elaborati come specifiche di alto livello e trattano la segmentazione delle parole (ISO 24614), annotazioni (ISO 24611 o MAF, ISO 24612 o LAF, ISO 24615 o SynAF, e ISO 24617-1 o SemAF/Time), feature structures (ISO 24610), contenitori multimediali (ISO 24616 o MLIF), and lessici (ISO 24613). Questi standard sono basati su specifiche di basso livello dedicate a costanti, ovvero data categories (revisione di ISO 12620), codici linguistici (ISO 639), scripts codes (ISO 15924), country codes (ISO 3166) e [[Unicode]] (ISO 10646).
Questa organizzazione a due livelli costituisce una famiglia coerente di standard con regole comuni e semplici:
0. La specifica di alto livello fornisce gli elementi strutturali che sono integrati dalle costanti standardizzate;
0. Le specifiche di basso livello forniscono le costanti standardizzate come metadati.
==Standard usati da LMF==
Le costanti linguistiche come /feminine/ (“femminile”) o /transitive/ (“transitivo”) non sono definite
La specifica LMF è conforme ai principi di modellazione di UML ([[Unified Modeling Language]]), così come definiti da OMG ([[Object Management Group]]). La struttura è specificata per mezzo di diagrammi di classi UML. Gli esempi sono presentati da diagrammi di esempi (o oggetti) UML. Una DTD XML è inoltre fornita in un annesso del documento LMF.
==Modello strutturale==
LMF è formato dai componenti seguenti:
0. Un pacchetto centrale che rappresenta lo scheletro strutturale che descrive la gerarchia di base
0. Estensioni del pacchetto centrale, espresse in un sistema che descrive il riutilizzo dei componenti centrali in unione con i componenti aggiuntivi richiesti per una risorsa lessicale specifica.
Le estensioni sono dedicate alla morfologia, dizionari elettronici (MRD), sintassi NLP, semantica NLP, annotazioni multiligui NLP, schemi di paradigma NLP, espressioni polirematiche, e constraint expression patterns.
==Un esempio==
[[Immagine:LMFMorphoClergymanInflected.svg]]
Gli elementi Lexical Resource, Global Information, Lexicon, Lexical Entry, Lemma, e Word Form definiscono la struttura del lessico, e sono specificati nel documento LMF. Al contrario, languageCoding, language, partOfSpeech, commonNoun, writtenForm, grammaticalNumber, singular, plural sono data categories prese dal registro di data categories, e servono ad integrare la struttura. I valori ISO 639-3, clergyman, clergymen sono semplici stringhe di caratteri. Il valore eng è tratto dalla lista di lingue così come definite in ISO 639-3.
Con alcune informazioni aggiuntive come dtdVersion e feat, gli stessi dati possono essere espressi dal seguente frammento XML:
<syntaxhighlight lang="xml">
<LexicalResource dtdVersion="14">
<GlobalInformation>
<feat att="languageCoding" val="ISO 639-3"/>
</GlobalInformation>
<Lexicon>
<feat att="language" val="eng"/>
<LexicalEntry>
<feat att="partOfSpeech" val="commonNoun"/>
<Lemma>
<feat att="writtenForm" val="clergyman"/>
</Lemma>
<WordForm>
<feat att="writtenForm" val="clergyman"/>
<feat att="grammaticalNumber" val="singular"/>
</WordForm>
<WordForm>
<feat att="writtenForm" val="clergymen"/>
<feat att="grammaticalNumber" val="plural"/>
</WordForm>
</LexicalEntry>
</Lexicon>
</LexicalResource>
</syntaxhighlight>
Nonostante questo esempio sia piuttosto semplice, LMF può rappresentare descrizioni linguistiche molto più complesse; in tal caso, la rappresentazione XML cresce in complessità.
==
*{{cita web | 1 = http://www.lexicalmarkupframework.org/ | 2 = Sito web di LMF | accesso = 23 gennaio 2008 | urlarchivio = https://web.archive.org/web/20170715122452/http://www.lexicalmarkupframework.org/ | dataarchivio = 15 luglio 2017 | urlmorto = sì }}
*{{cita web|http://lirics.loria.fr/|Sito web di LIRICS}}
*
*Language Resources and Evaluation LREC-2006/Genoa: Lexical Markup Framework (LMF) [3]
*Language Resources and Evaluation LREC-2006/Genoa: The relevance of standards for research infrastructures [4]
{{Standard ISO}}
[[Categoria:XML]]
[[Categoria:Standard informatici basati su XML]]
[[Categoria:Standard ISO]]
|