Lexical Markup Framework: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 28:
==Un esempio==
Nell’esempio seguente, l’entrata lessicale è associata ad un lemma (clergyman) e a due forme flesse (clergyman e clergymen). La codifica della lingua è effettuata per l’intera risorsa lessicale. Il valore scelto per descrivere la particolare lingua trattata è fissato per l’intero lessico, come indicato nel seguente diagramma UML.
 
[[Image:LMFMorphoClergymanInflected.svg]]
 
Gli elementi Lexical Resource, Global Information, Lexicon, Lexical Entry, Lemma, e Word Form definiscono la struttura del lessico, e sono specificati nel documento LMF. Al contrario, languageCoding, language, partOfSpeech, commonNoun, writtenForm, grammaticalNumber, singular, plural sono data categories prese dal registro di data categories, e servono ad integrare la struttura. I valori ISO 639-3, clergyman, clergymen sono semplici stringhe di caratteri. Il valore eng è tratto dalla lista di lingue così come definite in ISO 639-3.
 
Con alcune informazioni aggiuntive come dtdVersion e feat, gli stessi dati possono essere espressi dal seguente frammento XML:
 
<source lang="xml">
<LexicalResource dtdVersion="14">
<GlobalInformation>
<feat att="languageCoding" val="ISO 639-3"/>
</GlobalInformation>
<Lexicon>
<feat att="language" val="eng"/>
<LexicalEntry>
<feat att="partOfSpeech" val="commonNoun"/>
<Lemma>
<feat att="writtenForm" val="clergyman"/>
</Lemma>
<WordForm>
<feat att="writtenForm" val="clergyman"/>
<feat att="grammaticalNumber" val="singular"/>
</WordForm>
<WordForm>
<feat att="writtenForm" val="clergymen"/>
<feat att="grammaticalNumber" val="plural"/>
</WordForm>
</LexicalEntry>
</Lexicon>
</LexicalResource>
</source>
 
Nonostante questo esempio sia piuttosto semplice, LMF può rappresentare descrizioni linguistiche molto più complesse; in tal caso, la rappresentazione XML cresce in complessità.