Linguistic Linked Open Data: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
FrescoBot (discussione | contributi)
m Bot: numeri di pagina nei template citazione
 
(22 versioni intermedie di 18 utenti non mostrate)
Riga 1:
Nell'ambito dell’[[elaborazione del linguaggio naturale]], in [[linguistica]] e campi di ricerca attigui, '''Linguistic Linked Open Data (LLOD)''' descrive sia un metodo che una comunità multidisciplinare che si occupa di creare, condividere e (ri)utilizzare risorse linguistiche sviluppate secondo i principi dei [[Linkeddati Datacollegati]] (''linked data''). La '''Linguistic Linked Open Data Cloud''', sviluppata e sostenuta dal gruppo di lavoro Open Linguistics Working Group (OWLG) della [[Open Knowledge|Open Knowledge Foundation]] (in italiano Fondazione per la conoscenza aperta), ha rappresentato, sin dalla nascita, il centro focale delle attività di diversi gruppi delle comunità afferenti al [[World Wide Web Consortium|W3C]], di progetti di ricerca e dello sviluppo di infrastrutture.
 
== Definizione e Svilupposviluppo ==
[[File:800px-Llod2020.png|thumb|LLOD Cloud 2020|link=Special:FilePath/800px-Llod2020.png]]
Con l’espressione Linguistic Linked Open Data si indica la pubblicazione di dati linguistici e per l'elaborazione del linguaggio naturale secondo i seguenti principi:<ref>{{citeCita web|last1cognome1=Open Linguistics Working Group|titletitolo=Linguistic LOD|url=http://linguistic-lod.org/|websitesito=linguistic-lod.org|publishereditore=LIDER project|accessdateaccesso=2016-05-24 maggio 2016}}</ref>
* i dati devono essere licenziati in maniera libera, usando licenze come le licenze [[Creative Commons]].
* gli elementi di un dataset devono essere identificati in maniera univoca attraverso un [[Uniform Resource Identifier|URI]].
* l’URI dovrebbe poter essere risolto, così che gli utenti possano accedere ad un numero maggiore di informazioni attraverso un browser web.
* La risoluzione di una risorsa LLOD dovrebbe restituire dei risultati utilizzando il [[Resource Description Framework]] (RDF).
* I [[HyperlinkCollegamento ipertestuale|Linkscollegamenti]] (''link'') ad altre risorse devono essere inclusi per aiutare gli utenti a scoprire nuove risorse e fornire informazioni semantiche.
I principali benefici derivanti dall’applicazione dei principi LLOD sono stati identificati da:<ref>{{citeCita booklibro|last1cognome1=Chiarcos|first1nome1=Christian|last2cognome2=McCrae|first2nome2=John|last3cognome3=Cimiano|first3nome3=Philipp|last4cognome4=Fellbaum|first4nome4=Christiane|titletitolo=Towards open data for linguistics: Lexical Linked Data|datedata=2013|publishereditore=In: Alessandro Oltramari, Piek Vossen, Lu Qin, and Eduard Hovy (eds.), New Trends of Research in Ontologies and Lexical Resources. Springer|___locationcittà=Heidelberg|url=https://www.springer.com/cda/content/document/cda_downloaddocument/9783642317811-c1.pdf|accessdateaccesso=24 maggio 2016|urlarchivio=https://web.archive.org/web/20160215201050/http://www.springer.com/cda/content/document/cda_downloaddocument/9783642317811-05-24c1.pdf|urlmorto=sì}}</ref>
* Rappresentazione: I grafi connessi sono un formato rappresentativo più flessibile per i dati linguistici.
* Interoperabilità: i modelli RDF comuni e condivisi sono facilmente integrabili.
Line 16 ⟶ 17:
* Semantica: Link ordinary esprimono il significato.
* Dinamicità: I dati Web possono essere continuamente migliorati.
La rappresentazione della LLOD cloud è visionabile su linguistic-lod.org<ref>{{citeCita web |titletitolo=Linguistic Linked Open Data. Information about the current status of the growing cloud of linguistic linked open data. |url=http://linguistic-lod.org/ |accessdateaccesso=10 Decemberdicembre 2019}}</ref>.
=== Vocabolari LLOD ===
Oltre a raccogliere metadata e generare il diagramma della cloud LLOD, la comunità LLOD guida lo sviluppo di standard comunitari in riferimento alla creazione di raccomandazioni per i vocabolari, per i metadati e le best practices.
 
Secondo la panoramica dello stato dell’arte proposta da Cimiano et al. (2020),<ref>{{CiteCita booklibro|lastcognome=Cimiano|firstnome=Philipp|url=https://www.springer.com/gp/book/9783030302245|titletitolo=Linguistic Linked Data: Representation, Generation and Applications|last2cognome2=Chiarcos|first2nome2=Christian|last3cognome3=McCrae|first3nome3=John P.|last4cognome4=Gracia|first4nome4=Jorge|datedata=2020|publishereditore=Springer International Publishing|isbn=978-3-030-30224-5|languagelingua=en}}</ref> queste raccomandazioni includono:
 
* per la modellazione di risorse lessicali
**[[OntoLex-Lemon]], standard comunitario per risorse lessicali (dizionari in format leggibile dale machine, terminologie multilingui, lessicalizzazione di ontologie) <ref>{{CiteCita web|titletitolo=Lexicon Model for Ontologies: Community Report, 10 May 2016|url=https://www.w3.org/2016/05/ontolex/Overview.html|access-dateaccesso=5 giugno 2020-06-05|website=www.w3.org}}</ref>
*per la modellazione di annotazioni linguistiche (nei corpora o nell’elaborazione del linguaggio naturale)
**[[Web annotation|Web Annotation]], uno standard W3C per l’annotazione di risorse Web (testuali e non solo) <ref>{{CiteCita web|titletitolo=Deliverables of W3C’s Web Annotation Working Group|url=https://w3c.github.io/web-annotation/|access-dateaccesso=5 giugno 2020-06-05|website=w3c.github.io}}</ref>
**NLP Interchange Format (NIF), uno standard comunitario per l’annotazione grammaticale dei testi<ref>{{CiteCita journalpubblicazione|lastcognome=Hellmann|firstnome=Sebastian|last2cognome2=Lehmann|first2nome2=Jens|last3cognome3=Auer|first3nome3=Sören|last4cognome4=Brümmer|first4nome4=Martin|datedata=2013|editor-last=Alani|editor-firstcuratore=Harith|editor2-last=Kagal|editor2-first=Lalana|editor3-last=Fokoue|editor3-first=Achille|editor4-last=Groth|editor4-first=Paul|editor5-last=Biemann|editor5-first=Chris|editor6-last=Parreira|editor6-first=Josiane Xavier|editor7-last=Aroyo|editor7-first=Lora|editor8-last=Noy|editor8-first=Natasha|editor9-last=WeltyAlani|editor9curatore-firstnome9=Chris|titletitolo=Integrating NLP Using Linked Data|url=https://link.springer.com/chapter/10.1007/978-3-642-41338-4_7|journalrivista=The Semantic Web – ISWC 2013|seriesserie=Lecture Notes in Computer Science|languagelingua=en|___locationcittà=Berlin, Heidelberg|publishereditore=Springer|pagespp=98–11398-113|doi=10.1007/978-3-642-41338-4_7|isbn=978-3-642-41338-4|doi-access=free}}</ref>
**CoNLL-RDF, un vocabolario basato su NIF per la rappresentazione in RDF dei corpora in format TSV ("CoNLL")<ref>{{CiteCita journalpubblicazione|lastcognome=Chiarcos|firstnome=Christian|last2cognome2=Fäth|first2nome2=Christian|datedata=2017|editor-last=Gracia|editor-firstcuratore=Jorge|editor2-last=Bond|editor2-first=Francis|editor3-last=McCrae|editor3-first=John P.|editor4-last=Buitelaar|editor4-first=Paul|editor5-last=Chiarcos|editor5-first=Christian|editor6-last=Hellmann|editor6-first=SebastianGracia|titletitolo=CoNLL-RDF: Linked Corpora Done in an NLP-Friendly Way|url=https://link.springer.com/chapter/10.1007/978-3-319-59888-8_6|journalrivista=Language, Data, and Knowledge|seriesserie=Lecture Notes in Computer Science|languagelingua=en|___locationcittà=Cham|publishereditore=Springer International Publishing|pagespp=74–8874-88|doi=10.1007/978-3-319-59888-8_6|isbn=978-3-319-59888-8}}</ref>
**POWLA, un vocabolario per le strutture dei dati linguistici generali che può integrare NIF, CoNLL-RDF o Web Annotation<ref>{{CiteCita journalpubblicazione|lastcognome=Chiarcos|firstnome=Christian|datedata=2012|editor-lastcuratore=Elena Simperl|editor-first=Elena|editor2-last=Cimiano|editor2-first=Philipp|editor3-last=Polleres|editor3-first=Axel|editor4-last=Corcho|editor4-first=Oscar|editor5-last=Presutti|editor5-first=Valentina|titletitolo=POWLA: Modeling Linguistic Corpora in OWL/DL|url=https://link.springer.com/chapter/10.1007/978-3-642-30284-8_22|journalrivista=The Semantic Web: Research and Applications|seriesserie=Lecture Notes in Computer Science|languagelingua=en|___locationcittà=Berlin, Heidelberg|publishereditore=Springer|pagespp=225–239225-239|doi=10.1007/978-3-642-30284-8_22|isbn=978-3-642-30284-8|doi-access=free}}</ref>
 
* per le categorie dei dati linguistici
**[[Ontologies of Linguistic Annotation|Ontologies of Linguistic Annotation (OLiA)]] per le annotazioni linguistiche<ref>{{CiteCita journalpubblicazione|lastcognome=Chiarcos|firstnome=Christian|last2cognome2=Sukhareva|first2nome2=Maria|datedata=1º gennaio 2015-01-01|titletitolo=OLiA – Ontologies of Linguistic Annotation|url=https://content.iospress.com/articles/semantic-web/sw167|journalrivista=Semantic Web|languagelingua=en|volume=6|issuenumero=4|pagespp=379–386379-386|doi=10.3233/SW-140167|issn=1570-0844}}</ref>
**lexinfo per gli aspetti grammaticali delle risorse lessicali<ref>{{CiteCita journalpubblicazione|lastcognome=Cimiano|firstnome=P.|last2cognome2=Buitelaar|first2nome2=P.|last3cognome3=McCrae|first3nome3=J.|last4cognome4=Sintek|first4nome4=M.|datedata=1º marzo 2011-03-01|titletitolo=LexInfo: A declarative model for the lexicon-ontology interface|url=http://www.sciencedirect.com/science/article/pii/S1570826810000892|journalrivista=Journal of Web Semantics|languagelingua=en|volume=9|issuenumero=1|pagespp=29–5129-51|doi=10.1016/j.websem.2010.11.001|issn=1570-8268}}</ref>
*per l’identificazione della lingua
**stringhe taggate con la lingua usando i [[IETF language tag|47 tag di lingua IETF BCP 47]]
** URI [[ISO 639-3]] forniti da lexvo.org<ref>{{CiteCita journalpubblicazione|lastcognome=de Melo|firstnome=Gerard|datedata=1º gennaio 2015-01-01|titletitolo=Lexvo.org: Language-related information for&nbsp;the Linguistic Linked Data cloud|url=https://content.iospress.com/articles/semantic-web/sw171|journalrivista=Semantic Web|languagelingua=en|volume=6|issuenumero=4|pagespp=393–400393-400|doi=10.3233/SW-150171|issn=1570-0844}}</ref>
** URI per varietà di lingue non coperte dall’ISO 639 usando [[Glottolog]]
*per i metadata
**[[Dublin Core]], uno standard comunitario di termini che possono essere utilizzati per descrivere risorse Web
** Data Catalog Vocabulary (DCAT), uno standard W3C per i cataloghi di dati pubblicati sul Web<ref>{{CiteCita web|titletitolo=Data Catalog Vocabulary (DCAT) - Version 2|url=https://www.w3.org/TR/vocab-dcat-2/|access-dateaccesso=5 giugno 2020-06-05|website=www.w3.org|languagelingua=en}}</ref>
**METASHARE-OWL, vocabolario per I metadata delle risorse linguistiche<ref>{{CiteCita journalpubblicazione|lastcognome=McCrae|firstnome=John P.|last2cognome2=Labropoulou|first2nome2=Penny|last3cognome3=Gracia|first3nome3=Jorge|last4cognome4=Villegas|first4nome4=Marta|last5cognome5=Rodríguez-Doncel|first5nome5=Víctor|last6cognome6=Cimiano|first6nome6=Philipp|datedata=2015|editor-lastcuratore=Fabien Gandon|editor-first=Fabien|editor2-last=Guéret|editor2-first=Christophe|editor3-last=Villata|editor3-first=Serena|editor4-last=Breslin|editor4-first=John|editor5-last=Faron-Zucker|editor5-first=Catherine|editor6-last=Zimmermann|editor6-first=Antoine|titletitolo=One Ontology to Bind Them All: The META-SHARE OWL Ontology for the Interoperability of Linguistic Datasets on the Web|url=https://link.springer.com/chapter/10.1007/978-3-319-25639-9_42|journalrivista=The Semantic Web: ESWC 2015 Satellite Events|seriesserie=Lecture Notes in Computer Science|languagelingua=en|___locationcittà=Cham|publishereditore=Springer International Publishing|pagespp=271–282271-282|doi=10.1007/978-3-319-25639-9_42|isbn=978-3-319-25639-9|doi-access=free}}</ref>
A partire dalla metà del 2020, molti di questi standard comunitari sono diventati oggetto di diverse attività. In particolare, l’esistenza di molteplici standard per le annotazioni linguistiche che risultano incompatibili tra di loro appare problematica. All’inizio del 2020, la W3C Community Group Linked Data for Language Technology ha iniziato a lavorare per consolidare e uniformare questi (e altri) vocabolari per l’annotazione linguistica sul Web.<ref>{{CitationCita pubblicazione|titletitolo=ld4lt/linguistic-annotation|datedata=19 maggio 2020-05-19|url=https://github.com/ld4lt/linguistic-annotation|publishereditore=ld4lt|access-dateaccesso=5 giugno 2020-06-05}}</ref>
 
=== Comunità ===
Riga 49:
Diversi gruppi Business and Community del W3C si focalizzano su aspetti specialistici dei LLOD:
* Il W3C Ontology-Lexica Community Group ([[OntoLex]]) sviluppa e mantiene le specifiche per I dizionari machine-readable (in formato leggibile dalla macchina) nella cloud LLOD.
* Il W3C Best Practices for Multilingual Linked Open Data Community Group raccoglie informazioni sulle best practices per produrre linked open data multilingui.<ref>{{citeCita web |titletitolo=Best Practices for Multilingual Linked Open Data Community Group |url=https://www.w3.org/community/bpmlod/ |accessdateaccesso=9 Decemberdicembre 2019}}</ref>
* La W3C Linked Data for Language Technology Community Group raccoglie casi d’uso e I requisiti per le applicazioni relative alle tecnologie del linguaggio che usano Linked Data.<ref>{{citeCita web |titletitolo=Linked Data for Language Technology Community Group |url=https://www.w3.org/community/ld4lt/ |accessdateaccesso=9 Decemberdicembre 2019}}</ref>
 
Lo sviluppo dei LLOD è portato avanti e documentato in una serie di workshop internazionali, datathon e relative pubblicazioni. Tra le altre, sono incluse le seguenti:
Riga 59:
== Impiego dei LLOD ==
I Linguistic Linked Open Data sono stati applicati in diverse aree di ricerca scientifica:
In tutte le aree della linguistica empirica, della filologia computazionale e nell’[[elaborazione del linguaggio naturale]], l’annotazione linguistica e l’utilizzo di markup (in italiano marcature) linguistici rappresentano un elemento centrale di analisi. Tuttavia, il progresso in tale campo è stato ostacolato dal problema dell’[[Interoperabilità|interoperabilità]], soprattutto a causa delle differenze nei vocabolari e negli schemi di annotazione usati per differenti risorse e strumenti. L’uso dei Linked Data per connettere le risorse linguistiche e le banche dati di [[Ontologia_Ontologia (informatica)|ontologie]]/[[Terminologia|terminologia]] facilita il ri-uso di vocabolari condivisi e l’interpretazione degli stessi rispetto ad una base comune.
* Nella [[Corpus#Linguistica_dei_CorporaLinguistica dei Corpora|linguistica dei corpora]] e nella filologia computazionale, la [[Overlapping_markupOverlapping markup|sovrapposizione delle marcature]] rappresenta un problema riconosciuto per i formati [[XML]]. Per questo motivo, modelli di dati basati sui grafi sono stato proposti a partire dalla fine degli anni ’90. <ref>{{citeCita web|last1cognome1=Bird|first1nome1=Steven|last2cognome2=Liberman|first2nome2=Mark|titletitolo=Towards a formal framework for linguistic annotations|url=http://www.ldc.upenn.edu/sb/home/papers/icslp98.pdf|publishereditore=In: Proceedings of the International Conference on Spoken Language Processing, Sydney, 1998|accessdateaccesso=25 maggio 2016-05-25}}{{deadCollegamento linkinterrotto|datedata=Decemberdicembre 2017 |bot=InternetArchiveBot |fix-attempted=yes }}</ref>. Tali modelli sono tradizionalmente rappresentati attraverso molteplici file XML interconnessi (standoff XML),<ref>{{citeCita web|last1cognome1=ISO 24612:2012|titletitolo=Language resource management -- Linguistic annotation framework (LAF)|url=http://www.iso.org/iso/catalogue_detail.htm?csnumber=37326|publishereditore=ISO|accessdateaccesso=2016-05-25 maggio 2016}}</ref> che non sono adeguatamente supportati dalla tecnologia XML standard.<ref>{{citeCita booklibro|last1cognome1=Eckart|first1nome1=Richard|titletitolo=Choosing an XML database for linguistically annotated corpora|datedata=2008|publishereditore=SDV. Sprache und Datenverarbeitung 32.1/2008: International Journal for Language Data Processing, Workshop Datenbanktechnologien für hypermediale linguistische Anwendungen (KONVENS 2008), Universitätsverlag Rhein-Ruhr, Berlin, Sep 2008|pagespp=7–227-22|url=http://cat.inist.fr/?aModele=afficheN&cpsidt=20680853}}</ref> Modellare tali complesse annotazioni come Linked Data rappresenta un formalismo semanticamente equivalente all’utilizzo dell’XML (standoff XML),<ref>{{citeCita web|last1cognome1=Chiarcos|first1nome1=Christian|titletitolo=Interoperability of Corpora and Annotations (draft version)|url=http://acoli.cs.uni-frankfurt.de/bibtex/papers/chiarcos2012-ldl-corpora.pdf|publishereditore=In: Christian Chiarcos, Sebastian Nordhoff, and Sebastian Hellmann (eds.) Linked Data in Linguistics. Representing and Connecting Language Data and Language Metadata, 2012|accessdateaccesso=25 maggio 2016|dataarchivio=10 maggio 2017|urlarchivio=https://web.archive.org/web/20170510064852/http://acoli.cs.uni-05frankfurt.de/bibtex/papers/chiarcos2012-25ldl-corpora.pdf|urlmorto=sì}}</ref> che elimina il bisogno di una tecnologia specifica (special purpose technology) e, invece, si basa sull’esistente ecosistema RDF.
* Problemi relativi al multilinguismo, incluso il collegamento di risorse lessicali come nel caso di [[WordNet]] nell'indice interlinguale della Global WordNet Association e l'interconnessione di risorse eterogenee come WordNet e Wikipedia, come è stato fatto in [[BabelNet]].
* Favorire il dibattito sulla standardizzazione delle informazioni relative alle risorse linguistiche.
Riga 67:
* best practices per creare [[Web annotation|annotazioni Web]] (ad esempio utilizzando lo standard [[Web Annotation]])
* best practices per modellare e condividere risorse lessicali con [[Overlapping markup|sovrapposizione delle marcature]].
 
=== Progetti di ricerca ===
Usi e sviluppo dei LLOD sono stati oggetto di progetti di ricerca europei su larga scala, inclusi:
* LOD2. Creating Knowledge out of Interlinked Data (11 paesi europei + Korea, 2010–2014)<ref>{{citeCita web |titletitolo=lod2.okfn.org (archived version) |url=http://lod2.okfn.org/ |accesso=9 dicembre 2019 |dataarchivio=7 marzo 2014 |urlarchivio=https://archive.is/20140307183201/http://lod2.okfn.org/ |accessdateurlmorto=9 December 2019}}</ref>
* MONNET. Multilingual Ontologies for Networked Knowledge (5 paesi europei, 2010–2013)<ref>{{citeCita web |titletitolo=Multilingual Ontologies for Networked Knowledge (Monnet) |url=https://cordis.europa.eu/project/rcn/93713/factsheet/en?WT.mc_id=RSS-Feed&WT.rss_f=project&WT.rss_a=93713&WT.rss_ev=a |publishereditore=European Commission, CORDIS EU research results |accessdateaccesso=10 Decemberdicembre 2019}}</ref>
* LIDER. Linked Data as an enabler of cross-media and multilingual content analytics for enterprises across Europe (5 paesi europei, 2013–2015)<ref>{{citeCita web |titletitolo=LIDER: Linked Data as an enabler of cross-media and multilingual content analytics for enterprises across Europe |url=https://cordis.europa.eu/project/rcn/111151/factsheet/en |publishereditore=European Commission, CORDIS EU research results |accessdateaccesso=10 Decemberdicembre 2019}}</ref>
* QTLeap. Quality Translation by Deep Language Engineering Approaches (6 paesi europei, 2013–2016)<ref>{{citeCita web |titletitolo=Quality Translation by Deep Language Engineering Approaches |url=https://cordis.europa.eu/project/rcn/110559/en |publishereditore=European Commission, CORDIS EU research results |accessdateaccesso=10 Decemberdicembre 2019}}</ref>
* LiODi. Linked Open Dictionaries (BMBF eHumanities Early Carreer Research Group, Goethe University Frankfurt, Germany, 2015-2020)<ref>{{citeCita web |titletitolo=Linked Open Dictionaries (LiODi) |url=http://www.acoli.informatik.uni-frankfurt.de/liodi.html |accessdateaccesso=10 Decemberdicembre 2019 |dataarchivio=17 gennaio 2020 |urlarchivio=https://web.archive.org/web/20200117111249/http://www.acoli.informatik.uni-frankfurt.de/liodi.html |urlmorto=sì }}</ref>
* FREME. Open Framework of E-Services for Multilingual and Semantic Enrichment of Digital Content (6 paesi europei, 2015-2017)<ref>{{citeCita web |titletitolo=Open Framework of E-Services for Multilingual and Semantic Enrichment of Digital Content |url=https://cordis.europa.eu/project/rcn/194243/factsheet/en |accessdateaccesso=10 Decemberdicembre 2019}}</ref>
* POSTDATA. Poetry Standardization and Linked Open Data (ERC Starting Grant, UNED, Spain, 2016-2021)<ref>{{citeCita web |titletitolo=POSTDATA – Poetry Standardization and Linked Open Data |url=http://postdata.linhd.uned.es/ |accessdateaccesso=10 Decemberdicembre 2019}}</ref>
* Linking Latin (ERC Consolidator Grant, Universita Cattolica del Sacro Cuore, Italy, 2018-2023)<ref>{{citeCita web |titletitolo=Linking Latin. Building a Knowledge Base of Linguistic Resources for Latin |url=https://cordis.europa.eu/project/rcn/214068/factsheet/en |accessdateaccesso=10 Decemberdicembre 2019}}</ref>
* Pret-a-LLOD (5 paesi europei, 2019-2021)<ref>{{citeCita web |titletitolo=Pret-a-LLOD project home page |url=http://www.pret-a-llod.eu/ |accessdateaccesso=10 Decemberdicembre 2019}}
{{citeCita web |url=https://cordis.europa.eu/project/rcn/220250/factsheet/en |titletitolo=Pret-a-LLOD |publishereditore= European Commission, CORDIS EU research results|accessdateaccesso=10 Decemberdicembre 2019}}
</ref>
* NexusLinguarum. European network for Web-centred linguistic data science (COST Action, 35 paesi COST, 2 paesi vicini, un paese partner internazionale, 2019-2023) <ref>{{citeCita web |titletitolo=CA18209 - European network for Web-centred linguistic data science |url=https://www.cost.eu/actions/CA18209 |publishereditore=cost. European Cooperation in Science and Technology |accessdateaccesso=10 Decemberdicembre 2019}}</ref>
 
=== Risorse ===
A partire da ottobre 2018, le dieci risorse maggiormente connesse nel diagramma LLOD sono (in base delal numero di dataset connessi):
* Ontologies of Linguistic Annotation (OLiA, connesse con 74 dataset) riferimento terminologico per le annotazioni linguistiche e I metadata grammaticali;
* [[WordNet]] (connesso con 51 dataset), database lessicale per l’inglese e fulcro per lo sviluppo di database simili in altre lingue, con diverse versioni (la versione di Princeton connessa con 36 dataset; la versione W3C connessa con 8 dataset; la versione VU connessa con 7 dataset);
* [[DBpedia]] (connessa con 50 dataset) [[base di conoscenza]] multilingue basata su Wikipedia;
* lexinfo.net (connesso con 36 dataset) riferimento terminologico per risorse lessicali;
* [[BabelNet]], realizzato da [[Roberto Navigli]] presso L'[[Università degli Studi di Roma "La Sapienza"]], (connesso con 33 dataset) [[semantic network]] multilingue lessicalizzato, basato sulla aggregazione di risorse diverse ed eterogenee risorse, tra cui WordNet e Wikipedia;
* lexvo.org (connesso con 26 dataset) fornisce identificativi per le lingue e altri dati relative alle lingue. Soprattutto, lexvo fornisce una rappresentazione RDF dei codici a 3 lettere dell’[[ISO 639-3]] per gli identificativi delle lingue e delle informazioni su queste lingue;
* L’[[ISO 12620]] Data Category Registry (ISOcat; versione RDF, connesso con 10 dataset) fornisce un archivio semi-strutturato per diversa terminologia relativa alle lingue. ISOcat è ospitato da The Language Archive, precisamente dal progetto [[DOBES]], presso il [[Max Planck Institute for Psycholinguistics]], ma attualmente in transizione verso [[CLARIN]];
* [[UBY]] (versione RDF ''lemon-Uby'', connesso con 9 dataset), un network lessicale per l’inglese, aggregazione di varie risorse lessicali;
* [[Glottolog]] (connesso con 7 dataset) fornisce identificativi a grana fine di lingue meno diffuse, in particolare quelle non comprese in lexvo.org;
* [[Wiktionary]]-[[DBpedia]] links (''wiktionary.dbpedia.org'', linked with 7 datasets), Wiktionary-based lexicalizations for DBpedia concepts.
 
== Note ==
<references/>
 
{{Portale|internet|linguistica}}
==References==
{{reflist}}
 
[[Categoria:Dati_apertiDati aperti]]
[[Categoria:Web_semanticoWeb semantico]]
[[Categoria:World_Wide_Web_ConsortiumElaborazione del linguaggio naturale]]
[[Categoria:Elaborazione_del_linguaggio_naturaleLinguistica]]
[[Category:Linguistica]]