Web semantico: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m Errori di Lint: Tag non chiusi
mNessun oggetto della modifica
 
(32 versioni intermedie di 23 utenti non mostrate)
Riga 1:
Con il termineIl '''web semantico''', termineè coniato dal suo ideatore, [[Tim Berners-Lee]], si intende la trasformazioneun'estensione del [[World Wide Web]] in un ambiente dovecui i documenti pubblicati (pagine [[HTML]], [[file]], [[immagine digitale|immagini]], e così via) sono associati ad informazioni e dati ([[metadato|metadati]]) che ne specificano il contesto [[semantica|semantico]] in un formato adatto all'interrogazione e lall'interpretazione (es. tramite [[motore di ricerca|motori di ricerca]]) e, più in generale, all'[[Dati processabili automaticamente|elaborazione automatica]].
 
Con l'interpretazione del contenuto dei documenti che il Web semantico impone, saranno possibili ricerche molto più evolute delle attuali, basate sulla presenza nel documento di parole chiave, e altre operazioni specialistiche come la costruzione di reti di relazioni e connessioni tra documenti secondo logiche più elaborate del semplice [[collegamento ipertestuale]]. Il termine è stato coniato da [[Tim Berners-Lee]], inventore del Web.<ref>{{Cita|Tim Berners-Lee, 2001}}.</ref>
 
== Introduzione ==
Per la sua costruzione/definizione, si potrebbe pensare di utilizzare l'[[XML]], un metalinguaggio che consente di descrivere (e con il dettaglio desiderato) le diverse parti di un documento. Un documento così descritto può poi essere elaborato per usi diversi: estrazione di informazioni secondo specifici criteri, riformulazione più o meno parziale per l'adattamento ad altri formati, visualizzazione in funzione delle capacità del terminale. XML però non consente una definizione semantica adeguata, per motivi che specificheremo dopo.
 
Sebbene un documento sia un buon modo per specificare informazioni, un documento, ancorché espresso in formato XML, è poco adatto al [[Web]] che, per sua natura, è distribuito e decentralizzato e, quindi, informazioni su una particolare entità possono essere localizzate ovunque.
 
Infatti, con XML è possibile descrivere adeguatamente i contenuti di un documento, ma la [[sintassi]] XML non definisce alcun meccanismo esplicito per qualificare le relazioni tra documenti. In questo non è di aiuto neppure il meccanismo dei [[Collegamento ipertestuale|collegamenti ipertestuali]] reso popolare dall'[[HTML]] perché amorfo, cioè non prevede la possibilità di descrivere il legame definito.
Riga 16:
Poiché, però, i diversi documenti sono redatti per scopi differenti, indipendentemente gli uni dagli altri e normalmente senza condividere un comune formato XML, informazioni utili quali l'indirizzo postale o la data di nascita finiscono per essere espresse in modo dissimile e non uniforme. L'indirizzo in un caso può essere semplicemente racchiuso dal ''[[Tag HTML|tag]]'' <''indirizzo''>, in altri da <''indirizzo_postale''>, <''direccion''>, <''address''> o <''adresse''>, e poi è da considerare la possibilità di avere esplicitamente identificati <''via''>, <''numero_civico''>, ... rendendo ardua e non priva di rischi ogni [[deduzione]] automatica.
 
Nei prossimi paragrafi si illustreranno prima il linguaggio utilizzato per costruire il web semantico, quindi le previste evoluzioni, gli strumenti e il contributo che queste tecnologie potrebbero dare per rispondere definitivamente ad uno dei problemi irrisolti in ambito informatico: la [[gestione della conoscenza aziendale|gestione della conoscenza]].
 
== I primi linguaggi: RDF, N3 ==
L'evoluzione del web in web semantico inizia con la definizione, da parte del [[W3C]], dello standard [[Resource Description Framework]] (RDF), una particolare applicazione XML che standardizza la definizione di relazioni tra informazioni ispirandosi ai principi della [[logica dei predicati]] (o logica predicativa del primo ordine) e ricorrendo agli strumenti tipici del [[Web]] (ad es. [[Uniform Resource Identifier|URI]]) e dell'XML (''[[namespace]]'').
 
In estrema sintesi, secondo la logica dei predicati le informazioni sono esprimibili con '''asserzioni''' (''statement'' in inglese) costituite da tripletriplette formate da '''soggetto''', '''predicato''' e '''valore''' (in inglese spesso identificati come ''subject'', ''verb'' e ''object'', rispettivamente). Ad esempio, le seguenti affermazioni su un [[Presidente della Repubblicarepubblica]] italiano:
#''Il Signor Ciampi vive a Roma''.
#''Il Signor Ciampi ha codice fiscale CMPCLZ20T09E625V''.
Riga 43:
| CMPCLZ20T09E625V
|}
allora, per alcuni di questi elementi, è possibile reperire ''arbitrariamente'' sul [[Web]] [[Uniform Resource Identifier|URI]] (risorse) che li identificano univocamente quali:
{| class="wikitable"
| Il Signor Ciampi
| http://wwwpresidenti.quirinale.it/qrnw/statico/ex-presidenti/Ciampi/cia-biografia.htm
|-
| vive a
| httphttps://it.wiktionary.org/wiki/vivere
|-
| Roma
Riga 55:
|-
| Ha codice fiscale
| [[codice fiscale]]
| http://it.wikipedia.org/wiki/codice_fiscale
|}
 
Riga 66:
Nei prossimi paragrafi si descrive come formalizzare le precedenti frasi in RDF nella sua [[forma canonica]], in due suoi formati testuali alternativi (''[[Notation 3|N3]]'' ed ''N3 con prefissi'') e graficamente.
 
Si segnala che appositi programmi come ''IsaViz''<ref>[http{{cita web|url=https://www.w3.org/2001/11/IsaViz/ |titolo=IsaViz su w3.org]}}</ref> del W3C consentono di passare da un formato all'altro e sono utili per la sperimentazione del Web semantico.
 
=== Soluzione RDF canonica ===
Riga 180:
Alcuni applicativi, come il già citato ''IsaViz'', utilizzato in quest'esempio, adottano [[ellisse|ellissi]] per i nodi che sono [[Uniform Resource Identifier|URI]] (http://www.comune.roma.it/index.asp), altrimenti dei rettangoli per i nodi che contengono semplici [[Stringa (informatica)|stringhe]] di caratteri (CMPCLZ20T09E625V). Detto ciò, al nostro esempio corrisponde il [[grafo]]:
 
[[File:RDF_GrafoIsaViz_Esempio_Ciampi1RDF GrafoIsaViz Esempio Ciampi1.JPG|thumb|center|upright=2.9|Grafo RDF dell'esempio generato con il tool IsaViz]]
 
=== Soluzione N3 ===
''[[Notation 3|N3]]'' (noto anche come ''N-triples'' o ''Notation 3'') propone una forma più facile da leggere rispetto ad RDF e l'esempio che stiamo considerando trova la seguente soluzione:
<http://www.quirinale.it/qrnw/statico/ex-presidenti/Ciampi/cia-biografia.htm">
<httphttps://it.wiktionary.org/wiki/vivere>
<http://www.comune.roma.it/index.asp>''.''
<http://www.quirinale.it/qrnw/statico/ex-presidenti/Ciampi/cia-biografia.htm">
<[[codice fiscale]]>
<http://it.wikipedia.org/wiki/codice_fiscale>
"CMPCLZ20T09E625V"''.''
 
Riga 198:
 
@prefix presidente: http://www.quirinale.it/presidente/
@prefix wikipedia: httphttps://it.wikipedia.org/wiki/
@prefix wikidizionario: httphttps://it.wiktionary.org/wiki/
@prefix comune_roma: http://www.comune.roma.it/
Riga 210:
RDF non è che il primo passo. Il web semantico lo si sta costruendo a strati:
 
[[File:Semantic Web Stack.png|thumb|center|upright=1.4|W3C Semantic Web Layer Cake<ref>[http{{cita web|url=https://www.w3.org/2007/03/layerCake.png |titolo=Immagine su w3.org]}}</ref>]]
 
La logica predicativa del primo ordine è estremamente complessa, e RDF ne poteva esprimere una porzione molto ristretta. Non solo: questa logica, se presa complessivamente, non è nemmeno computabile, mentre possono essere computabili delle logiche costituite da sottoinsiemi degli operatori della logica del primo ordine. Questi sottoinsiemi della logica formale sono studiati dalle [[logiche descrittive]], o ''description logics'', ed una di queste è stata adottata per la formulazione di un nuovo standard, più ricco ed espressivo di RDF: [[Web Ontology Language|OWL]].
Riga 232:
Per quanto riguarda l{{'}}''inversa'', invece basta pensare che quando si afferma che ''[[Romolo]] è fratello di Remo'', si intende anche che ''Remo è fratello di Romolo'', '''asserzione''' da fare esplicitamente in RDF per poter essere nota al sistema. Operazione fattibile ma tediosa. Per ovviare a ciò, sarebbe sufficiente poter definire una volta per tutte che se ''X è fratello di Y'' allora è vero anche ''Y è fratello di X''.
 
Questi costrutti, insieme ad altri, sono stati introdotti per primi da linguaggi precedenti o contemporanei ad RDF quali [[DAML]] (definito dall'americana [[DARPA]]) ed [[Ontology Inference Layer|OIL]] (sponsorizzata dalla [[Unione europea]] nell'ambito del programma [IST<ref>{{cita web|url=http://cordis.europa.eu/ist/ |titolo=IST]}}</ref>), successivamente confluiti in [[DAML OIL|DAML+OIL]]. Su questa base il W3C ha definito OWL (''[[Web Ontology Language]]'').
 
OWL esiste in tre forme, caratterizzate da diversi gradi di complessità e - conseguentemente - di [[computabilità]]. ''OWL-Lite'' è computabile (ossia è possibile trovare tutte le soluzioni in un tempo finito) ma poco espressivo; OWL-Lite è poco usato, poiché esiste ''OWL-DL'', che è ugualmente computabile ma più ricco. Infine esiste ''OWL-Full'', che copre tutta la ricchezza della logica predicativa, ma non è computabile e non è quindi adatto al ragionamento automatico.
Riga 246:
Molto più opportuno sarebbe utilizzare la biografia definita in Wikipedia oppure il Codice Fiscale con, ad es.,
 
:''{{collegamento interrotto|1=http://www.agenziaentrate.it/servizi/CF#CMPCLZ20T09E625V |data=maggio 2018 |bot=InternetArchiveBot }}''
 
Sebbene questa URI oggi non referenzi alcunché sul Web, la si potrebbe comunque utilizzare allo scopo perché RDF non presuppone alcuna verifica sulla effettiva disponibilità della risorsa stessa. In questo modo tutte le persone fisiche e giuridiche contemporanee e non solo personaggi, aziende, enti ed istituzioni "importanti" potrebbero essere univocamente identificati, potenziando notevolmente le possibilità di RDF (in ogni caso nulla vieterebbe all'[[Agenzia delle Entrateentrate]] di mettere a disposizione un servizio che a partire dalla URI citata restituisca automaticamente le relative informazioni anagrafiche).
 
Ciò detto, si potrebbe affermare che:
:''La risorsa individuata dal codice fiscale CMPCLZ20T09E625V vive a Roma, ha una biografia in http://it.wikipedia.org/wiki/carlo_azeglio_ciampi[[carlo azeglio ciampi]] ed un'altra in http://www.quirinale.it/presidente/ciampi.htm''
 
ovvero:
 
@prefix agenzia: https://web.archive.org/web/20050212035111/http://www.agenziaentrate.it/servizi/
@prefix comune_roma: http://www.comune.roma.it/
@prefix presidente: http://www.quirinale.it/presidente/
@prefix wikipedia: httphttps://it.wikipedia.org/wiki/
@prefix wikidizionario: httphttps://it.wiktionary.org/wiki/
agenzia:CF#CMPCLZ20T09E625V wikidizionario:vivere comune_roma:index.asp
Riga 265:
agenzia:CF#CMPCLZ20T09E625V wikidizionario:biografia wikipedia:carlo_azeglio_ciampi
 
Un altro accorgimento da tenere presente nella scelta dei termini da utilizzare per la definizione delle relazioni è di ricorrere a dizionari già noti e diffusi, invece che inventarne ogni volta di nuovi. Ad es. per le informazioni anagrafiche personali tipiche dei biglietti da visita quali ''nome'', ''cognome'', ''indirizzo'', ''e-mail'', ''ruolo aziendale''... è già disponibile [[vCard]]<ref>{{Cita web|lingua=en}}[http|url=https://www.w3.org/TR/2001/NOTE-vcard-rdf-20010222/ |titolo=Representing vCard Objects in RDF/XML]}}</ref>. Non sono da dimenticare neppure le numerose applicazioni XML definite per abilitare l'EDI (''[[Electronic Data Interchange]]'', scambio dati elettronico) nell'ambito della pubblica amministrazione ([[e-government]]) o di associazioni di settore.
Da quanto esposto finora è facile intuire che, nella costruzione del web semantico, progetti come [[Wikipedia]] o [[Wikizionario]] non sono solo funzionali ma, adeguatamente sfruttati, anche abilitanti perché forniscono lemmi ben documentati per individuare risorse e predicati, garantendone la stabilità nel tempo e, grazie alla possibilità di dichiarare equivalenze nella stessa lingua e tra lingue diverse, di accrescere ulteriormente l'estensione di un'indagine automatica.
Riga 272:
Ovviamente non è sufficiente avere solo una sintassi per esprimere predicati. Per rendere concreto ed utile quanto detto finora, occorrono anche strumenti in grado di gestire un insieme di asserzioni per rispondere alle richieste utente.
 
Per quanto riguarda N3, la gran parte di questi strumenti, come si può intuire dagli esempi di ''N3'' ed ''N3 con prefissi'', archivianoarchivia le asserzioni in una o più tabelle di un [[database relazionale]]. Alcune di queste soluzioni sono state censite dal progetto ''[httpSWAD-Europe<ref>{{cita web|url=https://www.w3.org/2001/sw/Europe/ |titolo=SWAD-Europe]''}}</ref> sponsorizzata dall'Unione Europea nell'ambito dell'iniziativa [IST<ref>{{cita web|url=http://www.cordis.lu/ist/ |titolo=IST]|urlarchivio=https://web.archive.org/web/20040622084118/http://www.cordis.lu/ist/ }}</ref>.
 
Sui documenti scritti in OWL (o [[ontologia (informatica)|ontologie]]), invece, si può eseguire un vero e proprio ragionamento deduttivo inferenziale, realizzato tramite ragionatori automatici.
 
=== Linguaggi di query ===
Per utilizzare le basi di conoscenza formalizzate secondo questi standard è necessario un linguaggio per interrogarle. '''[[SPARQL]]''' (Simple Protocol And RDF Query Language) è uno dei linguaggi definiti per interrogare sistemi che gestiscono asserzioni RDF. Ad oggi sono disponibili altri linguaggi funzionalmente equivalenti ma SPARQL è candidato a divenire una raccomandazione [[W3C]]<ref>{{Cita web|lingua=en}}[http|url=https://www.w3.org/TR/rdf-sparql-query/ |titolo=SPARQL Query Language for RDF, W3C Recommendation 15 January 2008]}}</ref>.
 
Per interrogare OWL, invece, manca ancora uno standard, ed i singoli ragionatori implementano linguaggi di query proprietari.
 
== Web semantico e gestione della conoscenza ==
Da quanto detto si capisce perché se l'[[XML]] si rivolge alla descrizione di documenti, RDF (e sue evoluzioni) è particolarmente indicato per rappresentare dati, fornendo un metodo potenzialmente capace di risolvere un tema finora solo parzialmente soddisfatto da strumenti informatici: la [[gestione della conoscenza aziendale|gestione della conoscenza]], ovvero la capacità non solo di trattare le diverse [[anagrafica|anagrafiche]] (di prodotto, clienti, fornitori, dipendenti,...) e di classificare i documenti tecnici o amministrativi, (analisi di mercato, specifiche tecniche, norme, procedure...) ma di arrivare anche a gestire i ''contenuti'' di questi documenti permettendo, ad es., il reperimento delle informazioni in funzione delle specifiche esigenze del richiedente, integrando quanto reso disponibile da fonti diverse<ref>{{Cita web|lingua=en}}[http|url=https://www.w3.org/TR/webont-req/#usecase-designdoc |titolo=OWL Web Ontology Language Use Cases and Requirements]}}</ref>.
 
Per quanto riguarda le anagrafiche, sarebbe molto semplice mappare i dati già disponibili in un [[RDBMS]] in asserzioni RDF - per ciascuna tabella:
Riga 304:
Il web semantico per funzionare deve poter disporre di informazione strutturata e di regole di deduzione per gestirla, in modo da accostare quelle informazioni che un'interrogazione ha richiesto.
[[Tim Berners-Lee]] ha sottolineato che uno degli elementi fondamentali del web semantico sarà la compresenza di più ontologie. Se si vuole un sistema dinamico in grado di raffinarsi e funzionare su scala universale, bisognerà pagare il prezzo di una certa dose di incoerenza.
A partire dal 2006 il progetto di realizzazione del web semantico mediante la costruzione di ontologie è stato parzialmente revisionato. In un articolo pubblicato su ''International Journal on Semantic Web and Information Systems''<ref>[{{cita web|url=http://www.ijswis.org/ |titolo=International Journal On Semantic Web and Information Systems<!-- Titolo generato automaticamente -->]|urlarchivio=https://web.archive.org/web/20120305135848/http://www.ijswis.org/ }}</ref><ref>{{Cita dal web|titolo ''=The Semantic Web Revisited''<ref>|url=http://The%20Semantic%20Web%20Revisitedeprints.ecs.soton.ac.uk/12614/1/real/OLD_Semantic_Web_Revisted.pdf |urlarchivio=https://web.archive.org/web/20111027071252/http://eprints.ecs.soton.ac.uk/12614/1/real/OLD_Semantic_Web_Revisted.pdf }}</ref>, [[Tim Berners-Lee]], Nigel Shadbolt e [[Wendy Hall]] hanno ridefinito alcuni aspetti del web semantico in funzione della dinamicità del [[World Wide Web]]. L'idea era quella di sviluppare e migliorare le ontologie in maniera collaborativa, grazie all'intervento di [[comunità di pratica]]. In seguito, questo nuovo approccio si è orientato sempre più a far sì che i dati vengano strutturati sotto forma di [[linked data]] anziché sotto forma di ontologie. Nell'articolo del 2009<ref>http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf</ref> emerge chiaramente che i ''linked data'' vengono considerati come le nuove colonne portanti su cui costruire il web semantico.
 
=== Agenti semantici ===
È da segnalare che molto lavoro è attualmente in corso per estendere le possibilità del web semantico applicando l'idea degli ''[[agenti semantici]]'' intelligenti (programmi in grado di esplorare ed interagire autonomamente con i sistemi informatici per, ad es., ricercare informazioni). Ruolo di questi agenti nel web semantico è di fornire più vaste capacità di inferenza realizzando quanto espresso in un articolo su ''[[Scientific American]]'' di [[Tim Berners-Lee]] intitolato ''The Semantic Web'', dove si prospetta un futuro in cui ''Lucy'' fissa una visita medica alla madre utilizzando alcuni agenti capaci di "capire" la patologia, contattare i centri in grado di curarla e perfino di richiedere un appuntamento ai relativi agenti, salvo poi lasciarle la decisione di confermare<ref>[{{cita web|url=http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21 |titolo=The Semantic Web]}}</ref>.
 
=== Limiti ===
Riga 332:
*Davies, John, ''Towards the semantic web'', J. Wiley, Chichester-Hoboken, 2003
*Dieter Fensel, ''Spinning the semantic Web'', MIT Press, Cambridge, 2003
* {{cita pubblicazione|autore=Tim Berners-Lee|url=https://www.scientificamerican.com/article/the-semantic-web/|titolo=The Semantic Web|rivista=[[Scientific American]]|volume=284|numero=5|mese=maggio|anno=2001|lingua=en|doi=10.1038/scientificamerican0501-34|urlarchivio=https://web.archive.org/web/20081204134900/http://www.sciam.com/article.cfm?id=the-semantic-web|urlmorto=no|cid=Tim Berners-Lee, 2001}}
*Tim Berners-Lee, ''[http://www.sciam.com/article.cfm?id=the-semantic-web The Semantic Web]'', in «Scientific American», maggio 2001
*Luca Spinelli, ''Panoramica sul web semantico'', in «Login», [[Gruppo Editoriale Infomedia]], 2005
*Johan Hjelm, ''Creating the semantic Web with RDF'', Wiley, New York, 2001
Riga 346:
* [[Topic Maps]], tecnologia per l'organizzazione e la rappresentazione della conoscenza
* [[XML]]
*[[Web research]]
 
==Altri progetti==
{{interprogetto|preposizione=sul}}
{{Interprogetto|commons=Category:Semantic Web}}
 
== Collegamenti esterni ==
* {{Collegamenti esterni}}
*{{cita web|http://www.semanticism.org/|Rassegna stampa in tempo reale sul web semantico}}
*{{cita web | url = http://www.semanticism.org/ | titolo = Rassegna stampa in tempo reale sul web semantico | accesso = 18 dicembre 2008 | urlarchivio = https://web.archive.org/web/20081226015724/http://www.semanticism.org/ | urlmorto = sì }}
*{{cita web|httpurl=https://www.w3.org/TR/rdf-primer/|titolo=RDF Primer del W3C}}
*Un sistema semantico che raccoglie [http://weblabsrvbkp.isti.cnr.it:38080/SWTS/ riferimenti a risorse di pubblica utilità] quali strumenti e documenti nell'area Semantic Web
*{{cita web|httpurl=https://wwwweb.w3archive.org/2001web/sw20070504052812/http://weblabsrvbkp.isti.cnr.it:38080/EuropeSWTS/|SWAD-Europetitolo=Ufficio suitaliano W3C}}
*{{cita web|httpurl=https://www.websemanticow3.org/2001/sw/Europe/|Websemantico.orgtitolo=SWAD-Europe}}
*{{cita web|url=http://www.websemantico.org/|titolo=Websemantico.org}}
*[{{cita web|url=https://web.archive.org/web/20070214092612/http://lcl2.di.uniroma1.it/termextractor/ |titolo=TermExtractor] -}} softwareSoftware gratuito per l'estrazione di termini. Utile come punto di partenza per temi quali l'[[Ontologia (informatica)|Ontologia]]
*[{{cita web|url=https://web.archive.org/web/20070715154850/http://www.elearninglab.eu/studying/sw/sw_program.html |titolo=Web Semantico e Rappresentazione della conoscenza]:}} Percorso di studio introduttivo.
* {{Thesaurus BNCF}}
 
{{Tecnologie emergenti}}