Web semantico: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Recupero di 3 fonte/i e segnalazione di 0 link interrotto/i.) #IABot (v2.0.9.5 |
|||
(180 versioni intermedie di oltre 100 utenti non mostrate) | |||
Riga 1:
Il '''web semantico''' è un'estensione del [[World Wide Web]] in cui i documenti pubblicati (pagine [[HTML]], [[file]], [[immagine digitale|immagini]], e così via) sono associati ad informazioni e dati ([[metadato|metadati]]) che ne specificano il contesto [[semantica|semantico]] in un formato adatto all'interrogazione e all'interpretazione (es. tramite [[motore di ricerca|motori di ricerca]]) e, più in generale, all'[[Dati processabili automaticamente|elaborazione automatica]].
Con l'interpretazione del contenuto dei documenti che il Web
== Introduzione ==
Per la sua costruzione/definizione, si
Sebbene un
Infatti, con
In altre parole, sebbene in un
Nella migliore delle ipotesi sarebbe possibile dedurlo se, tra gli altri, vi fossero dati anagrafici semanticamente definiti e sufficientemente precisi (ad es. il ''[[Codice Fiscale]]'') o collegamenti ipertestuali debitamente descritti che li collegano.
Poiché, però, i diversi
Nei prossimi paragrafi si illustreranno prima il linguaggio utilizzato per costruire il
== I primi linguaggi: RDF, N3 ==
L'evoluzione del web in web semantico inizia con la definizione, da parte del [[W3C]], dello standard [[Resource Description Framework]] (RDF), una particolare
In estrema sintesi, secondo la
#''Il Signor Ciampi vive a Roma''.
#''Il Signor Ciampi ha codice fiscale CMPCLZ20T09E625V''.
possono essere schematicamente scomposte come
{| class="wikitable"
|
| '''Asserzione 1'''
| '''Asserzione 2'''
|-
| '''Soggetto
| Il Signor Ciampi
| Il Signor Ciampi
|-
| '''Predicato
| vive a
| ha codice fiscale
|-
| '''Valore
| Roma
| CMPCLZ20T09E625V
|}
allora, per alcuni di questi elementi, è possibile reperire ''arbitrariamente'' sul [[Web]] [[Uniform Resource Identifier|URI]] (risorse) che li identificano univocamente quali:
{| class="wikitable"
| Il Signor Ciampi
| http://
|-
| vive a
|
|-
| Roma
| http://www.comune.roma.it
|-
| Ha codice fiscale
| [[codice fiscale]]
|}
In questo caso, per
*
*
*
*
Nei prossimi paragrafi si descrive come formalizzare le precedenti frasi in RDF nella sua [[forma canonica]], in due suoi formati testuali alternativi (
Si segnala che appositi programmi come
=== Soluzione RDF canonica ===
Riga 76 ⟶ 75:
3. xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
4. xmlns:wikipedia="http://it.wikipedia.org/wiki/"
5. xmlns:
6. <rdf:Description
7. rdf:about="http://www.quirinale.it/
8. <
9. rdf:resource="http://www.comune.roma.it/index.asp"
10. />
11. </rdf:Description>
12. <rdf:Description
13. rdf:about="http://www.quirinale.it/
14. <wikipedia:codice_fiscale>
15. CMPCLZ20T09E625V
16. </wikipedia:codice_fiscale>
17. </rdf:Description>
18. </rdf:RDF>
{| class="wikitable"
| Riga 1
| colspan=2|'''<?xml version='1.0'?>''', ''header xml'' standard
Riga 102 ⟶ 98:
|-
| Riga 3
| colspan=2|'''xmlns:rdf=''' referenzia il ''namespace'' standard della sintassi ''RDF'', identificandolo come '''rdf'''. Si ricorda che in [[XML]] si definisce un ''
|-
| Riga 4 e 5
| colspan=2|'''xmlns:wikipedia=''' e '''xmlns:
|-
| Righe 6-11
| colspan=2|Definiscono l{{'
|-
| Riga 6
| colspan=2|'''rdf:Description''' è il tag del
|-
| Riga 7
Riga 118 ⟶ 114:
|-
| Riga 8
| '''vivere''' è il tag definito nel
| '''vive a'''
|-
| Riga 9
| '''rdf:resource''' è un identificativo del
| '''Roma'''
|-
Riga 132 ⟶ 128:
|-
| Riga 12-17
| colspan=2|Definiscono l{{'
|-
| Riga 12
| colspan=2|'''rdf:Description''' è il tag del namespace '''rdf''' di cui alla ''Riga 3'' che consente di specificare un{{'
|-
| Riga 13
Riga 146 ⟶ 142:
|-
| Riga 15
| Il ''valore'' dell{{'
| '''CMPCLZ20T09E625V'''
|-
Riga 160 ⟶ 156:
Poiché le due frasi hanno lo stesso ''soggetto'', allora possono essere riformulate nella seguente:
alla quale corrisponde una formalizzazione [[Resource Description Framework|RDF]] altrettanto sintetica (ed equivalente alla precedente):
<?xml version='1.0'?>
=== Soluzione grafica ===
Per rappresentare graficamente
Alcuni applicativi, come il già citato ''IsaViz'', utilizzato in quest'esempio, adottano [[ellisse|ellissi]] per i nodi che sono [[Uniform Resource Identifier|URI]] (http://www.comune.roma.it/index.asp), altrimenti dei rettangoli per i nodi che contengono semplici [[Stringa (informatica)|stringhe]] di caratteri (CMPCLZ20T09E625V). Detto ciò, al nostro esempio corrisponde il [[grafo]]:
[[File:RDF GrafoIsaViz Esempio Ciampi1.JPG|thumb|center|upright=2.9|Grafo RDF dell'esempio generato con il tool IsaViz]]
=== Soluzione N3 ===
''[[Notation 3|N3]]'' (noto anche come ''N-triples'' o ''Notation 3'')
<http://www.quirinale.it/
<
<http://www.comune.roma.it/index.asp>''.''
<http://www.quirinale.it/
<[[codice fiscale]]>
"CMPCLZ20T09E625V"''.''
Ciascuna
=== Soluzione N3 con prefissi ===
''
@prefix presidente: http://www.quirinale.it/presidente/
@prefix wikipedia:
@prefix wikidizionario:
@prefix comune_roma: http://www.comune.roma.it/
Riga 206 ⟶ 205:
presidente:ciampi.html wikipedia:codice_fiscale "CMPCLZ20T09E625V"''.''
Dove con il comando
== OWL ==
RDF non è che il primo passo. Il
[[File:Semantic Web Stack.png|thumb|center|upright=1.4|W3C Semantic Web Layer Cake<ref>{{cita web|url=https://www.w3.org/2007/03/layerCake.png|titolo=Immagine}}</ref>]]
La logica predicativa del primo ordine è estremamente complessa, e RDF ne poteva esprimere una porzione molto ristretta. Non solo: questa logica, se presa complessivamente, non è nemmeno computabile, mentre possono essere computabili delle logiche costituite da sottoinsiemi degli operatori della logica del primo ordine. Questi sottoinsiemi della logica formale sono studiati dalle [[logiche descrittive]], o ''description logics'', ed una di queste è stata adottata per la formulazione di un nuovo standard, più ricco ed espressivo di RDF: [[Web Ontology Language|OWL]].
OWL offre molti nuovi costrutti, due di questi, molto semplici da comprendere, sono l{{'}}''equivalenza'' tra risorse e la relazione ''inversa''.
*Per ''equivalenza'' tra risorse si intende la possibilità di affermare che due o più [[Uniform Resource Identifier|URI]] rappresentano lo stesso elemento.
*Per ''inversa'' si intende la possibilità di dire che se è vero (soggetto, predicato, oggetto), allora è anche vero (oggetto, predicato_inverso, soggetto).
L'importanza di un costrutto come l{{'}}''equivalenza'' è presto spiegata anche solo considerando gli esempi fatti in precedenza. Ad es. poter dichiarare che
CF:CMPCLZ20T09E625V, wikipedia:
sono '''equivalenti'''
consentirebbe di capire che le
CF:CMPCLZ20T09E625V '''si chiama''' "Carlo Azeglio Ciampi"
wikipedia:
quirinale:ciampi.htm '''è un''' "Presidente della Repubblica"
debitamente formalizzate ed ovunque reperite si riferiscono alla stessa risorsa, un ''Presidente della Repubblica'' (qualsiasi cosa questo significhi, ovvero qualsiasi cosa possa essere inferito da questa informazione) che '''vive a''' ''Roma'' e '''si chiama''' ''Carlo Azeglio Ciampi''.
Per quanto riguarda l{{'}}''inversa'', invece basta pensare che quando si afferma che ''[[Romolo]] è fratello di Remo'', si intende anche che ''Remo è fratello di Romolo'', '''asserzione''' da fare esplicitamente in RDF per poter essere
Questi costrutti, insieme ad altri, sono stati introdotti per primi da linguaggi precedenti o contemporanei ad RDF quali [[DAML]] (definito dall'
OWL esiste in tre forme, caratterizzate da diversi gradi di complessità e - conseguentemente - di [[computabilità]].
Con OWL è possibile scrivere delle [[Ontologia (informatica)|ontologie]] che descrivono la conoscenza che abbiamo di un certo dominio, tramite classi, relazioni fra classi e individui appartenenti a classi. La conoscenza così formalizzata è [[Dati processabili automaticamente|processabile automaticamente]] da un calcolatore, tramite un [[ragionatore automatico]] che implementa i processi inferenziali e deduttivi.
== Modalità di impiego ==
Dagli esempi precedenti si evince che ''condizione necessaria per il buon utilizzo di RDF è la disponibilità on-line di riferimenti di qualità alle URI utilizzate/referenziate''. In particolare, è importante che queste risorse siano note, condivise e stabili nel tempo. Ad
Dopo questa data l
Molto più opportuno sarebbe utilizzare la biografia definita in
Sebbene questa URI oggi non referenzi alcunché sul
ovvero:
@prefix agenzia: https://web.archive.org/web/20050212035111/http://www.agenziaentrate.it/servizi/
@prefix comune_roma: http://www.comune.roma.it/
@prefix presidente: http://www.quirinale.it/presidente/
@prefix wikipedia:
@prefix wikidizionario:
agenzia:CF#CMPCLZ20T09E625V wikidizionario:vivere comune_roma:index.asp
agenzia:CF#CMPCLZ20T09E625V wikidizionario:biografia presidente:ciampi.htm
agenzia:CF#CMPCLZ20T09E625V wikidizionario:biografia wikipedia:
Un altro accorgimento da tenere presente nella scelta dei termini da utilizzare per la definizione delle relazioni è di ricorrere a dizionari già noti e diffusi, invece che inventarne ogni volta di nuovi. Ad es. per le informazioni anagrafiche personali tipiche dei biglietti da visita quali ''nome'', ''cognome'', ''indirizzo'', ''e-mail'', ''ruolo aziendale''
Da quanto esposto finora è facile intuire che, nella costruzione del
=== Strumenti ===
Ovviamente non è sufficiente avere solo una sintassi per esprimere predicati. Per rendere concreto ed utile quanto detto finora, occorrono anche strumenti in grado di gestire un insieme di
Per quanto riguarda N3, la gran parte di questi strumenti, come si può intuire dagli esempi di ''N3'' ed ''N3 con prefissi'',
Sui documenti scritti in OWL (o [[ontologia (informatica)|ontologie]]), invece, si può eseguire un vero e proprio ragionamento deduttivo inferenziale, realizzato tramite ragionatori automatici.
=== Linguaggi di
Per utilizzare le basi di conoscenza formalizzate secondo questi standard è necessario un linguaggio per interrogarle. '''[[SPARQL]]''' (
Per interrogare OWL, invece, manca ancora uno standard, ed i singoli ragionatori implementano linguaggi di query proprietari.
== Web semantico e gestione della conoscenza ==
Da quanto detto si capisce perché se l'[[XML]] si rivolge alla descrizione di
Per quanto riguarda le
* le ''chiavi univoche'' identificano una ''entità'';
* i ''nomi delle colonne'' possono essere i ''predicati'';
* il ''contenuto delle colonne'' i ''valori''.
Per quanto riguarda i
* la paragrafazione, normalmente standardizzata nella documentazione tecnica;
* l'utilizzo di dizionari comuni (un dato elemento è chiamato allo stesso modo in documenti diversi);
* l'[[analisi lessicale]].
Ma la ri-formulazione in modo più efficace di strutture di dati esistenti non è che il primo e più semplice dei vantaggi che il web semantico ci offre. Tramite le ontologie abbiamo la possibilità di esprimere direttamente la struttura della nostra conoscenza e permettere alle macchine di elaborare automaticamente la conoscenza stessa, non più solo le semplici informazioni. In questo modo passiamo dalla semplice [[informatica]] (elaborazione automatica di informazioni) ad una [[epistematica]]: una elaborazione automatica di conoscenza.
== Prospettive per il
Il [[web]], come si presenta oggi, richiede strumenti di lavoro più progrediti, per facilitare e velocizzare la navigazione attraverso gli innumerevoli documenti dati alla pubblicazione multimediale.
Per il futuro, il web semantico si propone di dare un senso alle pagine
Non sempre la Rete ci porta dove ci attenderemmo e le difficoltà d'orientamento sono significative quando siamo alla ricerca di qualche cosa e non sappiamo dove reperirlo. Scorrere una lunga quantità di elenchi alla ricerca dell'informazione desiderata è ormai quotidianità, soprattutto quando la ricerca interessa un termine piuttosto comune.
Con il
Tutto questo non in virtù di sistemi di [[intelligenza artificiale]], ma semplicemente in virtù di una marcatura dei documenti, di un linguaggio gestibile da tutte le applicazioni e dell'introduzione di vocabolari specifici, ossia insiemi di frasi alle quali possano associarsi relazioni stabilite fra elementi marcati.
Il web semantico per funzionare deve poter disporre di informazione strutturata e di regole di deduzione per gestirla, in modo da accostare quelle informazioni che un'interrogazione ha richiesto.
[[Tim Berners-Lee]] ha sottolineato che uno degli elementi fondamentali del web semantico sarà la compresenza di più ontologie. Se si vuole un sistema dinamico in grado di raffinarsi e funzionare su scala universale, bisognerà pagare il prezzo di una certa dose di incoerenza.
A partire dal 2006 il progetto di realizzazione del web semantico mediante la costruzione di ontologie è stato parzialmente revisionato. In un articolo pubblicato su ''International Journal on Semantic Web and Information Systems''<ref>{{cita web|url=http://www.ijswis.org/|titolo=International Journal On Semantic Web and Information Systems<!-- Titolo generato automaticamente -->|urlarchivio=https://web.archive.org/web/20120305135848/http://www.ijswis.org/ }}</ref><ref>{{Cita web|titolo=The Semantic Web Revisited|url=http://eprints.ecs.soton.ac.uk/12614/1/real/OLD_Semantic_Web_Revisted.pdf |urlarchivio=https://web.archive.org/web/20111027071252/http://eprints.ecs.soton.ac.uk/12614/1/real/OLD_Semantic_Web_Revisted.pdf }}</ref>, [[Tim Berners-Lee]], Nigel Shadbolt e [[Wendy Hall]] hanno ridefinito alcuni aspetti del web semantico in funzione della dinamicità del [[World Wide Web]]. L'idea era quella di sviluppare e migliorare le ontologie in maniera collaborativa, grazie all'intervento di [[comunità di pratica]]. In seguito, questo nuovo approccio si è orientato sempre più a far sì che i dati vengano strutturati sotto forma di [[linked data]] anziché sotto forma di ontologie. Nell'articolo del 2009<ref>http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf</ref> emerge chiaramente che i ''linked data'' vengono considerati come le nuove colonne portanti su cui costruire il web semantico.
=== Agenti semantici ===
È da segnalare che molto lavoro è attualmente in corso per estendere le possibilità del
===
L'imprecisione del sistema è il prezzo da pagare alla sua universalità, i messaggi di ''"not found"'' (non trovato) non saranno
Tutto questo per rendere possibile l'affiancarsi di più referenze e quindi non perdere, almeno in linea programmatica, la possibilità di più definizioni, di più comprensioni di uno stesso oggetto concreto.
Un altro tema molto importante e dibattuto è come gestire la fiducia sulle
Per ovviare il problema delle certificazioni che sarebbero necessarie a mantenere la veridicità delle ontologie, le asserzioni vengono trasformate a loro volta in termini legati al proprio autore attraverso il ruolo (proprietà) "Asserisce" che ha per [[codominio]] il termine "Asserzione". In questo modo è possibile attribuire a questo nuovo termine un Soggetto, un Predicato e un Oggetto utilizzando le normali relazioni.
Attraverso questo procedimento, proposizioni del tipo "il bicchiere contiene del vino" vengono modificate in proposizioni del tipo "Marco ASSERISCE che il bicchiere (Soggetto) contiene (Predicato) del vino (Oggetto)". Se si vuole essere più precisi, bisognerebbe inserire nell'ontologia ben 4 asserzioni:
Riga 325 ⟶ 324:
# Asserzione - haOggetto - Vino
==
<references/>
== Bibliografia ==
*
*
*Davies, John, ''Towards the semantic web'', J. Wiley, Chichester-Hoboken, 2003
*
* {{cita pubblicazione|autore=Tim Berners-Lee|url=https://www.scientificamerican.com/article/the-semantic-web/|titolo=The Semantic Web|rivista=[[Scientific American]]|volume=284|numero=5|mese=maggio|anno=2001|lingua=en|doi=10.1038/scientificamerican0501-34|urlarchivio=https://web.archive.org/web/20081204134900/http://www.sciam.com/article.cfm?id=the-semantic-web|urlmorto=no|cid=Tim Berners-Lee, 2001}}
*Luca Spinelli, ''Panoramica sul web semantico'', in «Login», [[Gruppo Editoriale Infomedia]], 2005
*Johan Hjelm, ''Creating the semantic Web with RDF'', Wiley, New York, 2001
== Voci correlate ==
* [[Base di conoscenza]]
* [[Linked data]]
* [[KQML]], linguaggio e protocollo di comunicazione usato per scambiare informazioni e conoscenza
* [[Logiche descrittive]]
* [[Ontologia (informatica)]]
* [[Resource Description Framework]] (RDF),
* [[SKOS]]
* [[Topic Maps]], tecnologia per l'organizzazione e la rappresentazione della conoscenza
* [[XML]]
*[[Web research]]
==Altri progetti==
{{interprogetto|preposizione=sul}}
== Collegamenti esterni ==
* {{Collegamenti esterni}}
*{{cita web | url = http://www.semanticism.org/ | titolo = Rassegna stampa in tempo reale sul web semantico | accesso = 18 dicembre 2008 | urlarchivio = https://web.archive.org/web/20081226015724/http://www.semanticism.org/ | urlmorto = sì }}
*{{cita web|url=https://www.w3.org/TR/rdf-primer/|titolo=RDF Primer del W3C}}
*{{cita web|url=http://weblabsrvbkp.isti.cnr.it:38080/SWTS/|titolo=Ufficio italiano W3C|accesso=23 maggio 2018|dataarchivio=4 maggio 2007|urlarchivio=https://web.archive.org/web/20070504052812/http://weblabsrvbkp.isti.cnr.it:38080/SWTS/|urlmorto=sì}}
*{{cita web|url=https://www.w3.org/2001/sw/Europe/|titolo=SWAD-Europe}}
*{{cita web|url=http://www.websemantico.org/|titolo=Websemantico.org}}
*{{cita web|url=http://lcl2.di.uniroma1.it/termextractor/|titolo=TermExtractor|accesso=5 novembre 2017|dataarchivio=14 febbraio 2007|urlarchivio=https://web.archive.org/web/20070214092612/http://lcl2.di.uniroma1.it/termextractor/|urlmorto=sì}} Software gratuito per l'estrazione di termini. Utile come punto di partenza per temi quali l'[[Ontologia (informatica)|Ontologia]]
*{{cita web|url=http://www.elearninglab.eu/studying/sw/sw_program.html|titolo=Web Semantico e Rappresentazione della conoscenza|accesso=23 maggio 2018|dataarchivio=15 luglio 2007|urlarchivio=https://web.archive.org/web/20070715154850/http://www.elearninglab.eu/studying/sw/sw_program.html|urlmorto=sì}} Percorso di studio introduttivo.
{{Tecnologie emergenti}}
{{
{{Controllo di autorità}}
{{Portale|internet}}
[[Categoria:Web semantico| ]]
[[Categoria:Intelligenza artificiale]]
[[Categoria:Terminologia del web]]
|