Data integration: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m →Storia |
|||
Riga 57:
Un database su uno schema è definito come un insieme di insiemi, uno per ogni relazione (in un database relazionale). Il database corrispondente allo schema di origine <math>S</math> dovrebbe comprendere l'insieme di insiemi di tuple per ogni sorgente eterogenea ed è chiamato ''database sorgente''. Si noti che questo singolo database di origine potrebbe in realtà rappresentare una collezione di database disconnessi. Il database corrispondente allo schema virtuale intermedio <math>G</math> è chiamato ''database globale''. Il database locale deve soddisfare la mappatura <math>M</math> rispetto al database sorgente. La legittimità di questa mappatura dipende dalla natura della corrispondenza tra <math>G</math> e <math>S</math>. Esistono due modelli popolari per modellare questa corrispondenza: ''Vista Globale'' o GAV e ''Vista Locale'' o LAV.
[[File:GAVLAV_ita.png|thumb|right|Figura 3: Illustrazione dello spazio delle tuple nelle mappature GAV e LAV.<ref name="refseven">{{cite journal|author=Christoph Koch |title=Data Integration against Multiple Evolving Autonomous Schemata |year=2001 |url=http://www.csd.uoc.gr/~hy562/Papers/thesis_final.pdf |deadurl=yes |archiveurl=https://web.archive.org/web/20070926211342/http://www.csd.uoc.gr/~hy562/Papers/thesis_final.pdf |archivedate=2007-09-26 |df= }}</ref> In GAV, il sistema è vincolato all'insieme di tuple mappate dai mediatori mentre l'insieme delle tuple esprimibili sulle sorgenti potrebbe essere più vasto e ricco. In LAV, il sistema è vincolato all'insieme delle tuple nelle sorgenti mentre l'insieme delle tuple esprimibili sullo schema globale può essere più vasto. Perciò, i sistemi LAV devono spesso gestire risposte incomplete.]]
I sistemi GAV modellano il database globale come insieme di [[Vista (basi di dati)|viste]] su <math>S</math>. In questo caso <math>M</math> associa a ogni elemento di <math>G</math> una interrogazione su <math>S</math>. L'[[Ottimizzazione di query|elaborazione delle ''query'']] diventa un'operazione semplice grazie alle associazioni ben definite tra <math>G</math> e <math>S</math>. L'onere della complessità cade sull'implementazione del codice del mediatore in modo che istruisca il sistema di ''data integration'' nell'esatta maniera per recuperare elementi dai database sorgenti. Se si aggiungono altre fonti al sistema, può essere richiesto un grande impegno per aggiornare il mediatore, perciò l'approccio GAV sembra preferibile quando le sorgenti hanno una bassa probabilità di cambiare.
|