Database distribuito: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente

Contenuto cancellato Contenuto aggiunto

VisualeWikitesto

Versione delle 13:02, 20 mar 2012 modifica 151.28.50.19 (discussione) Nessun oggetto della modifica ← Differenza precedente		Versione attuale delle 14:17, 8 mag 2023 modifica annulla Simone Biancolilla (discussione \| contributi) Utenti autoverificati 30 626 modifiche m →Altri progetti: Aggiunto il parametro "Preposizione" nel template "Interprogetto" Etichetta: Modifica visuale
(41 versioni intermedie di 24 utenti non mostrate)
Riga 1: UnIn [[informatica]] un '''database distribuito''' è un [[database]] che si trova sotto il controllo di un [[~~Database~~database management system]] ('''DBMS''') nel quale gli archivi di [[dati]] non sono [[memoria (informatica)\|memorizzati]] sullo stesso [[computer]] bensì su più elaboratori o nodi. IlIn altri termini il database in senso fisico può essere dislocato in più [[computer]] situati nello stesso luogo, oppure distribuito in una [[Rete informatica\|rete]] di computer]] connessi tra loro sotto forma appunto di [[sistema distribuito]]. == Descrizione == ~~Il [[DBMS]] serve a strutturare i dati ed accedere in modo intelligente e efficace alle informazioni.~~ Formalmente si ha uno schema logico globale comune a tutti i nodi ed un insieme di schemi logici locali che dipendono funzionalmente da quello globale. Per passare dallo schema logico globale a quelli locali si operano delle trasformazioni chiamate frammentazioni. Il [[DBMS]] ~~deve~~serve a strutturare i dati ed accedere in modo intelligente ed efficace alle informazioni ed inoltre deve garantire: * [[affidabilità]] perché i dati devono essere mantenuti anche in caso di malfunzionamento; * [[confidenzialità\|riservatezza]], perché i dati devono essere [[protezione del database\|protetti]], per impedire che il database venga danneggiato da interventi non autorizzati ([[attacco ai database]]). Inoltre il DBMS deve essere in grado di garantire le proprietà ACID come nel caso di un DBMS centralizzato. === Architetture possibili === Esistono diverse modalità possibili di distribuzione dei dati: * '''Frammenti orizzontali''': sottoinsiemi di [[tupla\|tuple]] (righe) da una [[Modello relazionale\|relazione]] (tabella). * '''Frammenti verticali''': sottoinsiemi di [[attributo (~~database~~basi di dati)\|attributi]] (colonne) da una relazione (tabella). * '''Frammenti misti''': combinazione di frammenti orizzontali e verticali o una collezione di oggetti in un [[Base di dati a oggetti\|database a oggetti]] (OODB). * '''Database distribuiti omogenei''': utilizzano solo un DBMS (ad esempio [[MySQL]] o [[Oracle Database\|Oracle]]). * '''Database distribuiti eterogenei''': utilizzano diversi DBMS (ad esempio [[MySQL]] e [[PostgreSQL]]). Gli utenti possono accedere ai database distribuiti attraverso: * [[Applicazione (informatica)\|Applicazioni]] locali: applicazioni che non richiedono dati da altri siti; * Applicazioni globali: applicazioni che richiedono dati da altri siti. === Considerazioni === I database distribuiti richiedono una attenta gestione per garantire che: * La distribuzione sia trasparente,; gli utenti cioè siano in grado di interagire con il sistema come se fosse un unico sistema logico, sia dal punto di vista delle prestazioni che per quanto riguarda i metodi di accesso; * Le [[transazione (~~database~~basi di dati)\|transazioni]] siano trasparenti,; ogni transazione cioè mantenga l'integrità del database tra tutti i database distribuiti. Ciò normalmente si ottiene suddividendo la transazione principale in sub-transazioni, una per ogni database coinvolto. == Frammentazione == {{portale\|informatica}}▼ La frammentazione è una proprietà tipica del DBMS distribuito che permette di allocare diverse porzioni del Database su nodi diversi. Esistono diverse tipologie di frammentazione: * ''frammentazione verticale'', che tocca gli attributi di una specifica tabella; * ''frammentazione orizzontale primaria'', che tocca porzioni di tuple di una tabella; * ''frammentazione orizzontale derivata'', che tocca porzioni di tuple di due tabelle diverse unendole in un'unica tabella tramite chiave; * ''frammentazione composta'', che è una combinazione delle precedenti. In generale la frammentazione deve rispettare le seguenti proprietà: * completezza: ogni record della tabella di partenza deve essere poter ritrovato in uno dei due frammenti; * ricostruibilità: la tabella di partenza deve essere ricostruita senza perdita di informazione a partire dai frammenti; * disgiunzione: ogni record della tabella deve essere rappresentato in uno solo dei frammenti o, in alternativa, si parla di replicazione. === Frammentazione verticale === ~~[[Categoria:Software per base dati]]~~ Una frammentazione verticale è una partizione della relazione R in n relazioni dette ''frammenti'' definite: <math>R = \{R_1,...,R_n\}</math> <math>Schema(R) = L = (A_1,...A_m)</math> genericamente <math>Schema(R_i) = L_i = (A_i1, ... A_ik)</math> La frammentazione verticale soddisfa la proprietà di completezza <math>L_1 \cup L_2 \cup ... \cup L_n = L</math> Per garantire la proprietà di ricostruibilità: <math>L_i \cap L_j \supseteq key(R) \forall i \ne j</math> === Frammentazione orizzontale === Una frammentazione orizzontale è una partizione definita su una relazione R tale che: <math>Schema(R_i) = Schema(R) \forall_i</math> lo schema resti uguale in ogni frammento <math>\forall_i \ R_i \subseteq R</math> ogni frammento contiene un sottoinsieme dei record di R <math>\forall_i \ R_i = \delta_ci(R)</math> normalmente un frammento definito da una selezione La frammentazione orizzontale soddisfa la proprietà di completezza: <math>R_i \cup ... \cup R_n = R</math> La proprietà di ricostruibilità è sempre garantita dall'unione. == Replicazione == La replicazione è una proprietà tipica del DBMS distribuito che permette di allocare stesse porzioni del Database su nodi diversi. La replicazione si ritiene utile al fine di ridurre il trasferimento di informazioni tra i diversi nodi nell'ambito della stessa transazione o interrogazione. Dall'utilizzo della replicazione si ha un aumento della località dei dati utilizzati da ogni applicazione; si introduce tuttavia il problema delle transazioni multiple, ossia transazioni da eseguire su più nodi contemporaneamente. == Trasparenza == La trasparenza è una proprietà tipica del DBMS distribuito che permette alle applicazioni di non conoscere nulla sulla dislocazione dei dati ma accedervi come se fosse un Database centralizzato. Il DBMS fornisce diversi livelli di trasparenza, alcuni ereditati dalla tecnologia di DBMS centralizzato altri necessari per la gestione dell'architettura distribuita: * Trasparenza fisica (tipica dei DBMS centralizzati), indipendenza dell'applicazione dalle modifiche allo schema fisico del Database; * Trasparenza logica (tipica dei DBMS centralizzati), indipendenza dell'applicazione dalle modifiche allo schema logico del Database; * Trasparenza di rete; indipendenza dell'applicazione dalla dislocazione dei dati nei diversi nodi, l'applicazione non conosce la topologia della rete; * Trasparenza di frammentazione, indipendenza dell'applicazione dalla frammentazione dei dati, l'applicazione non conosce come sono frammentate le relazioni; * Trasparenza di replicazione, indipendenza dell'applicazione dalla replicazione dei dati, l'applicazione non conosce quali siano le replicazioni presenti; * Trasparenza di modello o linguaggio, indipendenza dell'applicazione dal modello o dal linguaggio utilizzato. == Bibliografia == M. T. Özsu and P. Valduriez, ''Principles of Distributed Databases'' (3rd edition) (2011), Springer, ISBN 978-1-4419-8833-1 Elmasri and Navathe, ''Fundamentals of database systems'' (3rd edition), Addison-Wesley Longman, ISBN 0-201-54263-3 == Voci correlate == *[[Blockchain]] == Altri progetti == {{interprogetto\|v=Basi di dati distribuite\|preposizione=sui}} {{Controllo di autorità}} ▲{{portale\|informatica}} [[Categoria:Basi di dati distribuite]] ~~[[bg:Разпределени бази от данни]]~~ ~~[[de:Verteiltes Datenbankmanagementsystem]]~~ ~~[[el:Κατανεμημένες Βάσεις Δεδομένων]]~~ ~~[[en:Distributed database]]~~ ~~[[es:Bases de datos distribuidas]]~~ ~~[[eu:Datu-base banatu]]~~ ~~[[ja:分散データベース]]~~ ~~[[pl:Rozproszona baza danych]]~~ ~~[[pt:Banco de dados distribuídos]]~~ ~~[[ro:Bază de date distribuită]]~~ ~~[[ru:Распределённые базы данных]]~~ ~~[[zh:分布式数据库]]~~