Base di dati

collezione organizzata di dati
Versione del 4 lug 2012 alle 15:40 di Buggia (discussione | contributi) (Annullate le modifiche di 93.45.95.240 (discussione), riportata alla versione precedente di 151.74.213.171)
Disambiguazione – Se stai cercando il programma televisivo, vedi Database (programma televisivo).

In informatica, il termine database, banca dati o base di dati, indica un insieme di archivi collegati secondo un particolare modello logico (relazionale, gerarchico, reticolare o a oggetti) e in modo tale da consentire la gestione dei dati stessi (ricerca o interrogazione, inserimento, cancellazione ed aggiornamento) da parte di particolari applicazioni software dedicate (DBMS) basate su un'architettura di tipo client-server e sui cosiddetti query language per l'interfacciamento con l'utente.

Informalmente e impropriamente, la parola "database" viene spesso usata come abbreviazione dell'espressione database management system (DBMS), che si riferisce però alla sola parte software cioè a quella vasta categoria di sistemi che consentono appunto la creazione, la manipolazione (gestione) e l'interrogazione efficiente dei dati, mentre più precisamente per database si intende l'archivio a livello logico e fisico ovvero compresa anche la parte hardware cioè il sistema con i supporti di memorizzazione che contengono i dati e il processore per l'elaborazione di questi.

Nei database più moderni ovvero quelli basati sul modello relazionale i dati vengono suddivisi per argomenti (in apposite tabelle) e poi tali argomenti vengono suddivisi per categorie (campi) con tutte le possibili operazioni di cui sopra. Tale suddivisione e funzionalità rende i database notevolmente più efficienti rispetto ad un archivio di dati creato ad esempio tramite file system di un sistema operativo su un computer almeno per la gestione di dati complessi.

La diffusione dei database, e dei relativi sistemi DBMS di gestione, nei sistemi informativi moderni è enorme e capillare essendo un componente base di un sistema informativo attraverso il rispettivo sistema informatico: si pensi a tutte le attività commerciali di gestione di magazzino, gestione clienti, a sistemi di immagazzinamento di dati personali o pubblici nella pubblica amministrazione e nelle imprese private (es. banche), contabilità ecc. La gestione e lo sviluppo dei database attraverso DBMS è diventata nel tempo una branca a tutti gli effetti dell'informatica moderna.

Gestione delle informazioni

La base di dati, oltre ai dati veri e propri, deve contenere anche le informazioni sulle loro rappresentazioni e sulle relazioni che li legano. Spesso, ma non necessariamente, una base dati contiene le seguenti informazioni:

  • Strutture dati che velocizzano le operazioni frequenti, di solito a spese di operazioni meno frequenti.
  • Collegamenti con dati esterni, cioè riferimenti a file locali o remoti non facenti parte del database.
  • Informazioni di sicurezza, che autorizzano solo alcuni profili utente ad eseguire alcune operazioni su alcuni tipi di dati.
  • Programmi che vengono eseguiti, automaticamente o su richiesta di utenti autorizzati, per eseguire elaborazioni sui dati. Un tipico automatismo consiste nell'eseguire un programma ogni volta che viene modificato un dato di un certo tipo.

In un sistema informatico, una base di dati può essere usata direttamente dai programmi applicativi, interfacciandosi con il supporto di memorizzazione (insomma, agendo direttamente sui file). Questa strategia era quella adottata universalmente fino agli anni sessanta, ed è tuttora impiegata quando i dati hanno una struttura molto semplice, o quando sono elaborati da un solo programma applicativo.

Dalla fine degli anni sessanta, tuttavia, per gestire basi di dati complesse condivise da più applicazioni si sono utilizzati appositi sistemi software, detti sistemi per la gestione di basi di dati (in inglese "Database Management System" o "DBMS"). Uno dei vantaggi di questi sistemi è la possibilità di non agire direttamente sui dati, ma di vederne una rappresentazione concettuale.

La ricerca nel campo delle basi di dati studia le seguenti problematiche:

  • Progettazione di basi di dati.
  • Progettazione e implementazione di DBMS.
  • Interpretazione (o analisi) di dati contenuti in database.

Le basi di dati spesso fanno uso di tecnologie derivate da altre branche dell'informatica. È usuale utilizzare tecniche derivate dall'intelligenza artificiale, come ad esempio il data mining, per cercare di estrarre relazioni o più in generale informazioni presenti nelle banche dati ma non immediatamente visibili.

Strutture

Le basi di dati possono avere varie strutture, di solito, in ordine cronologico:

  1. gerarchica (rappresentabile tramite un albero – anni millenovecentosessanta),
  2. reticolare (rappresentabile tramite un grafo – anni millenovecentosessanta),
  3. relazionale (attualmente il più diffuso, rappresentabile mediante tabelle e relazioni tra esse – anni settanta),
  4. ad oggetti (estensione alle basi di dati del paradigma "Object Oriented", tipico della programmazione a oggetti – anni millenvecentoottanta),
  5. semantica (rappresentabile con un grafo relazionale – inizio anni duemila).

Il formato XML, oltre che per scambi di dati su web, si sta diffondendo per la definizione di vere e proprie basi di dati. XML ha una struttura gerarchica, pare quindi un "ritorno alle origini" dei modelli di dati.

Un requisito importante di una buona base dati consiste nel non duplicare inutilmente le informazioni in essa contenute: questo è reso possibile dai gestori di database relazionali (teorizzati da Edgar F. Codd), che consentono di salvare i dati in tabelle che possono essere collegate.

La funzionalità di un database dipende in modo essenziale dalla sua progettazione: la corretta individuazione degli scopi del database e quindi delle tabelle, da definire attraverso i loro campi e le relazioni che le legano, permette poi una estrazione dei dati più veloce e, in generale, una gestione più efficiente.

Linguaggi per basi di dati

È possibile distinguere i linguaggi per basi di dati secondo il loro utilizzo:

Inoltre è possibile suddividere i linguaggi come:

  • Linguaggi testuali interattivi, come l'SQL, di cui sono stati pubblicati diversi standard, che attualmente è il linguaggio più utilizzato.
  • Linguaggi testuali interattivi immersi in linguaggi di programmazione comuni, quali C, Basic ecc.
  • Linguaggi testuali interattivi immersi in linguaggi di programmazione proprietari.
  • Linguaggi grafici e user-friendly, come QBE (Query By Example), che possono essere utilizzati anche dai meno esperti.

Server di database

Un Server di database è la parte del DBMS (e, per estensione, il server su cui il programma opera) che si occupa di fornire i servizi di utilizzo del database ad altri programmi e ad altri computer secondo la modalità client/server. Il server memorizza i dati, riceve le richieste dei client ed elabora le risposte appropriate.

I database server sono complessi sistemi software concepiti in un linguaggio binario, oltre che per memorizzare i dati, anche per fornire un accesso rapido ed efficace a una pluralità di utenti contemporaneamente e garantire protezione sia dai guasti che dagli accessi indebiti.

Tra i più diffusi DBMS open source troviamo, in ordine alfabetico:


I più diffusi sistemi commerciali sono:

Sicurezza dei database

  Lo stesso argomento in dettaglio: Protezione del database.

La protezione da accessi non autorizzati è un tema importante nella gestione dei database, che si rivelano vulnerabili nei seguenti punti:

Gestione dei dati (Data management)

Web Database

I web database sono un particolare tipo di servizi web dove poter creare database direttamente sul web. Questi servizi offrono normalmente tutte le caratteristiche base di un normale database per costruire tabelle strutturate di dati di ogni genere con campi di tipo testo, numeri, data e ora e altri. Il loro servizio non è solo quello di repository o contenitore di dati ma anche di creare un'interfaccia grafica usabile per la gestione degli stessi presentandosi come vere e proprie applicazioni web. La condivisione svolge un ruolo importante proprio perché i dati sono visibili su internet e quindi da altre persone che, con le dovute autorizzazioni, possono lavorare sui dati.

Diritto d'autore

La direttiva dell'Unione Europea n. 96/9/CE ha introdotto un diritto (qualificato sui generis) a tutela dell'estensore di una banca dati. In Italia tale normativa è stata disciplinata dal TitoloII-bis LdA: Disposizioni sui diritti del costitutore di una banca di dati. La tutela riguarda quelli che compiono una selezione o collocazione del materiale raccolto[1]

Database management system (DBMS)

Voci correlate

Note

  1. ^ Confronta Jarach-Pojaghi Manuale del diritto d'autore Mursia ISBN 978-88-425-3817-2

Bibliografia

  • Atzeni, Ceri, Paraboschi, Torlone – Basi Di Dati (Modelli e Linguaggi di Interrogazione) - McGraw Hill, 2003
  • Atzeni, Ceri, Fraternali, Paraboschi, Torlone – Basi Di Dati (Architetture e Linee Di Evoluzione) - McGraw Hill, 2003
  • Ramez Elmasri, Shamkant B. Navathe – Fundamentals of Database Systems, Fourth Edition – Addison Wesley, 2003
  • Tamer-Ozsu, P. Valduriez – Principles of Distributed Database Systems - Prentice Hall, 1999
  • Giovanni Guglielmetti, La tutela delle banche dati con diritto sui generis nella direttiva 96/9/CE, in Contratto e impresa / Europa, 1997, pag. 177 e segg.;

Altri progetti

Collegamenti esterni