Grid computing: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Riga 1:
[[image:Systems Diagram GRID Computing Jing Wu.jpg|thumb|right|Schema della possibile evoluzione del GRID]]
Il '''Grid computing''' (detto anche '''Grid''' o '''DataGrid''') è un nuovo modello computazionale che porterebbe [[Internet]] dall'essere una piattaforma di comunicazione ad una di lavoro. Questo modello rappresenta un nuovo passo avanti nella strada della progressiva condivisione delle risorse: si è cominciato col condividere i ''computer'' con l'introduzione delle [[rete|reti]], in seguito si è arrivati alla condivisione dei documenti (per esempio col [[WWW]]) ed infine si è arrivati a condividere le applicazioni mediante [[SOAP]], [[Web service]] ecc. L'ultimo passo è condividere tutto il resto cioè unire una serie di risorse eterogenee (''[[server]]'', ''[[storage]]'', applicazioni, ecc.) per fornire agli utenti un unico sistema computazionale virtuale sul quale utilizzare qualsiasi tipo di applicazione.
 
Il '''Grid computing''' indica un'infrastruttura distribuita per consentire l'utilizzo risorse di calcolo e di storage provenienti da un numero indistinto di calcolatori (anche e soprattutto di potenza non particolarmente elevata) interconnessi da una rete (solitamente Internet ma non necessariamente).
Il grid computing nasce per soddisfare le esigenze di una ingente quantità di dati da elaborare con la messa a regime dell'[[LHC]], ma le sue caratteristiche ne consentono l'utilizzo da parte di diverse discipline scientifiche, non solo nell'ambito della [[fisica]] delle alte energie. La Grid funzionerà sfruttando la rete [[internet]] come collegamento fisico di varie unità di calcolo sparsi nei diversi centri di ricerca mondiali, permettendo un'elaborazione più efficiente e veloce dei dati sperimentali, che saranno accessibili a tutto il mondo scientifico.
Il termine '''Grid computing''' e' stato coniato a meta' degli anni novanta Un testo tuttora di riferimento apparso in quegli anni e': "The Grid: Blueprint for a New Computing Infrastructure"(autori/editori Ian Foster e Carl Kesselman) del 1998.
 
Le 'griglie di calcolo' vengono prevalentemente utilizzate per risolvere problemi computazionali di larga scala in ambito scientifico e ingegneristico. Sviluppatesi originariamente in seno alla Fisica delle Alte Energie (in inglese HEP) il loro impiego e' gia' da oggi esteso alla Biologia, alla Astronomia e in maniera minore anche ad altri settori. I maggiori players dell'IT nell'ambito commerciale hanno gia' cominciato ad interessarsi al fenomeno collaborando ai principali progetti Grid world-wide con sponsorizzazioni o a sviluppare propri progetti Grid in vista di un utilizzo finalizzato al mondo del commercio e dell'impresa.
La Grid ha quindi l'obiettivo di mettere a disposizione di un utente di un gruppo, in qualsiasi località del mondo, di usare tutte le potenzialità di calcolo del sistema ([[calcolo distribuito]]). È una rete di [[personal computer]] tutti asserviti allo scopo di elaborare, gestire e condividere i dati di cui un utente, ovunque si trovi, ha bisogno.<br/>
Differisce quindi notevolmete dai sistemi quali [[SETI@home]] o [[Condor]] che sfruttano i pc solo quando i loro proprietari non sono intenti ad usarli.
 
Una Grid e' in grado di fornire agli utenti di un gruppo scalabile (chiamato VO ossia Virtual Organization) senza una particolare caratterizzazione geografica la potenzialita' di usare la potenza di calcolo di un sistema distribuito garantendo un accesso coordinato e controllato alle risorse condivise.
L'idea del Grid computing è scaturita dalla constatazione che in media l'utilizzo delle risorse informatiche di un'azienda è pari al 5% della reale potenzialità. Le risorse necessarie sarebbero messe a disposizione da varie entità in modo da creare una organizzazione virtuale con a disposizione un'infrastruttura migliore di quella che la singola entità potrebbe sostenere.
 
L'idea del Grid computing è scaturita dalla constatazione che in media l'utilizzo delle risorse informatiche di un'aziendauna organizzazione è pari al 5% della reale potenzialità. Le risorse necessarie sarebbero messe a disposizione da varie entità in modo da creare una organizzazione virtuale con a disposizione un'infrastruttura migliore di quella che la singola entità potrebbe sostenere.
 
==Evoluzione del ''Grid computing''==
L'idea su cui si fonda la tecnologia Grid nasce all'inizio degli anni Novanta negli ambienti di ricerca, dove si comincia a pensare un modo per aggregare, attraverso l'ormai inaffidabile rete Internet, la potenza di calcolo erogata dai computer che si trovano in istituti sparsi in tutto il mondo.
 
Il progetto SETI@home, lanciato nel 1999 da Dan Werthimer, e' un esempio molto noto di un progetto, pur semplice, di Grid Computing - seguito poi da tanti altri nel campo della Matematica e della Microbiologia. a
Un primo esperimento di archittettura di calcolo distribuito è il progetto [[SETI I]] della [[NASA]] per l'interpretazione di segnali di vita extratterestre.
Grid è concettualmente un'evoluzione della tecnologia cluster, dove due o più calcolatori vengono accoppiati tra di loro da connessioni ad alta velocità, per sommare le potenze di calcolo e rinforzare l'affidabilità, perchè in caso di un fuori servizio di un calcolatore gli altri subentrano automaticamente ai suoi compiti (collegamento in [[paral-lelo]]).
 
Attualmente, la piu' importante Grid europea e' quella del [[CERN]] di [[Ginevra]] che ora si chiama gLite (precedentemente LCG e prima ancora DataGrid) sviluppata da un team italo-ceco e prevalentemente - cosa che non tutti sanno - presso l'italiano INFN, l'Istituto Nazionale di Fisica Nucleare con la collaborazione di Datamat spa.
Grid non ha un "padre spirituale" chiaramente identificato, anche perchè è uno sviluppo tecnologico quasi scontato, in quanto l'idea di una rete globale di calcolatori capace di erogare servizi in modo indipendente dalla posizione dei server era già stata ampiamente dimostrata dalla realizzazione del [[Web]]. Se il principio teorico di funzionamento è semplice e quasi ovvio, la realizzazione pratica è il vero scoglio che ha richiesto dieci anni di tempo per fornire i primi risultati commerciali utilizzabili fuori dalle porte dei laboratori e delle università.
Il [[CERN]] di [[Ginevra]] ha sviluppato i protocolli del GRID. Varie aziende fra le quali [[IBM]] e [[Intel]], sono impegnate nella diffusione della tecnologia che in futuro dovrebbe sostituire supercomputer e server dal costo di decine di migliaia di euro, con macchine in se meno affidabili dal costo di 2000-3000 euro.
 
Ogni Grid prevede uno livello di [[middleware]] fra i calcolatori (CE, computing element - anche piu' di uno in una cosiddetta farm o worker node) e gli utenti della Grid.
Il [[CERN]] di [[Ginevra]] ha sviluppato i protocolli del GRID. Varie aziende fra le quali [[IBM]] e [[Intel]], sono impegnate nella diffusione della tecnologia che in futuro dovrebbe sostituire supercomputer e server dal costo di decine di migliaia di euro, con macchine in se meno affidabili dal costo di 2000-3000 euro.
Lo scopo principale del middleware e' quello di effettuare il cosiddetto match-making, ossia l'accoppiamento tra le risorse richieste e quelle disponibili in modo da garantire il dispatching dei job sempre nelle condizioni migliori avendo visibilita' in un tempo molto vicino a quello reale degli stati dell'intera grid.
 
La piattaforma prevede uno strato di [[middleware]] fra sistema operativo e applicazione Grid. Il disaccoppiamento fra sistema operativo e Grid consente a quest'ultimo di non richiedere installazione e integrazione col sistema operativo e dunque di funzionare su Windows, Linux e Mac.
Il middleware supporta richieste di invio e ricezione dei dati senza richiedere una conoscenza dei protocolli di rete all'utente-programmatore, indipendentemente dal sistema operativo utilizzato.
 
Gli sviluppi più importanti hanno riguardato la messa a punto di un protocollo di comunicazione efficiente per far dialogare tra loro i calcolatori e lo studio delle modalità più efficaci per scomporre i problemi e i calcoli complessi in una miriade di elaborazioni elementari adatte ad essere distribuite sui nodi del Grid.
 
In futuro è in progetto l'estensione dei problemi e degli ambiti scientifici in cui è utilizzabile la tecnologia Grid. L'architettura offre una potenza di calcolo in grado di memorizzare sui vari computer locali ed elaborare in pochi minuti moli di dati intermedi dell'ordine dei milioni di gigabyte, che occuperebbero moltissimi CD.
L'organismo di riferimento per lo sviluppo di omogeneità e standard dei protocolli usati da Grid è GGF (Global Grid Forum), ed ha creato gli standard OGSA (Open Grid Services Architeture). Nel 2004 è stato emanato WSRF (Web Services Resource Framework), che è un insieme di specifiche per aiutare i programmatori a scrivere applicazioni capaci di accedere alle risorse Grid.
 
NellNel campo dell'industriaIT delin softwareambito commerciale, il più grande successo commerciale delle tecnologie Grid è rappresentato dall'ultimo database prodotto da Oracle, chiamato "10g". Proposto pocoverso piùla difine undel anno fa,2004 è ormai arrivato alla seconda versione ed è probabilmente destinato a far diventare la particolare versione della tecnologia Grid scelta dai suoi sviluppatori uno standard di mercato per le applicazioni destinate a banche e a grandi aziende.
 
Infatti, banche e grandi aziende di telecomunicazioni utilizzano grandi moli di dati riguardanti addebiti o accrediti in conto corrente o della SIM card: necessitano di un sistema di calcolo rapido e non soggetto a guasti.
 
== Voci correlate ==