Il Grid computing indica un'infrastruttura distribuita per consentire l'utilizzo risorse di calcolo e di storage provenienti da un numero indistinto di calcolatori (anche e soprattutto di potenza non particolarmente elevata) interconnessi da una rete (solitamente Internet ma non necessariamente).

File:Systems Diagram GRID Computing Jing Wu.jpg
Schema della possibile evoluzione del GRID

Il termine Grid computing e' stato coniato a meta' degli anni novanta. Un testo tuttora di riferimento apparso in quegli anni e': "The Grid: Blueprint for a New Computing Infrastructure"(autori/editori Ian Foster e Carl Kesselman) del 1998.

Le 'griglie di calcolo' vengono prevalentemente utilizzate per risolvere problemi computazionali di larga scala in ambito scientifico e ingegneristico. Sviluppatesi originariamente in seno alla Fisica delle Alte Energie (in inglese HEP) il loro impiego e' gia' da oggi esteso alla Biologia, alla Astronomia e in maniera minore anche ad altri settori. I maggiori players dell'IT in ambito commerciale hanno gia' cominciato ad interessarsi al fenomeno collaborando ai principali progetti Grid world-wide con sponsorizzazioni o a sviluppare propri progetti Grid in vista di un utilizzo finalizzato al mondo del commercio e dell'impresa.

Una Grid e' in grado di fornire agli utenti di un gruppo scalabile (chiamato VO ossia Virtual Organization) senza una particolare caratterizzazione geografica la potenzialita' di usare la potenza di calcolo di un sistema distribuito garantendo un accesso coordinato e controllato alle risorse condivise.

L'idea del Grid computing è scaturita dalla constatazione che in media l'utilizzo delle risorse informatiche di una organizzazione è pari al 5% della reale potenzialità. Le risorse necessarie sarebbero messe a disposizione da varie entità in modo da creare una organizzazione virtuale con a disposizione un'infrastruttura migliore di quella che la singola entità potrebbe sostenere.

Evoluzione del Grid computing

Il progetto SETI@home, lanciato nel 1999 da Dan Werthimer, e' un esempio molto noto di un progetto, pur semplice, di Grid Computing - seguito poi da tanti altri nel campo della Matematica e della Microbiologia. a

Attualmente, la piu' importante Grid europea e' quella del CERN di Ginevra che ora si chiama gLite (precedentemente LCG e prima ancora DataGrid) sviluppata da un team italo-ceco e prevalentemente - cosa che non tutti sanno - presso l'italiano INFN, l'Istituto Nazionale di Fisica Nucleare con la collaborazione di Datamat spa. Varie aziende fra le quali IBM e Intel, sono impegnate nella diffusione della tecnologia che in futuro dovrebbe sostituire supercomputer e server dal costo di decine di migliaia di euro, con macchine in se meno affidabili dal costo di 2000-3000 euro.

Ogni Grid prevede uno livello di middleware fra i calcolatori (CE, computing element - anche piu' di uno in una cosiddetta farm o worker node) e gli utenti della Grid. Lo scopo principale del middleware e' quello di effettuare il cosiddetto match-making, ossia l'accoppiamento tra le risorse richieste e quelle disponibili in modo da garantire il dispatching dei job sempre nelle condizioni migliori avendo visibilita' in un tempo molto vicino a quello reale degli stati dell'intera grid.

Gli sviluppi più importanti hanno riguardato la messa a punto di un protocollo di comunicazione efficiente per far dialogare tra loro i calcolatori e lo studio delle modalità più efficaci per scomporre i problemi e i calcoli complessi in una miriade di elaborazioni elementari adatte ad essere distribuite sui nodi del Grid.

L'organismo di riferimento per lo sviluppo di omogeneità e standard dei protocolli usati da Grid è GGF (Global Grid Forum), ed ha creato gli standard OGSA (Open Grid Services Architeture). Nel 2004 è stato emanato WSRF (Web Services Resource Framework), che è un insieme di specifiche per aiutare i programmatori a scrivere applicazioni capaci di accedere alle risorse Grid.

Nel campo dell'IT in ambito commerciale, il più grande successo delle tecnologie Grid è rappresentato dall'ultimo database prodotto da Oracle, chiamato "10g". Proposto verso la fine del 2004 è ormai arrivato alla seconda versione.

Voci correlate

Collegamenti esterni