Cell (processore): differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m +Articoli su ars technica. |
Capitolo sulle prestazioni del processore |
||
Riga 19:
L'architettura di Cell prevede l'incorporazione di più elementi base (1 PE più 8 SPE) in un solo chip. IBM ha presentato il brevetto di un'unità formata da quattro unità base in grado di sviluppare in teoria 1 Teraflop.
== Prestazioni ==
Il PPE incrementa le sue prestazioni e lo sfruttamento delle risorse con il multithreading piuttosto che puntare su un ottimizzazione spinta delle prestazioni del singolo thread; avendo principalmente un compito di gestione delle altre unità, la grana del calcolo non è dunque particolarmente elevata ma diventa importante una buona gestione dei thread e dei processi.
Per quanto riguarda gli SPE vale invece il discorso opposto, essi sono specializzati nella computazione, hanno un (relativamente) grosso spazio di memoria on chip e lavorano solo su quello; il lavoro ottimale di queste unità è dunque il calcolo su vettori di dati delle stesse operazioni.
Sia PPE che SPE supportano il calcolo vettoriale, istruzioni su una serie di dati strutturati in un array monodimensionale. Questi elementi possono essere interi o floating point. In questo modo ogni singolo SPE è capace di lavorare contemporaneamente su 8 operazioni a singola precisione, grazie a questo meccanismo la sua performance arriva a circa 25,6 GFLOPS, dunque in teoria lavorando su precisione singola ogni singolo core ha potenzialità circa 8 volte maggiori di quelle di un Pentium IV con lo stesso clock, a precisione doppia le prestazioni diventano equivalenti.
A livello teorico il Cell può arrivare dunque sino ai 204,8 GFLOPS lavorando in singola precisione, e 25 GFLOPS in precisione doppia, rispettivamente 64 e 8 volte quelle di un Pentium IV con lo stesso clock.
Questo rende il Cell molto interessante per il calcolo in ambito scientifico; sebbene la sua architettura non sia ottimizzata per il calcolo in precisione doppia le prestazioni risultano comunque notevoli, e il fatto che tale processore sia studiato per una console influirà sicuramente sui costi del processore stesso, che essendo prodotto su larga scala risulterà notevolmente più economico di un processore "di nicchia" studiato appositamente per il calcolo scientifico.
== Cell anche per i Server ==
|