Intel Core Microarchitecture: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m typo |
fix |
||
(44 versioni intermedie di 33 utenti non mostrate) | |||
Riga 1:
{{F|microprocessori|luglio 2010}}
Con il nome '''Intel Core Microarchitecture''' viene identificata l'[[Microarchitettura|architettura]] di ottava generazione sviluppata per i [[processore|processori]] [[Intel]] come sostituta della vecchia [[NetBurst]] che era alla base dei [[Pentium 4]] e [[Pentium D]].
L'architettura "Core" è arrivata sul mercato a
== Cardini dell'architettura "Core" ==
L'architettura "Core" affonda le proprie radici nella filosofia alla base del progetto [[Banias]], il primo [[Pentium M]] delle piattaforme [[Centrino]], che è stato il primo progetto in cui Intel si è preoccupata di ottimizzare il consumo energetico pur mantenendo un elevato livello di prestazioni.
La prima versione della piattaforma "Core"
La nuova architettura "Core"
[[File:Intel Core2 arch.svg|thumb|upright=1.4|Architettura Core 2]]
Attraverso questa tecnologia è possibile eseguire più istruzioni per ciclo di [[clock]] rispetto a quanto era possibile nei processori basati sulle architetture precedenti. Ogni core può ora completare 4 istruzioni contemporaneamente, contro le 3 consentite da NetBurst. La lunghezza della [[pipeline]] si è accorciata molto rispetto a quella impiegata precedentemente; il primo processore Netburst, ovvero il Pentium 4 [[Willamette]], aveva una pipeline a 20 stadi che erano poi saliti a ben 31, nell'ultima evoluzione del Pentium 4, il core [[Prescott]]. L'architettura "Core" invece riprende la pipeline sviluppata già per il processore [[Yonah]] ed è a 14 stadi. È necessario sottolineare come una pipeline più corta sia meno vulnerabile ai salti nella successione di istruzioni e nella lettura di dati dalla memoria [[RAM]], anche se rende più difficile raggiungere frequenze di clock elevate: si tratta "solo" di trovare il giusto bilanciamento.▼
▲Attraverso questa tecnologia è possibile eseguire più istruzioni per [[ciclo di
All'interno di questa tecnologia ne trova posto anche un'altra chiamata "Macro-Fusion" che consente, secondo Intel, di unire tra loro alcune istruzioni per ottenre un'elaborazione più veloce. In pratica se su 10 istruzioni processate, 2 possono essere fuse tra loro, il processore eseguirà 8 istruzioni "semplici" e una aggregata attraverso proprio la tecnica "Macro-Fusion", ottenendo un aumento di prestazioni di circa il 10%.▼
▲All'interno di questa tecnologia ne trova posto anche un'altra chiamata "''Macro-Fusion''" che consente, secondo Intel, di unire tra loro alcune istruzioni per
Le operazioni svolte dai set di istruzioni [[SIMD]] che Intel ha sviluppato nel corso degli anni e che sono stati implementati anche nell'architettura "Core", vale a dire [[MMX]], [[Streaming SIMD Extensions|SSE]], [[SSE2]] e [[SSE3]], sono state ulteriormente velocizzate. Ora è possibile eseguire le istruzioni a [[128 bit]] (in realtà vengono uniti 4 elementi vettoriali a [[32 bit]] in un'unico blocco da 128 bit) SSE, SSE2 e SSE3 in un solo ciclo di clock, grazie alla presenza di ben 3 [[Arithmetic Logic Unit|ALU]] (Arithmetical Logical Unit).▼
▲Le operazioni svolte dai set di istruzioni [[SIMD]] che Intel ha sviluppato nel corso degli anni e che sono stati implementati anche nell'architettura "Core", vale a dire [[MMX]], [[Streaming SIMD Extensions|SSE]], [[SSE2]] e [[SSE3]], sono state ulteriormente velocizzate. Ora è possibile eseguire le istruzioni a [[128 bit]] (in realtà vengono uniti 4 elementi vettoriali a [[32 bit]] in un
Anche in questo caso si tratta di una tecnologia che Intel ha testato già con il processore Yonah; La [[cache]] L2 di un processore [[dual core]] viene finalmente condivisa da ciascun core. I vantaggi di tale tecnologia sono molteplici, infatti se da una parte viene minimizzato il traffico di dati sul [[BUS]] rispetto ad una soluzione dual core a 2 cache separate, dall'altra consente ad un core di utilizzare l'intera cache nel caso in cui l'altro core fosse al momento inattivo, cosa che può facilmente accadere con tutte quelle applicazioni che non sono in grado di sfruttare la presenza di più di un core in un sistema. Ora non può neanche più accadere che uno stesso dato sia duplicato nella cache L2, cosa che poteva accadere con i Pentium D dove le cache, essendo separate per ciascun core, potevano contenere dati replicati.▼
▲Anche in questo caso si tratta di una tecnologia che Intel ha testato già con il processore Yonah; La
La presenza di una cache L2 unificata di grandi dimensioni richiede una maggiore attenzione nel suo sfruttamento per non limitarne l'efficienza. Un processore dual core basato sulla nuova architettura integra 8 unità [[prefetch|prefetcher]]: più precisamente, si tratta di 2 data e 1 istruction prefetcher per ciascun core e 2 prefetcher come parte della cache L2 condivisa. Lo scopo del prefetcher è quello di leggere i dati all'interno di un'unità ad alto livello usando un algoritmo invasivo. Questo è progettato per fornire dati che devono essere forniti velocemente, riducendo le latenze e incrementando l'efficienza. I prefetchers di memoria guardano constantemente i modelli d'accesso di memoria, provando a prevedere se c'è qualcosa che possa essere inserito nella cache L2, nel caso in cui questi dati possano essere richiesti successivamente.▼
=== Smart Memory Access ===
Attraverso altri miglioramenti vari, si è potuto ottenere un generale abbassamento delle latenze di accesso alla memoria [[RAM]]. Accade spesso infatti, che il caricamento delle istruzioni debba attendere l'esecuzione di altre istruzioni. Il cosiddetto "Memory Disambiguation Predictor" dovrebbe limitare al massimo la possibilità di ambiguità della memoria in modo da sfruttare meglio la pipeline ed evitare svuotamenti a causa di dati non ancora disponibili. Si tratta di una innovazione che va a risolvere un vero tallone d'Achille della precedente architettura NetBurst.▼
▲La presenza di una cache L2 unificata di grandi dimensioni richiede una maggiore attenzione nel suo sfruttamento per non limitarne l'efficienza. Un processore dual core basato sulla nuova architettura
▲Attraverso altri miglioramenti vari, si è potuto ottenere un generale abbassamento delle latenze di accesso alla memoria [[RAM]]
==== Intelligent Power Capability ====▼
Anche per questa caratteristica Intel non ha rivelato dettagli molto esaurienti: in generale, il suo scopo è quello di ottimizzare ulteriormente il processo che regola la distribuzione del lavoro sui due core in modo da sfruttare tutta la potenza di calcolo a disposizione solo se questa viene effettivamente richiesta dal sistema.
In questo caso non si tratta di una vera e propria novità, infatti tale tecnologia, conosciuta come [[EM64T]] era già stata introdotta da Intel con i Pentium 4 Prescott. Per la prima volta però, l'elaborazione di codice a [[64 bit]] è possibile in tutti i settori di mercato, compreso quello mobile.
=== Innovazioni specifiche per il settore mobile ===
Di seguito vengono illustrate altre caratteristiche introdotte con la nuova architettura solo nelle versioni di processore destinate all'impiego in piattaforme mobile. Inizialmente quindi, esse
==== Intel Dynamic Power Coordination ====
Il suo compito è quello di
==== Intel Dynamic Bus Parking ====
Line 44 ⟶ 48:
Consente di risparmiare energia spostando i dati della cache nella memoria di sistema durante i periodi di inattività per ridurre il voltaggio della CPU.
== Enhanced Core Microarchitecture
Con l'arrivo della produzione di chip a [[45 nm]],
* '''Nuovo Divider Radix-16''':
* '''Operazioni di [[virtualizzazione]] migliorate''': la tecnologia di virtualizzazione [[Vanderpool]] ha
* '''Nuove istruzioni SSE4''':
* '''Aumento della cache L2 del 50%''': in tutti i prodotti della nuova generazione la [[cache]] L2
* '''BUS fino a 1333
* '''Nuova tecnologia [[Intel Deep Power-Down]]''': l'evoluzione delle CPU mobile mira a diminuire sempre di più l'energia dissipata affinando continuamente le tecniche di risparmio energetico in tutte quelle situazioni di utilizzo nel quale alla CPU non viene richiesta tutta la potenza elaborativa. Questa nuova tecnologia, affiancandosi alla SpeedStep,
== Considerazioni sull'efficienza: Stop alla corsa ai GHz ==
Una conseguenza molto importante delle varie migliorie introdotte con la nuova architettura risiede nel fatto che la corsa a frequenze di [[clock]] sempre più elevate diminuirà di parecchio, nei prossimi anni, nel segmento dei sistemi Desktop, pur naturalmente non arrestandosi; a parziale conferma di questo fatto si può notare che gli stadi della [[Pipeline dati|pipeline]] previsti dalla nuova architettura sono 14, al posto dei 12 del primo Pentium M Banias, e questo ha contribuito ad aumentare solo leggermente la frequenza di funzionamento. Infatti, più sono gli stadi della pipeline, e più essi sono elementari; di conseguenza ogni singolo stadio richiede meno cicli di clock per essere eseguito, e siccome i vari stadi possono essere eseguiti contemporaneamente si può innalzare la frequenza massima. Questo è uno dei motivi per cui Intel con il progetto [[Pentium 4]] [[Willamette]] prima, e quello [[Prescott]] poi, ha progressivamente aumentato il numero di stadi fino ad arrivare a ben 31; la frequenza massima è cresciuta molto fino a sfiorare i 4
== Differenza di prestazioni rispetto a NetBurst ==
Il settore in cui Intel soffriva di più il confronto con la rivale [[Advanced Micro Devices|AMD]] in termini di efficienza, era quello desktop e proprio in questo settore si ha avuto la maggior rivoluzione con l'adozione della nuova architettura. I nuovi processori Core 2 Duo [[Conroe (microprocessore)|Conroe]] hanno dimostrato un salto prestazionale di ben il 40% rispetto alla [[CPU]] Pentium D 950 (ovvero la più veloce CPU NetBurst, basata su [[
In ambito mobile, la differenza del nuovo processore Core 2 Duo [[Merom (microprocessore)|Merom]] rispetto al predecessore [[core Duo]] [[Yonah]]
In ambito server, Intel ha mantenuto in vita il marchio [[Xeon]] pur cambiando architettura. I nuovi Xeon basati su core [[Woodcrest (hardware)|Woodcrest]], sono stati in grado, in particolari ambiti, di aumentare le prestazioni anche dell'80% rispetto ad un modello Xeon 2,8
== Considerazioni sull'abbinamento "Processo produttivo/Architettura" di Intel ==
{{vedi anche|Intel Tick-Tock}}
Intel con la presentazione dell'architettura "Core" ha dichiarato l'intenzione di presentare una nuova architettura ogni 2 anni. Ma per aumentare le prestazioni mantenendo sotto controllo anche il consumo energetico di una CPU, è necessario non solo ottimizzare l'architettura ma anche produrre i nuovi processori con processi costruttivi sempre più raffinati.▼
▲
Per limitare gli imprevisti delle innovazioni tecnologiche necessarie al rinnovamento generazionale dei propri processori, a partire dagli inizi del [[2006]] Intel ha iniziato a seguire una strategia denominata "[[Intel Tick-Tock|Tick-Tock]]": prima viene introdotta una nuova tecnologia produttiva sulla base di un'architettura già collaudata (la fase "''Tick''") e in seguito, quando tale tecnologia è in grado di fornire [[resa produttiva|rese]] elevate, la si adotta per produrre una nuova architettura (la fase "''Tock''").
In maniera analoga, nel terzo trimestre [[2007]], Intel presenterà il processore [[Penryn]] che è in sostanza un [[die-shrink]] del Core 2 Duo, a 45 nm (fase "Tick"). Nel [[2008]], quando anche questo processo produttivo sarà a punto, arriverà la nuova architettura [[Nehalem]] (fase "Tock"). La sua evoluzione Nehalem-C (recentemente rinominata [[Westmere]]) sarà costruita a 32 nm, in modo da collaudare anche questa tecnologia in vista dell'architettura successiva [[Sandy Bridge]].▼
I primi esponenti di questa nuova filosofia di progetto, furono i processori [[Pentium D]] [[Presler]] (che avevano praticamente la stessa architettura dei precedenti [[Smithfield (informatica)|Smithfield]]) con cui venne introdotto il processo produttivo a [[65 nm]] (fase "''Tick''"). Dopo aver collaudato la nuova tecnologia costruttiva con queste CPU, Intel passò alla nuova architettura Core dei [[Core 2 Duo]], prodotta sempre a 65 nm (fase "''Tock''").
Questa metodologia di sviluppo, nelle intenzioni di Intel, minimizzerà i rischi propri dell'adozione di una nuova tecnologia produttiva con un'architettura a sua volta completamente nuova, consentendo ai progettisti di concentrarsi, ad anni alterni, a risolvere solo una delle due tipologie di problematiche.▼
▲In maniera analoga,
== Processori presenti e futuri basati su architettura "Core" ==▼
Di seguito sono elencati i nomi in codice dei processori sviluppati da Intel partendo dall'architettura "Core". Viene fornita anche una brevissima descrizione tecnica e l'anno di introduzione sul mercato. Per i processori per i quali si conosce il nome commerciale, viene fornito anche quello:▼
Seguendo il medesimo principio, Sandy Bridge è stata poi seguita dal die-shrink a [[22 nm]] [[Ivy Bridge]] nel [[2012]] (fase "Tick"), che ha quindi mantenuto la stessa architettura ma ha introdotto un nuovo processo produttivo. Nel [[2013]] arriverà anche la nuova architettura [[Haswell (hardware)|Haswell]] (fase "''Tock''"), il cui die-shrink a [[14 nm]] prenderà il nome di [[Broadwell (hardware)|Broadwell]] (fase "Tick"); quest'ultimo verrà poi seguito negli anni seguenti dall'architettura [[Skylake]] (fase "''Tock''") e dalla sua ri-scalatura [[Ice Lake]] (fase "Tick").
▲Questa metodologia di sviluppo, nelle intenzioni di Intel,
▲Di seguito sono elencati i nomi in codice dei processori sviluppati da Intel partendo dall'architettura "Core". Viene fornita anche una brevissima descrizione tecnica e l'anno di introduzione sul mercato
{| border="1" cellspacing="0" cellpadding="4" align="center"
Line 91 ⟶ 101:
|- align="center" |
| Core 2 Duo/Core 2 Extreme
| [[Conroe (microprocessore)|Conroe]]
| rowspan="
| rowspan="3" | 2
| rowspan="3" | L1=2x64KB<
| Desktop
| rowspan="5" | [[2006]]
|- align="center" |
| Core 2 Duo/Core 2 Extreme
| [[Merom (microprocessore)|Merom]]
| Mobile
|- align="center" |
| Xeon DP
| [[Woodcrest (hardware)|Woodcrest]]
| Server DP
|- align="center" |
| Core 2
| [[Kentsfield]]
| rowspan="5" | 4
| rowspan="
| Desktop
|- align="center" |
| Xeon DP
| [[Clovertown]]
| Server DP
|- align="center" |▼
| Xeon DP▼
| [[Harpertown]]▼
| rowspan="5" | 45 nm▼
| rowspan="3" | L1=2x64KB<BR>L2=2x6MB▼
| Server▼
| rowspan="5" | [[2007]]▼
|- align="center" |
| Xeon MP
| [[Tigerton (hardware)|Tigerton]]
| Server MP
|- align="center" |
| Core 2
| [[Yorkfield]]
▲| rowspan="5" | 45 nm
| Desktop
▲|- align="center" |
▲| Xeon DP
▲| [[Harpertown]]
▲| Server
|- align="center" |
| Core 2 Duo
| [[
| rowspan="2" | 2
| rowspan="
| Desktop/Server DP▼
| Mobile▼
| rowspan="3" | [[2008]]
|- align="center" |
| Core 2 Duo
| [[Penryn (computer)|Penryn]]
▲| Mobile
▲| Desktop/Server
|- align="center" |
| Xeon MP
| [[Dunnington (hardware)|Dunnington]]
| 6
| L1=6x64KB<br />L2=3x3MB<br />L3=16MB
| Server MP
|}
== Architettura successiva ==
Come anticipato poco sopra, l'architettura "Core" non
== Roadmap ==
{{Roadmap processori Intel}}
== Voci correlate ==
* [[Microarchitettura
* [[NetBurst]]
* [[
{{Portale|informatica}}
[[Categoria:Architettura x86]]▼
|