Coreマイクロアーキテクチャ

これはこのページの過去の版です。Puru48947114 (会話 | 投稿記録) による 2011年6月21日 (火) 19:39個人設定で未設定ならUTC)時点の版 (性能比較)であり、現在の版とは大きく異なる場合があります。

Coreマイクロアーキテクチャ(コアマイクロアーキテクチャ)は、インテルのイスラエル・ハイファの開発チームが、性能と低消費電力の両立を目指して、NetBurstマイクロアーキテクチャの後継として開発したCPUマイクロアーキテクチャである。

Intel Core 2で採用された。2008年末からは徐々に後継のNehalemマイクロアーキテクチャへの移行が進んでいる。

概要

ファイル:Conroe die.png
Core 2 (Conroe) のダイ写真

Core 2は、それまでとは違い全く新しい設計思想によって作られたCPUである。インテルのシニアアーキテクトであるボブ・バレンタインの発言によると、「Coreマイクロアーキテクチャはもはや内部RISCプロセッサのアーキテクチャではない」とした。

CISCであるx86命令セットは1命令で複雑な処理が可能であるが、その複雑さから処理の高速化は難しいと考えられた。そこで、CPUの内部でx86命令を複数の簡単なRISC的命令(μOPs)に分解することによって性能の向上が可能となる、との考え方が生まれた。それによって処理の向上を図った製品が、Pentium ProからPentium IIIプロセッサに続くP6マイクロアーキテクチャである。

当時、半導体の製造技術の順調な進歩に後押しされ、その設計思想は妥当だと考えられていた。また、処理能力の向上を支えるクロック速度向上に伴うダイナミック電流の増加、即ち消費電力の増大については、半導体技術の進歩を受けて設計ルールを微細化することにより消費電力を削減して相殺できると楽観視されていた。それに続くPentium 4プロセッサに代表されるNetBurstマイクロアーキテクチャは、その設計思想をさらに推し進めたものである。結果、NetBurstマイクロアーキテクチャは1個のx86命令を複数の極めて単純な命令に分解し、それを深いパイプラインに投入して高速に処理することで性能を稼ぐという手法を採用した。

しかし、半導体の製造技術の進歩により処理を高速化すると消費電力は級数的に増えてしまうことが予見されるようになり、加えて設計ルールの微細化に伴うリーク電流の増加が顕著になり、その現象が2000年代前半に顕著になってきた。NetBurstマイクロアーキテクチャは分解した単純な命令を大量に処理することを前提とし、それによってさらなる処理の高速化を実現する製品であったため、消費電力の増大と共に発熱問題にも直面した。結果として、複数のCPUを搭載するサーバ用途では放熱に苦心を強いられ、多数のCPUを搭載するブレードサーバ用途には向かないものとなった。また、熱設計的にはゆとりがあるはずのデスクトップPCでもその対策に悩まされるようになった。CPU放熱ファンは大型化し高速回転して唸りをあげ、放熱フィンも大型化し、これらの大きなパーツを支える仕組みを備える必要があったし、コストを押し上げる要因となった。また、CPUから奪った熱がこもらない様にケース内のレイアウトを適切に設計し、ケース・ファンを設けるなど設計に注意をはらう必要があった。

一方、同時期にモバイル用として登場したPentium Mは、良好な低消費電力と比較的高い処理性能によってモバイル分野では成功を収めた。しかし、モバイル用途に限定して設計していたため、デスクトップ/サーバ分野でNetBurstマイクロアーキテクチャを置き換える対象としては不向きであった。やがてPentium Mの後継としてIntel Coreに代替わりし、それをベースとしたデスクトップ/サーバにも適した次世代のマイクロアーキテクチャの開発が急がれた。

Coreマイクロアーキテクチャの完成により、高性能と低消費電力の両立に成功し、モバイルと高密度サーバ、そしてデスクトップと大規模サーバというカテゴリごとにそれぞれ違うマイクロアーキテクチャで対応していた製品展開を、Coreマイクロアーキテクチャから派生した単一のマイクロアーキテクチャでの対応を可能とするに至った。

Intel 3,4 Series、975X Express、965 (963) Express、946 Express、945 Expressの各チップセットファミリに対応する。

機能

Core 2の新しい機能としては、インテルのCTOにより大きく5つの技術が紹介されている。

インテル アドバンスト・スマート・キャッシュ
2MB - 3MB - 4MB - 6MBのL2キャッシュは2つのコアで効率的に共有され、使用率は状況に応じて動的に変更される。従来は各コアごとにL2キャッシュを備えていたため、データの重複によるキャッシュ領域の無駄遣いが生じ、またコヒーレンス制御にチップセットを経由する必要がありFSB帯域を無駄にしていた。コア間でL2キャッシュを共有することでより効率的なキャッシュ領域の使用ができ、またL2キャッシュのコヒーレンス制御がなくなるためFSB帯域が節約できるようになった。L1キャッシュのコヒーレンスもL2キャッシュ経由で行えるため極めて高速である。
インテル スマート・メモリー・アクセス
メインメモリからの読み込みはL1キャッシュ・L2キャッシュの読み込みに比べて大変遅い。メインメモリにあるデータや命令のうち、予め必要となりそうなデータをキャッシュに取り込んで(プリフェッチ)おくことで、遅延を解消している。
インテル アドバンスト・デジタル・メディア・ブースト
YonahのMedia Boostを強化したもの。それまで128ビットSSE命令は64ビット命令が2サイクルとして処理されていたが、これを1サイクルで処理可能にした。
インテル ワイド・ダイナミック・エグゼキューション
効率的なマイクロオペレーションμOPs、CPU内部の命令実行単位)の制御機構。デコードからエグゼキューション(実行)までの間に、μOPsを随時統合・分割するなど効率的に管理することによって、内部の処理時間を短縮させている。また32bit命令を最大6命令まで処理可能なパイプラインは14段階とされており、Pentium Proから4段増えている。ピーク性能は1クロックあたり24命令同時実行である (Kentsfield)。
ネーミングから判るように、P6のダイナミック・エクゼキューションをワイド化したものと言え、パイプラインはP6,の3issueから4issueへと拡張され、同時実行命令数及び同時実行可能命令種類の拡大が行われている。[1]
Intel Intelligent Power Capability
プロセッサの回路を細かく分割して管理し、使用されていない区画には電力を供給しないことで、消費電力を抑えている。
Intel Dynamic Acceleration
他のコアがC3ステート以下の状態にある時、TDPの枠内でクロックを引き上げることでシングルスレッド性能を向上させる。

更に2007年7月27日のリリースでMerom(モバイル向け)特有の機能として以下の3つの技術が紹介された。

インテル ダイナミック・パワー・コーディネーション
各コアをそれぞれ独立してスリープ(Cステート)させる機能。
インテル ダイナミック・バス・パーキング
CPUと連動してチップセットの消費電力も減らす機能。
ダイナミック・キャッシュ・サイジング機能を備えた拡張版インテル ディーパー・スリープ
キャッシュを利用しないことで、より消費電力を削減するスリープモード。

2007年3月28日に発表されたPenrynではプロセスルールの微細化によるリーク電流問題の解決のため、トランジスタゲート絶縁膜にHigh-k(高誘電率ゲート絶縁膜材料)とメタルゲートを採用。プロセスルールも65nmから45nmに微細化され、さらなる消費電力低減と高クロック動作が可能となった。 L2キャッシュはダイ毎に最大で6MBに増加。デュアルダイ構成の場合は最大で12MBとなる。Meromに対し新たにSSE4と除算性能を約2倍に向上させるRadix-16 dividerの追加、Intel VTの25~75%の性能向上が行われている。 また、Super Shuffle Engineによってシャッフルユニットが128Bit拡張されたことによりシャッフル/ パック/ アンパックなどの命令が1サイクルレイテンシーで実行できるようになった。これによってSSEユニットのフル128Bitを果たしたといえよう。

性能比較

Intelの前世代の主製品だったPentium 4 / Pentium Dと、競合するAMDAthlon 64 / Athlon 64 X2との間で、製品性能競争でつばぜり合いが行われていた。その為、Core 2が登場した時にも盛んにベンチマークテストが行われていた。

エンジニアリングサンプル品が幾つかのコンピューター関係プレス各社に配布され、プレス各社はベンチマークテストを行い、その結果を公表した。またAMDとIntelは秋葉原にて互いに競合製品との比較を行うベンチマークテストのデモンストレーションを実施した。

Pentium 4との性能比較
同じクロックのPentium 4に比べて圧倒的に高い性能を持つ事が明らかにされた。Merom New Instructions (SSSE3) をはじめとする、ストリーミングSIMD命令セットは極めて強力な能力がある事を示した。詳細はインテル アドバンスト・デジタル・メディア・ブーストの項を参照。