Intel,80コアでTFLOPSを実現する浮動小数点演算プロセッサ開発
Intelは,80コアでTFLOPS(Tera Floating point number Operations Per Second,テラフロップス:1秒間に1兆回の浮動小数点演算)の性能を実現する浮動小数点演算プロセッサの開発に成功したと発表した。このチップのままの形で発売することはないとされるが,この技術が,別の製品と組み合わせてさまざまな形で登場することが予想される。
詳細は公開されていないので憶測に頼るしかないのだが,1コアあたり最低でも12.5GFLOPSの性能ということで,3GHz程度の動作クロックであれば,1コアあたり2個の積和演算を同時に行う感じになる。6GHz以上のクロックは考えにくいので,1コアあたりの演算器数は2〜4個といったところだろう。大きさは「爪程度」ということなので,親指の爪としても,現状のCPUくらいの大きさだ。重要なのは,この表現からしてシングルチップらしいということである(Intelではマルチチップでマルチコアプロセッサを作る場合もある)。
NVIDIAの「GeForce 8800 GTX」が128個のストリームプロセッサを集積していることから,160個程度の演算器というだけではそれほどのインパクトは感じないのだが,コア内部に複数の演算器を持っている場合と,たくさんのコアを寄せ集めている場合では,構造的な違いがある。並列度を上げた製品を作る場合は,マルチコア構成のほうがはるかに簡単であろう。加えて,Intelはプロセッサの高速動作では一日の長があり,いまだ600MHz程度で停滞しているGPUの,数倍のクロックで動作するプロセッサも期待できるだろう。 ただ,コアを複数にした場合には,コア間のデータ転送がネックになる可能性が高い。Intelの今回のチップでは,チップ上にネットワークを統合しているという。またチップ−チップ間の高速転送に関する研究も行われている。
今回のチップ単体だけ見れば,マルチコアにせずに単体コアに80個分の演算器を詰め込んだほうが性能もダイ効率もよいのではないかと思うのだが,Intelにとっては,ダイの大きさだけでスケーラブルに性能を上げられるということが重要なのだろう。これで当分,ムーアの法則は堅持できるはずだ。
それはともかく,マルチコアで演算器をタイル状に敷き詰めるという構成は,必要な演算量に応じてさまざまなチップを構成できるということを意味する。携帯電話からスーパーコンピュータまで,同じアーキテクチャで対応できるかもしれない。 また,Intelでは,AMDの「Torrenza」の対抗となると思われる外部チップソリューションの開発を表明しているが,今回のチップは,まさにうってつけのものといえるだろう。さらに,これがチップセットに搭載されれば,チップセットのオンボードビデオ機能だからといって,侮れないくらいのシェーダ性能を見せつけるかもしれない。
加えて,高性能を発揮する割に,消費電力はさほど高くない。62Wは,Core 2 Duoと同程度の消費電力である。「Pentium D」や「GeForce 8800」の半分ではあるものの,ニュースリリースでいう「家電製品より小さい消費電力」というのは,いったいどんな家電製品を想定してるのだろうか。確かに性能を考えると,低消費電力には違いないのだが。 結構昔から「ゲームには浮動小数点演算性能が必要」と言われていたが,所詮CPUの演算範囲では,劇的に演算性能が変わるわけでもなく,「CPUは速いほうがいいよね」程度の捉えられ方だった。現在は,GPUが浮動小数点演算で突出した性能を発揮するようになってきており,より重い意味で浮動小数点演算性能が求められつつある。このような専用プロセッサの登場もそのような流れであろう。少スレッドに最適化されたプロセッサに注力していたIntelが,並列化を第一としたプロセッサに目を向けてきた。これは重要である。 とりあえず,数年内に「TFLOPSは当たり前」といった環境でゲームが作られるようになるだろう。一昔前のスーパーコンピュータに匹敵する性能が1チップで実現され,どんなことができるのか今後が楽しみである。(aueki)
左:驚くべき数のコンデンサが林立しているマルチコアプロセッサ用サンプルボード
中:性能測定中。1.6GFLOP程度の数値が出ている
右:マルチコアチップのウェハー
|
|
|
#### 以下リリースより ####
「テラ時代」に向けた研究を推進 〜 世界初、テラフロップス性能を実現し、かつエネルギー効率を大幅に改善した80コアのプログラム可能なプロセッサー 〜
インテル コーポレーション(本社:米国カリフォルニア州サンタクララ)は、世界初のプログラム可能な80コアのシングル・プロセッサーを開発しました。同プロセッサーは、指の爪ほどの大きさで、家電製品よりも小さい消費電力ながら、スーパーコンピューターに匹敵する性能を発揮します。これは、将来のPCやサーバーで1秒当り数兆回の演算速度(テラフロップス)を実現することを目的とした、インテルの革新的な「テラスケール・コンピューティング」についての研究の成果です。テラスケールの研究に基づくチップの技術的な詳細は、今週サンフランシスコで開催される“国際固体素子回路会議(ISSCC: Integrated Solid State Circuits Conference)で発表する予定です。
テラフロップス級の性能およびテラバイトのデータ伝送処理能力は、PC、サーバー、そして携帯機器で、教育や共同作業のための新しいアプリケーションや、高品質のエンターテインメントを可能にすることにより、あらゆる状況でインターネットに接続できる将来のコンピューターにおいては重要な役割を果たすことになります。 例えば、かつて「スター・トレック」でSF(サイエンス・フィクション)とされていた人工知能やビデオ通信、写真画質に迫るリアルなゲーム、マルチメディアのデータマイニング、リアルタイムの会話認識などは、身近なものになるでしょう。
インテルが浮動小数点演算機能だけを備えたこのチップを市場に投入する予定はありませんが、テラスケールの研究は、新たな技術革新を探求する先進的な研究課題です。この研究は、個々のプロセッサー、専用プロセッサーあるいはコアの各機能、データを最も効率的に移動する上で必要となるチップ-チップ間およびチップ-コンピューター間の相互接続、さらに重要である複数のプロセッサー・コアを最大限に利用するソフトウェア設計にまでおよびます。このテラフロップスの研究用チップは、新しいプロセッサーの設計方法や高帯域幅の相互接続、エネルギー管理手法に具体的に役立つ示唆をもたらしました。
インテル コーポレーション シニアフェロー 兼 最高技術責任者(CTO)のジャスティン・ラトナーは「当社の研究チームは、マルチコアおよび並列コンピューティングの性能を進展させる素晴らしい、画期的成果をあげました。それは近い将来、テラフロップスに対応した設計が当たり前になり、家庭やオフィスのコンピューターやインターネットで実現できることが様変わりするために、我々が進むべき方向性を示しています」と述べました。
テラフロップス性能が初めて達成されたのは1996年で、インテルがサンディア国立研究所(Sandia National Laboratory )のために構築したASCI レッド・ スーパーコンピューターでした。このコンピューターは、2,000平方フィート以上ものスペースを必要とし、さらには約10,000個のPentium(R) Pro プロセッサーを使用し、500キロワット以上の電力を消費しました。インテルの研究用チップは、これと同等の性能を1つのマルチコア・チップで実現します。
さらに注目すべきことは、この80コアの研究用チップは、多くの既存シングルコア・プロセッサーよりも少ない、わずか62ワットの消費電力でテラフロップス性能を実現する点です。
このチップは、より小さなコアを「タイル」のように繰り返し配置した革新的なタイル・デザインが特長で、メニーコア・チップの設計を容易にします。インテルは将来のトランジスタ構築のための新しく堅牢な素材を発見し、ムーアの法則の継続性が確認されたことにより、このチップは将来、数億個のトランジスタをもつマルチコア・プロセッサーのより効率的な製造に道筋をつけるものです。
さらにテラフロップス・チップは、コア間の超高帯域通信を可能にするメッシュのような「network-on-a-chip」アーキテクチャーを特徴とし、チップ内で1秒当り数テラビットのデータ伝送を実現しています。またこの研究により、コア電源のオン・オフをそれぞれ独立して行う研究が行われており、一つのタスクを完了させるために必要なコアのみが使用されるため、より電力効率を高めることができます。
さらにテラスケールの研究は、チップに3Dスタック・メモリーの追加と、インテル(R) アーキテクチャーを基盤とした多くの汎用コアをもつ最新式の研究用プロトタプの開発に力を入れています。現在、インテル(R) テラスケール・コンピューティングに関する研究プログラムでは、他のアーキテクチャー、ソフトウェアおよびシステム設計の課題を探るために100を超えるプロジェクトが進行中です。
インテルはISSCC において、この他に数件の研究論文を発表する予定です。 そのなかには現行の65 nmと、革命的な45nmプロセス・テクノロジーを活用したインテル(R) Core(TM) マイクロアーキテクチャーおよびノートPCからデスクトップPCまで使われているデュアルおよびクアッドコア・プロセッサーに関する論文が含まれています。
########
|
|
|
|
|