お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2009/05/29 20:34

ニュース

NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」

画像集#002のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」
画像集#003のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」
 2009年5月29日,NVIDIAは,GPUコンピューティングをテーマとした開発者向けイベント,「Professional Solution Conference 2009」(PSC2009)を開催した。その名のとおり,これはHPCやCAD/CAMなど,ハイエンドのGPUコンピューティング開発者向けのイベントで,メインテーマは4Gamerの守備範囲から外れるのだが,開幕を告げる基調講演のスピーカーが,NVIDIAのGPUアーキテクチャ開発部門を率いるBill Dally(ビル・ダリー)氏といえば,興味を引かれる読者も多いだろう。
 本講では,1月にNVIDIAのチーフサイエンティストへ就任した氏による講演,「The End of Denial Architecture and The Rise of Throughput Computing」(否定するアーキテクチャの終焉と,スループットコンピューティングの興隆)の内容をレポートしていくことにしたい。


「CPUにパフォーマンスの伸びしろはない」


Bill Dally氏(Chief Scientist & Sr.VP of Research, NVIDIA
Bell Processor of Engineering, Stanford University)
画像集#004のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」
 Bill Dally氏といえば,米スタンフォード大学でとくに並列コンピューティングに関する先駆的な研究を行い,並列計算の基礎や実装の分野に大きな業績を残してきたことで知られる超有名人だ。コンピュータサイエンスの大物が,NVIDIAの顔として何を訴えるのか,興味深いところである。

 冒頭で挙げたタイトルに含まれる「Denial Architecture」というのは,なかなか分かりにくい言い回しだが,Dally氏が講演のなかで使った言葉を借りるなら,「シリアルプロセッサ」であり,要するに,従来の典型的なCPUのこと。CPUが何を“否定するアーキテクチャ”なのかは後ほど触れるが,Dally氏は講演の冒頭で,「CPUのスケールがこれ以上拡張されることはない」と断言する。「スケール」(scale)は,ここでは「パフォーマンスの伸びしろ」といった意味合いになるが,「それはなぜか」というのが講演の主要なテーマになるわけだ。

 Dally氏はまず有名なムーアの法則を引き合いに出す。

「半導体の集積度は18か月で2倍になる」という,半導体業界では知らぬ者がないほど有名な経験則,ムーアの法則
画像集#005のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」

 ご存じの読者も多いと思うが,ムーアの法則とは,Intelの共同創立者であるGordon Moore(ゴードン・ムーア)氏が提唱した,「半導体の集積度は18か月で2倍になる」という予測のこと。Dally氏はここで「あくまで集積度に関するものであり,プロセッサのパフォーマンス向上を予測した法則ではない」と説明する。「CPUはこれまで,ムーアの法則に従って増えたトランジスタをアーキテクチャの改善に振り向けてきた。その結果としてプロセッサのパフォーマンスが向上し,より複雑でリッチなアプリケーションが利用できるようになり,結果としてユーザーに大きなバリューをもたらしてきたのだ」(Dally氏)。

ムーアの法則に従って増えてきたトランジスタをプロセッサアーキテクチャの改善に振り向けることで,よりリッチなアプリケーションが動作するようになり,エンドユーザーに価値をもたらしてきたのであって,ムーアの法則自体がパフォーマンスを予測するものではないとDally氏
画像集#006のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」

 では,CPUはより大きなバリューをもたらし続けているのだろうか。Dally氏は,CPUの命令実行速度の伸びは1990年後半から鈍化し始め,2000年代に入ると年率19%の伸びにまで落ちてきているというデータを示したうえで,「GPUはそうではない」と断言する。「GPUの性能は依然として年率74%という高い伸びを示し続けている。ユーザーにより大きなバリューをもたらすのがGPUであることは明らかだ」(Dally氏)。
 実際,CPUのパフォーマンスの伸びが最近鈍化していることは,PCユーザーの多くが実感していることだろう。ここまでのDally氏の話は十分に納得できる印象である。

画像集#007のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」
CPUの命令の実行速度の向上を表したグラフ。1990年代中頃までは年率52%のパフォーマンス向上率を示していたCPUだが,後半以降,鈍化が始まったという
画像集#008のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」
それに対し,GPUは依然として年率74%という高い伸びを維持し続けているというスライド


キーワードは「並列化」と「局所化」


 なぜCPUの性能の伸びは止まりつつあるのだろうか。Dally氏は,CPUに科せられている技術的な制約である,エネルギー効率について話題を移した。「演算処理系で最もエネルギーを消費しているのは何か?」という問いに対しては,演算ユニットと答えてしまいそうになるが,Dally氏はその答えが,「データの移動」であると述べる。

64bit浮動小数点数と16bit固定小数点数を例に,演算ユニットが消費するエネルギーや,データを移動させるのに要するエネルギーを比較したスライド。64bitのデータを1mm移動させるのに要するエネルギーは25pJ(ピコジュール),16bitのデータでは6pJと,演算に要するエネルギーと比較しても馬鹿にならないほどのエネルギーを要するという。しかも,ダイの外にデータを移動させる場合はさらに大きなエネルギーが必要になる
画像集#009のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」

 上のスライドで示されているように,データの移動に要するエネルギーは意外に大きい。したがって,データはできるだけ移動させないほうがよく,局所化が重要だとDally氏は強調する。平たくいえば,データは演算ユニットの近くに置いたほうがエネルギー効率の点から有利ということである。
 これに対して,CPUは局所化には向かないアーキテクチャである。CPUでも多階層キャッシュを使ってデータを近くに置くようにはなっているが,プログラマからはメモリがフラットに見える(データがキャッシュ上にあるのか,メインメモリ側にあるのか分からない)アーキテクチャだからだ。「フラットなメモリを採用するCPUは終焉に向かっている」(Dally氏)。

パフォーマンスは並列化により向上し,データの局所化はエネルギー効率を高めるとDally氏
画像集#010のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」

 Dally氏は並列化,局所化を重視したコンピューティングを「Throughput Computing」(スループットコンピューティング)と呼んでいる。そして,氏のなかでこれと対置されるのがCPUである。講演のタイトルにあるDenial Architectureには,CPUが「並列化と局所化を否定するアーキテクチャ」という意味が込められていたわけだ。
 Dally氏によれば,スループットコンピューティングはすでに多くのアプリケーションに利用されているという。さらにDally氏は,並列処理の限界としてよく指摘される「アムダールの法則」も問題にならないと断言する。
 アムダールの法則というのは,簡単にいうと,「処理のなかには,並列化できない部分があり,その『並列化できない部分』のせいで,並列度を高めれば高めるほど,パフォーマンスの伸びは鈍化する」というものだ。だがDally氏はこれを真っ向から否定し,「アプリケーションに,並列化できない部分はない」と断じている。

 ……いや,さすがにこれは極論であり,もちろん実際には,どうしても並列化できな部分を抱えるアプリケーションは多く存在するのだが,Dally氏が言いたいのは,「ユーザーに今以上のバリューを与えられるようなアプリケーションは,ほとんどが並列化が可能だ」ということだろう。


GeForce GTX 200シリーズは,8基のStreaming Processorごとに一つのローカルメモリを持ち,ローカルメモリが高速なバスでグローバルメモリに接続されるという,まさにDally氏がいうスループットコンピューティングに沿ったアーキテクチャを持つ
画像集#011のサムネイル/NVIDIAの新チーフサイエンティスト,Bill Dally氏が講演。「CPUは終焉に向かっている」
 Dally氏は最後に,CUDAの利点や,CUDAによるアプリケーションの高速化といったあたりを紹介して講演を締めていたが,4Gamer読者からすると“耳にタコ”なものだったので割愛したい。
 Dally氏の率いる研究開発部門が,今後のNVIDIA製GPU製品,そしてGeForceにどのように影響を与えていくのかは未知数だが,NVIDIAが,GPUコンピューティングに大きく舵を切っていくなかで,強力な指導者を得たということだけは確かだ。そのことを強く感じさせてくれる講演だったように思う。

  • 関連タイトル:

    CUDA

  • 関連タイトル:

    GeForce GTX 200

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
スペシャルコンテンツ
注目記事ランキング
集計:11月25日〜11月26日