ニュース
AMD,新世代GPU「Radeon HD 6800」を発表。HD 5800シリーズの後継を179〜239ドルで
日本時間2010年10月22日11:01,AMDは,第2世代のDirectX 11対応GPUシリーズとなる「Radeon HD 6000」(※正確には「AMD Radeon HD 6000」)シリーズを発表した。AMDブランドを冠した初めてのRadeonだ。
AMDは,2010年第4四半期中に,ATI Radeon HD 5800シリーズ後継となる「Barts」(バーツ,開発コードネーム)および「Cayman」(ケイマン,同),さらにCaymanを2基搭載した「Antilles」(アンティレス,同)を投入するが,発表に合わせて市場投入されることになったのは,Bartsこと「Radeon HD 6800」である。
本稿では,台湾で開催された事前技術説明会「Northern Islands Architecture Deep Dive」(以下,Deep Dive)の内容を中心に,Radeon HD 6800シリーズで拡張されたアーキテクチャのポイントをかいつまんでお伝えしたい。
「Radeon HD 6870&6850」レビュー。Northern Islands世代の開幕を告げる新製品は,誰のためのGPUか?
モデルナンバーの印象とは異なる立ち位置
ライバルはGeForce GTX 460
今回発表されたRadeon HD 6800シリーズの製品は2モデル,「Radeon HD 6870」(以下,HD 6870)と「Radeon HD 6850」(以下,HD 6850)だ。搭載カードは,正式発表と同時に各パートナーから出荷開始となる。
両GPUの基本的な仕様は下記のとおり。
●Radeon HD 6870
- シェーダプロセッサ数:1120基
- テクスチャユニット数:56基
- コアクロック:900MHz
- メモリクロック:4.2GHz相当(実クロック1.05GHz)
- グラフィックスメモリ:GDDR5 256bit,容量1GB
- レンダーバックエンド数:32基
- ディスプレイインタフェース:DVI-I×2(Dual-Link,Single Link各1),Mini DisplayPort×2,HDMI×1
- 電源供給:6ピン×2
- 最大消費電力:151W
- アイドル時消費電力:19W
- 北米市場想定売価:239ドル
●Radeon HD 6850
- シェーダプロセッサ数:960基
- テクスチャユニット数:48基
- コアクロック:775MHz
- メモリクロック:4GHz相当(実クロック1GHz)
- グラフィックスメモリ:GDDR5 256bit,容量1GB
- レンダーバックエンド数:32基
- ディスプレイインタフェース:DVI-I×2(Dual-Link,Single Link各1),Mini DisplayPort×2,HDMI×1
- 電源供給:6ピン×1
- 最大消費電力:127W
- アイドル時消費電力:19W
- 北米市場想定売価:179ドル
さて,この2モデルは,モデルナンバーからすると,「ATI Radeon HD 5870」と「ATI Radeon HD 5850」(以下,HD 5850)の後継に思えるが,実はそうではない。注目したいのは,両モデルの資料で示されている比較対象が,HD 6870はグラフィックスメモリ1GB版「GeForce GTX 460」(以下,GTX 460 1GB),HD 6850がグラフィックスメモリ768MB版GTX 460(以下,GTX 460 768MB)になっている点だ。
Deep Diveでは,同社でグラフィックス製品を統括するMatt Skynner(マット・スキナー)副社長兼ジェネラルマネージャーが登壇し,「Northern Islandsシリーズの開発にあたっては,ゲーマーが何を望んでいるかを第一に考えた」とアピールした。
これは,Radeon HD 6000シリーズが,2010年3月に開催された「Game Developers Conference 2010」で,同社がマニフェスト(公約)として掲げた「ゲーマー第一主義」(Gamers First)に則ったものであることを示すものだ。
それが,冒頭で述べたCaymanとBartsだ。前者はより性能を求めるユーザー向け,後者は価格対性能比重視のユーザー向けに,150〜250ドルの価格帯へ投入されることになるが,このBartsこそが,HD 6870とHD 6850というわけである。
また,HD 6870とHD 5850の比較では,消費電力にも注目したい。というのも,両製品の公称消費電力は,HD 6870が最大151W,最低19Wなのに対し,HD 5850が同151W,27Wで,最大値が同じながら,最低値が引き下げられているからだ。この19WというのはHD 6850も同じなので,Radeon HD 6800シリーズでは,ATI Radeon HD 5800シリーズから省電力機能に改善が入っていると言っていいだろう。
現行製品となる「ATI Radeon HD 5970」とATI Radeon HD 5800シリーズは,これに合わせて終息する見込み。ただし,ATI Radeon HD 5700シリーズは,店頭価格を引き下げたうえで継続販売することも発表されている。
HD 5800の性能を保ちつつ
ダイサイズと消費電力を縮小した設計
HD 6000シリーズの特徴は,Skynner氏によれば,よりリアルなグラフィックス表現を実現する「EyeDefinition」,より使いやすくなった第2世代の「Eyefinity」,そして,さらに強化されたビデオ再生品質と,並列コンピューティングによるマルチメディア処理・再生技術「EyeSpeed」だ。
EyeDefinitionの概要。解説を読む限り,HD 6000シリーズにおける,グラフィックス面での性能と画質の向上を表現するキーワードのようだ |
第2世代Eyefinityの概要。DisplayPortとHDMIが最新バージョンへ対応し,さらにHD 6800シリーズリファレンスカードでは,Mini DisplayPort×2基をはじめとする5個のディスプレイ出力を備える |
Eyefinityは,HD 5000シリーズから搭載されたマルチディスプレイ機能だ。HD 6000シリーズの第2世代では,DisplayPort 1.2やHDMI 1.4aのサポートにより,より柔軟なマルチディスプレイ環境構築が可能になった。合わせてHD 6800シリーズでは,ディスプレイ出力端子の構成も変更されている。
この3大機能が,HD 6000シリーズ共通のアーキテクチャ上の強化点であり,特徴ともなるわけだ。
次に,HD 6800のアーキテクチャだが,AMDがHD 6800で設計目標としたのは,「ATI Radeon HD 5800シリーズの性能を,安価かつ低消費電力で実現すること」。これを達成するため,アーキテクチャの最適化を図り,HD 5800シリーズと同等の性能をより小さなダイサイズで実現。ダイサイズの縮小により,価格あたりの性能を向上させると同時に,カードの消費電力を150W前後以下まで抑えることに成功したという。
AMDでグラフィックス製品担当CTOを務めるEric Demers(エリック・デメル)氏は,Radeon HD 6800シリーズのアーキテクチャをについて,「17億トランジスタを集積し,ダイサイズは255mm2と,ATI Radeon HD 5800シリーズと比較して25%小さい半導体サイズながら,最適化で同等以上のパフォーマンスを実現した」と述べた。
また,テッセレーション処理の効率化などにより,ジオメトリスループットも,HD 5850の1秒あたり7億2500万ポリゴンから,9億ポリゴンに向上している。
内部構造ではDispatch Processorと
テッセレータ強化がトピック
Deep Diveでは,HD 6800の内部構造についても紹介された。今回公開されたブロックダイアグラムから確認できる最大の相異点は,「Ultra-Threaded Dispatch Processor」が2基となり,「SIMD Engine」クラスタ――ミニGPUとも呼べるもので,NVIDIA製GPUだと「Graphics Processing Cluster」に相当する――ごとに独立した点だろう。これは,2基のラスタライザをより効率よく使うための変更と思われる。
なお,ここでSIMD Engineという言葉が出てきたが,この用語と合わせて,Radeonシリーズのアーキテクチャについて確認しておきたい。というのも,AMDの公開したブロックダイアグラムが正しいとするなら,Radeon HD 6800シリーズの基本的な構成自体は,ATI Radeon HD 5800シリーズと同じと推測できるからである。
SIMD Engineとは,Radeonシリーズにおいて,統合型シェーダ(Unified Shader)ユニットの役割を果たすものだ。
最小の演算ユニットである「Stream Processor」(ストリームプロセッサ。以下 SP)5基は,ATI Radeon HD 5800シリーズにおいて,“4SP+1ビッグSP+1分岐ユニット”(※ビッグSPとは,通常のSPより複雑な演算が可能なSP)という組み合わせで「Thread Processor」(スレッドプロセッサ)となる。
この前提に基づいてSP数を計算してみると,HD 6870はSIMD Engineを14基搭載するため,「5(SP)×16(Thread Processor)×14(SIMD Engine)=1120SP」となる。HD 6850はSIMD Engine 12基で,「5×16×12=960SP」だ。もっとも,この構成では,後述する命令発効の変更と矛盾するようにも思える。
各SIMD Engineあたりのテクスチャユニットは4基で,HD 5800シリーズと変わらない。そのため,SIMD Engine数の少ないRadeon HD 6870では56基と,HD 5800シリーズに比べて少なくなっており(HD 5870が80基,HD 5850は72基),この点で性能低下の可能性がある。ただし,SIMD Engineのメモリ周り――4基の64bitデュアルチャネルメモリインタフェースとL2キャッシュ構成,そしてROP数――は,HD 5800シリーズと同等だ。
さて,HD 6800でのアーキテクチャの変更点に話を戻そう。Ultra-Threaded Dispatch Processorに続くトピックは,テッセレータが第7世代へと進化した点だ。スレッド管理とバッファリング機能(内蔵バッファサイズ)を強化し,HD 5870に比べて最高2倍強のテッセレーション性能を実現するという。
テッセレーションの話が出たところで,少々蛇足になるが,Deep DiveでDemers氏が「現行のテッセレーションに対応したゲームやベンチマークテストは,ラスタライザへの負荷が高すぎる」と指摘していたので,紹介しておきたい。
同氏によると「現在のテストでは,テッセレーションによりポリゴンを細かく分割しすぎている。この状態では,ラスタライザの処理効率が落ちるうえ,同じピクセルに対して繰り返しシェーダパスで描画する『Overshading』(オーバーシェーディング)状態となり,処理に多大な無駄が発生する。ゲームやベンチマークの設計では,1ポリゴンあたり16ピクセル以上に留めることで,イメージ品質と性能をともに高いレベルで維持できる」とのことだ。
Morphological Anti-Aliansingは,DirectComputeによるポストプロセッシング処理によって,よりなめらかなAA処理を高速に行えるようにするという技術である。
まずは従来のハードウェア処理によるAA結果を描画し,それを参照。より望ましいエッジの形状をDirectComputeで検出・演算し,その結果に合わせてエッジのトーンを調整するという,規模の大きなテクニックである。この機能は,DirectComputeを利用すれば実装できるため,既存のDirectX 9や10.x世代のアプリケーションに対しても適用可能だそうだ。
また,異方性フィルタリングもアルゴリズムの改良での品質を向上。複雑なテクスチャもより忠実に再現できるようになるほか,テクスチャフィルタリングの品質を「Catalyst Control Center」から調整できるようにするなど,ユーザーインタフェースの改良も施されるという。
異方性フィルタリングも,アルゴリズムの改良などによって,HD 5000シリーズに比べてさらに品質が向上するとのこと |
新しいAMD Catarlyst Control Centerでは,テクスチャフィルタリングの品質をユーザーが直接調整できるようになる |
筆者の取材の結果出てきた「Bartsの謎」
果たしてSIMDエンジンの構造は?
さて,ここまで紹介してきたHD 6800のアーキテクチャだが,筆者が各方面に取材したところ,実は内部構造に対する謎が出てきている。
筆者が複数のAMDパートナー関係者に取材したところ,「事前情報が真実であれば,Bartsコアには16機のSIMD Engineが搭載されており,うち2基または4基を歩留まり向上の冗長性(Redundancy,リダンダンシー)としている」という指摘が得られたのである。
HD 6870がBartsコアのフルスペックなのであれば,ATI Radeon HD 5800からのアーキテクチャ拡張で25%の半導体シュリンクを実現できても不思議ではない。しかし,使われていないSIMD Engineが存在するということになると,ダイサイズがあまりにも小さすぎるように思えるのだ。
また,Skynner氏とDemers氏も気になる発言を残している。両氏はともにHD 6800を「HPC用途をターゲットとしたコアではなく,ゲーマーやエンスージアスト向けにアーキテクチャを最適化した製品だ」(Skynner氏)と位置づけており,Demers氏はさらに,「Bartsで倍精度演算はサポートしないが,Caymanではより優れた倍精度演算機能を実現するだろう」と明らかにし,BartsではSIMD Engineの構成が見直され,Cypress(=ATI Radeon HD 5800シリーズ)で最大5命令発効だったのが,Bartsで最大4命令発効となったことも示唆している。これにより,Radeon HD 6800シリーズは,より高クロックで動作しやすい構造となり,コア数あたりのパフォーマンス(≒単精度演算性能)を向上させることができたようだ。
残念ながら,今回の技術説明会で,これらSIMDユニットの詳細は明らかにされなかったため,ATI Radeon HD 2000シリーズから4世代にわたって続いてきた,4基の32bit浮動小数点演算ユニットに,より複雑な処理が可能な“スペシャル”な32bit浮動小数点ユニットを加えた,5SPによるSIMDユニットという構造そのものに変更が加えられたかどうかは確認できなかった。
Radeon HD 6800シリーズで強化されたEyefinityやステレオ立体視技術の「HD3D」,UVD3を含む「EyeSpeed」の詳細については,稿を改めたい。
「Radeon HD 6870&6850」レビュー。Northern Islands世代の開幕を告げる新製品は,誰のためのGPUか?
※2011年10月22日13:15追記
北米市場における搭載グラフィックスカードの想定売価について日本AMDから情報が公開されたため,記事中の価格情報をアップデートしました。
- 関連タイトル:
Radeon HD 6800
- この記事のURL:
(C)2010 Advanced Micro Devices, Inc.