レビュー
ついに登場した第4世代APU「Kaveri」,その3D性能と消費電力に迫る
A10-7850K with Radeon R7 Graphics
- A10-7850K with Radeon R7 Graphics(以下,A10-7850K)
12 Compute Cores(Streamroller Module×2+GCN Compute Unit×8),TDP 95W,CPUコア定格クロック3.7GHz,CPUコア最大クロック4.0GHz,GPUコア最大クロック720MHz,L2キャッシュ2MB×2,2万1980円(税込) - A10-7700K with Radeon R7 Graphics
10 Compute Cores(Streamroller Module×2+GCN Compute Unit×6),TDP 95W,CPUコア定格クロック3.4GHz,CPUコア最大クロック3.8GHz,GPUコア最大クロック720MHz,L2キャッシュ2MB×2,1万9980円(税込) - A8-7600 with Radeon R7 Graphics
10 Compute Cores(Streamroller Module×2+GCN Compute Unit×6),TDP 65W/45W,CPUコア定格クロック3.3GHz(65W時)/3.1GHz(45W時),CPUコア最大クロック3.8GHz(65W時)/3.3GHz(45W時),GPUコア最大クロック720MHz,L2キャッシュ2MB×2,価格未定(※2014年第1四半期発売予定)
AMDが推進する
28nmプロセスへ移行し,規模が大きくなったKaveri
ついに実現されたHSA対応が最大のトピック
Kaveriは,GLOBALFOUNDRIESの「28nm-SHP」
パッケージはFM2+で,対応マザーボードはSocket FM2+を採用したA88X
A10-7850K(左)とRichland世代の「A10-6800K」(右)でピンレイアウトを比較。Kaveriではピンが2本増えており,FM2マザーボードには取り付けられない |
A10-7850Kの製品ボックスには,AMD伝統のリテールクーラーとバッジシールが付属していた。AMDユーザーにはお馴染みのもので,取り付けに不安はないだろう |
第3世代AMD A-Series APUであるRichlandは,GLOBALFOUNDRIESの32nm SOIプロセスを採用して製造され,13億300万トランジスタを246mm2のダイサイズに集積していた。その意味でKaveriは,Richlandのダイサイズをほぼそのままに,プロセスシュリンク分の余剰をすべてスペック向上に振ってきた製品と見ることができるだろう。
冒頭でも述べたとおり,そんなKaveriにおける最大の特徴は,HSAに対応したことである。HSAによって,同じプログラムでCPUとGPUの両方が動くようになることから,AMDは従来の「CPUコア数+シェーダプロセッサ数」というスペック表記を止め,CPUコアとGPUコアの総数を,HSAに対応した演算コア「Compute Core」の数で表記するようになった。それが冒頭でしれっと記した「12 C
HSAに対応したKaveriでは,「hUMA」(H
関連記事1:AMD,次期主力APU「Kaveri」で対応する新技術「hUMA」を発表。CPUとGPUが同じメモリ空間を共有可能に
関連記事2:AMD,CPUとGPUの深い連携を可能にする新要素「hQ」発表。HSAの姿が見えてきた?
Kaveriで採用されるCPUマイクロアーキテクチャは,第3世代B
Steamrollerでは,フェッチ(Fetch,メモリから命令コードを取り出す処理系),整数演算スケジューラ,L1キャッシュ管理法の改善によって,IPC(Instructions Per Clock,クロックあたりの命令実行数)はRichland世代比で平均10%前後,最大20%程度の向上があるという。
対するGPUコア側が採用するのは,Southern Islands世代以降のRadeonと同じ「Graphics Core Next」(以下,GCN)アーキテクチャとなる。
上でその名を挙げたGCN Compute Unitは,GCNアーキテクチャにおける演算ユニットのこと。スカラプロセッサたるシェーダプロセッサ「Stream Processor」16基によるベクトル演算ユニット4基と,テクスチャユニットやL1キャッシュなどをひとまとめにしたGCN Compute Unitを,AMDはKaveriの「GCN GPU Core」と位置づけている。
ここで押さえておきたいのは,GPUコア全体の構造が,2014年1月時点におけるRadeonの最上位モデルたるRadeon R9 290シリーズをベースにしている点だ。
また,ブリッジコネクタなしでのCrossFire動作を可能にする「CrossFire XDMA」が採用されていたり,プログラマブルDSP「TrueAudio」を統合していたりするのも,Radeon R9 290シリーズと同じである。
一方,H.264形式のデコードにおけるエラー回復系に改善が入ったという第4世代UVD「UVD 4」は,おそらくKaveriで初めての採用となる。ビデオエンコードエンジンたる「VCE」も,Richland世代からアップグレードされている。
A10-6800Kやi5-4670Kはもちろん,単体GPUとも比較
Configurable TDPのテストも実施
テストのセットアップに入ろう。
前編となる今回は,最も重要な「A10-7850Kが持つ3Dゲーム性能」を見るべく,Richland世代の最上位モデルとなる「A10-6800K」と,AMDがA10-7850Kの競合製品と位置づける「Core i5-4670K」(以下,i5-4670K)をまず用意した。これら2製品との比較では,APU(≒GPU機能統合型CPU)としてのKaveriが持つ性能を見ることになる。
また,A10-6800Kにおける「Radeon HD 8670D」のような,型番込みのGPUブランド名がA10-7850Kでは廃され,ただ「Radeon R7 Graphics」とのみ表記されるようになって,単体GPUとの力関係が分かりづらくなったことから,今回は,
- 同じRadeon R7シリーズの最下位モデルとなる「Radeon R7 240」(以下,R7 240)
- GCNアーキテクチャベースではないが,3D性能的には拮抗する可能性がある「Radeon HD 6670」(以下,HD 6670)
- AMDがA10-7850Kのグラフィックス性能を示すうえで引き合いに出していた「GeForce GT 630」の,Keplerコア採用モデル(以下,GT 630 Kepler)
も比較対象としている。APUおよびCPUにおけるCPUコア周りの主なスペックは表1,APUとCPU,そして単体GPUにおけるGPUコア周りの主なスペックは表2を参照してもらえれば幸いだ。
ちなみに今回のテストにあたって日本AMDから入手した機材は,ボックス版のA10-7850Kのみである。北米の一部メディアに向けては,対応マザーボードと,DDR3-2400で確実に動作するメモリモジュール,そして,Kaveriのベンチマーク用SSDとしてタイアップしたSamsung Electronics製のSSDがセットになった評価キットが配布されたらしいのだが,筆者の手元には届いていない。
KHX24C11T3K2/16X DDR3-2400対応のOCモジュール,容量8GBの2枚セット メーカー&問い合わせ先:Kingston Technology 実勢価格:2万5000〜2万8000円程度(※2014年1月14日現在) |
こちらは4Gamerで独自に入手したFM2A88X Extreme6+。A88Xチップセット搭載のATXモデルだ |
メモリモジュールをPC3-12800対応のものに変更したり,より新しい1003版BIOSを導入したりしても状況は改善せず,途方に暮れていると,1月10日になって,「テストにはASRockの『FM2A88X Extreme6+』もしくは『FM2A88X-ITX+』を使い,AMDからレビュワー向けに配布するBIOSを導入するように」というお達しがAMDからあった。そこで急遽,ATXモデルとなるFM2A88X Extreme6+を購入し,AMDが配布していた2.40版BIOSを導入することになった次第である。
2.40版BIOSは,1月9日付けでASRockが公開したものと同じではないかと思われるが,これを導入すると,Windowsは問題なく起動し,また,A10-7850KでConfigurable TDPが利用可能になった。先のA88XM-Aでは設定項目が見つからなかったので,このあたりはマザーボードメーカーの対応待ちということになるのだろう。
せっかく利用できるようになったことから,今回はConfigurable TDPのテストも行いたいと思う。以下,65W設定は「A10-7850K 65W」,45W設定は「A10-7850K 45W」と書いて区別するので注意してほしい。
さて,FM2A88X Extreme6+の購入によってひとまずのテスト環境は構築できたのだが,残念ながら,メモリモジュールはDDR3-2400で動作しなかった。DDR3-2400設定を行うと,AMD Memory Profile(AMP)によって,動作電圧は自動的に1.65Vまで引き上げられるものの,それでは正常に動作せず。さらに,これを1.72Vにまで手動で引き上げてもテストを正常に実行できなかったため,今回はDDR3-2133設定でのテストとなる。この点もあらかじめお断りしておきたい。
NVIDIAおよびIntel製品用のドライバは,テスト開始時の公式最新版だ。単体グラフィックスカードは,A10-7850Kと組み合わせたうえで,FM2A88X Extreme6+に差して用いる。
テスト方法は4Gamerのベンチマークレギュレーション15.0準拠。ただし,時間的都合から「Crysis 3」のテストは省略した。
テスト対象の製品がローエンド〜エントリー市場向けに属することから,解像度は1280×720ドットと1600×900ドットの2つを選択。また,同じ理由から,基本的に「標準設定」か,「エントリー設定」が用意されているものは同設定でのみテストを行うことにした。ただし,「ファイナルファンタジーXIV: 新生エオルゼア ベンチマーク キャラクター編」(以下,新生FFXIVベンチ キャラ編)だけは,「最高品質」時のスコアをチェックしたい読者が多いと思われることから,「標準品質(デスクトップPC)」に加えて最高品質でのテストも実施する。
DX11ベースのタイトルで優位性を発揮するKaveri
Configurable TDP利用時のスコア低下は小さめ
3D性能のグラフは,基本的にAPU→単体GPU→CPUの順で並べてあるが,グラフ画像をクリックすると,3DMarkは「Fire Strike」,ゲームアプリケーションベンチマークでは1600×900ドット時のスコア順で並び変えたものを表示するようにしてあるとお断りしつつ,テスト結果を順に見ていきたい。
グラフ1は3DMark(Version 1.2.250)の結果で,Fire StrikeにおけるA10-7850Kのスコアは,A10-6800K比で26〜31%程度高い。競合であるi5-4670Kに対しては79〜83%程度ものスコア差を付けているので,これは「圧倒」と述べて差し支えないだろう。HD 6670やR7 240といった単体GPUより高いスコアを示している点も目を引くところだ。
表4は,3DMarkのFire Strikeにおけるスコアの詳細をまとめたものとなる。
ここで注目したいのは,A10-7850Kの「Physics Score」が,A10-6800Kの約94%,i5-4670Kの約60%に留まることだ。CPUコア性能は後編で分析したいと思うが,A10-6800Kに対してはCPUコアクロックの低さ,i5-4670Kに対してはマイクロアーキテクチャ的な不利が出ているように見える。
ただし,「i5-4670K比でCPUテストのスコアが6割」というのを,ゲームにおいて深刻に捉える必要があまりないというのは,上のグラフ1,そしてここでの「G
もう1つ,A10-7850K 65WがGraphics ScoreとPhysics Scoreで,A10-7850Kの約97%,84%,A10-7850 45Wは同89%,70%という点は押さえておきたい。
グラフ2は,GCNアーキテクチャに最適化されているゲームタイトル「Battlefield 4」(以下,BF4)のスコアだが,ご覧のとおり,上位はR7 240とA10-7850Kで占めるという,大変分かりやすい結果に落ち着いた。専用のグラフィックスメモリを持つR7 240が頭1つ抜け出て,それをA10-7850Kが追うという格好である。A
A10-7850Kと比較対象とのスコア差を見てみると,対A10-6800Kでは29〜34%程度,対HD 6670では11〜16%程度,対GT 630 Keplerでは33〜37%程度,対i5-4670Kでは61〜65%程度に開いている。
続いて,「BioShock Infinite」の結果がグラフ3となるが,ここでA10-7850KはR7 240やHD 6670に歯が立たない。対R7 240では87〜95%程度,対HD 6670では78〜89%のスコアに留まっている。
これはなぜかという話だが,BioShock Infiniteの「High」設定が,DirectX 10をベースに,一部でDirectX 11世代のエフェクトも用いるというものになっており,ゲームエンジンの世代としては一世代古いことが挙げられるのではないかと思う。DirectX 10以前のゲームタイトルだと,ベンチマークスコアを大きく左右するのはテクスチャフィルタリング性能とメモリ性能であり,そうなると,GPUコアクロックが低く,かつ,グラフィックスメモリをメインメモリと共用するというハンデが,やはり小さくないということなのではなかろうか。
なお,i5-4670Kが大きくスコアを落とす理由は分からない。しかし,テクスチャユニットの性能が今ひとつという可能性はあるだろう。
続く「The Elder Scrolls V: Skyrim」(以下,Skyrim)でも,同じ根拠でスコアの傾向を説明できそうだ(グラフ4)。Skyrimでは公式の高解像度テクスチャパックを用いており,メモリ周りの負荷を高めてあるのだが,BioShock Infiniteと比べるとGPU負荷の高いタイトルでもある。そのため,基本的にはメモリ性能がモノを言う一方で,テクスチャ性能も問われた結果,こういう結果になっている,というわけだ。
A10-7850KがA10-6800Kに対して3〜7%のスコア差しか付けられていないのは,A10-6800Kが844MHzという高いGPUコアクロックによってテクスチャ性能を引き上げているためではないかと考えられる。
グラフ5,6は新生FFXIVベンチ キャラ編のテスト結果で,ここでもA10-7850KはHD 6670やR7 240にまったく届かない。これはBioShock Infiniteと同じことが起こっているためだろう。
もっともその実スコアは,標準品質の1280×720ドットで7000超え。平均フレームレートは61.2fpsだ。1600×900ドットでも「とても快適」とされるスコア5000を超え,平均43.9fpsを示しており,十分にプレイアブルといえる。
性能検証の最後はグラフ7の「GRID 2」だが,DirectX 11世代のタイトルであり,また,クルマ系ゲームの常としてグラフィックスメモリ負荷がそれほど高くないことから,ここではA10-7850Kが頭1つ抜けた形でトップを取っている。A10
i5-4670Kと比較できるレベルにまで消費電力は大幅低下
Configurable TDPの効果は絶大
採用されるプロセス技術が新しい世代のものへ移行した一方で,ダイサイズはRichlandと変わらず,TDPも95Wと,A10-6800Kの100Wから5Wしか下がっていないA10-7850Kだが,3Dゲームのプレイを前提にしたとき,消費電力はどの程度なのか。また,Configurable TDPによって65Wや45WにまでTDP値を下げたとき,消費電力はどの程度抑えられるのだろうか。
そこで,ログの取得が可能なワットチェッカー「Watts up? PRO」を用いて,システム全体の消費電力で比較することにした。テストにあたってはゲーム用途を想定し,無操作時にもディスプレイ出力が無効化されないよう指定したうえで,OSの起動後30分放置した時点を「アイドル時」,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点を,タイトルごとの実行時としている。
その結果がグラフ8だ。
まず,A10-6800Kの示す値がかなり高いのは気になるが,何度テストしてもシステムレベルで180W強のところに収まったので,今回導入した2.40版BIOSだと,RichlandのTurbo CORE設定がアグレッシブなものになっているのかもしれない。
それを押さえつつ見ていくと,アイドル時にこそ大きな違いはないものの,アプリケーション実行時におけるA10-7850Kの消費電力は,i5-4670Kより16〜29W高い程度に収まっている。性能検証時のスコア差からして納得できるレベルになっていると述べていいだろう。
さらに興味深いのがA10-7850K 65WとA10-7850K 45Wのスコアである。前者はA10-7850Kから9〜27W,後者は21〜41Wと確実に低下しており,C
メモリ周りと情報の少なさに一抹の不安は残るものの
3D性能と低消費電力は大いに魅力的
メモリモジュールに関していえば,
といったところで前編はここまで。後編では,時間の都合から今回テストできなかった部分をお伝えしていきたい。
AMD日本語公式Webページ
- 関連タイトル:
AMD A-Series(Kaveri)
- この記事のURL: