レビュー
メモリ・CPUコア・GPGPUの性能検証とOCで,その立ち位置を明らかにする
A10-7850K
AMDの新世代APU「Kaveri」はどれだけ速い? 3D性能と消費電力に迫る「A10-7850K」レビュー前編
メモリによる性能の違いからオーバークロックまで
大別して5つのテストを実施
「Kaveriとは何か」「A10-7850KとはどんなAPUか」という基本的な話は前編で済ませてあるので,今回はいきなりテスト環境の話に入りたい。まず,比較に用いた製品は,Richland世代の最上位モデルとなる「A10-6800K」と,AMDがA10-7850Kの競合製品と位置づける「Core i5-4670K」(以下,i5-4670K)の2製品だ。これらのスペックは,前編からの再掲となる表1をチェックしてもらえればと思う。
ハードウェア的には,「Radeon R9 280X」(以下,R9 280X)を追加したのが表2におけるトピックだが,これは,グラフィックスカードを差したときのCPU性能を比較するためだ。ここで用いるASUSTeK Computer製カード「R9280X-DC2T-3GD5」は,メーカーレベルで動作クロックが引き上げられたクロックアップモデルとなるため,テストにあたっては,「Catalyst Contorol Center」から動作クロックをリファレンスレベルにまで下げている。
さて,後編では大きく分けて5つのテストを次のとおり実施したい。
- メインメモリの速度がもたらすゲーム性能検証
- ゲーム用「CPU」としての性能検証
- ゲーム用途以外での総合性能とCPUコアの基本特性検証
- IPCの向上率検証
- A10-7850Kのオーバークロック検証
なお,ここでのテストには4Gamerのベンチマークレギュレーション15.0から,3DMarkと「Battlefield 4」(以下,BF4),「ファイナルファンタジーXIV: 新生エオルゼア ベンチマーク キャラクター編」(以下,新生FFXIVベンチ キャラ編)の3つを選択。BF4で「エントリー設定」を,新生FFXIVベンチ キャラ編で「標準品質(デスクトップPC)」と「最高品質」を用いるのは前編と同じで,1280×720ドットと1600×900ドットの解像度を用いる点も変えていない。
2.では,単体グラフィックスカードを差して,APUを“CPU”として使ったときの性能を,A10-6800Kおよびi5-4670Kと比較することになる。以下,メモリ設定はAPUがDDR3-2133,i5-4670KがDDR3-1600となる。
ベンチマークレギュレーション15.0準拠で3DMarkとBF4,新生FFXIVベンチ キャラ編を用いるのは1.と同じ。ただ,GPUボトルネックを回避すべく,比較的高スペックなグラフィックスカードを組み合わせていることもあり,BF4のテストでは「標準設定」を用いる。さらに,CPUテストの規則に従い,解像度は1280
ただ,試しに「3DMark」(Version 1.2.250)の「Fire Strike」を実行してみると,A10-7850Kでは総合スコアが1474だったのに対し,R7 240とのDual Graphicsでは1656と,約12%しかスコアは向上せず。Dual Graphicsを無効化し,R7 240でスコアを取ってみたところ1429だったので,「恩恵がある」と言えなくもないが,実際問題として“景気”が悪すぎる。
AMDはKaveriに向けたDual Graphicsへの最適化を,先に公開延期が判明した次期Catalystで実現すると予告している。それもあり,いまテストを行うのはフェアではないという判断から,今回,Dual Graphicsの検証は見送った次第だ。
話を戻そう。3.では再びグラフィックスカードを取り外し,主にゲーム以外のアプリケーションを前にしたときの性能を見たいと思う。用いるテストは,PC総合ベンチマーク「PCMark 8」(Vesion 2.0.191)と,PC情報表示ツール兼ベンチマークである「Sadra 2014 SP1」(Version 20.10)の2つだ。
PCMark 8では,家庭でよく用いられるアプリケーションを用いたとされる「Home」と,業務用アプリケーションを用いたとされる「Work」,2つのワークロードを選択し,システム全体のパフォーマンスを見ようというわけである。
一方のSandra 2014 SP1では,「Processor Arithmetic」「Processor Multi-Media」「Processor Multi-Core Efficiency」「Memory Bandwidth」「GP(GPU/CPU/APU) Bandwidth」「Cache Bandwidth」「Cache&Memory Latency」「GP(GPU/CPU/APU) Processing」「Video Shader Compute」の9テストを実施し,CPUコアやメモリ周りの“素性”を探ってみたい。
POV-Ray |
CINEBENCH R15 |
ここで利用するテストは,CPUでレイトレーシングを行う「POV-Ray」(Version 3.7)と,業務用3Dグラフィックスソフトウェア「CINEMA 4D」(R15)ベースのベンチマークテストで,CPUもしくはGPUのレンダリング性能を見る「CINEBENCH R15」である。
最後に5.はこれまた文字どおりのオーバークロックテストだ。ここではマザーボードのUEFI(BIOS)からTurbo COREを無効にしたうえで,CPUあるいはGPUのクロックを上げ,ストレスツール「OCCT」(Version 4.4.0)に用意された,CPUコアとGPUコアの両方に100%の負荷をかける「POWER SUPPLY」を実施。この状態で6時間放置し,問題がなければ「安定動作」と判断することとした。そのうえで,1.と条件を揃えつつ,3DMarkとBF4,新生FFXIVベンチ キャラ編を実行し,そのスコアを取得する。
CPUコアのクロックアップはUEFIからの動作倍率引き上げ,GPUコアのクロックアップは,UEFI側であらかじめ用意されていた値の選択をもって行う。要は,常用できる範囲でオーバークロックを試み,CPUコアとGPUコアのクロック引き上げ効果を探ろうというわけである。
なお,5.に限り,A10-7850Kのリファレンスクーラーではなく,Thermalright製のサイドフロー型CPUクーラー「Silver Arrow SB-E Extreme」を装着するので,この点はあらかじめお断りしておきたい。
DDR3-2133を使うとDDR3-1600比で
約20%の性能向上を期待できる
5つの検証を順に行っていこう。まずはメモリスペックの違いがもたらすベンチマークスコアの違いからだ。
グラフ1は3DMarkの総合スコアをまとめたものだが,DDR3-1866はDDR3-1600比で8〜9%程度,DDR3-2133はDDR3-1600比で約16%,それぞれスコアを伸ばしている。メモリバス帯域幅のスペックで比較すると,DDR3-2133とDDR3-1600の間には約33%の開きがあるので,そこまでの違いはないことになるが,メモリモジュールの速度グレードを上げることで,スコアが順当に上がっていくと期待できる結果であるのも確かである。
「Fire Strike」における「Graphics Score」と「Physics Score」を抜き出したグラフ2も,総合スコアを踏襲したものとなっている。ただし,スコアが上がっているのはGPU性能を問うGraphics Scoreのほうだけだ。CPU性能が問われるPhysics Scoreだと,「一般に,メインメモリの性能がCPUのベンチマークスコアを左右するとしたら,それは帯域幅ではなくレイテンシによる」という理由により,メモリバス帯域幅によるスコアの違いはほとんど生じない。
続いてグラフ3はBF4のエントリー設定におけるテスト結果となるが,BF4では3DMark以上にメモリスペックの影響が顕著で,DDR3-1866がDDR3-1600比で10〜13%程度,DDR3-2133はDDR3-1600比で21〜23%程度のスコア差をそれぞれ付けている。このあたりは単体GPUと同じだが,グラフィックスメモリ負荷が高いタイトルでは,組み合わせるメモリモジュール次第でスコアにかなりの違いが出るわけだ。
グラフ4,5は新生FFXIVベンチ キャラ編の結果だが,ここでもスコアの傾向はBF4とよく似ている。標準品質(デスクトップPC)でも最高品質でも,DDR3-1866はDDR3-1600より9〜10%程度,DDR3-2133はDDR3-1600より24〜25%程度高いスコアを示した。
下のグラフ画像は,クリックすると平均フレームレートベースのグラフを表示するようにしてあるので,興味のある人はそちらもチェックしてもらえればと思うが,標準品質(デスクトップPC)の1280×720ドットにおいて,DDR3-1600だと平均48.6fpsのところ,DDR3-1866で同55.8fps,DDR3-2133で同61.3fpsにまで上がっていくのはなかなか興味深い。
単体グラフィックスカードを差す前提だと
A10-7850Kはi5-4670Kに惨敗
A10-7850Kの購入を検討している,もしくは購入済みの人の中には,将来的にグラフィックスカードの装着する前提の人も少なくないだろう。先に紹介したとおり,ここではR9 280Xカードと組み合わせ,APUをCPUとして使ったときの性能を確認してみたい。
まずグラフ6は3DMarkの総合スコアをまとめたものだが,描画負荷が極めて高く,スコアが丸まってしまう「Extreme」プリセットはさておき,標準のFire Strikeだと,A10-7850Kはi5-4670KどころかA10-6800Kにも届かないという結果になった。
グラフ7はそんなFire StrikeにおけるGraphics ScoreとPhysics Scoreの詳細となるが,CPU性能がモノをいう後者で,A10-7850KはA10-6800Kの約93%と,やはり後塵を拝している。A10-7850Kで採用される「Steamrolelr」(スチームローラー)マイクロアーキテクチャではクロックあたりのCPUコア性能が前世代のAPUより向上しているはず――正確なところは後段で検証する――なのだが,A10-6800Kとのスコア差は約3%。定格クロックで約90%。最大クロックで比べるとA10-7850KはA10-6800Kの約91%なので,動作クロックが1割も違ってしまうと,IPCの向上ではカバーしきれないということなのだろう。
一方,気になる対i5-4670Kのスコア比率はなんと約59%だ。レビュー前編で明らかになったように,「APUとしての総合性能でi5-4670Kより優れている」というAMDの主張は正しい。しかし,単体グラフィックスカードを差してCPUとして使う場合,A10-7850Kの性能はi5-4670Kにまったく及ばない可能性があるというわけだ。
なお,少々興味深いのは,GPUを揃えている以上,スコアが揃うはずのGraphics Scoreで,A10-7850KとA10-6800Kが明らかにi5-4670Kより高いスコアを示していること。チップセットも,マザーボードのメーカーも異なるので,確定的なことはもちろん言えないが,Socket FM2+プラットフォームのほうがPCI Expressリンクのレイテンシが低いという可能性は,ひょっとするとあるかもしれない。
BF4のスコアをまとめたグラフ8でも,A10-7850Kのスコアはかなり厳しい。A10-6800Kの94〜95%程度に留まるのはいいとしても,i5-4670Kの半分以下というのは……。
ミドルクラス以上のGPUと組み合わせた場合,A10-7850KのCPUは足りず,GPUの足を引っ張る原因になり得るという点は,指摘しておかざるを得まい。
そして,その傾向は,残念ながらグラフ9に示した新生FFXIVベンチ キャラ編のテスト結果でも大して変わらない。描画負荷が高まっていくと,GPU性能がスコアを左右する傾向が強くなるため,A10-7850Kとi5-4670Kのスコアは近づいていくが,1280×720ドットでは59%に留まってしまう。
PCMark 8の総合スコアではi5-4670Kより上!
その理由は?
ゲーム用途での「CPU性能」は残念な結果に終わったが,ゲーム用途以外ではどうか。そして,CPUコア部分はRichland世代からどの程度進歩しているのだろうか。
まずはPCMark 8で,HomeとWorkの両ワークロードにおけるテスト結果を見てみよう。スコアはグラフ10にまとめたとおりだが,いずれのワークロードにおいてもA10-7850Kがトップの座についている。i5-4670Kに対して9〜12%程度も高いスコアを示しており,なかなかインパクトが大きい。
CPU性能が高くないはずなのに,なぜこういう結果になったのか。PCMark 8におけるスコアの詳細をまとめたものがグラフ11〜16となる。
テスト項目の詳細は解説記事を合わせてチェックしてもらえればと思うが,Homeワークロードから見ていくと,各種操作の所要時間を見るグラフ11において,Internet Explorerを用いたSNSの利用をシミュレートする「Web Browsing - JunglePin」と,同じく通販サイトの利用をシミュレートする「Web Browsing - Amazonia」の速度は,テスト対象の3者でほぼ変わらず。いずれもCPUとストレージ性能がスコアを左右するのだが,Webブラウジング程度の負荷であれば,APUでもHaswell世代のCPUでも大して変わらないというわけだ。
テキストエディタの操作をシミュレートする「Writing」だと,CPU処理になることから,i5-4670KがAPUに有意なスコア差と付けている一方,画像処理の「Photo Editing」では,CPUとGPU性能が両方ともスコアを左右するが,ここではGPU性能順のグラフになっている。
所要時間を見るテストからもう1つ,単位がミリ秒(ms)となるため単独項目とした「Video Chat / Video encoding v2」の結果がグラフ12だ。対応ハードウェアがあればアクセラレーションが有効になることで知られる「Windows Media Foundation」ベースのエンコード処理を用いたものなので,Kaveriで採用された新型のハードウェアビデオエンコーダ「VCE2」が速くなっている……可能性が一瞬頭をよぎったが,実際のところはOpenCV(バージョン2.4.7)のGPUアクセラレーションが効いているのだろう。
PCMark 8のビデオチャット&エンコードテストではOpenCVベースの顔認識を行っているため,その処理性能差が大きなスコア差を生んでいるではないかと考えられる。
Homeワークロードで採用される残りのテスト結果がグラフ13で,ビデオチャット時のビデオ再生能力を見る「Video Chat / Video playback 1 v2」は,今回用意した全テスト対象がビデオデコーダを搭載することもあって,スコアは完全に横並び。DirectX 9ベースのカジュアルな3Dゲームをシミュレートした「Casual Gaming」では,前述したとおり「負荷が低い状況ではCPU性能が“効く”」ことから,CPUコアクロックの高いA10-6800Kが最も高いスコアを示している。
続いては,いくつかのテストがHomeと異なるWorkワークロードだ。ここでもまずは所要時間関連のスコアから見ていきたいが,グラフ14で注目したいのは,Workで初出となる「Spreadsheet」のスコアだ。ここでA10-7850KはA10-6800Kより約23%,i5-4670Kより52%も高いスコアを示した。
表計算(スプレッドシート)で,Kaveriのスコアが突出する理由は,PCMark 8のバージョン2が,オープンソースの表計算ソフト「LibreOffice Calc」(以下,Calc)を採用したことと関係しているはずだ。Futuremarkは,PCMarkのバージョン2で採用するCalcの世代を明らかにしていないが,LibreOfficeはバージョン4.2でCalcのOpenCLサポートを追加したため,ここではOpenCLのGPUアクセラレーションが有効に機能して,Kaveriのスコアを押し上げているものと思われる。
グラフ15,16のスコアは,後者でHomeワークロードのテスト時とは若干異なるものの,傾向自体は変わらない。同じテストなので,当然のことながら同じような結果になるわけだ。
全体としてPCMark 8は,APU,とくにKaveriへの最適化が目立つ。たとえば,オフィススイートとして一般的な「Microsoft Office」はGPUアクセラレーションに対応していないわけで,仮に表計算ソフトで「Microsoft Excel」を使えば,当然のことながら違う結果になるだろう。
よって,PCMark 8の結果は「あくまでもベストケースにおけるもの」ということになるのだが,CPUコアではなく,「プロセッサとしての総合的なポテンシャル」で比較すれば,A10-7850Kは確かにi5-4670Kより上,とも言えそうである。
GPUを使えば速い,使わなければ速くない
圧勝と完敗の目立つA10-7850Kの基礎テスト結果
続いてはSandra 2014 SP1である。ここではスコアの不安定要因となるTurbo COREや「Enhanced Intel SpeedStep Technology」は無効化している。
というわけでグラフ17,18は,CPUの演算性能を見る「Processor Arithmetic」の結果だ。「Dhrystone」は整数演算,「Whetstone」は浮動小数点演算のそれぞれ古典的なテストだが,ここではDhrystoneでA10-7850KがA10-6800Kに対して約50%も高いスコアを示している点が目を引く。Kaveriの解説記事でもお伝えしているとおり,Steamroller世代のCPUコアモジュールでは,従来世代比でかなりの改善が入っている。それがこうした形で整数演算性能の向上をもたらしているのだろう。
動作クロックでA10-6800Kの約90%に留まるA10-7850Kが,浮動小数点演算性能でも若干高いスコアを出しているところにも,Steamrollerにおける改善の跡を確認できる。
ただし,いずれの場合も,i5-4670Kには太刀打ちできていない。
続いてグラフ19は,AVX命令を用いたマルチメディア系演算の性能を見る「Processor Multi-Media」のテスト結果だ。スコアは上から順に,整数演算,32bit単精度浮動小数点演算,64bit倍精度浮動小数点演算,そして単精度と倍精度混在の浮動小数点演算のそれぞれ性能を示すが,いずれのテストにおいてもA10-7850KはA10-6800Kを下回った。気になるのは,整数演算性能だけ,A10-7850KスコアがA10-6800Kの約82%と,クロック差を超えて大きく落ち込んでいること――残る3項目は90〜95%程度で,クロックの違いからして妥当な範囲にある――だが,正直,この理由は分からない。
また,i5-4670Kとは,ここでもまったく勝負にならずだ。A10-7850Kのスコアは33〜44%程度に留まっている。
CPUコア間のデータ転送レートを見る「Processor Multi-Core Efficiency」のテスト結果がグラフ20だ。グラフだけでは分かりにくいので,グラフ画像をクリックすると表示される表3も合わせてチェックしてもらえれば幸いだが,ここでは,「16x 4kbytes Blocks」まででA10-7850Kがi5-4670Kに対して優勢,それ以上のブロックサイズで劣勢という,かなりはっきりした傾向を見て取ることができる。
i5-4670Kは,4基のCPUコア(とGPUコア)で共有された,容量6MBのL3キャッシュを備える。対してA10-7850KはL3キャッシュを持たないこともあり,16x 4kbytes Blocksより上のサイズでは大きく離されてしまった。また,A10-6800Kとの比較では,「8x 256kbyte Blocks」でスコアが落ち込んでいるのも気になるところだ。想像の範囲は脱しないものの,ちょうど1モジュールで抱えるL2キャッシュの容量内に収まることからすると,KaveriではSteamrollerモジュール内でのデータ転送が高速化された一方,モジュール間でのデータ転送速度が若干低下した可能性はあるかもしれない。
CPUコア側から見たメインメモリのバス帯域幅を見る「Memory Bandwidth」のテスト結果がグラフ16だ。同じDDR3-2133設定でこういう結果が出ている以上,KaveriではRichlandと比べて,メモリコントローラに若干の改善が入っているようである。
なお,i5-4670Kが頭1つ抜けているのは,ここでのテストがAVX(Intel Advanced Vector eXtentions)を利用しているためと思われる。
そこで,GPUコア側からメモリバス帯域幅を見る「GP(GPU/CPU/APU) Bandwidth」を実行してみた。その結果がグラフ22だ。
「Internal Memory Bandwidth」は,メモリ内部でGPUにデータ転送を行わせたとき,「Interface Transfer Bandwidth」はCPUかDMA(Direct Memory Access)でメインメモリからインタフェース経由でグラフィックスメモリへデータ転送を行わせたときの帯域幅を示したものだが,ここではA10-7850KとA10-6800KがしっかりとデュアルチャネルDDR3-2133アクセスのメリットを享受できている。先のMemory Bandwidthよりも,こちらのGP(GPU/CPU/APU) Bandwidthのほうが,ゲーム用途におけるメモリバス帯域幅の実行性能に近い印象だ。
なお,A10-7850KとA10-6800Kのスコア差はInternal Memory Bandwidthで約12%,Interface Transfer Bandwidthで約40%。前述のとおり,テストに用いたドライバはHSA(≒hUMA)の正式対応前とされているが,後者のスコア差を踏まえるに,何らかの最適化が入っているようにも見える。
キャッシュとメインメモリの帯域幅を容量帯ごとに見る,いわば詳細テストにあたる「Cache Bandwidth」だと,A10-7850Kは,2基あるL2キャッシュの範囲に収まる「4MB Data Set」以下で,A10-6800Kに対して有意なスコア差をつけていた(グラフ23)。ここでも詳細スコアはグラフ画像をクリックすると表示される表4にまとめてあるが,「8MB Data Set」以上の容量帯だとA10-7850KのスコアはA10-6800Kをわずかに下回った。その理由は,このグラフだけでは分からない。
なお,「128kB Data Set」以下の容量帯でi5-4670Kが飛び抜けたスコアを示すのは異常ではない。HaswellでL1キャッシュの帯域幅が大きくなった効果である(関連記事)
キャッシュとメインメモリ周りのレイテンシを見る「Cache & Memory Latency」の結果がグラフ24だ。ここでも,グラフ画像をクリックすると表示される表5とセットで確認してもらえればと思うが,これを見ると,Cache Bandwidthの8MB Data Set以上でA10-7850Kのスコアが振るわない理由が見て取れる。そう,A10-7850KのレイテンシがA10-6800Kよりも全体的に大きいのである。
同一のメモリモジュールセットを用いていることもあり,A10-7850KとA10-6800Kでレイテンシ設定自体は共通。にもかかわらず,1基のSteamrollr Moduleで共有される容量2MBのL2キャッシュを超える容量帯でとくにスコア差が顕著だ。メモリコントローラのレイテンシ増大がとくに目立っている。
CPUコア性能や,CPUコアから見たメモリ性能では競合にまったく歯が立たないA10-7850Kだが,汎用演算にGPUを用いる場合はどうなるだろうか。グラフ25は,単精度浮動小数点演算を用いる「Native Float Shaders」と,倍精度浮動小数点演算を用いる「Native Double Shaders」とで,GPUのOpenGLアクセラレーション性能をチェックする「GP(GPU/CPU/APU) Processing」の結果だ。GPGPU性能検証のグラフ,という理解でいい。
そのスコアは圧巻の一言であり,このクラスのGPUにとって重要な単精度浮動小数点演算性能はA10-6800Kの約1.29倍,i5-4670Kの約2.44倍。参考値となるものの,倍精度ではA10-6800Kの約3.97倍,i5-4670Kの約2.98倍だ。GCNアーキテクチャを採用する効果がはっきり確認できる結果と述べていいだろう。
DirectCompute性能を見る「Video Shader Compute」でも,その傾向は変わらない(グラフ26)。A10-7850Kは,GPUベースで単精度浮動小数点演算を行う「Native Float Shaders」で,A10-6800Kの約2.15倍,i5-4670Kの2.67倍という,圧倒的なスコアを示している。
「Emulated Double Shaders」は,DirecComputeが倍精度浮動小数点演算をサポートしていないため,GPUによる単精度浮動小数点演算を用いて倍精度浮動小数点演算をエミュレートしたときの性能を推し量るものとなる。そのため,Native Float Shadersの結果を踏襲する形で,A10-7850KはA10-6800Kに対して倍以上というスコアを発揮するが,気になるのはi5-4670Kのスコアに届いていないことだ。エミュレートにあたって,キャッシュなど,GPUコア以外の要素が,i5-4670Kのスコアを押し上げている(もしくはAPUのスコアを下げている)のではなかろうか。
IPCは対A10-6800Kで数%〜20%程度の向上
ただしHaswellには歯が立たない
AMDは,Richland世代と比べて,平均で10%程度,最大20%程度のIPC向上がKaveriにはあると謳っているが,POV-rayのスコアはそれを裏付けるものといえるだろう。
ただし,i5-4670K@3.7GHzを前にしたときのスコアはOne CPUで約66%,All CPU’sで約60%と,ここまでのテスト結果に沿った大差もついている。
CINEBENCH R15のテスト結果がグラフ28となる。
CPUベースのレンダリング速度を比較するテストにおいて,A10-7850K@3.7GHzは,CPUコア1基による「CPU(Single Core)」で約1%,すべてのCPUコアを用いた「CPU」で約6%,A10-6800Kよりも高いスコアを示した。POV-Rayほどは景気がよくないものの,同一クロックで比較したとき,確実にスコアが向上している点は押さえておきたいところだ。
なお,i5-4670Kにまったく歯が立たないのは,ここでも変わっていない。
CPUのオーバークロックでは空冷4.5GHzを達成
BIOSの問題? GPUの上がり幅は847MHzに留まる
テストもようやく最後。オーバークロックである。
※注意
APUのオーバークロック設定はメーカー保証外の行為です。最悪の場合,APU本体やマザーボードなど,PCを構成する部品の製品寿命を著しく縮めたり,壊してしまったりする危険がありますので,本稿の記載内容を試してみる場合には,あくまで読者自身の責任で行ってください。本稿を参考にしてオーバークロック動作を試みた結果,何か問題が発生したとしても,メーカー各社や販売代理店,販売店はもちろん,筆者,4Gamer編集部も一切の責任を負いません。
実のところ,テスト開始当初,FM2A88X Extreme6+のUEFIはバージョン2.40を用いていたのが,2.40版UEFIでは,GPUクロック757MHzすら通らなかった。そこで,テスト開始後にリリースされた2.70へアップデートしてテストし直し,ようやっと847MHzまで設定できた次第である。付け加えると,
- AMDはGPUコアクロックを1GHz超級にまで上げられると主張している
- 2.70版UEFIで847MHzまでGPUコアクロックを引き上げた場合,OCCTのPOWER SUPPLYテストはクリアするのだが,PCMark 8ではエラーが発生し,途中で終了してしまう
ことから,今回の847MHzというのは,UEFIの“練度”が足りていないことによる制限を受けた可能性が高いと考えている。今回,GPUコアのオーバークロックで得たスコアは,参考程度に留めてもらえればと思う。条件が整えば,AMDの謳う1GHz超に近いクロックを狙えるようになるはずだ。
ともあれ,CPUコアを4.5GHz動作させた状態は「A10-7850K:CPU@4.5GHz」,GPUコアを847MHzで動作させた状態は「A10-7850K:GPU@847MHz」と表記することにして,標準状態のA10-7850Kと3Dゲームのベンチマークスコアを比較してみよう。
グラフ29,30は,3DMarkの総合スコアと,Fire StrikeのGraphics ScoreおよびPhysics Scoreを見たものだ。テストする前から予測できていたことの確認となるが,ゲーム性能を引き上げたいのであれば,CPUではなくGPUのクロックを引き上げるべきだというのがはっきり分かる。
ちなみに,定格の最大動作クロックである720MHzから約18%のクロック引き上げが総合スコアにもたらすスコア向上率は約8%だった。
エントリー設定で実行したBF4や,標準品質(デスクトップPC)および最高品質で実行した新生FFXIVベンチ キャラ編におけるスコアの傾向も,大きくは変わらない(グラフ31〜33)。ただ,A10-7850K:GPU@847MHzで得られるフレームレートの向上率はBF4,新生FFXIVベンチ キャラ編とも2〜3fpsに留まっている。単体のグラフィックスカードと同じ話といえばそれまでだが,Kaveriにおいても,オーバークロックで得られるメリットがそう大きくないことは,押さえておく必要があるだろう。
デメリットのほうはどうだろうか。ログの取得が可能なワットチェッカー「Watts up? PRO」を用いて,システム全体の消費電力を比較してみることにした。
テストにあたっては,アイドル時が続いてもディスプレイ出力を無効化しないようOSの起動後,30分間放置した時点を「アイドル時」,CPU側とGPU側の両方に負荷をかけ続けることができるOCCTのPOWER SUPLYテストを30分間実行し続けた時点を「OCCT:POWER SUPPLY時」としている。
その結果がグラフ33で,CPUコア電圧を引き上げたA10-7850K:CPU@4.5GHzは,OCCT:POWER SUPPLY時でA10-7850Kから48Wも消費電力が増えてしまった。A10-7850K:GPU@847MHzも同様に31W増加しており,オーバークロックによるデメリットは決して小さくないのが分かる。
「CPUコア性能」で語るべきではないKaveri
APU単体で使ってこそ価値がある
長くなってしまったが,まとめよう。前後編のテストから判明したKaveriのポイントは下記のとおりだ。
- 統合されるGPUコアの3D性能は2014年2月時点で世界最速
- Configurable TDPは,使い方次第だが,省電力化に有効
- 組み合わせるメモリモジュールは高スペックなものほど高い3D性能を期待できる
- 同一クロックで比較する限り,CPUコア性能はA10-6800Kから確実に向上しているが,実クロックが低くなっているので,総合的に見れば大差なし
- 「CPU」としての性能は,ひいき目に見てもi5-4670Kの6〜7割程度
- 「Webブラウザを使う」といった軽作業なら,KaveriでもHaswellでも大した違いはない
- CPUコアやGPUコアのオーバークロックは可能だが,メリットはあまり大きくない
ただ,「CPUコアとGPUコアを併用するか,GPUコアをメイン,CPUコアをサブで使うか」する必要があるというのは,「近い将来,ミドルクラス以上のグラフィックスカードをKaveri搭載システムに差そうとすると,ゲームにおいてはCPUコア性能が足を引っ張る可能性が高い」こととほぼ同義でもある。3Dゲーマーにとってはここが要注意のポイントになるはずで,つまりKaveriというかA10-7850Kは,少なくとも当面の間,単体で使ってこそ価値のあるプロセッサということになるだろう。グラフィックスカードを追加するにしても,Dual Graphics対応製品あたりが無難ではなかろうか。
AMD A-Series APU(Kaveri)製品情報ページ
- 関連タイトル:
AMD A-Series(Kaveri)
- この記事のURL: