テストレポート
「Phenom」と「AMD 790FX」に関する現状報告
現時点では複数の問題を抱えるPhenom&AMD 790FX
メモリ周りの改善が急務か?
- TLBに関するエラッタが存在する
- HyperTransportアップ/ダウンリンクの動作クロックが合計2GHzに制限される
- “デュアルチャネル”メモリアクセスの効果がよく分からない
順に見ていこう。1.のTLBとは「Translation Look-aside Buffer」のことで,誤解を恐れずにまとめるなら,CPU内部にあるキャッシュメモリ(=バッファ)の一種である。仮想メモリアドレスと物理メモリアドレスの変換時に利用されるものだが,日本AMDから公式に提供された資料によると,このエラッタは「特定のワークロードを行った際にのみ発生」する,再現頻度の非常に低いもので,マザーボードベンダー各社から「新しいBIOSが近日中に更新される予定」になっているとのこと。新しいバージョンのBIOSでは,BIOSメニューから修正の有効/無効を選択できるようになる。
修正を選択すると「一部パフォーマンスの低下が見られる可能性」があること。また,上で述べたように,問題が顕在化する可能性が低いことから,修正を実際に行うかどうかはユーザーの裁量に任されるという。また,「2008年以降の他のAMD Phenomプロセッサに関しては修正される予定」だそうである(※「 」で囲んだ緑字は原文ママ)。
続いて2.は,「AMD OverDrive」(2.0.10 Beta)のスクリーンショットを見てもらったほうが早そうだ。下に示したサムネイルはクリックすると全体を別ウインドウで表示するようになっているが,「System Information」にある「HyperTransport Link」の「Speed」は1GHz程度となっているほか,「Performance Control」にある「HT Multiplier」は最大でも「5X」で,HyperTransport 2.0相当になってしまっている。
BIOSメニューには「Unganged Mode Support」という項目が用意されている |
Unganged Modeを有効(Enabled)にすると,メモリチャネルごとのタイミング設定が可能になる |
Phenomは2基のメモリコントローラを内蔵し,メモリコントローラのアクセス方式として「Unganged」(アンギャングド,「散らした」意)モードをサポートしている。Ungangedモードでは,二つのメモリコントローラが64bitのメモリチャネル×2を独立して駆動させ,別個かつ同時に利用できるようになる。マルチスレッド化されたアプリケーションでは,スレッドごとにメモリを割り振れるようになるため,結果としてパフォーマンスが向上するという理屈だ。BIOS 1.0においてK9A2 PlatinumのデフォルトはUngangedモードだった。
一方,従来型のデュアルチャネルメモリアクセスに近い方式もサポートされており,これが「Ganged」(ギャングド,「団結した」意)モードとされる。場合によっては「Ungangedモード無効」(Unganged Mode: Disabled)と二重否定で表記されるが,いずれにせよGangedモードでは,(手元の資料によれば)メモリバス帯域幅を重視したアクセス方式になるというわけだ。
詳細なテスト環境は後ほどお知らせするとして,グラフ1を見てほしい(※グラフをクリックすると,詳細スコアを含む完全版を別ウインドウで表示します)。これは,「Sandra XIIc」(2008.1.12.34)の「Cache and Memory」を実行,キャッシュメモリやメモリコントローラの性能をチェックした結果だ。K9A2 Platinumでは,BIOSメニューにある「Unganged Mode」を「Enabled/Disabled」で切り替えることで,Unganged/Gangedモードを切り替えられるため,そこから二つのモードを切り替えてテストし,1コア当たりのL2キャッシュ容量が512KBでPhenom 9600と同じ「Athlon 64 X2 5000+/2.6GHz」のスコアを比較用として示してある。
ざっとまとめてみると,Phenom 9600のスコアは,L2キャッシュの容量である512kB,それにL3キャッシュ容量を加えた1〜4MBのところで下がっている。また,メインメモリへのアクセスとなる4MB以上では,Ungangedモードのほうがスコアは高い。
続いてメモリバス帯域幅を確認するSandra XIIcの「Memory Bandwidth」だが,ここでは,64bitアクセスとなるUngangedモードが,Athlon 64 X2 5000+に大きく後れを取っている(グラフ2)。また,(前出の資料によれば)Gangedモードでは帯域幅が大きく向上するはずなのだが,実際にはわずかにしか上がっていない。
同じく,メモリ周りのテストを行えるソフトとして,「EVEREST Ultimate Edition」(4.2.0.1180 Beta)のメモリリード/ライト/コピー,またメモリレイテンシのテストを行ってみた結果がグラフ3,4だ。
デュアルチャネルアクセスとなるGangedモードでは,メモリリードとコピー,レイテンシで効果が見られるものの,メモリライトはAthlon 64 X2 5000+の6割程度と,大きく下がっている。
海外のPC系情報サイトを眺めていると,Sandra XIIcとEVEREST Ultimate Editionには,Phenomのメモリコントローラを正しく認識できない問題があるとしているところもある(ソース)。いよいよ混迷を極めつつあり,「よく分からない」というのが正直なところだが,データを見る限りは,Gangedモードが正常に機能していない印象だ。
ちなみに,3DMark06の総合スコアにも差は誤差程度しかなかったこと,前出のとおり,両モードですべてのテストを行うには時間が不足していることを考え,本稿においては以後,マザーボードのデフォルトとなるUngangedモードでゲームテストを行うことにした。
テスト方法は4Gamerのベンチマークレギュレーション4.1準拠。ただし,CPU性能が表れにくい1920×1200ドットならびに「高負荷設定」のテストは省略している。また,グラフは1024×768ドットのみ記載しているが,クリックすることで1280×1024ドット,1600×1200ドットのスコアも見られるようにしてある。
またこれも時間の都合により,AMD 790FXマザーボードでテストしたのはPhenom 9600のみ。ただし,倍率変更によって「Phenom 9500/2.2GHz」相当のスコアも取得する。
一方,比較対象は2007年10月23日に掲載した「デュアルコアCPU購入ガイド」からデータを流用する。マザーボード以外のテスト環境はすべて同一の個体/バージョンで揃えたため,GPUが「GeForce 7900 GS」になっている点はご注意を。具体的には表のとおりだ。
ゲームによってはX2 5200+やC2D E6550以下
現時点のパフォーマンスでは厳しい
さて,いろいろとお断りが多くなってしまったが,スコアをざっと確認しておこう。グラフ5,6は「3DMark06」(Build 1.1.0)の結果で,Phenomのスコアは良好。とくにCPUスコア(CPU Score)の伸びが目を引くが,「Core 2 Extreme QX9650/3GHz」のレビューで示した同スコアなどと比較するに,クアッドコアの強みが発揮されたと見ていいだろう。いずれにせよ,デュアルコアCPUとは一線を画した値になっている。
続いて「3DMark05」(Build 1.3.0)の結果がグラフ7となる。3DMark05のマルチスレッド最適化は3DMark06ほどでないため,クアッドコアのメリットはあまり出ていない。結果としてPhenom 9600のスコアはCore 2 Duo E6550/2.33GHzを下回り,Athlon 64 X2 6000+/3GHzにも若干の後れを取った。
FPS×2,「S.T.A.L.K.E.R.: Shadow of Chernobyl」と「Half-Life 2: Episode One」のスコアをまとめてチェックしてみよう(グラフ8,9)。ほとんど差は生じていないが,あえて述べるなら,Phenom 9600のスコアは,Athlon 64 X2 5200+/2.6GHzとほぼ同じレベルだ。
マルチスレッド処理に最適化された「ロスト プラネット エクストリーム コンディション」に期待してみたが,結果は奮わず。やはりAthlon 64 X2 5200+程度となってしまっている(グラフ10)。2.6GHz動作のCPUと同じスコアを2.3GHzで上げている以上,1クロック当たりの性能は確実に向上しているはずだが,メモリ周りが原因なのかどうか,真のクアッドコアCPUであることのメリットは,現時点では見えない。
GPUに依存したスコアの出やすい「Company of Heroes」だが,ここでは,本来的にはGPUボトルネックによって横並びになるはずにもかかわらず,Phenom 9600/9500だけが一段下がっている(グラフ11)。これもやはり,メモリ周りに何かあると考えざるを得ないところだ。
そして,メモリパフォーマンスがスコアを左右しやすいレースシム「GTR 2 - FIA GT Racing Game」において,メモリパフォーマンスの問題は決定的となる。同タイトルはAthlon 64ファミリーが有利となりやすいのだが,グラフ12を見てもらうと分かるように,Phenom 9600/9500のスコアは明らかに低い。
CnQ 2.0と温度センサー周りに問題発生も
消費電力に関しては期待できそう
続けて,システム全体の消費電力をチェックしてみる。OS起動後30分間放置した時点を「アイドル時」,MP3エンコードソフト「午後のこ〜だ」ベースのベンチマークソフトで,CPU負荷の高い「午後べんち」を30分間連続実行し続け,最も消費電力の高かった時点を「高負荷時」として,消費電力をスコアとして計測した。
ただこのとき,下の画面を見てほしいのだが,省電力機能「Cool'n'Quiet 2.0」有効時の動作クロックのうち,なぜか「CPU Core 3 Speed」だけ「Target Speed」が2300MHz(※Phenom 9600のリファレンスクロック)と表示されたままだったり,5.5倍となるはずのところ,なぜか倍率設定が5.75倍(5.75 X)と出てしまったりしている。このあたりはCPUドライバの改善待ちといったところだろう。
さて,Phenom 9600/9500のTDP(Thermal Design Power,熱設計消費電力)は95Wだが,高負荷時のスコアを見ると,TDP 89WのAthlon 64 6000+や同5600+より低い(グラフ13)。もちろん,マザーボードが異なるうえ,AMD 790FXは高負荷時にもわずか10Wという消費電力の低さがウリなので,スコアをそのまま受け取るわけにはいかないのだが,少なくとも「Phenom 9600の消費電力がクアッドコアCPUとしてはかなり低い」ことはいえそうである。
アイドル時も消費電力に関して不満はなさそう。ちなみに省電力機能を有効化した場合,Phenom 9600のコア電圧は標準の1.25Vから1.05Vへと下がっていた。
なお,CPUコア温度は今回のテスト環境において,残念ながら取得できなかった。AMD OverDriveの温度モニターでは0℃,マザーボードに付属するカスタマイズ&モニタリングツール「MSI Dual CoreCenter」では測定不能,そして
フリーソフトウェアの「CoreTemp」(0.95.4 Beta)では206℃とレポートされてしまったのである。唯一,EVEREST Ultimate Editionだけはアイドル時21℃,高負荷時46℃という,スコアらしきものを返したのだが,どの部分の温度なのかよく分からないうえ,そもそもPhenomのリファレンスクーラーも用意できていないため,今回は分析を見送りたい。
性能以前に不明な点,問題点が多く
現時点では様子見が正解
だが,現時点でキャッシュやメモリパフォーマンスについてはっきりとしたことを言えなかったり,HyperTransportに制限があったり,温度を正確に把握できなかったりするのも事実。とても安定してゲームをプレイできる環境になっておらず,現時点では“人柱”用の域を出ない。確実にそのポテンシャルを発揮できる環境が整うまで,AMD派のゲーマーは,手持ちのAthlon 64ファミリーを使い続けながら,しばらく様子を見るのが正解だろう。
(C)2007 Advanced Micro Devices, Inc.