テストレポート
「Core i9-9900K」再テスト結果報告。定格のTDP 95Wで動作させると「ゲーム用の最速CPU」は何が変わるか?
そう,先のレビュー記事でi9-9900Kは,動画のトランスコードや写真のRAW現像といったCPU負荷の高い処理を行ったときに,CPU単体の消費電力中央値が140Wを平気で超えていたのだ。どちらも20分前後にわたって負荷がかかり続けるテストなのだが,その消費電力中央値が140W超級だったということである。
i9-9900KのTDP(Thermal Design Power,熱設計消費電力)は95Wなので,「TDPとは?」と疑問を感じざるを得ない。
そもそもの話として,最近のIntel製CPUにおけるTDP値とベンチマークテストで得られた結果との間には乖離がある。そこで今回は,TDPと消費電力に焦点を当てて,もう一度i9-9900Kをテストしてみたいと思う。流通在庫が出てきたこのタイミングでの購入を検討している人は参考にしてもらえれば幸いだ。
「Core i9-9900K」レビュー。デスクトップPC向け初の8コア16スレッド対応CPUは何もかも強烈だった
2018年10月19日22:00,「Coffee Lake-S Refresh」ことデスクトップPC向け第9世代Coreプロセッサのレビューと販売が解禁となった。それに合わせて4Gamerではシリーズ最上位モデルとなる8コア16スレッド対応製品「Core i9-9900K」を入手できたので,さっそくテストにかけてみよう。その実力はいろいろな意味で強烈だ。
そもそも「TDP」とは何なのか
冒頭でも紹介したとおり,TDPというのは「Thermal Design Power」の略称であり,つまりは「CPUが出力する熱量」のことである。「CPUの消費電力」を示す数値ではない。
TDPでは,CPUを一種の「発熱体」(≒電熱器)として扱うことになる。そしてPCメーカーは,TDPの値を参考にして,その冷却に必要な冷却機構(≒CPUクーラーや筐体)の設計を行う。TDPが95Wなら,95Wの熱を発生する発熱体であるという前提で,PCメーカーはCPUクーラーや筐体からなる冷却機構を設計したり用意したりするわけである。
さらに言うと,Intelではその運用にあたって,「そこに達した場合はCPU内部の保護機構が動作する温度値」(≠設計上の温度上限)も規定している。デスクトップPCにおいてはCPUのシリコンダイを覆う“ケース”となるヒートスプレッダ(Integrated Heat Spreader)の温度を示す「Tcase」,CPUのシリコンダイが剥き出しとなるノートPCではシリコンの接合温度を示す「Tjunction」と対象部位が微妙に異なるものの,「発熱体の許容される温度上限」と考えればいい点で大差はない。
それを踏まえて,ではなぜ「発熱体の熱量」を示す値であるTDPを消費電力の指標値として扱うことができるのかというと,「CPUに投入される電力以上の熱をCPUが出すことはないから」だが,現在,CPUのTDPを取り巻く状況はかなり複雑になっている。一時的であれば定格のクロックを超えることができる自動クロックアップ機能を実装しているためだ。
IntelのCPUでは現在も,定格クロックで動作させる限り,発熱(≒消費電力)がTDPの枠内へ収まることになっている。しかし,Intel製のCPUが搭載する自動クロックアップ機能,最近で言えば「Turbo Boost Technology 2.0」(以下,TB2)が機能し,定格を超えるクロックで動作するときには,TDPの枠を超えて電力を消費し,いきおい,発熱も増大する。
幸いなことに,冷却機構の側では,一時的であればCPUが設計値を超える熱を出しても対応が可能だ。自動クロックアップ機能はそういう冷却機構の特性を期待して実装されていると言ってもいい。
なので,「CPUが定格以上のクロックでどれくらいの時間動作し続けるか」や,「定格以上のクロックで動作するときにどの程度の消費電力を上限とするか」といった自動クロックアップの動作パラメータは,PCを設計するOEMメーカーや,場合によってはユーザーがカスタマイズできるようになっている。
このデータシートは題名どおり第8〜第9世代CoreプロセッサとXeon Eプロセッサ(以下,第8世代以降のCoreプロセッサ)向けのデータシートで,電力設定周りの仕様がおおむね同じ3シリーズに関する資料だ。
さて,第8世代以降のCoreプロセッサにおいては,負荷に応じて自動的にクロックアップを行うTB2の動作いかんで消費電力や発熱が変化する。そしてデータシートによると,第8世代Coreプロセッサ以降では,TB2の動作を左右する2つの電力上限値「Power Limit 1」(以下,PL1)と「Power Limit 2」(以下,PL2)をOEMメーカー,あるいは(当該設定の用意がある製品なら)マザーボードのBIOS(UEFI)からユーザー側で設定できるようになっている※。
※より詳しく言えば「Power Limit 3」「Power Limit 4」もあるが,第8世代以降のCoreプロセッサでは無効化されているため,考慮しなくていいそうだ。
PL1は継続的に消費可能な電力上限値で,TDPと同じ値がデフォルトだとデータシートに記載がある。なのでi9-9900Kの場合ならPL1のデフォルト値は95Wだ。
一方,PL2は高負荷時に短時間であれば到達することが可能な電力上限値とされており,要するに「TB2が機能して高いクロックで動作するときに許容される電力の上限」という理解でいい。Intelの前述のデータシートを見るとPL2のデフォルト設定値はPL1の1.25倍なので,i9-9900Kの場合は 95W×1.25=118.75W ということになる。
ただ,話はこれで終わりではない。第8世代以降のCoreプロセッサには電力の上限値を決めるパラメータがもう1つあるのだ。TB2が動作クロックを調整するときの計算に利用する「Turbo Time Parameter」,略して「Tau」である。
前出のデータシートによれば,Tauは,TB2が高クロック動作を行う時間の長さを決定する内部アルゴリズムで使用される値となる。
下に示した画像は,前出のデータシートから,デスクトップ向けS-Processor LineのPL1,PL2,Tau(※データシート上の表記は「Power Limit 1 Time(Tau)」)それぞれの値が記載された表「Package Turbo Specifications(S-Processor Line)」を画像化したものだ。i9-9900Kは「S-Processor Line」の「8-Core GT2 95W」に相当する。
動作クロックを左右する3パラメータ,i9-9900Kにおける実際の設定値は?
上の画像を見ると分かるが,i9-9900KのPL1は(当然ながら)95Wで,PL2はその1.25倍(=118.75W),Tauは1というのがデフォルト値だが,ここで注目したいのは,第8世代以降のCoreプロセッサにおけるS-Processor Line(Sシリーズ)においてPL1とPL2の最大値(max)および最小値(min)の指定がない点である。これは「PL1とPL2ではOEMメーカーやユーザーが任意の設定を行える」と読めなくもない。
BIOSメニュー上の表記はPL1が「Long Duration Package Power Limit」,PL2が「Short Duration Package Power Limit」,Tauが「Package Power Time Window」となる。
下に示したのがそのスクリーンショットだが,デフォルト値はいずれも「Auto」になっていて,実際にどのような設定が行われているかは分からない。Tauはデータシート上で上限値が8になっているので「8以内だろう」とは言えるものの,PL1とPL2はヒントなしだ。
なのでここから,先のレビュー記事でi9-9900Kが高い性能と大きな消費電力を記録したのは,PL1やPL2やTauがIntelの示すデフォルト値よりかなり高い値に(マザーボードの工場出荷時設定である「Auto」の時点で)指定してあるからではないか,という疑念が出てくる。言い方を変えると,i9-9900Kと組み合わせたマザーボードの性能を「見栄えの良いもの」にするため,Auto設定でPL1とPL2,Tauを引き上げているのではないか,ということだ。
……という壮大な前置きを経て,ようやく本稿のテーマである。今回はPL1とPL2,Tauの3項目をデータシートで規定されているデフォルト値へ変更した状態で,i9-9900Kのテストをあらためて行ってみたいと思う。具体的には,PL1を95,PL2を118,Tauを1に固定した設定でベンチマークを実行し,3つのパラメータが「Auto」のときとのスコア差を調べることになる。
Ryzen 7 2700XのPBO有効/無効両条件も比較対象に追加
今回のテストでは「Ryzen 7 2700X」(以下,R7 2700X)を比較対象として用意した。
前段で触れたとおり,今回はi9-9900KのPL1とPL2,Tauの設定を弄るわけだが,第2世代Ryzenでも,自動クロックアップ機能「Precision Boost 2」(以下,PB2)の動作を左右するパラメータの変更は行える。専用のチューニングユーティリティソフト「Ryzen Master」にある,「Precision Boost Overdrive」(以下,PBO)以下の3項目「PPT」(Package Power Target),「TDC」(Thermal Design Current),「EDC」(Electrical Design Current)がそれだ。
PPTはPB2機能時の最大パッケージ電力値の設定を行うもので,ここでの「パッケージ電力値」はIntelと違い,冷却システムを含む。第8世代以降のCoreプロセッサにもVRM部と連携するためのパラメータとして「Platform Power Limit 2」が用意されているが,PBOのPPTはそれに相当するAMD版の設定項目と理解していいのではないかと思う。
設定値の単位はW(ワット)で,128W〜最大1000Wを1刻みで指定可能だ。
続いてTDCはPrecision Boostが機能していないときにCPUコアへ流れる最大電流値を設定するものとなっている。設定値はA(アンペア)なので,単位は異なるものの,基本的にはPL1の電流版に相当する項目と考えてよさそうだ。設定できる値は80〜114Aの範囲を1刻みである。
これらPBOの設定を変更した場合の動作はメーカー保証の対象外とされるが,テストで使用したASUSTeK Computer製「X470」チップセット搭載マザーボード「ROG CROSSHAIR VII HERO」とR7 2700Xの組み合わせだと,3つのパラメータを最大に設定してもRyzen Master組込みのストレステスト「Stability stress test」をクリアできることが分かった。
i9-9900KがPL1,PL2,Tauといったとパラメータの制限値を上げてTB2の性能を引き上げている可能性があるのなら,第2世代RyzenでもPBOを使ってPB2の動作を引き上げた設定と比較すべきだろう。
テストに使用する機材そのものはi9-9900Kのレビュー時と同じだ。DDR4-3200設定,メモリアクセスタイミング14-14-14-34に対応するメモリモジュールを使うので,メモリクロックを定格に設定した場合と,DDR4-3200に設定した場合の違いも調べてみる。
というわけで,i9-9900Kで4パターン,R7 2700Xで4パターンの合計8パターンでテストを実行することになる。具体的には以下のとおりだ。
- i9-9900K:PL1 Auto,PL2 Auto,Tau Auto,DDR4-3200
- i9-9900K:PL1 95,PL2 118,Tau1,DDR4-3200
- i9-9900K:PL1 Auto,PL2 Auto,Tau Auto,DDR4-2666
- i9-9900K:PL1 95,PL2 118,Tau1,DDR4-2666
- R7 2700X:PBO有効(PPT 1000,TDC 114,EDC 168),DDR4-3200
- R7 2700X:PBO無効,DDR4-3200
- R7 2700X:PBO有効(PPT 1000,TDC 114,EDC 168),DDR4-2933
- R7 2700X:PBO無効,DDR4-2933
以下グラフ中では,i9-9900KにおけるTDP関連3パラメータを「Auto」とした状態をi9-9900K Auto,データシートにおけるTDP 95Wの枠に固定した状態を「i9-9900K 95W」と表記する。またR7 2700XではPBOの最大設定値とした状態を「R7 2700X PBO」と表記して,PBO無効時と区別する。
メモリクロック設定は,DDR4-3200を(3200)といった具合に丸括弧書きの4桁数字で記載するので,その点もご注意を。
実行するテストはレビュー記事に準じるが,テストに用いるベンチマークレギュレーションは当時の22.0から今回は22.1に切り換えている。両者の違いは「PLAYERUNKNOWN'S BATTLEGROUNDS」(以下,PUBG)のテスト方法のみだ。
なお,ゲーム以外のベンチマークテストで実行したものは以下のとおり。PC総合ベンチマーク「PCMark 10」は完走しないトラブルが生じていること,CPUレビューで定番としている「Open Broadcaster Software」はテスト結果が数字で得られないためBIOS設定による違いの検証には適さないことから,それぞれ割愛している。
- ffmpeg(Nightly Build Version 20181007-0a41a8b)
- CINEBENCH R15(Relase 15.038)
- DxO PhotoLab 2(Version 2.0.0 Build 23352)
- 7-Zip(Version 1805)
H150i PRO RGBはSocket H4とSocket AM4の両方に対応するので,双方の環境でファン回転数最大固定,ポンプ回転数最大固定として使用した。
3DMarkの結果はTB2やPBOの設定にかかわらずおおむね横並びか
まずは「3DMark」(Version 2.6.6174)の結果から見ていこう。グラフ1はDirectX 11テストである「Fire Strike」の総合スコアをまとめたものだ。
i9-9900Kの結果を見ると,DDR4-3200アクセス条件のAuto設定,つまり,最も高い性能を期待できる条件のi9-9900Kは,DDR4-3200アクセス条件のTDP 95W設定と横並びという結果になった。DDR4-2666アクセス条件で比較すると,AutoよりもTDPを95Wに指定したときのほうがわずかにスコアは高くなっている。
比較対象として用意したR7 2700XもPBO有効時との間でスコアの違いは少なく,と標準動作の差は小さく,とくにDDR4-3200アクセス条件だと3つのテスト条件すべてで,ほぼ横並びという結果になった。DDR4-2933アクセス条件では「Fire Strike Ultra」でPBO有効時のスコアが無効時と比べて約99%になる一方,「Fire Strike Extreme」だと逆に約102%となっているので,ここはスコアがややブレ気味と紹介すべきかもしれない。
もちろん,3DMarkの総合スコアはグラフィックスカードの性能がスコアを大きく左右するので,そのカードを固定化している以上,TB2やPBOの設定でスコアに違いが出づらいということはあるだろう。これだけで何かを判断するのは難しい。
次にグラフ2はFire StrikeのGPUテスト「Graphics test」のスコアを抜き出したものだ。
ここでは総合スコア以上にGPU性能が支配的となることもあって,結果はほとんどグラフ1と同じ。i9-9900ではDDR-2666アクセス条件のAuto設定でスコアが若干下がり気味となっていたり,R7 2700Xのスコアがテスト条件ごとにややブレていたりというのはそのままである。
Fire Strikeから,CPUベースの物理シミュレーションによってCPU性能を測る「Physics test」の結果を抜き出したものがグラフ3となる。
事実上のCPUテスト結果なので期待が高まるが,スコアを見ると,DDR4-3200asアクセス条件においてi9-9900KのAuto設定とTDP 95W設定はおおむね横並び。ただしDDR4-2666アクセス条件だと若干の違いが出ており,Auto設定のスコアはTDP 95W設定と比べて1〜5%程度高い。
一方,R7 2700Xだとそこまでのスコア差は出ておらず,おおむね横並びとなった。あえて言えばDDR-3200でPBO有効時のスコアが無効時に対して98〜99%程度に留まっているのが気になるところだが,これをCPUベンチマークテストにおける有意な違いとまで言えるかというと,微妙なところである。
以上,i9-9900KではDDR4-2666アクセス条件のときにAutoのほうが最大約5%高いスコアを示したものの,DDR4-3200の条件だとそうではないので,これをもって「Auto設定が有利」とは言い切れないだろう。また,R7 2700XもPBOの有効/無効で有意な差があるとは言えないようだ。
グラフ4はGPUとCPUの両方へ同時に負荷をかけたときの性能を見る「Combined test」の結果を抜き出したものだ。
i9-9900Kは,DDR4-3200アクセス条件でAuto設定とTDP 95W設定のスコアがほぼ横並び。対してDDR4-2666アクセス条件だとFire Strike“無印”でAuto設定がTDP 95W設定に対して約3%高いスコアを示した。ただ,Fire Strike Extremeでは約94%,Fire Strike Ultraでは約98%と低くなってしまっていたりもするので,「GPU負荷が相対的に低い“無印”でスコアを伸ばした」とは言い切れない。ここは「スコアがやや乱れている」と評価すべきだと思う。
R7 2700XのほうはDDR4-3200アクセス条件でほぼ横並びながら,DDR4-2933アクセス条件でi9-9900K以上にスコアが大きく暴れている。Fire Strike ExtremeでPBO有効時のスコアが無効時と比べて約13%も高いので,PBOの効果ありと言いたいところだが,ではFire Strike Ultraだと約1%低く,Fire Strike“無印”だと約2%高いのはなぜかと問われると,なかなか回答しづらい。
続いては3DMarkのDirectX 12テストである「Time Spy」である。グラフ5は総合スコアをまとめたものだ。
i9-9900Kの結果を見ると,DDR4-3200アクセスの場合,Auto設定のスコアがTDP 95W設定のそれを1〜2%程度ほど上回っている。しかしDDR4-2666アクセスだと,Time Spy“無印”でAuto設定のスコアはTDP 95W設定比で約97%に留まり,「Time Spy Extreme」でも横並びと,Auto設定のメリットは確認できない。
R7 2700Xでは,DDR4-3200アクセス条件においてPBO有効時のスコアは無効時との比較で98〜99%に留まり,DDR4-2933だとほぼ横並びとなった。こちらもPBO有効の効果は確認できないということになる。
Time Spyの総合スコアから,GPUテストである「Graphics test」のスコアを抜きだしたものがグラフ6である。
i9-9900Kから見ていくと,DDR4-3200アクセス条件のスコアはAuto設定時とTDP 95W設定時でほぼ横並びだが,DDR4-2666アクセス条件だとAuto設定時のほうがスコアは低く,TDP 95W設定時に対して96〜98%程度となった。
R7 2700Xのほうだと,DDR4-3200アクセスにおけるPBO有効時のスコアは無効時に対して97〜98%程度,DDR4-2933アクセスにおいては約99%と,違いこそ僅かであるものの,やはりPBO有効時のほうがスコアは低いというデータが得られている。
続いてグラフ7はTime Spyにおける「CPU test」のスコアを抜き出したものだ。
i9-9900Kだと,メモリアクセス条件が同じ場合,Auto設定のスコアはTDP 95W設定のそれを有意に上回っている。DDR4-3200アクセスで5〜9%程度,DDR-2666アクセスで3〜9%程度高い。
一方のR7 2700Xではメモリアクセス条件にかかわらずPBO有効時のスコアが無効時を約1%上回ったが,これを有意と言えるかというと微妙なように思う。
以上,3DMarkの結果をざっとまとめると,i9-9900KのAuto設定やR7 2700XのPBO有効時が高いスコアを示すケースはあれども,そうでないスコアに留まることも往々にしてあり,全体を見ればバラつきつつも均(なら)せばほぼ横並びと言っていいのではないかと思う。
少なくとも3DMarkに関して言えば,i9-9900Kの利用にあたってUEFI側からTDPを95Wへ抑えようと抑えまいと,スコアへの影響はほとんどないレベルであると言ってしまっていい。
実ゲームでもAuto設定が有利とは言い切れない
続いて実ゲームを用いたベンチマークテストの結果を見ていこう。まずグラフ8〜10は「Far Cry 5」のスコアをまとめたものだ。
DDR4-3200アクセス条件においてi9-9900KのAuto設定とTDP 95W設定の間に違いはほぼなく,横並びと言ってしまっていいが,DDR4-2666アクセス条件の1600×900ドットではAuto設定の平均フレームレートがTDP 95W設定に対して約5%高くなった。最小フレームレートも約3%高いので,これは無視できない結果だ。
R7 2700Xに目を移すと,同じメモリアクセス条件であればPBO有効か無効かで違いはほとんど見られない。1920
「Overwatch」のスコアをまとめたものがグラフ11〜13となる。
Overwatchは300fpsでフレームレートのキャップがかかるため,今回のテスト環境だと1920
R7 2700Xのほうだと,DDR4-3200,DDR4-2933の両アクセス条件においてPBO有効時の最小フレームレートが無効時よりも約3%高いので,こちらはPBOの効果が最小フレームレートに出ていると言えそうだ。
グラフ14〜16はPUBGのテスト結果だ。DDR4-3200アクセス条件におけるi9-9900Kは,3つの解像度すべてにおいてAuto設定のほうがTDP 95W設定と比べて平均フレームレートが低いという結果になっている。最小フレームレートだと2560
ただ,DDR4-2666アクセス条件だと,平均フレームレートは勝ったり負けたりといった印象ながらも,最小フレームレートは1920
メモリ設定によって結果が逆になるのが妙なところだが,なぜこうなるのかはこれだけだとなんとも言えない。
R7 2700Xのほうだと,平均フレームレートを見る限り,PBO有効化の効果はあるということになる。DDR4-2933アクセス設定だと最小フレームレートでもPBO有効時のスコアが無効時に対して6〜12%程度高くなっているので,ここでは組み合わせるメモリモジュールのスペックが低いほうがPBOの効果は分かりやすく出ている印象がある。
続いてグラフ17〜19は「Fortnite」のスコアをまとめたものだが,ここではi9-9900Kにおいて「同じメモリアクセス条件であれば,Auto設定のほうがTDP 95W設定と比べて平均,最小フレームレートとも高い」という,はっきりした結果が出た。
DDR4-3200アクセス条件においてAuto設定はTDP 95W設定に対して平均フレームレートで2〜4%程度,最小フレームレートで1〜8%程度高い。また,DDR4-2666設定においても順に5〜9%程度,6〜12%程度高かった。
一方のR7 2700Xだと,PBO有効時のほうが無効時よりも平均フレームレートは高い傾向ながら,i9-9900Kほどの分かりやすい違いは出ていない。
「Middle-earth: Shadow of War」(以下,Shadow of War)の結果はグラフ20〜22にまとめている。
DDR4-3200アクセス条件において,i9-9900KのAuto設定における平均フレームレートはTDP 95W設定のそれに対して97〜98%程度と若干低い。DDR4-2666アクセス条件だとほぼ横並びだ。
それに対し,R7 2700Xだと,DDR4-3200アクセス条件のPBO有効時は無効時に対して2〜4%程度高いスコアとなった。DDR4-2933アクセス条件だと1〜2%程度に縮まるものの,PBO有効化の効果は割と出ていると言ってよさそうである。
「ファイナルファンタジーXIV: 紅蓮のリベレーター」の公式ベンチマーク(以下,FFXIV紅蓮のリベレーター ベンチ)の総合スコアをまとめたものがグラフ23だ。
一見して分かるのは,i9-9900Kにおいて,Auto設定のほうがTDP 95W設定と比べて低い結果になっていることだ。DDR4-3200アクセス条件で97〜99%程度,DDR4-2666アクセス条件で98〜99%程度となり,最もGPU負荷の低い1600
R7 2700Xのほうだと,メモリアクセス条件にかかわらず,スコアはほぼ横並びだった。PBOというか,Ryzenの自動クロックアップ全体に対する感応度が低いテストと言えるのではないかと思う。
グラフ24〜26はそんなFFXIV紅蓮のリベレーター ベンチの平均および最小フレームレートをまとめたものだ。おおむね総合スコアを踏襲する形になっていることが確認できる。
「Project CARS 2」のテスト結果がグラフ27〜29となる。
i9-9900Kの場合,メモリアクセス条件を問わず,Auto設定とTDP 95W設定では平均,最小フレームレートともに違いはほぼない。強いて言うなら2560
R7 2700Xのほうでも全体的な傾向はi9-9900Kと同様だ。2560
ということで,Project CARS 2は自動クロックアップ機能に対する感応度が低いタイトルと言えるように思う。
以上,実ゲームを見てきたが,i9-9900KでTB2の3パラメータによって性能の底上げを実現しているとしても,ゲーム性能で決定的な違いが生じているわけではないとまとめていいだろう。FortniteのようにTDP 95W設定で明らかにフレームレートが落ちるタイトルはあったが,全体としてそういうタイトルの割合は多くなさそうだ。
R7 2700XのPBOも同様で,タイトルによって効果が見られる場合もあるが,基本的には違いはほぼないという理解でいいだろう。
いずれにせよ,R7 2700Xと比べた場合にi9-9900Kの持つゲーム性能の高さは否定できないが,それはTB2の3パラメータとはさほど関係がないと言えそうである。
CPUに負荷がかかる局面では性能の底上げ疑惑が見える結果に
ゲームだとTB2の3パラメータを変えてもフレームレートに大差ないという結果になったが,非ゲーム用途のアプリケーションではどうだろうか。まずはffmpegを用いた動画のトランスコード時間を見てみたい。
ここでは,FFXIV紅蓮のリベレーターで実際にゲームをプレイした,総時間7分25秒,ビットレート437Mbps,Motion JPEG形式,解像度1920×1080ドットの録画データをソースとして用意。これを,「libx264」エンコーダによりH.264/AVC形式にトランスコードするのに要した時間と,「libx265」エンコーダでH.265/HEVC形式にトランスコードするのに要した時間をそれぞれスコアとして採用する。
使用したバッチファイルを参考のため以下のとおり掲載しておくので,参考にしてほしい。簡単に言うと,slowプリセットにanimationチューニングを加え,可能な限り画質の劣化を抑えた変換を行う設定だ。
del avc.mp4
del hevc.mp4
powershell -c measure-command {.\ffmpeg -i Diademe.avi -c:v libx264 -preset slow -tune animation -crf 18 -threads 0 avc.mp4} >MPEG4_score.txt
powershell -c measure-command {.\ffmpeg -i Diademe.avi -c:v libx265 -preset slow -crf 20 hevc.mp4} >HEVC_score.txt
結果はグラフ30にまとめたとおりで,i9-9900KのAuto設定とTDP 95W設定との間には明確な違いが出た。H.264のトランスコード所要時間には約1分,H.265では約3分も,Auto設定のほうが速い。つまり,Auto設定における3つのパラメータはTDP 95W設定のデフォルト値より高い可能性があると,はっきり言えるスコアになったわけだ。
対するR7 2700Xのほうは,PBOの効果がわずかに見られるものの,大差がつくというほどにはなっていない……が,注目すべきはそこではないだろう。そう,TDP 95W設定でi9-9900Kがスコアを落としたことで,R7 2700Xとのスコア差が縮まっているのだ。
libx265はIntel製の「AVX2」(Advanced Vector Extensions 2)拡張命令を多用しており,H.265/AVHCではその影響が出ているため,ここではH.264/AVCのほうに注目してみるが,すると,DDR4-3200アクセス条件のAuto設定でi9-9900KはPBO有効時のR7 2700Xに対して約76%の時間で処理を終えられているのに対し,TDP 95W設定ではこれが約84%にまで縮んでいるのが分かる。
次は,マルチスレッド性能がスコアに大きな影響を与える3DレンダリングベンチマークであるCINEBENCH R15のテスト結果だ。
ここでもi9-9900KではDDR4-3200アクセス条件でAuto設定がTDP 95W設定に対して約11%,DDR4-2666アクセス条件でも約10%と,大きなスコア差が生じた。2桁パーセントの違いというのは尋常ではない。
当然このことは,R7 2700Xとのスコア差にも影響を与えている。
具体的に言うと,DDR4-3200アクセス条件のAuto設定でi9-9900KはPBO有効時のR7 2700Xに対して約18%高いスコアを示しているのに対し,TDP 95W設定ではこれが約6%にまで縮まってしまう。2018年12月19日時点の実勢価格が順に6万5800〜6万6000円程度,3万7600〜4万3200円程度と,両者に大きな違いがあることを踏まえるに,「マルチスレッド性能が問われるテストでスコア差が約6%」という事実には大きなインパクトがあると言わざるを得まい。
次は,DxO PhotoLab 2を使ったRAW現像の所要時間検証だ。ここでは,ニコン製デジタルカメラ「D810」を用いて撮影した,解像度7360×4912ドットのRAWファイル60枚に対して,ベンチマーク用のプリセットを適用し,JPEGファイルとして出力し終えるまでの時間を計測し,スコアとして採用することになる。
その結果はグラフ32のとおりで,メモリアクセス条件にかかわらず,i9-9900KではAuto設定がTDP 95W設定より2分以上速く処理を終えている。
R7 2700Xのほうでは「PBOの効果がはっきりしない」結果になっているが,DDR4-3200アクセス条件のAuto設定でi9-9900KがPBO有効時のR7 2700Xに対して約85%の時間で処理を終えられているのに対し,TDP 95W設定では約93%にまで縮むのはやはり要注目と言えるだろう。
性能検証の最後は,マルチスレッドに最適化されたファイルの圧縮・展開ツールである7-Zipだ。7-Zipの「7-Zip File Manager」にはベンチマークが組み込まれているので,今回は7-Zip File Managerから「ツール」→「ベンチマーク」を開き,いったん[停止]ボタンを押してから「辞書サイズ」を「64MB」に設定。その後,[再開]ボタンをクリックして圧縮&解凍の総合スコアを示す「総合評価」が算出されるまで待ち,さらにテスト回数20回になるまでテストを実行し続けて,20回めの総合評価をスコアとして採用することにした。
結果はグラフ33のとおりだ。DDR4-3200アクセス条件でi9-9900KのAuto設定はTDP 95W設定に対して約3%高いスコアを示した一方,DDR4-2666アクセス条件だとスコアはほぼ横並びとなっている。
一方,R7 2700Xのほうだと,メモリアクセス条件にかかわらず約1%というスコア差が付いている。ここまでのスコア傾向からするとおおむね妥当な結果といったところか。
i9-9900KをTDP 95W設定にしても7-Zipのスコアはさほど低下せず,R7 2700Xとのスコア差も大きくは縮まっていないが,これは7-Zipが「IPP」(Integrated Performance Primitives,画像や信号,データ圧縮処理用)および「MKL」(Math Karnel Library,数値演算用)という2つのIntel製ライブラリを使っているためだろう。言うまでもなくこれら2ライブラリはIntel製CPUに最適化されているので,それがこの結果を生んだはずである。
以上をまとめると,CPUに負荷がかかるトランスコードやCINEBENCH R15,RAW現像といった処理において,i9-9900KのAuto設定は性能向上へ間違いなく寄与していることが分かる。また,PL1とPL2,Tauという3つのパラメータが,Auto設定においてデフォルト値より高くなっていることは間違いないと,あらためて断言できよう。
i9-9900KをTDP 95Wのデフォルト値に設定した場合は,アプリケーションがIntel製ライブラリを活用しているかどうかで結果が分かれる。活用しているのであれば性能低下は最小限に抑えられるものの,そうでないケースだと,R7 2700Xとのスコア差はかなり詰まり,少なくとも数万円という価格差を納得させられるだけのものではなくなる印象だ。
TDP 95W化を行うとi9-9900Kの電力性能は大幅に改善
ここからは注目の消費電力をまとめていきたい。
第20世代以降の4Gamerベンチマークレギュレーションは,EPS12Vの電流を測り,12を掛けて電力換算する方法も採用している。この方法ならCPU単体のおおよその消費電力が推測できるからだ。
ただ電気代という,現実的な運用コストに関わるシステム全体の消費電力も目安として知りたい読者は多いだろう。そこで,システム全体の最大消費電力も併せて掲載することにしている。
というわけでまずは,EPS12Vを使って計測した,CPU単体の消費電力の中央値からである。グラフ34に示したグラフデータは,「CPUでアプリケーションを実行したときの典型的な消費電力」という理解でいい。
ゲーム実行時におけるi9-9900Kの消費電力中央値は各テスト間でバラつきつつもおおむね同程度。なので,「TDP 95W設定を行ってもゲーム実行時の中央値は大して下がるわけではない」と言っていいかと思う。
一方,印象的なのはffmpegによるトランスコード実行時の消費電力中央値で,Auto設定だと140Wを超えるところが,TDP 95W設定だと95〜92Wと,実に妥当な中央値を記録している。
ffmpegと同様にCPUへ長時間の負荷をかけ続けるDxO PhotoLab 2も同様に,TDP 95W設定時はしっかり90W台に収まっている。PL1とPL2,Tauの3パラメータを規定値に設定すれば,i9-9900KはしっかりTDP 95WのCPUとして期待される消費電力で動作してくれるというわけである。これまた前段で触れたとおり,一部で競合製品とのベンチマークスコアが大幅に詰まる結果も生むが。
さて,「競合製品」ことR7 2700Xの消費電力中央値だが,DDR4-3200条件のゲームベンチマークで見ると3DMark時はPBOを有効化することで,無効にした状態よりも約35Wと突出して高い数字が出た。DDR4-2933条件だと1Wしか違わなかったりもするので,このスコアは,ノイズを拾ったか,それに類する事象によるものだと考えている。
実ゲームだとDDR4-3200条件で8〜11W程度,DDR4-2933条件だと8〜10W程度,PBO有効時のほうがそれぞれ高い。PBOの有効/無効によるフレームレートの違いはさほどでもないので,2桁弱の消費電力増は割が合わない印象だ。
なら,ほぼCPUのみに負荷がかかる非ゲームのテストだとどうかだが,DDR4-3200条件の7-Zip実行時が突出していてPBO有効時が無効時より70Wも高くなっている。ただ,DDR4-2933条件だと約8Wしか違わないので,おそらくノイズかそういった原因でDDR4-3200条件のスコアが跳ね上がっただけだろう。
また,DxO PhotoLab 2のスコアも妙で,DDR4-3200条件だとPBO有効時のほうが約15W高いのに対し,DDR4-2933条件だと逆に約20Wも低くなっている。DxO PhotoLab 2だとPBOの有効化による効果はほぼなかったので,そのことと,この妙な消費電力中央値の記録には関係があるかもしれない。
これらやや突出した記録を除くと,おおむねPBO有効時は無効時に対して8〜15W程度は高くなるといった傾向が見えると言ってよさそうだ。
次に,EPS12Vの最大値と,無操作時にディスプレイ出力が無効化されないよう指定したうえで,OSの起動後30分放置した時点(以下,アイドル時)のスコアをまとめたものがグラフ35である。
i9-9900Kのゲーム実行時を比較すると,3DMarkではDDR4-3200条件時に約23W,DDR4-2666条件時に約15W,それぞれAuto設定がTDP 95W設定より高くなっているが,3DMarkは実ゲームとは異なりCPUのベンチマークを含むので,こうしたある意味きれいな結果が出ると考えられる。
それに対し,実ゲームではかなり荒れた最大値を記録している。まず異常な値を拾っておくと,DDR4-2666アクセス条件におけるOverwatch実行時とFFXIV紅蓮のリベレーター ベンチ実行時にAuto設定がTDP 95W設定より40W以上高くなっているが,他のタイトルでそういう傾向は出ていないので,ここでも何らかのノイズ的なものを拾ってしまった可能性が高そうだ。
それ以外のタイトルだとAuto設定が高かったり低かったりといったところで,どちらが最高値が高いとも言い切れない結果になった。
非ゲームだと一転してAuto設定が圧倒的に高い最高値を記録する。DDR4-3200条件で30〜89W程度,DDR4-2666条件では34〜63W程度も高い。この結果からも,Auto設定ではTB2の動作を左右する3つのパラメータがデフォルト値よりかなり高めに設定されていると見て間違いないところだ。
なお,R7 2700Xの結果では,Project CARS 2でDDR4-3200アクセス条件時においてPBO有効時のスコアが無効時と比べて50W以上も低いが,これも何らかの原因による異常値と見ていいだろう。
それ以外だと,非ゲーム系アプリケーションも含め,PBO有効時はほぼ同程度か,最大20W強高いスコアを,PBO無効時に対して示している。
今回は「GeForce RTX 2080 Ti」搭載モデルという消費電力の大きなグラフィックスカードを組み合わせているため,ゲーム実行時の消費電力はグラフィックスカードが支配的となる。ただ,ゲーム以外だとやはりAuto設定を行ったi9-9900K消費電力が有意に高いということも確認できるはずだ。
ゲーム用途だとTDP 95W化はアリ。ただそれ以外ではR7 2700Xに対する優位性が失われることも
というわけで,再テストの結果を見てきた。本稿でここまですでに繰り返し述べてきたことではあるが,あらためて確認しておくと,i9-9900Kについて確実に断言できるのは以下のポイントである。
- TB2の挙動を決めるPL1とPL2,Tauという3つのパラメータは,マザーボードの工場出荷時設定であるAuto設定だと,Intelがデータシートに記載しているデフォルト値になっていない
あえてネガティブな書き方をすれば,マザーボードメーカーは,Intelの意思かマザーボードメーカーの意思かは分からないものの,PL1とPL2,Tauの設定を意図的にかつこっそり引き上げて性能の底上げを図っていることになる。
あるいはポジティブに表現するなら,マザーボードメーカーはユーザーの負担にならない,かつメーカー保証の範囲内でCPU性能をできる限り引き出すべくAuto設定をチューニングしている,ということになるだろう。
ならTDP 95W化はありやなしやという話だが,ゲーム用途では間違いなく「アリ」だ。フレームレートへの影響はほとんどなく,かつR7 2700Xを明らかに上回っているので,より万人向けのゲーマー向けCPUとして使っていくことができるだろう。
一方で,非ゲーム用途だと,とくにCPU負荷が高く,かつIntel製ライブラリの積極活用を行っていないアプリケーションにおいて,性能は確実に下がる。R7 2700Xとのベンチマークスコア差が1桁パーセント台にまで縮むのはさすがに看過できないところだ。
2018年12月19日時点の,
- i9-9900K:6万5800〜6万6000円程度
- R7 2700X:3万7600〜4万3200円程度
という税込実勢価格を見てしまうと,TDP 95W化がもたらす価格対性能比の悪化具合,そしてR7 2700Xの持つ価格対性能比の高さが目を惹くところで,再テストを通じ,CPU選びはまた難しくなったような気がしている。
最後に余談として2つ付け加えておこう。
1つめはパラメータの話だ。今回のテストにあたって,PL1=95,PL2=118,Tau=8とTauのみ最大に引き上げた設定も筆者は試したが,この設定だとffmpegやDxO PhotoLab 2実行時の消費電力中央値を100W強程度まで抑えることができ,ゲーム実行時の消費電力はさほど変わらずといったところで,そこそこ扱いやすいCPUとして使うことができた。
Tau=8にしてもゲームの性能に変化は生じていないが,非ゲーム用途だと性能が多少上がるのを確認できたので,たとえばTauだけなど,3つあるTB2関連パラメータを自分なりに弄って性能と消費電力のバランスを追求してみるのも面白い使い方ではなかろうか。
もう1つは,「今後,Intel製CPUをどうテストするか」という話である。消費電力を嵩上げして性能の引き上げを図っているのは間違いないわけで,今後は,公表されているTDP値とあまりにもかけ離れた消費電力中央値を記録する製品がある場合,PL1とPL2,Tauの設定をリファレンス値に固定した状態でのテストを行う必要が出てくるもしれない。
i9-9900KをAmazon.co.jpで購入する(Amazonアソシエイト)
i9-9900Kをパソコンショップ アークで購入する
IntelのCore i9プロセッサ製品情報ページ
- 関連タイトル:
第9世代Core(Coffee Lake Refresh)
- この記事のURL: