レビュー
8Kでのゲームプレイを謳うRTX 30シリーズ最強GPUの実力は?
GeForce RTX 3090
(ZOTAC GAMING GeForce RTX 3090 Trinity)
Ampereアーキテクチャによる新世代の幕開けとしては,十分なインパクトを残したNVIDIAの新型GPU「GeForce RTX 3080」(以下,RTX 3080)。その高性能ぶりは記憶に新しいが,GeForce RTX 30シリーズの最上位モデルとなる「GeForce RTX 3090」(以下,RTX 3090)の発売が始まり,レビューもようやく解禁となった。
RTX 3090とはどのようなGPUなのだろうか。今回は,ZOTAC Technology(以下,ZOTAC)製のグラフィックスカード「ZOTAC
フルスペック版GA102から2基のSMを無効化
メモリバス帯域幅は936GB/sを実現
冒頭でも述べたとおり,RTX 3090は,RTX 3080と同じAmpereアーキテクチャに基づくGPUで,RTX 3080の上位に置かれるモデルだ(関連記事)。GPUコアには,「GA102」を採用する点はRTX 3080と同じなので,NVIDIA向けにカスタムされたSamsung Electronicsの8nmプロセスルールで製造される点も変わらない。GPUコアが同じなので,RTX 3090のダイサイズは628mm2,トランジスタ数は280憶個ということになる。
GA102のフルスペックでは,ミニGPUクラスタ「Graphics Processor Cluster」(以下,GPC)を計7基搭載しており,各GPCは12基の「Strea
Ampereアーキテクチャの場合,SMには128基のシェーダプロセッサ「CUDA Core」が搭載するのだが,RTX 3080の場合,GPCのうち丸ごと1基分と,追加で4基分のSMが無効化されていた。そのため,RTX 3080のGPC数は6基で,SM数は68基,CUDA Core総数は計8704基となっていたのはRTX 3080のレビュー記事でお伝えしたとおり。
それがRTX 3090ではどうなっているかというと,全体から2基分のSMが無効化されただけだ。そのため,GPC数は7基となり,SM数は82基,CUDA Coreの総数は128×82で1万496基となる。これはRTX 3080比で1.2倍の規模にあたる。RTX 3090でもGA102のフルスペックではないのは残念だが,今後,歩留まりが向上すればさらに上位モデルが登場する可能性もあるのだろうか。
リアルタイムレイトレーシングを担当する「RT Core」は,RTX 3080と同様に第2世代へと進化した。1基のSMに対して1基を組み合わせる構成なので,RTX 3090のRT Core総数は82基となる。NVIDIAによると,RTX 3090におけるRT Coreのスループットは69.5 RT-FLOPSとなるそうで,これはRTX 3080の約1.2倍になる計算だ。
一方,AI推論エンジンアクセラレータである「Tensor Core」は,第3世代となったものがSM 1基あたり4基組み込まれている。そのため,Tensor Coreの総数は328基で,スループットは284.7 Tensor-TFLOPSと,こちらもRTX 3080の約1.2倍となる。
なお,テスト中のGPUコアクロックをGPU-Zで追ってみたところ1935MHzまで上がっていることを確認した。
また,RTX 3090でもRTX 3080と同様に,グラフィックスメモリにGDDR6Xを採用している。メモリクロックも19GHz相当と,こちらもRTX 3080と変わらない。しかし,RTX 3090ではメモリインタフェースが384bitになっているため,メモリバス帯域幅は936GB/sと,RTX 3080の1.23倍を実現した。メモリ容量も24GBと,RTX 3080の10GBに比べて大幅に増えている。
そのほかのトピックを挙げておくと,RTX 3080と同様に,RTX 3090はPCとの接続インタフェースにPCI Express(以下,PCIe) 4.0をサポートしている。一方で,RTX 3080では非対応だったNVLink SLIに対応しているのは注目すべきところだ。ただ,昨今のゲームにおいて,NVLink SLIの効果が非常に限定的な状況を踏まえると,GPUで汎用計算を行うGPGPU用途を視野に入れた仕様ではないだろうか。
そんなRTX 3090の主なスペックを,RTX 3080およびRTX 2080 Tiとともにまとめたものが表1となる。
GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 2080 Ti | |
---|---|---|---|
GPUコア | GA102(GA102-300) | GA102(GA102-200) | TU102(TU102-300) |
GPUアーキテクチャ | Ampere | Ampere | Turing |
製造プロセス技術 | 8nm | 8nm | 12nm FFN |
トランジスタ数 | 280億 | 280億 | 186億 |
ダイサイズ | 628mm2 | 628mm2 | 754mm2 |
ミニGPU(GPC)数 | 7 | 6 | 6 |
演算ユニット(SM)数 | 82 | 68 | 68 |
シェーダプロセッサ数 | 10496 | 8704 | 4352 |
TPC数 | 41 | 34 | 34 |
RT Core数 | 82 | 68 | 68 |
Tensor Core数 | 328 | 272 | 544 |
テクスチャユニット数 | 328 | 272 | 272 |
ROP数 | 112 | 96 | 88 |
ベースクロック | 1395MHz | 1440MHz | 1350MHz |
ブーストクロック | 1695MHz | 1710MHz | 1545MHz (FEは1635MHz) |
GPU Boost | 4.0 | 4.0 | 4.0 |
L2キャッシュ容量 | 6MB | 5MB | 4MB |
メモリタイプ | GDDR6X | GDDR6X | GDDR6 |
メモリインタフェース | 384bit | 320bit | 256bit |
メモリクロック | 19GHz相当 | 19GHz相当 | 14GHz相当 |
メモリバス帯域幅 | 936GB/s | 760GB/s | 448GB/s |
メモリ容量 | 24GB | 10GB | 11GB |
TGP | 350W | 320W | 215W(FEは260W) |
接続インタフェース | PCIe 4.0 | PCIe 4.0 | PCIe 3.0 |
NVLink SLI | ○(1リンク) | ― | ○(1リンク) |
PCIe外部電源 | 8ピン×2(評価機) | 12ピン(FE) | 8ピン×2 |
カードサイズは実測で321mmと大きめ
GPUクーラーには独自のIceStorm 2.0を採用
それでは,ZOTAC RTX 3090 Trinityのカードそのものを見ていこう。
まず,カード長は実測で約321mm(※突起部除く)。「GeForce
重量は実測で約1343gと,8gだけだがRTX 3080 Founders
GPUクーラーは2.5スロット占有タイプで,90mm角相当のファンを3基搭載する独自クーラー「IceStorm 2.0」だ。ZOTACによると,新しい11枚羽のファンは,従来のものに比べて空気流量が10%向上しているという。また,GPUへの負荷が低いとき,いわゆるアイドル時にファンの回転を停止させる機能も備えている。
アルミニウム製のヒートシンクは3ブロック構成で,メモリチップや電源部にもしっかり密接することで冷却を行う構造だ。そして,各ヒートシンクの間を6mm径のヒートパイプ7本が結ぶ格好となっている。
PCIe補助電源コネクタは,RTX 2080 Founders Editionのような12ピンではなく,一般的な8ピンが2基という構成だ。ただ,前述のとおり,基板自体のサイズはそれほど長くはないため,電源コネクタは,カードの中央寄りに実装されている。
なお,パッケージには2本の6ピンを8ピン1本に変換するコネクタが2本同梱されていた。
RTX 3080やRTX 2080 Tiとの比較を実施
DSRを用いて8K解像度でのテストを実施
テスト環境の構築に話を移そう。今回,比較対象にはRTX 3080 Founders Editionと,RTX 2080 Tiを用意した。グラフィックスドライバには「GeForce 456.38 Driver」を使用している。これは,テスト時における最新バージョンとなるものだ。また,RTX 3090がRTX 3080と同様にPCIe 4.0に対応しているため,テスト環境にはX570チップセットベースのRyzenプラットフォームを選択した。
それ以外のテスト環境は表2のとおり。
テスト方法は,4Gamerのベンチマークレギュレーション23.2に準拠。それに加えて,RTX 3080のテストと同様に,リアルタイムレイトレーシングやDLSS,それにPCIe 4.0の効果を確認するため「3DMark」(Version 2.13.7004)に含まれる「Port Royal」と「NVIDIA DLSS feature test」,「PCI Express feature test」も実施した。ただし,RTX 3080のテストとは異なり,今回はNVIDIA DLSS feature testで「DLSS 2.0」を利用している。
なお,テスト環境やテスト方法はRTX 3080のときとほぼ同じだ。グラフィックスドライバに関しても,RTX 3080のテストで用いた456.16と今回の456.38とでは,テストに用いるタイトルでパフォーマンスに影響はない。そのため,2560×1440ドットと1920×1080ドットのスコアに関しては,RTX 3080のテストのものを流用している。ただ,3DMarkについては前述のとおり,NVIDIA DLSS feature testでDLSS 2.0を用いているため,RTX 3080とRTX 2080 Tiでテストをし直している。
RTX 3080との性能差は10%前後
8K解像度でのプレイにはまだ力不足
それでは3DMarkから順にテスト結果を見て行こう。グラフ1は,Fire Strikeの総合スコアをまとめたものだ。
RTX 3090とRTX 3080との差は2〜9%程度といったところ。RTX 3080と同様に,RTX 3090もCPUがボトルネックになりやすいが,それでも4K解像度のテストであるFire Strike Ultraで,両GPUの差が1割もないのはいささか拍子抜けだ。対してRTX 2080 Ti比では,Fire Strike Ultraで43%もの差を付けており,格の違いを見せ付けている。
続いてグラフ2は,Fire Strikeから「Graphics score」を抜き出したものとなる。
このテストではCPUの影響を排除できるため,RTX 3090とRTX 3080との差はFire Strike“無印”で5%にまで広がっている。しかし,Fire Strike Ultraでも9%までしか差が開いておらず,総合スコアの大勢とあまり変わりはない。ただ,Fire Strike“無印”でも,RTX 3090はRTX 2080 Tiを29%も引き離している点は評価できよう。
続いてグラフ3は,ソフトウェアベースの物理演算テスト結果を「CPU score」として抜き出したもの。今回のテストでは,すべてのGPUでCPUを統一しているため,当然のことながら結果も横並びだ。
GPUとCPU両方の性能が効いてくる「Combined test」の結果がグラフ4となる。
CPU性能が足かせになっていることは明らかで,Fire Strike“無印”ではどれも差がついていない。一方で,Fire Strike Ultraでは,RTX 3090とRTX 3080との差は約10%に達しており,RTX 2080 Ti比でも約46%と,しっかり引き離している。
DirectX 12世代のテストである「Time Spy」の結果を見ていこう。グラフ5は,Time Spyにおける総合スコアをまとめたものだ。
RTX 3090とRTX 3080の差は約4%で,Fire Strike以上に差を付けることができていない。これは,Time Spyテストにおいては,CPU性能の重み付けが大きいためと思われる。ただ,RTX 2080 Tiに対しても26〜33%ほどしか差が開いていないため,Fire Strikeで見せた勢いは見られない。
Time SpyにおけるGPUテスト結果がグラフ6,CPUテスト結果がグラフ7となる。
まずGPUテスト結果だが,RTX 3090とRTX 3080の差は5〜6%ほどと,総合スコアよりも差が広がっている。それでも,Fire Strike Ultraほどの開きは見られない。
その一方で,RTX 2080 Tiには34〜42%の差をしっかり付けており,世代の差が実感できる。また,CPUテスト結果は,Fire Strikeと同様に,CPUが揃っているためスコアも横一線だ。
リアルタイムレイトレーシングの性能を計るPort Royalの結果がグラフ8となる。
ここでも,RTX 3090はRTX 3080に5%ほどの差しか付けていない。NVIDIAの説明では,「RTX 3090のリアルタイムレイトレーシング性能はRTX 3080の1.2倍程度」ということだったが,このテストでは,まったくそこまで及んでいない。また,RTX 2080 Tiに対しても1.37倍のスコアしか残せておらず,Port Royalへの最適化が足りていないのではないだろうか。
続いてグラフ9は,DLSSの性能を見るNVIDIA DLSS feature testの結果だが,今回はDLSS 2.0を用いたことで,RTX 3080のテスト時より,全体的にスコアが丸まっている。なお,DLSSの動作モードは「Performance」を使用した。また,RTX 3080とRTX 2080 Tiは8K解像度でのDLSS off状態では正常に動作しなかったため,スコアなしとしている。
ここでもRTX 3090はRTX 3080を3〜6%ほどしか引き離せておらずインパクトは乏しい。ただ,7680×4320ドットでDLSSを有効にすると,フレームレートが4倍以上増加している点は,なかなか見ごたえがある。
グラフ10は,PCI Express feature testの結果だが,RTX 3090はPCIe 4.0に対応したことで,RTX 3080と同じくRTX 2080 Tiに大差を付けている。インタフェース規格における転送レートの差が,しっかりと結果に表れている。
では,実際のゲームではどうなのだろうか。まずは「Far Cry New Dawn」(グラフ11〜13)の結果から見ていこう。
ここでは,さらにRTX 3090とRTX 3080との差が見え難い状況となった。両GPUの差は平均フレームレートで2〜3%程度,2560×1440ドットのフレームレートでも最大で2fpsしか差がなく,その違いを体感することはまずないだろう。また,7680×4320ドットで平均30fps以上が出ている点は頑張っているともいえるが,ゲームを快適にプレイするには,ハッキリ言ってまだ性能が足りていない。
「バイオハザード RE:3」の結果がグラフ14〜16となる。
CPUの影響により性能差が出ない2560×1440ドットを置いておくと,RTX 3090はRTX 3080を多少引き離して,その差は平均フレームレートで8〜9%程度にまで広がっている。とくに3840×2160ドットで約10fpsの差が開いている点は評価できよう。
その一方で7680×4320ドットでは,平均フレームレートが40fpsに達しておらず,やはり8K解像度で快適にプレイするには,RTX 3090を持ってしても力不足と言わざるをえない。
打って変わって,グラフ17〜19の「Call of Duty: Warzone」(以下,CoD Warzone)では,RTX 3090は良好な結果を残している。
CPUのボトルネックでスコアが頭打ちとなる2560×1440ドットを省くと,RTX 3090は,平均フレームレートでRTX 3080に10〜14%程度の差を付けている。また,RTX 2080 Tiに対しても40〜56%ほどの差を付け,3840×2160ドットで唯一120fpsを上回っている点は,かなりインパクトがある。
7680×4320ドットでも,RTX 3090は比較対象と比べて十分高いフレームレートを記録しているが,やはりプレイアブルな領域には,まだ性能が足りていない印象だ。
続いては「Fortnite」の結果なのだが,ここで少々問題が起きてしまった。というのも,7680×4320ドットのほうが,すべてのGPUで3840×2160ドットよりもわずかに高いスコアとなってしまったのだ。これは,FortniteでDSRがうまく機能しなかったというよりは,ゲーム側に8K解像度でのレンダリングが用意されていないのではないだろうか。
そのため,意味のない7680×4320ドットを省略した2つのスコアを見ていこう(グラフ20〜21)。
RTX 3090は,平均フレームレートでRTX 3080に13〜14%程度の差を付けたあたりは立派だ。最小フレームレートも,2560×1440ドットで140fps,3840×2160ドットで75fpsに達しているなど見所は多い。RTX 2080 Tiが3840×2160ドットの最小フレームレートで60fpsにまったく届いていないところを見ても,RTX 3090との性能差は明白だ。
グラフ22〜24は,「Borderlands 3」の結果である。
RTX 3090とRTX 3080との差は,3840×2160ドットまでの平均フレームレートで5〜8%ほどと,3DMarkのFire Strikeと似た傾向だ。7680×4320ドットにいたっては,RTX 3080とRTX 2080 Tiが平均フレームレートが10fpsにも満たないのに対して,RTX 3090は約20fpsと大差を付けた。これは,グラフィックスメモリ容量の差が,そのままフレームレートに結び付いた形だが,それでもRTX 3090は8K解像度でプレイするには少々厳しい。
なお,RTX 3080が7680×4320ドットでRTX 2080 Tiを下回っているのは,グラフィックスメモリ容量の差と,ゲーム側のレンダリングが8K解像度ではうまくできていないためではないだろうか。
グラフ25は,「ファイナルファンタジーXIV: 漆黒のヴィランズ ベンチマーク」(以下,FFXIV漆黒のヴィランズ ベンチ)の総合スコアをまとめたものだ。
このベンチマークは,CPU性能もスコアに影響を及ぼすため,RTX 3090はRTX 3080をあまり引き離せていない。両GPUの差は3〜6%ほどしかなく,RTX 3090が伸び悩む結果となっている。また,7680×4320ドットの結果は4000ほどと,プレイできなくはないものの,快適なプレイにはやはりRTX 3090を持ってしても性能が足りない印象だ。
そんなFFXIV漆黒のヴィランズ ベンチにおける平均フレームレートと最小フレームレートをまとめたものが,グラフ26〜28だ。
平均フレームレートは,総合スコアを踏襲したものとなっている一方で,最小フレームレートはCPU性能の影響が色濃く表れるため,RTX 3090はRTX 3080と大差ない結果に終わっている。やはり,RTX 3090でもCPUの足かせは,ゲームにおけるネックとなりそうだ。
ゲームでのテストにおける最後は,「PROJECT CARS 2」(グラフ29〜31)の結果となる。
RTX 3090とRTX 3080の平均フレームレートにおける差は4〜8%程度と,Borderlands 3の3840×2160ドットまでと似た傾向だ。7680×2160ドットでは,RTX 3090でも最小フレームレートが11fps程度にまで落ち込んでいるので,プレイするには少々厳しい結果に終わっている。RTX 3080に対しても,7680×2160ドットで明確な差を付けることができいない。
このあたりも,ゲーム側が8K解像度のレンダリングを想定していないのではないだろうか。
RTX 3080以上の電力喰い
IceStorm 2.0の冷却性能と静音性は申し分なし
RTX 3090のTGP(Total Graphics Power,グラフィックスカードの消費電力)は350Wと,RTX 3080の320Wから,さらに30W増えている。RTX 3080のテストでは消費電力の高さが如実に表れていたが,RTX 3090ははたしてどうなのだろうか。
なお,今回も「4Gamer GPU Power Checker」(Version 1.1)の不調が続いているので,ログの取得が可能なワットチェッカー「Watts up? PRO」を用いたシステム全体の最大消費電力のみを計測している。
テストにあたっては,Windowsの電源プランを「バランスに設定」。さらに,ゲーム用途を想定し,無操作時にもディスプレイ出力が無効化されないよう指定したうえで,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点をタイトルごとの実行時,OSの起動後30分放置した時点を「アイドル時」としている。
その結果はグラフ32のとおりだ。
RTX 3090の消費電力は,各アプリケーション実行時でRTX 3080から17〜51W上昇している。ピーク値を見るテストであるため,数値は高く出る傾向にあるのだが,それでもシステム全体の消費電力が600Wに迫っているあたりは電力喰いと言わざるをえない。少なくともRTX 3080から消費電力あたりの性能が悪化しているのは事実で,この消費電力の大きさはRTX 3090の弱点であるとと指摘しておきたい。
最後に,GPU-Zを用いて計測したGPU温度も確認しておきたい。ここでは,温度約24℃の室内で,テストシステムをPCケースに組み込まず,いわゆるバラックに置いた状態から,3DMarkの30分間連続実行時を「高負荷時」として,アイドル時ともども,GPU-Zから温度を取得することにした(グラフ34)。
グラフィックスカードごとに,空冷ファンの制御や温度センサーの位置などは異なる。そのため,横並びの評価にあまり意味はないのだが,それを踏まえて結果を見ていくと,RTX 3090は高負荷時でも70℃台半ばと,ほかに比べて低めだ。これは,ZOTAC RTX 3090 Trinityが採用するGPUクーラーのIceStorm 2.0が,十分な冷却性能を発揮していると理解していいだろう。その一方で,アイドル時にRTX 3090の温度が高めなのは,ファンの回転が停止するためだ。
なお,ファンの動作音について触れておくと,筆者の主観であることを断ったうえで述べると,かなり静かな印象を受けた。テスト中のZOTAC RTX 3090 Trinityを見ていると,ファンの回転と停止をかなりの頻度で行っており,静音性と冷却性能のバランスにかなり配慮していることがうかがい知れる。少なくとも,RTX 3080 Founders Editionより静かだったことは間違いない。
価格は20万円以上と非常に高価
ゲームよりもGPGPUなどに向けたGPUか
もちろん,RTX 3090がRTX 3080より高い性能を発揮するのは事実だ。1割程度とはいえ,フレームレートを少しでも高めたいと考えるコアなゲーマーにとって,RTX 3090は最高性能が得られる唯一無二の選択肢であることは間違いない。ただ,ZOTAC RTX 3090 Trinityのメーカー想定売価は,税込で22万5000円前後と,実勢価格が10〜12万円程度であるRTX 3080のほぼ倍である。そこまでかけて得られるグラフィックス性能の伸びが1割程度なら,価格対性能比は非常に悪いと言わざるをえない。
しかも,NVIDIAはRTX 3090について,4K解像度だけでなく8K解像度でのゲームプレイをアピールしているのだが,今回テストを行ったタイトルやグラフィックス設定では,力不足が露呈してしまっている。NVIDIAによると,DSRはネイティブな解像度で動作させた場合に比べて全体的に4%前後の性能低下が起きるそうだが,それを踏まえても絶対的な性能が足りていない。もちろん,グラフィックス設定を下げれば,8K解像度でもプレイアブルな性能を得られるが,それなら4K解像度で映像品質を高めるほうがゲーム体験の質は良いだろうから,本末転倒と言える。
NVIDIAがゲームスタジオ側に働きかけて,このような仕組みをゲーム側に取り入れることを期待したい。
いずれにしても,24GBものグラフィックスメモリや936GB/sというメモリバス帯域幅という仕様を考えると,RTX 3090は純粋なゲーム用というよりも,やはりTITANシリーズの後継として,GPGPUやディープラーニング用途向けと捉えたほうがしっくりくるGPUと言えるだろう。
ZOTACのZOTAC RTX 3090 Trinity製品情報ページ
- 関連タイトル:
ZOTAC GAMING(旧称:ZOTAC Gaming)
- 関連タイトル:
GeForce RTX 30
- この記事のURL: