ニュース
西川善司の3DGE:PS5のスペック予想はいくつ当たったか? CPUとGPUは予想どおりだが,最も意外なのはPrimitive Shaderの採用
筆者は,初期型PlayStation 4(以下,PS4)が発売される1年前にPS4 Proの登場を予想し当てた実績(笑)があるので,2019年4月当時は,かなり気合を入れて予想したものだ。PS5の予想は,どの程度当たっていただろうか。
西川善司の3DGE:無茶を承知で「PS5」の姿を予想してみる。CPUは大幅に性能向上するがレイトレ対応GPUはダイサイズが問題に
北米のテックメディアであるWiredが,SIEのMark Cerny氏に対する単独インタビューで「次世代PlayStation」プラットフォームのヒントを明らかにした。本稿では,この次世代機をPS5と仮称して,西川善司氏にその構成を予想してもらった。PS5では,CPUやGPU,メモリやストレージ,PSVR対応がどう変わるのだろうか。
参考までに,PS5とライバルであるXbox Series Xのスペックを比較した表を示しておこう。これらを見ながら読み進めてもらうと,理解しやすいかもしれない。
意外に高クロックだったPS5のCPU
まずは,SoC(System-on-a-Chip)周りから,CPUを見ていこう。
次世代PlayStationと呼ばれていた1年前の時点で,「Zen 2ベースの8コアCPUを採用する」という情報は公開済みだった。筆者が予想したのは動作クロックで,必要となる想定性能から3GHz〜4GHzの間と推定し,その理論性能値を,
- 32 FLOPS×8コア×3〜4GHz=約768〜1024 GFLOPS
と予想した。このとおりだと,PS5のCPU性能はPS4の7.4〜10倍くらいに相当する。予想記事を公開したあとで,SNSでは「予想クロックは高すぎるのでは?」とか,「そこまでCPU性能は求められていないのでは?」といった指摘もだいぶあったが,結果は896 GFLOPSと,PS4の8.75倍であった。予想の範囲内には収まり,ほぼ正解と言っていいだろう。ちなみに,Xbox Series Xもほぼ予想の範囲内に収まるCPU性能となっている。
ゲーム機においても,CPU性能は高くて困るものではない。改めてPS4世代のゲームを振り返ると,グラフィックス表現に見合うアニメーション(キャラクターモーション)やAIの振る舞い,物理シミュレーションといった点で,品質的にあと一歩と思わされることも少なくなかった。
たとえば,身体全体のフルモーションキャプチャで作った人体アニメーションデータを使うイベントシーンでは目立たないのだが,プレイ中に起こるキャラクターのアクションにおいては,部位ごとの動きで不自然さが露呈することが多かった。これを自然に行うための仕組みの1つに,「フルボディIK」(Inverse Kinematics)という技術がある。
表情のアニメーションも,クチパクベースから抜け出せていないものが多かった。PS4世代になってからは,実在の俳優をCG化して演技させるゲームも増えたが,そうしたタイトルほど,役者本人のイメージがゲーマー側にもあるため,単純な表情アニメーションでは,操り人形的なクチパク感が目立ってしまうのだ。
また,PS4世代でも,リアルなグラフィックス表現を採用しながら,壁に囲まれた場所での戦闘になると,振り回す剣先が壁にめり込むことをお構いなしとしているタイトルは多かったし,飛散した瓦礫の破片が着地後の地面でブルブル震え続ける様子を見ることも多かった。また,剣の柄を握る手に隙間があってフィギュア感が払拭できていなかったり,突進する方向を間違えたとき,壁に激突したままその場で足踏みを続けて一歩も進まない「ルームランナー走り」をしている敵キャラもいまだ多かったりするものだ。NPCや敵キャラ同士が狭いところで絡み合って,互いに避けたりできない興ざめなシーンも,いまだによく遭遇する。
グラフィックスにおける質感やライティングのリアルさとのアンバランスを目の当たりにして,途端にゲームへの没入感が失われる経験は,今に至ってもまだ少なくない。
ゲームにおけるアニメーションやAI処理,物理シミュレーションをGPUにオフロードして処理すれば……というゲーム開発者たちの理想は,毎回,次世代ゲーム機が登場するたびに語られるものだが,これまでは常に幻想で終わっていた。どのゲーム開発プロジェクトにおいても,GPUにグラフィックス以外をやらせる演算予算(=処理能力)の配分は小さいので,結局CPUに任せるしかなかったのである。この点は,PS5の世代でも大きくは変わらないだろうから,そうなると,アニメーションや物理シミュレーションの精度を上げるには,CPU性能を上げるしかない。
例を挙げよう。以下に示した2枚の画像は,CEDEC 2015における「ファイナルファンタジーXV」(以下,FFXV)のAIに関するセッションで公開された開発画面で,画像手前にいる金髪のキャラクター(プロンプト)を制御するAIが,次に行うアクションを判断している様子をヒートマップで可視化したものだ。緑赤青のヒートマップは,赤い場所が危険な場所,緑が移動の候補,右にひとつだけ見える青が,AIが算出したベスト位置で,キャラクターはそこに向かって移動している。
FFXVは,こうした処理をCPUで行っていたが,ほかのゲームも基本的には同様だ。
また,PS4時代から積極的に使われるようになったアニメーションとAIの相互連携は,PS5時代にはますます重要度を増すだろう。
アニメーションとAIの相互連携を具体的に説明すると,プレイヤーおよび敵キャラクターが,周囲の環境を認識しながら適切な動きを自動的に行うといったものだ。たとえば,キャラクターが壁際で剣を振るときには,剣先が壁に当たらないようにスイングをコンパクトに変更するといった具合に,認識と知性をコンビネーションさせることである。
次に示す動画は,PC版「Max Payne 3」で撮影したもので,寝そべった姿勢で銃を構える主人公キャラクターを床で回転させたものだ。ある程度までは,両腕でバランスを取りながら姿勢を変えていくが,腕の曲げ具合が間接の曲がる限界に達すると,体全体を回転させるという自然な動きを見せるのが分かると思う。これは,NaturalMotionのミドルウェア「Euphoria」によるもので,人体解剖学とAI処理を組み合わせたフルボディIKによるアニメーション自動生成システムを実現している。つまり,これらの動きはモーションキャプチャではなく,AIによる自動生成によるものだ。
ちなみにEuphoriaは,「Grand Theft Auto V」「Red Dead Redemption」「Quantum Break」や「Until Dawn」といった大作にも採用実績がある。ただ,残念ながら,2017年で提供を終了している。
こうした表現や,アニメーション,AI,物理シミュレーションといった要素が,PS5におけるCPU性能向上でどの程度進化するか,今から楽しみだ。もっとも,これらは不自然さのある表現が,より自然になるだけとも言えるので,なかなかゲーマーにも気付いてもらえないポイントではあるのだが……。
「レイトレの謎」は解決へ?
思ったよりも低かったGPUの理論性能値
話が長くなったが,PS5のGPUについての答え合わせに進もう。
PS5のGPUにおいては,以下の要素がずっと謎のままだった。
- 「PS5のGPUは『Navi』ベースのカスタムGPU」というPS5のリードシステムアーキテクトであるMark Cerny(マーク・サーニー)氏による予告
- 「PS5はハードウェアレイトレーシングに対応する」というCerny氏の予告
- しかし,2019年夏に登場した初のNaviベースRadeon GPUは,ハードウェアレイトレーシングに未対応だったという矛盾する事実
Cerny氏の予告と実際に登場したNaviの仕様が一致しないという謎は,3月5日にAMDが明らかにしたGPUロードマップにおいて,2020年末頃に発表予定の第2世代Naviこと「RDNA 2」ベースのGPUでハードウェアレイトレーシング機能を搭載することが明らかとなって決着した。「Navi世代(RDNAベース)のGPUでハードウェアレイトレーシングを実装する」という筆者の予測は,「第2世代NAVI(RDNA2ベース)のGPUで実装する」ということになり,微妙に外れてしまった。
さて,1年前に筆者は,PS5のGPUにおける性能値も予想した。その予想は以下の3点を主な根拠としたものだ。
- APUの製造プロセス技術は,7nmとCerny氏が予告している
- 次世代ゲーム機に搭載できるであろうSoCの現実的なダイサイズには目安がある
- 理論性能値は,疑似ではないリアル4Kグラフィックスレンダリングに必要十分なものになるだろう
これらを根拠に,筆者は,PS5のGPU演算性能が「7.36 TFLOPSから13.8 TFLOPSの間に落ち着くだろう」と予想した。明らかになったGPU演算性能は10.28 TFLOPSで,予想範囲のほぼ中央値である。正直「もう少し上かも」と思っていたのだが,消費電力や製品価格などとのバランスを考えて,この値に落ち着いたのかもしれない。
ちなみに,Xbox Series XにおけるGPU演算性能は,12.15 TFLOPSとなっている。だが,Microsoftは,「Series X」の部分には「ワイルドカード的な意味合いがある」と海外のメディア向けに説明しており,将来的には下位モデルが出る可能性を示唆したものと受け止められている。
だとすれば,その下位モデルは,筆者予想の最低値から,PS5の10.28 TFLOPSの間,つまり8〜9 TFLOPS前後になるのではないだろうか。もっとも,この予想は,「性能と価格のバランスを考えれば,Xbox Series XとXbox One Xの間に収まるはず」ということだけが根拠の,ある意味適当な予想ではある。
3月19日に行われたオンラインイベントでCerny氏は,「PS5のGPUは,新しいジオメトリパイプラインとして『Primitive Shader』を採用する」と発表した。
2000年に,最初のプログラマブルシェーダアーキテクチャが誕生してから,GPUの進化とともに頂点パイプラインには,「頂点シェーダ」に「ジオメトリシェーダ」,「テッセレーションステージ」(※ハルシェーダ,テッセレータ,ドメインシェーダの3つをまとめた呼び名)が追加されてきたわけだ。しかし,場当たり的な機能拡張によって活用方法が難解で,性能も出しにくいというやっかいものに成り下がってしまっている。
頂点パイプラインが2009年に現在の形になってから,もう11年が経つのだが,いまだにほとんどのゲームにおけるグラフィックスエンジンは,頂点シェーダ以外活用していない状態なのだから大問題だ。現行世代のPS4やXbox One,Switchはもちろんのこと,最新のPC用GPUにおいても,ある意味デッドウェイト的な,誰も使わない機能となっているのだから。
そこで,この状況を打開すべく,AMDは2017年にPrimitive Shader(関連記事)を,NVIDIAは2018年に「Mesh Shader」(メッシュシェーダ,関連記事)を発表したのだが,当然,これは規格化戦争に発展した。
そしてMicrosoftは,業界標準のDirectX(Direct3D)にNVIDIA案のMesh Shaderを採用。当然,Xbox Series Xもこれを利用できる。おそらくだが,AMDが2020年末までに発表する「Navi 2X」ベースのPC向けRadeon GPUも,Mesh Shaderに対応する可能性は高い。なにしろ,当のAMDからしてPrimitive Shaderのサポートをやめてしまい(関連リンク),ゲーム開発者が使える機能として提供したことは一度もなかったからだ。
そんなお蔵入り状態となったPrimitive ShaderをPS5が採用すると発表したことは,ある意味で業界に驚きを与えた。これについて筆者は,SIEに問い合わせをかけているものの,今のところ「いずれしかるべきときに解説する」という回答しか得られていない。
なにか理由があるとは思うが,PS5が採用する頂点パイプラインが,業界標準から外れてしまったことのインパクトは大きい。頂点パイプラインの仕組みは,ゲーム開発者に対して,3Dモデルのデザインにおける方法論や,データの持ち方に対してある種の変革を要求するからだ。DirectX 11世代GPUに追加された「テッセレーションステージ」が,11年経った今でもほとんど活用されていないのは,ゲーム開発者側がその変革を受け入れなかったためでもある。つまり,「PS5がMesh Shaderを採用しなかったこと」が問題なのではなく,MicrosoftとSIEで足並みが揃わなかったことが気になる点と言える。
もしかしたら,Primitive ShaderもMesh Shaderも積極的に使われることなく,この先も頂点シェーダ以外活用されない状態が,さらに続くことになるかもしれない。
この点ばかりは,さすがに筆者も予想はできなかった。Cerny氏はオンラインイベントの中で,ゲーム開発者がある世代のゲーム機におけるタイトル開発に慣れ親しむまでの期間について,「PS5は歴代最短になるだろう」とアピールしていたが,この新頂点パイプラインの取り扱いについてゲーム開発者がどう取り組んでいくかは,注目すべきポイントになると思う。
メモリシステムはコストが安いGDDR6に
次はPS5のメモリシステムについてだ。
容量についての予想は,16GBで,ドンピシャの正解だった。もっとも,これは予想の難度としてそれほど高いものではない。ゲーム機が採用するOSなどシステム部分の進化を踏まえて,なおかつ,昨今の4K前提で開発するハイエンドPCゲームタイトルのメインメモリとグラフィックスメモリの使い方を見れば,16GBという値に落ち着くことは妥当な路線だったからだ。
筆者は,PS5のメモリシステムについて,「HBMとGDDR6のハイブリッド構成になる可能性がある」と述べつつも,「コストに妥協すれば,16GBのGDDR6という選択もあり得る」と予想したが,正解は後者のほうだった。
このような結果になった第1の原因は,HBM自体の価格や実装技術のコストが,想定していたほど下がらなかったことだ。そして,もう1つの原因には,Cerny氏らがPS5にかけるハードウェアコストの振り分けを,後述するSSDに大きく割いたからではないかと考えている。
ただ,性能の違うメモリを組み合わせて使うハイブリッドメモリシステムという筆者の予想は,Xbox Series Xの方で「かする程度」に当たったのが面白い。Xbox Series Xでは,容量16GBのGDDR6メモリのうち,10GB分はPS5のメインメモリと同じメモリクロック14GHz,メモリインタフェース320bitで動作するが,残り6GBは192bitのメモリインタフェースを採用しているため,メモリバス帯域幅が40%ほど狭くなっているのだ。
Microsoftの説明によると,この6GB分は,それほど高速性を求められない用途に使われるそうで,そのうち2.5GB分は,OSなどシステム用途で利用されるとのことである。
お詫びと訂正:掲載当初,6GB分はメモリクロックが8.4GHzと記載しておりましたが,正しくはメモリインタフェースが192bitでした。お詫びして訂正いたします。
予想の斜め上を行っていたPS5のSSDアーキテクチャ
ストレージシステムに関する予想はどうだったろうか。
まず光ディスクドライブについて,筆者は1年前の記事で「BDXL対応ドライブを搭載」し「4K Blu-rayことUltra HD Blu-rayの再生にも対応する」と予想したが,これは的中した。
この部分は,PS4 Proに対する予想で外していたポイントだったので,的中することを願うというよりも,「いい加減搭載してくれ」という気持ちが強かった。かつてのPS3が,「ドルビーのシアターデモルームでも使われるほどの高信頼性Blu-rayプレイヤー」となっていたように,PS5では「Ultra HD Blu-rayプレイヤーの名機」となってくれることを期待したい。
さて,本題のアプリケーション用ストレージの話に入ろう。
1年ほど前にSIEは,「次世代PSでSSDを採用する」ことだけを予告していた。これを受けて筆者は,1年前の予測記事で「SSDをキャッシュとして利用し,HDDも併用するようなハイブリッドストレージ構成とするのではないか」と考えたのだが,こればかりは予想が外れたどころか,SIEは,予想の斜め上を行くと言ってもいいほどすごいものを採用してきたのだ。
詳細は,PS5の解説記事前編を参照してほしいが,PS5では,SSDをSoC内蔵のカスタムI/Oユニットと組み合わせることで,SSD上の圧縮データを仮想メモリのようにアクセスできるシステムを実現していたのだ。ここは,PS5の設計においてCerny氏の最もこだわったポイントだったそうで,たしかに説明を聞くと天才の業といった印象を受ける。
ただ,内蔵SSDの記憶容量は,コスト優先の据え置き型ゲーム機に搭載するものとしては,随分と大きな825GBだった。1年前の予想記事で,PS5のSSDは約1TBになると,筆者は予想できなかった。おそらく,Cerny氏にとってPS5のSSDは,GPUにおける理論性能値の高さを追求するよりも優先すべき項目だったに違いない。
結局,SSDがらみで筆者が当てたのは,「接続インタフェースは,PCI Express Gen 4ベースとなるだろう」という部分だけであった。
サウンド機能は予想どおり,オブジェクトベースオーディオ技術対応に
PS5におけるCerny氏のこだわりといえば,サウンドシステムも挙げられよう。詳細は解説記事後編を参照してほしいが,SIEは,オーディオプロセッサ的に活用できるようにGPUにDSP的なストリームプロセッサ構造としたカスタム版Compute Unitを搭載して,HRTF(Head-Related Transfer Function,頭部伝達関数)ベースの音像定位処理を実現する「Tempest 3D Audio」技術をPS5に搭載したのだ。
1年前にCerny氏は,「PS3からPS4で,サウンド関連の機能は変わりばえしなかった。PS5では,これが大きく変わる」「PS5では,ヘッドフォンでサウンドを聴くのが最良の体験となるかもしれない」と述べていたことから,筆者は「PS5では,オブジェクトベースオーディオ技術に対応するのではないか」と予想したが,これもずばり的中したわけだ。
同じソニーグループが開発を進めている同系技術の「360 Reality Audio」を導入するのではないか,というところまでが筆者の予想だったが,ここは今もはっきりしていない。Cerny氏の口ぶりからすると,Tempest 3D Audio技術はSIE独自で開発を進めているものという印象を抱く。
解説記事後編で説明したTempest 3D Audio Engineの動作を,もう少し分かりやすい図にしてみた。
まず,素材となる音は,高速フーリエ変換(FFT)によって周波数領域に変換される。音源が速度を持って動いている場合,移動元の「HRTF START」(移動元の始点座標におけるHRTF)と移動先の「HRTF END」(移動先の終点座標におけるHRTF)をHRTFデータベースから取り出して,素材の音をHRTF STARTとHRTF ENDでそれぞれ変調する。変調後の音は,仮に始点音,終点音と呼ぼう。
そして,音源の移動に合わせて始点音を鳴らしながら終点音に近づくように,
なお,2020年1月に行われたCES 2020で受けた説明によると,360 Reality Audioは,ソニー純正のヘッドフォンおよびイヤフォンに限定したソリューションであるという。そうなると気になるのは,PS5のTempest 3D Audioを体験できる機器が,SIE純正品だけになったりはしないかという点だ。
実際,PS4にはそういう制限があった。PS4の場合,SIE純正のサラウンドヘッドフォン(※CUHJ-15005,CUHJ-15007J2,CUHJ-15007J3の3機種)以外では5.1chや7.1chのサラウンドサウンドを出力できず,USB接続型サウンドデバイスは2chのステレオ出力のみに限定されていた。そのため,サードパーティ製のUSB接続型ヘッドフォンやサウンドデバイスは,すべて2ch音源を元にしたバーチャルサラウンドサウンドとなってしまう。
そんな実例があるので,PS5のTempest 3D Audioが,PS5純正のサウンドデバイスでしか使えない機能になるかどうかは分からない。純正品以外のサウンド機器でも,Tempest 3D Audio技術を利用できることを期待したい。
次世代PSVR対応は,HDMI出力×2ではなくVirtualLinkを採用する可能性も
たとえばゲームパッドだ。4月8日にSIEは,PS5世代の純正ゲームパッドとして「DualSense」を発表したが,重要な新要素であるハプティック技術やアダプティブトリガーをどのようにして実現したのかについては明らかにしていない。
筆者は,PS5の純正ゲームパッドに使われる可能性のある技術として,アルプスアルパイン(旧アルプス電気)の「ハプティックリアクタ」や,磁性流体技術を用いるのではないかと予想したことがある。だが,これらについての答え合わせは,もうちょっと先になりそうだ。
同様にインタフェース周りについては,筆者が予想したHDMI 2.1対応と120fps表示対応はずばり的中した。しかし,次世代のPlayStation VRをスマートに接続するためのHDMI出力×2搭載は,インタフェースのラインナップが明らかになっていないので,答え合わせも先送りだ。
もっとも,HDMI出力の2系統搭載は,筆者の個人的な願望を含む予想であり,可能性は最初から低いと見ている。というのも,USB Type-Cを利用して汎用データも映像音声などのメディアデータもケーブル1本で伝送できる規格「VirtualLink」が存在するからだ。
HDMIインタフェースは,機器に搭載する端子の数に対して特許料が発生するので,ゲーム機メーカーはこれを嫌う傾向にある。かつてのPS3において,スペックとして公開された「HDMI×2」がキャンセルとなったのも,このあたりの事情が影響していた。一方,VirtualLinkはオープンスタンダードなので,採用自体に高いコストはかからない。
いずれにせよ,PS5の背面I/Oインタフェース部の公開が待ち遠しいところである。
PlayStation公式のPS5情報ページ
- 関連タイトル:
PS5本体
- この記事のURL: