企画記事
進化したAIは,我々を「缶詰」のようなゲームから解放できるか
いつのころからかオープンワールドという言葉は,プレイヤーの間では「缶詰製品」の代名詞になりつつある。
ただただ退屈で繰り返すだけのクエスト,広いだけで中身のないマップ,目新しさに欠けるストーリー……流れ作業で作ったような匂いがぷんぷんするゲームも少なくない。
このような現象が起こる原因を探ってみると,オープンワールドの「無限性」と開発陣の知力,体力,資金などの「有限性」の間に存在する,越えられない障壁というものに気付く。
技術の進歩につれて,AIやアルゴリズムの開発を使って“缶詰度合い”を下げようと試みる企業が現れはじめている。しかし多くの場合,これらのアプローチは逆効果になってしまっているのが現実だ。
なぜなら,アルゴリズムによってランダムに生成されたキャラクターやクエスト,ストーリーなどは,見た目が違えど本質的には同じもので,組み合わせた要素が違うだけという当たり前のことにプレイヤーは気付いてしまうからだ。
しかし,ChatGPTなどの新世代AIの登場により,AIの技術は急速に進化して,状況は本当に変わり始めているようだ。
リアル「ウエストワールド」?
進化したAIは,会話テキストを生成するような雑用だけでなく,NPCを操作して“ウエストワールド”のようなリアルなAI社会を構築できると分かった。
最近披露された「Living Chang'an City(生きた長安)」という技術デモは,その一部を実現している。
このデモにあるNPCの会話や動きは,事前に設定されたものではなく,AIによってリアルタイムで生成されている。NPCのやることは,事前に設定されたキャラクターの個性と行動目標から外れない範囲で制御されている。サボりたい一心で働く役人や,ナンバーワンになりたい踊り子など,そういった感じのものだ。
今回お披露目された「生きる長安」はまだ進行中の社会で,流されたデモ動画は社会の誕生から30日間の記録となっている。裏にあるのは,GAEA(ガイア)という技術だ。
GAEAによって動いているAIが,ストーリーラインに基づいて設計されたほかのNPCと最も大きく違うところは,自分自身の目標や行動理由を持ち,現実の人間のように社会の常識や(同じ環境にいるほかのキャラクターやプレイヤーなどからの)外部フィードバックの影響を受けることだ。
もしプレイヤーにまた話しかけられても,いくつかの同じセリフを繰り返すだけで,プレイヤーの成長や変化に応じてリアクションを取らない(取れない)のだ。
「生きる長安」はGAEAを応用することで,NPCの行動はNPC仲間の影響を受け,周りの環境や社会に応じて変化することを可能にした。前者は「ソウルシステム」と呼ばれ,後者は「環境システム」と呼ばれる。
一方で「環境システム」によって,NPC達が行ったすべての動きはシステムに記録され,システムへのフィードバックデータになる。NPCの足跡が残るこのシステムは,NPCに対して動的なお返しをするのだ。こうして,周りの社会環境に対してリアルな相互関連があるNPCの行動は,より合理的に人間ぽくなる。
確かに画期的な技術であることは認めるが,プレイヤーの立場からすると,このような「持続成長」な動的な世界は,味気ない缶詰ゲームから本当にプレイヤーを救い出せるのだろうか。
この問題に答えるにはまず,「缶詰」現象頻発の被災地としてどんなゲームがあるのかを明白にする必要があるだろう。
AIと「缶詰」が出会うとき
現在世に出た「オープンワールド」のゲームは,大きく2つのタイプに分けられる:
(1)決まったルールに従い,システムによって自動生成されるオープンワールド。代表作は「Minecraft」や「テラリア」
(2)デベロッパにデザインされた固定のオープンワールド。代表作は「GTA」や「アサシンクリード」
前者のゲームは,メインストーリーというものがほとんどなくて,プレイヤーによるワールド探索と体験創造がメインとなる。後者のゲームは,ストーリーがメインの構成要素となり,メイン+サイドのストーリーで物語が進んでいく。
こういう問題を解消するために,人が作業するという以外にも,AIを導入することで作業を軽減するという試みも,あるにはあった。
2020年に発売されたユービーアイソフトのオープンワールド型アクションゲーム「ウォッチドッグス レギオン」は,似たようなAIジェネレーションシステムを利用している。
人工知能のアルゴリズムの元で,出身・背景・名前などのディテールまで持つ多種多様なリクルート可能なNPCが生まれた。ユービーアイソフトはそれを「Play as Anyone」(どのキャラクターでもプレイできる)というコンセプトにして高く掲げた。
[GDC 2021]「ウォッチドッグス レギオン」の“ロンドンの人々の誰もが主人公”となるゲーム性を支え,その世界における“社会”を築いたAIシステム・Census
「ウォッチドッグス レギオン」の特徴である“ロンドンの人々の誰もが主人公”となるゲーム性を支えたのが,街の人々の年齢や性別,見た目だけではなく,日常生活のルーティンまでも自動生成するAIシステム・Census(センサス)だ。NPCの人間関係による社会も構築した同システムが解説されたGDCのセッションレポートをお届けしよう。
キャラクターを生成する時,キャラクターの人種,給与,社会関係と勤務地などのデータのほか,ユービーアイソフトは各要素が影響し合うようにできるシステムにした。
これらのデータの連鎖で,一人のキャラクターは何時にどこで仕事をして,仕事が終わったらどこで何をやるのか,などの日常生活が,ロジック的に破綻なく完結できるのだ。
逆にもしプレイヤーが彼らに手助けをしたならば,彼らのDedsecに対する好意は高まり,組織に参加するようになる。
そして,ランダムな事件でキャラクターの行動を変える可能性もある。あるキャラの家族が殺された場合,そのキャラクターは家族と旅に出る予定をキャンセルし,代わりに愛する人を弔うために墓地へ行くのだ。
こうして見ると,ゲーム内のすべてのキャラクターはリアルな人のように,動的に豊富な感情を備えるようになった(せめて,備えているように見える)。冒頭で触れた「生きた長安」のデモと比べても,このようなロジックは合理的で,リアルタイムに変化する動的なAIシステムは,技術においては似たような設計ロジックをシェアしていることが分かる。
こんな素晴らしいシステムを導入したにも関わらず,どうして「ウォッチドッグス レギオン」は缶詰風に見えてしまうのだろう。
変量と定数
もしかしたら本当の問題は,プレイヤーが求めているものが現実とそっくりなバーチャルなのではなく,このバーチャルな世界で“想定外”と“非日常”を見たいというところかもしれない。
さし障りのない現実の退屈さに辟易しているからこそ,プレイヤーは目新しさを求めてゲームにのめり込んでいく。それに対してAIが提案できる合理性というのは,現実にある定数をシミュレーションするまでだ。
この定数に一例を出してみると,サラリーマンの一日は,朝起きて,歯磨きなどの支度を終え,電車に乗って出勤して数時間を仕事に費やして,家に戻ってご飯を食べて,最後にまた身の回りの支度をして寝る。
この何気ない平凡な一連の活動こそが,現実にある定数である。
いまゲームで運用されているAIシステムはせいぜい,こういうルーティンのような定数に沿って合理的に見えるものを作り出し,明らかな不自然さを減らすだけだ。定数の反対にある現実での変量は,偶然で,確率は低いが,おっと思わせる事件だ。
「ウィッチャー3」で,ゲラルトが依頼を受けてモンスターを退治するのは「バイトで働く」のような定数だ。ただゲラルトは,いつもその定数の中に,奇妙もしくは神秘的な,また感動的な“邂逅”を引き起こす。
これこそが,プレイヤーの心を動かす変量だ。
問題は,AIを使ってこのような低確率の「奇想天外」な出来事をシミュレートするのは容易ではないということだ。
というのも,ChatGPTのようにテキストデータを大量に使って学習するAIであっても,人間からもらえるベースとなる知識そのもののほとんどは,平凡なものでしかないからだ。
それらのテキストの中に,公式のような定型文が定数で,シェイクスピアのような,狂気が人の心を打つような作品は,希少的な変数となる。
「中を取ると,下しか得られず」※という言い伝えがあるように,優秀なデータが希少な状況においては,AIがどうやってクリエイティビティあふれるプロットを生成できるというのだろうか。
※唐の太宗が記した「帝範」の最後に書かれた一句,「夫れ法を上に取らば。僅かに中を為すことを得ん。法を中に取らば。故より其れ下と為らん。上徳に非ざるよりは,効ふ可からず焉。」
いやそこまで言うのなら,AIの力を借りて「缶詰ゲーム」から脱出するのは,本当に実現不可能なんだろうか。
そうとは限らない。
希少性と創発的能力
人工知能の発展は,現実の歴史の流れ同様、ある種の「創発(Emergent)」が存在する。創発とは,量的変化が質的変化を開花させるタイミングだ。
例えば無生命の原子の集まりは分子になり,やがて生きた細胞になることがある。水の分子がある数までたまると波が発生する。
同様に,ChatGPTのようなAIモデルにとっても,パラメータが多ければ多いほど,連結する能力が高くなる。パラメータをある程度蓄積させれば,驚異的な知能を生み出せる可能性も持っている。
大規模言語モデル(LLM:Large Language Models)においての創発的能力とは,元の訓練データから自動的に学習し,物事の特徴やパターンをまとめることにより,新しい発見をより高いレベルで行える能力のことだ。
大規模言語モデルをトレーニングする時,マルチモーダルの学習データを大量に食わせて,データの統計をとり,内部パラメータや構造,法則をまとめ,汎化する能力を身につける。そして進化したモデルを,またほかのマルチモーダルデータに応用する。それを行ううちに,徐々に何らかの新しい能力や特性が現れてくる。
そしてこれこそが,大規模言語モデルが人間に近づき続けている特徴である。
外部サイト:Emergent Abilities of Large Language Models
ではこの「創発」で,我々を「缶詰」のようなゲームから解放できるのだろうか。
ここまでくると,上記で少し触れた変量という概念に行きつく。現実的に考えると,ほとんどの人の人生においては,本当に人生を変え,運命を変えるような変数が現れる瞬間は,きわめて少ない。我々の人生の大半は,波瀾のない「定数」の中で生きているのだ。
でも目線を遠くに置いて,時間軸を大きく引き伸ばせば、希少な変量は定数から湧き上がる。
定数でベースを重ねなければ,それを元にした変量が現れることはなく,無数の定数から創発する変量も,私たちの言葉や行動の決定の蓄積を元に出てきたものだ。
より広いディメンジョンでいうと,重要な科学発見や帝国の興亡,革命,戦争など,人類史にある偉大な変量もまた,定数の蓄積から生まれる。
このような広い時空の中,劇的な変量が引き起こす驚きや,波乱万丈な紆余曲折をシミュレーションするには,人類の有限な思考能力を超えている。なぜなら,こうした変量を創発するのに必要な定数は巨大すぎて,もはや人の脳の容積を超えているのだ。
しかし人間ができないからと言って,AIができないわけではない。
ChatGPTのようなAIは,進化を続ける統計・学習能力によって,膨大なデータから定数をシミュレーションし,計算し,様々な可能性のある変数を導き出すことができるかもしれない。
その能力をオープンワールドのプロットデザインに生かすと,どのような人物や出来事が推移を経て「驚き」や「非日常」として浮かび上がってくるか,AIが知るのかもしれない。そしてこうした「驚き」や「非日常」が集まったとき,重複の“缶詰”から離れた,伝説と変化に満ちたゲーム世界が生み出される。
しかし,本当にAIがそこまで到達してしまったら,ゲームデザインとして使われるのはちょっと役不足かもしれない。(著者:举大名耳)
- この記事のURL: