ニュース
1枚の画像から探索可能な3Dワールドを生成できるAIモデル「Genie 2」発表。命令に合わせ自動的にゲームをプレイする「SIMA」との連携も
※画像は発表ページ(外部リンク)より
Introducing Genie 2: our AI model that can create an endless variety of playable 3D worlds - all from a single image. ??
— Google DeepMind (@GoogleDeepMind) December 4, 2024
These types of large-scale foundation world models could enable future agents to be trained and evaluated in an endless number of virtual environments. →… pic.twitter.com/qHCT6jqb1W
Genie 2は,プレイヤーの入力を受け取り,それに合わせて次のフレームをシミュレートするものだ。移動だけでなく,キャラクターのジャンプや,扉を開けるといった動作も再現できる。
また,火山の煙や海流などの表現に加え,ドラム缶を撃つと爆発するなど,オブジェクト同士の相互作用も表現可能だ。
3Dゲームをリアルタイムにまるごと生成する「GameNGen」が発表される。「DOOM」を“移植”ではなく“生成”する時代へ
Google Researchの研究員ら4名は2024年8月27日,ニューラルモデルのみを搭載したゲームエンジン「GameNGen」を発表した。従来のゲームエンジンを一切使用せずに,プレイヤーの入力に合わせ「DOOM」をリアルタイムに描画できる。
Genie 2は,画面外に行ったワールドについても記憶しておくことができ,視点を動かして再び画面に映る時に,同じものを正確に再現できる。
これは最大1分間にわたり,一貫したワールドを構築できるそうだ。
言語で指示すると,その指示に合わせてエージェントがゲームをプレイしてくれる「SIMA」との連携も発表された。
Genie 2で生成した3D空間で,「階段を上ってください」「青い扉を開けてください」といった命令をすると,SIMAはそれをうけ,自動的にキャラクターを操作する。
SIMAを使うことで,Genie 2で生成したワールドの評価を自動的に行うワークフローも構築可能だ。
Google DeepMindの3D仮想環境向け汎用型AIエージェント「SIMA」とは?[CEDEC 2024]
2024年8月21日,ゲーム開発者向けカンファレンス「CEDEC 2024」で,セッション「SIMA: Developing General AI Agents with Video Games/SIMA:ビデオゲームを用いた汎用型AIエージェントの開発」が行われた。その内容をレポートする。
Google「Genie 2: A large-scale foundation world model
- この記事のURL: