advertisements

Google DeepMind、AIワールドモデル「Project Genie」を米国で展開開始

[更新]2026年1月31日

Google DeepMind、AIワールドモデル「Project Genie」を米国で展開開始

Google DeepMindは2026年1月29日、インタラクティブな世界を作成・探索できる実験的研究プロトタイプ「Project Genie」を発表した。

1月29日(現地時間)より米国のGoogle AI Ultraサブスクライバー(18歳以上)向けに展開を開始し、順次他地域にも拡大する。Project GenieはGenie 3、Nano Banana Pro、Geminiを搭載したWebアプリで、ワールドスケッチング、ワールド探索、ワールドリミックスの3つのコア機能を持つ。ユーザーはテキストや画像を用いて環境を生成し、リアルタイムで移動・相互作用できる。

なお、2025年8月の発表時に紹介された「探索中に世界が変化するプロンプト駆動イベント」などの高度な機能については、現段階のプロトタイプでは体験できる範囲が限定されている。

From: 文献リンクProject Genie: Experimenting with infinite, interactive worlds

【編集部解説】

このProject Genieの一般展開は、Google DeepMindが掲げるAGI(汎用人工知能)への道筋におけるマイルストーンとなります。

ワールドモデルとは、環境のダイナミクスをシミュレートし、行動がどのように影響を与えるかを予測するAIシステムです。従来、Google DeepMindはチェスや囲碁といった特定環境でのAIエージェント開発に注力してきましたが、真のAGI実現には、現実世界の多様性をナビゲートできるシステムが不可欠とされています。Genie 3は、その足がかりとなる技術として位置づけられています。

注目すべきは、この技術が約半年という短期間で研究室から一般ユーザーの手に届いたという事実です。Genie 3は2025年8月5日に限定的な研究プレビューとして発表され、当時は学術研究者とクリエイターの小さなコホートにのみ提供されていました。それが2026年1月29日、Project Genieとして月額249.99ドル(1ドル=150円換算で約3万7500円)のGoogle AI Ultraサブスクライバー向けに展開されました。

この価格設定は、OpenAIのChatGPT Pro(月額200ドル)を上回る設定となっており、計算コストの高さを物語っています。生成された世界は720p解像度、24fpsで動作しますが、セッションは60秒に制限されています。この制約は技術的限界を示すものですが、リアルタイムで一貫性のある世界を生成し続けるという計算負荷の大きさを考えれば、現時点では妥当な設計判断といえます。

技術的な観点から見ると、Genie 3の真価は「自己回帰的」なアプローチにあります。従来の3D表現手法(NeRFsやGaussian Splatting)とは異なり、Genie 3はフレームごとに世界を生成し、過去の環境と行動を記憶することで一貫性を保ちます。この「創発的な一貫性」により、数分間にわたって環境を維持できるのです。

ゲーム産業への影響も看過できません。The Register紙が指摘するように、この技術は既に苦境に立たされているゲーム開発者たちにとって新たな脅威となる可能性があります。一方で、Unity Technologiesは2018年にDeepMindとの協業を発表し、AI研究向けの仮想環境やタスク開発で連携してきました。こうした流れの中で、ゲーム分野でも生成AIの活用が広がっています。

ただし、実用化までの道のりは平坦ではありません。現時点では、キャラクターの制御が不安定であったり、テキストレンダリングに課題があったり、現実世界の地理的位置を正確にシミュレートできないといった制約があります。また、2025年8月の発表時に言及された「探索中に世界を変化させるプロンプト可能なイベント」といった機能は、まだプロトタイプには実装されていません。

より本質的な課題は、持続時間です。AIエージェントの訓練には数時間の連続した相互作用が必要ですが、現在のGenie 3は数分しか持続しません。DeepMind自身が認めるように、この技術が真に有用となるには、シミュレーションを数時間単位で維持できる必要があります。

それでも、この技術が示唆する未来は魅力的です。教育分野では古代ローマを探索する歴史学習、ロボティクス分野では安全な環境での自動運転車の訓練、クリエイティブ分野では新しい形態のインタラクティブストーリーテリングなど、応用可能性は広範囲に及びます。

Project Genieは、生成AIが「見るだけ」のコンテンツから「体験する」コンテンツへと進化する転換点を示しています。今後、持続時間の延長、安定性の向上、クリエイターへのより細かい制御の提供が実現すれば、ゲームエンジンと生成動画の中間に位置する全く新しいコンテンツパイプラインが誕生する可能性があります。

【用語解説】

AGI(汎用人工知能)
Artificial General Intelligenceの略。特定のタスクに特化したAIではなく、人間と同様にあらゆる知的作業を遂行できる汎用的な人工知能を指す。現在のAIは特化型であり、AGIの実現は長期的な研究目標とされている。

ワールドモデル
環境のダイナミクスをシミュレートし、環境がどのように進化し、行動がどのように影響を与えるかを予測するAIシステム。AIエージェントの訓練や、インタラクティブな環境生成に活用される。

自己回帰的
過去の出力を入力として次の出力を生成する方式。大規模言語モデル(LLM)と同様の仕組みで、Genie 3では前のフレームとユーザーの行動に基づいて次のフレームを生成する。

NeRFs(Neural Radiance Fields)
ニューラル放射輝度場。3D空間を表現するAI技術の一つで、複数の2D画像から3D環境を再構築する。静的な3D表現を得意とする。

Gaussian Splatting
3D環境を高速にレンダリングする技術。NeRFsと比較して高速だが、いずれも明示的な3D表現を必要とする点でGenie 3のアプローチとは異なる。

【参考リンク】

Google DeepMind(外部)
Googleの人工知能研究組織。AGI実現を目指し、Genie 3やGeminiを開発。

Genie 3 – Google DeepMind(外部)
Genie 3公式ページ。汎用ワールドモデルの技術詳細と実例を紹介。

Google AI Ultra – Google One(外部)
月額249.99ドルの最上位AIプラン。最先端AIツールと30TBストレージを提供。

OpenAI(外部)
ChatGPTを開発するAI研究組織。月額200ドルのChatGPT Proを提供。

Epic Games(外部)
Unreal Engine開発企業。DeepMindとGenie 3統合の研究パートナーシップ。

Unity Technologies(外部)
Unity Engine開発企業。AI支援レベルデザインの可能性を探索中。

【参考記事】

Genie 3: A new frontier for world models — Google DeepMind(外部)
2025年8月5日発表のGenie 3公式記事。720p、24fpsでリアルタイム生成可能で、数分間の一貫性を保つ技術仕様を詳述。

Google’s Project Genie turns prompts into interactive worlds • The Register(外部)
月額249.99ドルで展開されたProject Genieの60秒生成制限やキャラクター制御の課題など技術的制約を詳報。

Google DeepMind’s Genie 3 can dynamically alter the state of its simulated worlds(外部)
Genie 2との比較を詳述。Genie 2は360p解像度で理論上60秒の限界、Genie 3は数分間の一貫性実現。

Google’s Project Genie lets you generate your own interactive worlds(外部)
Project Genieがゲームエンジンでないことを明確化。Nano Banana Proモデルによる画像生成機能を解説。

DeepMind Says The Newly-Released Genie 3 World Model is a Critical Milestone Toward AGI(外部)
研究ディレクターの発言を引用し「初のリアルタイムインタラクティブ汎用ワールドモデル」と位置づけ。

The promise and limitations of DeepMind’s Genie 3(外部)
Genie 2のメモリ約10秒に対し、Genie 3は最大1分間の記憶保持可能。自己回帰的アーキテクチャの詳細解説。

Google DeepMind’s Genie 3 Could Be the Virtual World Breakthrough AI Has Been Waiting For(外部)
Epic Games、Unity Technologiesとの研究パートナーシップでレベルデザイン時間70-80%削減の可能性を示唆。

【編集部後記】

「想像した世界を、自分で歩き回れる」――この体験が月額約250ドル(約3万7500円、1ドル=150円換算)の価値を持つ時代が、すでに始まっています。注目されるのは、60秒という制約の中に秘められた可能性です。完璧な仮想世界ではなく、リアルタイムで生成され続ける「生きた環境」という発想は、ゲームとも映像とも異なる新しいメディアの誕生を予感させます。

みなさんは、この技術が数年後にどんな形で日常に溶け込んでいると思いますか?AGIへの道筋として語られるこの技術が、私たちの創造活動をどう変えていくのか、一緒に見守っていければと思います。

投稿者アバター
omote
デザイン、ライティング、Web制作を行っています。AI分野と、ワクワクするような進化を遂げるロボティクス分野について関心を持っています。AIについては私自身子を持つ親として、技術や芸術、または精神面におけるAIと人との共存について、読者の皆さんと共に学び、考えていけたらと思っています。

読み込み中…

innovaTopia の記事は、紹介・引用・情報収集の一環として自由に活用していただくことを想定しています。

継続的にキャッチアップしたい場合は、以下のいずれかの方法でフォロー・購読をお願いします。