General Intuition、3億ドル調達へ|OpenAIが5億ドルで欲しがったゲームデータでAIエージェントを育てる

AIエージェントの訓練に必要なのは、テキストでも観客視点の動画でもなく、「操作したデータ」だという考え方が広がっています。ワールドモデルを製品として売るのか、エージェント訓練の場として使うのか——その設計上の選択が、次世代AI競争の構造を変えつつあります。ゲーム動画がなぜいまAI業界の中心資産になっているのか、その理由をこの記事で読み解きます。


ニューヨーク拠点のAIスタートアップGeneral Intuitionは、約3億ドルの資金調達に向けた交渉を行っている。評価額は20億ドル強となる見込みだ。出資者にはJeff BezosとEric Schmidt、既存投資家のKhosla VenturesとGeneral Catalystが名を連ねる。

同社はゲームクリップ共有プラットフォーム「Medal」から2025年10月にスピンアウトした。創業の背景には、OpenAIが2024年末にMedalを5億ドルで買収しようとした経緯がある。創業者Pim de Witteはこれを拒否し、独立を選んだ。

同社の中核資産はMedalのデータセットで、1,000万人以上の月間アクティブユーザーが生成する年間約20億件のゲーム動画クリップから構成される。一人称かつインタラクティブという点でYouTubeやTwitchの映像と異なり、空間推論や意思決定のデータを豊富に含む。同社はこのデータでワールドモデルを訓練し、エージェントを開発する方針を取る。今夏後半から秋初めにかけてプロダクトをリリースする計画と報じられている。

From: 文献リンクGeneral Intuition is raising $300 million to train AI agents on the video game data OpenAI tried to buy|The Next Web

【編集部解説】

General Intuitionという社名は、ゲームで培われた直感的な空間把握をAIに移植したい、という創業者の意図を反映しているように読めます。しかし今回の調達で注目すべきは金額や投資家の顔ぶれよりも、この会社が選んだ設計上の立場です。

ワールドモデル競争は2026年に入って急速に過熱しています。Runway、Decart、World Labs、Odyssey AIといったスタートアップが相次いで大型調達を行い、「AIは言語だけでなく物理法則を理解しなければならない」という共通テーゼのもとで各社がしのぎを削っています。この分野では、仮想空間をいかにリアルに再現できるか、すなわちワールドモデルそのものの品質が問われてきました。

General Intuitionはこの競争に別の角度から参入しています。同社がワールドモデルを構築するのは、それを製品として販売するためではありません。ワールドモデルはあくまでもAIエージェントを訓練するための環境であり、市場に届けるのはエージェント自体だという立場をとっています。この違いは小さく見えますが、ビジネスモデルの根幹に関わります。シミュレーション環境を販売する企業の収益は、仮想シーンの再現精度に依存します。一方、エージェントを販売する企業の収益は、そのエージェントが実際のタスクで何をどこまでできるかに紐付きます。評価される指標が異なり、求められる開発の優先順位も変わってきます。

この設計思想を支えているのが、Medalのデータセットです。年間約20億件のゲーム動画クリップ、月間1,000万人以上のアクティブユーザーが生成するこのデータは、競合他社が持ちえない性質を備えています。YouTubeやTwitchの配信映像は観客視点ですが、Medalのクリップは一人称かつインタラクティブです。プレイヤーが実際に操作した入力と、その結果として展開した映像がセットで記録されています。これはAIに空間推論を学習させるうえで質的に異なるデータです。観ることと動かすことの差、と言い換えてもよいかもしれません。

同社の技術的な基盤となっているのが、共同創業者のEloi AlonsoとVincent Micheliらが開発したDIAMOND(DIffusion As a Model Of eNvironment Dreams)です。これは将来のフレームをトークンに圧縮するのではなく、拡散モデルを使って直接予測するワールドモデルで、2024年のNeurIPS(神経情報処理システム学会)でスポットライト論文に選ばれました。Atari 100kベンチマークでは当時最高水準の平均ヒューマンノーマライズドスコア1.46を記録しており、CS:GOのゲームプレイを学習してインタラクティブなニューラルゲームエンジンとして動作することも実証されています。この研究チームが、Medalの膨大なゲームデータと組み合わさったのが現在の同社の姿です。

OpenAIが5億ドルでMedalを買収しようとしたという事実は、ゲームの一人称インタラクティブ映像データが、業界全体から見て希少かつ価値のある資産だという認識が広がっていることを示しています。その取引を断り、データを手放さずに自社で研究開発を続けた結果、同社の評価額は今や提示された買収額の4倍に達しようとしています。データをコアに据えた独立戦略が、少なくとも現時点では市場から正当な評価を受けていると言えます。

参考までに競合の状況を整理しておきます。評価額53億ドルのRunwayは2025年12月に初のワールドモデル(GWM-1)を発表し、報道によれば四半期あたり4,000万ドルのARRを追加しています。報道では約50億ドルの評価額での調達と伝えられたWorld Labsが2月に10億ドルを調達。Odyssey AIはAmazonとAMD Venturesらの支援を受け3億1,000万ドルを調達し、Yann LeCunのAMI Labsはプレマネー評価額35億ドルで10億3,000万ドルを調達しました。

ただし、見通しには不確実な部分も残ります。今夏後半から秋初めのプロダクトリリースを目指しているとされますが、ゲームで培った空間推論がロボティクスや自律システムなど現実世界のタスクにどこまで転用できるかは、まだ公開された検証データが乏しい段階です。エージェントを製品にするという設計思想が商業的に成立するかどうかは、リリースされるプロダクトの中身によって初めて問われることになります。

【用語解説】

ワールドモデル(World Model)
AIが環境の物理法則や因果関係を内部でシミュレートするための仕組み。「この行動をとったら次に何が起きるか」を予測できるモデルで、テキスト予測を中心とする言語モデルとは異なり、空間・時間の動きを扱う。強化学習エージェントの訓練環境として使われるほか、それ自体を製品として販売するアプローチもある。

AIエージェント
与えられた目的に対して自律的にタスクを計画・実行するAIプログラム。ユーザーの指示を待って単発で答えるチャット型AIとは異なり、複数のステップを連続的に判断・実行できる。General Intuitionはこのエージェント自体を最終製品と位置づけ、ワールドモデルはその訓練手段として位置づけている。

DIAMOND(DIffusion As a Model Of eNvironment Dreams)
General Intuitionの共同創業者Eloi AlonsoとVincent Micheliらが発表した拡散ベースのワールドモデル。将来フレームをトークンに圧縮せず、拡散モデルで直接予測する設計が特徴。2024年のNeurIPS(神経情報処理システム学会)でスポットライト論文に選出。Atari 100kベンチマークで当時最高水準のスコアを記録した。

空間・時間推論(Spatial-Temporal Reasoning)
物体や行動者が空間の中でどのように動き、時間の経過とともに変化するかを推論する能力。テキストのみで学習した言語モデルが本質的に苦手とする領域であり、ゲームの一人称インタラクティブ映像はこの学習に適したデータとされる。

強化学習(Reinforcement Learning)
AIが環境の中で試行錯誤を繰り返し、報酬を最大化する行動を学習する手法。ワールドモデル内でのシミュレーション訓練により、現実環境のコストやリスクなしに大量の経験を積ませることができる。

【参考リンク】

General Intuition(外部)
本記事の主体企業。ゲーム動画データを活用したワールドモデルとAIエージェントの研究開発を行うニューヨーク拠点のAIスタートアップ。Medalから2025年10月にスピンアウト。

Medal(外部)
ゲームプレイのクリップを録画・共有するプラットフォーム。月間1,000万人以上のアクティブユーザーが生成する年間約20億件の一人称インタラクティブ映像データが、General Intuitionの中核資産となっている。

DIAMOND プロジェクトページ(外部)
General Intuition共同創業者らが発表した拡散ベースのワールドモデルDIAMONDの公式ページ。論文・コード・デモ動画・インタラクティブなゲームエンジンのサンプルを公開している。

【参考記事】

General Intuition in talks to raise $300M at around $2B valuation|TechCrunch(外部)
今回の資金調達を最初に報じたTechCrunchの記事。調達額・評価額・投資家・プロダクトリリース計画について情報源に基づいて詳報している。

General Intuition is raising $300 million to train AI agents on the video game data OpenAI tried to buy|The Next Web(外部)
OpenAIによる買収提案の経緯からエージェント対ワールドモデルという設計上の差異まで、同社の戦略的背景を詳しく分析した記事。ワールドモデル競争の全体像も整理されている。

Diffusion for World Modeling: Visual Details Matter in Atari(DIAMOND)|arXiv(外部)
General Intuition共同創業者らが発表した学術論文。拡散ベースのワールドモデルDIAMONDの技術詳細とAtari 100kベンチマーク結果を記載。NeurIPS 2024スポットライト論文。

【関連記事】

Odyssey「Agora-1」発表、最大4人が同じAI生成世界を共有するマルチエージェント・ワールドモデル
ワールドモデル競争において、General Intuitionとは異なるアプローチをとる企業もあります。Odysseyが発表した「Agora-1」は、ワールドモデルそのものをマルチエージェント共有環境として製品化した事例です。

フィジカルAIとエンボディドAI:「動く知能」と「知能が生まれる条件」をつなぐ2026年の転換点
ゲームデータで訓練したAIが現実世界のロボティクスや自律システムへ転用できるかという問いは、フィジカルAIの中心課題のひとつです。その構造的背景については下記記事で詳しく解説しています。

【編集部後記】

ゲームデータでAIを育てるという発想は、かつては傍流に見えていました。しかし「観るデータ」と「動かすデータ」の違いが本質的だとすれば、Medalが蓄積してきたものの意味は単なる量の問題ではありません。エージェントが製品になる時代に、私たちはどんな「動かすデータ」が世界に存在するかをあらためて問い直す必要があるかもしれません。

Googleで優先するソースとして追加するボタン
投稿者アバター
乗杉 海
SF小説やゲームカルチャーをきっかけに、エンターテインメントとテクノロジーが交わる領域を探究しているライターです。 SF作品が描く未来社会や、ビデオゲームが生み出すメタフィクション的な世界観に刺激を受けてきました。現在は、AI生成コンテンツやVR/AR、インタラクティブメディアの進化といったテーマを幅広く取り上げています。 デジタルエンターテインメントの未来が、人の認知や感情にどのように働きかけるのかを分析しながら、テクノロジーが切り開く新しい可能性を追いかけています。