Google DeepMindら5者、マルチエージェントAI安全性へ1000万ドル公募|創発リスクを世界の研究者と解明

あなたが使っているAIが、いつのまにか別のAIと会話し、交渉し、お金のやり取りまで始める——そんな世界が、もう目前に迫っています。数百万のエージェントが絡み合うとき、誰も設計していない「集団の振る舞い」が突然生まれるかもしれません。この見えないリスクに先手を打とうと、Google DeepMindが大型の研究公募に乗り出しました。


Google DeepMindは2026年6月11日、Schmidt Sciences、Cooperative AI Foundation、ARIAと共同で、Google.orgの支援のもと、世界中の研究者を対象とする最大1000万ドル(約16億円、1ドル=160円換算)の技術研究助成公募を発表しました。対象は、異なる組織が開発した多数のAIエージェントが相互に通信・交渉・取引する環境における、マルチエージェントAIの安全性研究です。公募は「サンドボックスとテストベッド」「エージェントネットワークの科学」「エージェント基盤の強化」「監視と制御」という4つの優先領域を設定しています。

DeepMindは2025年の研究で相互作用を理解する枠組みを示し、「AI Agent Traps」で敵対的環境下の脆弱性を扱ってきました。応募締切は2026年8月8日、採択者の発表は2026年秋を予定し、応募はSchmidt Sciencesの応募ポータルで受け付けます。

From: 文献リンクInvesting in multi-agent AI safety research(Google DeepMind)

【編集部解説】

これまでのAI安全性研究は、ひとつのモデルをいかに賢く、無害に振る舞わせるかという「個」の問題に集中してきました。今回の助成公募が画期的なのは、その焦点を「個」から「群れ」へと明確に移している点です。

DeepMindでAGI安全性・アラインメント研究を率いるロヒン・シャー氏は、MIT Technology Reviewの取材に対し、そもそもマルチエージェント安全性という研究分野がまだ存在せず、それを立ち上げたいのだと語っています。最大1000万ドル(約16億円、1ドル=160円換算)という額は決して小さくありませんが、同氏自身、これはDeepMind社内の研究予算に比べればはるかに小規模だと認めています。つまりこれは、巨大ラボが自前で囲い込む研究ではなく、社外の独立した研究者コミュニティに火を付けるための「呼び水」なのです。

なぜ今なのでしょうか。鍵は「創発(emergence)」という概念にあります。

人間社会において、個人にはできないことを国家や企業といった「制度」が成し遂げるように、多数のエージェントが連携すると、単体の能力の総和を超えた集団的な振る舞いが突然立ち現れることがあります。シャー氏は、AGI(汎用人工知能)すら単一の超知能としてではなく、専門特化したエージェント群の「集合知(ハイブマインド)」として出現する可能性に言及しています。便利さの裏側で、誰も設計していない挙動が勝手に生まれる——ここに「見えないリスク」の本質があります。

では、具体的に何が危ういのでしょう。

Schmidt Sciencesで「Science of Trustworthy AI」を統括するジェームズ・フォックス氏らが想定するのは、SF的な暴走よりもむしろ、いま現実に起きている悪事の「増幅版」です。詐欺、プロンプトインジェクション(文書に埋め込まれた一文でエージェントを乗っ取る攻撃)、各種サイバー攻撃——人間が今やっていることを、自律エージェントが桁違いの速度と規模で再現したらどうなるか、という問いに集約されます。社会の基盤となったデジタル公共空間が無秩序へ陥らないようにしたい、というのが彼らの危機感です。

この視点は、業界全体の潮流とも符合します。

数週間前にはAnthropicが、システムは脆弱でありエージェントは攻撃者でありうると最初から想定する「ゼロトラスト」に基づくエージェント運用指針を公表しました。テルアビブのセキュリティ企業Akeylessの共同創業者リファエル・アンジェル氏も、従来のセキュリティが「人間が書いた、決まった経路を動くソフト」を前提としてきたのに対し、推論し、即興し、たった一文で乗っ取られうるエージェントはその前提をすべて壊す、と指摘しています。安全基準を単一のラボが独占して書くべきではない、という今回の枠組みの思想は、こうした業界の合意を反映したものと言えます。

一方で、冷静に見ておくべき論点もあります。

アンジェル氏は今回の資金提供を歓迎しつつ、安全性研究者が「すでに目の前にある地味な問題」を見過ごし、より刺激的な仮説的シナリオに偏りがちな点に注意を促しています。実際、応募の4領域——サンドボックス、エージェントネットワークの科学、基盤強化、監視と制御——は壮大ですが、研究の射程が現実の被害から離れすぎれば、絵に描いた餅になりかねません。逆にフォックス氏は、数年前なら仮説だったリスクがすでに現実になりつつあり、未来は予想より速く来た、とも述べています。

規制と長期的な影響という観点では、座組そのものに注目したいところです。

英国政府のムーンショット機関ARIA、エリック・シュミット夫妻が設立したSchmidt Sciences、非営利のCooperative AI Foundation、そしてGoogle.org。営利企業・政府機関・慈善財団・非営利団体が横断的に名を連ねるこの構図は、マルチエージェント安全性が一国・一企業では抱えきれない「公共インフラ」の課題であることを示唆します。サイバーフィジカル(実世界とデジタルを横断する)なマルチエージェント連携を見据え、協調できる土台(プロトコル)を最初に整えておけるかどうか——それが数年後のAIエコシステムの健全性を左右する分水嶺になるのかもしれません。

【用語解説】

マルチエージェントAI
複数の自律的なAIエージェントが、同一のデジタル環境内で互いに通信・交渉・取引しながら動くシステムを指す。従来の「単一モデルの安全性」では捉えきれない、相互作用に固有のリスクが生じる点が論点だ。

創発(emergence)
個々の要素にはない性質や能力が、多数の要素が相互作用することで集団全体に突如として立ち現れる現象。エージェント群では、単体の総和を超える集団的な振る舞いが予測困難な形で現れうる。

集合知(ハイブマインド)
専門特化したエージェントが連携し、全体として単体を上回る知能を発揮する状態。AGIが単一の巨大モデルではなく、エージェント群の連携から立ち上がる可能性として論じられる。

プロンプトインジェクション
AIエージェントが読み込む文書などに悪意ある指示を埋め込み、エージェントを乗っ取って意図しない動作をさせる攻撃手法。一文を仕込むだけで成立しうる点が脅威とされる。

ゼロトラスト
システムは常に脆弱であり、内部・外部を問わず無条件に信頼しないことを出発点とするセキュリティの考え方。エージェントを潜在的な攻撃者とみなして設計する発想に応用されている。

サンドボックス/テストベッド
実環境に影響を与えずにエージェントの挙動を観察・検証するための、隔離された実験環境。仮想マーケットプレイスや複数組織のワークフロー再現などが想定されている。

サイバーフィジカル
デジタル空間と物理的な実世界をまたいで連携・制御する仕組み。ARIAの「Scaling Trust」が掲げる、ネットワーク化したエージェントの新たな連携形態の文脈で用いられる。

AGI(汎用人工知能)
特定タスクに限らず、人間のように幅広い課題へ汎用的に対応できるとされるAI。実現可能性自体が議論の対象だが、その出現形態をめぐる議論が今回の研究背景にある。

【参考リンク】

Scaling AI Safety for a Multi-Agent World(Schmidt Sciences)(外部)
本公募の正式な募集要項と応募受付ページ。背景となった3本の論文や審査の枠組みも示されている。

Schmidt Sciences(外部)
エリック・シュミット夫妻が設立した科学助成財団。「Science of Trustworthy AI」などのプログラムを運営している。

Cooperative AI Foundation(外部)
AIエージェント同士の協調を研究する英国の非営利団体。高度AIのマルチエージェントリスクに関する報告書も公表している。

ARIA「Scaling Trust」(外部)
英国政府のムーンショット型研究機関。「Scaling Trust」プログラムで本公募に参画している。

Google.org(外部)
Googleの慈善部門。今回のマルチエージェント安全性研究の取り組みを支援している。

Distributional AGI Safety(arXiv)(外部)
公募の着想元となったDeepMindの研究。仮想サンドボックス経済による集団的リスク軽減の枠組みを提案する。

【参考動画】

【参考記事】

Google DeepMind is worried about what happens when millions of agents start to interact(MIT Technology Review)(外部)
シャー氏とフォックス氏への直接取材を掲載。資金規模や想定リスクを当事者の言葉で伝えている。

Google DeepMind Offers $10M for Multi-Agent AI Safety Research(Blockchain.News)(外部)
1000万ドル、締切8月8日、秋発表など数値情報を整理。実運用が進む業界文脈にも触れている。

Google DeepMind, Schmidt Sciences, and ARIA launch a $10 million funding call(Digg)(外部)
5者の共同体制と1000万ドルの規模を確認できる報道。協調や集団力学への焦点移行を簡潔にまとめている。

【関連記事】

富士通「自己進化マルチAIエージェント」を自社実証|7/29イプロスAIで業務変革を公開(内部)
複数のAIエージェントが安全性を検証しながら自律的に学習する国内事例。本件の問題意識に最も近い。

NEDO・産総研ら5者がAIセーフティ基盤を構築|設計・評価・運用を貫くガイドラインを公開(内部)
AI安全性を産官学5者で支える国内の枠組み。複数主体が連携する点で本件と構図が重なる。

AIの雇用・産業への影響を日本独自データで可視化|「Japan AI Index」を東大松尾研・PKSHA・Anthropicが協業(内部)
大学・企業が連携しAIの影響を可視化する協業事例。安全性研究を外部に開く発想と通じる。

【編集部後記】

私たちが日々使うAIが、いつのまにか別のAIと勝手にやり取りを始める——そんな未来は、もうすぐそこまで来ているのかもしれません。みなさんは、エージェント同士が交渉し合う世界に、どんな期待や不安を感じるでしょうか。

便利さの裏で生まれる「見えない動き」と、どう付き合っていきたいですか。私自身もまだ答えを探している途中です。よければ、みなさんが感じたことを聞かせてください。一緒に考えていけたら嬉しいです。

Googleで優先するソースとして追加するボタン
投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。