派手な新モデルの発表ではありません。けれど、AIの歴史を振り返ったとき「あのあたりが分岐点だった」と語られるのは、案外こういう一報かもしれません。Googleが打ち出した今回の変化は、AIとの付き合い方そのものを、静かに塗り替えていく可能性を秘めています。
「APIが新しくなりました」という発表は、開発者でなければ素通りしてしまいがちです。しかしGoogleが2026年6月に一般提供(GA)を発表した「Interactions API」は、AIの使い方そのものが「チャット」から「エージェント」へと移る、その分岐点を映す出来事でした。
Geminiのモデルとエージェントを一つの窓口で扱え、状態管理やバックグラウンド実行、Managed Agentsに対応します。本記事では、この変化が持つ意味を、できることと潜在リスクの両面から読み解きます。
From:
Interactions API: our primary interface for Gemini models and agents

【編集部解説】
「APIが新しくなりました」という発表を、ただの仕様変更として読み流すこともできます。けれども今回の Interactions API の一般提供には、AI業界全体がいま向かっている方向を映す、もう少し大きな意味が隠れているように感じます。
そもそも Interactions API とは何か。ひとことで言えば、Geminiの「モデル」と「エージェント」を、ひとつの窓口でまとめて呼び出せるようにした統合インターフェースです。これまで開発者は、用途ごとに異なる作法を覚える必要がありました。それを一本化し、長時間かかる処理は background=True と書くだけでサーバーに任せられる。この「シンプルさ」こそが、今回の核心です。
技術的にいちばん重要な変化は、状態(ステート)を持つ場所が移ったことだと考えます。
従来の対話型APIは「ステートレス」、つまり毎回これまでの会話履歴をすべて送り直す方式でした。Interactions API では会話の状態をサーバー側が保持するため、続きを指定するだけで文脈を引き継げます。地味に聞こえるかもしれませんが、これは多段階で考え、ツールを使い、何分もかけて作業するAIエージェントにとっては不可欠な土台です。
注目したいのは、これがGoogleだけの動きではないという点です。
OpenAIは2025年3月、同じ思想の「Responses API」を投入し、これを新しい標準と位置づけました。同社は社内テストで、従来のChat Completionsと比べてキャッシュ利用が40〜80%改善したとしています。役割を終えつつあるAssistants APIは2026年中に終了予定です。つまり主要各社が示し合わせたように、APIの設計思想を「チャット」から「エージェント」へと書き換えている。今回のGoogleの発表は、その大きな潮流のなかに置いてこそ正しく読めます。
開発者にとって何が嬉しいのか。具体的な実利も用意されています。
Managed Agents を使えば、1回のAPI呼び出しだけで、コード実行・Web閲覧・ファイル操作ができるLinux環境がまるごと立ち上がります。Flexティアを選べばコストは50%下がり、過去のやり取りは有料ティアで55日間、無料ティアで1日保持されます。画像生成のNano Banana 2、音楽生成のLyria 3まで同じ窓口から扱える点も、つくり手の負担を確実に減らすでしょう。
一方で、見落とすべきでない論点もあります。
状態をサーバーに預けるということは、自分の会話データがGoogle側に保存されるということでもあります。保存を望まない場合は store=false で無効化できますが、その代わり previous_interaction_id や background=True といった便利機能は使えなくなります。利便性とデータ管理は、ここでトレードオフの関係に立ちます。機密性の高い業務で使う企業ほど、この線引きは丁寧に検討する価値があります。
もうひとつ、静かに進む「囲い込み」の側面も意識しておきたいところです。
最先端機能が次第に新APIへ集約されていくと、開発者は自然と各社独自の作法へ深く根を下ろしていきます。この懸念に応える形で、OpenAIが立ち上げた「Open Responses」という共通仕様づくりも動いています。NvidiaやVercel、Hugging Faceといった企業も名を連ねる、相互運用性を目指す取り組みです。特定の事業者に縛られず、プロバイダーをまたいで動かせる仕組みをどう確保するか。これは今後の規制やガバナンスの議論にもつながる、業界の宿題です。
では、私たちはこの変化をどう受け止めればよいのでしょうか。
象徴的なのが、今回の「ロールからステップへ」という設計変更です。会話の「発言者(ロール)」で世界を捉えるのではなく、思考・関数呼び出し・出力といった一つひとつの「行動(ステップ)」で捉え直す。これは、AIを“話し相手”ではなく“自律して働く存在”として設計し始めた、という思想の転換にほかなりません。
未来を知り、触れ、関わりたいと願う読者のみなさんにとって、今回のニュースは「便利なAPIが出た」以上の意味を持ちます。AIが人に代わって手を動かす時代の土台が、いま静かに敷かれている。その地殻変動の最初の一歩を、私たちは目撃しているのだと思います。
【用語解説】
一般提供(GA / General Availability)
ソフトウェアやAPIが試験段階を終え、誰でも本番利用できる正式提供の状態を指す。「ベータ」が試用段階であるのに対し、GAは仕様が安定し、本番利用を想定した安定版として提供される段階だ。
エージェント
人間が一つずつ指示を出すのではなく、目標を与えれば自ら計画・判断し、複数の手順を実行するAIのこと。本記事のAntigravity agentのように、コード実行やWeb閲覧まで自律的にこなすものを指す。
ステートレス/ステートフル(状態管理)
ステートレスは、やり取りのたびに過去の文脈をすべて送り直す方式。ステートフルは、文脈をサーバー側が記憶し続ける方式である。Interactions APIは後者を採用し、続きを指定するだけで会話を引き継げる。
バックグラウンド実行background=True を指定することで、時間のかかる処理をサーバーに任せ、完了を待たずに別の作業へ移れる仕組み。長時間動くエージェント処理で効果を発揮する。なお対象範囲は仕様更新で変わりうるため、実装時は最新の公式ドキュメントで対応範囲を確認したい。
Managed Agents(マネージド・エージェント)
エージェントが動く実行環境を、利用者がサーバーを用意せずとも、1回のAPI呼び出しでGoogle側に丸ごと準備してもらえる仕組み。準備されるのは隔離されたLinuxサンドボックスだ。
Linuxサンドボックス
外部から隔離された安全な仮想作業空間のこと。エージェントがコードを実行したりファイルを操作したりしても、外部システムに影響を及ぼさないよう囲い込まれている。
ロールからステップへ(From Roles to Steps)
従来は「ユーザー」「アシスタント」といった発言者の役割(ロール)で会話を構造化していた。新方式では、思考・関数呼び出し・出力といった一つひとつの行動を「ステップ」として扱う。AIを対話相手ではなく作業主体として捉え直した設計思想の変化を象徴する。
Flexティア/Priorityティア
コストとレイテンシ(応答速度)のどちらを優先するかを選べる料金区分。Flexはコストを優先して費用を50%下げ、Priorityはレイテンシ(応答速度)を優先する。
previous_interaction_id / store=false
previous_interaction_idは、過去のやり取りを指定して文脈を引き継ぐための識別子。store=falseに設定するとデータ保存を無効化できるが、その場合は文脈の引き継ぎやバックグラウンド実行が使えなくなる。
Open Responses
特定の事業者に縛られず、複数のAIプロバイダー間で共通して使えるAPI仕様を目指す取り組み。OpenAIが立ち上げ、Nvidia、Vercel、Hugging Faceなど複数の企業が参加する形で策定が進む。
【参考リンク】
Interactions API ドキュメント(Google AI for Developers)(外部)
公式技術文書。状態管理やバックグラウンド実行など本記事で触れた機能の詳細と実装例を確認できる。
Google AI Studio(外部)
APIキー取得やプロトタイプ作成ができる開発者向けプラットフォーム。Interactions APIを試す入口となる。
Google DeepMind(外部)
本記事の発表元であり、著者2名が所属するGoogleのAI研究開発部門。Geminiモデル群の開発を担う。
画像生成ドキュメント(Nano Banana 2)(外部)
本記事で言及された画像生成モデル「Nano Banana 2」を含む、Geminiの画像生成機能に関する公式解説ページ。
音楽生成ドキュメント(Lyria 3)(外部)
音楽生成モデル「Lyria 3」の機能を解説した公式ページ。APIから音楽生成を扱う方法がまとめられている。
google-genai(Python SDK)(外部)
Interactions APIをPythonから利用するための公式SDK配布ページ。インストール方法とバージョンを確認できる。
@google/genai(JavaScript SDK)(外部)
Interactions APIをJavaScript/TypeScriptから利用するための公式SDK配布ページ。
LiteLLM(外部)
複数のLLMを共通の作法で扱えるライブラリ。Interactions APIとの連携が提供されている対応パートナーの一つ。
Eigent(外部)
GeminiのマネージドエージェントAPIを遠隔の推論エンジンとして活用する事例を公開している対応パートナー。
Agno(外部)
エージェント開発フレームワークの一つで、GeminiのInteractions API連携に対応している。
OpenAI Responses API(移行ガイド)(外部)
編集部解説で比較対象としたOpenAIのステートフル型API「Responses API」の公式移行ガイド。
【参考記事】
OpenAI Chat Completions vs Responses vs Assistants 2026(PkgPulse Blog)(外部)
OpenAIの3つのAPIを比較。Responses APIがChat Completionsよりキャッシュ利用を40〜80%改善し、Assistants APIは2026年終了予定と整理している。
gemini-interactions-api(Agent Skills Library)(外部)
データは有料ティアで55日間、無料ティアで1日間保持され、store=falseで無効化できるが文脈引き継ぎが使えなくなる点を明記している。
OpenAI Chat Completions API vs Responses API(Medium/Joe San Pietro)(外部)
OpenAIが2025年3月11日にResponses APIを公開し、Assistants APIは2026年に終了、Responsesが主軸になると解説する記事。
Open Responses vs. Chat Completion: A new era for AI apps(The New Stack)(外部)
OpenAIが立ち上げた共通仕様「Open Responses」にNvidia、Vercel、Hugging Faceらが参加する動きと、相互運用性の論点を伝える。
From Chat Completions to Responses API(demiliani.com)(外部)
状態管理をクライアントからサーバーへ移す設計変更がAIアプリの構造を変えると、Azure側の視点から論じた記事。
【編集部後記】
「APIの話なんて、開発者じゃない自分には関係ない」——そう感じた方こそ、少し立ち止まっていただけたら嬉しいです。今回の変化は、AIが“話し相手”から“自分の代わりに働く存在”へと姿を変えていく、その入口にあたるものでした。みなさんは、AIにどんな仕事を任せてみたいでしょうか。
任せたいことと、任せたくないこと。その線引きを一度考えてみると、これから訪れる時代の輪郭が、ぐっと身近に見えてくる気がします。私も一緒に考えていきたいです。












