OpenAIは2025年3月11日(米国時間)、開発者や企業が独自のAIエージェントを構築するための新しいツール「Responses API」と「Agents SDK」をリリースした。OpenAIはエージェントを「ユーザーに代わって独立してタスクを実行するシステム」と定義している。
Responses APIは、Chat Completions APIとAssistants APIの機能を統合したもので、ウェブ検索、ファイル検索、コンピュータ操作などの組み込みツールを提供する。このAPIは単一の呼び出しで複数のツールとモデルのターンを使用し、複雑なタスクを解決できるようにすることでエージェント開発を簡素化する。
Agents SDKは、AIエージェントの活動を「オーケストレーション」するためのオープンソースフレームワークとして紹介されており、複数のエージェントが連携して複雑な課題に取り組むことを可能にする。このSDKは、実験的なフレームワーク「Swarm」の後継として、エージェント、ツール、ハンドオフ、ガードレールなどの機能を提供し、エージェントワークフローの実行を追跡・検査するための統合された可観測性ツールも備えている。
OpenAIの製品責任者であるOlivier Godement氏は「世界は非常に複雑で、多くの産業やアプリケーションがある。そのため、開発者が特定のニーズに合わせた最も効果的なエージェントを作成するための基本的なツールを提供できることに興奮している」と述べている。
OpenAIは2026年半ばにAssistants APIをResponses APIに置き換える計画も発表している。
from OpenAI will let other apps deploy its computer-operating AI
【編集部解説】
OpenAIが発表した「Responses API」と「Agents SDK」は、AIエージェント開発の世界に大きな進歩をもたらす可能性を秘めています。これまでAIエージェントの開発は、高度な専門知識と複雑なプロンプトエンジニアリングを必要としていましたが、今回のツールセットによって、その敷居が大幅に下がることになります。
まず注目すべきは、OpenAIがエージェントを「ユーザーに代わって独立してタスクを実行するシステム」と明確に定義していることです。これは単なるチャットボットとの大きな違いで、自律的に行動し、複数のステップにわたるタスクを遂行できる能力を意味します。
Responses APIは、従来のChat Completions APIとAssistants APIの機能を統合し、ウェブ検索、ファイル検索、コンピュータ操作などの組み込みツールを提供します。これにより、開発者は単一のAPI呼び出しで複雑なタスクを解決できるようになります。特に注目すべきは以下の組み込みツールです:
・ウェブ検索:リアルタイムの情報取得とインライン引用が可能で、研究エージェントやショッピングアシスタントなどのアプリケーションに有用です。
・ファイル検索:メタデータフィルタリングとリランキング機能を備え、大規模な文書データセットの検索を容易にします。
・コンピュータ操作:マウスとキーボードの操作をキャプチャしてブラウザベースのワークフローを自動化できます(研究プレビュー段階)。
Agents SDKは、複数のエージェントワークフローのオーケストレーションを簡素化するオープンソースのフレームワークで、実験的なフレームワーク「Swarm」の後継として位置づけられています。このSDKを使用することで、複数のエージェントを連携させ、必要に応じてエージェント間でタスクを引き継ぐ「ハンドオフ」が可能になります。
特筆すべきは、これらのツールがAIエージェントの透明性と安全性を高める機能も備えていることです。Agents SDKには、エージェントの挙動を可視化するトレーシング機能やガードレール機能が標準搭載されており、開発者はエージェントの活動を正確に追跡できます。
このリリースの背景には、OpenAIが過去1年間で高度な推論、マルチモーダル対応、新たな安全対策などをモデルに追加し、複雑なマルチステップのタスクを処理するための基盤を整えてきたことがあります。しかし、実用レベルのエージェントを開発するには依然として高度な開発作業が求められていたため、今回のツールセットの提供に至ったと考えられます。
OpenAIのKevin Weil氏は「2025年はエージェントの年になる」と述べており、「ChatGPTと開発者ツールが、単に質問に答えるだけでなく、実際に現実世界であなたのために物事を行うようになる年だ」と強調しています。これは、AIの役割が情報提供から実際の行動支援へと進化することを示唆しています。
今回のリリースによって、AIエージェントの実用化が大きく加速することが予想されます。すでにCoinbaseやBoxなどの企業がOpenAIのエージェント技術を活用してワークフローの効率化を図っているとの報告もあります。
長期的には、OpenAIはAssistants APIを2026年半ばにResponses APIに完全に置き換える計画を発表しており、開発者はこの移行を視野に入れながら今後のプラットフォーム強化を注視する必要があります。
【用語解説】
SDK(Software Development Kit):ソフトウェア開発キットのことで、特定のプラットフォームやサービス向けのアプリケーションを開発するためのツール一式です。家具を組み立てる際の「工具セット」のようなものと考えるとわかりやすいでしょう。
オーケストレーション:複数のシステムやサービスを連携させ、全体として調和のとれた動作をさせること。オーケストラの指揮者が様々な楽器の演奏を調整するように、複数のAIエージェントの動きを統合的に管理します。
ガードレール:AIの行動や出力に制限を設けるための仕組み。子供の遊び場に設置される安全柵のように、AIが危険な領域に踏み込まないよう制限します。
【参考リンク】
OpenAI公式サイト(外部)OpenAIが提供する各種AIサービスやAPIの詳細情報、最新ニュースが掲載されている公式サイトです。
OpenAI Agents SDK GitHub(外部)OpenAIが公開しているAgents SDKのオープンソースコードとドキュメントが掲載されています。
OpenAI Developer Platform(外部)開発者向けのOpenAI APIドキュメントやツール、リソースが提供されているプラットフォームです。