innovaTopia

ーTech for Human Evolutionー

OpenAI Operator、o3モデルにアップグレード – ChatGPT Pro月額200ドルでAIエージェント性能が大幅向上

OpenAI Operator、o3モデルにアップグレード - ChatGPT Pro月額200ドルでAIエージェント性能が大幅向上 - innovaTopia - (イノベトピア)

Last Updated on 2025-05-25 22:58 by admin

OpenAIは2025年5月23日、自律的ウェブブラウジングエージェント「Operator」のAIモデルをGPT-4oからo3推論モデルにアップグレードしたと発表した。

このアップデートは月額200ドルのChatGPT Proプラン購読者向けの研究プレビューとして世界的に提供される。

o3ベースのOperatorはブラウザタスクの完了を測定するOSWorldベンチマークで42.9点(従来38.1点)、WebArenaベンチマークで62.9点(従来48.1点)、GAIAベンチマークで62.2点(従来12.3点)を記録した。
安全面では機密性の高いアクションの確認率が向上し、金融取引では100%の確認を実施する。プロンプトインジェクション脆弱性は23%から20%に減少した。

Operatorは2025年1月23日に初回リリースされ、夕食予約やショッピングリスト作成などのウェブベースタスクを自動実行できる。

References:
文献リンクSafeguards remain, as do general cautionary notes about usage on sensitive, financial transactions and account access

【編集部解説】

今回のアップデートで最も注目すべきは、推論能力の飛躍的向上です。o3モデルは従来のGPT-4oと比較して、数学的計算や論理的思考を要するタスクで格段の性能向上を実現しています。特にGAIAベンチマークでの62.2点(従来12.3点)という5倍以上のスコア向上は、AIエージェントの実用性を大きく押し上げる成果といえるでしょう。

企業への影響範囲は想像以上に広範囲に及びます。データエンジニアリング分野では、手動でのウェブスクレイピングや検証作業の自動化が現実的になり、ITセキュリティ分野では監査やインシデント対応のシミュレーションツールとして活用できます。OpenAI公式によると、DoorDash、Instacart、OpenTable、Priceline、StubHub等の企業との協業も進んでおり、実用化への道筋が見えています。

一方で潜在的なリスクも無視できません。プロンプトインジェクション攻撃への耐性は改善されたものの(23%→20%)、完全ではありません。また、月額200ドルという価格設定により、現時点では限られたユーザー層のみがアクセス可能な状況が続いています。

規制面での影響については、現在米国、カナダ、英国、日本、韓国等での展開が確認されており、各国の規制環境に応じた段階的な展開が行われています。OpenAIは公的機関(カリフォルニア州ストックトン市等)との協業も進めており、市民サービスへの応用も検討されています。

長期的視点では、APIの一般公開により開発者エコシステムの拡大が期待されます。現在はウェブブラウザ内での操作に限定されていますが、将来的にはより広範囲なアプリケーション連携が計画されており、RPAツール市場に大きな変革をもたらす可能性を秘めています。

【用語解説】

CUA(Computer-Using Agent)
コンピュータを人間のように操作するAIエージェント。従来のAPIを使わず、画面を「見て」「考えて」「操作する」仕組み。

o3推論モデル
OpenAIの最新AI。従来のGPT-4oと異なり、問題を段階的に考える能力を持つ。数学の問題を解く時に途中計算を書きながら進むような思考プロセスを内部で実行する。

研究プレビュー
完成品ではなく、まだ開発中の機能を限定公開している状態。ベータ版のようなもので、不具合や制限があることを前提としている。

プロンプトインジェクション
AIに悪意のある指示を混入させて意図しない動作をさせる攻撃手法。

【参考リンク】

OpenAI(外部)
ChatGPTやOperatorを開発するAI企業の公式サイト。最新の研究成果や製品情報を提供。

ChatGPT Operator(外部)
Operatorの専用サイト。ChatGPT Proユーザーが実際にAIエージェント機能を利用できる。

Google Gemini(外部)
Googleの競合AI製品。マルチモーダル機能と月額約250ドルの料金設定でOpenAIと競合。

【参考動画】

【編集部後記】

AIエージェントが日常業務を代行する時代が本格的に始まりました。皆さんの職場では、どのような作業を自動化できそうでしょうか?データ収集、予約管理、情報整理など、繰り返し作業の多い業務ほどAIエージェントの恩恵を受けやすいかもしれません。一方で、月額200ドルという価格設定をどう感じられますか?個人利用には高額でも、チーム単位なら十分にペイする投資になるのか、ぜひ皆さんの現場感覚でお聞かせください。AIエージェントとの協働が当たり前になる未来を、一緒に考えてみませんか。

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

投稿者アバター
TaTsu
デジタルの窓口 代表 デジタルなことをまるっとワンストップで解決 #ウェブ解析士 Web制作から運用など何でも来い https://digital-madoguchi.com
ホーム » AI(人工知能) » AI(人工知能)ニュース » OpenAI Operator、o3モデルにアップグレード – ChatGPT Pro月額200ドルでAIエージェント性能が大幅向上