ーTech for Human Evolutionー

OpenAIのChatGPT、デフォルトモデルがGPT-5.5 Instantへ刷新

AI（人工知能）ニュース｜テクノロジーと社会ニュース

Headline News

omote

[公開]

2026年5月7日8:24

[更新]2026年5月7日

OpenAIのChatGPT、デフォルトモデルがGPT-5.5 Instantへ刷新 - innovaTopia

OpenAIは2026年5月5日、ChatGPTのデフォルトモデルをGPT-5.5 Instantに更新したと発表した。これはGPT-5.3 Instantを置き換えるものである。

社内評価において、医療、法律、金融などのリスクの高いプロンプトでは、GPT-5.3 Instantと比較して幻覚的な主張を52.5%削減し、ユーザーが事実誤認を指摘した会話における不正確な主張を37.3%削減した。ベンチマーク結果はCharXiv-reasoningで75.0%から81.6%、MMMU-Proで69.2%から76.0%、OmniDocBenchで14.6%から12.5%、GPQAで78.5%から85.6%、AIME 2025で65.4%から81.2%へと向上した。応答の単語数は30.2%、行数は29.2%削減された事例がある。

過去のチャット、ファイル、連携Gmailを活用したパーソナライゼーション機能、および応答に使用された文脈を確認できる「メモリソース」機能も導入された。APIではchat-latestとして提供される。GPT-5.3 Instantは有料ユーザー向けに3カ月間利用可能なまま残される。

From: GPT‑5.5 Instant: smarter, clearer, and more personalized

【編集部解説】

GPT-5.5 Instantのリリースは、派手な性能ジャンプを謳うものではなく、「日常的に使われるデフォルトモデルの底上げ」に焦点を絞ったアップデートです。月額の上位プラン向けモデルではなく、無料ユーザーを含む数億人が触れる入り口部分が対象である点に、今回の発表の戦略的な意味合いが見て取れます。

まず注目したいのが、52.5%および37.3%という幻覚（ハルシネーション）削減率の出所です。これはOpenAIの社内評価で得られた数値であり、LongFactやSimpleQAといった公開ベンチマークの結果ではありません。医療・法律・金融などのリスクの高いプロンプト、およびユーザーが事実誤認を指摘した会話という、独自の評価セットを用いた測定です。実利用に近い品質を測ろうとする姿勢は評価できる一方、他社モデルや過去リリースとの直接比較が難しい点には留意が必要でしょう。

CharXiv-reasoning（75.0%→81.6%）、MMMU-Pro（69.2%→76.0%）といった視覚・マルチモーダル系のスコアには明確な伸びが見られます。特にAIME 2025の数学スコアが65.4%から81.2%へ大きく上昇している点は注目に値し、低レイテンシのInstant系列でも本格的な数学処理が現実的になってきたことを示唆します。

もう一つの目玉が「メモリソース（Memory Sources）」機能です。AIが応答を生成する際にどの過去チャットや保存済みメモリを参照したのかを、ユーザー側で確認・編集・削除できる仕組みになります。これまでブラックボックス化されがちだった個人化のプロセスに、初めて利用者側からの可視性をもたらす設計と位置づけられます。

ただし、OpenAI自身が「すべての参照要素を表示するわけではない」と明言している点は見逃せません。透明性の機能ではあるものの、その範囲は限定的であるという前提を理解しておく必要があります。

機能拡張の対象に、過去のチャットだけでなく連携済みGmailやアップロード済みファイルまで含まれた点も論点を伴います。利便性が増すのは確かですが、メールデータを継続的にAIに参照させる設計は、企業のデータガバナンスや日本の個人情報保護法制との関係で、今後さらに議論が深まる領域となるでしょう。

技術トレンドの整理としては、今回の改善はモデル基盤の革命ではなく、いわゆる「コンテキストエンジニアリング」の領域に位置付けられます。検索ツールを使う判断の最適化、過去文脈の高速参照、自己検証の強化など、業界で広がりつつある手法群をデフォルトモデルに統合してきた、と読み解けます。

過剰な絵文字や不要なフォローアップ質問を抑える方向への調整は、業務利用層への適合を意識した変更と捉えられそうです。OpenAIがGPT-4oの引き上げを進めた際には、同モデルを「親友」「鏡のような存在」と表現するユーザー層から強い反発が寄せられ、それでも2026年2月に同モデルは廃止に至った経緯があります。「温かみは残しつつ過度な同調は減らす」という今回のチューニングには、その学びが反映されているようにも見えます。

長期的な視点では、AI業界の競争軸が「最大能力の誇示」から「日常使用での信頼性」へとシフトしている兆候として、このリリースは記憶しておく価値があります。エンタープライズ需要の本格化、規制対応、ユーザーの定着と離反──これらすべてが、デフォルトモデルの設計思想にかかっている時代に入りつつあるのです。

【用語解説】

ハルシネーション（幻覚）
生成AIが、もっともらしい文章でありながら事実とは異なる、または根拠のない内容を出力してしまう現象を指す。特に医療・法律・金融といった正確性が求められる領域での発生は、実害につながるリスクとして問題視されている。

chat-latest
OpenAIのAPIにおけるモデル指定識別子。常に最新のChatGPT向け基盤モデルが割り当てられる枠で、今回からGPT-5.5 Instantが対応する。

CharXiv-reasoning
科学論文に登場する図表（チャート）を読み解き、推論する能力を測るベンチマーク。マルチモーダル理解の評価指標として用いられる。

MMMU-Pro
画像・図表を含む大学院レベルの専門知識を要する問題群でAIの推論能力を測る、マルチモーダル評価ベンチマーク。

OmniDocBench
PDFや画像形式の文書を構造化テキストへ正確に変換する能力を測るベンチマーク。エラー率が低いほど性能が高いことを示す。

GPQA
博士号レベルの専門家が作成した、生物学・物理学・化学などの難問に対する回答能力を測るベンチマーク。

AIME 2025
2025年に実施されたAmerican Invitational Mathematics Examination（米国数学招待試験）。米国の高校生向け数学コンテストで、AIの数学的推論能力を測る指標として広く用いられている。

GPT-4o
OpenAIが過去に提供していたマルチモーダル対応モデル。引き上げの過程で、その「人格」に愛着を持っていたユーザーから強い反発があったものの、2026年2月に廃止された経緯が報じられている。

【参考リンク】

OpenAI（外部）
ChatGPTやGPTシリーズ、APIプラットフォームなどを提供する、米国を拠点とするAI研究企業の公式サイト。

ChatGPT（外部）
OpenAIが提供する対話型AIサービスの公式アクセスポイント。GPT-5.5 Instantを含む各モデルが利用できる。

OpenAI Platform（外部）
OpenAIの開発者向けAPIプラットフォーム。chat-latestをはじめとする各モデルへ開発者がアクセスできる窓口。

Gmail（外部）
Google社が提供するメールサービスの公式サイト。今回ChatGPTのパーソナライズ連携対象として言及されている。

【参考記事】

OpenAI releases GPT-5.5 Instant update to make ChatGPT smarter with fewer emoji（9to5Mac）（外部）
ハルシネーション削減率と過剰絵文字使用の抑制という二つの改善軸に焦点を絞り、5/5リリースを報じた記事。

OpenAI rolls out GPT-5.5 Instant as default ChatGPT model, promises more accurate responses（The New Stack）（外部）
ベンチマーク結果とメモリソース機能、個人データの透明性向上を技術系メディアの視点で解説したリリース報道。

GPT-5.5 didn’t cut hallucinations 60%. Here’s what it did.（Wire Blog）（外部）
OpenAIのハルシネーション削減数値の検証を行い、改善の本質はコンテキストエンジニアリングだと指摘した記事。