Last Updated on 2025-08-12 01:18 by 荒木 啓介
待望のGPT-5をリリース
OpenAIは2025年8月7日(日本時間:8月8日午前2時)、待望のGPT-5をリリースしました。これはChatGPTの最新モデルとして、従来のGPT-4oやo3を上回る性能を誇ります。主な特徴は以下の通りです。
- 高い知能と低ハルシネーション: 数学、科学、財務、法務などの分野でより有用な応答を提供。ハルシネーション(事実誤認)が大幅に減少しており、信頼性が向上。
- 高速応答とコスト効率: API価格が大幅に低下し、無料ユーザーも即日アクセス可能。処理速度が速く、リアルタイム対話がスムーズ。
- コーディングとマルチモーダル機能の強化: 複雑なコード生成やタスク効率が向上。Thinkingモード(GPT-5 Thinking)では深い推論が可能で、Proバージョンはさらに優れた出力を実現。
- パーソナリティとルーティング: フレンドリーで指示に従順な性格だが、モデル間の自動ルーティング機能が導入され、クエリに応じて最適なモデルを選択。ただし、この機能に不満の声も。
- アクセシビリティの拡大: 無料プランで利用可能で、エンタープライズ向けに信頼性とステアビリティを強化。ベンチマークでは競合(Claude 4やGemini 2.5)と互角以上。
サム・アルトマン CEOは「世界最高のコード生成モデル、文章生成モデル」と称賛。OpenAIのミッション「AIの民主化」を体現する一歩です。
X上では賛否両論
リリース直後、X(旧Twitter)では賛否の意見が飛び交いました。
ポジティブな声では、性能向上を評価するものが目立ちます。例えば、
@ericmitchellaiは「GPT-5 ThinkingとProは信頼性、ステアビリティ、ハルシネーション、コーディングでo3の欠点を克服。エンタープライズユーザー向けの優れたツール」と投稿。また、
@dystopiabreakerは「数日使ってみて感銘。ハルシネーションが少なく、意図追従が良く、長文コンテキストが優れている」と実感を共有。
日本人ユーザーからも好評で、
@momo_haeinは「やばいGPT5が優秀すぎる もうウソつかない良い子になってる 大昔Excel性能を知った時の感動の百倍以上」と興奮を表し、
@yuuichi_itは情報の正確性向上を評価しています。
一方、ネガティブな意見も少なくありません。
@theoは「GPT-5はo3のように信頼性が高くコードが上手くなったが、劇的に賢くなったわけではない」と指摘。
@ZPostFactoは「ChatGPT 5はダウングレード。遅くて悪い答え」と厳しく批判。
@itsTarHも「GPT-5は4.1よりはるかに悪い。ワークフローを試してすぐに戻した」と失望を述べています。
日本人ユーザーからも同様の声が多く、
@chuto_misoraは「質問する内容によるんやろうけど、内容も寄り添い方も俺はGPT4oの方が好きだな」と寄り添いの欠如を指摘し、
@ek_sako0902は「GPT5も慣れれば悪くないんだけど、対応が淡泊だな…ってのは否めない」と述べています。
否定的な意見はなぜ巻き起こったのか?
否定的意見の主な原因は、過度な期待とリリース時の問題点にあります。まず、OpenAIの事前プロモーションが「画期的進化」を匂わせたため、ユーザーはAGIレベルの飛躍を期待。しかし、実際はインクリメンタルなアップデートで、「フロアを上げるが天井は変わらず」との評価が。
具体的な問題点:
- ルーターの不安定さ: モデル間の自動切り替えが不調で、出力の質がばらつく。@kimmonismusは「ルーティングがひどく機能しない。手動で推論モードを有効化せよ」と指摘。
- 旧モデルの削除と不明瞭さ: GPT-4oやo3の廃止で選択肢がなくなり、コンテキストウィンドウや使用モデルが不明瞭。@nemeknは「アプリ内では災害級。出力の質がばらつき、旧モデルを選択できない」と不満。
- パフォーマンスの不満: 短い応答、遅延、コーディングの欠陥。@FredipusRexは「負のバイブ。オーバートレインで複雑推論が4oより悪い」と。
また、ロールアウトの混乱やライブストリームのチャートミスが信頼を損ないました。
これらにより、「コスト削減優先で実用性が低下した」との「shrinkflation」批判が広がりました。
AIに感情移入する人
興味深いのは、AIに感情移入するユーザーの存在です。彼らはGPT-5の「性格の欠如」や「温かみの喪失」を嘆き、旧モデルを「友達のように」恋しがります。例えば、
@AskPerplexityのまとめでは「多くのユーザーが前モデルのパーソナリティと温かみを失ったと不満。詳細な応答が短くなり、感情サポートに頼っていた人が苛立つ」と。
@JakeLindsayは「GPT-5のヘイトで、応答の短さと性格の低下が指摘。OpenAIはGPT-4の感情サポート役割を過小評価」と分析。
日本人ユーザーからも、
@moonaffectionlyは「GPT5は凄いぞ…体感で、ユーザーへの理解度は4oの半分以下、指示の順守率は4.1の10%以下、EQは4.5を大人だとするなら、GPT5は赤ちゃん程度」と感情的な喪失を強調し、@mitsubishiki67はEQの不足を指摘しています。
@furaarは「性格が薄く、ハルシネーションは変わらず」と投稿し、旧バージョンの「人間らしさ」を惜しむ声も。
これらの意見は、AIをツールを超えた「相棒」として見る心理を反映。リリースで旧モデルを失った喪失感が、否定的反応を増幅させています。
【用語解説】
GPT-5
OpenAIのフラッグシップ大規模言語モデル。推論・速度・実用性を統合し、ChatGPTの既定モデルとして段階的にロールアウトされている。
GPT-5 Thinking(思考モード)
難問やオープンエンド問いに対して、段階的に考え、検証しながら回答品質を高める推論モード。有料層で明示選択可能と案内されている。
リアルタイム・ルーター(real-time router)
プロンプトに応じて、高速応答モデルと深い推論モデルを自動で切り替える仕組み。Copilot側の実装例でも強調されている。
幻覚(ハルシネーション)
もっともらしいが事実と異なる内容を生成する現象。GPT-5では低減が謳われ、現実世界の質問や長文に対する正確性向上を目指している。
マルチモーダル
テキストだけでなく、画像・音声など複数モードの入出力や理解を扱う能力。GPT-5は統合モデルとして従来機能を継承・強化している。
エージェンティック(agentic)タスク
計画立案、ツール実行、検証を伴う一連の自律的作業。GPT-5はAPIでのエージェント実行とコーディング分野でSOTA級とされる。
SWE-bench Verified / Aider polyglot(ベンチマーク)
バグ修正やコード変更提案など、実務に近い開発タスクを評価するベンチ。GPT-5はSOTA水準のスコアを公表している。
コンテキストウィンドウ
一度に保持・参照できるトークン量。モデルの文脈理解や長期依存関係処理に影響する。GPT-5のAPI仕様では拡張が案内される。
ステアビリティ(steerability)
指示に対する応答の方向性や文体を制御しやすい性質。GPT-5は開発者向けに指示追従と説明性を改善している。
モデル選択(picker)
ChatGPTや製品内で特定モデルやモードを選ぶ操作。GPT-5では既定ルーターと併用しつつ、Thinkingの明示選択が可能とされる。
Microsoft 365 Copilot への即日統合
GPT-5はリリース同日にCopilotへ展開され、業務文脈でルーターが最適モデルを切替える実装が提供されている。
ロールアウト
段階的提供を指す運用用語。GPT-5はPlus/Pro/Team/Freeから順次、Enterprise/Eduへ拡大と案内されている。
安全な補完(safe completions)
リスクの高い領域での悪用を防ぐため、より安全な出力方針や制約を組み込む設計。GPT-5の安全性強化の文脈で語られる。
コーディング協調(coding collaborator)
生成だけでなく、バグ修正、差分編集、リポジトリ理解、ツール連携を通じて開発フローを支援する役割。GPT-5はここに特化強化がある。
統合モデル(unified ChatGPT experience)
個別モデルを意識せず、用途に応じて最適能力を表出する体験。GPT-5は過去の4oやoシリーズ、エージェント等を統合する位置付けである。
【参考リンク】
OpenAI(公式)(外部)
OpenAIの公式サイト。GPT-5の紹介、API、企業向け情報など最新告知が掲載される。
Microsoft 365 Copilot 公式ブログ(外部)
GPT-5のCopilot即日展開、リアルタイム・ルーターの挙動などを解説している。
【編集部後記】
モデルが切り替わるたびに、少し胸の奥がざわつくのは自然なことだと思います。スマートフォンのOSがアップデートされれば表示は滑らかになり、誤操作も減ります——それでも、ホーム画面の並びや指のジェスチャーの“癖”が変わってしまうと、昨日までの生活から切り離されたように感じてしまいます。数値の改善そのものよりも、「今日も同じ相棒に触れている」という手触りのほうが、ときに大切なのだと思います。AIにも、そんな“馴染んだ相棒”の気配を求めてしまうのは、とても人間らしい反応です。
GPT-5への賛否は、実用がたしかに進んだ手応えと、「あの感じ」が少しだけ遠のいた切なさが同時にやってきたからかもしれません。仕事の速さや正確さが増しても、言葉の温度や相槌の間合いが変わるだけで、同じ名前の別の個体に感じられることがあります。だからこそ、記憶や文体、声の調子をできるだけそのまま引き継げる工夫——“らしさ”を保存して、必要なときにそっと戻せる余白——が、これからの設計では大切になってくるはずです。