ーTech for Human Evolutionー

Claude Opus 4.8登場、Anthropicが掲げる「正直なAI」とは何か

AI（人工知能）ニュース｜サイバーセキュリティニュース｜テクノロジーと社会ニュース

Claude　Headline News

山本達也

[公開]

2026年5月29日16:00

Claude Opus 4.8登場、Anthropicが掲げる「正直なAI」とは何か - innovaTopia

「賢くなった」よりも「正直になった」。Anthropicが2026年5月28日に公開した新モデル、Claude Opus 4.8の最大の進化は、性能の数字ではなく、その姿勢にあります。AIが根拠の薄いまま「できました」と言い切ってしまう――そんな厄介な癖を抑え、自分の作業に自信がないときは「ここは怪しい」と申告できるようになった。派手な飛躍ではないけれど、AIを仕事の相棒として使う私たちにとっては、地味に効いてくる変化です。価格は据え置きのまま、応答の力の入れ具合を選べる新機能や、開発を丸ごと任せられる仕組みも同時に登場しました。そしてその背後には、さらに高性能な「次のモデル」の影も見え隠れしています。今回の発表が何を意味するのか、いっしょに読み解いていきましょう。

Anthropicは2026年5月28日、Claude OpusをClaude Opus 4.8へアップグレードしたと発表した。Opus 4.7を基盤とし、価格は据え置かれる。通常利用は入力100万トークンあたり5ドル、出力25ドル、fast modeは入力10ドル、出力50ドルである。

fast modeは2.5倍速で動作し、従来モデルより3倍安価となった。Opus 4.8は自作コードの欠陥を見逃す確率が前世代比で約4分の1に下がった。同日、Claude Codeの「dynamic workflows」、claude.aiとCoworkの「effort control」、Messages APIのsystemエントリ受付に対応した。Anthropicは今後、Opusより高知能の新クラスを計画し、Project Glasswingの一環で一部組織がClaude Mythos Previewをサイバーセキュリティ用途で使用している。

開発者はAPIでclaude-opus-4-8を利用できる。

From: Introducing Claude Opus 4.8

【編集部解説】

今回のアップデートを一言で言えば、「派手さはないが、芯のある改良」です。Anthropic自身が「modest but tangible（ささやかだが確かな）改善」と表現している通り、Opus 4.7からの飛躍を期待すると肩透かしを食らうかもしれません。それでも私がこの発表に注目するのは、数字よりも「何を改良の軸に据えたか」という思想が見えるからです。

その軸が「正直さ（honesty）」です。ここでいう正直さとは、道徳的な誠実さのことではありません。AIが根拠の薄い段階で「できました」と言い切ってしまう、あの厄介な癖をどれだけ抑えられるか、という話です。この文脈での「正直さ」は、Claudeが自らの実際の振る舞いや暗黙の判断により忠実な言葉を返すことを意味します。

具体的な数字が説得力を持っています。Anthropicのアラインメントチームは、Opus 4.8が自ら書いたコードの欠陥を見過ごす確率が前世代の約4分の1だと報告しています。コードを書いた本人（AI）が「ここは怪しい」と自己申告してくれる頻度が上がるということです。実装の現場では、これが地味に効いてきます。

アラインメント面ではもう一つ興味深い数値があります。VentureBeatによれば、Anthropicが公開した棒グラフ上で、Opus 4.8の逸脱（ミスアライメント）スコアは約1.9で、Opus 4.7の2.5から低下し、能力的には上位で限定提供中のMythos Previewとほぼ並んだとされます。この数値はモデルごとに約2,600回の模擬調査セッションに基づくものです。「より賢いモデルほど危ういのでは」という直感に反して、安全性の指標で最上位機に肉薄した点は、評価されてよいでしょう。

ユーザー側で実感しやすいのは「effort control（努力量の調整）」です。応答にどれだけ手間（とトークン）をかけるかを自分で選べるようになりました。ここで一つ、報道の食い違いに触れておきます。Gizmodoはこの機能の初期設定を「Low」と報じていますが、Anthropicの公式発表では既定値は「high（高）」とされています。一次情報を優先すれば既定は高努力であり、この点は注意が必要です。背景には、前世代Opus 4.7の「adaptive thinking」が簡単なタスクに時間をかけすぎるという不満があり、effort controlはその直接的な回答という見方もあります。

開発者にとっての本命は、むしろ「dynamic workflows」かもしれません。Claude Codeと組み合わせることで、数十万行規模のコードベース移行を、着手からマージまで既存テストスイートを基準に実行できるとされます。これは「AIにコードを書かせる」段階から「AIにプロジェクトを任せる」段階への移行を意味します。何百もの並列サブエージェントが動くという発想は、開発の生産性を一段引き上げる可能性を秘めています。

一方で、冷静な視点も必要です。Techzineは、各指標の改善幅が1ポイント未満から9%弱までと幅があり、日々の体感はそれほど変わらないかもしれないと指摘しています。ベンチマークの上昇が、必ずしも個々の作業の劇的な改善に直結するわけではない、という冷静な留保です。

そして、この発表の本当の主役は「次に控えるもの」だと私は見ています。Anthropicは最上位のMythosモデルを、サイバーセキュリティ上の懸念から依然として一般公開せず留保しています。現在はProject Glasswingの一環で、ごく少数の組織がサイバーセキュリティ業務にClaude Mythos Previewを使っているにとどまります。能力が高いモデルほど悪用リスクも高まるため、安全装置（セーフガード）の整備を待つという判断です。

この「能力を持っているのに、あえて出さない」という姿勢は、AI規制を考えるうえで象徴的です。性能競争が激化するなかで、自主的にブレーキを踏む企業判断が、今後の業界標準や法整備にどう影響するのか。Opus 4.8という堅実な一手の背後で、より大きな問いが静かに進行しているように感じられます。

未来を見据えれば、注目すべきは価格と効率の動きです。DatabricksはGenie上でOpus 4.8がOpus 4.7比でトークンコスト61%減を実現したと報告しています。顧客がより安くAIを使う方法を求めるなか、今回の発表は支出に応じて使い方を調整できるツールを前面に出したものでもあります。性能の頂を競う時代から、「賢さをいかに手頃に届けるか」という競争へ。その潮目が、この派手さのない発表に表れているのではないでしょうか。

ただし、この値下げを過大に受け取らないよう一点だけ補足します。Opus 4.8のfast modeは現在、Claude APIとClaude Managed Agentsでのリサーチプレビューという位置づけで、Amazon BedrockやVertex AI、Microsoft Foundryといった第三者プラットフォームでは利用できないとされています。「どこでも一律に安く速くなる」わけではない点は、導入を検討する読者にとって押さえておきたい現実です。

【用語解説】

Opus（オーパス）
Anthropicが提供するClaudeシリーズのうち、最上位に位置づけられる高性能モデルの呼称。今回その新版としてOpus 4.8が登場した。

Mythos Preview（ミトス・プレビュー）
Anthropicが開発する、Opusを上回る知能を持つとされる新クラスのモデル。能力が高いゆえにサイバー攻撃などへの悪用リスクも大きく、安全装置の整備が済むまで一般公開を控えている。現在はごく一部の組織がサイバーセキュリティ業務で試験的に使用している。

Project Glasswing（プロジェクト・グラスウィング）
Mythos Previewを限定的に運用しているAnthropicの取り組みの名称。glasswingは翅が透明な蝶を指す。

アラインメント（alignment）
AIの振る舞いを、人間の意図や価値観、安全性に沿わせること。逸脱（ミスアライメント）とは、欺瞞や悪用への加担など、人間の意図から外れた行動を指す。

effort control（努力量コントロール）
応答にどれだけの思考量・トークンを費やすかをユーザーが選べる新機能。高く設定すれば品質が上がり、低く設定すれば応答が速く利用枠の消費も緩やかになる。

dynamic workflows（ダイナミック・ワークフロー）
Claude Codeの新機能。何百もの並列サブエージェントを単一セッションで動かし、大規模な作業を計画・実行・検証する。リサーチプレビューとして提供される。

サブエージェント（subagent）
親となるAIが、特定の作業を切り分けて任せる補助的なエージェント。複数を同時並行で動かすことで大規模なタスクをこなす。

トークン（token）
AIが文章を処理する際の最小単位。入出力の料金や処理量はトークン数で計算される。

ベンチマーク（benchmark）
モデルの能力を測るための共通テスト。コーディングや推論などの分野ごとに性能を数値で比較できる。

adaptive thinking（適応的思考）
前世代Opus 4.7に搭載されていた、タスクに応じて思考時間を変える仕組み。簡単な作業にも時間をかけすぎるとの指摘があった。

fast mode（ファストモード）
応答速度を高めた動作モード。Opus 4.8では2.5倍速で動作し、従来モデルより3倍安価になった。現状はClaude APIなどでのリサーチプレビュー扱いで、利用できる環境は限定される。

【参考リンク】

Anthropic（公式サイト）（外部）
Claudeを開発する米国のAI企業の公式サイト。研究、製品、安全性に関する方針を発信している。

Claude（製品サイト）（外部）
Claudeを実際に利用できる公式インターフェース。Webやアプリから対話形式で各モデルを使える。

Claude Code（製品ページ）（外部）
開発者向けのエージェント型コーディングツール。dynamic workflowsはこの製品に搭載される。

Claude Opus 4.8 System Card（外部）
性能評価やアラインメント評価の詳細を記載した技術文書。ベンチマークや安全性テストの根拠が確認できる。

Databricks（公式サイト）（外部）
データ・AIプラットフォームを提供する企業。AIエージェント「Genie」でOpus 4.8を活用していると報告した。

Fast mode（Claude API Docs）（外部）
Opus 4.8のfast modeの仕様を解説した公式ドキュメント。対応プラットフォームや提供形態の最新情報を確認できる。

【参考動画】

【参考記事】

Anthropic’s Claude Opus 4.8 is here with 3X cheaper fast mode and near-Mythos level alignment（VentureBeat）（外部）
逸脱スコアが約1.9でOpus 4.7の2.5から低下し、Mythos Previewとほぼ並んだと報道。約2,600回の模擬調査が根拠。

Anthropic upgrades Claude with new Opus 4.8 model, details here（9to5Mac）（外部）
エージェント型コーディングが64.3%から69.2%へ、多分野推論が54.7%から57.9%へ上昇したと具体値を提示。

Anthropic releases Claude Opus 4.8, promising a more honest model（Techzine Global）（外部）
改善幅は1ポイント未満から9%弱までと幅があり、日々の体感は大きく変わらない可能性を冷静に指摘。

Anthropic releases new model, Opus 4.8（Axios）（外部）
支出に応じて使い方を調整できるツールを前面に出した発表だと位置づけ、模擬都市の事例にも言及している。

Anthropic releases Opus 4.8 with new ‘dynamic workflow’ tool（TechCrunch）（外部）
数十万行規模のコードベース移行が可能になった点に焦点を当て、Mythos留保の経緯も伝えている。

Anthropic Debuts Claude Opus 4.8, Teases Upcoming Launch of ‘Mythos-Class Models’（Gizmodo）（外部）
「ゲームチェンジャーではない」と評価。effort controlを前世代の不満への回答と位置づけている。

【関連記事】

Claude Design始動─Anthropicがデザインツール市場に参入、Claude Opus 4.7が下支え
今回のOpus 4.8の直系の前世代にあたるOpus 4.7と、それを基盤とするデザインツールを解説した記事。

Claude Opus 4.6発表、100万トークンのコンテキストと自律エージェント機能を搭載
今回登場したeffort controlの源流である「adaptive thinking」「4段階のeffort制御」の初出記事。

Claude Mythos Preview、開始1か月で深刻脆弱性1万件超を検出 ─ Anthropic「Project Glasswing」が暴いたAIサイバー防御の新局面
本記事で触れた「次に控えるMythos」の実績に特化し、その実力を深掘りした記事。

Anthropic主導「Project Glasswing」にIBM参画｜AI時代のセキュリティ防衛連合へ
用語解説で触れたProject Glasswingの全体像と、参画企業の広がりを伝える背景記事。

Claude Opus 4.6がFirefoxの脆弱性22件を発見—AIがセキュリティ研究者になる日
AIが脆弱性を発見する時代を描き、Mythosのサイバー文脈につながる伏線となる記事。

【編集部後記】

今回いちばん心に残ったのは、AIが「ここは自信がない」と自分から言えるようになった、という変化でした。賢さよりも正直さ。私たちが人と仕事をするときに大切にする感覚に、少し近づいた気がします。

みなさんは、AIに何を任せたいですか。速さでしょうか、それとも間違いを正直に教えてくれる誠実さでしょうか。effort controlのように「どれだけ力を込めるか」を自分で選べる時代に、私たちはAIとどんな距離感で付き合っていくのか。よければ、いっしょに考えていけたら嬉しいです。

AI（人工知能）ニュース｜サイバーセキュリティニュース｜テクノロジーと社会ニュース

Claude　Headline News

山本達也

『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

記事一覧