Claude Opus 4.7登場|「Mythosの体験版?」サイバーセキュリティ対応モデルの性能とは

AIモデルの能力競争が加速するなか、Anthropicは異例の透明性をもって新モデルを世に出した。「一般公開されている中では最も強力だが、公開できないほど高度な上位モデルが存在する」と自ら認めながらのリリース——それがClaude Opus 4.7だ。能力の飛躍と、安全性の段階的な検証という選択。その両立が何を意味するのか、数字とともに読み解く。


Anthropicは2026年4月16日、最新AIモデル「Claude Opus 4.7」の一般提供を開始した。Opus 4.6比でコーディングベンチマーク+13%、Rakuten-SWE-Benchでの本番タスク解決数が3倍、コンピューターユースの視覚精度(XBOW社計測)が54.5%から98.5%へと向上するなど、複数の指標で前モデルを上回る。

注目すべきはAnthropicが発表文中で「最も強力なモデルであるClaude Mythos Previewほど広く有能ではない」と公式に明記した点だ。Opus 4.7はProject Glasswingの方針に沿って、禁止・高リスクのサイバーセキュリティ用途を自動検出・ブロックするセーフガードを初搭載して公開された。価格はOpus 4.6と変わらず入力$5・出力$25(100万トークンあたり)で、Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryを通じて利用できる。

同日、highとmaxの中間に位置するxhigh推論レベルの追加、高解像度ビジョン(最大2,576px・約3.75MP)対応、タスクバジェット機能のパブリックベータ開始、Claude Codeへの/ultrareviewコマンド追加なども発表された。

From: 文献リンクIntroducing Claude Opus 4.7

【編集部解説】

「最強ではない」と自ら明かすリリース文

新モデルのリリース文で、「公開できない上位モデルが既に存在している」と自ら明かす——これは珍しい書き方です。

通常、AIモデルのリリース発表は、ベンチマーク上位を強調し、「最もパワフル」と売り込むものです。ところがAnthropicは、Opus 4.7について「Claude Mythos Previewほど広く有能ではない」と冒頭近くで認めています。社内には、もっと能力の高いモデルが既にある、しかし今回は出さない、と。なぜそんな書き方をするのか。背景を理解するには、先週発表されたProject Glasswingまで遡る必要があります。

Project Glasswingが露わにした「強すぎる能力」の扱い

Project Glasswingは、Anthropicが主導し、AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksとともに発足した、重要ソフトウェアのセキュリティを強化する12社(Anthropic含む)の取り組みです。

中心にあるのが、非公開のフロンティアモデル「Claude Mythos Preview」。このモデルは、数週間のあいだに、あらゆる主要OS・主要ウェブブラウザを含む複数のソフトウェアから、数千件の未公開脆弱性(ゼロデイ)を発見したとAnthropicは報告しています。

具体例として公式ページに挙げられているのは、27年前からOpenBSDに潜んでいた遠隔クラッシュ脆弱性、500万回の自動テストを通り抜けていたFFmpegの16年前のバグ、Linuxカーネルで権限昇格を成立させる脆弱性の連鎖発見——いずれもMythos Previewがほぼ自律的に特定したとされます。

脆弱性を「見つける」能力と、脆弱性を「悪用する」能力は、技術的には同じ地平にあります。Mythosは前者の目的で使われていますが、同じ力が逆方向に働けば、攻撃者の生産性も跳ね上げてしまう。このことからAnthropicは誰にでも使える形では公開しなかったと読み取れます。

実際、Mythos Previewへのアクセスは、上述のパートナー企業と、重要ソフトウェアを管理する40以上の組織に限定。利用価格はOpus 4.7の5倍にあたる入力$25・出力$125(100万トークンあたり)に設定される予定で、一般向けの広範公開は現時点で予定されていないと明言されています。

「一段下のモデル」でセーフガードを育てる

Opus 4.7は、このような文脈のなかで登場しました。トレーニング段階でサイバー関連の能力を意図的に抑制したうえで、禁止・高リスクのサイバーセキュリティ用途を自動検出・ブロックするセーフガードを初めて搭載したモデルです。

設計の意図は明確です。Opus 4.7でセーフガードを実環境に展開し、検知と誤検知のバランスを現場から学ぶ。そこで得た知見を、「Mythosクラスのモデルを広くリリースするという最終目標」に向けた地ならしに使う。つまり、安全装置を先に「危なすぎないモデル」で鍛え、後から本命のモデルに搭載する——そうした段階運用です。

新しい技術ほど制御された環境で先に検証する、という発想自体は工学全般に共通する考え方です。それが今回、AIモデル自体を「能力の段階」で区切り、公開範囲と安全装置を対応づけるかたちで明示的に運用化されたという点は、生成AIの歴史のなかでひとつの転換点と言えそうです。

正規のサイバーセキュリティ業務(脆弱性調査、ペネトレーションテスト、レッドチーミングなど)でOpus 4.7を必要とする専門家に向けては、新設の「Cyber Verification Program」への参加が案内されています。セーフガードが正当な業務を阻害しうるケースを運用側が吸収しながら進める構えと読めます。

コンピューターユースが実験段階を越えた日

もう一つ、現場レベルで大きな変化があります。Opus 4.7は、コンピューターユース(モデルが画面を見てマウスやキーボードを操作する機能)のビジュアル精度が、Opus 4.6の54.5%からOpus 4.7の98.5%へと跳ね上がりました(自動ペネトレーションテストを手がけるXBOW社の計測)。

44ポイントの向上は、実用面では「使える/使えない」の境界線を越える類の変化です。XBOWのCEO Oege de Moor氏は「Opus最大の痛点が事実上消えた」と評し、以前は使えなかった種類の業務で活用できる領域が一気に広がったと述べています。もっとも、XBOWが手がけているのは自律型のペネトレーションテストです。コンピューターユースの精度向上がエージェント時代の実用化を後押しする一方で、それ自体がサイバー能力でもある——という両義性をこの事例は端的に示しています。セーフガードの必要性とコンピューターユースの到達点は、同じ技術の表裏として読むべきでしょう。

「指示を文字通りに受け取る」ことの両刃

Anthropicは、Opus 4.7が「指示を文字通りに受け取るようになった」と説明しています。Opus 4.6以前は、指示を大まかに解釈したり、一部をスキップしたりすることがあったのに対し、Opus 4.7はそのまま実行する。これは歓迎すべき改善ですが、既存システムにとっては波紋を生みます。これまで「AIがある程度ゆるく解釈してくれる」前提で書かれてきたプロンプトは、予期しない結果をもたらしうる——Anthropicは明示的に「プロンプトとハーネスの再調整を推奨」しています。長く使ってきたワークフローほど、見直しの手間が発生する可能性があるという意味です。

加えて、トークナイザーの更新により、同じ入力でも1.0〜1.35倍のトークンを消費するようになった点は実務上見逃せません。単価は据え置き(入力$5・出力$25/100万トークン)であっても、トークン数が増えれば実効コストは上昇方向に働きます。高effortレベルで思考量が増える設計も、同じベクトルです。この点をコントロールする手段として、同日にhighとmaxの中間に位置するxhigh推論レベルの追加、そして長時間タスクでのトークン配分を制御できる「タスクバジェット」のパブリックベータ開始も発表されています。「思考の深さ」と「コスト」のトレードオフを、開発者が手元で調整できる方向に進んでいると見えます。

AIの「使い分け」が始まっている

ここまで整理すると、一つの構図が見えてきます。同じメーカーのAIモデルに、能力と公開範囲の異なる階層が、意識的に設計されつつある——という構図です。

Mythos Preview(非公開・Glasswingパートナーと40以上の組織のみ)は最高性能で、Anthropic評価上「最もアライメントが高い」モデル。価格はOpus 4.7の5倍。Opus 4.7は一般公開の最上位として、サイバー能力を意図的に抑えセーフガードを搭載。Sonnet 4.6 / Haiku 4.5は用途・コスト別のラインナップを担う。

興味深いのは、同じリリース文の中で、Anthropicが自社評価上Mythos Previewを「トレーニングしたなかで最もアライメントが高いモデル」と位置づけている一方、Opus 4.7のアライメント評価については「概ね整合されており信頼できるが、行動として完全に理想的ではない」と結論づけている点です。最も能力が高いモデルが最もアライメントも高い、という一致は、「能力と安全性はトレードオフ」という素朴な見方を覆します。ただし、これをもって「能力があればアライメントも自動的に付いてくる」と早合点するのも正確ではありません。Mythos Previewが広く公開されない決定が別途下されているということは、モデル設計上のアライメントと、社会に出したときの安全性が、別の問題として扱われていることを意味しています。

ここから見えてくるのは、AIモデルがかつてのように「単一の最強」を目指す時代から、能力・公開範囲・安全装置を束ねて複数の階層で運用する時代へと、少なくともAnthropicにおいては移行しつつあるということ。私たちもAIを業務に使う場面で、「どのモデルを使うか」だけでなく「そのモデルは何ができるように/できないように設計されているか」を意識する必要が出てきていると言えます。

ここから先の注目点

個人的に注視したい「まだ分からないこと」がいくつかあります。一つは、Mythos Previewがいつ広く公開されるのか。Anthropicは「Mythosクラスのモデルの広範リリースが最終目標」と明言していますが、その条件である“どの水準のセーフガードが完成すれば解禁されるのか”は明示されていません。Opus 4.7での実運用データがその判断材料になるはずで、90日以内に公開されるAnthropicの報告書が最初の手がかりになりそうです。

もう一つは、他のAI開発各社がこの「使い分け」アプローチに追随するか否か。OpenAI、Google、Metaなどが、能力と公開範囲を段階化した運用に寄せてくるのか、あるいは別の枠組みを提示してくるのか。業界全体として強すぎる能力の扱いに共通の作法が形成されるまでには、まだ時間がかかると見るのが妥当でしょう。

そしておそらく最も重要なのは、Project Glasswingが掲げる「防衛側が先手を取る」という賭けが成立するか否かです。発見された数千件の脆弱性のうち、どこまでが実際に修正まで到達し、悪用される前に塞がれるのか。悪意ある側が同等の能力を手にするまでの時間との競争になる局面で、この構図がうまく機能するかどうかは、今後の数ヶ月〜1年で徐々に明らかになっていくはずです。その意味で、Opus 4.7のリリースは単なるモデル更新というより、AI業界が「能力そのものを売る」フェーズから「能力と安全装置のパッケージを売る」フェーズに移る局面の実例として記録されるべき出来事と言えるかもしれません。

【用語解説】

Claude Mythos Preview
Anthropicが開発した非公開のフロンティアモデル。サイバーセキュリティ能力が特に高く、主要OS・ブラウザを含む複数ソフトウェアから数千件の未公開脆弱性を自律的に発見できるとされる。能力が高すぎることを理由に一般公開されず、Project Glasswingのパートナー企業と40以上の重要ソフトウェア管理組織に限定提供。利用価格は入力$25・出力$125(100万トークンあたり)の予定で、Opus 4.7の5倍に設定される見込み。なお、Anthropicの評価では「トレーニングしたなかで最もアライメントが高いモデル」とされており、能力と安全性が高い次元で両立している点が注目される。

Project Glasswing
Anthropicが主導する、重要ソフトウェアのセキュリティを強化するための業界横断イニシアチブ。Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksが参加。Mythos PreviewをOSSメンテナーや重要インフラ管理者に提供し、脆弱性の発見・修正を加速させることを目的とする。$1億ドルのAIクレジット提供、$400万ドルのOSS財団への寄付を含む。90日以内に進捗報告書を公開予定。

セーフガード(Cyber Safeguard)
禁止・高リスクのサイバーセキュリティ用途を示すリクエストを自動検出してブロックする仕組み。Opus 4.7に初搭載。「禁止用途」(例:攻撃インフラの構築支援)と「高リスク用途」(例:実環境での脆弱性悪用支援)を区別し、正当な脆弱性調査・ペネトレーションテスト等は別途Cyber Verification Program経由で対応。Opus 4.7での実運用データが、将来的なMythosクラスモデルへの同機能搭載の判断材料になる。

コンピューターユース(Computer Use)
AIモデルが画面を視覚的に認識し、マウスやキーボードの操作を通じてGUI上のタスクを実行する機能。Opus 4.7では長辺2,576px(約3.75MP)の高解像度対応(従来の3倍超)と組み合わさり、XBOWの計測でビジュアル精度が54.5%から98.5%へと向上。「実験的機能」から「実用レベル」への到達を示す数字として注目される。

アライメント(AI Alignment)
AIモデルの出力・行動を、開発者の意図・人間の価値観・社会規範と整合させる取り組みの総称。技術的には、欺き・迎合(sycophancy)・悪用への協力といった「望ましくない行動」の発生率を評価指標として用いることが多い。Anthropicの評価では、Opus 4.7は「概ね整合されており信頼できるが、行動として完全に理想的ではない」、Mythos Previewは「最もアライメントが高い」とされている。

ゼロデイ(Zero-Day)
ソフトウェアの開発者にまだ知られていない脆弱性、またはそれを突いた攻撃手法の総称。公表・修正(パッチ適用)前の「0日目」から悪用されうることが語源。Mythos Previewは、OpenBSDに27年間潜伏していた遠隔クラッシュ脆弱性、FFmpegで500万回の自動テストを通り抜けていた16年前のバグ、Linuxカーネルの権限昇格チェーンなど、複数の長期潜伏ゼロデイを発見したとされる。

Cyber Verification Program
正規のサイバーセキュリティ業務(脆弱性調査・ペネトレーションテスト・レッドチーミング等)でOpus 4.7を使用したいセキュリティ専門家向けの申請プログラム。Anthropicが新設。セーフガードが正当業務をブロックするケースに対応するための運用上の窓口。

SWE-Bench / Rakuten-SWE-Bench
ソフトウェアエンジニアリング能力を測るベンチマーク。SWE-Bench Verifiedは実際のGitHubイシューを解決する能力を評価(Opus 4.7は87.6%)。Rakuten-SWE-BenchはRakutenが開発した本番環境のタスクを対象とした派生版で、Opus 4.7はOpus 4.6比で解決数が3倍に向上したと報告されている。

xhigh effort level
Anthropicが同日追加した新しい推論深度の設定値。既存のhighとmaxの中間に位置する。難しい問題での推論精度とレイテンシーのトレードオフをより細かく調整可能にする。Claude Codeでは全プランのデフォルトがxhighに引き上げられた。Opus 4.7のコーディング・エージェント用途ではhighまたはxhighからの試用が推奨される。

タスクバジェット(Task Budget)
長時間のエージェントタスクにおいて、Claudeのトークン消費を作業の優先順位に応じてガイドする機能。Claude Platform(API)でパブリックベータとして同日開始。コスト制御と作業の重点配分を両立させる手段として、xhigh推論レベルと組み合わせた活用が想定される。

トークナイザー(Tokenizer)
テキスト入力をモデルが処理可能なトークン(単語・部分文字列の単位)に分割する仕組み。Opus 4.7ではトークナイザーが更新され、同じ入力テキストに対してコンテンツの種類によって約1.0〜1.35倍のトークン数にマッピングされる場合がある。単価(入力$5・出力$25)は据え置きだが、トークン数の増加により実効コストが上昇しうる点は移行時の注意事項。

【参考リンク】

Project Glasswing(Anthropic公式)(外部)
Mythos Previewの能力・公開限定の理由、発見された脆弱性の具体例、12社のパートナー一覧、$100Mクレジット、報告書公開予定など記事の文脈背景を網羅。

Claude Opus 4.7 System Card(安全性評価の詳細)(外部)
アライメント評価・サイバー能力評価・ベンチマーク詳細を含むAnthropicの公式安全性報告書。

Cyber Verification Program(申請窓口)(外部)
脆弱性調査・ペネトレーションテスト・レッドチーミング等の正規用途でOpus 4.7利用を希望するセキュリティ専門家向けの申請フォーム。

Opus 4.7 移行ガイド(Claude API Docs)(外部)
Opus 4.6からOpus 4.7への移行手順。トークナイザー変更・effort level・タスクバジェットの調整方法を記載。

Claude API モデル概要(Claude API Docs)(外部)
利用可能なモデルの一覧と各モデルのAPI仕様(コンテキスト長・価格・モデルID等)。claude-opus-4-7で呼び出し可能。

    【参考記事】

    Project Glasswing — Anthropic公式(外部)
    Opus 4.7の背景となるGlasswing全体像を解説。Mythos Previewの限定公開の理由とパートナー企業による脆弱性発見の具体例が読める。

    Assessing Claude Mythos Preview’s cybersecurity capabilities — Anthropic Red Team(外部)
    Mythos Previewのサイバー能力を評価した技術論文。「強すぎる能力をなぜ公開しないのか」という判断の技術的根拠にあたる。

    Introducing Anthropic’s Claude Opus 4.7 model in Amazon Bedrock — AWS News Blog(外部)
    AWSの視点からOpus 4.7のBedrock対応を解説。プロビジョニング・キャッシュ・バッチ処理等との組み合わせ方を補完的に把握できる。

    Introducing Project Glasswing: Giving Maintainers Advanced AI to Secure the World’s Code — Linux Foundation(外部)
    OSSメンテナーの立場からProject Glasswingへの参加意義を説明。ソフトウェアコモンズの観点から「防衛側が先手を取る」取り組みの意味を論じる。

    Strengthening secure software at global scale: How MSRC is evolving with AI — Microsoft MSRC(外部)
    GlasswingパートナーMicrosoftのセキュリティレスポンスセンターが、AI活用による大規模インフラのセキュリティ対応進化を解説。

      【編集部後記】

      「防衛側が本当に先手を取れるのか」Project Glasswingが立てた賭けは、Opus 4.7の公開をもって、いよいよ実環境で検証される局面に入りました。セーフガードが現場でどこまで機能するのか、Mythosクラスの公開はどんな条件で解禁されるのか。90日以内に予告されているAnthropicの報告書は、この新しい運用様式のゆくえを見届ける最初の手がかりになるはずです。私も引き続き、続報を追いかけていきます。

      投稿者アバター
      まお
      おしゃべり好きなライターです。趣味は知識をためることとゲームをすること(ソシャゲや音楽ゲームが大好きです)。最近はAIの情勢や地政学の問題を勉強中。時折記者として会見や発表に赴いたり、インタビューを行ったりもしています。