Anthropic が、これまで一般公開してきたどのモデルより強力な Claude Fable 5 を世に出しました。サイバー攻撃や危険な生物研究につながりそうな質問には、自動で一段下のモデルが応答する仕組み付き。同時に、同じ性能で制限を一部外した限定版 Mythos 5 も登場しています。最強の道具を、安全装置とセットで広く配る——その挑戦の全体像を整理します。
Anthropic は2026年6月9日、Claude Fable 5 を公開した。一般利用向けに安全化した Mythos クラスのモデルで、同社がこれまで一般提供したモデルの能力を上回るとする。サイバーセキュリティ、生物・化学、蒸留に関する要求を分類器が検出した場合は、次点モデルの Claude Opus 4.8 が応答するフォールバックを実装し、発動は平均してセッションの5%未満だとする。
同日、Fable 5 と同一の基盤モデルで一部のセーフガードを解除した Claude Mythos 5 も公開し、米国政府と連携した Project Glasswing を通じて Claude Mythos Preview の後継として展開する。早期テストでは Stripe が5000万行の Ruby コードベースの全面移行を1日で実行したと報告した。
価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、API モデル名は claude-fable-5。サブスクリプションプランでは6月9日から6月22日まで追加費用なしで提供する。
From:
Claude Fable 5 and Claude Mythos 5
【編集部解説】
今回の発表で最初に押さえておきたいのは、「Mythos(ミトス)」と「Fable(フェイブル)」という二つの名前の関係です。両者は同じ基盤モデルであり、能力そのものに差はありません。違いはセーフガード、つまり安全装置の有無だけです。Anthropic は脚注で、Fable がラテン語の fabula(語られるもの)に由来し、ギリシャ語の mythos に通じると説明しています。能力が同じでも、危険な使われ方を防ぐ仕組みを備えたものを一般公開用の Fable 5、それを外した限定版を Mythos 5 と呼び分けた、という整理です。
技術的に目新しいのは、危険とされる要求を「拒否」するのではなく、一段下のモデルである Opus 4.8 に処理を肩代わりさせる「フォールバック」という設計でしょう。サイバーセキュリティ、生物・化学、そして自社モデルの能力を盗み取る「蒸留(distillation)」に関わる問いがそれにあたります。利用者にとっては、門前払いされるより自然な体験になる一方で、何が高リスクと判定されるかの線引きは Anthropic 側に委ねられます。
この仕組みが効くのは、Mythos クラスが持つ能力が、それだけ社会に与える振れ幅が大きいからです。Stripe の事例のように開発現場の生産性を一変させ、創薬や分子生物学では新しい仮説を生み出す。その同じ力が、悪意ある者の手に渡れば脆弱性の発見やウイルス設計を助けてしまう。記事中の AAV(遺伝子治療の運搬体)の例は、遺伝子治療という善意の研究と危険な転用とが、技術的には地続きであることを示す象徴的なケースです。こうした「両用性(デュアルユース)」こそ、今回の安全策が向き合っている本質だと、私は受け止めています。
見逃せないのが、発表のタイミングです。Anthropic はこの数日前の6月5日、AI が人間の介入なしに自らを改良する「再帰的自己改善」の危険性に触れ、業界全体に開発の「ブレーキペダル」を持つべきだと警告したばかりでした。その直後に、自社で最も強力なモデルを一般公開する。警鐘を鳴らしながらアクセルも踏むという姿勢を、矛盾と見るか、安全装置を作り込んだ上での一貫した行動と見るかは、読者の判断が分かれるところでしょう。
規制との関係も重要な伏線です。米国では6月2日、フロンティアモデルを公開前に連邦政府へ任意で提出し、最大30日前に早期アクセスを認める任意の枠組みを定めた大統領令が署名されました。今回のフォールバック設計や30日間のデータ保持ポリシーは、こうした政策の流れと呼応している可能性があります。Anthropic と国防総省の間には、同社技術を「サプライチェーンのリスク」と指定した件をめぐる係争も続いており、政府との距離の取り方が製品設計に影響した可能性も考えられます。
長期的に見れば、これは「最先端の能力を、安全装置とセットでどこまで広く配るか」という問いへの、一つの実装解と言えます。能力の解放と封じ込めを同じモデルの中で切り替えるという発想は、今後の業界標準になる可能性があります。とはいえ、その封じ込めが完璧でないことは Anthropic 自身も認めており、英国 AISI が短期間で突破口に近づいたとも記しています。便益とリスクの綱引きは、これからも続いていく。私たちはその過程を、期待と警戒の両方を持って見届けていく必要があるでしょう。
【用語解説】
Mythos クラス(ミトス・クラス)
Anthropic のモデル階層で、Opus クラスの上位に位置する最上位ティアである。第1弾の Claude Mythos Preview が2026年4月に登場し、今回の Fable 5 と Mythos 5 が続く。
Claude Fable 5 / Claude Mythos 5
いずれも同一の基盤モデルだが、安全装置の有無で呼び分けられる。一般公開向けに安全化したものが Fable 5、一部の安全装置を外した限定提供版が Mythos 5 である。
Claude Opus 4.8
2026年5月下旬に発表された Anthropic の高性能モデル。Fable 5 が高リスクと判定した要求の応答を肩代わりする「次点モデル」として機能する。
フォールバック
要求を拒否する代わりに、別のモデル(ここでは Opus 4.8)へ処理を切り替える仕組み。利用者には切り替えが起きたことが通知される。
分類器(classifier)
誤用やジェイルブレイク(脱獄)の試みを検出し、本体モデルの応答を止める別個の AI システムを指す。
蒸留(distillation)
あるモデルの能力を抽出し、別の競合モデルの訓練に流用する手法。Fable 5 では、蒸留と判定された要求も Opus 4.8 にフォールバックされる。
ジェイルブレイク(脱獄)
安全装置が存在しないかのようにモデルを操作する試み。あらゆる文脈で安全策を回避できるものを「普遍的脱獄(universal jailbreak)」と呼ぶ。
デュアルユース(両用性)
同じ技術や情報が、有益にも有害にも使われうる性質。サイバーや生物分野の高度な能力が典型例である。
AAV(アデノ随伴ウイルス)
遺伝子治療で遺伝子を細胞に運ぶ運搬体。治療に役立つ一方、同じ設計能力が危険なウイルス開発に転用されうる代表的なデュアルユース対象である。
トークン
AI が文章を処理する際の最小単位。料金は入力・出力それぞれ100万トークンあたりで設定されている。
再帰的自己改善(recursive self-improvement)
AI が人間の介入なしに自らを改良し続ける能力。Anthropic が6月5日に「ブレーキペダルが必要」と警告した際の中心的な論点である。
英国 AISI(AI Security Institute)
英国政府傘下の AI 安全性評価機関。今回、Fable 5 の安全策に対し短期間で突破口に近づいたと記されている。
【参考リンク】
Anthropic|Claude Fable(製品ページ)(外部)
Fable モデルの位置づけや特徴をまとめた製品紹介ページ。Mythos クラスのうち一般公開版にあたる。
Anthropic|Project Glasswing(外部)
Mythos クラスをサイバー防衛者や重要インフラ提供者に限定提供する取り組みの公式ページ。Mythos 5 の初期展開先である。
Anthropic|Claude(公式トップ)(外部)
Anthropic の企業・製品全体を案内する公式サイト。最新モデルや研究、安全性への取り組みへの入口となる。
Stripe(外部)
オンライン決済インフラを提供する米企業。早期テストで5000万行の Ruby コードベースの全面移行を1日で実行したと報告した。
Claude API|モデル一覧(開発者向けドキュメント)(外部)
開発者が claude-fable-5 を含む各モデルを利用するための公式ドキュメント。仕様や使い方を確認できる。
【参考動画】
公式チャンネルによる Claude Fable 5 単独の解説動画は確認できませんでした。検索で見つかった非日本語の解説動画は信頼度の判断が難しいため、本媒体の基準に照らして掲載を見送ります。なお Anthropic 公式ブログには、Fable 5 が Pokémon FireRed を視覚情報のみでクリアするタイムラプス映像が掲載されています。能力を直感的に把握する材料として、一次情報での確認をおすすめします。
【参考記事】
CNBC|Anthropic releases Mythos-like AI model to the public, Claude Fable 5(外部)
一部ベンチマークで Fable 5 が Opus 4.8 を10%以上上回ったと報じる。能力の飛躍ゆえに追加のガードレールが必要になったとする説明や、IPO への投資家の関心にも触れている。
TechCrunch|Anthropic’s Claude Fable 5 is a version of Mythos the public can access today(外部)
1000時間超の外部バグバウンティで普遍的脱獄が見つからなかった点を強調。発表が危険性への警告の数日後だった矛盾を指摘している。
VentureBeat|Anthropic brings Mythos to the masses with Claude Fable 5(外部)
価格が Mythos Preview の半額未満ながら主要モデル中で最も高価だと指摘。Slay the Spire で永続メモリが3倍の改善をもたらしたと伝える。
NBC News|Anthropic releases Fable 5, the first public Mythos-class model(外部)
Mythos Preview が世界150超の組織に提供されてきた経緯を整理。創薬や分子生物学での記録更新や、大統領令との関係に言及する。
Crowell & Moring|Executive Order Creates Voluntary Regulatory Regime of Frontier AI Models(外部)
6月2日署名の大統領令を法務視点で解説。公開30日前の連邦政府への任意提出の枠組みなどを整理している。
CNN Business|Anthropic warns that AI will soon be able to improve itself without human intervention(外部)
6月5日の「ブレーキペダル」警告を報道。再帰的自己改善の危険性と、IPO 申請との時期的な重なりにも触れている。
CNBC|Trump signs AI executive order asking companies to give government early access to models(外部)
6月2日署名の大統領令を報道。国防総省が Anthropic を「サプライチェーンのリスク」と指定し、同社が係争中である経緯にも触れている。
【関連記事】
Anthropicが警告、AIが自らを作る「再帰的自己改善」—Claudeが社内コードの80%超を執筆
Fable 5 公開前夜の「ブレーキペダル」警告を扱った記事。発表タイミングの背景を理解する前提になります。
トランプ大統領令、AIフロンティアモデルに政府が30日前アクセス|任意の安全枠組みを解説
本記事の「30日前提出」「データ保持30日」の規制的背景を補完する解説記事です。
Claude Mythos/Anthropicの新AIが世界の金融機関を揺るがす
Mythos クラスとは何か、なぜ一般公開されなかったのかを解説したシリーズ起点記事です。
【編集部後記】
正直に言うと、この記事を書きながら何度も手が止まりました。「世界で最も強力なモデルを、安全装置とセットで誰もが使える形にした」——言葉にすればシンプルですが、その一文の重さを、私はまだ完全には測りきれていません。
みなさんが普段 Claude や他の AI を使っていて、「ここから先は別のモデルがお答えします」と画面が切り替わったら、どう感じるでしょうか。守られていると感じるか、それとも壁を感じるか。たぶん、その日の用件によって答えは変わりますよね。私もそうです。
ひとつだけ確かに思うのは、これからは「何ができるか」と同じくらい、「何をあえてさせないか」が、技術を語るうえで大切になっていくということです。アクセルとブレーキ、その両方の話を、これからもみなさんと一緒に追いかけていけたらうれしいです。












