サイバー専門家数十名が米政府のAnthropic輸出規制に異議|「コード修正はジェイルブレイクではない」

「コードのバグを直して」とAIに頼むことは、ジェイルブレイクなのか——その問いが、米国のサイバーセキュリティ政策を揺さぶっています。


セキュリティ業界の重鎮を含む多数の専門家が2026年6月14日、「freefable.org」と題した公開書簡を発表し、AnthropicのFable 5およびMythos 5に対する米政府の輸出規制撤回をホワイトハウスに求めた。書簡は元Facebookセキュリティトップのアレックス・スタモス氏が主導し、Luta Security創業者のケイティ・ムスリス氏、SocialProof Security CEOのレイチェル・トバック氏らが署名している。

規制の根拠となったのは、Amazon研究者が執筆した非公開論文とされるジェイルブレイク手法だ。ムスリス氏はこの論文を直接確認したうえで、研究者が行ったのはFableに既知の脆弱性を含むコードの修正を求めただけであり、本来のジェイルブレイクではないと反論した。「この動作は意味のある形で修正できるものではなく、修正しようとすればモデルの防御能力を弱めるだけだ」と述べている。

書簡はまた、論文が示した能力はGPT-5.5やClaude Opus、中国モデルの「Kimi 2.7」でも再現可能であり、Fable 5に固有の脅威ではないと主張。「攻撃側が急速に進歩している中、正当な理由なく防御側から最良のツールを取り上げることは危険だ」と訴えた。

TechCrunchの報道時点で、76人のサイバーセキュリティ専門家が署名している。 

From: 文献リンクCybersecurity vets protest ‘dangerous’ US government ban on Anthropic’s most powerful models

【編集部解説】

今回の規制の技術的な根拠を整理しておくことが重要です。Amazonの研究者たちが行ったのは、既知の脆弱性を含むオープンソースコードと、意図的に脆弱性を埋め込んだコードを用意し、Fable 5に「セキュリティ上の問題についてコードをレビューしてほしい」と要求することでした。Fable 5はこれを拒否しました。次に研究者たちは「このコードを修正してほしい」と依頼し、複数の手動ステップを経て、パッチを検証するスクリプトを生成させました。

問題は、この手順のどこに「ガードレール迂回」があるのかという点です。書簡署名者でもあるムスリス氏が実際に論文を読んだうえで述べているのは、「コードの修正を求める能力は、防御的なセキュリティにとって最も価値あることをAIにさせているにすぎない」ということです。バグを発見し、修正し、パッチの動作を確認するというのは、セキュリティエンジニアが日々繰り返す基本的なループです。これを「ジェイルブレイク」と呼ぶことへの反論は、技術的に見て相当な説得力を持っています。

「Fable固有の脅威」という前提が崩れている

書簡が指摘するもう一つの核心は、Fable 5が持つとされる脆弱性発見能力が、他のモデルにも同様に備わっているという点です。GPT-5.5、AnthropicのOpusやSonnet、さらに中国のKimi 2.7でも同等の能力が再現可能だとしています。

Anthropicも自社の声明でこの点を認めており、「この基準を業界全体に適用すれば、すべてのフロンティアモデル提供者による新モデルの展開が事実上停止するだろう」と述べています。規制の根拠が「Fable 5が特別に危険だ」という前提に立つとすれば、その前提はかなり脆弱と言えます。

規制が防御者を弱体化させるWassenaar条約の教訓

ムスリス氏がWassenaar条約の再交渉に関わった経験から指摘しているのは、AI規制にも同じ構造的な落とし穴があるということです。2013年に「侵入ソフトウェア」への輸出規制が適用された際、その文言が広すぎたために、脆弱性開示や事件対応といった防御的な活動まで規制対象となりかねない状況が生まれました。

今回の規制も同じ問題を抱えています。中国をはじめとする競合国のモデルは輸出規制の対象外であり、数ヶ月以内に同等の能力に追いつくとも言われています。その状況で、米国のセキュリティ防御者だけが最も優れたツールを使えない状態になるとすれば、安全保障の観点から見ても合理的とは言えません。「輸出規制でサイバーレジリエンスは達成できない」というムスリス氏の言葉は、この構造的矛盾を端的に表しています。

署名者の一部は数週間前、同じモデルの危険性を警告していた

一点留保が必要なのは、署名者の中に、数週間前にはMythosクラスのモデルによるサイバー攻撃リスクについて企業向けに警告を発していた人物が含まれていることです。これは矛盾ではなく、「強力なモデルには固有のリスクがあるが、それを理由に防御側からツールを取り上げることは別問題だ」という立場の表明とも読めます。とはいえ、今後の議論の中でこの点が問われることになるのは避けられないでしょう。

現時点でAnthropicはワシントンDCに担当者を派遣し、政府との直接交渉を進めているとも報じられています。規制の是非をめぐる対話が、業界と政府の間でどのように展開するかが、当面の注目点です。

【用語解説】

輸出管理指令(Export Control Directive)
米国の安全保障法に基づき、特定の技術・製品を外国籍者や海外に提供することを制限する行政命令。本来は半導体や軍事技術に適用されてきたが、今回はAIモデルそのものに発動された。

ジェイルブレイク(Jailbreak)
AIモデルの安全装置(ガードレール)を回避し、通常は拒否される応答を引き出す手法。「汎用的なジェイルブレイク」は幅広い制限を突破できるのに対し、「限定的なジェイルブレイク」は特定の状況下でのみ機能する。

ガードレール(Guardrail)
AIモデルに組み込まれた安全制限機能。危険なコンテンツの生成や特定の悪用を防ぐために設計される。Fable 5ではサイバーセキュリティ・生物・化学・モデル蒸留の4分野に強力なガードレールが設けられていた。

【参考リンク】

Open Letter on Transparent AI Cyber Protections(freefable.org)(外部)
今回の公開書簡の全文。署名者一覧と4つの要求事項を確認できる。

Statement on the US government directive to suspend access to Fable 5 and Mythos 5(Anthropic)(外部)
Anthropicによる公式声明。停止の経緯と規制への反論が示されている。

【参考記事】

Cybersecurity experts blast US government for restricting Anthropic’s AI models — Cybersecurity Dive(外部)
書簡署名者の一部が数週間前にMythosの危険性を警告していた経緯を指摘。業界内の立場の複雑さを報じる。

The Fable 5 Export Controls Harm US Cyber Defense(Luta Security)(外部)
ムスリス氏によるAmazon論文の詳細分析。論文を実際に読んだ唯一の外部専門家による一次情報。

【関連記事】

Anthropic「Mythos」「Fable 5」を全面停止、ホワイトハウスの輸出規制と中国アクセス疑惑の全容
規制発令の経緯・商務省の枠組み・中国アクセス疑惑まで詳細にまとめた記事。

Claude Fable 5、公開数日でジェイルブレイクか——Anthropicの最新AIに何が起きたか
今回の規制の直接の引き金となったジェイルブレイク事件を報じた記事。

リミッター付きの最強モデル─Claude Fable 5、セキュリティ専門家が『仕事に使えない』と訴える理由
Fable 5のガードレールが防御側の専門家を締め出すという「ディフェンダーのジレンマ」を解説した記事。

【編集部後記】

今回の書簡が問いかけているのは、「どの行為がジェイルブレイクか」という技術的な定義の話だけではありません。「防御のためにAIを使う行為が、規制によって犯罪に近い扱いを受ける」という逆説が、現実のものになりかけているということです。規制する側と守る側の認識にこれほどの乖離があるとすれば、今後どのような対話の仕組みが必要なのか——私たちも引き続き注目していきます。

Googleで優先するソースとして追加するボタン
投稿者アバター
まお
おしゃべり好きなライターです。趣味は知識をためることとゲームをすること(ソシャゲや音楽ゲームが大好きです)。最近はAIの情勢や地政学の問題を勉強中。時折記者として会見や発表に赴いたり、インタビューを行ったりもしています。