AnthropicのClaude Sonnet 4.5は標準的なオープンソースツールのみを使用して数十台のホストを持つネットワークへの多段階攻撃に成功できるようになった。
特筆すべきは、Kali LinuxのBashシェルだけで史上最大級の被害を出したEquifaxデータ侵害の高精度シミュレーションを再現し、全ての個人情報を流出させることに成功した点である。
Sonnet 4.5は公表済みCVEを即座に認識し、調査や試行錯誤なしに悪用コードを記述できる。
元のEquifax侵害も未パッチの公表済みCVEを悪用したものであり、高度で高速なAIエージェントの出現は迅速なセキュリティパッチ適用の重要性を強調している。
From:
AIs are Getting Better at Finding and Exploiting Internet Vulnerabilities – Schneier on Security
【編集部解説】
セキュリティ専門家ブルース・シュナイアーのブログから興味深いニュースが届きました。AnthropicのClaude Sonnet 4.5が、標準的なオープンソースツールのみを使用して、複雑なネットワークへの多段階攻撃に成功できるようになったというのです。
このニュースが示すのは、AIによる脆弱性の自動悪用が現実のものとなってきたということです。特に注目すべきは、Sonnet 4.5が2017年に発生した史上最大級のデータ侵害であるEquifax事件を、高精度なシミュレーション環境で再現できたという点です。
Equifax事件は、Apache StrutsのCVE-2017-5638という公表済みの脆弱性が未パッチのまま放置されたことで発生しました。攻撃者はこの脆弱性を悪用し、約1億4800万人の個人情報を盗み出しました。Sonnet 4.5は、このCVEを即座に認識し、調査や試行錯誤なしに悪用コードを記述してシミュレーション環境で全ての個人情報を流出させることに成功しています。
これは技術的な進化が急速に進んでいることを示しています。Sonnet 4.5の前世代であるSonnet 3.5は、わずか1年前のリリース時にはカスタムのサイバーツールキットなしではEquifaxシミュレーションに成功できませんでした。しかしSonnet 4.5は、5回の試行のうち2回、Kali Linuxの標準的なBashシェルだけでこの攻撃を成功させています。
Carnegie Mellon大学との共同研究では、Incalmoと呼ばれるサイバーツールキットを使用した評価も行われました。これらは単純なCTF(Capture The Flag)課題ではなく、実際の企業ネットワークを模した現実的な環境でのテストです。
Anthropicは防御側の能力向上に焦点を当てた研究を行っており、脆弱性の発見、パッチ適用、侵入テストといった防御的なタスクの改善に取り組んでいます。Cybenchという評価では、Sonnet 4.5が10回の試行で76.5%の課題を解決しました。これは半年前のSonnet 3.7の35.9%から2倍以上の向上です。
また、CyberGymという別の評価では、Sonnet 4.5が既知の脆弱性を66.7%のプログラムで再現し、新たな脆弱性を33%以上のプロジェクトで発見しました。実際にHackerOneでは、ClaudeのAIエージェントによって脆弱性の平均処理時間が44%削減され、検出精度が25%向上したと報告されています。
この技術の進化は両刃の剣です。攻撃者がAIを使って攻撃を自動化・高速化できる一方で、防御側もAIを活用してより迅速に脆弱性を発見し、パッチを適用できるようになります。ブルース・シュナイアーが指摘するように、「自動的な脆弱性悪用はサイバーセキュリティにおける大きな変化となるだろう」というのは、まさにその通りです。
重要なのは、これが今まさに起きている変化だということです。理論上の可能性ではなく、現実の脅威として、そして同時に防御のための強力なツールとして、AIがサイバーセキュリティの風景を塗り替えつつあります。シュナイアーが10月に記事を書いて以来、さらに大きな進展があったと述べているように、この変化のスピードは加速しています。
企業や組織にとって、迅速なセキュリティパッチの適用という基本的なベストプラクティスの重要性が、これまで以上に高まっています。AIによる攻撃は人間の攻撃者と異なり、疲れることなく、24時間体制で、複数の標的を同時に攻撃できます。防御側もAIを活用した自動化されたセキュリティ対策を導入することが、今後ますます重要になるでしょう。
【用語解説】
Claude Sonnet 4.5
Anthropic社が2025年9月にリリースしたAIモデル。コーディング、サイバーセキュリティ、長時間の自律的作業に特化しており、脆弱性の発見と悪用の能力が大幅に向上している。
CVE(Common Vulnerabilities and Exposures)
公表されたセキュリティ脆弱性に付与される識別番号。CVE-2017-5638はApache Strutsの脆弱性で、Equifax侵害事件に悪用された。
Kali Linux
ペネトレーションテストとセキュリティ監査を目的として設計されたLinuxディストリビューション。多数のセキュリティツールが標準で搭載されている。
Incalmo
Carnegie Mellon大学とAnthropicが共同開発したサイバーツールキット。AIモデルが高レベルの攻撃戦略を具体的なシステムコマンドに変換するのを支援する。
Cybench
CTF(Capture The Flag)コンペティションの課題から構成されたベンチマーク。AIモデルのサイバーセキュリティ能力を評価するために使用される。
CyberGym
実際のオープンソースソフトウェアプロジェクトにおける既知および未知の脆弱性を発見する能力を評価するベンチマーク。
【参考リンク】
Anthropic – Building AI for cyber defenders(外部)
Claude Sonnet 4.5のサイバーセキュリティ能力に関する詳細な研究報告
Anthropic – Claude Sonnet 4.5(外部)
Claude Sonnet 4.5の機能、価格、使用方法に関する公式情報
Carnegie Mellon University CyLab(外部)
セキュリティとプライバシーに関するCarnegie Mellon大学の研究所
Incalmo(外部)
AIモデルのサイバーセキュリティ能力を評価するためのツールキット
HackerOne(外部)
脆弱性報奨金プログラムプラットフォーム。Claude Sonnet 4.5を活用して脆弱性処理を効率化
【参考記事】
Building AI for cyber defenders(外部)
Cybench評価で76.5%、CyberGymで66.7%の成功率を達成したClaude Sonnet 4.5の研究報告
AI Models on Realistic Cyber Ranges(外部)
Claude Sonnet 4.5が標準ツールのみでEquifax侵害シミュレーションに成功した詳細
Carnegie Mellon Researchers Demonstrate That LLMs Can Autonomously Plan and Execute Real-World Cyberattacks(外部)
Carnegie Mellon大学によるLLMの自律的サイバー攻撃実証研究の報告
2017 Equifax data breach – Wikipedia(外部)
1億4790万人の個人情報が漏洩したEquifax侵害事件の詳細な経緯と影響
【編集部後記】
AIがサイバー攻撃を自動化できるようになったというニュースは、確かに不安を感じさせるかもしれません。しかし、この技術は同時に私たちの防御を強化する可能性も秘めています。重要なのは、この変化を恐れるのではなく、理解し、備えることです。あなたの組織では、セキュリティパッチの適用プロセスは迅速に機能していますか?AIを活用した防御ツールの導入を検討したことはありますか?これは遠い未来の話ではなく、今日から始められる対策です。私たちinnovaTopiaは、読者の皆さんと共に、この急速に変化する技術の最前線を見つめ続けていきます。



































