ーTech for Human Evolutionー

Meta「Llama Guard 4」「LlamaFirewall」など新AIセキュリティツール発表――オープンソースと企業防御を強化

AI（人工知能）ニュース

Headline News

TaTsu

[公開]

2025年5月1日8:53

[更新]2025年6月30日

MetaLlama Guard 4LlamaFirewallなど新AIセキュリティツール発表オープンソースと企業防御を強化 - innovaTopia

Llama Guard 4はテキストと画像の両方に対応するマルチモーダルなセーフティ分類器で、Metaの新APIやHugging Face、GitHubで利用できる。LlamaFirewallはAIシステムのセキュリティ指令塔となる新ツールで、プロンプトインジェクション、不正なコード生成、AIプラグインのリスク行動などをリアルタイムで検知・防御する。Prompt Guard 2（86M/22M）はプロンプトインジェクションや脱獄（jailbreak）攻撃の検知精度を向上し、22Mモデルは従来比で最大75%のレイテンシ・計算コスト削減を実現する。

CyberSec Eval 4はオープンソースのAIセキュリティ評価スイートで、CrowdStrikeと共同開発した「CyberSOC Eval」はSOC（セキュリティオペレーションセンター）でのAI有効性を評価し、「AutoPatchBench」はAIによる自動脆弱性修正能力を測定する。Llama Defenders Programは選定パートナー向けにAIセキュリティソリューションへの特別アクセスを提供する新プログラム。Automated Sensitive Doc Classification Toolは社内文書に自動でセキュリティラベルを付与し、機密情報のAIシステム流入や漏洩を防止する。

Llama Generated Audio Detector／Audio Watermark DetectorはAI生成音声の検出ツールで、ZenDesk、Bell Canada、AT&Tなどが導入を検討している。Private ProcessingはWhatsApp向けの新技術で、MetaやWhatsAppが内容を閲覧せずにAIがメッセージ要約や返信案作成を実現する。これらのツールは、開発者やサイバーセキュリティ担当者、企業のAI活用をより安全にし、AIを悪用した詐欺や情報漏洩リスクへの対策を強化することを目的としている。

from:Meta beefs up AI security with new Llama tools

【編集部解説】

Metaが2025年4月末に発表したLlama関連の新AIセキュリティツール群は、AIの安全利用とサイバー防御の両面で大きなインパクトを与える内容です。Meta公式発表や複数の海外テックメディア、AI専門コミュニティの情報を総合的に確認しました。

Llama Guard 4は、従来のテキストだけでなく画像にも対応するマルチモーダル安全分類器です。これにより、テキストと画像が混在するプロンプトや出力に対しても一貫した安全判定が可能となります。AIによる情報生成や解析がテキスト以外にも拡大している現状に即した進化です。

LlamaFirewallは、AIシステムの「最終防衛ライン」として設計されており、プロンプトインジェクションや脱獄、危険なコード生成など、AI特有の新たな脅威にリアルタイムで対応します。Prompt Guard 2による攻撃検知、AI行動の整合性監査、静的コード解析などを統合しており、開発者が自社アプリに柔軟に組み込める設計です。

Prompt Guard 2（86M/22M）は、従来比で最大75%のレイテンシ・計算コスト削減を実現しつつ、プロンプトインジェクションやjailbreak検知精度を維持しています。この軽量化は、エッジデバイスやリソース制約のある環境でもAIセキュリティを担保できる点で実用的です。

CyberSec Eval 4は、AIのセキュリティ能力を客観的に評価するベンチマークスイートであり、CrowdStrikeと共同開発したCyberSOC Evalや、AIによる自動脆弱性修正能力を測るAutoPatchBenchが追加されました。これにより、AIのセキュリティ運用適性や自動パッチ適用能力を実環境で検証できます。

MetaはLlama Defenders Programを開始し、選定パートナー企業に先進的なAIセキュリティソリューションへのアクセスを提供。また、社内で運用してきた自動機密文書分類ツールや、AI生成音声の検出・ウォーターマーク技術も外部パートナーに公開し、ZenDeskやAT&Tなどが導入を検討しています。

「Private Processing」は、MetaやWhatsAppがユーザーのメッセージ内容にアクセスせず、AIによる要約や返信提案などを実現するプライバシー重視の設計です。セキュリティ研究者との連携による脅威モデルの公開・改善も進めています。

AIの生成能力が拡大する一方で、プロンプトインジェクションや偽音声詐欺など新たなリスクも急増しています。こうした包括的なセキュリティ対策の重要性は今後さらに高まるでしょう。AIセキュリティ技術の進化が「万能の盾」となるわけではなく、企業や開発者による適切な運用やガバナンス体制の整備も不可欠です。今後は、AIセキュリティの標準化や国際的な規制動向、オープンソースコミュニティとの連携強化など、業界全体での協調が重要となります。

【用語解説】

Meta（メタ）
米国カリフォルニア州メンローパークに本社を置く、FacebookやInstagram、WhatsAppを運営する世界最大級のテクノロジー企業。AI開発にも積極的。

Llama（ラマ）
Metaが開発・公開している大規模言語モデル（LLM）のシリーズ。オープンソースで、研究者や開発者が自由にカスタマイズ・利用できる。最新はLlama 4。

Llama Guard（ラマガード）
AIの入力（プロンプト）や出力（応答）を監視し、不適切・有害な内容を自動で検出・ブロックするセーフティモデル。

LlamaFirewall（ラマファイアウォール）
AIシステム全体のセキュリティ指令塔。複数のセーフティモデルを統合管理し、プロンプトインジェクションや危険なコード生成など高度な脅威を検知・防御する。ネットワークのファイアウォールのAI版。

Prompt Guard（プロンプトガード）
AIへの攻撃手法である「プロンプトインジェクション」や「脱獄（jailbreak）」を検知する専用モデル。重要な命令や危険な操作を未然に防ぐ。

プロンプトインジェクション
AIへの入力（プロンプト）に巧妙な命令文を混ぜて、意図しない動作や情報漏洩を引き起こす攻撃手法。SQLインジェクションのAI版と考えると分かりやすい。

CyberSec Eval（サイバーセック・イバル）
AIのセキュリティ性能を評価するためのオープンソース・ベンチマークスイート。実際のセキュリティ運用現場（SOC）での有効性や、AIによる脆弱性修正能力などを測定。

Llama Defenders Program
Metaが選定したパートナー企業や開発者に、先進的なAIセキュリティソリューションへの特別アクセスを提供するプログラム。

Automated Sensitive Doc Classification Tool
社内文書に自動でセキュリティラベルを付与し、機密情報のAIシステム流入や漏洩を防止するツール。

【参考リンク】

Meta AI公式サイト（外部）
MetaのAI研究・製品情報サイト。LlamaやAIセキュリティ技術の詳細を掲載。

Llama公式サイト（外部）
Llama 4など最新のオープンソースAIモデルの配布・解説サイト。

Purple Llama GitHub（外部）
Llama GuardやPrompt GuardなどAIセーフティツールの公式実装。

【参考動画】

【編集部後記】

AIがますます身近になる中、「安全性」や「プライバシー」の課題は私たち一人ひとりにも関わるテーマです。みなさんはAIのセキュリティや、その進化によってどんな未来が訪れると思いますか？
もしご自身の仕事や生活でAIを使うとしたら、どんな安全対策があれば安心できるでしょうか。ぜひ、みなさんのご意見やご感想をお聞かせください。

【関連記事】

サイバーセキュリティニュースをinnovaTopiaでもっと読む

AI（人工知能）ニュース

Headline News

TaTsu

『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

記事一覧