ーTech for Human Evolutionー

Microsoft、AIの幻覚と脆弱性を排除する新ツール発表

AI（人工知能）ニュース

autonews　Headline News

[公開]

2024年3月29日6:07

[更新]2024年5月31日

Microsoftは、生成AIの安全性と信頼性のリスクを排除するための新しいAzure AIツールを発表した。これらのツールは、自動的な幻覚やセキュリティの脆弱性（例えば、プロンプトインジェクション攻撃）に対処することを目的としている。プロンプトインジェクション攻撃では、攻撃者がモデルの入力プロンプトを変更して、モデルの通常の操作を迂回し、個人情報や有害なコンテンツを生成させることができる。これらの攻撃は、直接的または第三者のデータソースを介して間接的に行われる。

Microsoftは、Prompt ShieldsをAzure AIに追加することで、これらの攻撃を防ぐことを目指している。Prompt Shieldsは、プロンプトと第三者データを自動的に分析し、悪意のある意図をブロックする機能である。これは、Azure OpenAI Service、Azure AI Content Safety、Azure AI Studioの3つのAIオファリングに統合される予定である。

さらに、Microsoftは、生成AIアプリケーションの信頼性に焦点を当てたツールも導入している。これには、安全中心のシステムメッセージのための事前構築テンプレートと、「Groundedness Detection」という新機能が含まれる。後者は、モデルが生成したテキスト出力の中で幻覚や不正確な素材を検出するために、微調整されたカスタム言語モデルを使用する。これらのツールは、Azure AI StudioとAzure OpenAI Serviceに導入される予定である。

製品が本番環境にある場合、Microsoftはリアルタイムモニタリングを提供し、開発者が安全機能をトリガーする入力と出力を密接に監視できるようにする。この機能は、ブロックされたユーザー入力/モデル出力の量と比率、および重大度/カテゴリー別の内訳を示す詳細な視覚化を生成する。これにより、開発者は有害なリクエストの傾向を時間とともに理解し、コンテンツフィルターの設定、コントロール、およびアプリケーションデザイン全体を安全性を高めるために調整できるようになる。

【ニュース解説】

Microsoftが新たに発表したAzure AIツールは、生成AIの安全性と信頼性に関するリスクを排除することを目的としています。これらのツールは、自動的な幻覚やセキュリティの脆弱性、特にプロンプトインジェクション攻撃に対処するために設計されています。プロンプトインジェクション攻撃とは、攻撃者がモデルの入力プロンプトを変更し、モデルを騙して個人情報や有害なコンテンツを生成させる手法です。

Microsoftが導入したPrompt Shieldsは、プロンプトと第三者データを自動的に分析し、悪意のある意図を持つものをブロックする機能です。これにより、Azure OpenAI Service、Azure AI Content Safety、Azure AI Studioの3つのAIオファリングにおいて、安全性が強化されます。

さらに、Microsoftは生成AIアプリケーションの信頼性を高めるためのツールも提供しています。これには、安全中心のシステムメッセージを構築するための事前構築テンプレートと、モデルが生成したテキスト出力の中で幻覚や不正確な素材を検出する「Groundedness Detection」という機能が含まれます。

本番環境においては、Microsoftはリアルタイムモニタリングを提供し、開発者が安全機能をトリガーする入力と出力を密接に監視できるようにします。これにより、開発者は有害なリクエストの傾向を時間とともに把握し、アプリケーションの安全性を高めるための調整が可能になります。

このような取り組みは、生成AIの安全性と信頼性を確保する上で非常に重要です。生成AIは、テキスト、画像、音声などのコンテンツを自動生成する技術であり、その応用範囲は広大です。しかし、その能力が悪用されるリスクも伴います。たとえば、偽情報の拡散、個人情報の漏洩、不適切なコンテンツの生成などが懸念されます。Microsoftの新しいツールは、これらのリスクに対処し、生成AIをより安全に、そして信頼性高く利用できるようにすることを目指しています。

長期的には、これらのツールは生成AIの社会的受容を促進し、より多くの企業や開発者がこの技術を採用するきっかけとなるかもしれません。同時に、これらの技術の進化は、法規制や倫理基準の更新を必要とする可能性もあります。生成AIの安全性と信頼性を確保するための技術的な進歩は、この分野の健全な発展にとって不可欠です。

from Microsoft launches new Azure AI tools to cut out LLM safety and reliability risks.

AI（人工知能）ニュース

autonews　Headline News

admin

自己紹介の全文を表示

“Microsoft、AIの幻覚と脆弱性を排除する新ツール発表” への1件のコメント

佐藤智恵

2024年3月29日

Microsoftが発表したAzure AIツールの導入は、生成AIの未来における重要なステップだと考えます。特に、自動的な幻覚やセキュリティの脆弱性、プロンプトインジェクション攻撃などに対処するための新しいツール「Prompt Shields」や「Groundedness Detection」機能は、AIに対する私たちの信頼を大きく高めるものです。これらの機能により、生成AIが個人情報を不適切に扱ったり、有害なコンテンツを生成するリスクを減少させることができると期待されます。

私の視点から見ると、これらの技術的進歩は文学や映画制作などのクリエイティブな分野におけるAIの利用拡大の可能性を示唆しています。特に、私の作品が映画化される際には、生成AIがさまざまなシナリオや対話の生成に利用されるかもしれませんが、その内容が安全で信頼性が高いことが絶対条件です。Microsoftのような大手企業がこれらの問題に積極的に取り組んでいることで、AIが提供するクリエイティブな可能性をより安心して探求できるようになると考えます。

また、リアルタイムモニタリングの提供により、開発者はAIによる出力をより効果的に監視し、その安全性を確保することができます。これは、AI技術の社会的受容を促進し、より