OpenAIのGPT-4oがリリースされた後、Pliny the Prompterは簡単なテキストプロンプトでこのモデルをジェイルブレイクした。PlinyはAnthropicのClaudeやGoogleのGeminiなど、他の大規模言語モデル(LLM)もジェイルブレイクしている。
PlinyはDiscordコミュニティ「BASI PROMPT1NG」を立ち上げ、他のジェイルブレイカーと協力してAIモデルの制限を解除し、ユーザーにより自由な利用を可能にすることを目指している。ジェイルブレイクはユーモアや音楽、医療/金融分析などのポジティブな利用も可能にする一方で、AIの真の能力を広め、ガードレールやコンテンツフィルターの努力が無駄であることを示したいとジェイルブレイカーたちは考えている。
VentureBeatによるPliny the Prompterへのインタビューでは、Plinyが9ヶ月前にLLMのジェイルブレイクを始め、クリエイティビティ、パターン認識、実践を通じてスキルを磨いたことが明らかにされた。PlinyはAIモデルの制限を解除することで、AIモデルプロバイダーやAI業界、ユーザーの認識に影響を与えたいと考えており、AIツールを日常的に使用して生活を効率化し、創造性を高めている。
LLMジェイルブレイクの倫理と法的な問題について、Plinyは責任あるジェイルブレイクが害を防ぐ最善の方法であると主張している。ディープフェイクやAI生成コンテンツの責任についての議論もあり、Plinyは法的な措置や制裁に懸念を示しているが、明確なAIジェイルブレイクの法律が存在しないため、具体的なリスクは不明であると述べている。
【編集者追記】用語解説
- ジェイルブレイク: AIモデルの安全制限を解除し、本来制限されている出力を可能にすること。
- LLM(Large Language Model): 大規模な言語モデルのこと。GPT-4やChatGPTなどが該当する。
【参考リンク】
OpenAI (外部)
【関連記事】
サイバーセキュリティ関連の記事をinnovaTopiaでもっと読む
【ニュース解説】
OpenAIが最新のAI基盤モデルであるGPT-4oをリリースした直後、”Pliny the Prompter”と名乗る人物が、このモデルをジェイルブレイクすることに成功しました。ジェイルブレイクとは、AIモデルに設定された制限やガードレールを回避する行為を指します。Plinyは、特定のテキストプロンプトを使用して、GPT-4oから著作権で保護された歌詞や、核兵器の製造方法、軍事戦略、医療診断などの応答を引き出すことに成功しました。
Plinyは、AnthropicのClaudeやGoogleのGeminiなど、他の大規模言語モデル(LLM)もジェイルブレイクしており、Discord上で「BASI PROMPT1NG」というコミュニティを立ち上げています。このコミュニティでは、他のジェイルブレイカーと協力してAIモデルの制限を解除し、ユーザーにより自由な利用を可能にすることを目指しています。ジェイルブレイクは、ユーモアや音楽、医療/金融分析などのポジティブな利用を可能にする一方で、AIの真の能力を広め、ガードレールやコンテンツフィルターの努力が無駄であることを示したいという目的も持っています。
Plinyによると、ジェイルブレイクの動機は、制限されたことを乗り越えることに対する挑戦意欲から来ています。彼は、AIモデルプロバイダーやAI業界全体、さらにはユーザーのAIに対する認識に影響を与えたいと考えています。また、Plinyは日常生活でChatGPTやClaudeなどのAIツールを活用しており、生活を効率化し、創造性を高めるために使用しています。
ジェイルブレイクに関する倫理的および法的な問題について、Plinyは、責任あるジェイルブレイクが害を防ぐ最善の方法であると主張しています。特に、ディープフェイクやAIによるコンテンツ生成の責任については、プロンプトを提供した人、モデルを作成した人、またはモデル自体のいずれが責任を負うべきかという議論があります。Plinyは、AIジェイルブレイクに関する明確な法律が存在しないため、具体的なリスクは不明であると述べていますが、法的な措置や制裁に対する懸念を示しています。
このニュースは、AI技術の進化とともに、その制限を回避しようとする試みが増えていることを示しています。ジェイルブレイクは、AIの潜在的なリスクや倫理的な問題を浮き彫りにすると同時に、AIの能力と可能性を広く知らせる機会も提供しています。しかし、このような行為がAI技術の発展と普及にどのような影響を与えるか、そして社会や法制度がこれにどう対応していくべきかは、今後の大きな課題となるでしょう。
from An interview with the most prolific jailbreaker of ChatGPT and other leading LLMs.