Last Updated on 2024-05-23 07:38 by admin
Patronus AIは、AIの誤りや著作権違反を自動的に検出し、企業のAI導入を促進するために1700万ドルの資金を調達した。この資金調達により、Patronus AIの総資金は2000万ドルに達した。資金提供はNotable CapitalのGlenn Solomonが主導し、Lightspeed Venture Partners、元DoorDash幹部のGokul Rajaram、Factorial Capital、および複数の匿名の技術幹部が参加した。
Patronus AIは、元Metaの機械学習専門家であるAnand KannappanとRebecca Qianによって設立され、大規模言語モデル(LLM)の出力における幻覚、著作権侵害、安全違反などのエラーを特定する自動評価プラットフォームを開発した。このシステムは、独自のAIを使用してモデルのパフォーマンスを評価し、敵対的な例でモデルをストレステストし、手動の労力を必要とせずに詳細なベンチマークを可能にする。
Patronus AIの研究によると、GPT-4などのモデルが公開されたSEC提出書類に基づいて金融クエリに答える「FinanceBench」ベンチマークでは、最も性能の良いモデルでも質問の19%しか正確に答えられなかった。また、新しい「CopyrightCatcher」APIを使用した別の実験では、オープンソースのLLMが出力の44%で著作権で保護されたテキストをそのまま再現していた。
Patronus AIは、専用の評価モデルを訓練し、特定のLLMが失敗する可能性が高いエッジケースを信頼性高く浮き彫りにする技術に基づいている。この戦略はすでに、自動車、教育、金融、ソフトウェアなどの業界にまたがる複数のフォーチュン500企業でPatronus AIを使用してLLMを「安全に」展開しているという。新たな資金で、Patronusは研究、エンジニアリング、営業チームを拡大し、追加の業界ベンチマークを開発する計画である。
【編集者追記】用語解説
- 大規模言語モデル(LLM): 大量のテキストデータから学習した、高度な言語処理能力を持つAIモデル。ChatGPTなどが該当します。
- 著作権侵害: 他人の著作物(小説、映画、音楽など)を無断で利用し、著作者の権利を侵すこと。
- Patronus AI: LLMの出力を評価・検証するプラットフォームを提供するスタートアップ企業。
【参考リンク】
Patronus AIオフィシャルサイト(外部)
【関連記事】
Patrounusに関する記事をinonvaTopiaでもっと読む
【ニュース解説】
Patronus AIは、大規模言語モデル(LLM)の出力における誤りや著作権違反、安全上の問題を自動的に検出する技術を開発しているサンフランシスコのスタートアップです。この技術により、企業がAIをより安全に、かつ効率的に導入することを目指しています。最近、Patronus AIは1700万ドルの資金を調達し、これにより同社の総資金は2000万ドルに達しました。この資金調達ラウンドは、Notable CapitalのGlenn Solomonをはじめとする複数の投資家からの支援を受けています。
Patronus AIが開発した自動評価プラットフォームは、独自のAIを用いてLLMのパフォーマンスを評価し、敵対的な例を用いてモデルをストレステストすることで、幻覚や著作権侵害、安全違反などのエラーを特定します。これにより、企業は手動での労力をかけずに、LLMの出力の品質を保証することが可能になります。
この技術の重要性は、近年のLLMの急速な発展とその応用範囲の拡大に伴い、ますます高まっています。例えば、ニュース記事の自動生成や薬物発見における研究論文の作成など、LLMは多岐にわたる分野で活用されています。しかし、これらのモデルが不正確な情報を生成したり、著作権で保護された内容を無断で使用したりするリスクも指摘されています。Patronus AIの技術は、これらの問題を自動で検出し、企業がLLMをより安心して使用できるようにすることを目指しています。
Patronus AIのアプローチは、専用の評価モデルを訓練し、LLMが失敗する可能性が高いエッジケースを信頼性高く特定することにあります。これにより、手動テストでは困難なエラーの検出が可能になり、LLMのパフォーマンスの自動評価が実現します。この技術は、自動車、教育、金融、ソフトウェアなど、多様な業界のフォーチュン500企業によって既に採用されています。
Patronus AIの取り組みは、AI技術の安全性と信頼性を高めることに貢献し、企業がAIをより積極的に導入するための道を開く可能性を秘めています。しかし、LLMの「ブラックボックス」性質と、生成可能な出力の範囲が広大であることから、そのパフォーマンスを完全に検証することは依然として大きな課題です。Patronus AIの研究と技術開発が、この課題に対する解決策を提供し、AIの責任ある実用化への道を加速することが期待されています。
このように、Patronus AIの取り組みは、AI技術の安全性と信頼性を確保する上で重要な役割を果たす可能性があり、その進展は今後も注目されるでしょう。