innovaTopia

ーTech for Human Evolutionー

KL3M、著作権フリーデータで訓練された法律特化AIモデルが登場

KL3M、著作権フリーデータで訓練された法律特化AIモデルが登場 - innovaTopia - (イノベトピア)

Last Updated on 2024-07-04 07:57 by admin

KL3M(ケルビン・リーガル・ラージ・ランゲージ・モデル、略称「クレム」)は、イリノイ工科大学の法学教授であり、ベンチャー企業273 Venturesの最高戦略責任者(CSO)であるダニエル・マーティン・カッツと、法律技術起業家で273 VenturesのCEOであるマイケル・ボンマリートによって共同設立された。このモデルは、著作権で保護されたデータを使用せずに訓練された最初の大規模言語モデル(LLM)として、2024年2月にリリースされた。

KL3Mは、独立監査会社Fairly Trainedから「Licensed Model (L) Certification」を受けた最初のLLMである。この認証は、AIモデルの訓練データが「契約に基づいて適切な権利を持つ当事者から取得され、使用された」ことを証明できる企業にのみ与えられる。KL3Mの訓練には、米国政府の文書や古い法的文書など、著作権のない公開ドメインのデータが使用された。

KL3Mは、法律、財務、規制分野に特化して設計されており、法律事務所や法律業界向けに、時間エントリーや請求書の作成、契約条項の草稿、SEC提出物のセクションの作成、特許の草稿などに役立つ。273 Venturesによると、KL3Mは法律業界を超えても広範囲に適用可能であるという。現在、複数の法律事務所がKL3Mを使用しており、モデルのコストについては、興味のある者は273 Venturesに直接問い合わせるようになっている。

【ニュース解説】

KL3M(ケルビン・リーガル・ラージ・ランゲージ・モデル、略称「クレム」)は、著作権で保護されたデータを使用せずに訓練された、画期的な大規模言語モデル(LLM)です。このモデルは、イリノイ工科大学の法学教授であり、ベンチャー企業273 Venturesの最高戦略責任者(CSO)であるダニエル・マーティン・カッツと、法律技術起業家で273 VenturesのCEOであるマイケル・ボンマリートによって共同設立されました。2024年2月にリリースされたKL3Mは、独立監査会社Fairly Trainedから「Licensed Model (L) Certification」を受けた最初のLLMとなりました。この認証は、AIモデルの訓練データが契約に基づいて適切な権利を持つ当事者から取得され、使用されたことを証明できる企業にのみ与えられます。

KL3Mの訓練には、米国政府の文書や古い法的文書など、著作権のない公開ドメインのデータが使用されました。これにより、著作権で保護されたデータに依存せずに有用なモデルを作成することが可能であることが示されました。KL3Mは、法律、財務、規制分野に特化して設計されており、法律事務所や法律業界向けに、時間エントリーや請求書の作成、契約条項の草稿、SEC提出物のセクションの作成、特許の草稿などに役立ちます。273 Venturesによると、KL3Mは法律業界を超えても広範囲に適用可能であるとのことです。

このモデルの開発は、AI技術の進歩とともに高まる著作権問題に対する新たな解決策を提供します。従来の大規模言語モデルが著作権で保護されたデータを使用して訓練されることが多い中、KL3Mのようなモデルは、著作権侵害のリスクを回避しつつ、高品質なAIサービスを提供する可能性を秘めています。特に法律業界など、データの出所と合法性に敏感な分野では、KL3Mのような認証を受けたモデルが重宝されることでしょう。

しかし、公開ドメインのデータのみを使用して訓練されたモデルは、訓練データの範囲や多様性に制限がある可能性があります。そのため、KL3Mがどの程度のパフォーマンスを発揮できるか、また、特定の専門分野において従来のモデルとどのように比較されるかは、今後の研究や実用化の過程で明らかになるでしょう。また、このようなモデルの開発と普及は、AI技術に関する法的・倫理的な議論を促進し、将来の規制やガイドライン策定に影響を与える可能性があります。

長期的には、KL3Mのようなモデルが、AI技術の持続可能な発展と社会へのポジティブな貢献に向けた新たな道を切り開くことになるかもしれません。著作権問題を避けつつ、高品質なAIサービスを提供することは、技術者、法律家、そして社会全体にとって重要な課題です。KL3Mの成功は、この分野における重要な一歩となり、今後のAI技術の発展において重要な参考点となるでしょう。

from The first ‘Fairly Trained’ AI large language model is here.

ホーム » AI(人工知能) » AI(人工知能)ニュース » KL3M、著作権フリーデータで訓練された法律特化AIモデルが登場

“KL3M、著作権フリーデータで訓練された法律特化AIモデルが登場” への1件のコメント

  1. 佐藤 智恵のアバター
    佐藤 智恵

    KL3Mのリリースは、AI技術と著作権という二つの領域が交差する点で、非常に興味深い進展だと思います。私の小説が映画化される際にも、著作権は常に重要なテーマでありました。そのため、KL3Mのようなモデルが著作権で保護されたデータを使用せずに開発されたことは、創作物の作者としても大きな関心を持っています。

    特に、公開ドメインのデータのみを利用することで、著作権侵害のリスクを回避し、同時に高品質なAIサービスを提供しようとするこの取り組みは、知的財産権の保護と技術進歩という、時に相反するかのように見える二つの目標をどのように両立させるかという問題への一つの解答を示しています。

    また、法律、財務、規制分野に特化したこのモデルがどの程度のパフォーマンスを発揮し、実際の業務にどれほど貢献できるのかは、非常に気になるところです。公開ドメインのデータのみを利用した場合の限界や可能性について、具体的な事例を通して学べることは多いでしょう。

    また、このようなモデルが法的・倫理的な議論を促し、AI技術に関する規制やガイドライン策定に影響を与