Last Updated on 2024-06-29 08:15 by admin
Cohere for AI(C4AI)、カナダの企業向けAIスタートアップの非営利研究部門は、新しい多言語言語モデルファミリーであるAya 23のオープンウェイトを発表した。このモデルは8Bおよび35Bパラメータバリアントで利用可能であり、Ayaイニシアチブの最新作である。Ayaイニシアチブは強力な多言語能力を提供することを目指している。C4AIはAya 23のウェイトをオープンソース化し、第三者の研究者が個々のニーズに合わせてモデルを微調整できるようにした。Aya 23は23言語に対応し、アラビア語、中国語(簡体字・繁体字)、チェコ語、オランダ語、英語、フランス語、ドイツ語、ギリシャ語、ヘブライ語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、ペルシャ語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スペイン語、トルコ語、ウクライナ語、ベトナム語をサポートする。
C4AIによると、このモデルは世界人口のほぼ半分に対応する最先端の言語モデリング能力を拡大し、Aya 101だけでなく、GoogleのGemmaやMistralの様々なオープンソースモデルなど、他のオープンモデルをも上回る高品質な応答を提供する。Ayaイニシアチブは、3,000人以上の独立した研究者と協力して、513百万インスタンスのプロンプトと完了からなる大規模な多言語インストラクションスタイルのデータセット、Ayaコレクションを作成し、101言語をカバーするインストラクション微調整LLMを開発した。Aya 101は2024年2月にオープンソースLLMとしてリリースされ、101言語をサポートする大規模多言語言語モデリングにおいて重要な進歩を遂げた。しかし、Aya 23のリリースにより、C4AIは範囲と深さのバランスを取ることに移行した。このモデルは、CohereのCommandシリーズのモデルとAyaコレクションに基づいており、23言語により多くの容量を割り当てることに焦点を当て、それらの生成を改善する。
評価では、Aya 23はカバーする言語でAya 101やGemma、Mistral、Mixtralなどの広く使用されているモデルを上回るパフォーマンスを示した。Cohere for AIは、8Bおよび35BモデルのオープンウェイトをHugging Face上でクリエイティブ・コモンズの帰属非営利4.0国際公共ライセンスの下でリリースし、研究者や実践者が多言語モデルとアプリケーションを進化させることを目指している。また、ユーザーはCohere Playgroundで新しいモデルを無料で試すことができる。
【ニュース解説】
Cohere for AI(C4AI)、カナダの企業向けAIスタートアップの非営利研究部門は、多言語対応の最先端言語モデル「Aya 23」のオープンウェイトを発表しました。このモデルは、8Bおよび35Bのパラメータバリアントで提供され、23の異なる言語に対応しています。これにより、世界人口のほぼ半分に対応する言語モデリング能力が拡大され、他のオープンモデルを上回る高品質な応答を提供することが可能になります。
Aya 23は、C4AIが推進するAyaイニシアチブの一環として開発されました。このイニシアチブは、強力な多言語能力を提供することを目指しており、3,000人以上の独立した研究者と協力して、513百万インスタンスのプロンプトと完了からなる大規模な多言語インストラクションスタイルのデータセット「Ayaコレクション」を作成しました。このデータセットを使用して、101言語をカバーするインストラクション微調整LLM「Aya 101」が開発され、2024年2月にオープンソースLLMとしてリリースされました。
Aya 23は、CohereのCommandシリーズのモデルとAyaコレクションに基づいており、23言語により多くの容量を割り当てることに焦点を当てています。これにより、カバーする言語での生成能力が向上し、Aya 101や他の広く使用されているモデルを上回るパフォーマンスを実現しています。
このモデルのオープンウェイトリリースにより、第三者の研究者や実践者は、個々のニーズに合わせてモデルを微調整することが可能になります。これは、AIの研究と開発におけるアクセシビリティと柔軟性を大幅に向上させるものであり、多言語モデルとアプリケーションの進化を促進することを目指しています。
Aya 23のリリースは、言語モデリングの分野における重要な進歩を示しています。特に、英語中心だった大規模言語モデル(LLM)の開発から、多言語対応へとシフトすることで、世界中の多様な言語を話す人々に対するアクセシビリティが向上します。しかし、このような技術の進歩は、データのプライバシー、倫理的な使用、バイアスの問題など、新たな課題をもたらす可能性もあります。したがって、これらのモデルを使用する際には、これらの問題に対する注意深い考慮が必要です。
長期的には、Aya 23のような多言語モデルの開発と普及により、世界中でのコミュニケーションの障壁が低減され、異なる文化や言語間での理解が深まることが期待されます。また、教育、医療、ビジネスなど、さまざまな分野での応用が可能になり、グローバルな協力とイノベーションを促進することにも寄与するでしょう。
from Cohere launches open weights AI model Aya 23 with support for nearly two dozen languages.