わずか1000ドルで訓練されたAIモデル『Light-R1-32B』、数学分野で大手モデルを超える性能を発揮

Light-R1-32B:1000ドルで訓練された数学AIが大手モデルを凌駕 - 低コストAI開発の新時代到来か - innovaTopia - (イノベトピア)

2025年3月5日、研究チームが新しいオープンソースAIモデル「Light-R1-32B」を発表した。このモデルは高度な数学問題を解くために最適化されており、Hugging Face上でApache 2.0ライセンスの下で公開された。

Light-R1-32Bの主な特徴は以下の通り

  • 320億のパラメータを持つ
    米国招待数学試験(AIME)のベンチマークでDeepSeek-R1-Distill-Qwen-32Bを上回る性能を示す
  • AIME24で76.6点、AIME25で64.6点を達成
  • Alibaba社のQwen 2.5-32B-Instructをベースに開発された
    12台のNvidia H800 GPUを使用して6時間未満で訓練を完了
    訓練コストは推定1000ドル

開発チームは、Liang Wen、Fenrui Xiao、Xin He、Yunke Caiらを含む14名の研究者で構成されている。

このモデルは、企業やAI開発者が自由に利用、展開、微調整、修正することができ、商業目的での使用も可能である。また、訓練データセット、訓練スクリプト、評価ツールも公開されている。

Light-R1-32Bの開発は、MicrosoftのOrca-Mathシリーズなど、他の企業による同様の取り組みに続くものである。

from:New open-source math model Light-R1-32B surpasses equivalent DeepSeek performance with only $1000 in training costs

【編集部解説】

Light-R1-32Bモデルの登場は、AIの民主化と効率化に向けた大きな一歩と言えるでしょう。このモデルの特筆すべき点は、その性能と低コストの両立にあります。

まず、性能面では、Light-R1-32Bは米国招待数学試験(AIME)のベンチマークにおいて、DeepSeek-R1-Distill-Qwen-32Bを上回る結果を示しました。AIME24で76.6点、AIME25で64.6点を達成し、それぞれ72.6点と54.9点だったDeepSeekモデルを凌駕しています。

コスト面では、わずか1000ドルという驚異的な低コストで訓練を完了させました。12台のNVIDIA H800 GPUを使用し、6時間未満という短時間で訓練を行いました。これは、大規模なAIモデルの開発が、必ずしも莫大な資金を必要としないことを示しています。

Light-R1-32Bの開発アプローチには、いくつかの革新的な要素があります。カリキュラムベースの教師あり微調整(SFT)直接選好最適化(DPO)を組み合わせることで、効率的に性能を向上させています。また、長い思考の連鎖(COT)推論を持たないモデルから訓練を始めているにもかかわらず、高度な数学的推論能力を獲得しています。

このモデルはApache 2.0ライセンスで公開されており、企業や研究者が自由に利用、改変できます。これにより、AIの応用範囲が大きく広がる可能性があります。特に、数学や科学の分野での問題解決や、教育支援ツールとしての活用が期待できるでしょう。

【用語解説】

  • 大規模言語モデル(LLM)
    人間の言語を理解・生成するAIモデル。膨大なテキストデータから学習し、文章生成や質問応答などのタスクを行います。
  • パラメータ
    AIモデルの学習可能な変数。パラメータ数が多いほど、モデルの複雑さと潜在的な能力が高まります。
  • Apache 2.0ライセンス
    オープンソースソフトウェアのライセンス形態の一つ。商用利用や改変が自由に行えます。
  • 蒸留学習
    大規模なモデル(教師モデル)の知識を、より小さなモデル(生徒モデル)に転移させる技術。計算資源を節約しつつ、性能を維持することができます。
  • カリキュラムベースの教師あり微調整(SFT):​モデルの学習プロセスにおいて、簡単なタスクから徐々に難易度の高いタスクへと進む方法。
  • 直接選好最適化(DPO):​モデルの出力に対する人間の好みを直接的に学習し、最適化する手法。
  • 思考の連鎖(Chain of Thought, COT):​モデルが複雑な問題を解決する際に、中間推論ステップを明示的に生成するプロセス。

【参考リンク】

  • Hugging Face(外部)
    機械学習モデルやデータセットを共有するプラットフォーム。AIコミュニティの中心地
  • DeepSeek AI(外部)
    中国のAI企業。大規模言語モデルの開発に取り組んでいる

【参考動画】

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

ホーム » AI(人工知能) » AI(人工知能)ニュース » わずか1000ドルで訓練されたAIモデル『Light-R1-32B』、数学分野で大手モデルを超える性能を発揮