ーTech for Human Evolutionー

わずか1000ドルで訓練されたAIモデル『Light-R1-32B』、数学分野で大手モデルを超える性能を発揮

AI（人工知能）ニュース

Headline News

TaTsu

[公開]

2025年3月6日7:42

[更新]2025年3月6日

Light-R1-32B1000ドルで訓練された数学AIが大手モデルを凌駕 - 低コストAI開発の新時代到来か - innovaTopia

2025年3月5日、研究チームが新しいオープンソースAIモデル「Light-R1-32B」を発表した。このモデルは高度な数学問題を解くために最適化されており、Hugging Face上でApache 2.0ライセンスの下で公開された。

Light-R1-32Bの主な特徴は以下の通り

320億のパラメータを持つ
米国招待数学試験（AIME）のベンチマークでDeepSeek-R1-Distill-Qwen-32Bを上回る性能を示す
AIME24で76.6点、AIME25で64.6点を達成
Alibaba社のQwen 2.5-32B-Instructをベースに開発された
12台のNvidia H800 GPUを使用して6時間未満で訓練を完了
訓練コストは推定1000ドル

開発チームは、Liang Wen、Fenrui Xiao、Xin He、Yunke Caiらを含む14名の研究者で構成されている。

このモデルは、企業やAI開発者が自由に利用、展開、微調整、修正することができ、商業目的での使用も可能である。また、訓練データセット、訓練スクリプト、評価ツールも公開されている。

Light-R1-32Bの開発は、MicrosoftのOrca-Mathシリーズなど、他の企業による同様の取り組みに続くものである。

from:New open-source math model Light-R1-32B surpasses equivalent DeepSeek performance with only $1000 in training costs

【編集部解説】

Light-R1-32Bモデルの登場は、AIの民主化と効率化に向けた大きな一歩と言えるでしょう。このモデルの特筆すべき点は、その性能と低コストの両立にあります。

まず、性能面では、Light-R1-32Bは米国招待数学試験（AIME）のベンチマークにおいて、DeepSeek-R1-Distill-Qwen-32Bを上回る結果を示しました。AIME24で76.6点、AIME25で64.6点を達成し、それぞれ72.6点と54.9点だったDeepSeekモデルを凌駕しています。

コスト面では、わずか1000ドルという驚異的な低コストで訓練を完了させました。12台のNVIDIA H800 GPUを使用し、6時間未満という短時間で訓練を行いました。これは、大規模なAIモデルの開発が、必ずしも莫大な資金を必要としないことを示しています。

Light-R1-32Bの開発アプローチには、いくつかの革新的な要素があります。カリキュラムベースの教師あり微調整（SFT）と直接選好最適化（DPO）を組み合わせることで、効率的に性能を向上させています。また、長い思考の連鎖（COT）推論を持たないモデルから訓練を始めているにもかかわらず、高度な数学的推論能力を獲得しています。

このモデルはApache 2.0ライセンスで公開されており、企業や研究者が自由に利用、改変できます。これにより、AIの応用範囲が大きく広がる可能性があります。特に、数学や科学の分野での問題解決や、教育支援ツールとしての活用が期待できるでしょう。

【用語解説】

大規模言語モデル（LLM）：
人間の言語を理解・生成するAIモデル。膨大なテキストデータから学習し、文章生成や質問応答などのタスクを行います。
パラメータ：
AIモデルの学習可能な変数。パラメータ数が多いほど、モデルの複雑さと潜在的な能力が高まります。
Apache 2.0ライセンス：
オープンソースソフトウェアのライセンス形態の一つ。商用利用や改変が自由に行えます。
蒸留学習：
大規模なモデル（教師モデル）の知識を、より小さなモデル（生徒モデル）に転移させる技術。計算資源を節約しつつ、性能を維持することができます。
カリキュラムベースの教師あり微調整（SFT）：モデルの学習プロセスにおいて、簡単なタスクから徐々に難易度の高いタスクへと進む方法。
直接選好最適化（DPO）：モデルの出力に対する人間の好みを直接的に学習し、最適化する手法。
思考の連鎖（Chain of Thought, COT）：モデルが複雑な問題を解決する際に、中間推論ステップを明示的に生成するプロセス。

【参考リンク】

Hugging Face（外部）
機械学習モデルやデータセットを共有するプラットフォーム。AIコミュニティの中心地
DeepSeek AI（外部）
中国のAI企業。大規模言語モデルの開発に取り組んでいる

【参考動画】

【関連記事】

AI（人工知能）ニュースをinnovaTopiaでもっと読む

AI（人工知能）ニュース

Headline News

TaTsu

『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

記事一覧