日本のAIラボSakana AIが2025年8月29日、新しい進化技術「Model Merging of Natural Niches(M2N2)」を発表した。
この技術は高額なトレーニングやファインチューニングを行わずにAIモデルの能力を拡張する。M2N2は大規模言語モデル(LLM)やテキスト画像生成器など異なるタイプの機械学習モデルに適用可能である。
研究チームはMNISTデータセットでの画像分類実験、数学専門モデル「WizardMath-7B」とエージェント専門モデル「AgentEvol-7B」のLLMマージ実験、日本語プロンプト訓練モデル「JSDXL」と3つのStable Diffusionモデルの画像生成実験を実施した。実験では数学問題データセット「GSM8K」とウェブタスクデータセット「WebShop」を使用した。
アルゴリズムは固定マージ境界を排除し、柔軟な分割ポイントと混合比率を使用する。研究者らはM2N2のコードをGitHubで公開している。
From: How Sakana AI’s new evolutionary algorithm builds powerful AI models without expensive retraining
【編集部解説】
今回Sakana AIが発表した「M2N2」は、AI開発における従来のアプローチを根本から覆す可能性を秘めた技術です。これまでのAI業界では「より大きく、より強力なモデル」を目指すスケーリングが主流でしたが、計算コストと電力消費の急激な増大により、この手法の限界が明らかになってきました。
M2N2が注目される背景には、現在の「AIスケーリングの限界」があります。GPU不足と電力制約により、巨大モデルの訓練コストは企業にとって大きな負担となっており、より効率的な代替手段が求められていました。この技術は、既存の専門化されたモデルを「生物学的な進化原理」で組み合わせることで、再訓練なしに新たな能力を獲得できる革新的なソリューションを提供します。
特に重要な点は、この手法がGECCO 2025でベストペーパー準賞に選ばれている点です。学術界での高い評価は、技術の科学的な妥当性を示しており、産業界での実用化への道筋を示しています。
技術的な画期性とそのインパクト
従来のモデルマージ技術では、開発者が手動で「どの層を組み合わせるか」を定義する必要がありました。しかしM2N2は、自然界の遺伝子組み換えのように「可変長の分割ポイント」を進化させることで、この制約を突破しています。これは例えて言うなら、従来は「レゴブロック単位」でしか組み合わせできなかったものが、「分子レベル」での精密な組み合わせが可能になったようなものです。
実際の応用例では、数学専門モデル(WizardMath-7B)とショッピングタスク専門モデル(AgentEvol-7B)を融合し、両方のタスクで高性能を維持することに成功しています。これは「破滅的忘却」と呼ばれる、新しいタスクを学習する際に以前の能力を失ってしまう問題を回避できることを意味します。
エンタープライズへの実用的メリット
企業にとって最も魅力的な点は、コスト効率性です。勾配更新を必要としない「勾配フリー」プロセスであるため、従来のファインチューニングと比較して大幅な計算コスト削減が可能です。また、元のトレーニングデータにアクセスする必要がなく、モデルの重みのみで作業できるため、企業の機密データ保護の観点からも有利です。
記事中で示された「営業ピッチ特化LLM」と「顧客反応解釈ビジョンモデル」の融合例は、リアルタイム適応型営業支援システムの実現可能性を示唆しており、CRM分野での革新的応用が期待されます。
潜在的リスクと課題
一方で、この技術には重要な課題も存在します。最も深刻なのは「組織的な問題」として研究者らが指摘するガバナンスの課題です。オープンソース、商用、カスタムコンポーネントが混在する「マージモデル」環境では、プライバシー、セキュリティ、コンプライアンスの確保が複雑になります。
また、進化的アルゴリズムの性質上、結果の予測可能性と説明可能性に課題があると考えられます。金融や医療など高度な規制要件がある分野での適用には、慎重なアプローチが必要となるでしょう。
長期的な業界への影響
研究者らが描く「モデル融合」の未来像は、AI開発パラダイムの根本的転換を意味します。「巨大なモノリシックモデル」から「進化し続けるAIエコシステム」への移行は、AI業界の競争構造を変える可能性があります。
この技術により、大手テック企業の計算リソース優位性が相対的に低下し、中小企業でも高性能なカスタムAIソリューションの構築が現実的になるかもしれません。オープンソースモデルの価値も飛躍的に向上し、AI開発の民主化が加速する可能性があります。
Sakana AIがコードをGitHubで公開している点も重要で、この技術の普及と発展を促進し、AI開発エコシステム全体の進化を加速させる要因となるでしょう。
【用語解説】
モデルマージ(Model Merging)
複数の専門化されたAIモデルの知識やパラメータを統合し、単一のより能力の高いモデルを作成する技術である。従来のファインチューニングとは異なり、既存の複数モデルを同時に結合することで新しい機能を獲得する。
破滅的忘却(Catastrophic Forgetting)
AIモデルが新しいタスクを学習する際に、以前に学習した知識や能力を失ってしまう現象である。従来のファインチューニングでは避けがたい問題とされていた。
勾配フリープロセス(Gradient-Free Process)
モデル訓練において勾配計算を必要としない最適化手法である。計算コストを大幅に削減し、メモリ使用量も抑制できる利点がある。
進化アルゴリズム(Evolutionary Algorithm)
自然界の生物進化の仕組みを模倣した最適化手法である。選択、交配、突然変異などの操作を通じて解の品質を段階的に改善していく。
GECCO(Genetic and Evolutionary Computation Conference)
遺伝的アルゴリズムと進化計算に関する世界最大級の国際会議である。AI分野における進化的手法の権威ある学術発表の場として知られる。
【参考リンク】
Sakana AI(外部)
日本を拠点とするAI研究開発企業の公式サイト。進化的アプローチによるAI開発を専門とし、M2N2などの革新技術を公開
Sakana AI GitHub(外部)
Sakana AIのオープンソースプロジェクト公開ページ。M2N2のコードを含む最新の研究成果を一般公開
Model Merging of Natural Niches論文(外部)
M2N2技術の詳細を記述したarXiv学術論文。競争と引力によるモデル融合理論と実験結果を提供
【参考動画】
【参考記事】
Teaching AI to “Choose Mates and Have Offspring”(外部)
M2N2技術を生物学的進化の観点から解説。GECCO 2025ベストペーパー準賞受賞についても詳細に言及
AI Models that Compete, Mate, and Evolve Like Living Organisms(外部)
M2N2の3つの進化原理を生物学的観点から詳細解説。従来の巨大モノリシックシステムへの挑戦として位置づけ
Competition and Attraction Improve Model Fusion(外部)
M2N2技術の原著論文HTML版。技術詳細とアルゴリズム仕組み、実験結果について包括的な情報を提供
【編集部後記】
今回のSakana AIの技術発表を拝見して、私たちも「AIの進化」について改めて考えさせられました。これまで「より大きく、より高性能に」という方向性だったAI開発が、今度は「生物学的な進化の原理」を取り入れる方向に舵を切り始めているのは興味深いですね。
みなさんの職場や身の回りでも、複数の専門ツールを使い分けている場面は多いのではないでしょうか。それらが「進化的に融合」し、まったく新しい能力を獲得するとしたら、どのような可能性が開けるでしょうか。
一方で、AIが自律的に「進化」していく未来に対して、どのような期待や不安をお持ちでしょうか。ぜひSNSで、みなさんのご意見をお聞かせください。私たち編集部も、この技術の行方を一緒に見守っていきたいと思います。