ーTech for Human Evolutionー

Sakana AI、新技術「TAID」で超小型AI実現へ｜スマホでも動く日本語モデル「TinySwallow-1.5B」を発表

AI（人工知能）ニュース

Headline News

TaTsu

[公開]

2025年1月31日10:31

[更新]2025年1月31日

Sakana AI新技術TAIDで超小型AI実現へ｜スマホでも動く日本語モデルTinySwallow-15Bを発表 - innovaTopia

Sakana AIは2025年1月30日、新しい知識蒸留手法「TAID (Temporally Adaptive Interpolated Distillation)」と、この手法を用いて開発した小規模日本語言語モデル「TinySwallow-1.5B」を発表した。

主な技術的特徴

32Bパラメータの大規模言語モデルから1.5Bパラメータ（約1/20のサイズ）への知識転移を実現
小規模モデルの学習進度に応じて適応的に知識を転移
同規模の日本語モデルの中で最高性能を達成
スマートフォンやPC単体で動作可能

開発チーム

デビッド・ハ（CEO、元Google研究者）
ライオン・ジョーンズ（CTO）
伊藤錬（COO、元外務官僚）

成果と評価

ICLR 2025（機械学習分野の国際会議）に採択
ブラウザ上で動作するデモアプリを公開
オープンソースとして公開（GitHub）
Hugging Faceでモデルを公開

from X

この度、新手法「TAID」を用いて学習された小規模日本語言語モデル「TinySwallow-1.5B」を公開しました。https://t.co/U7qpbz2BgL

私たちは、大規模言語モデル（LLM）の知識を効率的に小規模モデルへ転移させる新しい知識蒸留手法「TAID (Temporally Adaptive Interpolated… pic.twitter.com/OUCy71ho42
— Sakana AI (@SakanaAILabs) January 30, 2025

【編集部解説】

Sakana AIが開発したTAID（Temporally Adaptive Interpolated Distillation）は、AIの民主化に向けた重要な一歩となる可能性を秘めています。従来の知識蒸留技術と異なり、生徒モデルの学習進度に合わせて教師モデルを段階的に変化させる独自のアプローチを採用しています。

特筆すべきは、Qwen2.5-32B-Instructという320億パラメータの大規模モデルから、わずか15億パラメータの小規模モデルへの知識転移に成功した点です。これは、従来の常識を覆す約1/20という圧縮率を実現しています。

実用的な意義

TinySwallow-1.5Bの最も革新的な点は、iPhone 14のような一般的なスマートフォンでもオフライン動作が可能な点です。これにより、プライバシーを重視するユーザーでも、個人情報を外部に送信することなく高性能な言語モデルを利用できるようになります。

技術的特徴

TAIDの核心は「中間教師モデル」という概念にあります。生徒モデルの理解度に合わせて段階的に教師モデルを変化させることで、効率的な知識転移を実現しています。この手法により、従来の知識蒸留では困難だった大きな能力差の克服に成功しました。

今後の展望と課題

研究チームは、言語処理だけでなく視覚言語タスク向けのTAID-VLM-2Bも開発中です。これは、マルチモーダルAIの小型化にも本技術が応用できることを示唆しています。

一方で、商用利用や重要なシステムでの利用については現時点で制限が設けられており、信頼性や安定性の検証が今後の課題となっています。

産業への影響

この技術は、特に組み込みシステムやエッジデバイスでのAI活用に大きな可能性を開きます。医療機器やロボット、自動運転車など、リアルタイム処理が求められる分野での応用が期待されます。

また、開発コストの削減にも貢献し、スタートアップや中小企業でも高性能なAIシステムの開発が可能になると考えられます。

社会的インパクト

プライバシー保護とAI活用の両立という現代的な課題に対する一つの解決策となる可能性があります。オフライン処理が可能になることで、センシティブな情報を扱う現場でもAIの活用が進むことが期待されます。

【用語解説】

TAID (Temporally Adaptive Interpolated Distillation)
大規模AIから小規模AIへ知識を効率的に移す新技術
知識蒸留（Knowledge Distillation）
大きなAIモデルの知識を小さなモデルに転移させる技術
SLM（Small Language Model）
小規模言語モデル
パラメータ
AIモデルの学習における調整可能な要素のことで、モデルの規模や性能に影響を与える。

【参考リンク】

SakanaAI公式サイト（外部）
生物の群れの動きからインスピレーションを得た革新的なAI開発を行う日本の研究企業

【関連記事】

AI（人工知能）ニュースをinnovaTopiaでもっと読む

AI（人工知能）ニュース

Headline News

TaTsu

『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

記事一覧