AIモデルの性能競争は長らく「大きさ」を軸に語られてきました。しかし、Raspberry Piで動き、ヒューマノイドロボットの頭脳として機能し、データ抽出では自身の2倍以上の規模のモデルを超える——230Mパラメータという数字が問いかけるのは、「どれだけ賢いか」ではなく「どこで、何のために動くか」という設計思想そのものです。
Liquid AIは2026年6月25日、同社史上最小モデル「LFM2.5-230M」をHugging Faceで公開した。パラメータ数は2億3,000万で、LFM2アーキテクチャを採用している。事前学習トークン数は19兆、コンテキスト長は32K。ポストトレーニングは、LFM2.5-350Mからの知識蒸留を用いた教師あり微調整、直接選好最適化(DPO)、マルチドメイン強化学習の3段階で構成される。
10種類のベンチマーク評価において、自身の2倍以上の規模のモデルと互角以上の結果を示した。特にデータ抽出ベンチマーク(CaseReportBench)とツール使用ベンチマーク(BFCLv3、BFCLv4)で強みを発揮する。推論速度はSamsung Galaxy S25 Ultraで213トークン/秒、Raspberry Pi 5で42トークン/秒。llama.cpp、MLX、vLLM、SGLang、ONNXに初日から対応し、GPU・CPU・NPUを問わずデプロイ可能とされる。高度な数学・コード生成・創作文章など推論負荷の高いタスクには不向きとされている。オープンウェイトモデルとして公開されており、ダウンロード・ファインチューニング・デプロイが可能。
From:
LFM2.5-230M: Built to Run Anywhere | Liquid AI
【編集部解説】
LFM2.5-230Mが示しているのは、技術的な性能値の積み上げだけではありません。「何ができるかより、どこで動くか」という設計の優先順位を明示的に選んだモデルが登場したという事実です。
現在のAIモデル開発は、大きく2つの方向性に分かれています。一方は、より大きく・より汎用的なモデルを追求するGPT系の路線。もう一方は、特定の用途と動作環境に最適化し、規模を意図的に抑える路線です。LFM2.5-230Mは後者の極端な例として位置づけられます。
230Mというパラメータ数は、現在主流の小型モデルと呼ばれるクラスの中でも最小水準です。同社の既存ラインアップと比較しても、LFM2.5-350M(3億5,000万パラメータ)よりさらに小さく、Qwen3.5-0.8B(8億パラメータ)やGemma 3 1B(10億パラメータ)の3分の1以下です。
にもかかわらず、ベンチマーク結果でデータ抽出タスク(CaseReportBench)のスコアが22.51と、Qwen3.5-0.8Bの13.83やGemma 3 1Bの2.28を大きく上回っている点は注目に値します。ツール使用ベンチマーク(BFCLv3)でも43.26を記録し、上位モデルを含む比較群の中で競争力を維持しています。
重要なのは、この優位性が万能ではない点を同社自身が明言していることです。高度な数学・コード生成・創作文章など推論負荷の高いタスクには不向きとされており、「全部できるが少し劣る」ではなく「一部だけできるが確実に勝てる」という設計姿勢が読み取れます。
Liquid AIは2023年にMITのCSAIL(コンピュータ科学・人工知能研究所)から独立したスタートアップで、Ramin Hasani、Mathias Lechner、Alexander Amini、Daniela Rusの4名が共同創業しています。同社の技術的な出発点は、線形動力学系の理論に基づく「リキッドニューラルネットワーク(LNN)」の研究にあります。
LFM2シリーズが採用する「LIV(線形入力依存)オペレータ」は、入力に応じて動的に重みを生成する仕組みです。これにより、畳み込み・リカレント・アテンションといった異なる処理方式を一つの統一フレームワークとして扱えるハイブリッドアーキテクチャが成立します。トランスフォーマーが「すべてをアテンション機構で処理する」設計であるのに対し、LFM2は「入力に応じて処理方式を切り替える」設計であり、短い系列処理での推論コストを下げやすい構造になっています。
アーキテクチャの選定にはSTAR(同社独自のニューラルアーキテクチャ探索エンジン)が用いられており、品質・メモリ・レイテンシの制約を実際のハードウェア条件に合わせて最適化する仕組みが組み込まれています。
LFM2.5-230Mが対応する環境の幅は異例に広いと言えます。Raspberry Pi 5では毎秒42トークン、Samsung Galaxy S25 Ultraでは毎秒213トークンのデコード速度を記録しており、クラウドGPUだけでなくシングルボードコンピュータ相当の低消費電力デバイスでも実用的な速度での動作が確認されています。llama.cpp、MLX、vLLM、SGLang、ONNXという主要な推論フレームワーク全てに初日から対応している点も、実際の開発・デプロイを意識した設計です。
今回の発表で特に示唆的なのが、Unitree G1ヒューマノイドロボットへの搭載デモです。NVIDIAのエッジAI向け推論モジュール「Jetson Orin」上で完全にオンデバイス動作し、自然言語の指示をNVIDIAのSONICフレームワークが提供するロボット制御スキルへと変換する「スキル選択レイヤー」として機能しました。ロボットや自律システムにとって、クラウドへの通信は遅延とオフライン耐性の両面でリスクになります。230Mという規模のモデルが、自然言語インターフェースを担いながらオンデバイスで動作できるという実証は、AIの「動作場所」をめぐる議論に実例を加えるものです。
ただし、このデモはあくまで「動いた」段階であり、商用展開や汎用ロボット制御への応用が確認されたわけではありません。同社自身も「まだシンプルな段階」と明言しており、現時点での評価は実証実験の範囲で捉えることが適切です。
現在、230Mから10億パラメータ規模の小型モデルは複数の大手・スタートアップが参入する競争領域になっています。Google Gemma、Qwen(Alibaba)、GraniteシリーズなどがHugging Face上で公開されており、LFM2.5-230Mはこれらと同じ土俵でベンチマーク比較を行っています。
差別化の軸は、単なるパラメータ効率の良さではなく、「特定タスクに絞った時の優位性」と「ハードウェアを選ばないデプロイ性」の組み合わせです。データ抽出やツール呼び出しといった「構造化された繰り返し処理」に用途を絞り、その範囲で大型モデルに勝てるかどうかを問うているとも言えます。モデルが大きければ良いという方向性が相対化されつつある今、「何のために小さくするか」という問いへの答えの一形態として、今回のリリースは読み解くことができます。
【用語解説】
LFM(Liquid Foundation Models)
Liquid AIが開発する独自アーキテクチャの基盤モデル群。トランスフォーマーとは異なり、動力学系・信号処理の理論に基づく「リキッドニューラルネットワーク」を応用している。入力に応じて重みを動的に生成する「LIV(線形入力依存)オペレータ」を中核に据えており、特に短い系列処理での推論コストを低く抑えられる設計になっている。
エッジAI(Edge AI)
クラウドサーバーではなく、スマートフォン・組み込みボード・ロボットなどのデバイス上でAI処理を完結させるアプローチ。通信遅延が発生しない、オフライン環境でも動作できる、データがデバイス外に出ないといった特性から、リアルタイム性やプライバシーが求められる用途で注目されている。
知識蒸留(Knowledge Distillation)
大規模モデル(教師モデル)の出力を正解ラベルとして小型モデル(生徒モデル)を学習させ、教師モデルの性能を小型モデルに転移させる手法。LFM2.5-230Mのポストトレーニングでは、LFM2.5-350Mを教師として蒸留が行われている。
GGUF形式
llama.cppで使われるモデルファイル形式。量子化(重みを低精度で表現すること)に対応しており、CPUやモバイル環境での効率的な推論を可能にする。LFM2.5-230MはHugging Face上でGGUFチェックポイントも公開されている。
τ²-Bench(Tau-squared Bench)
エージェント型AIの実際の業務処理能力を評価するベンチマーク。通信(Telecom)・小売(Retail)など特定業種のユースケースで、ツール呼び出しを連続的に行うシナリオで評価する。単純なQAではなく「タスクを完遂できるか」を問う設計になっている。
【参考リンク】
Liquid AI 公式サイト(外部)
MITのCSAILから独立したスタートアップ。Liquid Foundation Models(LFM)シリーズを開発・公開し、エッジ向けの効率的なAI基盤モデルを提供する。モデルのダウンロード、LEAP(カスタマイズ・デプロイ)、Playgroundによる試用が可能。
LFM2.5-230M|Hugging Face(外部)
LFM2.5-230Mのモデルページ。ベースモデル・ポストトレーニング済みモデルの両方が公開されており、GGUF形式での量子化版も提供されている。ライセンスはLFM Licenseに準拠。
Liquid AI ドキュメント(外部)
LFM2.5-230Mのローカル実行・ファインチューニング手順、llama.cpp・MLX・vLLM各環境への対応方法、チャットテンプレートの仕様などを解説する公式技術ドキュメント。
【参考動画】
【参考記事】
LFM2.5-230M: Built to Run Anywhere|Liquid AI Blog(外部)
今回記事の一次ソース。モデル仕様・ベンチマーク結果・推論速度・ロボットデモの詳細が掲載されている公式発表ページ。
Introducing LFM2|Liquid AI Blog(外部)
LFM2アーキテクチャの設計思想(LIVオペレータ・STARエンジン)と前世代比3倍の学習効率について解説した公式技術記事。LFM2.5シリーズの基盤を理解するための一次資料。
LFM2 Technical Report|arXiv 2511.23404(外部)
LFM2ファミリーのアーキテクチャ設計・学習手法・評価結果を詳述した技術論文。350Mから8B-MoEまでのモデルラインアップと、エッジ向け設計の詳細を確認できる。
【関連記事】
Liquid AI、革新的な省メモリAIモデル『LFM』発表 ─ MITスピンオフ企業が示すAIの新潮流
Liquid AIのモデル開発の歩みは、2024年10月の初代LFM発表から始まりました。当時の設計思想と、今回の230Mモデルがどう接続されているかを、こちらの記事でご確認いただけます。
スタンフォード発「ワットあたりの知能(IPW)」とは―小型ローカルAIがクラウドに挑む
小型モデルがクラウドAIに対して本当に競争力を持てるのか、という問いを別の角度から検証した記事もご覧ください。
Siri × Gemini × NVIDIA|Apple「プライバシーの約束」を守るための三社連合の実態
Liquid AIをめぐっては、Appleによる買収検討も報じられています。オンデバイスAIの主導権を争う構図は、こちらの記事でも読み解けます。
【編集部後記】
AIモデルが「どこで動くか」という問いは、これまで主にコストと利便性の話として語られてきました。しかし、ロボットや医療機器、産業設備のような「クラウドとの通信が前提できない」環境が現実の実装先として浮かび上がるにつれ、この問いは技術選択だけでなく、どこに知性を置くかという設計思想の問いに変わりつつあります。私たちはAIを「呼び出すもの」として使ってきましたが、それが「埋め込まれるもの」へと移行する時代の入口に、今いるのかもしれません。












