最新ニュース一覧

人気のカテゴリ


Sapient Intelligence「HRM」、LLMを100倍高速化する脳型推論AIを開発

Sapient Intelligence「HRM」、LLMを100倍高速化する脳型推論AIを開発 - innovaTopia - (イノベトピア)

シンガポール拠点のAIスタートアップSapient Intelligenceが、2025年7月25日に脳の階層構造にインスパイアされた新たなAI推論アーキテクチャ「階層推論モデル(HRM)」を発表した。HRMは2,700万パラメータと小規模ながら、わずか1,000の学習例で大規模言語モデル(LLM)を大幅に上回る推論性能を達成する。

HRMは人間の脳の高レベル計画処理と低レベル詳細計算を模倣した2つの回帰モジュール構造を採用している。数独エクストリームや迷路解決などの複雑な推論タスクにおいて、最先端のCoT(思考の連鎖)手法が0%の正答率で失敗する中、HRMはほぼ完璧な精度を記録した。特にARC-AGIベンチマークでは40.3%を達成し、OpenAIのo3-mini-high(34.5%)やClaude 3.7 Sonnet(21.2%)といったはるかに大規模なモデルを上回った。

Sapient IntelligenceのCEOであるGuan Wang氏は、HRMがLLMに対して100倍の推論速度向上を実現し、専門レベルの数独解決に約2GPU時間しか要しないと説明している。同社は既にヘルスケア、気候予測、ロボティクスでの有望な初期結果を得ており、次世代モデルの開発を進めている。

From: 文献リンクNew AI architecture delivers 100x faster reasoning than LLMs with just 1,000 training examples

【編集部解説】

このニュースが現在注目される理由は、AIの巨大化競争が限界に直面する中で、まったく異なるアプローチが実用レベルの成果を示したことにあります。従来の大規模言語モデルは数千億から数兆のパラメータを必要としますが、HRMは2,700万パラメータという軽量さでこれらを上回る推論性能を実現しています。これは、AI開発の方向性そのものに一石を投じる発見といえるでしょう。

技術面で特筆すべきは、人間の脳の階層構造と時間スケールの違いを模倣した設計です。高速な詳細処理を行うLモジュールと、ゆっくりとした抽象的計画を担うHモジュールの連携により、従来のChain-of-Thought(思考の連鎖)手法の「脆弱性」を回避しています。CoTは一つのステップが間違うと全体が破綻するリスクがありましたが、HRMはより安定した推論プロセスを実現しています。

この技術により可能になることは多岐にわたります。まず、軽量アーキテクチャによりエッジデバイスでの高度な推論が現実的になります。また、データが限られた専門分野での活用も有望です。同社は既にヘルスケア診断や気候予測、ロボティクスでの初期的な成功を収めており、これまでLLMでは困難だった専門性の高いタスクへの道筋を示しています。

一方で、潜在的なリスクも存在します。まず、HRMの「潜在推論」は解釈可能性の課題を抱えています。CEOのGuan Wang氏は「デコードして可視化できる」と説明していますが、ブラックボックス性への懸念は完全に払拭されていません。また、現時点では特定の推論タスクに特化しており、汎用性の面ではまだ制約があります。

規制面では、HRMの軽量性と効率性により、従来の大規模AIシステムを前提とした規制枠組みの見直しが必要になる可能性があります。特に、個人デバイスで動作する高度なAIシステムの管理・監督体制については新たな課題となるでしょう。

長期的な視点では、このアプローチがAI業界の「効率性革命」の始まりとなる可能性があります。現在のAI開発競争は計算リソースの拡大に依存していますが、HRMのような脳科学に基づく構造的革新により、より持続可能で民主的なAI開発が可能になるかもしれません。

【用語解説】

階層推論モデル(HRM)
人間の脳の階層構造にインスパイアされた新たなAI推論アーキテクチャ。高レベル(H)モジュールが抽象的な計画を担当し、低レベル(L)モジュールが詳細な計算を処理する2つの結合した回帰モジュールで構成される。従来の深層学習モデルの勾配消失問題と回帰アーキテクチャの早期収束問題を解決する。

思考の連鎖(Chain-of-Thought/CoT)
現在の大規模言語モデルが推論を行う際に使用する手法。問題を中間的なテキストベースのステップに分解し、モデルが「声に出して考える」ように推論プロセスを可視化する。一つのステップが間違うと全体が破綻するリスクがある。

ARC-AGI(抽象化・推論コーパス)
人工知能の汎用的な推論能力を測定するベンチマーク。抽象的なパターン認識と論理的推論を要求するテストセットで、AGI(汎用人工知能)に向けた研究の指標として使われる。

潜在推論
言語で明示的に表現することなく、モデルの内部表現で行われる推論。人間の脳が言語に変換せずに思考を進める過程を模倣したもの。

勾配消失問題
深層学習で多層のニューラルネットワークを学習する際、層が深くなるにつれて学習信号(勾配)が弱くなり、効果的な学習が困難になる問題。

早期収束
回帰型ニューラルネットワークが問題を十分に探索する前に、早すぎる解決策に落ち着いてしまう現象。

【参考リンク】

Sapient Intelligence公式サイト(外部)
シンガポール拠点のAIスタートアップ。機械学習、神経科学、数学の知見を統合している。

HRM GitHubリポジトリ(外部)
階層推論モデルの公式オープンソースコード。実装とデモを提供している。

arXiv論文(外部)
階層推論モデルの詳細な技術仕様と実験結果を記載した研究論文。

【参考記事】

Sapient Intelligence launches brain-inspired AI model(外部)
HRMの発表を投資の観点から分析した記事。応用分野について報告している。

脳にインスパイアされたAIモデルを発表(外部)
日本語での関連報道。CEOのコメントと大規模モデルを上回る性能について言及。

【編集部後記】

今回ご紹介したHRMの技術は、私たちが考えるAIの未来像を根本から変える可能性を秘めています。巨大化の一途をたどっていたAI開発に、まったく異なる道筋が示されたのです。

みなさんはどう思われるでしょうか?軽量で効率的なAIがエッジデバイスで動作する未来と、クラウドの巨大AIに依存する現在、どちらがより魅力的に感じますか?また、脳科学からヒントを得たこのアプローチが、他にどのような技術革新をもたらすと予想されますか?

ぜひSNSで、みなさんの率直なご意見をお聞かせください。一緒にこの技術の可能性について考えていければと思います。

AI(人工知能)ニュースをinnovaTopiaでもっと読む

投稿者アバター
TaTsu
デジタルの窓口 代表 デジタルなことをまるっとワンストップで解決 #ウェブ解析士 Web制作から運用など何でも来い https://digital-madoguchi.com

読み込み中…
読み込み中…