ブルガリアのコンピュータサイエンス・人工知能・テクノロジー研究所(INSAIT)は2025年10月23日、オープンソースのロボットAIモデルSPEAR-1を公開した。
SPEAR-1は3D空間理解能力を備え、評価額20億ドル超のスタートアップPhysical IntelligenceのPi-0.5と同等の性能を発揮する。従来のロボット基盤モデルが2D画像で訓練されるのに対し、SPEAR-1は3Dデータを組み込むことで物体の動きをより正確に理解する。RoboArenaベンチマークでケチャップボトルを絞る、書類をホチキスで留めるといったタスクで商用モデルと同等の結果を示した。
INSAITとETHチューリッヒのMartin Vechev氏は「オープンウェイトモデルはエンボディドAIの進歩に不可欠」と述べた。SPEAR-1は従来モデルの20分の1のロボットデータで訓練され、工場自動化企業がOpenAI、Google、Anthropicとのライセンス契約なしで同等の技術にアクセスできる可能性を示している。
From:
European Researchers Drop Open-Source Robot Brain That Thinks in 3D
【編集部解説】
ロボティクス分野で長年の課題となっていたデータ収集のボトルネックに、画期的なアプローチで挑んだのがSPEAR-1です。
従来のロボット基盤モデルは、大規模言語モデルの成功に倣い、膨大なロボット操作データを収集してきました。しかし、ロボットの動作データは人間がテレオペレーションで収集する必要があり、時間とコストが膨大にかかります。Physical IntelligenceのPi-0.5のような商用モデルは、膨大なロボット操作データを収集することで性能を向上させてきました。
SPEAR-1は、2D画像データで訓練された既存モデルと異なり、3D空間データを直接学習に組み込んだ点にあります。ロボットは3D空間で動作するにもかかわらず、既存のビジョン言語モデル(VLM)は平面的な2D画像からしか世界を理解していませんでした。この「次元のミスマッチ」が、環境変化への脆弱性を生んでいたのです。
具体的には、SPEAR-1は約20万例の3Dインタラクションデータを用いて、一部の競合モデルが使用する9億例以上のロボット操作データに匹敵、あるいは上回る性能を達成しています。これは単なる効率化ではなく、学習アプローチそのものの転換といえます。
産業への影響は多岐にわたります。OpenAI、Google、Anthropicとライセンス契約を結ぶ余裕のない中小製造業でも、高度なロボット制御技術にアクセスできるようになります。倉庫自動化や組み立てライン構築のハードルが大幅に下がり、これまで大手テック企業が独占していた技術領域が民主化されるでしょう。
一方で、現時点での限界も明確です。ロボットアームを交換したり、作業環境が変わったりすると、モデルの再調整や追加学習が必要になる場合があります。。「汎用的なロボット知能」にはまだ距離があり、タスク間の転移学習や長期的な計画立案といった課題が残されています。
MetaのLlamaがOpenAIの独占に風穴を開けたように、SPEAR-1はロボティクス分野でオープンソース革命の引き金を引く可能性があります。ヨーロッパ発のこの技術が、AI時代における産業自動化の主導権を誰が握るかという地政学的な問いにも影響を与えそうです。
【用語解説】
エンボディドAI(Embodied AI)
物理的な身体を持つシステムにAIを統合し、現実世界と相互作用できるようにする技術である。ロボット、自動運転車、ドローンなどが含まれ、センサーで環境を認識し、推論し、行動する能力を持つ。単にデータを処理する従来のAIとは異なり、物理世界での経験から学習する点が特徴だ。
ビジョン言語モデル(VLM)
画像や動画といった視覚情報と自然言語を統合的に処理するAIモデルである。画像を見て質問に答えたり、説明文を生成したりできる。大規模言語モデルに視覚認識能力を追加したもので、ロボティクスでは環境認識の基盤技術として活用される。
ビジョン言語アクション(VLA)モデル
視覚情報と言語指示を受け取り、ロボットが実行可能な具体的な動作指令を直接出力するモデルである。VLMをロボット操作データで追加学習させることで構築され、認識、推論、制御を統合する。Google DeepMindのRT-1(2022年)やRT-2(2023年)などが代表例として知られている。
RoboArenaベンチマーク
汎用ロボットポリシーの性能を現実世界で評価するための分散型評価フレームワークである。複数の研究機関が参加し、異なる環境とタスクでロボットモデルを比較評価する。Chatbot Arenaにヒントを得た二重盲検方式のペア比較を採用している。
【参考リンク】
SPEAR-1公式サイト(外部)
INSAITが公開したSPEAR-1の技術詳細、論文、デモ動画を掲載する公式ページ。モデルのアーキテクチャや訓練データが公開されている。
INSAIT(コンピュータサイエンス・人工知能・テクノロジー研究所)(外部)
ブルガリアのソフィアに位置するAI研究機関で、ETHチューリッヒ、EPFL、ソフィア大学と連携。東ヨーロッパ初の世界級AI研究拠点を目指す。
Physical Intelligence(外部)
汎用ロボット知能の開発を目指すスタートアップで2024年設立。OpenAI、Jeff Bezosらから4億ドルを調達し、評価額は20億ドル超。
RoboArena(外部)
分散型ロボット評価ベンチマークの公式サイト。複数の大学が参加し、DROIDロボットプラットフォーム上で汎用ロボットポリシーを比較評価する。
ETHチューリッヒ・Robotic Systems Lab(外部)
ETHチューリッヒのロボティクス研究室で、脚式ロボットANYmalなどの開発で知られる。困難な環境での自律動作を可能にする技術を研究している。
【参考記事】
INSAIT unveils SPEAR-1 – Europe’s first open robotic foundation model trained on 3D data(外部)
INSAITによる公式発表記事。SPEAR-1がヨーロッパ初のオープンソースロボット基盤モデルであること、産業自動化への民主化の可能性について詳述している。
This Open Source Robot Brain Thinks in 3D – WIRED(外部)
SPEAR-1の発表を報じる記事で、Martin Vechev氏へのインタビューを掲載。Physical IntelligenceのKarl Pertsch氏による学術グループの急速な進歩への評価が含まれる。
Open-Source Robot Minds Enter the 3D Realm – EngTechnica(外部)
SPEAR-1の技術的特徴と業界への影響を分析。従来の2D画像訓練との違い、オープンソース化による中小企業への技術アクセス拡大について考察している。
Inside the Billion-Dollar Startup Bringing AI Into the Physical World – WIRED(外部)
Physical Intelligenceの詳細なレポート。4億ドルの資金調達、評価額20億ドル超、CEO Karol Hausmanのビジョン、サンフランシスコの研究施設での開発風景を紹介している。
【編集部後記】
オープンソースの波が言語モデルの世界を変えたように、今度はロボティクスの番かもしれません。工場自動化や物流、さらにはご家庭のロボットまで、これまで大手テック企業が握っていた技術が、誰でもアクセスできる形で広がっていく可能性があります。
みなさんの会社や生活の中で、「こんな作業をロボットに任せられたら」と感じる場面はありませんか。SPEAR-1のようなオープンソース技術が普及すれば、そんな未来が思ったより早く実現するかもしれませんね。























