ドーナッツロボティクス株式会社(本社:東京都、代表取締役小野泰助)は、日本ブランドのヒューマノイド『cinnamon 1(シナモン ワン)』を発表し、世界初公開した。同製品は二足歩行の量産型ヒューマノイドで、特許技術を搭載している。現在は海外企業からOEM提供された機体に独自AIを搭載しており、将来的には機体も国産となるヒューマノイドを目指す。
2025年10月に発表した株式会社エムビーエス(本社:山口県、代表取締役 山本貴士)との資本業務提携により、建築業界などでの導入や国内VLAデータセンターの設立を目指している。VLA(Vision-Language-Action)AI搭載予定で、2026年内に工場内や建築現場での作業代替を進める予定である。
同社はロボットをジェスチャーで操作する技術「サイレント ジェスチャー コントロール」も発表した。これは声を発することなく手振りや指の動きでロボットに指示を伝える特許技術である。
同社は2014年に創業し、2017年に『羽田空港ロボット実験プロジェクト』に採択、2024年には『EY Innovative Startup 2024』(ロボティクス部門)を受賞している。
From:
ドーナッツロボティクス、日本ブランドのヒューマノイド『cinnamon 1』を発表 世界初のジェスチャーコントロール搭載のヒューマノイドを年内に市場投入

【編集部解説】
今回のドーナッツロボティクスによる発表は、日本のロボティクス産業にとって極めて重要な転換点となる可能性があります。
まず注目すべきは「サイレント ジェスチャー コントロール」という独自技術です。音声認識によるロボット操作は、すでに多くの製品で実装されていますが、この技術は騒音環境や静寂が求められる状況での限界を解決します。建設現場や工場では騒音レベルが85デシベルを超えることも珍しくなく、音声コマンドの認識精度が著しく低下するという課題がありました。また、WHOの統計によれば世界で約4.3億人が難聴を抱えているとされ、アクセシビリティの観点からも画期的なアプローチといえます。
ただし、ジェスチャー認識技術には技術的な課題も存在します。照明条件の変動、ユーザーごとのジェスチャーの違い、リアルタイム処理に必要な計算リソースの確保などです。ドーナッツロボティクスがこれらの課題をどのように克服しているかは、今後の実証実験で明らかになるでしょう。
次に、VLA(Vision-Language-Action)AIの搭載計画についてです。VLAは視覚、言語理解、動作を統合したAIモデルで、従来のロボットが「見る→考える→行動する」という段階的処理を行っていたのに対し、これらを同時並行で実行できます。Figure AIやGoogleのRT-2といった先行事例では、VLAによって複雑な環境でもロボットが適応的に行動できることが実証されています。
市場環境の観点では、日本のヒューマノイドロボット市場は2026年に0.29億ドル、2034年までに3.99億ドルに成長すると予測されており、年平均成長率は43.7%に達します。この急成長の背景には、日本の深刻な労働力不足と急速な高齢化があります。65歳以上の人口が28%を超える日本において、介護、小売、製造業での人手不足は喫緊の課題です。
また、2025年10月に発表されたエムビーエス社との資本業務提携を実施しており、建設業界への導入と国内VLAデータセンターの設立を目指しています。山口県に拠点を置くエムビーエス社との提携は、地方の建設現場における人材不足という具体的な社会課題に対する解決策として機能する可能性があります。
現時点では海外企業からのOEM機体に独自AIを搭載する形ですが、将来的には機体の国産化も視野に入れています。これは技術的な自立性だけでなく、サプライチェーンの安全保障という観点からも重要な戦略です。2026年内の市場投入という具体的なタイムラインが示されており、今後数ヶ月の実証実験と製品化プロセスが注目されます。
【用語解説】
VLA(Vision-Language-Action)
視覚、言語理解、動作制御を統合したAIモデルである。従来のロボットは「見る→考える→行動する」という段階的な処理を行っていたが、VLAはこれらを同時並行で実行することで、複雑な環境でも適応的に行動できる。人間が目で見た情報と言葉による指示を理解し、即座に適切な動作を実行する能力を持つ。
OEM(Original Equipment Manufacturing)
他社ブランドの製品を製造する企業、またはその製造形態のことである。この場合、海外企業が製造したロボット機体に、ドーナッツロボティクスが独自開発したAIソフトウェアを搭載している。将来的には機体の国産化を目指している。
サイレント ジェスチャー コントロール
音声を使わず、手振りや指の動きでロボットに指示を伝える操作技術である。騒音環境や静寂が求められる場所、聴覚に障害がある方でもロボットを操作できる。ドーナッツロボティクスが特許を取得している技術である。
【参考リンク】
ドーナッツロボティクス株式会社 公式サイト(外部)
2014年創業のロボット開発スタートアップ。ヒューマノイドや接客ロボット開発を手がけ、国内外から注目を集める。
Figure AI – Helix(VLA技術の先行事例)(外部)
米国のヒューマノイドロボット企業Figure AIが開発するVLAモデル。視覚と言語を統合した技術の実例として参照される。
【参考動画】
Kalil 4.0チャンネルによるCinnamon 1の紹介動画。実機デモンストレーションとジェスチャーコントロール機能を英語で解説。2026年1月20日公開。
ドーナッツロボティクス公式チャンネル「donut AI アカデミア」による解説動画。同社CTOの林裕一郎氏がAIロボット開発について語る。2025年9月公開。
【参考記事】
Donut Robotics Launches “Cinnamon 1” Humanoid Robot(外部)
Cinnamon 1発表の詳細を報じる記事。サイレント ジェスチャー技術と建設現場での活用シナリオを解説。
How Vision-Language-Action Models Powering Humanoid Robots(外部)
VLAモデルの技術的仕組みと応用を解説。Figure AIやGoogleのRT-2など先行事例を紹介する記事。
Japan Humanoid Robot Market Size, Share, Demand(外部)
日本市場の成長予測。2026年0.29億ドル、2034年3.99億ドル、年平均成長率43.7%と分析。
Japan Humanoid Robot Market Market Size 2026 | AI Impact(外部)
日本の65歳以上人口28%超の中、介護・小売・製造業での人手不足とロボット活用を分析する記事。
Gesture Based Control Technology for Drones : Challenges(外部)
ジェスチャー認識技術の課題を論じる学術論文。照明変動やリアルタイム処理の障壁を分析している。
【編集部後記】
音声ではなくジェスチャーでロボットを操る未来は、私たちの働き方や暮らし方をどう変えていくのでしょうか。建設現場や工場だけでなく、静かな図書館や病院、あるいは言葉の壁を超えたコミュニケーションの場でも、この技術は新しい可能性を開くかもしれません。
日本のスタートアップが挑む「国産ヒューマノイド」という野心的なビジョンが、どこまで実現するのか。みなさんは職場や日常でロボットと共に働く未来を、どのように思い描いていますか。ぜひご意見をお聞かせください。



































