1. RoboStep TOP
  2. 歩行はもう当前、中国人型ロボットの今後の競争点
  3. 「話さなくても、想いは届く」。ジェスチャーで操るヒューマノイドの可能性

2026.02.24

「話さなくても、想いは届く」。ジェスチャーで操るヒューマノイドの可能性

ヒューマノイドロボットとの対話といえば、多くの人が「音声」によるコミュニケーションを想像するだろう。しかし、私たちの暮らしや仕事の現場は、必ずしも理想的な静寂に包まれているわけではない。重機が轟音を鳴り響かせる建築現場、あるいは愛する家族が静かに眠る深夜の寝室。そんな「声を出せない、届かない」状況下で、ロボットは私たちの意図をどう汲み取るべきか。

ロボット開発スタートアップのドーナッツロボティクス株式会社が発表した新型ヒューマノイド「cinnamon 1(シナモン ワン)」は、その問いに鮮やかな回答を提示した。手振り一つで意思を通わせる特許技術「サイレント ジェスチャー コントロール」が、ロボットと人の関係をより密接で、より優しいものへと変えようとしている。(文=RoboStep編集部)

騒音を越え、静寂を守る。ジェスチャー操作が解決する課題


(引用元:PR TIMES

今回、世界初公開された「cinnamon 1」は、二足歩行を実現した量産型のヒューマノイドロボットだ。その最大の特徴は、同社が新たに発表した「サイレント ジェスチャー コントロール」という技術にある。これは音声を発することなく、手振りや指の動きだけでロボットに複雑な指示を伝えることができる技術だ。

従来のロボット操作において、音声認識は最も直感的な手段として期待されてきた。しかし、実社会への導入を想定したとき、そこには大きな死角が存在していた。一つは、空港の滑走路付近や建築現場、工場内といった、周囲の騒音が激しく音声がかき消されてしまう環境だ。もう一つは、病院の深夜の巡回や一般家庭の寝室など、声を出すこと自体がはばかられる 静寂の空間である。

ドーナッツロボティクスが開発した特許技術は、手振りや指の動きによるロボットへの指示を可能にすることで、音声操作が抱えていた死角を解消する。その恩恵は幅広く、情報の秘匿性が求められる場面で活用できるほか、外国人との対話に加え、世界に約4.3億人いるとされる難聴者をはじめとするハンディキャップを持つ人々に対しても、極めてバリアフリーな操作環境をもたらすことになる。

「cinnamon 1」は2026年内の市場投入を予定しており、まずは工場内や建築現場での作業代替から実用化を進めていくという。すでに建築大手の株式会社エムビーエスとの資本業務提携を通じて現場への導入準備を加速させており、単なる「動く機械」を超えた、現場の空気を読む「熟練の作業員」としての活躍が期待されている。

「器用な手足」から「状況を理解する脳」へ

このプロジェクトが示唆するのは、ヒューマノイドの進化が「器用な手足」を作る段階から、「高度な文脈理解と自律性」を競うフェーズに移ったという事実だ。

「cinnamon 1」の知能を司るのは、「VLA(Vision-Language-Action)」と呼ばれる最新のAI基盤である。これは、視覚情報(Vision)と言語情報(Language)を統合し、具体的な行動(Action)へと結びつけるためのモデルだ。例えば、「机の上のあの工具を取って、隣の作業員に渡して」という、視覚的な認識と言葉の指示を組み合わせなければ成立しない複雑なタスクを、ロボットが自律的に判断して実行することを可能にする。

現在は海外企業からOEM提供を受けた機体をベースに独自のAIを搭載する形を採っているが、ドーナッツロボティクスが描く未来図はさらに先にある。同社は、国内にVLA専用のデータセンターを設立する構想を掲げており、将来的にはハードウェア自体の完全国産化も目指している。

なぜ今、日本ブランドのヒューマノイドにこだわるのか。そこには、日本の産業構造を支えるための切実な戦略が見え隠れする。少子高齢化による労働力不足が深刻化する中で、ヒューマノイドを社会インフラの一部として定着させるためには、日本の現場特有のルールや細やかなニュアンスを理解し、国内で安全にデータを管理できる体制が不可欠だからだ。

ジェスチャーひとつでロボットが人の想いを汲み取り、黙々と作業をこなす。そんな光景が当たり前になったとき、ロボットは特別な存在であることをやめ、私たちの生活を力強く支える「新しい家族」や「信頼できる同僚」へと昇華していくはずだ。2026年、日本発のヒューマノイドが、世界のロボティクスの常識を書き換えようとしている。