延世大学校を中心とする共同研究チームが、指輪型手話翻訳デバイス WRSLT(Wirelessly Connected, Ring-type Sign Language Translator)を Science Advances 誌(2026年5月1日付、Vol 12, Issue 18)に発表しました。
各指に独立装着するリング型センサーで構成され、3軸加速度計、Bluetooth Low Energy(BLE)システムオンチップ、磁石による着脱機構を備え、バッテリーは約12時間連続稼働します。両手10本指のうち寄与度の高い7本(右親指、右人差し指、右中指、右薬指、左人差し指、左薬指、左小指)を Bluetooth マルチリンクで同時接続する構成を採用しました。
アメリカ手話(ASL)100語と国際手話(ISL)100語、合計200語を対象に評価し、訓練に参加していない未学習ユーザー条件下で、論文 Abstract が代表値として ASL 88.3%、ISL 88.5% の認識精度を報告しています(論文本文 Fig. 1F では同条件下で ASL 88.4%、ISL 88.9% も示されており、評価箇所により値が異なります)。さらに逐次単語検出フレームワークにより、文レベルの翻訳も可能としました。論文本文によれば、単語推論時間は約0.10秒、文レベル推論時間は約0.36秒、計算負荷は推論あたり14.3 MFLOPS です。
研究資金は韓国国立研究財団(NRF)および Samsung Research Funding Center などが提供しました。
【編集部解説】
延世大学校を中心とする共同研究チームが発表した WRSLT(Wirelessly Connected, Ring-type Sign Language Translator)は、手話翻訳デバイスの開発史において、ひとつの注目すべき進展と位置づけられる研究です。これまで主流だったスマートグローブ型や有線センサーアレイ型が抱えてきた構造的な限界を、ハードウェア設計の発想転換によって緩和した点に技術的な意味があります。なお本研究は延世大学校に加え、韓国外国語大学校(Hankuk University of Foreign Studies)、KIST(韓国科学技術研究院)などが資金面・人材面で協力した共同プロジェクトです。
世界ろう連盟(WFD)によれば、世界には300種類以上の手話が存在し、それぞれが地域や文化に根ざして独立した文法体系を持っています。手話は単なるジェスチャーの集合ではなく、独自の構文・文法・空間表現を備えた完全な言語であるという事実は、ろう者コミュニティ以外には依然として十分に共有されていません。本研究の意義は、こうした言語的多様性を技術が「均質化」するのではなく、ASL と ISL という性質の異なる2つの手話で同等の精度を実証した点にあります。
ハードウェアの核心は、各リングが互いに配線でつながっていない「完全ワイヤレス分散型」である点です。従来のシステムでは、複数のセンサーが1つのマイクロコントローラに有線接続される構造が一般的でしたが、WRSLT は Bluetooth マルチリンク通信を用いて、7つのリングがそれぞれ独立してホスト機器と通信します。これにより、従来のグローブ型や有線方式に比べ、指の自然な可動性を大きく損ないにくい設計が実現されました。
センシング方式に加速度計のみを採用した判断も、エンジニアリング的に重要な意思決定です。筋電図(EMG)方式は皮膚インピーダンスや筋肉生理の個人差が大きく、ユーザーごとのキャリブレーションが避けられません。本研究が3軸加速度計に絞り込んだことで、未学習ユーザー条件下でも校正なしに約88%の精度を達成した点は、実用化に向けた重要な前進と言えます。なお認識精度については、論文 Abstract が代表値として ASL 88.3% / ISL 88.5% を示す一方、本文 Fig. 3E では上位7本指選定後の評価として ASL 88.4% / ISL 88.9% も併記されており、評価箇所によって値が異なります。本記事では Abstract 記載の代表値を主に採用しています。
7本の指の選定方法にも注目すべき洞察があります。研究チームは論文 Methods で示すとおり、層別関連性伝播(LRP)という説明可能AI(Explainable AI)の手法を用いて、各指の認識への寄与度を定量化しました。論文 Fig. 3C の解析によれば、最も寄与が大きいのは右親指で、これは手話の利き手側であることに加え、解剖学的に他の指と異なる斜めの方向を持つため、独自の空間情報を捕捉できることに起因します。AI モデルの判断根拠を可視化し、それを使ってハードウェアを最適化するという、AI とハードウェア設計の双方向的な統合が見て取れます。
文レベル翻訳を実現した「逐次単語検出フレームワーク」も実用上の意義が大きい技術です。論文 Fig. 5A の説明によれば、スライディングウィンドウで連続的な手話を切り出し、2回以上連続して同じ単語が検出された場合にのみその単語を確定する仕組みにより、文の境界を事前に学習させずとも、流動的な手話会話の翻訳が可能になりました。文の組み合わせを全パターン学習するスケーラビリティの壁を、シンプルな統計的判定で回避した設計思想は、エッジAI 一般にも応用が利く考え方です。
一方で、過度な期待は禁物です。共同責任著者の1人である延世大学校のドシク・ファン氏自身が IEEE Spectrum の取材に対し、200語は従来のワイヤレスシステムから見れば意義ある進歩ではあるものの、数千語規模の完全な手話語彙からすればまだ小さな一部分にすぎないこと、現状でオープン語彙の実会話に対応できると過大評価しないよう注意したいと、慎重な姿勢を示しています。さらに同氏は、本システムが翻訳しているのは「手の動き」のみであり、顔の表情による文法、口形、身体の姿勢、空間構文といった、手話における文法的に重要な要素を捕捉していない点を明確に認めています。
この指摘は、ろう者コミュニティの言語的尊厳に直結する重要な論点です。手話は手だけで完結する言語ではなく、表情や視線、体の向きが文法そのものを担います。「手話翻訳デバイス」と一括りに呼ぶことが、こうした言語の本質を軽視する誤解を読者に与えないよう、メディアとしても慎重な紹介が求められる領域だと考えます。
実用化までの道のりについては、責任著者であり延世大学校電気電子工学科准教授のキ・ジュン・ユ氏が、将来的には会話全体の意味、意図、ニュアンス、感情のトーンまで読み取り、各個人の手話スタイルに適応するシステムを目指すと述べています。また、共著者で韓国外国語大学校のカン氏は ZME Science の取材に対し、Bluetooth チップ、小型加速度計、フレキシブル基板といった主要部品がすでに民生用電子機器で広く安価に流通していること、希少材料は使用していないことを強調し、量産時には他のコンシューマーウェアラブルと同等のコスト水準まで下がりうるとの見通しを示しています。次の展開としては、研究チームの所属国にちなみ韓国手話(KSL)への対応が自然な次のステップとして言及されています。
長期的な視座で見れば、このリング型・モジュラー・ワイヤレスというアーキテクチャは、手話翻訳に留まる技術ではありません。論文の考察部分でも触れられているとおり、VR/AR の空間操作、タッチレスデバイスインターフェース、リハビリテーションにおける細かな手指運動のモニタリングなど、ジェスチャー駆動型アプリケーション全般への横展開が想定されます。スマートリングという形状自体が、近年急速に拡大している身体装着型デバイス市場の中で、新たなフォームファクターとして注目を集めつつあることも、この技術の社会実装に追い風となる要因でしょう。
innovaTopia としてあえて加えたい視点は、「アクセシビリティ技術はマジョリティ側の便利さに転用された瞬間に、本来の使命を見失う」という歴史的なリスクへの留意です。OCR が視覚障害者支援から始まり、音声認識が聴覚障害者支援を起点として発展してきたように、支援技術はしばしば一般消費財へと拡張されてきました。WRSLT もまた VR コントローラーやスマートホーム操作デバイスとして商品化が進む可能性は十分にあります。その際、ろう者コミュニティ自身が開発プロセスに継続的に関与し、彼らの言語的・文化的アイデンティティを尊重した形で技術が育っていくこと、それを支える制度設計が同時に整っていくことが、「Tech for Human Evolution」の理念に照らして本質的に重要な論点だと考えます。
【用語解説】
ASL(American Sign Language、アメリカ手話)
米国およびカナダの英語圏で使用される手話。独自の文法と語順を持ち、英語とは異なる独立した言語として扱われる。
ISL(International Sign Language、国際手話)
国際的な会議やイベントで、異なる手話を母語とする手話話者間のコミュニケーションのために用いられる接触手段。学術的には「International Sign(IS)」と呼ばれることも多く、固有の母語話者を持たない接触変種として位置付けられる。ピジンに近いとする見解と、独自の文法的特徴を持つコイネに近いとする見解の双方が存在する。本論文では ISL 表記が採用されている。
3軸加速度計
X・Y・Z の3方向の加速度を測定する MEMS センサー。重力を基準ベクトルとして利用すれば静止時の傾きが、運動時には動的な加速度パターンが計測できる。スマートフォンの画面回転検出にも使われている。
BLE(Bluetooth Low Energy)
低消費電力で短距離無線通信を行う規格。コイン電池や小型バッテリーでも長時間動作するため、ウェアラブルデバイスに広く採用されている。
Bluetooth マルチリンク通信
1台のホスト機器が複数の BLE 周辺機器と同時に独立した通信リンクを確立する技術。WRSLT では7つのリングが並列にデータを送信する基盤となっている。
SoC(System-on-Chip)
プロセッサ・メモリ・無線通信モジュールなどを1つのチップに集積した半導体。WRSLT には Bluetooth 通信機能を内蔵した MBN52832 が搭載されている。
未学習ユーザー条件(unseen-user condition)
AI モデルの訓練データに含まれていない人物を対象に性能を評価する実験設定。実社会での汎化性能を測る厳密な指標とされる。
LRP(Layer-wise Relevance Propagation、層別関連性伝播)
ニューラルネットワークの判断にどの入力特徴がどれだけ寄与したかを層ごとに逆算する説明可能AI(Explainable AI)の手法の一つ。
R-CAM(Relevance-weighted Class Activation Map)
関連性スコアで重み付けされたクラス活性化マップ。分類結果の根拠となる時間的・空間的領域を可視化する技術。
t-SNE(t-distributed Stochastic Neighbor Embedding)
高次元データの構造を保ちながら2次元または3次元に圧縮して可視化する次元削減手法。クラスタの分離性を直感的に確認できる。
逐次単語検出フレームワーク(sequential word detection framework)
本研究で提案された独自手法。固定幅のスライディングウィンドウを連続入力に適用し、2回以上連続して同一単語が検出された場合のみ確定する。文の境界を事前学習する必要がない点が特徴。
サーペンタイン構造
蛇行した形状の配線パターン。直線配線と比べて引っ張りや曲げによる応力を分散できるため、フレキシブル・伸縮性エレクトロニクスで多用される。
PDMS(ポリジメチルシロキサン)
シリコーン系の柔軟ポリマー。生体適合性が高く、フレキシブルデバイスの基板や封止材として広く用いられている。
MFLOPS(メガ浮動小数点演算/秒)
コンピュータの計算負荷を示す単位で、1秒あたり百万回の浮動小数点演算を意味する。論文では「推論あたり14.3 MFLOPS」と表記されており、原文に従って本記事でも同表記を用いている。現在のスマートフォン CPU でも余裕で処理可能な軽量さである。
ファウンデーションモデル(基盤モデル)
大規模データで事前学習され、多様な下流タスクに転用できる汎用 AI モデル。WRSLT ではテキストエンコーダ部分に活用されている。
ヒューマン・マシン・インターフェース(HMI、Human-Machine Interface)
人間と機械が情報をやり取りする接点となる技術や仕組みの総称。ジェスチャー入力、音声入力、視線入力などが含まれる。
世界ろう連盟(WFD、World Federation of the Deaf)
ろう者の権利擁護を行う国際 NGO。世界に300以上の手話が存在することを公式に発表している。
【参考リンク】
Science Advances(本論文掲載誌)(外部)
米国科学振興協会(AAAS)が発行するオープンアクセス学術誌。本論文の全文・図表・補足資料が公開されている。
WRSLT 公開コードリポジトリ(GitHub)(外部)
本研究のソースコードが共同筆頭著者イェジ・シン氏のアカウントで公開されている。
Dryad(研究データ公開リポジトリ)(外部)
オープンサイエンス推進のための学術データリポジトリ。本研究のデータも公開されている。
HandSpeak(外部)
ASL の語彙を動画で学べる手話辞書プラットフォーム。本研究で語彙選定の参照源として用いられた。
Spread the Sign(外部)
スウェーデンに拠点を置く国際手話辞書プロジェクト。本研究で ASL/ISL の対応関係確認に使われた。
世界ろう連盟(WFD)(外部)
ろう者の人権・言語的権利を擁護する国際 NGO。世界の手話の多様性に関する公式情報を発信している。
Samsung Electronics(Samsung Research Funding Center 運営元)(外部)
本研究の資金提供元の一つである Samsung Research Funding Center を運営する企業。
【参考記事】
Sign Language Translator Rings Turn Gestures into Text(IEEE Spectrum)(外部)
責任著者キ・ジュン・ユ氏および共同責任著者ドシク・ファン氏への直接取材を含み、ASL 88.3%、ISL 88.5% の精度を達成した一方で、200語は完全な手話語彙の一部に過ぎないこと、現システムが顔の文法・口形・身体姿勢・空間構文を捕捉していないことなどの限界を共著者自身が明示している。
These Wireless Rings Can Translate Sign Language Into Text Without Cameras or Gloves(ZME Science)(外部)
未学習ユーザー条件下で ASL 88.3%、ISL 88.5% の精度を達成したこと、共著者カン氏のコメントとして Bluetooth チップや加速度計、フレキシブル基板など民生用電子部品のみで構成され、量産時には一般のコンシューマーウェアラブル並みのコストに収まる見通しを伝えている。
Seven smart rings promise to break sign language barriers by turning hand movements into instant text(Tech Xplore)(外部)
世界ろう連盟が世界に300以上の手話が存在すると公表していること、ASL と ISL で約88%の精度を達成したこと、3軸加速度計や Bluetooth マルチリンク通信の役割など技術仕様と社会的背景を平易に整理している。
One-of-its-kind ‘smart rings’ could break sign language barrier for 300 million people(Tech.Yahoo)(外部)
世界の聴覚障害者数の規模(3億人)を見出しで示し、WRSLT の語彙数100語ずつという制約に言及。本技術の新規性はモジュール性・ワイヤレス構造・ユーザー間汎化性の組み合わせにあると分析している。
This see-through smart ring translates sign language and almost works like magic(Digital Trends)(外部)
訓練グループと完全に分離されたテストグループで ISL 88.5%、ASL 88.3% という精度を達成した点を、手話の個人差を考慮すれば印象的な結果だと評価。今後の小型化と多言語対応拡張が次の課題と展望している。
AI Rings Turn Sign Language Into Speech(Electronics For You)(外部)
延世大学校が手話翻訳ウェアラブルを開発し、約90%の精度でリアルタイム音声化を実現したと報じる。独立配置のリングが快適性と柔軟性を改善する仕組みを技術系読者向けに解説している。
AI Rings Are Breaking Down Communication Barriers(Hackster.io)(外部)
延世大学校チームが従来のグローブ設計を独立センサーリング数個に置き換えた点を紹介。各リング内蔵の加速度計が指の動きと手の向きを追跡するハードウェア設計面に焦点を当てている。
【関連記事】
MediaPipe×YOLOv8で実現!転移学習を活用した手話リアルタイム翻訳AI、FAU研究チームが98%の精度を達成
ビジョンベース(カメラ)の手話翻訳AIに関する記事。装着型の WRSLT と対照的なアプローチを比較できる。
Silence SpeaksのAI手話アバターがロンドンで本格導入 – 公共交通・医療現場の情報格差をAIで解消
音声・テキストを手話アバターで出力する逆方向の翻訳技術。WRSLT と組み合わせれば双方向翻訳の可能性が見える。
スマートリングが「指のリモコン」に進化していく|Ouraがジェスチャー認識技術のDoublepointを買収
リング型デバイスでジェスチャー認識を行う商用動向。WRSLT が見据える VR/AR・タッチレスインターフェース応用と直結する。
急成長を遂げるスマートリングの世界:Oura Ring、EVERINGたちが生活を変える。”指先のテクノロジー”とは
スマートリング市場全体の俯瞰記事。WRSLT が属する身体装着型デバイス市場の文脈把握に有用。
【編集部後記】
指に通すだけの小さなリングが、ろう者と聴者の間に長く存在してきた壁を、少しずつ低くしていく未来。それを想像しながら本記事を書きました。一方で、手話は手の動きだけでは完結しない言語であり、表情や視線、空間の使い方までもが文法を担っています。
技術が手話を「翻訳」するとき、何が拾えて、何が抜け落ちるのか。みなさんが日常で使うジェスチャーや表情のうち、もし機械に置き換わったら失われてしまうものは何だと思いますか。WRSLT のような技術と社会の距離感を、一緒に考えていけたらうれしいです。












