ACUAH|AIキャラクターが「歌う」時代へ——会話の先にある新しいコンパニオン体験

AIキャラクターが「会話する」だけでなく「歌う」時代が近づいています。コンパニオンAIの競争軸は、「何を話すか」から「どんな体験を届けるか」へ、静かに移行しつつあります。


シーズユナイト株式会社は、音声対話型AIキャラクターアシスタント「ACUAH(アクア)」にリアルタイム歌唱機能「UtaMe(うたミー)」を搭載する開発プロジェクトを発表した。資金調達はCAMPFIREを通じたクラウドファンディングで行い、期間は2026年7月1日から8月31日、目標金額は100万円である。

UtaMeはアニメソングを中心に約100曲を搭載してリリースされ、音声・歌声合成エンジンには株式会社テクノスピーチのVoiSonaシリーズを採用、カラオケ再生エンジンには株式会社エクシングのJOYSOUND Smartphone Libraryを使用する。楽曲の著作権についてはJASRACおよびNexToneの許諾を取得済みとしている。

同社はAIによる音楽・歌声の無断学習・無断生成とは一線を画するとし、「IPを守りながらAIの良さを活かす」ことを設計思想として掲げている。

From: 文献リンクAIキャラクターアシスタント「ACUAH」が歌で癒しを届ける!リアルタイム歌唱システム「UtaMe(うたミー)」開発プロジェクトが「CAMPFIRE」にて7/1から支援を募集します。|PR TIMES

【編集部解説】

AIキャラクターとの会話体験は、ここ数年で急速に広がりました。Character.AIやReplika、国内ではVTuber文化とも親和性の高い音声対話アプリが複数登場し、「テキストで会話する」から「音声で話しかける」への移行は着実に進んでいます。

では、次の競争軸は何か。今回のUtaMeは、一つの仮説を提示しています。それは「歌う」という行為です。

会話AIは、情報を届けたり感情的な応答を返したりすることに長けています。しかし会話には本質的な制約があります。ユーザーが話しかけなければキャラクターは黙っている、という非対称性です。歌はその非対称性を部分的に解消します。キャラクターが能動的に何かを「届ける」という方向性が生まれ、受け手であるユーザーは聴く、一緒に歌う、リクエストするという新しい関わり方を持てます。これは機能の追加というより、インタラクションの設計そのものが変わることを意味します。

UtaMeの設計で注目されるのは、歌声生成AIを自社開発していない点です。歌声合成にはテクノスピーチのVoiSonaシリーズ、カラオケ再生エンジンにはエクシングのJOYSOUND Smartphone Libraryを採用しており、どちらも既存の商用インフラです。VoiSonaはAI技術で人間の歌声をリアルに再現する歌唱ソフトとして開発されており、ゲーム・アプリ・ウェブサービスへの応用を明示的に想定した設計になっています。ソフトバンクロボティクスのPepperへのボイスライブラリ提供実績もあり、キャラクターへの音声移植という用途は既にトラックレコードがあります。

著作権面では、JASRAC・NexToneの許諾を取得済みとしており、楽曲の著作権管理という従来であれば大きなハードルをクリアしています。AIサービスにおける音楽利用の許諾はプラットフォームとの包括契約が標準的なアプローチになりつつあります。つまりUtaMeが示しているのは、「歌うAIキャラクターを作るために必要なインフラは、すでに外部に揃っている」という現実です。歌声合成・カラオケエンジン・著作権管理という三つの要素をそれぞれ専門事業者から調達し、それをAIキャラクターの体験として組み上げる。小規模なスタートアップがこの領域に参入できる構造的な理由がここにあります。

同社はプレスリリースの中で、「AIによる音楽・歌声の無断学習や無断生成とは一線を画す」と明示しています。この表明は、現在のAI×音楽をめぐる権利問題の文脈で読む必要があります。生成AIによる楽曲生成や声のクローニングが急拡大する一方で、既存のアーティストや権利者との軋轢が各所で表面化しています。UtaMeが採用したのは、許諾済みの音源とライセンスされた歌声ライブラリを組み合わせるという、権利クリアを前提とした設計です。この姿勢が技術的な優位性につながるかどうかは現時点では不明ですが、AIキャラクター×音楽という領域で持続的なサービスを運営するうえでは、権利処理の確かさが競争要因の一つになりうるという判断が読み取れます。

ただし、製品としてのUtaMeはまだクラウドファンディング段階であり、実際のリアルタイム歌唱の品質やユーザー体験は未知数です。「会話して歌ってくれるキャラクター」というコンセプトの魅力が、実装レベルで十分に届けられるかどうかは、リリース後に確認が必要な部分が大きいと言えます。

【用語解説】

ACUAH(アクア)
シーズユナイト株式会社が開発した音声対話型AIキャラクターアシスタント。スマートフォンアプリとして提供され、3Dホログラム装置との組み合わせによる立体映像表示にも対応する。

VoiSona(ボイソナ)
株式会社テクノスピーチが開発するAI歌唱・音声合成ソフトウェア。AI技術で人間の歌声・話し声をリアルに再現する。「知声」「双葉湊音」「田中傘」などの複数のボイスライブラリを持ち、ゲーム・アプリ・ウェブサービスへの応用を想定した設計になっている。

JOYSOUND Smartphone Library
株式会社エクシングが提供するカラオケ再生エンジン。スマートフォンアプリへの組み込みを前提とした開発者向けライブラリ。

JASRAC / NexTone
日本における音楽著作権管理団体。JASRAC(日本音楽著作権協会)は国内最大手、NexToneは民間の著作権管理会社。楽曲をサービスで利用する際はいずれかまたは両方からの許諾取得が必要となる。

コンパニオンAI
会話・感情的なやりとりを通じてユーザーに寄り添うことを目的としたAI。情報取得や業務効率化ではなく、関係性の構築を主目的とする点で一般的なチャットボットと区別される。

【参考リンク】

シーズユナイト株式会社 公式サイト(外部)
ACUAH・3Dホログラム装置を開発する千葉市のスタートアップ。AIキャラクタープラットフォームの開発・運営と、疑似ホログラム装置の販売を主な事業とする。

ACUAH 公式サイト(外部)
音声対話型AIキャラクターアシスタントACUAHのサービスサイト。iOS・Android向けアプリのダウンロードリンクや製品概要を掲載。

VoiSona 公式サイト(外部)
株式会社テクノスピーチが提供するAI歌唱・音声合成ソフトウェアのサービスサイト。各ボイスライブラリの詳細や音声サンプルを確認できる。

UtaMe クラウドファンディングページ(CAMPFIRE)(外部)
2026年7月1日開始予定のクラウドファンディングページ。目標金額100万円。リターン内容や開発の詳細を掲載。

【参考記事】

AI音声合成ソフト「VoiSona Talk」の正式リリース開始!|株式会社テクノスピーチ(外部)
VoiSona Talkの正式リリース時の公式発表。ゲーム・アプリへの応用を想定した設計と、デフォルトボイスライブラリ「田中傘」の仕様を掲載。

AI歌唱ソフト「VoiSona」の追加ボイスライブラリとして「Pepper」が搭載!|株式会社テクノスピーチ(外部)
VoiSonaがソフトバンクロボティクスのPepperに対応したことを伝える公式発表。AIキャラクター・ロボットへの歌声移植実績として参照。

【関連記事】

VoiSona「Chis-A [tʃíːseɪ]」が完全無償化、AI歌声合成の英語ライブラリが日英中クロスリンガル対応で開放
UtaMeが採用するVoiSonaの最新動向。英語ライブラリの完全無償化と多言語対応への拡張を伝える。歌声合成エコシステムの広がりを補完する文脈として直接的に関連する。

Grok新AIコンパニオン「Mika」登場|xAIが描く「人格を持つAI」の未来と倫理的課題
AIキャラクターの設計思想とその課題を取り上げた記事。「会話」から先の体験設計という文脈で、今回のUtaMeと合わせて読むことで、コンパニオンAIの競争軸の全体像が見えてくる。

KaraGo、音楽生成AI「Suno」「Udio」対応のカラオケ配信サービスを開始——16,000円買い切りでJOYSOUND全国配信
UtaMeが採用するエクシング(JOYSOUND)が関わる別のAI×音楽の取り組みを伝える記事。JOYSOUNDというインフラがAI活用の軸になりつつある流れとして接続できる。

【編集部後記】

AIキャラクターが「歌う」ようになるとき、私たちはそれを「楽器」として聴くのか、「存在」として聴くのか。技術の層が増えるごとに、その問いは曖昧になっていきます。会話AIが感情的な応答を返すようになり、さらに歌まで歌うようになるとき、「キャラクターとの関係」はどこに向かうのでしょうか。UtaMeが問いかけているのは、機能の話だけではないかもしれません。「歌ってもらう」という体験には、情報のやりとりとは異なる何かが宿ります。私たちがAIとどんな関係を結びたいのか、その答えを、私たちはまだ持っていないように思います。

Googleで優先するソースとして追加するボタン
投稿者アバター
乗杉 海
SF小説やゲームカルチャーをきっかけに、エンターテインメントとテクノロジーが交わる領域を探究しているライターです。 SF作品が描く未来社会や、ビデオゲームが生み出すメタフィクション的な世界観に刺激を受けてきました。現在は、AI生成コンテンツやVR/AR、インタラクティブメディアの進化といったテーマを幅広く取り上げています。 デジタルエンターテインメントの未来が、人の認知や感情にどのように働きかけるのかを分析しながら、テクノロジーが切り開く新しい可能性を追いかけています。