NTTテクノクロスは2025年11月27日、音声合成プロダクト「FutureVoice」の新バージョンの提供を開始した。新バージョンでは、AI音声の自然性や再現性が向上し、利用シーンに応じて選べるAI音声のバリエーションが拡充された。
最大の特徴は、オリジナルのAI音声生成が顧客企業側で可能になった点である。従来はNTTテクノクロスへの作業委託が必要だったが、タレントや声優などの音声データを数秒から数分用意するだけで自社生成できるようになった。また、クロスリンガル音声合成技術が新たにフランス語とスペイン語に対応し、日本語、英語、中国語、韓国語と合わせて6ヵ国語に拡大した。同製品は2015年7月から展開されており、今回の新バージョンはNTT西日本の音声AI事業「VOICENCE」にも採用されている。
From:
音声合成プロダクト「FutureVoice」、新バージョンを提供開始~選べるAI音声の拡充に加え、オリジナルのAI音声が自社で生成可能に~

【編集部解説】
今回のFutureVoice新バージョンが注目される理由は、AI音声生成の「民主化」と「権利保護」という相反する課題に同時に取り組んでいる点にあります。従来はNTTテクノクロスへの委託が必須だった音声生成を企業側で実行できるようになったことで、コンテンツ制作の機動性が飛躍的に向上します。
特に重要なのが、NTT西日本の「VOICENCE」との連携です。VOICENCEは声優やタレントの「声の権利」を保護するサービスで、声紋認証技術を用いて無断使用を検出・防止する仕組みを提供しています。FutureVoiceがこのエコシステムに組み込まれることで、権利者が安心してAI音声ビジネスに参入できる環境が整いつつあります。
クロスリンガル音声合成技術の6言語対応も見逃せません。数秒から数分の音声データから他言語のネイティブな発音を生成できるこの技術は、2023年に国内初の商用提供が開始されました。声優やキャラクターの声質を保ったまま多言語展開できるため、日本のコンテンツの海外展開において大きなアドバンテージとなるでしょう。
潜在的なリスクとしては、生成の容易さが悪用につながる可能性です。だからこそVOICENCEのような権利管理基盤との統合が不可欠であり、技術提供者としての責任が問われています。今後は声の権利をブロックチェーンで管理するような、より高度な仕組みも求められるかもしれません。
【用語解説】
音声合成(Text-to-Speech, TTS)
テキストデータを人工的な音声に変換する技術である。AI技術の進化により、従来の機械的な読み上げから、人間に近い自然な抑揚や感情表現が可能になった。
クロスリンガル音声合成技術
1つの言語の音声データから、他の言語でもその話者の声質を保ったままネイティブな発音を生成する技術である。言語情報と話者情報を分離して処理することで実現される。
DNN音声合成(Deep Neural Network)
深層学習の一種であるディープニューラルネットワークを用いた音声合成手法である。大量の音声データから特徴を学習し、自然で表現力豊かな音声を生成できる。
ゼロショット/フューショット学習
わずか数秒から数分程度の音声サンプルから、その話者の声を再現できる学習手法である。従来は長時間の録音が必要だったが、この技術により収録負担が大幅に軽減された。
NTT人間情報研究所
NTTグループの研究機関で、音声認識・音声合成技術の研究開発を担当している。FutureVoiceの基盤技術を開発し、国際学会INTERSPEECHなどで継続的に研究成果を発表している。
【参考リンク】
FutureVoice公式サイト(外部)
NTTテクノクロスが提供する音声合成プロダクトの公式ページ。製品ラインナップ、活用事例、サンプル音声などを掲載している。
VOICENCE(ヴォイセンス)公式サイト(外部)
NTT西日本が運営する音声ブランディングサービス。声の権利保護とAI音声を活用したコンテンツプロデュース事業を展開している。
NTT Human Informatics Laboratories(外部)
音声認識・音声合成の研究開発を行うNTT人間情報研究所の英語サイト。最新の研究トピックスや技術情報を発信している。
【参考記事】
NTT西日本が”声の権利”を守り、”声の価値”を高める音声AI事業「VOICENCE」を開始(外部)
NTT西日本が2025年10月27日に開始したVOICENCE事業の詳細を発表。パブリックブロックチェーンとVC技術を活用した音声IP管理を解説。
Expressive Speech-synthesis Technology Supports People’s Daily Lives(外部)
NTT技術ジャーナルに掲載されたクロスリンガル音声合成技術の解説記事。ゼロ/フューショット学習の技術的詳細を述べている。
AI Voice Cloning Market Size, Share & Trends Report, 2030(外部)
Grand View Researchによる市場調査レポート。世界のAI音声クローニング市場は14.5億ドル規模で年平均成長率26.1%と予測。
【編集部後記】
AI音声技術が身近になるにつれ、私たちの「声」の価値について考える機会が増えてきました。もしあなたの声がAIで再現できるとしたら、どんな使い方をしてみたいですか?家族への読み聞かせを残したり、多言語でメッセージを届けたり、可能性は無限に広がります。
一方で、声の権利をどう守るべきかという問いも重要です。クリエイターとして、消費者として、あなたはこの技術にどんな未来を期待しますか?ぜひSNSで意見を聞かせてください。






























