機械的で平坦だったAI音声に、ついに「感情」という新たな次元が加わりました。東京のスタートアップ、株式会社CoeFontが8月5日にリリースした「CoeFont v3 Fuji」は、喜怒哀楽や微細な感情変化を自然に表現できる音声合成モデルです。これまで多くの人が感じていた「なにか物足りない」というAI音声への違和感が、ついに解消される時が来たかもしれません。
株式会社CoeFont(本社:東京都港区、代表取締役:早川尚吾)は、AI音声プラットフォーム「CoeFont」の最新音声モデル「CoeFont v3 Fuji」を2025年8月5日(火)に正式リリースした。このモデルは感情表現の精度と自然な発話リズムを両立し、20種類以上のAI音声を同時に公開している。利用可能文字数は無料ユーザーが3回までの試用、スタンダードプランが月間約8,000文字、プラスプランが月間最大100万文字となる。CoeFontのオリジナルキャラクター「アリアル」と「ミリアル」もv3 Fujiに対応し、感情表現がアップデートされた。同社は2020年設立の東京科学大学認定ベンチャーで、今後は企業向けカスタム音声ソリューションやリアルタイム多言語AI通訳サービスの展開を予定している。
From: AI音声はついに’感情’の領域へ!CoeFont、最新音声モデル「CoeFont v3 Fuji」を正式リリース
【編集部解説】
このニュースは、AI音声技術における重要なマイルストーンと位置づけることができます。CoeFontのv3 Fujiは、従来のAI音声が持つ最大の課題である「感情表現の貧弱さ」に正面から挑戦した製品であり、その意義は単なる技術的進歩を超えて、AI音声が人間の表現領域に本格的に踏み込む転換点を示していると考えられます。
従来のAI音声合成技術は、主に韻律(ピッチ、強勢、リズム)の制御に焦点を当ててきましたが、人間らしい感情の微妙なニュアンスを再現することは困難でした。しかし、v3 Fujiは「感情表現の精度と自然な発話リズムの両立」を実現することで、この技術的障壁を越えようとしている点が注目すべき要素です。
この技術が社会に与える影響は多岐にわたります。まず、ポジティブな側面として、声を失った人々への支援や、多言語コミュニケーションの促進、コンテンツ制作の効率化などが挙げられます。実際、CoeFontは声帯摘出者向けのサービスを無料提供しており、医療・福祉分野での社会貢献も期待されています。
長期的には、この技術は人間とAIのコミュニケーション方式を根本的に変える可能性を秘めています。感情を込めて話すAIが一般化すれば、従来のテキストベースの対話から音声中心の自然な対話へとシフトが進み、ユーザー体験の向上や新たなビジネスモデルの創出につながることが期待されます。
【用語解説】
CoeFont v3 Fuji
CoeFontが開発した最新AI音声モデル。感情表現の精度と自然な発話リズムを両立し、人間に近い音声合成を実現する。「Fuji」は日本の象徴である富士山に由来し、技術的高みと美しさを表現している。
音声合成(TTS)
Text-To-Speechの略称で、テキストデータを音声に変換する技術である。AIが文字情報を読み取り、人間の発話に近い音声を生成する。
【参考リンク】
CoeFont公式サイト(外部)株式会社CoeFontの企業サイト。AI音声プラットフォーム事業の概要や最新情報を掲載
CoeFont CLOUD(外部)CoeFontのメインサービスサイト。AI音声合成やボイスチェンジャー機能を提供
v3チャレンジ申請フォーム(外部)自身の声をv3 Fujiに対応させたいユーザー向けの申請受付フォーム
【参考動画】
【参考記事】
CoeFont Launches v3 Fuji for More Human-Like AI Voices(外部)IT Business Todayによる英語記事。v3 Fujiの技術的特徴と業界への影響を詳しく解説
CoeFont、新AI音声モデル「v3 Fuji」発表(外部)AudioStartによる日本語記事。v3 Fujiの技術的詳細と無料コンテンツについて報告
【編集部後記】
CoeFontのv3 Fujiによって、AI音声がついに感情を込めて話せるようになりました。この技術は私たちの日常にどのような変化をもたらすでしょうか。
皆さんは既にAI音声を使った経験がおありでしょうか?もしこれまで機械的な音声に違和感を感じていたとしたら、感情豊かなAI音声はその印象を変えるかもしれません。一方で、人間の声と区別がつかないレベルになったとき、私たちはどう向き合うべきでしょうか。
ぜひ実際にv3 Fujiを試聴してみて、皆さんなりの感想や活用アイデアを考えてみてください。