ーTech for Human Evolutionー

Hume AI EVI 3が革新する感情認識音声AIの未来——カスタムボイス生成と業界最速応答を実現

AI（人工知能）ニュース

Headline News

TaTsu

[公開]

2025年5月30日8:39

[更新]2025年5月30日

Hume AI EVI 3が革新する感情認識音声AIの未来カスタムボイス生成と業界最速応答を実現 - innovaTopia

2025年5月29日、米国ニューヨークのHume AIは会話型AI音声モデル「Empathic Voice Interface（EVI）3」を発表した。

EVI 3はユーザーが自然言語で声の特徴や性格を指定し、即座にカスタム音声を生成できるボイス・トゥ・ボイス機能を持つ。

用途はカスタマーサポート、ヘルスコーチング、ストーリーテリング、バーチャルコンパニオンなど多岐にわたる。個人はHumeのウェブサイトやiOSアプリでデモ利用が可能で、開発者向けAPIは近日中に提供予定。

Humeの1,720人によるユーザーテストでは、EVI 3はOpenAIのGPT-4oやGoogle Gemini、Sesameなど競合モデルより自然さ、表現力、共感性、応答速度などで高評価を得た。

EVI 3は約300ミリ秒の低遅延、多言語対応（英語・スペイン語）、無制限のカスタムボイス生成を特徴とし、価格は従量課金制で詳細は未発表である。

From: Emotive voice AI startup Hume launches new EVI 3 model with rapid custom voice creation

【編集部解説】

EVI 3は、従来のAI音声モデルと比較して、ユーザーの感情や意図をより深く理解し、自然な会話を実現する点が際立っています。

Hume独自の音声・言語統合モデルにより、会話中にプロンプトで話し方や感情を即時に調整できるため、カスタマーサポートやヘルスケア、教育、エンターテインメント分野での応用が期待されています。

また、API経由での統合が容易であり、開発者や企業は自社サービスにEVI 3の音声体験を組み込むことができます。競合のGPT-4oやGeminiと比較して、共感性や表現力、応答速度で優位性を示していることが公式ベンチマークでも確認されています。

一方で、声のクローン機能は現時点でEVI 3には搭載されておらず、倫理的配慮や悪用防止策が重視されています。今後、音声AIが社会に浸透する中で、感情データの取り扱いや規制、プライバシー保護の重要性がさらに高まると考えられます。

EVI 3の登場は、音声AIが単なる情報伝達手段から、人間の感情や個性を媒介するインターフェースへと進化する転換点と言えるでしょう。

【用語解説】

Empathic Voice Interface（EVI）：
Hume AIが開発した、感情や個性を反映できる会話型AI音声モデルのシリーズ名。

ボイス・トゥ・ボイス：
ユーザーの声や特徴をもとにAIが即座にカスタム音声を生成する技術。

感情知能（Emotional Intelligence）：
AIが声の抑揚や間、トーンから感情を推定し、応答に反映する能力。

API（Application Programming Interface）：
他のソフトウェアやサービスと機能を連携させるための仕組み。

【参考リンク】

Hume AI公式サイト（外部）
感情認識AIや音声合成AIを開発する米国ニューヨーク拠点の企業。EVIシリーズやOctave TTSなどを提供。

EVI 3公式ブログ（外部）
2025年5月発表のEVI 3に関する公式解説。技術的特徴や活用例を掲載。

【参考動画】

【編集部後記】

AI音声技術が進化し、感情や個性を持つカスタム音声が身近になりつつあります。もし自分だけのAIボイスや、状況に応じて感情を変える音声AIが使えるとしたら、どんなシーンで活用してみたいと思いますか？みなさんのアイデアや期待をぜひ聞かせてください。

【参考記事】

ZDNET「Hume’s new EVI 3 model lets you customize AI voices – how to try it」
Hume AI公式ブログ「Introducing EVI 3」
TestingCatalog「Hume.ai released EVI 3, a new personalized voice AI model」

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

AI（人工知能）ニュース

Headline News

TaTsu

『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

記事一覧