ElevenLabs、会話型AIプラットフォームを発表 ─ 3000種類の音声と32言語対応

ElevenLabs、会話型AIプラットフォームを発表 ─ 3000種類の音声と32言語対応で圧倒的な没入感を実現 - innovaTopia - (イノベトピア)

Last Updated on 2024-10-25 08:31 by admin

音声AI技術で知られるElevenLabsは、2024年10月21日にサンフランシスコでAndreessen Horowitz (a16z)と共同で会話型AIに関するミートアップを開催し、新しい会話型AIプラットフォームのプレビューを発表することを明らかにした。

このプラットフォームは音声対音声のAIエージェントを簡単に構築できることを特徴としており、同社が持つ3,000以上の高品質なAI音声ライブラリと音声クローニング技術を活用する。

ElevenLabsは2023年に80億円規模の資金調達を実施してユニコーン企業となった企業で、最近では32言語に対応したReaderアプリをグローバルにリリースするなど、急速に事業を拡大している。

現在提供している音声変換サービスの価格は、ビジネスプランで1分あたり10セントという料金設定で、OpenAIの同様のサービス(入力0.06ドル/分、出力0.24ドル/分)と比較して競争力のある価格となっている。

from:ElevenLabs is teasing a conversational AI platform — I’m excited!

【編集部解説】

ElevenLabsの新しい会話型AIプラットフォームの発表は、音声AI市場に大きな転換点をもたらす可能性があります。

同社はこれまで高品質な音声合成技術で知られてきましたが、今回の発表は単なる音声生成から一歩踏み出し、完全な会話型AIエコシステムの構築を目指すものと言えます。

特筆すべきは、ElevenLabsが持つ3,000以上の高品質な音声ライブラリと32言語対応の技術基盤です。これにより、企業は自社ブランドに最適な音声を選択し、グローバルな展開が可能になります。OpenAIが提供する6つの音声オプションと比較すると、その選択肢の豊富さは圧倧的です。

価格面でも、ElevenLabsは1分あたり10セントという競争力のある料金設定を実現しています。これはOpenAIの料金(入力0.06ドル/分、出力0.24ドル/分)と比較しても魅力的な価格帯といえます。

しかし、この市場にはBland AIなど強力な競合も存在します。Bland AIは最近1,600万ドルの資金調達を完了し、PayPal創業者のMax Levchinなど著名な投資家からの支援を受けています。興味深いことに、ElevenLabsのCTOであるPiotr Dąbkowskiもその投資家の一人となっています。

AIの安全性と責任ある開発という観点では、ElevenLabsは積極的な取り組みを見せています。同社は最近、AI安全性とイノベーションを推進する法案を支持する姿勢を示しており、特に選挙における欺瞞的なAI使用を規制する法案への支持を表明しています。

今後の展望として、この技術は顧客サービス、教育、エンターテインメントなど幅広い分野での活用が期待されます。特に多言語対応と感情表現の機能は、グローバルなビジネスコミュニケーションに革新をもたらす可能性があります。

ただし、音声クローニング技術の悪用や、AIによる詐欺への懸念も存在します。ElevenLabsはこれらの課題に対して、厳格なデータ保護措置とAIコンテンツの出所を特定するためのツール開発で対応を進めています。

【用語解説】

  • 音声クローニング
    人の声を録音データから解析し、AIで再現する技術。
  • 会話型AIプラットフォーム
    LINEやチャットボットのように対話できるAIシステムですが、テキストではなく音声でやり取りができます。

【参考リンク】

  1. ElevenLabs公式サイト(外部)
    AIによる音声合成と多言語音声生成を提供する主要プラットフォーム。無料トライアルも利用可能。
  2. Bland AI(外部)
    AIを活用したカスタマーサービス向け音声ソリューションを提供する企業。

【参考YouTube動画】

How To Clone Your Voice With Eleven Labs AI Tool | AI Voice Cloning | Chris Johnstone

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

ホーム » AI(人工知能) » AI(人工知能)ニュース » ElevenLabs、会話型AIプラットフォームを発表 ─ 3000種類の音声と32言語対応