AIが私たちの代わりに電話をかけ、予約を取り、問い合わせを完了する時代が本格的に始まりました。GensparkのAI通話サービス「Call for Me」は、既に18万人のユーザーが利用し、1日800件の電話を代行。言語の壁を越えて世界中のサービスにアクセスできる、まったく新しいコミュニケーションの形が現実になっています。
Twilioは2026年2月3日、GensparkのグローバルAI通話サービス「Call for Me」がTwilio Programmable Voiceを採用したことを発表した。同サービスはAIエージェントがユーザーに代わって電話を発信し、予約手配、情報収集、カスタマーサポート対応などのタスクを代行する。
40か国以上で多言語対応し、ユニークユーザー数は18万人、1日最大800件の発信通話を処理している。通話成功率94.3%、稼働率99.97%を達成し、全通話の23%でリアルタイム言語翻訳が活用されている。一秒未満のレイテンシーで安定した通話品質を実現する。Gensparkはパロアルトに拠点を置き、Microsoft、Google、Meta、YouTube、Pinterestの出身者が設立した企業である。
2025年4月に「Super Agent」を発売して以降、ユーザー数が急増している。
From:
GensparkがグローバルAI通話サービス「Call for Me」にTwilioを採用
【編集部解説】
今回のニュースが示すのは、AIが「テキストを生成する存在」から「実際に行動する存在」へと進化した瞬間です。従来のChatGPTやClaude、Geminiといった対話型AIは、ユーザーの質問に答えることには長けていました。しかし「Call for Me」は、ユーザーに代わって電話をかけ、予約を取り、交渉し、結果を報告するという、これまでにない実行力を備えています。
このサービスが際立つのは、40か国以上での多言語対応と、23%の通話でリアルタイム言語翻訳を活用している点です。東京のレストラン予約を英語話者が、ベルリンのベンダーへの問い合わせを日本語話者が行えるという、言語の壁を越えた「代理実行」が現実になりました。
技術的な基盤となるTwilio Programmable Voiceは、180か国以上で展開される音声通信プラットフォームで、通話成功率94.3%、稼働率99.97%という高い信頼性を実現しています。一秒未満のレイテンシーでリアルタイム応答が可能なため、AIエージェントが人間のように自然な会話をこなせるのです。
興味深いのは、Gensparkが「Mixture-of-Agents」というアーキテクチャを採用している点です。これは9つの異なる大規模言語モデルと80以上の専門ツールを動的に組み合わせる仕組みで、タスクに応じて最適なAIモデルを選択します。従来の単一モデル依存から脱却し、複数の専門家が協力するような形でタスクを処理できるため、複雑な電話対応でも高い成功率を維持できています。
ただし、AI音声通話には規制上の課題も存在します。米国では2024年2月にFCC(連邦通信委員会)がAI生成音声通話をTCPA(電話消費者保護法)の対象として明確化し、事前の明示的同意なしにAI音声による営業電話をかけることを禁止しました。Gensparkのサービスはユーザーが自らの代理人としてAIに電話をかけさせる形式のため、この規制には該当しませんが、今後の機能拡張では透明性とオプトアウト機能の確保が重要になります。
2026年のAI音声エージェント市場では、「反応型」から「予測型・自律型」への移行が加速しています。Gartnerは2026年末までに企業アプリケーションの40%がタスク特化型AIエージェントを統合すると予測しており、これは2025年の5%未満から大幅な増加となります。また、カスタマーサービスの10件に1件が完全に自動化されると見込まれています。
この技術が普及すれば、言語の壁、時差、待ち時間といった従来のコミュニケーション障壁が大幅に低減されます。個人ユーザーにとっては日常の雑務からの解放、企業にとってはカスタマーサポートや営業フォローの効率化が実現するでしょう。一方で、AI音声詐欺やなりすましといったリスクも増大するため、本人確認やセキュリティ対策の強化が並行して進む必要があります。
Gensparkは2025年4月に「Super Agent」をリリースして以降、わずか10か月でユニークユーザー数18万人を獲得しました。この急成長は、「AIに仕事を任せる」という需要が想像以上に大きいことを示しています。今後、企業向け機能の拡充により、営業フォロー、顧客対応、業務ワークフローの自動化が進めば、ナレッジワーカーの働き方そのものが変わる可能性があります。
【用語解説】
AIエージェント
単なる対話型AIとは異なり、ユーザーの指示に基づいて自律的にタスクを実行するAIシステム。情報検索だけでなく、予約、問い合わせ、交渉など、実世界での行動を代行する能力を持つ。
レイテンシー
通信における遅延時間のこと。音声通話では、発話から相手に届くまでの時間を指す。一秒未満のレイテンシーは、人間同士の自然な会話と同等の応答速度を実現する。
Mixture-of-Agents(MoA)
複数の大規模言語モデルを動的に組み合わせるアーキテクチャ。タスクの性質に応じて最適なAIモデルを選択し、それぞれの強みを活かして処理を行う。単一モデルより高い精度と柔軟性を実現する。
TCPA(電話消費者保護法)
米国の連邦法で、自動ダイヤルシステムや録音メッセージによる営業電話を規制する。2024年2月にFCCがAI生成音声も対象に含めることを明確化した。
FCC(連邦通信委員会)
米国の独立政府機関で、通信に関する規制を担当する。ラジオ、テレビ、電話、インターネットなどの通信インフラとサービスを監督する。
【参考リンク】
Genspark公式サイト(外部)
AIエージェント「Super Agent」と音声通話サービス「Call for Me」を提供。10億人以上のナレッジワーカー向けオールインワンAIワークスペース。
Twilio公式サイト(日本語)(外部)
180か国以上で展開するカスタマーエンゲージメントプラットフォーム。Programmable Voice、SendGrid、Verifyなど通信APIを提供。
Twilio Programmable Voice(外部)
音声通話を実装するためのAPI。AIエージェントによる自動通話、多言語対応、リアルタイム翻訳などの機能実装が可能。
【参考記事】
Genspark Uses Twilio to Power Global AI Calling ‘Call for Me’ Agent(外部)
ユニークユーザー数18万人、1日最大800件の通話処理、通話成功率94.3%など具体的な数値データを提示。
Genspark Uses Twilio to Power Global AI Calling ‘Call for Me’ Agent(外部)
Business Wire配信の公式プレスリリース。エンジニアおよびTwilio副社長のコメントを掲載。
Voice AI Trends 2026: Enterprise Adoption & ROI Guide(外部)
Gartner予測として企業アプリの40%がAIエージェント統合、カスタマーサービス10件に1件が完全自動化と分析。
Super Agent | Genspark AI(外部)
Mixture-of-Agentsアーキテクチャが9つのモデルと80以上のツールを動的に組み合わせる技術詳細を解説。
Ethics and AI Phone Calls: Are AI Voices Legal?(外部)
FCCがAI生成音声をTCPA対象に明確化。透明性とオプトアウト機能の重要性について詳述。
【編集部後記】
AIが私たちの代わりに電話をかける時代が、思ったより早く到来しそうです。レストランの予約、問い合わせ、カスタマーサポートへの連絡など、「面倒だけどやらなきゃ」と後回しにしていたタスクを、AIが代行してくれるとしたら、あなたはどう活用しますか?
言語の壁を越えて海外のサービスを利用できる可能性にワクワクする一方で、「本人確認はどうなるのか」「AIが勝手に交渉することへの不安」を感じる方もいるかもしれません。私自身も、この技術がもたらす便利さと、透明性や倫理面でのバランスをどう取るべきか、考え続けています。みなさんの率直な意見や懸念を、ぜひお聞かせください。






がもたらす「アンテザード・ソサエティ」の衝撃-300x200.png)





























