innovaTopia

ーTech for Human Evolutionー

AIで言葉の壁を破壊!Akool Live Cameraの140言語超リアルタイム翻訳とアバター技術

 - innovaTopia - (イノベトピア)

Last Updated on 2025-05-29 17:48 by admin

米カリフォルニア州パロアルトに本社を置くAIスタートアップ企業Akool Inc.は、2025年5月28日(現地時間、日本時間5月28日)に、リアルタイムAIビデオ生成ツール「Akool Live Camera」を発表した。

このツールは人工知能(AI)を活用し、ビデオ通話中のリアルタイム翻訳、フェイススワップ(顔交換)、バーチャルアバターによる人間の動作模倣などを100ミリ秒未満という低遅延で実現する。

Akool Live Cameraは、AIによって人間の表情、ジェスチャー、声のトーンを認識し、それらをフォトリアルなアバターを通じてリアルタイムに再現する。主要な機能として、140以上の言語に対応したリアルタイム音声翻訳があり、話し手の声質を維持したままアバターの口の動きと同期させることが可能だ。また、通話中に瞬時にフェイススワップを行う機能も搭載している。この技術は、同社CEOのジャジュン・ルー氏によると、OpenAIのビデオ生成モデル『Sora』がテキストプロンプトから映像を生成するのとは異なり、台本のないライブ配信やオンライン会議、AR(拡張現実)といったインタラクティブな場面でのリアルタイム生成に特化している点が特徴となっている。対応プラットフォームはZoom、Microsoft Teams、Google Meetなど多岐にわたり、これらのプラットフォーム間でシームレスに動作する。

このツールは、同社が提供する「Akool Live Suite」という包括的な製品群の一部として位置づけられており、ライブアバター、フェイススワップ、ビデオ翻訳、リアルタイムビデオ作成といった機能を統合的に提供する。Akool社は既にコカ・コーラやカタール航空といったグローバル企業との協業実績も有している。プライバシー保護にも配慮した設計となっており、顔データはローカルで処理され、機密性の高い会議などではプロフェッショナルなアバターがユーザーの身元を保護する役割を果たす。提供されるアバターは、写実的なものの他に、アニメ風、レトロ調、ビジネス用途に特化したものなど、多様なスタイルから選択でき、服装やキャラクター設定の変更も柔軟に行える。

Akool社は2022年に設立され、現在の従業員数は約80名で、その多くがAppleやGoogleといった大手テクノロジー企業出身者で構成されていると報じられている。同社は創業から短期間で数千万ドル規模の収益を達成しているとされる。Akool Live Cameraは、発表時点ではベータ版として一部の早期導入者向けに提供されており、2025年中に一般向けの正式リリースが予定されている。

from: 文献リンクAkool Live Camera can translate video calls in real time, swap faces and get virtual avatars to mimic human movements | VentureBeat

【編集部解説】

Akool Live Cameraは、AIを活用したリアルタイムビデオ生成技術の分野で大きな注目を集めています。公式発表や複数の海外メディアの報道、公式サイトの記載を総合すると、同社が提供する「ライブ翻訳」「AIアバター」「フェイススワップ」「リアルタイムビデオ生成」といった機能は事実であり、Zoom、Google Meet、Microsoft Teamsといった主要なビデオ会議プラットフォームでシームレスに動作することが確認されています。

特に注目すべきは、140以上の言語に対応するリアルタイムの多言語翻訳とリップシンク技術です。これは、話し手の声質や表情、口の動きを自然に維持したまま翻訳・再現できる点で、既存のAIビデオ生成ツールと比較しても高い水準にあります。また、フェイススワップ機能も高精度で、ユーザーの顔や表情をリアルタイムで他のキャラクターやアバターに置き換えることが可能です。この技術は、OpenAIの『Sora』のようなテキストからの動画生成とは異なり、台本のないライブ環境でのインタラクティブな応答性に特化している点が大きな特徴と言えるでしょう。

この技術がもたらす最大のインパクトは、グローバルなコミュニケーションの壁を大幅に低減する点にあります。例えば、英語しか話せない営業担当者が、Akool Live Cameraを使ってスペイン語圏の顧客に自国語で自然なプレゼンテーションを行ったり、企業のCEOが世界中の拠点にいるチームメンバーに対して、自身のAIアバターを通じて多言語でメッセージを届けたりといった活用が現実のものとなります。教育分野では、言語の異なる生徒へ向けてリアルタイムで授業内容を翻訳・配信したり、医療分野では外国人患者とのコミュニケーションを円滑にしたり、カスタマーサポートでは24時間対応の多言語AIアバターによる応対が実現したりするなど、その応用範囲は非常に広いです。

一方で、AIによるリアルタイム映像生成やフェイススワップ技術には、倫理的・法的な課題も伴います。特にディープフェイク技術の悪用による偽情報の拡散、プライバシー侵害、なりすましといったリスクへの懸念は無視できません。Akool社は、エンタープライズグレードのセキュリティ基準やプライバシーフォワードな設計(顔データのローカル処理など)を強調しており、コミュニティコンテンツポリシーを設けるなど、技術の悪用を防ぐための対策を講じている姿勢を示しています。しかし、今後この技術が普及するにつれて、より包括的な規制や業界全体のガイドライン整備が求められることは間違いありません。ユーザー自身も、生成されたコンテンツが法的に問題ないかを確認する責任が伴う点に留意が必要です。

AIビデオ生成市場では、HeyGenやD-IDといった競合サービスも存在し、各社がリアルタイム性、アバターの自然さ、翻訳精度、セキュリティ機能の強化といった点で技術開発競争を繰り広げています。Akoolは、100ミリ秒未満という低遅延でのリアルタイム処理や、インタラクティブな応答性を強みとしていますが、ユーザー体験のさらなる向上や、より厳格なガバナンス体制の構築が今後の市場での成功の鍵となるでしょう。

Akool Live Cameraは現在ベータ版として早期アクセスが提供されており、正式リリースに向けて期待が高まります。この技術は、単に便利なツールというだけでなく、私たちのコミュニケーションのあり方そのものを変革する可能性を秘めています。その進展と社会的な受容のバランスを注視していく必要があります。

【用語解説】

AIアバター (AI Avatar)
人工知能(AI)技術を用いて、人間の姿や動き、表情、声などをデジタル空間で再現したキャラクターのこと。ビデオ会議やライブ配信、メタバースなどで本人の代わりにコミュニケーションを行うために利用される。

フェイススワップ (Face Swap)
AIを利用して、動画や画像中のある人物の顔を別の人物の顔にリアルタイムまたは後処理で入れ替える技術。ディープラーニングが活用され、表情や顔の向きなどを自然に合成する。

リアルタイム翻訳 (Real-time Translation)
会話やテキストをほぼ同時に他の言語に翻訳する技術。AIによる自然言語処理や音声認識、音声合成技術が用いられ、国際会議やオンラインコミュニケーションでの言語障壁を低減する。

エッジコンピューティング (Edge Computing)
データ処理をクラウド上ではなく、データが発生するデバイス自体やその近く(エッジ)で行う技術。通信遅延の低減やリアルタイム性の向上が期待され、自動運転やAR/VR、本件のようなリアルタイムAI処理に適している。

Akool Live Camera
Akool社が開発したAIビデオ生成ツール。リアルタイムでの多言語翻訳、AIアバター生成、フェイススワップなどの機能を持ち、ZoomやMicrosoft Teamsなどの主要なビデオ会議プラットフォームで利用可能。特に、台本のないライブ環境でのインタラクティブな応答性と低遅延を特徴とし、OpenAIのSoraのようなテキストベースの動画生成とは異なるアプローチをとる。

【参考リンク】

Akool公式サイト(外部)
AIを活用した画像・動画生成プラットフォーム。フェイススワップ、アバター生成、リアルタイム翻訳など、ビジネス向けの多様なAIツール群を提供している。1億5500万以上のアセットが作成された実績を持つ。

Akool Live Camera 公式ページ (英語)(外部)
Akool Live Cameraの詳細情報、機能紹介、早期アクセス(ベータ版)への登録案内などが掲載されている。対応言語は140以上。

Akool Live Camera 公式ページ (日本語)(外部)
Akool Live Cameraの日本語による製品紹介ページ。機能概要やZoom、Google Meet、Microsoft Teamsなど主要プラットフォームとの連携について説明されている。

Akool プライバシーポリシー(外部)
Akoolのサービス利用における個人情報の取り扱いに関する方針。データの収集、利用、開示、処理方法について記載されている。

Akool コミュニティコンテンツポリシー(外部)
AkoolコミュニティにおけるAI生成コンテンツの利用ガイドライン。禁止コンテンツや違反時の対応などが定められている。

【参考動画】

Introducing Akool Live Camera: Real-Time AI Video Creation (公式) – 公開日: 2025年5月28日

【参考記事】

Akool Live Camera can translate video calls in real time, swap faces and get virtual avatars to mimic human movements | VentureBeat

Introducing Akool Live Camera, a Breakthrough in Real-Time AI Video Generation | PR Newswire

Akool introduces Live Camera for real-time AI-driven video | SiliconANGLE

【編集部後記】

インターネットでもリアルでも、違う言語を使用する人と話すのは非常に難しいと思われます。まさに『言葉の壁』なんてものが生まれるくらいには……。近年では翻訳アプリなどが開発され、それらの進歩は目覚ましい活躍を遂げています。そしてそんな時代の中、ついに発表されたのが本ツール『Akool Live Camera』です。リアルタイムでの翻訳、AIを使用したリップシンク機能により受け取り手が視覚的にも理解しやすくなるような設計など、これらがうまく転じれば国を跨いだ交流がより行いやすくなると考えられます。よって新たな時代を築く可能性のある注目すべきツールであると筆者は感じております。

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む