デジタルの闇と原始の光が交錯する未来世界から、彼女の声が聞こえてくる。ハンティングボウを手に取り、機械獣との戦いに身を投じてきた戦士が、今度は私たちとの対話に挑む。ソニーが発表したAI搭載アーロイの登場は、単なる技術革新を超え、人間と仮想キャラクターの関係性を根本から変える可能性を秘めている。
ソニーが『Horizon Forbidden West』の主人公アーロイをベースにしたAI搭載キャラクターのプロトタイプを公開した。このAIキャラクターは自然な会話が可能で、質問の意図を理解し、感情表現やジェスチャーを交えながら応答できる。ソニーは2025年3月上旬にブログ投稿でこのプロトタイプを発表し、アーロイキャラクターと彼女が恐れていることや機械についての考えなどのトピックについて人が話すデモを紹介した。
このプロトタイプはソニーの「大規模AIモデル」と「独自の音声合成およびアニメーション技術」を使用して構築されており、「AI搭載キャラクター」イニシアチブの一環である。ソニーはこのプロトタイプが「製品発表ではない」とし、「AI搭載キャラクターの可能性を引き続き探求している」と述べている。
ソニーは長い間AIに投資しており、2020年9月に環境問題に取り組むAI企業を支援するための10億円規模の「Sony Innovation Fund: Environment」を創設した。また2022年4月には「メタバースを進化させる」ためにEpic Gamesへ10億ドル(約1,000億円)の投資を行った。
AIキャラクターの開発に取り組んでいるのはソニーだけではない。OpenAIは仮想キャラクターを作成できるシステムを開発中と伝えられており、Metaはそのメタバース向けにAI搭載NPCに取り組んでいる。また2024年1月には、ユーザーがAIキャラクターを作成して会話できるCharacter.AIが、10億ドルの評価額で1億5,000万ドルの資金調達を行った。Character.AIは2024年初頭時点で月間数百万人のユーザーを抱えている。
from Sony is experimenting with AI-powered PlayStation characters
【編集部解説】
ソニーが開発中のAI搭載アーロイのプロトタイプについて、さらに詳しい情報が明らかになりました。The Vergeの報道によると、このプロジェクトはソニー・インタラクティブエンタテインメント(SIE)のPlayStation Studios Advanced Technology Groupが手がけており、ソフトウェアエンジニアリングディレクターのシャーウィン・ラゴバルダジャル氏が中心となって開発されているようです。
このプロトタイプは、単なるコンセプト実証ではなく、実際にゲーム内で機能するシステムとして開発されています。デモ映像では、アーロイがプレイヤーからの質問に応答するだけでなく、ゲームプレイの内容について説明する様子も示されていました。
技術的には、OpenAIのWhisperを音声認識(音声からテキストへの変換)に、GPT-4とLlama 3を会話と意思決定のために使用しています。さらに注目すべきは、ソニー独自の「Emotional Voice Synthesis(EVS)」システムを音声生成に、「Mockingbird」技術を顔のアニメーションに活用している点です。これらはソニーが長年培ってきた音声・映像技術の集大成と言えるでしょう。
興味深いのは、このデモがPC上で実行されていますが、ラゴバルダジャル氏によれば、WhisperとMockingbirdの一部機能はPS5コンソール上でも動作テストが行われているとのことです。これは将来的にPS5ゲーム内でこの技術が実装される可能性を示唆しています。
ただし、現時点でのデモの完成度については評価が分かれています。PCGamerの記事によれば、インタラクションはぎこちなく不自然で、明らかに機械が生成した音声であり、「自然な」会話とは言い難いとの指摘もあります。しかし、ラゴバルダジャル氏自身も「これは可能性のほんの一部を示したもの」であり、最終製品ではないと述べています。
この技術が持つ可能性は計り知れません。ゲーム内のNPCとリアルタイムで自然な会話ができるようになれば、ゲーム体験は根本から変わるでしょう。特に、ストーリー主導型のゲームでは、プレイヤーがキャラクターとより深い関係を築くことができ、没入感が飛躍的に高まる可能性があります。
また、この技術はゲーム以外の分野にも応用できるでしょう。教育分野では、学習者が歴史上の人物やフィクションのキャラクターと会話しながら学べるインタラクティブな教材の開発が考えられます。エンターテイメント分野では、映画やドラマのキャラクターとファンが交流できるプラットフォームも実現可能かもしれません。
ソニーがこの技術を実際の製品にどのように組み込んでいくのかはまだ不明ですが、現在開発中の『Horizon』マルチプレイヤーゲームへの導入が検討されているという噂もあります。
【編集部追記】
本技術が声優さんに与える影響も考察しました。
ソニーが公開したAI搭載キャラクター技術は、ゲーム業界における新たな可能性を示すだけでなく、声優や開発者の仕事にも大きな影響を与える可能性があります。
まず声優にとって、この技術は「脅威」と「チャンス」の両面性を持っています。従来、ゲームキャラクターの声は声優がスタジオで収録した音声を使用していましたが、AIによる音声合成技術が進歩することで、収録コストや時間が大幅に削減される可能性があります。これは特に小規模なプロジェクトやプロトタイプ開発ではメリットとなるでしょう。一方で、AIが人間の声をリアルに再現できるようになると、声優の仕事が減少するリスクも指摘されています。
しかし一方で、AI技術を活用することで、声優自身が自分の声を「クローン化」し、新たな収益源を得ることも可能になります。例えば、自分の声をAIモデルとしてライセンス提供することで、自分自身が直接参加しなくても収益を得られる仕組みが生まれつつあります。実際にElevenLabsなどのプラットフォームでは、声優に対してAI音声モデル利用料という形で収入を提供しています。
次にゲーム開発者にとっては、このAIキャラクター技術は制作プロセスを大きく変える可能性があります。従来NPC(ノンプレイヤーキャラクター)の会話は事前にプログラムされた内容を繰り返すだけでしたが、AIによってリアルタイムで自然な会話や感情表現が可能になるため、開発者はより没入感のあるストーリー展開やインタラクション設計に集中できます。
しかし、このような高度なAI技術には新たな課題も伴います。特に著作権や肖像権など法的・倫理的問題への対応や、AI生成コンテンツの品質管理、人間による監督・検証プロセスの必要性など、新たな規制やガイドライン整備も求められるでしょう。
【用語解説】
AI搭載キャラクター:人工知能技術を活用して、ゲームやアプリケーション内のキャラクターに自律的な会話能力や感情表現を持たせたもの。従来のプログラムされた応答とは異なり、ユーザーの質問や状況に応じて柔軟に対応できます。
アーロイ:『Horizon』シリーズの主人公。機械生命体が支配する未来の地球を舞台に、文明の謎を解き明かす若い女性ハンター。『Horizon Forbidden West』は2022年に発売されたシリーズ2作目です。
大規模AIモデル:膨大なデータで学習した人工知能モデルで、自然言語処理や画像認識などの複雑なタスクを実行できます。GPT-4やLlama 3などが該当します。
Mockingbird技術:ソニーが開発した顔のアニメーション技術。音声に合わせて自然な表情やジェスチャーを生成します。
EVS (Emotional Voice Synthesis):ソニーが開発した感情表現が可能な音声合成技術。2022年に論文が発表されており、様々な感情を混合した音声を生成できます。
【参考リンク】
Horizon Forbidden West 公式サイト(外部)『Horizon Forbidden West』の公式サイト。ゲームの世界観やキャラクター、ゲームプレイの特徴などを紹介しています。
ソニー・インタラクティブエンタテインメント(外部)PlayStation®ブランドを展開するソニーグループ企業。ゲームコンソールやソフトウェアの開発・販売を行っています。
Character.AI(外部)ユーザーがAIキャラクターを作成し会話できるプラットフォーム。2022年9月にベータ版が公開されました。
Sony Innovation Fund(外部)ソニーのコーポレートベンチャーキャピタル。環境技術に特化したファンドも運営しています。