Last Updated on 2025-05-19 18:55 by 乗杉 海
Metaは「Project Warhol(プロジェクト・ウォーホル)」と呼ばれる新しいプロジェクトを通じて、参加者に時給50ドル(約7,500円)を支払い、Codec Avatars(コーデックアバター)と呼ばれる次世代バーチャルアバターのトレーニングデータを収集している。この取り組みは2025年5月に明らかになり、Business Insiderが5月14日(現地時間、日本時間5月15日)に最初に報じた。
Project Warholは、ペンシルバニア州ピッツバーグにあるMetaの研究施設で実施されており、データ収集・ラベリング企業のAppenがMetaの代理として参加者の募集を行っている。このプロジェクトは「Human Motion(人間の動き)」と「Group Conversations(グループ会話)」の2つの研究に分かれており、9月から開始される予定だ。
Human Motionの研究では、参加者は顔の表情の模倣、文章の朗読、手のジェスチャーなどを行い、カメラやセンサー、ヘッドセットによってあらゆる角度から動きが記録される。一方、Group Conversationsの研究では、2〜3人の参加者が会話や即興活動に参加し、研究者は自然な発話、ジェスチャー、微表情を捉えることを目指している。
Metaによると、Codec Avatarsは2019年に公表された研究イニシアチブで、バーチャルおよび拡張現実で使用するための写実的なリアルタイムデジタル複製を構築することを目的としている。この技術は「metric telepresence(メトリックテレプレゼンス)」というMetaのビジョンの重要な要素であり、バーチャルな交流において「現実と区別がつかない」社会的存在感を可能にするものだ。
この取り組みは、Meta Reality Labsにとって重要な時期に行われている。同部門は2020年以来600億ドル(約9兆円)以上の損失を累積しており、2024年第4四半期には過去最高となる49.7億ドル(約7,455億円)の営業損失を記録した。Metaの最高技術責任者(CTO)であるアンドリュー・ボスワースは、2025年がメタバースの成功または失敗を決定する「最も重要な年」になると内部メモで述べている。
Metaは数年間にわたって同様のアバターデータ収集研究を実施してきたと述べており、Project Warholはその最新の取り組みであるとみられる。Codec Avatarsの参照がQuest向けHorizon OSのコード内で2024年初めから発見されており、Metaは次世代VRヘッドセットでのCodec Avatars実装に近づいているとされる。このヘッドセットは2026年9月頃に発売される可能性がある。
References:Meta ‘Project Warhol’ Pays Participants $50/Hour To Train Codec Avatars
【編集部解説】
Metaが進める「Project Warhol」は、次世代のバーチャルリアリティ体験を実現するための重要な一歩と言えます。時給50ドルという比較的高額な報酬で参加者を募り、人間の表情や動きを詳細に記録するこの取り組みは、単なるデータ収集以上の意味を持っています。
Codec Avatarsは2019年に発表された技術ですが、その開発はピッツバーグの研究施設で約10年にわたって続けられてきました。この技術の最終目標は「社会的存在感(ソーシャルプレゼンス)」の実現です。これは、物理的に離れた場所にいる人との交流でも、まるで同じ空間にいるかのような感覚を生み出すことを意味します。現在のビデオ通話やVRアバターでは、この感覚を十分に再現できていません。
特に注目すべきは、Metaがこの技術を段階的に進化させている点です。当初は100台以上のカメラを使用した特殊な撮影装置が必要でしたが、2022年には65種類の表情を3分以上かけてスマートフォンで撮影する方式に進化。さらに2025年初頭には、わずか4枚のセルフィー写真から数分でアバターを生成できるようになりました。処理時間は数時間から数分へと大幅に短縮されています。
しかし、技術的な課題はまだ残っています。現在のシステムはNVIDIAのRTX 3090グラフィックカードでも8FPSでしか動作せず、実用的なリアルタイム処理には至っていません。また、2023年のLex Fridmanポッドキャストでマーク・ザッカーバーグが披露したデモでは、1つのアバターに4台のRTX 4090 GPUが必要だったという報告もあります。
Metaにとって2025年は極めて重要な年です。Reality Labs部門は2020年以来600億ドル以上の損失を抱え、2024年第4四半期には過去最高となる49.7億ドルの営業損失を記録しました。CTOのアンドリュー・ボスワースは、2025年がメタバースの成功か失敗かを決める「最も重要な年」になると内部メモで述べています。失敗すれば「伝説的な誤った冒険」として記憶されるリスクもあるのです。
Codec Avatarsの実用化に向けた道筋も見えてきています。2024年9月にMetaの当時のVR/MR担当VPであるMark Rabkinは、「次世代ヘッドセットでの実現が可能になるはず」と述べています。また、Quest OSのコードからはCodec Avatarsへの参照が2024年初頭から発見されており、実装に向けた準備が進んでいることが伺えます。
一方で、このような技術には常にプライバシーの懸念がつきまといます。Metaは2024年9月にRay-Ban Smart Glassesを発売しましたが、これらのデバイスで撮影された画像はMetaのクラウドでAI処理され、同社の製品改善やAIトレーニングに使用されることが明らかになっています。Project Warholで収集されるデータについても、同様の懸念が生じる可能性があります。
Metaの描く未来像は、物理的な会議とバーチャルな参加者が混在するハイブリッド会議です。ザッカーバーグは「将来的には、拡張現実技術を通じて、実際にその場にいる人々と、このような写実的なアバターで参加する人々が混在する会議が可能になる」と述べています。これは、遠隔コミュニケーションの在り方を根本から変える可能性を秘めています。
今後の展開としては、2025年9月17日に開催予定のMeta Connect 2025でCodec Avatarsの進捗が発表される可能性があります。また、VRヘッドセット向けの完全版の前に、WhatsAppやMessengerのビデオ通話で使える簡易版が先行して登場する可能性も指摘されています。ただし、本格的なVR版のCodec Avatarsの実現には顔のトラッキング機能を備えたヘッドセットが必要であり、次世代Meta VRヘッドセットは2026年の発売が見込まれています。
Project Warholは、テクノロジーの進化と人間らしさの融合という大きなテーマを体現しています。完璧な「不気味の谷」の克服と、本当の意味での「存在感」の実現は、単なる技術的な進歩を超えた、人間のコミュニケーションの本質に関わる挑戦と言えるでしょう。
【用語解説】
Codec Avatars(コーデックアバター):Metaが2019年に発表した研究イニシアチブ。写実的なリアルタイムデジタル人物複製を構築することを目的とした技術。高度な3Dキャプチャ技術とAIシステムを使用して、リアルな表情や動きを再現できるバーチャルアバターを作成する。
Project Warhol(プロジェクト・ウォーホル):Metaが進めるCodec Avatarsのトレーニングデータ収集プロジェクト。参加者に時給50ドルを支払い、表情や動きのデータを収集する。名称はピッツバーグ出身の芸術家アンディ・ウォーホルに由来していると考えられる。
メトリックテレプレゼンス(Metric Telepresence):Metaが目指す技術ビジョン。物理的に離れた場所にいても、「現実と区別がつかない」社会的存在感を実現することを目指している。
社会的存在感(ソーシャルプレゼンス):バーチャル環境において、他者と同じ空間にいるかのような感覚を生み出す技術概念。リアルなアバターを通じて、遠隔地にいる人との自然なコミュニケーションを可能にする。
Human Motion(人間の動き):Project Warholの研究の一つ。参加者の顔の表情、朗読、手のジェスチャー、視線追跡、全身の動作などをカメラやセンサーで記録する。
Group Conversations(グループ会話):Project Warholのもう一つの研究。2〜3人の参加者による会話や即興活動を通じて、自然な発話、ジェスチャー、微表情を捉える。
不気味の谷(Uncanny Valley):人間に似せたロボットやCGが、ある程度リアルになると逆に不気味さを感じる現象。完全にリアルなアバターを作るには、この「谷」を超える必要がある。
Avat3r(アバター):2025年3月にMetaが発表した新技術。わずか4枚のセルフィー写真から数分で写実的なアバターヘッドを生成できる。大規模再構成モデル(LRM)と呼ばれる技術を活用している。
大規模再構成モデル(LRM: Large Reconstruction Model):自然言語処理における大規模言語モデル(LLM)に相当する、3D視覚タスク向けのトランスフォーマーアーキテクチャを活用したモデル。Avat3rシステムで使用されている。
Instant Codec Avatars(インスタントコーデックアバター):スマートフォンでわずか1分間の顔スキャンから生成できる簡易版のCodec Avatars。2024年3月時点ですでにスタンドアロンVRヘッドセットで動作可能とされている。
【参考リンク】
Meta(メタ)(外部):
Facebookから社名変更したテクノロジー企業。VR/AR、メタバース、AIなどの次世代技術開発に注力している。Quest VRヘッドセットやRay-Banスマートグラスなどのデバイスを提供している。
Reality Labs(リアリティラボ)(外部):
Metaのバーチャルリアリティ(VR)と拡張現実(AR)を専門とする研究開発部門。以前はOculus VRとして知られていた。Quest VRヘッドセットなどのハードウェアとソフトウェアを開発している。
Appen(アッペン)(外部):
オーストラリアに本社を置く、AIトレーニングデータの収集・ラベリングを専門とする企業。Metaの代理としてProject Warholの参加者募集を行っている。25年以上の歴史を持ち、世界中に100万人以上の協力者を持つ。