Googleは、DeepMind AI部門の研究者によって開発された新しいAIビデオモデル「Veo」を発表した。Veoは、1080pの高品質クリップを60秒以上生成でき、写実主義から超現実主義、アニメーションまで様々な映画スタイルに対応可能である。GoogleはVeoを使って、ビデオ制作を誰もがアクセスできるツールとして提供することを目指している。このモデルは、テキストからビデオ、ビデオからビデオ、画像からビデオへの変換をサポートしている。
Googleは、アーティストであり「アトランタ」のクリエイターであるDonald Glover(Childish Gambino)と協力し、彼のクリエイティブスタジオGilgaを通じてVeoの新機能をテストした。DeepMindは、Veoが生成したビデオの例として、ネオンの都市、海中を泳ぐリアルなクラゲ、カウボーイが馬に乗るシーン、宇宙船が宇宙を旅するシーン、リアルな人間のシーンなどをYouTubeページとXアカウントに投稿した。
Veoは、テキストプロンプトから高品質の編集やユーザーがアップロードしたクリップ、さらには事前に録画された実写映像への編集を容易かつ迅速に行うことができる。また、Veoはビデオフレーム間の一貫性を実現し、Soraでも見られた奇妙で不気味な変換やアーティファクトを避けることができる。これは「最先端の潜在拡散トランスフォーマー」に依存しており、これらの不一致の出現を減らし、実生活でのようにキャラクター、オブジェクト、スタイルをその場に保つ。
Googleは、Veoが生成したすべてのビデオにSynthIDというコンテンツ認証の追跡ウォーターマークを埋め込んでおり、AIによって生成されたものとして識別できるようにしている。Veoは、Generative Query Network (GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet、Lumiereなど、DeepMindでの数年間の研究と以前の進歩に基づいている。しかし、GoogleはVeoを一般公開する予定はなく、選ばれたクリエイターによるプライベートプレビューでのみ利用可能で、将来的にはYouTube Shortsなどの他の製品にも一部の機能を提供する予定である。
【編集者追記】用語解説
- Google DeepMind:Googleの子会社で、人工知能(AI)の研究を行う組織。深層学習や強化学習などの先進的なAI技術の開発で知られる。
- Donald Glover(ドナルド・グローバー):米国の俳優、コメディアン、ラッパー、作家、監督。ラップではChildish Gambino(チャイルディッシュ・ガンビーノ)の名で活動。代表作に「アトランタ」「スター・ウォーズ/ハン・ソロ」など。
- 電子透かし:デジタルコンテンツに目に見えない情報を埋め込む技術。著作権保護や改ざん検知などに使われる。画像の場合、人間の目には分からないが機械的に検出できるパターンをピクセルに埋め込む。
- Vertex AI:GoogleのAIプラットフォーム。機械学習モデルの開発、学習、デプロイを一貫して行える。Imagenなどの画像生成AIを利用可能。
- Imagen:Googleが開発したテキストから画像を生成するAIシステム。自然な高品質の画像を生成できる。
【参考リンク】
Google DeepMindオフィシャルサイト(外部)
【関連記事】
Veo関連の記事をinnovaTopiaでもっと読む
Google、性能4.7倍のAIチップ「Trillium」発表!エネルギー効率も大幅向上
GoogleのAIスマートグラスが未来のコミュニケーションを変革!
GoogleとHPの「Project Starline」が商品化へ、ヘッドセット不要の没入型ビデオ会議
Google、新型Gemini 1.5 Flash発表:高速タスク処理を実現
【ニュース解説】
Googleが、その有名なDeepMind AI部門の研究者によって開発された新しいAIビデオモデル「Veo」を発表しました。この技術は、1080pの高品質クリップを60秒以上生成する能力を持ち、写実主義から超現実主義、アニメーションまで、幅広い映画スタイルをカバーできるとされています。Googleの目標は、Veoを使用して、ビデオ制作を誰もが手軽に行えるツールとして提供することです。これにより、経験豊富な映画製作者、意欲的なクリエイター、知識を共有したい教育者など、さまざまなユーザーが新たなストーリーテリングや教育の可能性を探求できるようになります。
Veoは、テキストからビデオ、ビデオからビデオ、画像からビデオへの変換をサポートしており、これによりユーザーは簡単に自分のアイデアをビジュアルコンテンツに変換することができます。Googleは、アーティストであり「アトランタ」のクリエイターであるDonald Glover(Childish Gambino)と協力し、彼のクリエイティブスタジオGilgaを通じてVeoの新機能をテストしました。これは、Veoが実際に多様なクリエイティブなビジョンを実現できることを示す一例です。
Veoの特徴の一つは、高品質の編集やユーザーがアップロードしたクリップ、さらには事前に録画された実写映像への編集を容易かつ迅速に行う能力です。また、ビデオフレーム間の一貫性を実現し、奇妙で不気味な変換やアーティファクトを避けることができる点も注目されます。これは「最先端の潜在拡散トランスフォーマー」に依存しており、キャラクター、オブジェクト、スタイルを実生活でのようにその場に保つことができます。
Googleは、Veoが生成したすべてのビデオにSynthIDというコンテンツ認証の追跡ウォーターマークを埋め込んでおり、これによりAIによって生成されたコンテンツとして識別できるようにしています。これは、AIが生成したコンテンツの使用に関する透明性と信頼性を高めるための重要なステップです。
しかし、GoogleはVeoを一般公開する予定はなく、選ばれたクリエイターによるプライベートプレビューでのみ利用可能です。将来的には、YouTube Shortsなどの他の製品にもVeoの一部の機能を提供する予定です。
この技術のポジティブな側面としては、ビデオ制作の民主化が挙げられます。Veoにより、専門的なスキルや高価な機材がなくても、誰でも高品質のビデオコンテンツを作成できるようになります。これは、教育、エンターテイメント、マーケティングなど、多岐にわたる分野でのコンテンツ制作に革命をもたらす可能性があります。
一方で、AIによるビデオ生成技術は、著作権侵害や偽情報の拡散といったリスクもはらんでいます。生成されたコンテンツが実際の人物や出来事を模倣することで、誤解を招く情報が広まる可能性があります。このため、技術の使用にあたっては、倫理的なガイドラインや規制の整備が重要となります。
長期的には、Veoのような技術がさらに発展し、よりリアルで複雑なビデオコンテンツの生成が可能になることで、映画産業や広告業界などでの利用が拡大することが予想されます。また、教育やトレーニングの分野でも、リアルなシミュレーションやビジュアル教材の作成に活用されることで、学習体験の向上に寄与する可能性があります。
from Google takes on OpenAI’s Sora with stunning new generative AI video model Veo.