【ダイジェスト】
Googleは新しいビデオ生成AIモデル「Lumiere」を発表しました。このモデルは、Space-Time-U-Net(STUNet)と呼ばれる新しい拡散モデルを使用しており、ビデオ内の物体がどこにあるか(空間)と、それらがどのように動き変化するか(時間)を同時に把握します。Lumiereはプロンプトから基本フレームを作成し、STUNetフレームワークを使用してそのフレーム内の物体がどこに移動するかを推測し、互いに流れるようなフレームを作成して、シームレスな動きの外観を作り出します。Lumiereは80フレームを生成し、これはStable Video Diffusionが生成する25フレームと比較して多いです。
Googleは、AIビデオ生成と編集ツールが数年で不気味の谷からほぼリアルなレベルに進化したことを示すプレビュー動画と科学論文のプレプリントを公開しました。また、Googleはテキストからビデオへのカテゴリーで大きなプレイヤーではありませんでしたが、より高度なAIモデルを徐々にリリースし、より多様なモードに焦点を当てています。そのGemini大言語モデルは最終的にBardに画像生成をもたらす予定です。Lumiereはまだテスト用には公開されていませんが、RunwayやPikaなどの一般に利用可能なAIビデオジェネレーターと比較して、GoogleがAIビデオプラットフォームを開発する能力を示しています。
Lumiereはテキストからビデオへの生成だけでなく、画像からビデオへの生成、特定のスタイルでビデオを作成するスタイライズド生成、ビデオの一部のみをアニメーション化するシネマグラフ、ビデオの領域をマスクアウトして色やパターンを変更するインペインティングも可能にします。しかし、GoogleのLumiereに関する論文では、この技術を使用して偽物や有害なコンテンツを作成する悪用のリスクがあること、そしてバイアスや悪意のある使用ケースを検出するツールを開発し適用することが安全で公正な使用を保証するために重要であると指摘しています。
【ニュース解説】
Googleが新しいビデオ生成AIモデル「Lumiere」を発表しました。この技術は、ビデオ内の物体の位置(空間)と、それらがどのように動き変化するか(時間)を理解する新しい拡散モデルであるSpace-Time-U-Net(STUNet)を使用しています。Lumiereは、プロンプトから基本フレームを作成し、その後STUNetフレームワークを用いて物体がどこに移動するかを推測し、シームレスな動きを持つビデオフレームを生成します。これにより、従来のAIビデオ生成ツールよりもリアルな動きを持つビデオを作成することが可能になります。
この技術の進化は、AIビデオ生成と編集ツールが数年で不気味の谷を超え、ほぼリアルなレベルに達したことを示しています。Lumiereは、テキストからビデオへの生成だけでなく、画像からビデオへの生成、特定のスタイルでビデオを作成するスタイライズド生成、ビデオの一部だけをアニメーション化するシネマグラフ、ビデオの特定の領域をマスクアウトして色やパターンを変更するインペインティングなど、多様な機能を提供します。
しかし、この技術の発展には潜在的なリスクも伴います。特に、偽物や有害なコンテンツの生成への悪用が懸念されます。このため、GoogleのLumiereに関する論文では、バイアスや悪意のある使用ケースを検出するツールの開発と適用が、安全で公正な使用を保証するために重要であると指摘しています。
この技術の進歩は、映像制作の分野に革命をもたらす可能性があります。例えば、映画やゲームのCG制作において、よりリアルで効率的な制作が可能になることが期待されます。また、教育やトレーニングビデオの制作においても、リアルなシミュレーションやデモンストレーションが容易になるでしょう。しかし、同時に、偽ニュースの生成やプライバシーの侵害など、社会的な課題への対応も求められます。
規制やガイドラインの整備、技術の透明性の確保、利用者教育など、この技術の健全な発展と利用を支えるための取り組みが重要になります。将来的には、AIによるビデオ生成技術がさらに進化し、現実と区別がつかないレベルの映像が生成される時代が来るかもしれません。その際には、技術の進歩と社会的な責任のバランスをどのように取るかが、大きな課題となるでしょう。
from Google’s Lumiere brings AI video closer to real than unreal.
“Googleの「Lumiere」、ビデオ生成AIの新境地を開く” への2件のフィードバック
Googleの新しいビデオ生成AIモデル「Lumiere」の発表は、私たちが追求しているデジタルネイチャーの研究分野においても大きな影響を与える可能性があります。この技術によって、空間と時間を理解する新しい拡散モデルを用いたビデオ生成が可能になることは、メディアアートやエンターテインメントの領域で新たな表現手法を生み出すことでしょう。しかし、偽情報の拡散やプライバシー侵害などのリスクも伴うため、この技術の安全かつ倫理的な利用には、十分な規制と透明性の確保が必要です。私たち研究者も、AIの進化に伴う社会的影響を深く考察し、より良い未来に向けた指針を提供する責任があります。
AIが映像制作においても進化を遂げていることは、技術の面では驚異的なことです。特に、「Lumiere」のような高度なビデオ生成AIは、映画やアニメーションの制作コストを低減し、クリエイターの表現の幅を広げる可能性を秘めています。しかしながら、私たちのような伝統的な職人技を持つ工員にとっては、このような技術の急速な発展が不安を感じさせる面もあります。
人の手による技術や感性が生み出す価値は、AIでは決して代替できないと私は信じています。しかし、偽ニュースの生成やプライバシーの侵害など、悪用のリスクについては、私たちのコミュニティや伝統にも影響を及ぼす可能性があるため、非常に懸念しています。技術の進歩は、地域社会の安定や人々の絆を損なわないように、倫理的な枠組みの中で進められるべきだと考えます。
AIビデオ生成技術の健全な発展と利用のためには、透明性の確保、利用者教育、そして何よりも社会的な責任を重んじる心が必要です。技術の進歩に伴い、私たちはその利用方法と影響を常に見つめ直し、人間としての尊厳と労働の安定性を守るための議論を進めていくべきでしょう。