innovaTopia

ーTech for Human Evolutionー

MIT CSAIL×Adobe Research、ハイブリッドAI動画生成モデル「CausVid」発表 – 4K動画を1.3秒で生成・リアルタイム編集も可能

 - innovaTopia - (イノベトピア)

Last Updated on 2025-05-07 12:10 by admin

2025年5月6日(現地時間、日本時間5月7日)、米マサチューセッツ工科大学(MIT)のコンピュータ科学・人工知能研究所(CSAIL)とAdobe Researchは、ハイブリッドAI動画生成モデル「CausVid(コーズビッド)」を共同で発表した。

CausVidは、拡散モデルと自己回帰モデルを組み合わせた新しいアーキテクチャを採用し、従来の動画生成AIと比べて最大100倍の高速化を実現している。具体的には、4K解像度・30秒間の動画を1.3秒の初期遅延で生成開始し、毎秒9.4フレームの速度で滑らかな動画をリアルタイムに出力できる。テキストによる指示から動画を生成したり、生成途中で内容を編集・追加することも可能である。

研究チームはTianwei Yin(MIT CSAIL)、Qiang Zhang(xAI/元CSAIL)、Adobe ResearchのRichard Zhang、Eli Shechtman、Xun Huang、MITのBill Freeman教授、Frédo Durand教授らで構成されている。CausVidは2025年6月に開催されるコンピュータビジョン分野の国際会議「CVPR 2025」で公式発表される予定であり、ゲーム開発、ロボット訓練、ストリーミング配信、教育・医療分野など幅広い応用が期待されている。

References:
・Hybrid AI model crafts smooth, high-quality videos in seconds | MIT News
・CausVid Project Page
・From Slow Bidirectional to Fast Causal Video Generators | arXiv
・Hybrid AI model crafts smooth, high-quality videos in seconds | ScienceSprings

【編集部解説】

CausVidの登場は、AIによる動画生成技術の進化において大きな転換点となります。従来のAI動画生成は、高品質な映像を作るには膨大な計算リソースと時間が必要であり、リアルタイム性や編集の柔軟性に課題がありました。しかし、CausVidは拡散モデルの高品質性と自己回帰モデルの高速性を組み合わせることで、4Kクラスの動画をわずか数秒で生成し、しかも途中で内容を追加・編集できるという新しいユーザー体験を実現しています。

この技術のブレイクスルーは、AI研究の最先端である知識蒸留(Knowledge Distillation)の応用にあります。高性能な「教師モデル」(拡散モデル)が「生徒モデル」(自己回帰モデル)に知識を効率的に伝えることで、品質を維持しつつ大幅な高速化を実現しました。これにより、例えばゲーム開発現場では、ノンプレイヤーキャラクター(NPC)の行動やイベント動画を動的に生成したり、eラーニングや医療シミュレーションの教材を個別最適化したりと、従来では考えられなかった応用が現実味を帯びてきます。

一方で、AIによる動画生成が一般化することで、フェイク動画や著作権侵害など新たなリスクも指摘されています。CausVidの研究チームは、生成動画に電子透かしを埋め込む技術や、編集履歴を追跡できるメタデータの付与など、悪用防止策にも取り組んでいます。Adobe Researchが開発に関わっている背景には、クリエイティブ業界におけるコンテンツの信頼性担保や、AI生成物の真正性を保証するという企業戦略も見て取れます。

日本市場においても、動画広告や自治体のプロモーション、教育・医療分野での応用が期待され、今後数年で大きなインパクトを与えることは間違いありません。AI動画生成の民主化が進むことで、個人や中小企業でも高品質な動画コンテンツを手軽に作成できる時代が到来します。今後の技術改良や社会的ルールの整備とともに、CausVidのような先端技術がどのように私たちの生活や産業を変えていくのか、引き続き注視していく必要があります。

【用語解説】

拡散モデル
ノイズを加えたデータから元の画像や動画を再構成するAI生成技術。高品質なコンテンツ生成が可能だが、計算コストと処理時間が大きい。

自己回帰モデル
直前までに生成したデータをもとに、次のデータを逐次予測するAIモデル。高速な処理やリアルタイム編集に強みがある。

知識蒸留(Knowledge Distillation)
高性能な「教師モデル」の知識を、より軽量な「生徒モデル」に効率よく伝えるAIの学習手法。精度を維持しつつ高速化や省メモリ化ができる。

電子透かし
デジタルコンテンツの真正性や出所を証明するために埋め込まれる目に見えない情報。AI生成動画の悪用防止や著作権管理に活用される。

【参考リンク】

MIT CSAIL(外部)
マサチューセッツ工科大学のAI・コンピュータサイエンス研究所。AIや画像処理など先端研究を行う。

Adobe Research(外部)
Adobe社の研究開発部門。画像・動画編集や生成AIなどクリエイティブ技術を開発。

CausVid公式プロジェクトページ(外部)
CausVidの技術概要、研究成果、生成サンプル動画や論文など公式情報を掲載。

CVPR 2025(外部)
コンピュータビジョン分野で世界最大規模の国際会議。最新AI研究が発表される。

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

投稿者アバター
りょうとく
主に生成AIやその権利問題について勉強中。
ホーム » AI(人工知能) » AI(人工知能)ニュース » MIT CSAIL×Adobe Research、ハイブリッドAI動画生成モデル「CausVid」発表 – 4K動画を1.3秒で生成・リアルタイム編集も可能