Last Updated on 2025-05-21 20:14 by admin
Googleは2025年5月20日に開催された年次開発者会議「Google I/O 2025」において、AI動画作成ツール「Flow」を発表した。このツールは映画製作に特化しており、GoogleのAIモデル「Veo」「Imagen」「Gemini」の3つを組み合わせて動作する。
Flowは8秒間のAI生成クリップを作成でき、テキストプロンプトや画像素材からの生成が可能である。また「シーンビルダー」機能を使って複数のクリップを繋ぎ合わせることができる。その他の機能として、カメラコントロール(カメラアングルや動きの調整)、アセット管理ツール、そして「Flow TV」(他のユーザーの作品とそのプロンプトを閲覧できるキュレーションサービス)が提供される。
同時に発表された「Veo 3」は、Googleの最新の動画生成AIモデルで、ネイティブ音声生成をサポートしている。環境音や会話を含む音声を動画と一緒に生成でき、リップシンク(口の動きと音声の同期)も改良されている。また、より長いプロンプトの理解や一連の出来事を正確に処理する能力も向上している。
既存の「Veo 2」モデルには、参照画像を使った一貫性のある動画生成、カメラコントロール、アウトペインティング(アスペクト比の変更)、オブジェクトの追加・削除などの新機能が追加された。
さらに、画像生成モデル「Imagen 4」も発表された。最大2K解像度の画像生成が可能で、テクスチャの詳細表現(布地、水滴、動物の毛皮など)、構図、特にタイポグラフィ(テキスト表示)が改善されている。Googleによれば、Imagen 4は前モデルのImagen 3より最大10倍高速になる予定である。
Flowは米国でGoogle AI ProおよびGoogle AI Ultraプランの加入者向けに提供開始された。Google AI Proでは月100回の生成が可能で、Google AI Ultraではより高い使用制限とVeo 3の早期アクセスが提供される。Google AI Ultraの月額料金は249.99ドル(約37,500円)である。
また、Google DeepMindは映画製作者と協力し、Flowが彼らのワークフローにどのように適合するかを理解するための取り組みを行っている。Dave Clark、Henry Daubrez、Junie Lauなど、すでに映画製作でAIツールを使用している人々とパートナーシップを結んでいる。
References:
Google has a new tool just for making AI videos
【編集部解説】
GoogleがI/O 2025で発表した「Flow」は、単なるAI動画生成ツールではなく、映像制作のワークフローを根本から変えうる革新的なプラットフォームです。検索結果を総合すると、Flowはテキストプロンプトから映像を生成するだけでなく、既存の素材を活用し、カメラワークを調整し、シーンを拡張するといった、従来の映像編集ソフトウェアの機能をAIと融合させた点が画期的だと言えます。
特に注目すべきは、Veo 3による音声生成機能の統合です。これまでのAI動画生成ツールは「サイレント映画」のように映像のみを生成するものが主流でしたが、Veo 3は環境音やキャラクターのセリフを含む音声を生成し、さらにリップシンク(口の動きと音声の同期)まで実現しています。これは動画生成AIにとって大きな進化と言えるでしょう。
Flowの登場は、OpenAIが2024年2月に発表したテキストから動画生成AI「Sora」への対抗とも見られています。しかし、SoraがAIによる動画生成に特化しているのに対し、Flowは映像制作のワークフロー全体をサポートする包括的なプラットフォームとして差別化を図っている点が興味深いです。
価格設定については、月額249.99ドル(約37,500円)というGoogle AI Ultraプランが必要な点が、一般ユーザーへの普及の障壁となる可能性があります。ただし、より機能を限定したGoogle AI Proプラン(月額19.99ドル、約3,000円)でも基本機能は利用できるため、プロフェッショナルからアマチュアまで幅広いユーザー層をカバーする戦略と言えるでしょう。
Flowが映像制作にもたらす影響としては、まず制作コストと時間の大幅な削減が挙げられます。従来、コンセプト映像やストーリーボードの作成には多くの時間と人手が必要でしたが、Flowを使えば数分でアイデアを視覚化できます。これにより、特に予算の限られた独立系映画製作者やスタートアップ企業にとって、創造性を形にするハードルが大きく下がるでしょう。
また、Google DeepMindは映画製作者と協力し、Flowが彼らのワークフローにどのように適合するかを理解するための取り組みを行っています。Dave Clark、Henry Daubrez、Junie Lauなど、すでに映画製作でAIツールを使用している人々とパートナーシップを結んでいることからも、プロフェッショナルな映像制作現場でのAI活用を積極的に推進していることがわかります。
一方で、AIによる映像生成技術の進化は、映像制作業界の雇用構造にも影響を与える可能性があります。特に、コンセプトアーティストやストーリーボードアーティストなど、初期段階の視覚化を担当する職種は、AIによる代替が進む可能性があるでしょう。
また、AIによって生成された映像の著作権や、既存の映像作品から「学習」したAIモデルの法的位置づけなど、解決すべき課題も残されています。特に、Flowが生成した映像に含まれる要素が既存の作品に類似している場合、著作権侵害の問題が生じる可能性があります。
技術的な観点からは、Imagen 4が最大2K解像度の画像生成をサポートし、テクスチャや細部の表現が向上している点も注目に値します。これにより、AIによる映像生成の品質がプロフェッショナルな制作現場の要求水準に近づきつつあると言えるでしょう。
日本のクリエイティブ産業への影響としては、アニメーション制作やゲーム開発など、視覚的なストーリーテリングを重視する分野での活用が期待されます。特に人手不足が深刻な日本のアニメ業界では、中間工程の効率化や、企画段階での視覚化ツールとしての活用が考えられるでしょう。
長期的には、Flowのようなツールが普及することで、映像制作の民主化が進み、より多様な視点やストーリーが世に出る可能性があります。一方で、AIによる映像生成技術の進化は、「本物」と「偽物」の境界を曖昧にし、ディープフェイクなどの悪用リスクも高めることになるでしょう。
私たちinnovaTopiaは、このような技術の進化を単に賞賛するだけでなく、その社会的影響や倫理的課題についても継続的に注視していきたいと考えています。テクノロジーの進化は人間の創造性を拡張するものであるべきであり、それを実現するための議論や取り組みが今後ますます重要になるでしょう。
【用語解説】
AI動画生成モデル:
テキストや画像などの入力から、人工知能が自動的に動画を生成する技術。Flowで使用されているVeo 3は、GoogleのAI動画生成モデルの最新版である。
プロンプト:
AIに対する指示や命令のこと。「夕暮れの海岸を歩く犬」のような文章を入力すると、AIがその内容に合った映像を生成する。
リップシンク:
口の動きと音声を同期させる技術。Veo 3では、キャラクターが話す際の口の動きと発話内容が自然に一致するよう改良されている。
アウトペインティング:
既存の画像や映像の外側を拡張する技術。例えば、縦長の映像を横長に変換する際に、足りない部分をAIが自然に補完する。
フロー状態:
心理学用語で、人が活動に完全に没頭し、集中している状態を指す。「ゾーン」とも呼ばれる。Flowという名前は、このような創造的な没入状態からインスピレーションを得ている。
【参考リンク】
Google DeepMind(外部)
GoogleのAI研究部門。Veo、Imagen、Geminiなどの先端AIモデルを開発している。
Google AI(外部)
GoogleのAIサービスのポータルサイト。Google AI ProやGoogle AI Ultraのサブスクリプションプランの詳細が確認できる。
Vertex AI(外部)
GoogleのクラウドAI開発プラットフォーム。企業向けにVeoやImagenなどのAIモデルを提供している。
【参考動画】
【編集部後記】
AIによる映像制作の可能性が広がる今、皆さんならFlowをどのように活用してみたいですか?短編映画の制作、アイデアの視覚化、あるいは全く新しい表現方法の模索など、思いつくアイデアは無限にあります。もし手元にこのツールがあったら、まず何を作りたいと思いますか?また、AIが映像制作の民主化をもたらす一方で、クリエイターの役割はどう変化していくと思いますか?ぜひコメント欄で皆さんの考えをシェアしてください。テクノロジーとクリエイティビティの新たな関係性について、一緒に考えていきましょう。