15秒で途切れていた映像が、ついに30秒。一本まるごと、継ぎ目なしで生まれる時代がやってきます。中国・バイトダンスが披露した新しい動画生成AIは、ただ「長く作れる」だけの話ではありません。その先に見据えているのは、現実そのものをAIが理解する「世界モデル」という大きな目標です。私たちが映像と向き合う前提が、静かに、しかし確実に書き換わろうとしています。
2026年6月23日に開催された火山引擎(Volcano Engine)の「Force大会」で、動画生成モデル「豆包(Doubao)Seedance 2.5」が初公開された。正式公開は7月を予定している。火山引擎社長のタン・ダイ氏によれば、Seedance 2.5は、30秒の1ショットをネイティブで直接生成する機能、最大50点の全モーダル素材を組み合わせて生成する機能、画面の一貫性を保った部分編集の3つの能力向上を実現した。
タン・ダイ氏は、動画生成は世界モデルへ至る道筋の一つであり、実体経済での応用可能性を持つと述べた。Seedance はすでに身体性を持つAI、工業製造、自動運転の分野で実用化され、データ合成、シーンのシミュレーション、工程のデモンストレーションといった業務に新たなツールとしての能力を提供している。
From:
豆包视频生成模型Seedance 2.5 预计将于7月上线
【編集部解説】
中国のAI動画生成が、ついに「30秒・一発撮り」の領域へ踏み込みました。バイトダンス傘下の火山引擎(Volcano Engine)が6月23日のFORCE大会で披露したSeedance 2.5は、地味に見えて、実はこの分野の「実用化の壁」を一段押し上げる発表だと私は受け止めています。
まず、最大の注目点である「30秒」の意味を整理しておきます。動画生成モデルの生成尺はモデルやサービスによって幅がありますが、品質を安定させやすい1ショットの尺は十数秒前後にとどまるものが少なくないとされてきました。短い尺では「フック(つかみ)」しか作れず、起承転結のある映像を作るには複数のクリップを継ぎ接ぎする必要がありました。Seedance 2.5は、1回の生成で30秒を一気通貫で出力します。継ぎ目がないため、登場人物の顔が途中で変わったり、画面の雰囲気が急に飛んだりしにくい。これは「おもちゃ」から「制作ツール」への移行を示す数字だと私は見ています。
次に「50点の全モーダル素材」です。前世代のSeedance 2.0が一度に参照できた素材は、公式論文では合計15点程度と説明されていました。それが50点へと大きく拡大したと報じられています。画像・動画・音声をまとめて投入し、AIに一貫した世界観を保たせる。広告で複数の出演者の顔を揃える、シリーズもののドラマで世界観を統一する、ブランドの視覚要素を崩さない、といった「プロの現場の必須要件」に応える設計です。
ここで一歩引いて、なぜ私が今このニュースを取り上げるのかをお話しします。元記事はわずか3段落の短報でしたが、その背景には大きな文脈があります。同じFORCE大会では、言語モデルの豆包(Doubao)2.1 Proも発表され、複数の評価でアンスロピックのClaude Opus 4.6を上回ったと火山引擎側は説明しています。ただし、これはあくまで同社による発表時点での主張であり、第三者による独立した検証はこれからという段階です。それでも、動画・画像・音声・言語のすべてで「フロンティアに並ぶ」と主張し始めたこと——ここに今回の本質があります。
タン・ダイ氏が語った「動画生成は世界モデルへの道筋の一つ」という言葉は、軽く読み飛ばせない一節です。世界モデルとは、物理法則や因果関係を内部に持ち、現実世界をシミュレートできるAIを指します。動画を「作る」技術は、世界を「理解する」技術と地続きだ、という考え方です。だからこそSeedanceは、エンターテインメント用途にとどまらず、エンボディドAI(身体性を持つロボット等)の学習データ合成、工業製造の工程シミュレーション、自動運転のシーン生成といった、実体経済の現場ですでに使われ始めていると報じられています。
できるようになることは具体的です。15秒では作れなかった完結した広告を1本そのまま生成する。顔が崩れない短編ドラマを作る。ロボットや自動運転車に学習させる仮想シーンを、撮影コストをかけずに大量生成する。映像制作の常識が、撮るものから生成するものへと静かに置き換わっていく入り口に、私たちは立っているのではないでしょうか。
一方で、見落とせない懸念もあります。30秒の高精細な動画を「一発」で作れるということは、本物と見分けがつかない偽情報やディープフェイクを、より低いコストで作れる状況に近づくことも意味します。火山引擎が今回あわせてAI著作権の商業化プラットフォームを予告し、生成物の権利処理や来歴管理の枠組みづくりに動いている点は、その裏返しとも読めます。技術の加速と、それを制御する仕組みづくりが、ようやく同時に語られ始めたわけです。
規制への影響も、日本の私たちにとって他人事ではありません。EUでは、AI法(AI Act)第50条に基づくAI生成コンテンツの透明性に関する実務規範が2026年6月に公表され、機械可読なマーキングやディープフェイクの表示を求める義務が8月から適用される予定です。生成のしやすさが上がるほど、出所を明示する責任は重くなる。Seedance 2.5の登場は、制作者の創造性を解放すると同時に、「これはAIが作ったものだ」と誠実に示す文化を、私たち自身が育てる必要性を突きつけています。
最後に長期的な視点を。注目すべきは、これがアメリカの研究所の成果ではなく、中国のAI企業から出てきたという事実です。生成AIの競争が、もはや言語モデルだけの話ではなく、映像という「人間の知覚に最も近い領域」へ広がり、しかもその主役が一極ではなくなっている。未来は一つの国や企業が独占して描くものではない——その現実を、Seedance 2.5は静かに告げているように思います。
【用語解説】
世界モデル(World Model)
物理法則や因果関係、空間構造などを内部に保持し、現実世界の挙動をシミュレートできるAIの考え方を指す。動画を「生成する」技術は、世界を「理解する」技術と地続きだとされ、生成AIの次の到達点の一つと位置づけられている。
全モーダル素材(マルチモーダル参照)
画像・動画・音声・テキストといった異なる種類のデータを、まとめて一度の生成の参照材料として投入する仕組みを指す。複数の素材から構図・動き・人物の一貫性などを同時に制御できる。
1ショット(単段)生成・直出
複数のクリップを継ぎ接ぎするのではなく、1回の生成処理で連続した1本の映像を出力すること。継ぎ目がないため、人物の見た目や画面の雰囲気が途中で破綻しにくい。
部分編集(局部編集)
映像全体を作り直すことなく、画面の一部分だけを修正する機能。わずかな不具合の手直しのために全体を再生成する必要がなくなる。
エンボディドAI(身体性を持つAI/具身智能)
ロボットなど物理的な身体を通じて、現実環境を認識し行動するAIを指す。学習には大量の現実シーンが必要とされ、動画生成によるデータ合成が有力な供給手段になりつつある。
データ合成・シーンのシミュレーション
AIの学習に使うデータや状況を、実地の撮影・収集ではなく生成技術で人工的に作り出すこと。自動運転や工業製造の分野で、コストと時間を抑える手段として注目されている。
【参考リンク】
火山引擎(Volcano Engine)公式サイト(外部)
バイトダンスが運営するクラウド・AIサービスのプラットフォーム。豆包大模型やSeedanceなどのモデルをAPIとして企業向けに提供している。
Seedance(豆包視频生成模型)公式紹介ページ/ByteDance Seed(外部)
ByteDanceのSeedチームによる動画生成モデルの公式紹介。マルチモーダル入力やマルチショット生成など、技術的特徴が解説されている。
即梦(Dreamina/Jimeng)公式サイト(外部)
ByteDanceが提供する、ノーコードで画像・動画を生成できる制作プラットフォーム。Seedance系モデルを実際に試せる入口の一つとなっている。
2026 火山引擎FORCE原動力大会 公式ページ(外部)
Seedance 2.5や豆包2.1 Proが発表されたカンファレンスの公式案内ページ。登壇者や展示内容などが掲載されている。
【参考記事】
字节Seedance 2.5预计七月初正式上线(毎日経済新聞/每经网)(外部)
FORCE大会でのSeedance 2.5公表を報じる一次的短報。30秒単段生成、50点参照、原生4K、AI著作権プラットフォーム予告などを伝える。
Seedance 2.0 公式技術ページ(ByteDance Seed)(外部)
前世代Seedance 2.0の公式説明。テキスト・画像・音声・動画の全モーダル入力に対応するなど、技術的な土台を一次情報で確認できる。
Seedance 2.0: Advancing Video Generation for World Complexity(arXiv論文)(外部)
Seedance 2.0の技術論文。参照素材の上限や世界の複雑さを扱う設計思想など、「世界モデル」志向を裏づける一次資料となる。
豆包大模型2.1发布跨越生产级质变点(光明網)(外部)
豆包大模型の日間Token呼び出し量180兆突破、中国MaaS市場シェア49.5%首位、豆包2.1 ProのClaude超え主張などの数値を伝える。
Code of Practice on Transparency of AI-Generated Content(欧州委員会)(外部)
EU AI法第50条に基づくAI生成コンテンツの透明性に関する実務規範。機械可読マーキングやラベル表示の義務化方針を示す一次情報。
ByteDance Surprise Launches Seedance 2.5(BigGo Finance/英語)(外部)
当初2.1予定を直前に2.5へ切り替えたとの関係者証言や、CEO梁汝波氏の発言、3D白模機能を伝える英語報道。
Seedance 2.5: 30-Second 4K AI Video from ByteDance (2026)(explainx.ai)(外部)
原生4K・30秒・50点参照を整理しつつ、独立検証は未実施と明記。Sora・Kling等競合との位置関係を示す創作者視点の解説。
【関連記事】
Seedance 2.0 Mini登場、ByteDanceが約半額で開くAI動画の量産時代
今回のSeedance 2.5の直前(6月15日)に公開された軽量版モデルの記事。価格戦略と「量産」志向を知ると2.5の位置づけがより立体的に見える。
ByteDance「Seedance 2.0」が映像業界に衝撃―60秒で2K動画を自動生成する技術
前世代Seedance 2.0の登場を伝えた記事。マルチショットや音声同期など、2.5が受け継ぐ技術的な土台を押さえられる。
Seedance 2.0著作権騒動―Disney・MPAが差し止め通告、ByteDanceはセーフガード強化を表明
解説で触れた著作権・ディープフェイク問題の具体的な経緯。2.5のAI著作権プラットフォーム予告の背景として読みたい。
【編集部後記】
「30秒を一発で」と聞いて、ワクワクしましたか。それとも、本物と見分けがつかない映像が増えることに、少し不安を覚えたでしょうか。私自身、その両方を行ったり来たりしています。映像はもう「撮るもの」だけではなくなりつつあります。
もしご自身の仕事や趣味でこの技術を使えるとしたら、何を作ってみたいですか。逆に、これだけは人の手で残したい、と感じるものはありますか。よかったら、その感覚をしばらく心に留めながら、これからの動きを一緒に追いかけてもらえたら嬉しいです。












