アリババ通義万相「Wan2.2-Animate」オープンソース化|1枚の画像から動画生成する最強AIモデル

アリババ通義万相「Wan2.2-Animate」オープンソース化|1枚の画像から動画生成する最強AIモデル - innovaTopia - (イノベトピア)

アリババの通義万相が2025年9月19日、新しい動作生成AI「Wan2.2-Animate」をオープンソース化した。このモデルは1枚の画像から人物、アニメキャラクター、動物を動画で動かすことができ、ショート動画制作、ダンステンプレート生成、アニメ制作に応用される。

Wan2.2-Animateは従来のAnimate Anyoneモデルを全面改良し、キャラクター模倣とキャラクター演技の2つのモードを搭載している。キャラクター模倣では1枚の画像と参考動画から動作や表情を移植し、キャラクター演技では元動画の環境を保持しながらキャラクターを置換する。

通義万相チームは会話、表情、身体動作を含む大規模人物動画データセットを構築し、骨格信号と暗黙的特徴を活用した動作リターゲティングモジュールで精密な複製を実現した。

実測結果では、StableAnimator、LivePortraitなどのオープンソースモデルを動画生成品質、主体一致性、知覚損失で上回り、人間による主観評価ではRunway Act-twoなどのクローズドソースモデルも超越した。

GitHub、HuggingFace、魔搭コミュニティでダウンロード可能で、アリババクラウド百炼プラットフォームでのAPI利用も対応している。

From: 文献リンク上传一张图、主演任何视频,”性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源

【編集部解説】

アリババ通義万相が発表したWan2.2-Animateは、生成AI分野における重要な技術的マイルストーンとして注目されています。このモデルが「性能最強」と謳われる背景には、従来のオープンソースモデルを大幅に上回る技術革新があります。

最も注目すべきは、キャラクター模倣演技の2つのモードを単一モデルで実現した点です。従来の画像アニメーション技術では、動作の転移か背景の保持かのどちらかに特化することが一般的でした。Wan2.2-Animateは統一された表現フォーマットを採用し、両方の機能を同時に提供することで、制作現場での柔軟性を大幅に向上させています。

技術面では、骨格信号暗黙的特徴を組み合わせた動作リターゲティングが核心技術となっています。身体の動きには構造的な骨格情報を、顔の表情には微細な特徴量を使い分けることで、自然で精密な動作再現を実現しました。さらに、照明融合LoRAの導入により、キャラクター置換時の照明整合性も保たれます。

このモデルがもたらす影響範囲は多岐にわたります。ショート動画制作では、個人クリエイターでも映画レベルの表現が可能になり、コンテンツ制作の民主化が加速するでしょう。アニメ業界では、原画作業の自動化により制作コストの大幅削減が期待されます。教育分野でも、歴史上の人物を動かした教材制作など、新たな活用法が生まれています。

一方で、潜在的なリスクも無視できません。肖像権侵害やディープフェイク技術の悪用懸念は深刻な課題です。特に、本人の許可なく有名人や一般人の画像を動画化する行為は、法的・倫理的な問題を引き起こす可能性があります。

オープンソース化により技術の透明性は確保されましたが、同時に悪意ある利用への門戸も開かれました。今後は技術の発展と並行して、適切な利用ガイドラインや検知技術の確立が急務となるでしょう。

【用語解説】

動作生成モデル
静止画像に動きを付与して動画を生成するAI技術。人物の表情や身体の動きを自然に再現し、一枚の写真から生き生きとした映像を作り出すことができる。

動作リターゲティング
ある対象の動作パターンを別の対象に移植する技術。例えば、ダンサーの動きを3Dキャラクターや別の人物に適用することで、元の動作を保持したまま異なる主体で表現することが可能になる。

骨格信号
人体の骨格構造を数値化した情報。関節の位置や角度を座標データとして表現し、身体の動きを正確に捉えるための基礎データとして活用される。

暗黙的特徴
明示的に定義されていない潜在的な特徴量。顔の表情などの微細な変化を数値化する際に使用され、自然な表現を実現するための重要な要素となる。

LoRA
Low-Rank Adaptationの略。大規模AIモデルを効率的に微調整するための技術手法。少ないパラメータで特定タスクに適応させることができる。

【参考リンク】

GitHub – Wan2.2-Animate(外部)
Wan2.2-Animateモデルの公式オープンソースリポジトリ。モデルのコード、使用方法、技術詳細が公開されている。

Hugging Face – Wan2.2-Animate-14B(外部)
機械学習モデル共有プラットフォームでのWan2.2-Animate配布ページ。モデルのダウンロードと技術仕様の確認が可能である。

ModelScope – Wan2.2-Animate(外部)
アリババが運営するAIモデル共有コミュニティ。中国語での詳細説明と実行環境が提供されている。

通義万相公式サイト(外部)
アリババの画像生成AI「通義万相」の公式サービスページ。各種生成AIツールを体験できるプラットフォームである。

【参考記事】

Unified Character Animation and Replacement with Wan2.2-Animate(外部)
Wan2.2-Animateの技術論文。統一型キャラクターアニメーションと置換技術の詳細な技術仕様と性能評価結果が記載されている。

Tongyi Wanxiang’s New Action Generation Model Wan2.2-Animate(外部)
AIBASEによるWan2.2-Animate発表の速報記事。モデルの主要機能と他社製品との比較分析が含まれている。

【編集部後記】

皆さんは普段、SNSで見かける魅力的な動画コンテンツを見て「自分もこんな映像を作ってみたい」と思ったことはありませんか。Wan2.2-Animateの登場により、もしかすると私たちの日常の写真や動画制作が大きく変わるかもしれません。一枚の家族写真を動画にしたり、ペットの可愛い瞬間を別のシチュエーションで表現したり、想像もしなかった創作の可能性が目の前に広がっています。

ただ、この技術の進歩と同時に、私たちは責任ある使い方についても考える必要がありそうです。皆さんなら、この革新的な技術をどのような場面で活用してみたいですか。また、どのような点に注意を払うべきだと思いますか。ぜひ一緒に、この新しい時代の可能性と課題について考えてみませんか。

投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

読み込み中…
advertisements
読み込み中…