株式会社AIdeaLab(本社:東京都千代田区)は、2025年1月15日、日本初の日本語対応動画生成AI基盤モデル「AIdeaLab VideoJP」を商用利用可能で無償公開しました。
このモデルは、経済産業省とNEDOが2024年2月から開始した国内の生成AI開発力強化プロジェクト「GENIAC」の成果として開発されました。
主な特徴
- 最小14GBのVRAMで動作する効率的な設計
- 日本語と英語の両方に対応した自然な動画生成
- Rectified Flow Transformerアルゴリズムを採用
- Apache-2.0ライセンスで提供
from:日本初*の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」を商用利用可能で無償公開
【編集部解説】
技術的な意義
AIdeaLab VideoJPの登場は、日本の生成AI開発において重要な転換点となります。これまでの動画生成AIは主に英語圏で開発され、日本語での利用に制限がありましたが、このモデルは日本語と英語の両方に対応しています。
特筆すべきは、最小14GBのVRAMで動作する効率的な設計です。これにより、高価なGPUを必要とせず、より多くのクリエイターが利用できる環境を実現しています。
倫理的配慮とライセンス
このモデルの特徴的な点は、著作権に配慮した学習データの使用方針です。CC-BY-4.0やCC-0ライセンスの動画のみを使用することで、法的な問題を回避しています。これは、今後の生成AIモデル開発における一つの指針となる可能性があります。
GENIACプロジェクトの文脈での位置づけ
このリリースは、経済産業省とNEDOが推進するGENIACプロジェクトの成果の一つとして位置づけられます。日本のAI開発力強化という国家戦略の一環として見ることができ、特に「Society 5.0」の実現に向けた具体的な一歩と言えます。
現状の制限と課題
学習データが1200時間と限られていることは、現時点での大きな制約となっています。比較として、NVIDIAのCosmosは2000万時間の学習データを使用しており、この差は明確です。
また、日本固有のコンテンツに関する知識が限定的である点も課題です。これは、視覚言語モデルの不足や、学習データの偏りに起因しています。
将来への展望
このモデルの公開は、日本のAI開発における重要なマイルストーンとなります。特に、リスク回避を重視する日本の企業文化の中で、オープンソースでの公開という選択は注目に値します。
今後は、ComfyUIやWebUIなどの一般的なツールへの対応や、データセットの拡充が期待されます。また、このモデルを基盤として、より特化した用途向けのモデル開発も進むことが予想されます。
産業への影響
小規模なクリエイターやスタートアップにも新たな可能性が開かれます。特に、商用利用が可能なライセンスでの提供は、ビジネス展開における障壁を下げることになるでしょう。