Last Updated on 2025-06-19 09:11 by admin
AI画像生成サービスMidjourneyが2025年6月18日、初のAI動画生成モデル「V1」をリリースした。
同社の約2000万人のユーザーは、ウェブサイトおよびDiscord経由で静止画像を5秒間のクリップにアニメーション化でき、4秒ずつ最大4回延長して合計21秒まで拡張可能である。
動画生成機能は月額10ドルから始まる既存のサブスクリプションプランに含まれる。各動画ジョブは画像生成タスクの約8倍のコストがかかるが、秒あたりのコストは静止画像1枚の生成とほぼ同等となる。
発表の約1週間前の2025年6月11日、DisneyとUniversalがMidjourneyを米国カリフォルニア州中央地区連邦地方裁判所で著作権侵害で提訴した。100ページを超える申立書は、同社がマーベル、スター・ウォーズ、ザ・シンプソンズ、シュレックなどの著作権保護キャラクターでモデルを訓練したと非難している。
同社は将来的に静的画像生成、アニメーション、3D空間ナビゲーション、リアルタイムレンダリングを統合したワールドモデルの構築を目標としている。
【編集部解説】
Midjourneyの動画生成機能リリースは、単なる新機能追加以上の意味を持ちます。これまで高額な専門ソフトウェアや技術的知識が必要だった動画制作が、月額10ドルという手頃な価格で誰でもアクセス可能になったのです。
この価格設定の革新性を理解するには、競合他社との比較が重要です。GoogleのVeo 3は月額249.99ドル、OpenAIのSoraでも月額20ドルからという中で、Midjourneyの戦略は明確に「大衆化」を狙っています。
アクセス方法の戦略的選択
現在のV1モデルは、ウェブサイトとDiscordの両方でアクセス可能となっています。これはMidjourneyの従来の画像モデルと同様のアプローチで、既存ユーザーの利便性を重視した設計です。
動画の最大長は21秒(初期5秒+4秒×4回延長)となっており、短時間ながらも実用的な長さを実現しています。この制約は技術的な未熟さというより、戦略的な選択と考えるべきでしょう。
法的リスクが業界全体に与える深刻な影響
Disney・Universal両社による2025年6月11日の訴訟提起は、AI業界全体の転換点となる可能性があります。この訴訟は、AI企業のビジネスモデル自体を根本から変える可能性を秘めています。
訴状では、Midjourneyが著作権保護されたキャラクターの学習データ使用に対する適切な対価を支払っていないと主張されています。現在の「学習データの無償利用」が法的に認められなくなれば、AI開発コストは大幅に上昇し、サービス価格にも影響が及ぶでしょう。
市場競争の激化が消費者にもたらすもの
AI動画生成市場は急成長を続けており、この背景にはソーシャルメディアでの動画コンテンツ需要の爆発的増加があります。Midjourneyの参入により、競合他社も価格競争を余儀なくされる可能性が高く、結果として消費者にとってはより手頃で高機能なツールが利用できるようになるでしょう。
RunwayのGen-4、GoogleのVeo 3、OpenAIのSoraなど、各社が独自の特徴を持つサービスを展開しており、選択肢の多様化が進んでいます。
創作活動の未来を左右する技術革新
「ワールドモデル」という概念は、単なる動画生成を超えた革命的な技術です。CEO David Holzが掲げる「リアルタイム・オープンワールド・シミュレーション」の実現により、ユーザーが「夕日のモロッコの市場を歩く」と入力するだけで、探索可能な3D環境がリアルタイムで生成される未来が見えてきます。
この技術が実現すれば、個人クリエイターでもハリウッド級の映像体験を制作できるようになり、コンテンツ制作の民主化が一層進むことになります。
企業利用における慎重な判断が必要
企業がMidjourneyを商用利用する際は、現在進行中の著作権侵害訴訟のリスクを慎重に評価する必要があります。生成されたコンテンツに著作権侵害のリスクが伴う可能性があるためです。
一方で、OpenAIのSoraやAdobe Firefly Videoのように補償機能を内蔵したサービスを選択することで、このリスクを軽減できる選択肢も存在します。
長期的視点で見る技術の意義
Midjourneyの動画機能リリースは、AI技術の発展における重要なマイルストーンです[1]。現在の制約や法的課題は一時的なものであり、技術の本質的な価値は「創造性の解放」にあります。
今後数年間で、この技術がどのように進化し、社会にどのような変化をもたらすかを注視していく必要があるでしょう。特に、著作権法とAI技術の関係性がどう整理されるかは、デジタル創作の未来を決定する重要な要素となります。
サービス名 | 企業名 | 価格(月額) | 動画長さ | 音声生成 | 解像度 | 主な特徴 |
---|---|---|---|---|---|---|
Midjourney V1 | Midjourney | $10〜 | 最大21秒 | なし | 480p | 画像から動画生成、低価格戦略 |
Sora | OpenAI | $20〜 | 最大20秒 | あり | 1080p | テキストから動画生成、補償機能 |
Runway Gen-4 | Runway | $12〜 | 最大450秒 | あり | 4K対応 | 高品質動画、AIカメラ制御 |
Luma Dream Machine | Luma Labs | $9.99〜 | 最大120秒 | あり | 1080p | 音声付き動画、再スタイル化 |
Pika Labs | Pika Labs | $10〜 | 最大210秒 | あり | 1080p | 独自エフェクト、柔軟な編集 |
Google Veo 3 | $249.99 | 最大8分 | あり | 4K | 企業向け高品質、Google統合 | |
Adobe Firefly Video | Adobe | $9.99〜 | 最大60秒 | あり | 4K | Adobe統合、プロ向け機能 |
【用語解説】
AI動画生成モデル
テキストプロンプトや静止画像から動画を自動生成するAI技術。深層学習により物理法則や動きのパターンを学習し、リアルな映像を作成する。
ワールドモデル
AIが現実世界の物理法則や空間構造を理解し、ユーザーが探索可能な3D環境をリアルタイムで生成・シミュレーションする技術概念。
プロンプト
AI生成ツールに対してテキストで与える指示文。「夕日のモロッコの市場を歩く」のような自然言語で、生成したい内容を具体的に記述する。
GPU分数
AI動画生成における計算リソースの使用量を表す単位。高性能なGPU(グラフィック処理装置)の使用時間に基づいて課金される従量制システム。
著作権侵害訴訟
他者の著作権で保護された作品を無断で使用・複製した場合に起こる法的紛争。AI学習データの使用についても新たな争点となっている。
マルチモーダル合成
テキスト、画像、動画、音声など複数の異なるメディア形式を統合して処理・生成するAI技術。
【参考リンク】
Midjourney(外部)
AI画像・動画生成サービスを提供する独立研究ラボ。約2000万人のユーザーを持つ。
OpenAI(Sora)(外部)
ChatGPTで知られるAI企業。動画生成AI「Sora」を月額20ドルから提供。
Runway(外部)
AI動画生成ツール「Gen-4」を提供。映画制作レベルの高品質動画生成が可能。
Luma Labs(外部)
「Dream Machine」という動画生成AIを開発。音声付き動画生成に対応。
Pika Labs(外部)
テキストや画像から動画を生成するAIツール。独自の「ピカエフェクト」機能が特徴。
【参考動画】
【参考記事】
Midjourney launches its first AI video generation model, V1(外部)
TechCrunchによるMidjourney V1の発表記事。技術詳細と将来ビジョンを解説。
Disney and Universal’s Lawsuit Against Midjourney, Explained(外部)
Disney・Universal両社による著作権侵害訴訟の詳細解説記事。業界への影響を分析。
Introducing Runway Gen-4(外部)
Runway社の最新AI動画生成モデル「Gen-4」の公式発表記事。技術詳細を説明。
【編集部後記】
Midjourneyの動画生成機能リリースと法的課題を見ていると、AI技術の進歩と社会制度のギャップを強く感じます。月額10ドルで誰でも動画制作ができる時代が到来する一方で、著作権という根本的な問題が未解決のまま残されています。
皆さんは、この技術革新をどう受け止めていらっしゃいますか?創作活動の民主化として歓迎すべきなのか、それとも既存のクリエイターの権利を脅かす存在として警戒すべきなのか。また、企業での活用を検討される際、法的リスクとイノベーションのバランスをどう取られているでしょうか。
私たちinnovaTopia編集部も、この技術が持つ可能性と課題について、読者の皆さんと一緒に考えていきたいと思っています。ぜひ、皆さんのご意見や体験をお聞かせください。