AI動画生成の新時代へ。Lightricks LTX-2、わずか5秒でHDビデオを生成するオープンソースモデル

[更新]2025年10月25日20:59

AI動画生成の新時代へ。Lightricks LTX-2、わずか5秒でHDビデオを生成するオープンソースモデル - innovaTopia - (イノベトピア)

※実際にLTXをつかって動画にしたものを編集部後記に貼っています。

 - innovaTopia - (イノベトピア)
LTX2で実際に動画にしてみた

Lightricks社は2025年10月23日、オープンソースAI動画生成基盤モデルLTX-2をリリースした。

LTX-2は6秒の高解像度動画を5秒で生成でき、音声と映像を同時に合成する機能を備える。最大4K解像度、48フレーム/秒での出力が可能で、コンシューマーグレードのGPUで動作する。

同社CEOのZeev Farbman氏は、同期された音声と映像、4Kの忠実度、柔軟なワークフロー、高効率性を組み合わせた最も完全なクリエイティブAIエンジンだと述べた。

LTX-2はLTX StudioおよびAPI経由で現在利用可能で、オープンソース版は11月にリリース予定である。料金は1秒あたり0.04ドルからで、競合モデルより最大50%安価だと同社は主張している。

同モデルはGettyとShutterstockのライセンスデータで訓練されている。

From: 文献リンクOpen-source AI video from Lightricks offers 4K, sound, and faster rendering

【編集部解説】

LTX-2の核となっているのは「拡散モデル」という技術です。これは、ノイズだらけの状態から少しずつ鮮明な映像を復元していく手法ですが、これまでは膨大な計算時間が必要でした。LTX-2の真の革新性は、このプロセスを劇的に高速化し、一般家庭にあるようなコンピューター(コンシューマーグレードGPU)でも、再生時間より速く動画を生成できる点にあります。これは、技術が研究段階を終え、実用的な「道具」として成熟したことを明確に示しています。

これがクリエイターにとってどれほど大きな意味を持つか、想像してみてください。アイデアが浮かんだら、数秒でプレビューを確認し、修正を加え、また数秒で結果を見る。この高速なイテレーション(繰り返し改善)は、創造性の流れを止めることがありません。さらに、映像と完全に同期した音声(セリフや効果音、BGM)まで同時に生成できるため、これまで別々のツールで行っていた煩雑な作業から解放されるのです。

特に注目すべきは、LTX-2が「オープンソース」として公開される点です。これにより、世界中の開発者やクリエイターが、この強力な基盤モデルを自由に改良し、特定のスタイルに特化させたり(LoRAがこれにあたります)、独自のアプリケーションに組み込んだりすることが可能になります。これは、プロ品質の映像制作の「民主化」であり、個人のクリエイターや小規模なスタジオが、ハリウッドに匹敵するような映像表現に挑戦できる道を開くものと言えるでしょう。

もちろん、光があれば影も存在します。高品質なビデオを誰でも簡単に生成できる技術は、悪意を持って使用されれば、偽情報の拡散やディープフェイクといった問題に繋がりかねません。Lightricks社は、学習データにGettyやShutterstockといった信頼性の高い素材を使用することで、著作権や倫理的な問題に対応する姿勢を見せています。しかし、オープンソース化されたモデルがどのように使われるかは、私たちユーザー側のリテラシーにもかかっているという点は、心に留めておくべき重要な課題です。

長期的に見れば、LTX-2のような技術は、動画制作の概念そのものを根底から変えてしまうかもしれません。テキストで指示するだけで、頭の中にあるイメージが次々と映像になる。そんな未来がすぐそこまで来ています。これはエンターテイメントや広告業界だけでなく、教育、ニュース報道、そして私たちの日常的なコミュニケーションのあり方にも、大きな影響を与えていくことでしょう。LTX-2は、その未来への扉を開ける、重要な一歩と言えるのではないでしょうか。

【用語解説】

拡散モデル (Diffusion Model)
AIが画像を生成する手法の一つ。ノイズだらけの画像から段階的にノイズを取り除いていくことで、目的の画像を生成する。高品質な画像を生成できるが、計算に時間がかかる傾向があった。

オープンソース (Open Source)
ソフトウェアの設計図にあたるソースコードを無償で公開し、誰でも利用、改変、再配布ができるようにしたソフトウェアや開発手法のことである。

GPU (Graphics Processing Unit)
コンピューターグラフィックスの描画を専門に担当する半導体チップ。その高い並列処理能力から、近年ではAIの計算にも広く活用されている。

API (Application Programming Interface)
ソフトウェアやプログラム、ウェブサービスなどの一部の機能を外部の他のプログラムから利用するための手順やデータ形式などを定めた規約のことである。

ベーパーウェア (Vaporware)
開発の発表はされたものの、実際には完成・発売される見込みのないソフトウェアやハードウェア製品を揶揄する言葉である。

LoRA (Low-Rank Adaptation)
AIモデルを効率的に追加学習させる手法の一つ。比較的少ない計算量で、特定の画風やキャラクターなどをモデルに学習させることができるため、カスタマイズに用いられる。

【参考リンク】

Lightricks(外部)
LTX-2を開発した企業。AIを活用したクリエイター向けの写真・動画編集アプリで知られる。

LTX Studio(外部)
Lightricks社が提供するAI動画制作プラットフォーム。LTX-2の機能を活用できる。

GitHub(外部)
世界最大級のソフトウェア開発プラットフォーム。LTX-2のオープンソース版が公開予定。

【参考記事】

Lightricks Releases LTX-2: The First Complete Open-Source AI Video Foundation Model(外部)
Lightricks社の公式発表。完全なオープンソースAIビデオ基盤モデルである点を強調している。

Lightricks hits the accelerator, generating video clips in just 5 seconds(外部)
LTX-2の生成速度に焦点。5秒でクリップを生成する高速性と価格競争力について分析している。

【編集部後記】

さわってみて驚いたのはその生成スピードです。

こちらの写真をLTX-2で動画にしてみます。

 - innovaTopia - (イノベトピア)
ImageFXで生成した動画
 - innovaTopia - (イノベトピア)
The woman in the image smiles and waves while saying “Konnichiwa.”

The woman in the image smiles and waves while saying “Konnichiwa.”

にっこり笑って「こんにちは」って言って。

5秒ほど待つと動画が。

セリフも同時に生成してくれるのですが、少し発音が外国風、そしてオーダーしていない外国語が(聞いてみてくださいね)

LTX-2のような技術が、私たちの創造性をどこまで解き放ってくれるのか、想像するだけでワクワクしますね。もしあなたがこのAIを自由に使えるとしたら、どんな映像を創り出してみたいですか?

頭の中に眠っている物語や、言葉では伝えきれなかった風景など、ぜひ聞かせてください。この技術の進化が、あなた自身の「表現」とどう結びついていくのか、一緒に考えていけたら嬉しいです。

投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。

読み込み中…
advertisements
読み込み中…