innovaTopia

ーTech for Human Evolutionー

Lightricks、消費者向けGPUで動作する30倍高速なAIビデオ生成モデル「LTXV-13B」を発表

Lightricks、消費者向けGPUで動作する30倍高速なAIビデオ生成モデル「LTXV-13B」を発表 - innovaTopia - (イノベトピア)

Last Updated on 2025-05-07 09:24 by admin

Lightricksは2025年5月6日、130億パラメータのAIビデオ生成モデル「LTXV-13B」を発表した。このモデルは「マルチスケールレンダリング」と呼ばれる革新的な技術を採用しており、同等のモデルと比較して最大30倍高速にビデオを生成できる。

特筆すべき点は、このモデルが高価な企業向けGPUではなく、一般消費者向けのハードウェア(デスクトップPCやハイエンドノートPC)で動作することである。RTX 3090、4090、5090などの消費者向けGPUで、量子化や近似なしに完全なモデルを実行できる。

マルチスケールレンダリング技術は、ビデオを段階的に詳細化する方法で、最初に粗いグリッドでシーンや物体の動きの大まかな推定を行い、その後タイルに分割して徐々に詳細を追加していく。これにより、最終解像度ではなくタイルサイズによってVRAM使用量が決まるため、メモリ効率が大幅に向上する。

性能データによると、LightricksのLTXV-13Bモデルは同様のハードウェア上で競合モデルの1,491秒に対して37.5秒でビデオを生成でき、約40倍の速度向上を示している。

LTXV-13Bは、Lightricksの旗艦プラットフォーム「LTX Studio」に統合され、オープンソースとしてHugging FaceとGitHubで公開されている。また、GettyImagesやShutterstockとの戦略的パートナーシップにより、高品質なビデオ資産のライブラリにアクセスし、倫理的に訓練された商業的に安全な生成ツールを構築している。

Lightricksは年間収益が1,000万ドル未満の企業に対してLTXV-13Bを無料で提供している。

from:Lightricks just made AI video generation 30x faster — and you won’t need a $10,000 GPU

【編集部解説】

Lightricksの「LTXV-13B」は、AIビデオ生成の世界に革命をもたらす可能性を秘めています。これまでのAIビデオ生成は、RunwayやPika、Lumaなどの企業が提供するモデルが主流でしたが、これらは通常、80GB以上のVRAMを搭載した複数の企業向けGPUを必要とするクラウドベースのサービスでした。

LTXV-13Bの革新性は、「マルチスケールレンダリング」と呼ばれる技術にあります。アーティストが複雑なシーンに取り組む方法に似たこのアプローチは、まず大まかなスケッチから始めて細部を追加していくように、AIビデオを生成します。これにより、最終解像度ではなくタイルサイズによってVRAM使用量が決まるため、消費者向けGPUでも高品質なビデオを生成できるようになりました。

性能データによると、LightricksのLTXV-13Bモデルは同様のハードウェア上で競合モデルの1,491秒に対して37.5秒でビデオを生成でき、約40倍の速度向上を示しています。これは、AIビデオ生成の民主化と創造的可能性の拡大に大きく貢献するでしょう。

注目すべきは、このモデルがRTX 3090、4090、5090などの一般消費者向けGPUで動作することです。これまでAIビデオ生成は専門的な機材を持つ一部のクリエイターやスタジオに限られていましたが、LTXV-13Bによって、より多くの人々がAIビデオ制作に参入できるようになります。

また、LTXV-13Bは完全にオープンソース化されており、Hugging FaceとGitHubで公開されています。年間収益が1,000万ドル未満の企業は無料でライセンスを取得できるため、スタートアップや小規模クリエイターにとって大きな機会となるでしょう。

Lightricksは、GettyImagesやShutterstockとの戦略的パートナーシップを通じて、高品質なビデオ資産のライブラリにアクセスし、倫理的に訓練された商業的に安全な生成ツールを構築しています。これは、AIジェネレーティブモデルの著作権問題や倫理的懸念に対する重要な取り組みと言えます。

LTXV-13Bは、Lightricksの旗艦プラットフォーム「LTX Studio」に統合されており、カメラモーション制御、キーフレーム編集、マルチショットシーケンシングなどの高度な創造ツールをサポートしています。さらに、TeaCacheと呼ばれる新しいキャッシングメカニズムにより、推論時間が最大2倍高速化されています。

AIビデオ生成技術の競争は激化しており、OpenAI、Google、Adobeなどの大手企業が独自モデルで注目を集めています。しかし、Lightricksの強みは、高性能なモデルをオープンソースとして提供し、一般的なハードウェアで動作させる点にあります。

今後、AIビデオ生成はマーケティング、エンターテイメント、教育など様々な分野で活用されることが予想されます。LTXV-13Bのようなモデルの登場により、高品質なビデオコンテンツの制作コストが大幅に削減され、クリエイティブな表現の可能性が広がるでしょう。

一方で、AIによる高品質なビデオ生成の普及は、偽情報の拡散やディープフェイクなどの懸念も引き起こします。技術の進化とともに、AIで生成されたコンテンツの検出技術や倫理的ガイドラインの整備も重要になってくるでしょう。

【用語解説】

マルチスケールレンダリング:
ビデオを段階的に生成する技術で、まず粗い解像度で全体像を作り、その後細部を追加していく方法。絵画制作で言えば、最初に下書きをして全体構図を決め、その後細部を描き込んでいくようなプロセスに似ている。

VRAM (Video RAM):
グラフィックカードに搭載されているメモリで、画像やビデオ処理に使用される。消費者向けGPUは通常24〜32GBだが、企業向けは80GB以上ある。

レイテントスペース:
AIモデルが画像や動画を圧縮して処理する内部表現空間。データを効率的に扱うための抽象的な空間である。

DiT (Diffusion Transformer):
画像生成に使われる拡散モデルとトランスフォーマーを組み合わせた技術で、高品質な画像やビデオを生成できる。

【参考リンク】

Lightricks外部)
写真・動画編集アプリを提供するAI企業。Facetune、Videoleap、LTX Studioなど多数のクリエイティブツールを開発。

LTX Studio(外部)
AIを活用した動画制作プラットフォームで、テキストからプロ級の動画を簡単に作成できる。

Getty Images(外部)
世界的なビジュアルコンテンツ制作・マーケットプレイス企業。高品質な画像・映像素材を提供。

【参考動画】

【編集部後記】

AIビデオ生成技術は急速に進化しており、LTXV-13Bのような革新的なモデルの登場により、高品質なビデオコンテンツの作成がより身近になっています。これまで専門的な機材や知識が必要だったビデオ制作が、一般のクリエイターでも手の届く範囲になりつつあります。皆さんも消費者向けGPUでAIビデオ制作に挑戦してみませんか?あるいは、この技術がどのように皆さんの仕事や趣味に活かせるか、想像してみてください。AIと人間のクリエイティビティが融合した新しい表現の可能性が広がっています。

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

投稿者アバター
TaTsu
デジタルの窓口 代表 デジタルなことをまるっとワンストップで解決 #ウェブ解析士 Web制作から運用など何でも来い https://digital-madoguchi.com
ホーム » AI(人工知能) » AI(人工知能)ニュース » Lightricks、消費者向けGPUで動作する30倍高速なAIビデオ生成モデル「LTXV-13B」を発表