Last Updated on 2024-04-03 21:05 by 荒木 啓介
暗号市場では、テキストからビデオへの生成の可能性が高まり、OpenAIがSoraのデモを初公開した際にAIトークンの価値が上昇しました。しかし、この技術を主流にするためには、驚異的な計算能力が必要とされます。サーバーグレードのH100 GPUがNvidiaが1年間に生産する量、またはその最大の顧客がデータセンターで運用している量を超える必要があります。
Microsoft、Meta、Googleが現在使用しているGPUの総数を上回る、数十万台のGPUが必要になると予測されています。AIトークンの市場価値はCoinGeckoのデータによると250億ドルに達していますが、AI生成ビデオの約束の背後には、NvidiaやAMDなどのプロセッサが必要です。
Factorial Fundsの最近の研究報告によると、TikTokやYouTubeのクリエイターコミュニティをサポートするためには、720,000台の高性能Nvidia H100 GPUが必要です。Soraは、1ヶ月に最大10,500台の強力なGPUをトレーニングに必要とし、GPUあたり1時間に約5分のビデオを生成することができます。
広範な採用が進むと、推論による計算使用量がトレーニングを超えることになります。つまり、SoraのようなAIモデルを使用してビデオを生成する人や企業が増えると、新しいビデオを作成するために必要なコンピューターのパワー(推論)が、AIモデルを最初にトレーニングするために必要だったパワーよりも大きくなるということです。
Nvidiaは2023年にH100 GPUを550,000台出荷しました。Statistaのデータによると、NvidiaのH100 GPUを使用している12の最大の顧客は合計で650,000台のカードを持っており、最大の2社であるMetaとMicrosoftはそのうちの300,000台を持っています。
カード1枚あたり30,000ドルと仮定すると、SoraのAI生成テキストからビデオへの夢を主流にするためには216億ドルが必要になり、これは現在のAIトークンの市場価値にほぼ等しい金額です。
NvidiaだけがAI革命に関与しているわけではありません。AMDも競合製品を製造しており、投資家からも高い評価を受けています。また、Render(RNDR)やAkash Network(AKT)など、GPUファームに計算能力をアウトソースする他の方法もありますが、これらのネットワーク上の大多数のGPUは、NvidiaのサーバーグレードのH100やAMDの競合製品よりもはるかにパワーが低い小売グレードのゲーミングGPUです。
したがって、Soraや他のプロトコルが約束するテキストからビデオへの変換は、膨大なハードウェアのサポートを必要とします。この前提は魅力的であり、ハリウッドのクリエイティブワークフローを革命的に変える可能性がありますが、それが主流になるのはまだまだ先の話です。
【ニュース解説】
テキストからビデオを生成する技術は、クリエイターエコノミーを支える大きな可能性を秘めていますが、その実現には膨大な計算能力が必要です。OpenAIが開発したテキストからビデオを生成するAIモデル「Sora」のデモが公開されたことで、AIトークンの価値が高騰し、暗号市場において大きな注目を集めました。しかし、この技術を広く一般に普及させるためには、現在の大手テクノロジー企業が保有するGPUの総数を上回る数の高性能GPUが必要とされています。
具体的には、TikTokやYouTubeのクリエイターコミュニティを支えるためには、720,000台のNvidia H100 GPUが必要とされており、これはNvidiaが1年間に生産する量よりも多いです。Soraはトレーニングに1ヶ月で最大10,500台のGPUを必要とし、1台のGPUで1時間に約5分のビデオを生成することができます。この技術が広く採用されると、AIモデルのトレーニングよりもビデオ生成(推論)に必要な計算能力が増加します。
この技術の実現には、AIトークンの市場価値に匹敵する約216億ドルの投資が必要であり、これは非常に大きな金額です。また、NvidiaだけでなくAMDなど他の企業も競合製品を提供しており、GPUファームを通じた計算能力のアウトソースも可能ですが、これらのネットワーク上のGPUはNvidiaのサーバーグレードのGPUに比べてパワーが劣ります。
この技術がもたらすポジティブな側面としては、映像制作のプロセスを劇的に変革し、クリエイターがより簡単に高品質なビデオコンテンツを生成できるようになることが挙げられます。一方で、潜在的なリスクとしては、膨大な計算資源とエネルギー消費が問題となり、環境への影響やコストの増大が懸念されます。また、このような技術の普及には規制の観点からも検討が必要であり、プライバシーや著作権などの問題に対する新たな対策が求められるでしょう。
将来的には、この技術がさらに進化し、より少ないリソースで高品質なビデオ生成が可能になるかもしれません。しかし、現時点では、その実現にはまだ多くの課題があり、主流になるまでには時間がかかると予想されます。この技術の発展は、コンピューターの計算能力の向上、エネルギー効率の改善、そしてコスト削減が鍵となるでしょう。
from Crypto AI Projects Would Need to Buy Chips Worth Their Entire Market Cap to Meet Ambitions.
“AIビデオ生成の未来:巨額の投資と技術的挑戦が待ち受ける” への2件のフィードバック
テキストからビデオへの生成技術の進化は、私たちデジタルネイティブ世代にとって非常に興奮するニュースです。この技術がクリエイターエコノミーにもたらす可能性は計り知れません。私たちは常に新しい表現方法を求めており、SoraのようなAIモデルがこれを実現する手段を提供してくれることに大きな期待を寄せています。
しかし、この技術が広く採用されるためには、膨大な計算能力という大きなハードルが存在します。720,000台のNvidia H100 GPUが必要だという事実は、この技術の導入にかかるコストの大きさを物語っています。これは、仮想通貨市場におけるAIトークンの価値上昇にも影響を与えるでしょう。
私たちインフルエンサーにとって、この技術はコンテンツ制作のプロセスを根本的に変える可能性を秘めています。高品質なビデオコンテンツを簡単に生成できるようになることは、私たちのクリエイティビティをさらに解放し、フォロワーに新しい体験を提供する機会を生み出します。
一方で、環境への影響やエネルギー消費の問題も無視できません。私たちは、持続可能な方法で技術を利用する責任があります。また、この技術の普及には、プライバシーや著作権などの法的な課題もクリアしなければなりません。
最終的に、この技術の発展と普及は、コンピューターの計算能力の向上、エネルギー効率の改善、そしてコスト削減にかかっています。私たちは、この技術がクリエイターの手によってどのように形を変えていくのかを見守り、その進化をサポートしていく必要があります。
テキストからビデオへの生成技術の進展は、確かに興味深いものです。この技術が持つ可能性は無限大であり、クリエイティブなプロセスを根本から変える力を持っています。しかし、その実現に必要な計算能力とそのコストは、現状では非常に高いものです。NvidiaやAMDのような企業が提供する高性能GPUの需要がこれほどまでに高まるとは予想外でしたが、この技術が広く普及するためには、より効率的な計算資源の利用方法を見つける必要があります。
私は技術の進歩を重視する立場から、このような技術革新を支持します。しかし、その一方で、膨大なエネルギー消費とそれに伴う環境への影響には懸念を感じます。持続可能な方法でこれらの技術を利用するためには、エネルギー効率の良い計算方法や、再生可能エネルギーの利用拡大など、環境に配慮したアプローチが必要です。
また、この技術がもたらす可能性を最大限に活用するためには、プライバシーや著作権などの法的・倫理的な問題に対する慎重な検討も求められます。技術が進化する速度に法規制が追いつかない場合、新たな問題が生じる可能性があります。
最終的には、この技術の発展は、計算能力の向上、エネルギー効率の改善、そしてコスト削減にかかっています。これらの課題を克服することができれば、テキストからビデオへの生成技術は、映像制作の未来を大きく変えることになるでしょう。しかし、そのためには、技術開発者、環境専門家、法律家など、多様な分野の専門家が協力して取り組む必要があります。