Last Updated on 2025-05-01 14:29 by admin
NVIDIAは2025年4月29日(日本時間)、「AI Blueprint for 3D-guided generative AI」を発表した。このワークフローは、オープンソースの3Dモデリングソフト「Blender」で作成した3Dシーンの深度マップを活用し、Black Forest Labsが開発した画像生成AIモデル「FLUX.1-dev」などを使って、構図やカメラアングルを直感的にコントロールしながら画像生成ができるのが特徴である。
ワークフローにはComfyUIやBlender用プラグイン、NVIDIAのNIMマイクロサービスが含まれる。推奨GPUはGeForce RTX 4080以上、推奨メモリ48GB。1024×1024ピクセルの画像をRTX 5090環境で約11秒で生成できる。
本Blueprintは非商用利用が前提で、商用利用にはBlack Forest Labsとの契約が必要。主な用途はAIアーティストや開発者のプロトタイピング、研究、教育分野での活用が想定されている。
from Nvidia’s new tool can turn 3D scenes into AI images
【編集部解説】
NVIDIAの「AI Blueprint for 3D-guided generative AI」は、従来のテキストプロンプト主体の画像生成AIに比べて、構図やカメラアングル、オブジェクト配置のコントロール性を飛躍的に高める技術です。Blenderで作成した3Dシーンの深度マップを活用し、ユーザーは直感的にシーンを設計しながらAI画像生成を行うことができます。
この技術の大きな利点は、3D空間上でオブジェクトやカメラの位置を自由に調整できる点です。従来のテキストプロンプトだけでは難しかった細かな構図指定や複雑なレイアウトも、Blenderのビューポート操作で簡単に実現できます。3Dモデルやテクスチャの精度にこだわる必要がなく、ラフな配置でも高品質な画像生成が可能です。
ワークフローにはBlack Forest LabsのFLUX.1-devモデル、ComfyUI、NVIDIA NIMマイクロサービスなどが組み込まれており、RTX 4080以上のGPUで動作します。TensorRTによる最適化で、RTX 5090環境では1024×1024ピクセル画像が約11秒で生成可能です。
一方、現時点では非商用利用が前提であり、商用利用にはBlack Forest Labsとの契約が必要です。また、推奨スペックの高さやNIMマイクロサービスのライセンスなど、導入には一定のハードルがあります。
この技術は、AIによるクリエイティブ制作の現場に「空間的な自由度」と「再現性」「高速なイテレーション」をもたらします。今後、プロダクトデザイン、ゲーム開発、広告、教育など多様な分野での応用が期待される一方、生成物の著作権や倫理的な利用、AIによるフェイク画像生成への悪用リスクなど、社会的な議論も必要となるでしょう。
【用語解説】
Blender:無料・オープンソースの3DCG制作ソフトウェア。
ComfyUI:ノードベースで画像生成AIを直感的に操作できるGUIツール。
FLUX.1-dev:Black Forest Labsが開発した高品質な画像生成AIモデル。
NIMマイクロサービス:NVIDIAが提供するAI推論用マイクロサービス。
深度マップ:3Dシーン内の各ピクセルのカメラからの距離を示す画像。
ControlNet:追加情報で画像生成AIの出力を細かく制御する技術。
【参考リンク】
NVIDIA公式サイト(外部)GPUやAI技術のリーディングカンパニー。製品・ソリューション情報を掲載。
Blender公式サイト(外部)無料・オープンソースの3DCG制作ソフトウェア。基本から応用まで幅広く対応。
Black Forest Labs公式サイト(外部)FLUX.1などの画像生成AIモデルを開発・提供する企業。最新AI技術を発信。