FLUX.2発表、Google Nano Banana Proの4分の1コストで画像生成AIの新時代へ

[更新]2025年11月29日

FLUX.2発表、Google Nano Banana Proの4分の1コストで画像生成AIの新時代へ - innovaTopia - (イノベトピア)

ドイツのAIスタートアップBlack Forest Labsが2025年11月26日(日本時間)、画像生成・編集システム「FLUX.2」を発表した。同社はStable Diffusionの開発者であるRobin Rombach氏らが創業し、Andreessen Horowitz主導で3100万ドルのシード資金を調達した注目企業だ。

FLUX.2は用途に合わせた複数のモデルで構成される。最上位のFlux.2 [Pro]は、【Black Forest Labsの公式APIでは「最初の1メガピクセルが0.03ドル、以降は1メガピクセルあたり0.015ドル」という従量課金制】を採用しており、競合のクローズドモデルと比較しても高解像度画像の生成コストを抑えられる設計だ。
開発者向けのFlux.2 [Dev]は、約320億パラメータ規模のオープンウエイトモデルとして公開されており、研究・検証用途で自由度の高い実験が行える。

機能面での白眉は「マルチリファレンスコンディショニング」だ。最大10枚の参照画像を同時に読み込み、その特徴を維持したまま高精度な生成・編集を行える。また、Googleの最新モデル「Gemini 3 Pro Image」(通称:Nano Banana Pro)と比較した場合のコストパフォーマンスは圧倒的だ。

また、軽量モデルのFlux.2 [Klein]と、画像圧縮技術の中核であるFlux.2 VAEがApache 2.0ライセンスでオープンソース公開されることも発表された。

From: 文献リンクBlack Forest Labs launches Flux.2 AI image models to challenge Nano Banana Pro and Midjourney

【編集部解説】

今回のFLUX.2リリースで最も注目すべきは、画像生成AIが「実験的なツール」から「業務で使える信頼性ある基盤」へと進化している点です。これまでの画像生成AIは、プロンプト次第で結果が大きくブレたり、テキストが崩れたり、複数の画像で同じキャラクターを維持できないといった課題がありました。FLUX.2はこうした実用上のボトルネックを技術的に解決しようとしています。

特に重要なのが「マルチリファレンス機能」です。最大10枚の参照画像から一貫性を保ったまま生成できるため、ECサイトの商品画像バリエーション制作や、ブランドガイドラインに沿った素材作成が格段に効率化されます。従来は人手で調整していた作業が、AI側で自動的に整合性を取れるようになるわけです。

技術面では、320億パラメータという大規模なモデルサイズが特徴的です。このスケールにより、複雑な指示文への追従性や、光源・材質といった物理的な整合性が大幅に向上しています。

コスト面での競争力も見逃せません。GoogleのGemini 3 Pro Image(Nano Banana Pro)は、4K(4096×4096)画像の生成に1枚あたり約0.24ドルかかります。
一方、FLUX.2 [Pro]はBlack Forest Labsの公式APIにおいて【最初の1メガピクセルが0.03ドル、その後は1メガピクセルあたり0.015ドル】で課金されるモデルとなっており、実際の利用パターンによっては高解像度でも総コストを抑えやすい価格設計です。
企業が大量の商品画像や広告クリエイティブを生成するシーンでは、こうした従量課金モデルの違いが年間コストに大きな差を生む可能性があります。

Apache 2.0ライセンスで公開されるVAE(変分オートエンコーダー)の意義も大きいです。これは画像を圧縮・復元する中核技術で、オープン化されることで企業は自社環境に組み込みやすくなります。特定ベンダーへの依存を避けつつ、商用利用も自由に行えるため、長期的な技術投資として安心感があります。

一方で、リアルな画像やテキストを高精度で生成できるということは、偽情報や悪用のリスクも高まることを意味します。Black Forest Labsは厳格な利用規約を設けていますが、技術が広く普及すればするほど、コンテンツの真正性を検証する仕組みや、透かし技術などの対策が不可欠になってくるでしょう。

このリリースは、オープンソースとビジネスの両立という点でも示唆的です。完全オープンではなく「オープンコア戦略」を採用し、無償で使える部分と商用サービスを明確に分けています。持続可能なAI開発のビジネスモデルとして、今後の業界標準になる可能性があります。

【用語解説】

オープンウエイトモデル
AIモデルの学習済みパラメータ(重み)を公開する形態。完全なオープンソースとは異なり、学習コードやデータセットは非公開の場合もある。研究者や開発者が自由に実験できる一方、商用利用には別途ライセンスが必要なケースが多い。

VAE(変分オートエンコーダー)
画像を低次元の潜在空間に圧縮し、再び高解像度に復元する機械学習モデル。画像生成AIでは、この圧縮表現を操作することで効率的な生成・編集を実現する。FLUX.2では4メガピクセルの高品質な復元を可能にする中核技術となっている。

ELOスコア
もともとチェスの実力評価に使われていた指標で、AI分野では複数モデルを対戦形式で比較評価する際に用いられる。スコアが高いほど他モデルとの比較で優れた結果を出したことを示す。

Apache 2.0ライセンス
商用利用・改変・再配布が自由に認められるオープンソースライセンス。企業が安心して製品に組み込める寛容なライセンスとして広く採用されている。

レイテンシー
システムが要求を受けてから応答するまでの遅延時間。画像生成AIでは、プロンプト入力から画像出力までの待ち時間を指す。業務利用では予測可能な低レイテンシーが重要となる。

マルチリファレンスコンディショニング
複数の参照画像を条件として与え、それらの特徴を維持しながら新しい画像を生成する技術。FLUX.2では最大10枚までの参照画像を同時に処理できる。キャラクターの一貫性や商品の詳細を保ったまま、異なるシーンやアングルの画像を作成できる。

【参考リンク】

Black Forest Labs 公式サイト(外部)
Stable Diffusion開発者が創業したドイツのAIスタートアップ。FLUX.2を含む画像生成モデルの開発・提供を行う。

FLUX.2 公式ブログ(外部)
FLUX.2の技術詳細、モデルバリアント、ベンチマーク結果を掲載。各モデルの性能比較やアーキテクチャ解説が含まれる。

FLUX API Pricing(外部)
FLUX.2の料金計算機を提供。メガピクセル単位での課金体系や、解像度別の具体的なコストをシミュレーション可能。

Andreessen Horowitz (a16z)(外部)
Black Forest Labsへ3100万ドルのシード資金を主導したベンチャーキャピタル。AI・Web3分野へ積極投資する米国大手VC。

NVIDIA Developer Blog – FLUX.2(外部)
NVIDIAとの協業で実現したfp8最適化実装について解説。ComfyUIでのローカル実行に関する技術情報を提供。

【参考記事】

Finally, image generation AI ‘FLUX.2’ has arrived – GIGAZINE(外部)
FLUX.2のリリース内容と技術的進化を包括的にカバー。ベンチマーク結果や競合比較、価格面での優位性を具体的数値で提示。

【編集部後記】

日々の暮らしやお仕事の現場に、AI画像生成の波は確かに押し寄せています。みなさんは「人手では不可能」と感じていたクリエイティブ作業や、表現の広がりにワクワクする瞬間はありますか?AIの進化でどんなアイデアが生まれるのか、ご自身の現場に当てはめて考えてみてはいかがでしょうか。今だからこそ、未来の可能性について一緒に探っていけたら嬉しいです。

投稿者アバター
Ami
テクノロジーは、もっと私たちの感性に寄り添えるはず。デザイナーとしての経験を活かし、テクノロジーが「美」と「暮らし」をどう豊かにデザインしていくのか、未来のシナリオを描きます。 2児の母として、家族の時間を豊かにするスマートホーム技術に注目する傍ら、実家の美容室のDXを考えるのが密かな楽しみ。読者の皆さんの毎日が、お気に入りのガジェットやサービスで、もっと心ときめくものになるような情報を届けたいです。もちろんMac派!

読み込み中…
advertisements
読み込み中…