Black Forest Labsは2024年1月16日、わずか1-5枚の画像でAI画像生成モデル「FLUX Pro」をカスタマイズできる「FLUX Pro Finetuning API」をリリースしました。
主な特徴
最大4メガピクセルの高解像度画像生成に対応し、以下の4つのモードを搭載:
- キャラクターモード:オリジナルキャラクターの一貫した生成
- 製品モード:商品画像の統一的な生成
- スタイルモード:特定の芸術様式の再現
- 一般モード:汎用的な画像生成
価格設定
モデル | 価格(1画像あたり) |
---|---|
FLUX 1.1 [pro] Ultra | 0.06ドル |
FLUX 1.1 [pro] | 0.04ドル |
FLUX.1 [pro] | 0.05ドル |
FLUX.1 [dev] | 0.025ドル |
from:You can now fine-tune your own version of AI image maker Flux with just 5 images
【編集部解説】
技術の革新性と背景
Black Forest LabsはStability AIの主要開発者たちが設立し、Andreessen Horowitzなどから3,100万ドルの出資を受けた注目のスタートアップです。
従来のAI画像生成モデルのカスタマイズには数百枚の画像が必要でしたが、わずか1-5枚でファインチューニングを可能にした技術は画期的です。
実用性と応用範囲
BurdaVerlagとの提携事例は、この技術の実用性を明確に示しています。子供向け出版物「Lissy PONY」のビジュアル制作において、ブランドの一貫性を保ちながら効率的なコンテンツ制作を実現しています。
特筆すべきは、4メガピクセルという高解像度出力に対応している点です。これにより、印刷物やデジタルサイネージなど、プロフェッショナルな用途にも対応可能です。
技術的特徴
FLUXは120億のパラメータを持つハイブリッドアーキテクチャを採用しており、従来のモデルと比較して手や顔の描写の一貫性が高いことが特徴です。
ファインチューニングでは、キャラクター、製品、スタイル、一般の4つのモードを提供し、様々なユースケースに対応しています。
今後の展望と課題
この技術は、個人クリエイターからエンタープライズまで、幅広い層のコンテンツ制作ワークフローを変革する可能性を秘めています。
一方で、著作権の問題も存在します。Ars Technicaの報告によると、トレーニングデータの収集方法に関する透明性が不足しているとの指摘もあります。
また、リアルな画像生成能力が高いことから、誤情報の拡散やプライバシーの侵害といった懸念も指摘されています。これらの課題に対する適切な規制やガイドラインの整備が今後の課題となるでしょう。