Stable Diffusion 3.5登場!80億パラメータの新モデルで画像生成の精度が劇的向上

Stable Diffusion 3.5登場!80億パラメータの新モデルで画像生成の精度が劇的向上 - innovaTopia - (イノベトピア)

Last Updated on 2024-10-23 07:37 by admin

Stability AIは2024年10月22日、AIイメージ生成モデル「Stable Diffusion 3.5」を発表した。このリリースには以下の3つのモデルが含まれる:

  • Stable Diffusion 3.5 Large(80億パラメータ)
  • Stable Diffusion 3.5 Large Turbo(80億パラメータ、高速版)
  • Stable Diffusion 3.5 Medium(26億パラメータ、10月29日リリース予定)

全モデルは一般的なコンシューマー向けハードウェアで動作し、Stability AI Community Licenseの下で提供される。商用利用については、年間収益100万ドル未満の中小企業は無料で利用可能だが、それを超える企業はEnterprise Licenseが必要となる。

from:Stable Diffusion 3.5 debuts as Stability AI aims to improve open models for generating images

編集部解説

【編集部解説】

Stable Diffusion 3.5の登場は、AIイメージ生成の新たな転換点となる可能性を秘めています。特に注目すべきは、前バージョンで指摘された問題点を徹底的に改善しようとする姿勢です。

今回のアップデートで最も重要な進展は、プロンプトへの高い忠実性です。これまでのAIイメージ生成では、ユーザーの意図した画像と実際の出力結果に大きな乖離が生じることが課題でしたが、新バージョンではこの問題が大幅に改善されています。

人物の多様性に関する改善も特筆すべき点です。これまでのAIモデルでは、特別なプロンプトがない限り特定の外見の人物像に偏る傾向がありましたが、3.5では明示的な指示なしでも多様な人物表現が可能になりました。これは、GoogleのGeminiで起きたような歴史的な不正確さを避けつつ、より自然な形で多様性を表現しようとする試みといえます。

技術面では、3つの異なるモデルを用意することで、ユーザーのニーズや使用環境に応じた柔軟な選択を可能にしています。特に、Medium版は一般的なノートPCでも動作する設計となっており、AIイメージ生成の民主化をさらに推し進めるものと考えられます。

一方で、著作権に関する課題は依然として残されています。Getty Imagesとの訴訟に見られるように、学習データの使用に関する法的問題は未解決です[4]。これは、AIイメージ生成技術全体が直面している重要な課題の一つといえます。

ビジネス面では、年間収益100万ドル未満の企業に対する無料ライセンスの提供は、スタートアップや小規模ビジネスによるAI活用を促進する可能性があります。これにより、クリエイティブ産業に新たなイノベーションの波が生まれることが期待されます。

今後の展開としては、ControlNetsの提供により、さらなる細かいカスタマイズが可能になる予定です。これにより、プロフェッショナルユースでの活用範囲が広がることが予想されます。

【用語解説】

  • プロンプト忠実性:
    テキストの指示通りに画像を生成する精度のこと。例えば「赤い帽子をかぶった少女」と指示したら、確実にその通りの画像が生成される能力を指します。

【参考リンク】

  • Stability AI公式サイト
    AIイメージ生成技術を開発する企業。Stable Diffusionの開発元。
  • Hugging Face
    AIモデルの共有プラットフォーム。Stable Diffusion 3.5のモデルが公開されている。

【参考YouYube】

Stable Diffusion-3.5 : This NEW Image Diffusion JUST DROPPED & BEATS Flux!?

【関連記事】

AI(人工知能)ニュースをinnovaTopiaでもっと読む

ホーム » AI(人工知能) » AI(人工知能)ニュース » Stable Diffusion 3.5登場!80億パラメータの新モデルで画像生成の精度が劇的向上