Last Updated on 2024-08-16 08:03 by admin
2024年5月14日、グーグル傘外のDeepMindは画像生成AI「Imagen」の最新バージョン「Imagen 3」を発表した。Imagen 3は、以前のモデルと比較して画像の詳細さが向上し、テキストのレンダリング能力が強化された。
主な特徴は以下の通り:
- プロンプトの理解力が向上し、長く複雑な指示にも対応可能
- 人物の手の細かいしわや複雑なテクスチャを正確に描写
- テキストのレンダリング機能が大幅に強化され、バースデーカードやプレゼン資料の作成などに活用可能
- 電子透かし「SynthID」を搭載し、AIによる生成画像であることを示すことが可能
Imagen 3は、Google Cloud PlatformのVertex AIで利用可能となる予定だ。また、今後数か月のうちにGoogleの各種製品(Geminiアプリ、ウェブ体験、Workspace、広告など)にも展開される。
8月15日時点で、アメリカ合衆国のユーザーはGoogle AI Test Kitchenを通じてImagen 3にアクセスできるようになった。
from:Google’s upgraded AI image generator is now available
【編集部解説】
Googleが発表した最新の画像生成AI「Imagen 3」は、テキストから画像を生成する技術において大きな進歩を遂げています。この新モデルは、単に画像の品質を向上させただけでなく、AIと人間のクリエイティブな協働の可能性を広げる重要な一歩となっています。
Imagen 3の特筆すべき点は、自然言語の理解力が大幅に向上したことです。これにより、ユーザーは専門的な知識がなくても、日常的な言葉で複雑な画像を生成できるようになりました。これは、クリエイティブ業界やマーケティング分野に大きな影響を与える可能性があります。
また、Imagen 3はテキストのレンダリング能力も大幅に改善されています。これまで画像生成AIの弱点とされてきたこの分野での進歩は、グラフィックデザインやプレゼンテーション資料の作成など、ビジネスシーンでの活用の幅を広げるでしょう。
安全性の面では、GoogleはSynthIDという電子透かし技術を導入し、AI生成画像の識別を可能にしています。これは、ディープフェイクなどの悪用を防ぐ重要な取り組みですが、同時にクリエイターの著作権保護にも寄与する可能性があります。