「いいアイデアが浮かんだのに、形にするまでが遠い」――そんなもどかしさを、誰でも一度は味わったことがあると思います。頭の中の絵が、4秒で目の前に立ち上がり、そのまま動き出す。今回Googleが出してきた2つのモデルは、その「思いつき」と「完成」のあいだにあった距離を、ぐっと縮めてくるものでした。しかも、驚くほど安く。プロの道具だったはずの映像制作が、気軽に試せる場所まで降りてきたとき、私たちの「作ってみたい」はどこまで広がるのでしょうか。まずは、何が発表されたのかを一緒に見ていきます。
Googleの研究部門であるGoogle DeepMindは2026年6月30日、画像生成モデル「Nano Banana 2 Lite」と動画生成・編集モデル「Gemini Omni Flash」を発表しました。Nano Banana 2 Lite(gemini-3.1-flash-lite-image)はGoogle AI Studio、Gemini API、Gemini Enterprise Agent Platformで一般提供され、検索のAI ModeやGeminiアプリなどへ順次展開されます。
テキストから画像への出力は4秒、価格は1K画像あたり0.034ドルです。Gemini Omni Flash(gemini-omni-flash-preview)はGoogle I/Oで発表されたモデルで、Gemini APIとGoogle AI Studioでパブリックプレビューを開始しました。テキスト・画像・動画を入力に動画生成と対話型編集に対応し、価格は動画出力1秒あたり0.10ドル、Veo 3.1 Fastと同額です。現在の生成尺は10秒で、両モデルはSynthIDによる電子透かしを使用します。
From:
Start building with Nano Banana 2 Lite and Gemini Omni Flash
【編集部解説】
Googleが今回発表した2つのモデルは、それぞれ単体でも優秀ですが、本当の狙いは「組み合わせ」にあります。Nano Banana 2 Liteで画像を生成し、その画像をGemini Omni Flashに渡して動画化する。この流れを一つのAPIワークフローで完結させられる点が核心です。
なぜ今これを報じるのか。生成AIの競争軸が「品質の高さ」から「速度とコスト」へと明確に移りつつある転換点だからです。Nano Banana 2 Liteは4秒で画像を出力し、1K画像あたり0.034ドル。前世代から速度・価格ともに大幅に改善されており、これは個々のクリエイターよりも、大量生成を前提とする開発者やサービス事業者に効いてきます。
なお、2つのモデルは提供段階が異なります。Nano Banana 2 Liteはすでに一般提供(generally available)が始まっている一方、Gemini Omni Flashはまだパブリックプレビューの位置づけです。後者は仕様や制約が今後変わりうる前提で受け止めておくと、期待値を見誤らずに済みます。
ここで「Lite」という命名にも注目しておきたいところです。Googleは上位のNano Banana ProやNano Banana 2と並べ、用途に応じて品質・速度・コストを選べる階層構造を整えました。クラウドインフラで実証済みの「価格性能の幅を顧客に選ばせる」戦略を、生成メディアにも持ち込んだ格好といえます。
もう一方のGemini Omni Flashは、性質が異なります。テキスト・画像・動画を入力に動画を生成・編集でき、しかも自然言語による「対話型編集」に対応します。「この人物を入れ替えて」「角度を変えて」と言葉で指示するだけで動画を作り替えられる――非エンジニアでも動画制作に踏み込める余地が一気に広がるわけです。価格は動画出力1秒あたり0.10ドルで、既存のVeo 3.1 Fastと同額に設定されています。
この技術が実用段階に入ると、たとえばeコマースの商品紹介動画や、インテリアのビフォーアフター提案、広告クリエイティブの量産といった領域で、制作コストと時間が桁違いに圧縮される可能性があります。実際、AdobeやWPPといった大手がすでに早期導入を表明しており、絵空事ではなく現場の生産ラインに入り始めている点は見逃せません。
一方で、制約とリスクも冷静に押さえておく必要があります。Omni Flashの動画は現状10秒どまりで、音声参照やシーン拡張は未対応。シーン転換時のキャラクターの一貫性にも課題が残ると、Google自身が明記しています。誇大広告ではなく等身大の機能として捉えるべきでしょう。
より重い論点は、真贋の判別です。両モデルはSynthIDによる電子透かしを施し、Geminiアプリや検索で検証できる仕組みを備えています。生成のハードルが下がるほど、偽情報や肖像の悪用といったリスクも比例して高まるため、こうした透明性ツールの整備は規制対応の観点からも今後ますます重みを増していくはずです。
長期的に見れば、今回の発表は「誰でも、速く、安く」映像を生み出せる世界への一歩です。表現の民主化という希望と、信頼できる情報をどう守るかという課題は、いつも背中合わせで進みます。私としては、その両面を見据えながら、この潮流の行方を追い続けたいと考えています。
【用語解説】
Gemini Enterprise Agent Platform
Googleが提供する企業向けのAIエージェント構築・運用基盤である。生成AIモデルを業務アプリケーションへ組み込み、大規模に利用するための環境を整える。
Eloスコア
もともとチェスの実力指標として考案された相対評価の仕組みである。AIモデルの比較では、人間の評価による勝敗を積み重ね、生成・編集品質を数値化する指標として用いられる。
レイテンシ(latency)
入力に対して結果が返るまでの遅延時間を指す。本記事では、画像や動画が生成されるまでにかかる時間を意味し、短いほど高速である。
1K解像度(1K image)
横幅おおむね1000ピクセル前後の画像を指す。Nano Banana 2 Liteの価格は、この1K解像度画像1枚あたりで算定されている。
マルチモーダル
テキスト・画像・音声・動画など、複数の種類のデータを横断して扱える性質を指す。Gemini Omni Flashは、これらを組み合わせて入力できる点が特徴である。
対話型編集(conversational editing)
自然言語での指示を通じて、生成済みの動画や画像を作り替える編集手法である。専門的な操作を経ずに、言葉で修正を重ねられる。
一般提供(generally available)
試験段階を終え、すべての利用者へ正式に提供される段階を指す。Nano Banana 2 Liteはこの段階にある。
パブリックプレビュー(public preview)
正式提供の前段階として、機能を一般の開発者に先行公開する形態である。仕様や制約が変わる可能性を含む。Gemini Omni Flashはこの段階にある。
SynthID
Google DeepMindが開発した、AI生成コンテンツに電子透かしを埋め込む技術である。人間の目には見えない形で識別情報を付与し、生成物の真贋判定を支援する。
Interactions API
複数ターンにわたるやり取りで、セッション履歴や文脈を保持するためのAPIである。本記事では、最大3回の連続編集を積み重ねる仕組みを支える。
【参考リンク】
Google AI Studio(外部)
Geminiの各モデルをブラウザ上で試せる開発者向けプレイグラウンド。両モデルをすぐに実験できる。
Nano Banana 2 Lite(Google DeepMind)(外部)
Nano Banana 2 Liteの公式紹介ページ。高速・低コストの設計思想や導入事例の声が掲載されている。
Google Cloud Blog(企業向け発表)(外部)
Gemini Enterprise Agent Platformへの両モデル追加を伝える公式発表。導入パートナーの声も含む。
Gemini API ドキュメント(外部)
Geminiの各モデルを開発に組み込むための公式ドキュメント。APIの利用方法や対応機能を確認できる。
【参考記事】
Google launches Nano Banana 2 Lite for fast AI images and Gemini Omni Flash for video via API(THE DECODER)(外部)
両モデルの数値や連続編集、デモアプリ、SynthIDまで具体的に解説した技術メディアの記事。制約事項も明記している。
Nano Banana 2 Lite and Gemini Omni Flash available(Google Cloud Blog)(外部)
Gemini Enterprise Agent Platformへの追加を伝える公式発表。一般提供開始やパートナーの声を補強する一次情報。
Google launches Nano Banana 2 Lite and Gemini Omni Flash models(Investing.com)(外部)
両モデルの数値を簡潔に確認できる金融系メディアの記事。展開先サービス名も列挙している。
Google launches Nano Banana 2 Lite, Gemini Omni Flash(Digg)(外部)
一般提供とプレビューを書き分けた記事。前世代から価格が約半分、レイテンシ短縮にも触れている。
Google Launches Nano Banana 2 Lite and Gemini Omni Flash(TechBuzz)(外部)
「Lite」の階層戦略や競合との位置関係まで踏み込んで論じた分析記事。市場戦略の視点を補った。
【編集部後記】
正直に打ち明けると、私がいちばん引っかかったのは「4秒」と「0.034ドル」という数字でした。コーヒーをひと口飲むくらいの時間で、しかも数円で、頭の中のイメージが画面に現れる。さらにそれを動かせる。便利になったと喜ぶ前に、少しだけ立ち止まって「これは、けっこう大きな変化なんじゃないか」と感じたのが本音です。
というのも、これまで映像づくりは、技術と時間とお金という三つの壁に守られた領域でした。その壁が低くなることは、表現したい人にとって間違いなく追い風です。商品を売りたい人、自分の部屋を見つめ直したい人、伝えたい物語を抱えている人――それぞれの手元に、強力な道具が届く。これはやっぱり、わくわくする話です。
一方で、壁が低くなるというのは、誰にとっても低くなるということでもあります。本物そっくりの映像を、誰でも、速く、安く作れる世界では、「これは本当にあったことなのか」と立ち止まる場面が、これまでより増えていくはずです。SynthIDのような、生成物に印をつけて見分ける仕組みが用意されているのは、その不安への一つの答えなのだと思います。便利さとリスクは、たいてい同じ扉から一緒に入ってくる。だからこそ、扉を開ける手と、見極める目は、両方とも自分で育てていきたいところです。












