Amazonは、推論・マルチモーダル・音声・エージェントという生成AIの主要ピースを「Nova 2」「Nova Forge」「Nova Act」で一気に揃えてきました。
モデルを“使う”段階から、「自分たちの業務やサービス前提でAIスタックを組む」フェーズへの入口が、ようやく現実味を帯びてきたように感じます。
Amazonは12月2日、マルチモーダル対応の「Amazon Nova 2」シリーズ4モデルと、企業が自社専用のフロンティア級モデル「Novella」を構築できる「Nova Forge」、ブラウザUI自動化エージェントサービス「Nova Act」を発表した。
Nova 2 Lite/Proはテキスト・画像・動画・音声を扱う推論モデルとして設計され、Nova 2 Sonicは音声対話、Nova 2 Omniは超長コンテキストの統合マルチモーダル処理を担う。
Nova Forgeはpre/mid/postの各学習段階におけるNovaのチェックポイントとデータミキシング機能を提供し、Nova Actは強化学習ジムで鍛えたモデルによりブラウザベースのワークフローで約90%の成功率を示している。
【編集部解説】
今回の発表は、AWSが「モデルを貸し出すクラウド事業者」から「企業ごとのAIファクトリーを動かす基盤」へと踏み込んだ一手に見えます。 Nova 2シリーズで推論・マルチモーダル・音声・長文処理を押さえつつ、Nova ForgeとNova Actで「自社専用モデル」と「実務で動くエージェント」を同じ土俵で扱えるようにしている点が特徴です。
Nova Forgeの「open training」は、既存モデルの表層チューニングでもなく、フルスクラッチの自前LLMでもない第3の選択肢として機能します。 pre-trainedからpost-trainedまでのチェックポイントにアクセスし、自社データとNova由来データを段階的に混ぜ込めるため、指示追従などの基礎能力を維持したままドメイン知識を深く埋め込める設計です。 これは、自前モデルへの関心が高い一方でコストや人材面で踏み切りづらい大企業・行政組織にとって、現実的な落としどころになります。
Nova Actは、ブラウザ上の業務をこなすエージェントの「実用ライン」をどこに置くかという問いに、約90%のワークフロー成功率という数値で答えようとしています。 強化学習ジムで大量のUI操作パターンを学習させることで、Hertzや1Passwordなどの事例に見られるように、テスト自動化やフォーム入力、決済照合といった既存システム前提のタスクにも適用しやすくなっています。 まだ人間の監視なしで完全無人運用という段階ではないものの、「試験導入してROIを測る」には十分現実的な水準と言えそうです。
より大きな流れとしては、汎用モデル1つですべてを賄うのではなく、用途別モデルと自社専用Novella、エージェント基盤を組み合わせる「自前AIスタック」構築の時代が見え始めています。 欧米やアジア各国で進む主権的AIや官公庁向けモデルの動きとも連動しており、日本でも行政向けLLMの公募など、同じ地平線上のトピックが増えつつあります。 こうした状況では、モデルの性能比較だけでなく、責任あるAIや監査、セキュリティにどう向き合うかが、導入可否の判断軸として一段と重要になっていきます。
innovaTopiaの読者にとって重要なのは、「自社や自分のプロダクトでどこからエージェント化やNovella化を始めるか」という視点です。 画面の前で人が行っているルーティン作業をそのままブラウザエージェントに任せるのか、専門チームの暗黙知をNovellaに落とし込むのか、それとも顧客接点のマルチモーダル体験を再設計するのか。 どこにテコを入れるかで、得られるインパクトや求められる準備(データ整備や業務設計)が大きく変わってくるタイミングに差し掛かっています。
【用語解説】
フロンティアモデル
最先端クラスの性能と規模を持つ基盤AIモデルのことを指し、大規模データと計算資源で訓練されている。
マルチモーダル
テキスト、画像、音声、動画など複数の種類のデータを統合的に扱えるAIモデルの性質を指す。
コンテキストウィンドウ
モデルが一度に処理・保持できるトークン数を指し、値が大きいほど長い会話や長文を扱いやすくなる。
強化学習(Reinforcement Learning)
エージェントが環境との相互作用を通じて報酬を最大化する行動方針を学ぶ機械学習手法である。
ジム(Gym)
強化学習向けに設計されたシミュレーション環境の総称であり、エージェントがタスクを繰り返し実行して学習する場を指す。
ブラウザベースUIワークフロー
Webブラウザ上でのフォーム入力やボタン操作など、画面を通じて行う一連の業務プロセスのことを指す。
エージェント型AI
外部ツールやアプリケーションを呼び出しつつ、タスクを自律的に分解・実行するAIシステムの総称である。
【参考リンク】
Amazon Bedrock(外部)
複数のフロンティアモデルをAPIで提供し、企業が生成AIアプリケーションを安全かつスケーラブルに構築できるマネージドサービスである。
Amazon Nova(外部)
推論、マルチモーダル、音声対話などを対象としたAIモデル群であり、テキストから画像・音声・動画まで幅広いユースケースをカバーする。
Amazon Nova Forge(外部)
企業が自社専用のNovellaモデルを構築できるサービスで、Novaのチェックポイントと自社データを組み合わせたopen trainingを提供する。
Amazon Nova Act(外部)
ブラウザ上のUIワークフロー自動化に特化したエージェントサービスで、Nova 2 Liteをベースに高いタスク成功率を実現することを目指している。
Cisco(外部)
ネットワーク機器やセキュリティソリューションを提供するグローバル企業で、企業ネットワークやデータセンター向け製品を展開している。
Siemens(外部)
産業機器や医療機器などを手がけるドイツの大手企業で、製造業のデジタル化やインダストリー4.0領域にも注力している。
Reddit(外部)
コミュニティベースの掲示板プラットフォームを運営する企業で、スレッド形式の投稿と投票機能を備えたソーシャルニュースサイトを提供する。
Booking.com(外部)
宿泊施設や旅行商品をオンラインで予約できるサービスで、世界各国のホテルや交通手段を検索・予約できるプラットフォームを運営する。
1Password(外部)
パスワードや秘密情報を安全に保管・管理するソフトウェアを提供し、ブラウザ拡張などでログイン情報の自動入力機能を提供している。
Hertz(外部)
世界各地でレンタカー事業を展開する企業で、空港や都市部の拠点を通じて乗用車や商用車のレンタルサービスを提供する。
【参考記事】
AWS launches new Nova AI models and a service that gives customers more control(外部)
TechCrunchによる記事で、Nova 2シリーズの概要とともに、Nova Forgeがチェックポイントアクセスとデータミキシングにより企業へより大きなコントロールを提供する点や、Nova Actのブラウザ自動化への応用を解説している。
AWS introduces Nova Forge for training bespoke “Novella” frontier models(外部)
SiliconANGLEがNova Forgeにフォーカスし、pre/mid/post各段階のチェックポイント提供、強化学習ジム、知識蒸留など技術的特徴と、企業が独自フロンティアモデル級Novellaを構築する戦略的背景を詳述している。
Build reliable AI agents for UI workflow automation with Amazon Nova Act, now generally available(外部)
AWS公式ブログで、Nova Actが強化学習とシミュレーション環境を活用し、ブラウザUIワークフロー自動化で約90%の成功率を達成していることや、Hertzや1Passwordの導入事例を紹介している。
Top announcements of AWS re:Invent 2025(外部)
re:Invent 2025の主な発表をまとめた公式ブログで、Nova 2シリーズ、Nova Forge、Nova Actを含むAI関連サービスの位置付けとAWS全体戦略の中での役割をダイジェスト的に整理している。
With Nova Forge, AWS gives companies a path to build foundation-class models(外部)
VentureBeatによる記事で、Nova Forgeが企業にフロンティア級モデル構築の新しい選択肢を提供し、既存のファインチューニングや自前LLM構築との違いをビジネス的観点から整理している。
【編集部後記】
ブラウザの向こう側で、どんな業務やサービスにこの波を試してみるか、少しイメージは湧いてきたでしょうか。 Nova 2やNova Forge、Nova Actのような仕組みは、特別なAI専業企業だけのものではなく、日々の業務フローや自分たちのプロダクト設計にどこまで溶け込ませられるかが鍵になってきています。
もし、チームやご自身の仕事の中に「毎日なんとなく画面の前で繰り返している作業」があるなら、そこはエージェント化やNovella化の候補としてかなり有望です。 どのプロセスをAIに任せて、どこは人がハンドルを握り続けるのか──その線引きを一緒に考えていけたら、とても心強いです。






























