Last Updated on 2025-04-25 17:19 by 乗杉 海
NVIDIAは2025年4月23日、NeMoマイクロサービスの一般提供開始を発表した。このマイクロサービスは企業ITがデータフライホイールを活用したAIチームメイト(AIエージェント)を迅速に構築し、従業員の生産性を向上させることを可能にする包括的な開発プラットフォームである。
NeMoマイクロサービスには以下のツールが含まれている
- NeMo Customizer:大規模言語モデルのファインチューニングを加速し、トレーニングスループットを最大1.8倍向上させる
- NeMo Evaluator:わずか5つのAPIコールでAIモデルとワークフローの評価を簡素化する
- NeMo Guardrails:わずか0.5秒の追加レイテンシーでコンプライアンス保護を最大1.4倍向上させる
- NeMo Curator:データ処理を担当
- NeMo Retriever:情報検索を担当
- Llama Nemotron:推論用大規模言語モデル
これらのマイクロサービスはNVIDIAのTriton Inference Serverと統合され、それぞれが独自のコンテナで動作する。
導入企業の事例
- AT&T:ArizeとQuantiphiと協力し、毎週更新される約10,000文書のナレッジベースを処理するAIエージェントを構築。Mistral 7BモデルをNeMo CustomizerとNeMo Evaluatorでファインチューニングし、エージェントの精度を最大40%向上させた。
- BlackRock:投資管理プロセスを統一するAladdinテクノロジープラットフォームにエージェント型AI機能を実装中。
- CiscoのOutshiftチーム:ツール選択エラーを40%削減し、応答時間を最大10倍高速化するコーディングアシスタントを開発中。
- Nasdaq:NeMo Retrieverマイクロサービスを活用し、検索精度と応答時間を最大30%向上させた。
- Amdocs:通信会社向けに3種類のエージェント(請求書エージェント、営業エージェント、ネットワークエージェント)を開発。請求書エージェントは初回コール解決率を50%向上させた。
- ServiceNow:HR、IT、カスタマーサポート向けAIエージェントにより、人間の作業時間を300万時間削減。
- Yum:音声AIによる注文受付を500店舗に拡大中。
NeMoマイクロサービスは、Llama、Microsoft Phi、Google Gemma、Mistral、Llama Nemotron Ultraなど多様なオープンモデルをサポートしている。Metaは新しいコネクタを通じてNeMoマイクロサービスをLlamastackに統合した。
また、Cloudera、Datadog、Dataiku、DataRobotなど多くのAIソフトウェアプロバイダーがNeMoマイクロサービスを自社プラットフォームに統合している。開発者はCrewAI、LangChain、LlamaIndexなどの人気AIフレームワークでNeMoマイクロサービスを利用できる。
開発者はNVIDIA NGCカタログからNeMoマイクロサービスをダウンロードでき、NVIDIA AI Enterpriseの一部として、API安定性、積極的なセキュリティ対策、エンタープライズグレードのサポートを備えた拡張ライフソフトウェアブランチとともにデプロイできる。
from: Enterprises Onboard AI Teammates Faster With NVIDIA NeMo Tools to Scale Employee Productivity
【編集部解説】
NVIDIAのNeMoマイクロサービスが一般提供開始となり、企業のAIチームメイト導入を加速させる重要な一歩となりました。2025年4月23日の発表では、データフライホイールを活用したAIエージェント構築プラットフォームが紹介されています。
データフライホイールとは、ユーザーとの対話や推論から得られたデータを活用してAIが自己学習・改善していく仕組みです。これにより、時間経過とともにAIの精度と有用性が向上していきます。
NeMoマイクロサービスの特徴は、独立したコンテナとして動作する各コンポーネントが連携する点です。NeMo Curator(データ処理)、Customizer(モデルカスタマイズ)、Evaluator(モデル評価)、Guardrails(保護機能)、Retriever(情報検索)といった要素が企業データを活用したAIエージェントの構築と改善を可能にしています。
特にGuardrailsは、AI導入における最大の懸念であるセキュリティとコンプライアンスに対応し、わずか0.5秒の追加レイテンシーで1.4倍のコンプライアンス保護を実現しています。
実際の導入事例も増えています。AT&Tでは約10,000文書のナレッジベースを処理するAIエージェントを構築し、精度を40%向上。Amdocsは通信会社向けに請求書エージェントなど3種類のエージェントを開発し、初回コール解決率を50%向上させました。
しかし課題も残っています。英国の調査では、AIへの投資から「わずかな利益しか得られていない」と感じている企業が約44%に上ります。NeMoマイクロサービスは、企業固有のデータを活用してAIエージェントを継続的に改善することで、これらの課題解決を目指しています。
【編集部追記】
AIチームメイト、かなり面白い響きだと思いました!
AIについて「業務効率化ツール」として捉える人が多かったと思うのですが、これからその考えもすこしずつ変わっていくのでしょうか?
また、データフライホイールの仕組みにより、企業内に散在する暗黙知や形式知を継続的に収集・学習することができるのであれば、ナレッジの俗人化も止められたりするのかなあ…とぼんやり思いました。
もしそれが実現可能ならかなり凄いかも…めちゃくちゃ助かりますねえ…。
【用語解説】
データフライホイール
AIモデルの継続的な改善サイクルのこと。ユーザーとの対話や推論から得られたデータを活用して、AIが自己学習・改善していく仕組み。車のフライホイールが回転エネルギーを蓄積して安定した動力を生み出すように、データが蓄積されることでAIの性能が向上し続ける。
NeMoマイクロサービス
NVIDIAが提供する、AIエージェント構築のための個別のモジュール化されたツール群。それぞれが独立したコンテナとして動作し、必要な機能だけを組み合わせて利用できる。
AIエージェント(AIチームメイト)
特定のタスクや目的のために設計された自律的なAIシステム。単なる質問応答だけでなく、ユーザーの意図を理解し、複雑なタスクを実行できる。デジタルな「同僚」として機能する。
ファインチューニング
既存の大規模言語モデルを特定の目的や領域に合わせて調整すること。企業固有のデータや知識を学習させることで、より精度の高い回答や機能を実現する。
Llama Nemotron Ultra
NVIDIAが開発した大規模言語モデルで、MetaのLlama-3.1-405B-Instructをベースにしている。特に推論性能において高い能力を持つ。
【参考リンク】
NVIDIA(外部)
GPUとAI技術のリーディングカンパニー。半導体企業として始まり、現在はAI分野で主導的役割を果たす
AT&T(外部)
米国の大手通信企業。世界第3位の通信企業で、米国内では第3位の無線通信キャリア
BlackRock(外部)
世界最大の資産運用会社。約11.5兆ドルの資産を運用し、Aladdinプラットフォームを所有
Cisco(外部)
ネットワーク機器とソフトウェアのグローバル企業。通信機器開発・販売の多国籍テクノロジー企業
Amdocs(外部)
通信業界向けソフトウェア・サービス企業。本社は米国セントルイスの多国籍企業
ServiceNow(外部)
ビジネス変革のためのAIプラットフォーム提供企業。企業向けクラウドコンピューティングを提供