Google「Agentic RAG」発表|情報が足りなければ自律的に再検索、信頼できるAI回答へ

AIに調べ物を頼んで、それっぽいのに微妙にズレた答えが返ってきた——そんな経験はないでしょうか。その原因の多くは、AIが「答えるための材料が足りていない」ことに気づけないまま、推測で押し切ってしまう点にあります。Googleが2026年6月5日に発表した新技術「Agentic RAG」は、この弱点に正面から挑むものです。

複数のAIエージェントが役割を分担し、情報が足りなければ「まだ足りない」と自ら判断して検索を繰り返す。部署ごとにバラバラのデータをまたいでも、根拠をたどれる答えにたどり着く仕組みです。AIが「賢く答える」段階から「あきらめずに調べ抜く」段階へ——その転換点を、できるだけわかりやすく読み解いていきます。


2026年6月5日、Google ResearchはGoogle Cloudとの協業による新しいエージェント型RAGフレームワークを発表しました。Gemini Enterprise Agent Platform上で「Agentic RAGによるクロスコーパス検索」として提供されます。著者はサイラス・ラシュティアンとダーチェン・ジュアン。

複数のエージェントが連携し、回答前に十分な文脈が集まるまで反復的に検索します。標準的なRAGと比べ事実性データセットでの正確性を最大34%向上させました。ベンチマークFramesQAは824件のクエリと2,676件のPDF文書からなります。クロスコーパス設定では90.1%の質問に正しく答え、シングル/クロス両設定のレイテンシ差は平均3%以内でした。

同機能はGemini Enterprise Agent Platformのパブリックプレビューとして提供されます。

From: 文献リンクUnlocking dependable responses with Gemini Enterprise Agent Platform’s Agentic RAG

【編集部解説】

今回の発表でまず押さえておきたいのは、これが「まったく新しい発明」ではなく、Google Researchがかねて温めてきた基礎研究を、実際に使える製品へ落とし込んだものだという点です。

中核にある「十分な文脈(sufficient context)」という考え方は、2024年に公開された論文「Sufficient Context: A New Lens on Retrieval Augmented Generation Systems」がその源流にあります。この論文は、RAGの誤りがLLMの読み取り失敗から生じるのか、それとも与えられた文脈そのものが不足しているのかを切り分ける新しい視点を提示しました。今回のAgentic RAGは、その問いに対する一つの実装解答だと位置づけられます。

なぜこの区別が重要なのでしょうか。従来のRAGが抱えていた厄介な癖は、根拠が足りないときの振る舞いにありました。GeminiやGPT、Claudeといった大規模モデルは、文脈が十分なら高精度で答える一方、情報が足りないときには「分かりません」と答えず、誤った内容を自信ありげに生成してしまう傾向が指摘されていたのです。つまり問題は「賢さ」ではなく、「足りないことに気づけない」点にありました。

今回のフレームワークが面白いのは、この弱点を一体のモデルに丸投げするのではなく、役割分担で解こうとしている発想です。計画を立てる係、検索文を書き換える係、そして回答前に「材料はそろったか」を点検する検査係——いわば一人の天才ではなく、機能別の調査チームを組ませることで信頼性を担保しようとしています。

実務へのインパクトは、部署ごとにデータが分断された大企業ほど大きくなりそうです。記事中の医療カルテの例のように、薬・食事・アレルギーが別々の文書に散らばっていても、足りない情報を自ら追いかけて補完する。この「あきらめずに探し続ける持続性」こそが、本記事の肝だと私は読みました。

恩恵は明快です。回答が「監査可能・追跡可能・根拠付き」になること。どの文書のどの一節を根拠にしたかを後から検証できるため、医療・金融・法務といった、間違いが許されない領域での導入ハードルが下がります。

一方で、楽観だけではいられません。検索を反復するということは、計算コストや処理経路が複雑になることを意味します。今回はレイテンシ差3%以内と報告されていますが、これはあくまで特定ベンチマーク上の数字であり、実運用の多様なデータで同じ快適さが保証されるわけではない点には留意が必要でしょう。

規制やガバナンスの観点では、むしろ追い風になり得ます。AIの判断根拠を説明できることは、EUのAI規則をはじめとする世界的な「説明責任」の要請と相性が良いからです。「なぜその答えを出したのか」を記録できるアーキテクチャは、今後のエンタープライズAI調達で標準要件になっていくと見ています。

長期的に見れば、この発表は「RAGの第二章」の号砲かもしれません。これまでの競争が「いかに速く・的確に検索するか」だったとすれば、これからは「いかに足りなさを自覚し、自律的に補うか」へと軸足が移っていく。その転換点として、数年後に振り返られる一件になる可能性を感じています。

【用語解説】

RAG(検索拡張生成 / Retrieval-Augmented Generation)

LLMが回答する前に、外部の文書やデータベースから関連情報を検索し、それを材料に答えを生成する仕組み。モデル内部の知識だけに頼らず、組織固有のデータに基づいた回答ができる点が特徴です。

エージェント型RAG(agentic RAG)

単一の検索で終わる従来型RAGと異なり、複数の自律的な「エージェント」が計画・検索・点検などの役割を分担し、必要に応じて検索を反復するRAGの発展形。複雑な問いへの対応力と信頼性を高める狙いがあります。

クロスコーパス検索(Cross-Corpus Retrieval)

コーパス(検索対象となる文書群)が複数に分かれている状況で、どのデータ群を探すべきかを判断しながら横断的に検索する手法。部署ごとにデータが分断された企業環境を想定した機能です。

十分な文脈(sufficient context)

ある問いに確定的な答えを出すために必要な情報が、検索で集めた文脈の中に「そろっているか否か」を判定する概念。情報が足りないまま推測で答える事態を防ぐための、本技術の中核的な考え方です。

事実性データセット(factuality dataset)

モデルの回答が事実に即しているかを測るために用意された評価用データの集合。本記事では、この種のデータセットで正確性が最大34%向上したと報告されています。

大規模言語モデル(LLM / Large Language Model)

膨大なテキストで学習し、自然言語の生成や理解を行うAIモデル。Gemini、GPT、Claudeなどが代表例です。

レイテンシ(latency)

リクエストを送ってから応答が返るまでの遅延時間。検索を反復する仕組みでは増えがちですが、本記事では従来との差は平均3%以内に収まったとされています。

パブリックプレビュー(public preview)

正式提供の前段階として、機能を一般に試験公開する提供形態。仕様変更の可能性を含む段階であることを示します。

【参考リンク】

Google Research Blog(元記事)(外部)
Agentic RAGを発表したGoogle Researchの公式ブログ。仕組みの図解と実験結果を一次情報として確認できる記事。

Cross-Corpus Retrieval(Google Cloud 公式ドキュメント)(外部)
クロスコーパス検索の公式技術文書。設定方法や仕様を開発者向けに解説したGoogle Cloudのページ。

RAG Engine overview(Google Cloud 公式ドキュメント)(外部)
今回の技術の土台となるRAG Engineの概要。取り込みから検索・生成までの流れを解説した公式文書。

Gemini Enterprise Agent Platform 紹介(Google Cloud 公式ブログ)(外部)
本機能をホストする基盤を紹介する公式ブログ。エンタープライズ向けエージェント基盤の全体像がわかる。

FRAMES(FramesQA)データセット(Hugging Face)(外部)
実験に用いた多段階推論ベンチマークの公式配布ページ。824件のクエリからなる評価データを確認できる。

Deeper insights into RAG: sufficient context(Google Research Blog)(外部)
中核概念「十分な文脈」の源流研究を解説したGoogle Research公式ブログ。判定の考え方を紹介する。

【参考記事】

Sufficient Context: A New Lens on Retrieval Augmented Generation Systems(arXiv)(外部)
技術の源流となった学術論文。文脈の十分・不十分で誤りを切り分ける新視点を提示し、十分でも14〜16%の誤答が残ると報告。

Google Researchers Improve RAG With “Sufficient Context” Signal(Search Engine Journal)(外部)
上記研究の解説記事。データが不十分でも35〜65%は正答する一方、控えるべき場面で誤答しやすい傾向を指摘する。

Why enterprise RAG systems fail: Google study introduces ‘sufficient context’ solution(VentureBeat)(外部)
企業向けRAGが失敗する理由を「十分な文脈」の観点から論じた記事。信頼性と事実の正確さが最重要と整理する。

Deeper insights into retrieval augmented generation: The role of sufficient context(Google Research Blog)(外部)
「十分な文脈」を一般向けに解説した公式ブログ。判定器の考え方とハルシネーション抑制への応用を紹介する。

【関連記事】

Gemini Enterprise Agent Platform正式発表—Google Cloud Next ’26が告げる「エージェント時代」の本番開幕
今回の機能が動く基盤そのものの発表記事。本記事の前提として全体像をつかめる。

Google Research/DeepMind・MIT「Towards a Science of Scaling Agent Systems」:マルチエージェントはいつ効き、いつ崩れるのか
「なぜ役割分担が効くのか」を数字で示した研究。本記事の設計思想を学術面から補強する。

Gemini Deep Research Agent登場|Googleの自律型AIが公開Webと社内データを横断調査
「反復検索で答えに迫る」思想を共有する姉妹記事。Web+社内データ横断という発展形が読める。

【編集部後記】

ここまで読んでくださり、ありがとうございます。正直に告白すると、私自身もAIに調べ物を頼んで「それっぽいけれど、どこか違う答え」に何度もヒヤリとさせられてきました。今回の「足りないなら、自分でもう一度探しにいく」という設計思想には、技術の進歩というより、どこか誠実さのようなものを感じます。

完璧な答えそのものより、答えにたどり着くまでの過程を見せてくれるAI。そんな相棒となら、もう少し安心して未来の一歩を踏み出せそうです。これからも、新しい技術がもたらす「期待」と「不安」の両方に寄り添いながら、お伝えしていきます。

Googleで優先するソースとして追加するボタン
投稿者アバター
TaTsu
『デジタルの窓口』代表。名前の通り、テクノロジーに関するあらゆる相談の”最初の窓口”になることが私の役割です。未来技術がもたらす「期待」と、情報セキュリティという「不安」の両方に寄り添い、誰もが安心して新しい一歩を踏み出せるような道しるべを発信します。 ブロックチェーンやスペーステクノロジーといったワクワクする未来の話から、サイバー攻撃から身を守る実践的な知識まで、幅広くカバー。ハイブリッド異業種交流会『クロストーク』のファウンダーとしての顔も持つ。未来を語り合う場を創っていきたいです。