Agentic RAG（エージェンティックラグ）とは？

Agentic RAG

エージェンティックラグ

更新日:2026年3月11日作成日:2026年3月11日

Agentic RAG とは、LLM がエージェントとして検索クエリの生成・結果の評価・再検索の判断を自律的に繰り返すことで、単純な一問一答型 RAG では得られない回答精度を実現するアーキテクチャである。

従来の RAG との違い

標準的な RAG パイプラインは「ユーザーの質問 → ベクトル検索 → 取得した文書を LLM に渡す → 回答生成」という一直線の流れで動く。質問の意図が明確で、必要な情報が1回の検索で取得できる場合はこれで十分だが、実務では1回の検索では必要な情報が揃わないケースが頻繁に発生する。

Agentic RAG では LLM 自身が「検索結果が不十分か」「クエリを変えるべきか」を判断し、必要に応じてクエリを書き換えたり別のデータソースに問い合わせたりする。マルチステップ推論を組み込むことで、複数の情報を段階的に収集・統合して最終回答を組み立てられる。

社内ナレッジベースへの質問を例に考える。「先月の売上トップ3の案件で使われた提案テンプレートはどれか」という質問は、売上データの検索→案件の特定→各案件の提案資料の検索という複数ステップが必要になる。エージェントがこの分解と逐次検索を担うことで、ユーザーは1回の質問で回答を得られる。

ただし、エージェントのループ回数が増えるほどレイテンシとトークンコストが上がる。ループ上限の設定や、途中経過をストリーミングで返す設計が実運用では欠かせない。