Agentic RAG とは、LLM がエージェントとして検索クエリの生成・結果の評価・再検索の判断を自律的に繰り返すことで、単純な一問一答型 RAG では得られない回答精度を実現するアーキテクチャである。
## 従来の RAG との違い 標準的な RAG パイプラインは「ユーザーの質問 → ベクトル検索 → 取得した文書を LLM に渡す → 回答生成」という一直線の流れで動く。質問の意図が明確で、必要な情報が1回の検索で取得できる場合はこれで十分だが、実務では1回の検索では必要な情報が揃わないケースが頻繁に発生する。Agentic RAG では LLM 自身が「検索結果が不十分か」「クエリを変えるべきか」を判断し、必要に応じてクエリを書き換えたり別のデータソースに問い合わせたりする。
マルチステップ推論を組み込むことで、複数の情報を段階的に収集・統合して最終回答を組み立てられる。## どんな場面で効果があるか 社内ナレッジベースへの質問を例に考える。「先月の売上トップ3の案件で使われた提案テンプレートはどれか」という質問は、売上データの検索→案件の特定→各案件の提案資料の検索という複数ステップが必要になる。
エージェントがこの分解と逐次検索を担うことで、ユーザーは1回の質問で回答を得られる。ただし、エージェントのループ回数が増えるほどレイテンシとトークンコストが上がる。ループ上限の設定や、途中経過をストリーミングで返す設計が実運用では欠かせない。


RAG(Retrieval-Augmented Generation)とは、外部の知識ソースから関連情報を検索し、その結果を LLM の入力に付加することで、回答の正確性と最新性を向上させる手法である。

Agentic AI とは、人間の逐一の指示なしに目標を解釈し、計画の立案・実行・検証を自律的に繰り返す AI システムの総称である。

Agent Skills とは、AI エージェントに特定のタスクや専門知識を実行させるために定義された再利用可能な命令セットであり、エージェントの能力を拡張するモジュール単位として機能する。


マルチエージェントAIとは?設計パターンから実装・運用の勘所まで
A2A(Agent-to-Agent Protocol)とは、異なる AI エージェント同士が能力の発見・タスクの委譲・状態の同期を行うための通信プロトコルであり、Google が 2025 年 4 月に公開した。