RAG(Retrieval-Augmented Generation)
らぐ

RAG(Retrieval-Augmented Generation)とは、外部の知識ソースから関連情報を検索し、その結果を LLM の入力に付加することで、回答の正確性と最新性を向上させる手法である。
LLM は学習時点までの知識しか持たない。そして、持っている知識でも自信満々に間違えることがある(ハルシネーション)。RAG はこの二つの弱点に対する実務的な対処法として定着した。
仕組みは直感的だ。ユーザーの質問を受け取ったら、まず社内ドキュメントやナレッジベースから関連する文書を検索する。次に、検索結果を質問と一緒に LLM へ渡す。LLM は自分の知識だけでなく、渡された文書を根拠にして回答を生成する。出典を明示することもできるため、回答の検証が容易になる。
RAG を構成する要素を分解すると、文書の前処理(チャンク分割)、ベクトル埋め込み、類似度検索(セマンティック検索)、そして LLM への入力構成になる。各ステップに選択肢があり、チャンクの切り方一つで回答品質が大きく変わる。
ファインチューニングとの使い分けは頻繁に議論されるが、役割が違う。RAG は「外部の知識を参照させる」手法で、ファインチューニングは「モデルの振る舞いやトーンを調整する」手法だ。社内マニュアルの内容を正確に答えさせたいなら RAG、回答の形式や文体を統一したいならファインチューニング、が出発点として妥当だろう。両者を併用するプロジェクトも多い。
関連用語

AI ROI(AI投資対効果)
AI ROIとは、AI導入・運用に投じたコストに対して得られた業務効率化・収益改善などの効果を定量的に測定する指標のこと。

AIオブザーバビリティ(AI Observability)
本番稼働中のAIシステムの入出力・レイテンシ・コスト・品質を継続的に監視・可視化する運用プラクティス。ハルシネーションやドリフトの早期検出に不可欠。

BPO(ビジネス・プロセス・アウトソーシング)
BPOとは、企業が特定の業務プロセスを外部の専門業者に委託するアウトソーシング形態のこと。AI活用による自動化と組み合わせたAIハイブリッドBPOが近年注目されている。

ERP(エンタープライズ・リソース・プランニング)
ERP(エンタープライズ・リソース・プランニング)とは、財務・購買・製造・人事などの基幹業務データを一元管理し、経営意思決定を支援する統合型業務管理システムのこと。