ハイブリッド検索
はいぶりっどけんさく

ハイブリッド検索とは、キーワードベースの全文検索(BM25 等)とベクトル検索(セマンティック検索)を組み合わせ、両者の長所を活かして検索精度を向上させる手法である。
RAG の検索精度を左右する最大の要因は、関連文書を正しく取得できるかどうかだ。ベクトル検索だけでは「ISO 27001」のような固有名詞の完全一致に弱く、BM25 だけでは「情報セキュリティの国際規格」のような意味的な言い換えに対応できない。ハイブリッド検索はこの二つの弱点を相互に補完する。
実装パターンはいくつかあるが、最も一般的なのは BM25 とベクトル検索をそれぞれ実行し、結果を RRF(Reciprocal Rank Fusion)で統合する方式だ。各検索手法が返すランキングの逆数を足し合わせ、最終スコアとしてリランキングする。数式は単純だが、単独の検索手法より一貫して高い精度を示すことが実証されている。
pgvector + PostgreSQL の全文検索を組み合わせれば、追加のインフラなしでハイブリッド検索を実現できる。Supabase 上では、ベクトルカラムと tsvector カラムを同一テーブルに持ち、SQL の中で両方のスコアを計算して統合するアプローチが実用的だ。
チャンクサイズの設計も精度に影響する。小さなチャンクはベクトル検索の精度を高めるが、BM25 では文脈が失われやすい。実務では 500〜1000 トークン程度のチャンクに、前後の文脈をオーバーラップさせる設計が多い。
関連用語

AI ROI(AI投資対効果)
AI ROIとは、AI導入・運用に投じたコストに対して得られた業務効率化・収益改善などの効果を定量的に測定する指標のこと。

AIオブザーバビリティ(AI Observability)
本番稼働中のAIシステムの入出力・レイテンシ・コスト・品質を継続的に監視・可視化する運用プラクティス。ハルシネーションやドリフトの早期検出に不可欠。

BPO(ビジネス・プロセス・アウトソーシング)
BPOとは、企業が特定の業務プロセスを外部の専門業者に委託するアウトソーシング形態のこと。AI活用による自動化と組み合わせたAIハイブリッドBPOが近年注目されている。

ERP(エンタープライズ・リソース・プランニング)
ERP(エンタープライズ・リソース・プランニング)とは、財務・購買・製造・人事などの基幹業務データを一元管理し、経営意思決定を支援する統合型業務管理システムのこと。