セマンティック検索とは、クエリと文書の「意味的な近さ」に基づいて検索結果を返す手法である。キーワードの文字列一致ではなく、エンベディングによってテキストをベクトル空間に変換し、コサイン類似度などの距離関数で関連度を測る。
従来のキーワード検索(BM25 に代表される Sparse Model)は、クエリに含まれる単語が文書中に出現するかどうかを直接評価する。「自動車」で検索すれば「自動車」を含む文書がヒットするが、「車」や「クルマ」は拾えない。
セマンティック検索は、この制約を超える。テキストをエンベディングモデルで数百〜数千次元のベクトルに変換し、ベクトルデータベース上で近傍探索を行う。「自動車の燃費を改善したい」と「車のガソリン消費を減らす方法」は、語彙はほぼ重複しないが、意味空間では近い位置に写像されるためヒットする。
セマンティック検索が得意なのは、言い換え・同義語・概念レベルの問い合わせだ。「退職手続きの流れ」と「会社を辞めるときにやること」のように、表現が異なるが意図が同じクエリに対して高い再現率を発揮する。社内ナレッジベースや FAQ 検索との相性がよい。
一方、型番(XR-990)・法令番号・プログラムコードのように語彙の完全一致が必要なクエリには弱い。エンベディング空間では「XR-990」と「XR-991」がほぼ同じ位置にマッピングされ、区別がつかないことがある。この弱点を補うために、BM25 と組み合わせるハイブリッド検索が実務で広く採用されている。
RAG(Retrieval-Augmented Generation)では、セマンティック検索が検索フェーズの中核を担う。ユーザーの質問をベクトル化し、外部ナレッジベースから意味的に関連するチャンクを取得して LLM に渡す。このとき検索精度が低いと、LLM は関連のない文書をもとに回答を生成し、ハルシネーションにつながる。
検索品質を高めるための実務上の勘所は、エンベディングモデルの選定(多言語対応が必要か、ドメイン特化が効くか)と、チャンクサイズの設計だ。筆者の経験では、同じモデルでもチャンクを 256 トークンから 512 トークンに変えただけで Recall@10 が 10 ポイント以上動いたことがある。モデルとチャンクはセットで評価するのが鉄則になっている。


A2A(Agent-to-Agent Protocol)とは、異なる AI エージェント同士が能力の発見・タスクの委譲・状態の同期を行うための通信プロトコルであり、Google が 2025 年 4 月に公開した。

AES-256 とは、米国国立標準技術研究所(NIST)が標準化した共通鍵暗号方式 AES(Advanced Encryption Standard)のうち、鍵長 256 ビットを使用する最高強度の暗号アルゴリズムである。

Agent Skills とは、AI エージェントに特定のタスクや専門知識を実行させるために定義された再利用可能な命令セットであり、エージェントの能力を拡張するモジュール単位として機能する。



ハイブリッド検索とは?ベクトル検索×全文検索でRAG精度を上げる仕組みと実装
Agentic AI とは、人間の逐一の指示なしに目標を解釈し、計画の立案・実行・検証を自律的に繰り返す AI システムの総称である。