การค้นหาแบบไฮบริด (Hybrid Search) คือเทคนิคที่ผสมผสานการค้นหาแบบคีย์เวิร์ด (เช่น BM25) กับการค้นหาเชิงเวกเตอร์ (Semantic Search) เพื่อใช้จุดแข็งของทั้งสองวิธีในการปรับปรุงความแม่นยำ
ปัจจัยสำคัญที่สุดที่ส่งผลต่อความแม่นยำในการค้นหาของ RAG คือสามารถดึงเอกสารที่เกี่ยวข้องได้ถูกต้องหรือไม่ Vector Search เพียงอย่างเดียวอ่อนแอกับการจับคู่ชื่อเฉพาะอย่าง "ISO 27001" ขณะที่ BM25 เพียงอย่างเดียวไม่สามารถรับมือกับการถอดความเชิงความหมายอย่าง "มาตรฐานสากลด้านความปลอดภัยข้อมูล" ได้ การค้นหาแบบไฮบริดชดเชยจุดอ่อนทั้งสอง รูปแบบการใช้งานที่พบมากที่สุดคือรัน BM25 และ Vector Search แยกกัน จากนั้นรวมผลลัพธ์ด้วย RRF (Reciprocal Rank Fusion) โดยนำค่าผกผันของอันดับจากแต่ละวิธีมาบวกกันเป็นคะแนนสุดท้าย สูตรเรียบง่ายแต่ให้ความแม่นยำสูงกว่าการใช้วิธีค้นหาเดียวอย่างสม่ำเสมอ การผสม pgvector กับ Full-text Search ของ PostgreSQL ทำให้สร้าง Hybrid Search ได้โดยไม่ต้องเพิ่มโครงสร้างพื้นฐาน บน Supabase สามารถมีทั้ง Vector Column และ tsvector Column ในตารางเดียวกัน แล้วคำนวณคะแนนทั้งสองใน SQL การออกแบบ Chunk Size ก็มีผลต่อความแม่นยำ Chunk เล็กเพิ่มความแม่นยำของ Vector Search แต่ BM25 จะสูญเสียบริบท ในทางปฏิบัตินิยมใช้ Chunk ขนาด 500-1000 Token พร้อม Overlap กับบริบทด้านข้าง


RAG (Retrieval-Augmented Generation) คือเทคนิคที่ทำการค้นหาข้อมูลที่เกี่ยวข้องจากแหล่งความรู้ภายนอก แล้วนำผลลัพธ์ที่ได้มาเพิ่มเติมใน input ของ LLM เพื่อเพิ่มความแม่นยำและความทันสมัยของคำตอบ

Agentic RAG คือสถาปัตยกรรมที่ LLM ทำหน้าที่เป็น Agent โดยวนซ้ำกระบวนการสร้าง Query ค้นหา ประเมินผลลัพธ์ และตัดสินใจค้นหาซ้ำอย่างอิสระ เพื่อให้ได้ความแม่นยำของคำตอบที่เหนือกว่า RAG แบบถาม-ตอบทั่วไป

BM25 (Best Matching 25) คือ อัลกอริทึมการค้นคืนสารสนเทศเชิงความน่าจะเป็น ที่ทำการให้คะแนนความเกี่ยวข้องระหว่างเอกสารกับ query โดยพิจารณาจากความถี่ของคำในเอกสารและความยาวของเอกสาร

Human-in-the-Loop (HITL) คืออะไร? พื้นฐานการออกแบบ "แบบมีมนุษย์ร่วม" เพื่อให้การทำงานอัตโนมัติด้วย AI ยั่งยืน

แอมเบียนต์ AI (Ambient AI) หมายถึงระบบ AI ที่ฝังตัวอยู่ในสภาพแวดล้อมของผู้ใช้อย่างถาวร โดยสามารถตรวจสอบข้อมูลจากเซนเซอร์และเหตุการณ์ต่าง ๆ รวมถึงดำเนินการเชิงรุกได้โดยไม่ต้องรอคำสั่งที่ชัดเจนจากผู้ใช้