RAG (Retrieval-Augmented Generation) คือเทคนิคที่ทำการค้นหาข้อมูลที่เกี่ยวข้องจากแหล่งความรู้ภายนอก แล้วนำผลลัพธ์ที่ได้มาเพิ่มเติมใน input ของ LLM เพื่อเพิ่มความแม่นยำและความทันสมัยของคำตอบ
LLM มีความรู้เพียงแค่ช่วงเวลาที่ผ่านการเรียนรู้มาเท่านั้น และแม้แต่ความรู้ที่มีอยู่ก็อาจให้คำตอบที่ผิดพลาดอย่างมั่นใจได้ (Hallucination) RAG ได้กลายเป็นแนวทางปฏิบัติที่ใช้รับมือกับจุดอ่อนทั้งสองประการนี้ กลไกการทำงานนั้นเข้าใจได้ง่าย เมื่อรับคำถามจากผู้ใช้ ระบบจะค้นหาเอกสารที่เกี่ยวข้องจากเอกสารภายในองค์กรหรือ Knowledge Base ก่อน จากนั้นจึงส่งผลลัพธ์ที่ค้นหาได้พร้อมกับคำถามไปยัง LLM LLM จะสร้างคำตอบโดยอ้างอิงจากเอกสารที่ได้รับมา ไม่ใช่เพียงแค่ความรู้ของตัวเองเท่านั้น นอกจากนี้ยังสามารถระบุแหล่งที่มาได้อย่างชัดเจน ทำให้การตรวจสอบคำตอบทำได้ง่ายขึ้น เมื่อแยกองค์ประกอบของ RAG ออกมา จะประกอบด้วยการประมวลผลเอกสารล่วงหน้า (Chunk Splitting), Vector Embedding, การค้นหาความคล้ายคลึง (Semantic Search) และการจัดโครงสร้าง Input สำหรับ LLM แต่ละขั้นตอนมีตัวเลือกที่แตกต่างกัน และเพียงแค่วิธีการแบ่ง Chunk ก็สามารถส่งผลต่อคุณภาพของคำตอบได้อย่างมาก การเลือกใช้ระหว่าง RAG กับ Fine-tuning เป็นหัวข้อที่ถูกพูดถึงบ่อยครั้ง แต่ทั้งสองมีบทบาทที่แตกต่างกัน RAG คือวิธีการ "ให้โมเดลอ้างอิงความรู้จากภายนอก" ในขณะที่ Fine-tuning คือวิธีการ "ปรับพฤติกรรมและโทนของโมเดล" หากต้องการให้ตอบเนื้อหาจากคู่มือภายในองค์กรได้อย่างแม่นยำ RAG เป็นจุดเริ่มต้นที่เหมาะสม และหากต้องการให้รูปแบบหรือสไตล์การตอบมีความสม่ำเสมอ Fine-tuning ก็เป็นตัวเลือกที่เหมาะสมกว่า โปรเจกต์จำนวนมากก็ใช้ทั้งสองวิธีร่วมกัน


Agentic RAG คือสถาปัตยกรรมที่ LLM ทำหน้าที่เป็น Agent โดยวนซ้ำกระบวนการสร้าง Query ค้นหา ประเมินผลลัพธ์ และตัดสินใจค้นหาซ้ำอย่างอิสระ เพื่อให้ได้ความแม่นยำของคำตอบที่เหนือกว่า RAG แบบถาม-ตอบทั่วไป

สถาปัตยกรรม RAG รุ่นถัดไปที่ผสมผสาน Knowledge Graph และการค้นหาแบบ Vector เข้าด้วยกัน โดยใช้ประโยชน์จากความสัมพันธ์ระหว่าง Entity เพื่อเพิ่มความแม่นยำในการค้นหา

โมเดลข้อมูลที่แสดงเอนทิตีและความสัมพันธ์ในรูปแบบโครงสร้างกราฟ ใช้เพื่อเพิ่มความแม่นยำใน RAG และการค้นหาด้วย AI

ฐานข้อมูลเวกเตอร์คืออะไร? อธิบายครบจบ ตั้งแต่หลักการทำงาน เปรียบเทียบผลิตภัณฑ์หลัก ไปจนถึงการใช้งาน RAG

ข้อมูลสำหรับการฝึกอบรมที่สร้างขึ้นโดย AI ใช้เพื่อชดเชยการขาดแคลนข้อมูลจริง และนำไปใช้ในการเรียนรู้และประเมินผลโมเดลในขณะที่ปกป้องความเป็นส่วนตัว