RAG (การสร้างข้อความเสริมด้วยการดึงข้อมูล)とは？

RAG (การสร้างข้อความเสริมด้วยการดึงข้อมูล)

Updated:9 มีนาคม 2569Published:7 มีนาคม 2569

RAG (Retrieval-Augmented Generation) คือเทคนิคที่ทำการค้นหาข้อมูลที่เกี่ยวข้องจากแหล่งความรู้ภายนอก แล้วนำผลลัพธ์ที่ได้มาเพิ่มเติมใน input ของ LLM เพื่อเพิ่มความแม่นยำและความทันสมัยของคำตอบ

LLM มีความรู้เพียงแค่ช่วงเวลาที่ผ่านการเรียนรู้มาเท่านั้น และแม้แต่ความรู้ที่มีอยู่ก็อาจให้คำตอบที่ผิดพลาดอย่างมั่นใจได้ (Hallucination) RAG ได้กลายเป็นแนวทางปฏิบัติที่ใช้รับมือกับจุดอ่อนทั้งสองประการนี้

กลไกการทำงานนั้นเข้าใจได้ง่าย เมื่อรับคำถามจากผู้ใช้ ระบบจะค้นหาเอกสารที่เกี่ยวข้องจากเอกสารภายในองค์กรหรือ Knowledge Base ก่อน จากนั้นจึงส่งผลลัพธ์ที่ค้นหาได้พร้อมกับคำถามไปยัง LLM LLM จะสร้างคำตอบโดยอ้างอิงจากเอกสารที่ได้รับมา ไม่ใช่เพียงแค่ความรู้ของตัวเองเท่านั้น นอกจากนี้ยังสามารถระบุแหล่งที่มาได้อย่างชัดเจน ทำให้การตรวจสอบคำตอบทำได้ง่ายขึ้น

เมื่อแยกองค์ประกอบของ RAG ออกมา จะประกอบด้วยการประมวลผลเอกสารล่วงหน้า (Chunk Splitting), Vector Embedding, การค้นหาความคล้ายคลึง (Semantic Search) และการจัดโครงสร้าง Input สำหรับ LLM แต่ละขั้นตอนมีตัวเลือกที่แตกต่างกัน และเพียงแค่วิธีการแบ่ง Chunk ก็สามารถส่งผลต่อคุณภาพของคำตอบได้อย่างมาก

การเลือกใช้ระหว่าง RAG กับ Fine-tuning เป็นหัวข้อที่ถูกพูดถึงบ่อยครั้ง แต่ทั้งสองมีบทบาทที่แตกต่างกัน RAG คือวิธีการ "ให้โมเดลอ้างอิงความรู้จากภายนอก" ในขณะที่ Fine-tuning คือวิธีการ "ปรับพฤติกรรมและโทนของโมเดล" หากต้องการให้ตอบเนื้อหาจากคู่มือภายในองค์กรได้อย่างแม่นยำ RAG เป็นจุดเริ่มต้นที่เหมาะสม และหากต้องการให้รูปแบบหรือสไตล์การตอบมีความสม่ำเสมอ Fine-tuning ก็เป็นตัวเลือกที่เหมาะสมกว่า โปรเจกต์จำนวนมากก็ใช้ทั้งสองวิธีร่วมกัน

RAG (การสร้างข้อความเสริมด้วยการดึงข้อมูล)

คำศัพท์ที่เกี่ยวข้อง

AI ROI (ผลตอบแทนจากการลงทุนด้าน AI)

AI พยากรณ์ความต้องการ (Demand Forecasting AI)

AI ออบเซอร์แวนบิลิตี้ (AI Observability)

BPO (การจ้างภายนอกเพื่อดำเนินกระบวนการทางธุรกิจ)