โมเดลข้อมูลที่แสดงเอนทิตีและความสัมพันธ์ในรูปแบบโครงสร้างกราฟ ใช้เพื่อเพิ่มความแม่นยำใน RAG และการค้นหาด้วย AI
## Knowledge Graph คืออะไร Knowledge Graph คือโมเดลข้อมูลที่ใช้แสดงความสัมพันธ์ระหว่าง entity ในโลกความเป็นจริง (เช่น บุคคล องค์กร แนวคิด ผลิตภัณฑ์ เป็นต้น) ในรูปแบบโครงสร้างกราฟที่ประกอบด้วย node และ edge ### ความแตกต่างจาก Relational DB ในขณะที่ Relational DB จัดการข้อมูลด้วยแถวและคอลัมน์ของตาราง Knowledge Graph จะจัดเก็บข้อมูลในรูปแบบ triple (ชุดสามองค์ประกอบ) ที่มีโครงสร้างว่า "ประธาน → กริยา → กรรม" เช่น "โตเกียว → เป็นเมืองหลวงของ → ญี่ปุ่น" ซึ่งเป็นโครงสร้างที่ข้อมูลมีความหมายในตัวเอง โครงสร้างนี้ช่วยให้สามารถประมวลผล query ความสัมพันธ์หลายชั้น เช่น "คู่แข่งของคู่ค้าของบริษัท A คือใคร" ได้อย่างเป็นธรรมชาติผ่านการค้นหาในกราฟ ซึ่งหากใช้ Relational DB จะต้องทำการ join หลายตารางแทน ### การผสานรวมกับ AI Search Knowledge Graph เป็นเทคโนโลยีหลักของ GraphRAG โดยที่ vector search นั้นดึงข้อมูลเอกสารโดยอาศัยความคล้ายคลึงทางความหมายของข้อความ ในทางกลับกัน Knowledge Graph จะดึงองค์ความรู้เชิงโครงสร้างโดยการติดตาม path ระหว่าง entity การผสานทั้งสองแนวทางเข้าด้วยกันคาดว่าจะช่วยลด hallucination และเพิ่มความแม่นยำของ multi-hop reasoning ได้ ### ต้นทุนการสร้าง อุปสรรคที่ใหญ่ที่สุดของ Knowledge Graph คือต้นทุนในการสร้างและบำรุงรักษา แม้ว่าการทำงานอัตโนมัติจะก้าวหน้าขึ้นด้วยการใช้ LLM สำหรับการสกัด entity และการประมาณความสัมพันธ์ แต่ยังคงมีสถานการณ์ที่การตรวจสอบโดยผู้เชี่ยวชาญเป็นสิ่งที่ขาดไม่ได้ เพื่อให้สามารถแปลงระบบองค์ความรู้เฉพาะทางให้อยู่ในรูปแบบกราฟได้อย่างถูกต้อง


RAG (Retrieval-Augmented Generation) คือเทคนิคที่ทำการค้นหาข้อมูลที่เกี่ยวข้องจากแหล่งความรู้ภายนอก แล้วนำผลลัพธ์ที่ได้มาเพิ่มเติมใน input ของ LLM เพื่อเพิ่มความแม่นยำและความทันสมัยของคำตอบ

Gherkin記法 (สัญกรณ์ Gherkin) คือรูปแบบโครงสร้างที่ใช้อธิบายพฤติกรรมของซอฟต์แวร์ในลักษณะภาษาธรรมชาติ โดยแบ่งออกเป็น 3 ขั้นตอน ได้แก่ Given (เงื่อนไขเริ่มต้น), When (การกระทำ) และ Then (ผลลัพธ์) สัญกรณ์นี้ถูกใช้อย่างแพร่หลายในฐานะรูปแบบมาตรฐานของไฟล์ .feature ที่เครื่องมือทดสอบอัตโนมัติ Cucumber ใช้อ่านข้อมูล

ฮาลูซิเนชัน (Hallucination) คือปรากฏการณ์ที่ AI model สร้างข้อมูลที่ไม่มีข้อเท็จจริงรองรับ โดยนำเสนอราวกับว่าเป็นข้อมูลที่ถูกต้อง ซึ่งมีสาเหตุมาจากกลไกที่ LLM ใช้ในการสร้างข้อความที่ "น่าเชื่อถือ" จากรูปแบบของข้อมูลที่ใช้ในการเรียนรู้ และถือว่าเป็นเรื่องยากที่จะกำจัดออกไปได้อย่างสมบูรณ์

Human-in-the-Loop (HITL) คืออะไร? พื้นฐานการออกแบบ "แบบมีมนุษย์ร่วม" เพื่อให้การทำงานอัตโนมัติด้วย AI ยั่งยืน