
Agentic RAG
Agentic RAG ແມ່ນສະຖາປັດຕະຍະກຳທີ່ LLM ເຮັດໜ້າທີ່ເປັນ agent ໂດຍການສ້າງ query ການຄົ້ນຫາ, ປະເມີນຜົນລັບ, ແລະຕັດສິນໃຈຄົ້ນຫາຄືນໃໝ່ຢ່າງອັດຕະໂນມັດຊ້ຳໆ ເພື່ອບັນລຸຄວາມຖືກຕ້ອງຂອງຄຳຕອບທີ່ RAG ແບບຖາມ-ຕອບທຳມະດາບໍ່ສາມາດໃຫ້ໄດ້.
ຄຳອະທິບາຍທີ່ເຂົ້າໃຈງ່າຍກ່ຽວກັບຄຳສັບ AI, DX ແລະ ເທັກໂນໂລຢີ

Agentic RAG ແມ່ນສະຖາປັດຕະຍະກຳທີ່ LLM ເຮັດໜ້າທີ່ເປັນ agent ໂດຍການສ້າງ query ການຄົ້ນຫາ, ປະເມີນຜົນລັບ, ແລະຕັດສິນໃຈຄົ້ນຫາຄືນໃໝ່ຢ່າງອັດຕະໂນມັດຊ້ຳໆ ເພື່ອບັນລຸຄວາມຖືກຕ້ອງຂອງຄຳຕອບທີ່ RAG ແບບຖາມ-ຕອບທຳມະດາບໍ່ສາມາດໃຫ້ໄດ້.

BM25 (Best Matching 25) ແມ່ນ algorithm ການຄົ້ນຫາຂໍ້ມູນແບບຄວາມເປັນໄປໄດ້ທີ່ໃຊ້ການໃຫ້ຄະແນນຄວາມກ່ຽວຂ້ອງກັບ query ໂດຍພິຈາລະນາຄວາມຖີ່ຂອງການປາກົດຂຶ້ນຂອງຄຳສັບໃນເອກະສານ ແລະ ຄວາມຍາວຂອງເອກະສານ.

Gemini Embedding 2 ແມ່ນໂມເດລ embedding ທີ່ຮອງຮັບ multimodal ທີ່ພັດທະນາໂດຍ Google ສາມາດແປງຂໍ້ຄວາມ, ຮູບພາບ, ວິດີໂອ, ສຽງ ແລະເອກະສານໃຫ້ເປັນພື້ນທີ່ vector ດຽວກັນໄດ້.

ສະຖາປັດຕະຍະກຳ RAG ລຸ້ນໃໝ່ທີ່ລວມເອົາ Knowledge Graph ແລະ Vector Search ເຂົ້າດ້ວຍກັນ ເພື່ອນຳໃຊ້ຄວາມສຳພັນລະຫວ່າງ Entity ໃນການປັບປຸງຄວາມຖືກຕ້ອງຂອງການຄົ້ນຫາ.

RAG (Retrieval-Augmented Generation) ແມ່ນເຕັກນິກທີ່ປັບປຸງຄວາມຖືກຕ້ອງ ແລະ ຄວາມທັນສະໄໝຂອງຄຳຕອບ ໂດຍການຄົ້ນຫາຂໍ້ມູນທີ່ກ່ຽວຂ້ອງຈາກແຫຼ່ງຄວາມຮູ້ພາຍນອກ ແລ້ວນຳຜົນລັບທີ່ໄດ້ໄປເພີ່ມໃສ່ໃນ input ຂອງ LLM.

RRF (Reciprocal Rank Fusion) ແມ່ນວິທີການໃຫ້ຄະແນນທີ່ລວມເອົາຜົນລັດຂອງການຈັດອັນດັບຈາກຫຼາຍວິທີການຄົ້ນຫາເຂົ້າດ້ວຍກັນ. ໂດຍການບວກຄ່າສ່ວນກັບຂອງອັນດັບໃນແຕ່ລະວິທີການ, ສາມາດລວມລະບົບຄະແນນທີ່ແຕກຕ່າງກັນໄດ້ໂດຍບໍ່ຕ້ອງຜ່ານການ normalization.

ຮູບແບບຂໍ້ມູນທີ່ສະແດງ entity ແລະ ຄວາມສຳພັນຂອງມັນໃນໂຄງສ້າງກຣາຟ. ຖືກນຳໃຊ້ເພື່ອເພີ່ມຄວາມຖືກຕ້ອງຂອງ RAG ແລະ ການຄົ້ນຫາດ້ວຍ AI.

ການຄົ້ນຫາແບບປະສົມ (Hybrid Search) ແມ່ນເທັກນິກທີ່ລວມການຄົ້ນຫາແບບຄຳສຳຄັນ (ເຊັ່ນ BM25) ກັບການຄົ້ນຫາແບບເວັກເຕີ (Semantic Search) ເພື່ອໃຊ້ຈຸດແຂງຂອງທັງສອງວິທີ.

ຂະໜາດ chunk ແມ່ນຂະໜາດຂອງໜ່ວຍການແບ່ງ (ຈຳນວນ token ຫຼືຈຳນວນຕົວອັກສອນ) ທີ່ໃຊ້ໃນການແບ່ງເອກະສານເພື່ອເກັບໄວ້ໃນ vector store ພາຍໃນ RAG pipeline. ນີ້ແມ່ນ parameter ທີ່ສຳຄັນທີ່ສົ່ງຜົນໂດຍກົງຕໍ່ຄວາມຖືກຕ້ອງຂອງການຄົ້ນຫາ ແລະ ຄຸນນະພາບຂອງຄຳຕອບ.

ຖານຂໍ້ມູນເວັກເຕີ (Vector Database) ແມ່ນຖານຂໍ້ມູນທີ່ເກັບຮັກສາຂໍ້ຄວາມ ແລະ ຮູບພາບເປັນເວັກເຕີຕົວເລກ (Embedding) ແລະ ໃຫ້ບໍລິການຄົ້ນຫາໄວຕາມຄວາມຄ້າຍຄືກັນທາງຄວາມໝາຍ.

ເອັມເບັດດິງ (Embedding) ແມ່ນເທັກນິກທີ່ແປງຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງ ເຊັ່ນ ຂໍ້ຄວາມ, ຮູບພາບ ແລະ ສຽງ ໃຫ້ເປັນເວັກເຕີຕົວເລກຄວາມຍາວຄົງທີ່ ໂດຍຍັງຮັກສາຄວາມສຳພັນທາງຄວາມໝາຍ.
