RAG (Retrieval-Augmented Generation) ແມ່ນເຕັກນິກທີ່ປັບປຸງຄວາມຖືກຕ້ອງ ແລະ ຄວາມທັນສະໄໝຂອງຄຳຕອບ ໂດຍການຄົ້ນຫາຂໍ້ມູນທີ່ກ່ຽວຂ້ອງຈາກແຫຼ່ງຄວາມຮູ້ພາຍນອກ ແລ້ວນຳຜົນລັບທີ່ໄດ້ໄປເພີ່ມໃສ່ໃນ input ຂອງ LLM.
LLM ມີຄວາມຮູ້ພຽງແຕ່ຈົນເຖິງຈຸດທີ່ໄດ້ຮຽນຮູ້ມາເທົ່ານັ້ນ. ນອກຈາກນັ້ນ, ແມ່ນແຕ່ຄວາມຮູ້ທີ່ມີຢູ່, ກໍ່ຍັງສາມາດຕອບຜິດດ້ວຍຄວາມໝັ້ນໃຈ (hallucination). RAG ໄດ້ກາຍເປັນວິທີແກ້ໄຂທາງປະຕິບັດທີ່ໃຊ້ກັນແຜ່ຫຼາຍສຳລັບຈຸດອ່ອນທັງສອງນີ້. ກົນໄກຂອງມັນເຂົ້າໃຈງ່າຍ. ເມື່ອໄດ້ຮັບຄຳຖາມຈາກຜູ້ໃຊ້, ທຳອິດຈະຄົ້ນຫາເອກະສານທີ່ກ່ຽວຂ້ອງຈາກເອກະສານພາຍໃນອົງກອນ ຫຼື knowledge base. ຈາກນັ້ນ, ສົ່ງຜົນການຄົ້ນຫາພ້ອມກັບຄຳຖາມໄປຫາ LLM. LLM ຈະສ້າງຄຳຕອບໂດຍອ້າງອີງໃສ່ເອກະສານທີ່ສົ່ງມາ ບໍ່ພຽງແຕ່ຄວາມຮູ້ຂອງຕົນເອງເທົ່ານັ້ນ. ເນື່ອງຈາກສາມາດລະບຸແຫຼ່ງທີ່ມາໄດ້ຢ່າງຊັດເຈນ, ຈຶ່ງເຮັດໃຫ້ການກວດສອບຄຳຕອບເປັນໄປໄດ້ງ່າຍຂຶ້ນ. ເມື່ອແຍກອົງປະກອບທີ່ປະກອບເປັນ RAG ອອກ, ຈະປະກອບດ້ວຍ: ການປຸງແຕ່ງເອກະສານລ່ວງໜ້າ (chunk splitting), vector embedding, ການຄົ້ນຫາຄວາມຄ້າຍຄືກັນ (semantic search), ແລະ ການຈັດຮູບແບບ input ສຳລັບ LLM. ແຕ່ລະຂັ້ນຕອນມີທາງເລືອກຫຼາຍຢ່າງ, ແລະ ພຽງແຕ່ວິທີການຕັດ chunk ກໍ່ສາມາດສົ່ງຜົນຕໍ່ຄຸນນະພາບຂອງຄຳຕອບໄດ້ຢ່າງຫຼວງຫຼາຍ. ການເລືອກໃຊ້ລະຫວ່າງ RAG ກັບ fine-tuning ເປັນຫົວຂໍ້ທີ່ຖືກຖົກຖຽງກັນເລື້ອຍໆ, ແຕ່ທັງສອງມີບົດບາດທີ່ແຕກຕ່າງກັນ. RAG ແມ່ນວິທີ "ໃຫ້ໂມເດລອ້າງອີງຄວາມຮູ້ພາຍນອກ", ໃນຂະນະທີ່ fine-tuning ແມ່ນວິທີ "ປັບພຶດຕິກຳ ແລະ ໂທນຂອງໂມເດລ". ຖ້າຕ້ອງການໃຫ້ຕອບເນື້ອຫາຂອງຄູ່ມືພາຍໃນອົງກອນໄດ້ຢ່າງຖືກຕ້ອງ, RAG ຄືຈຸດເລີ່ມຕົ້ນທີ່ເໝາະສົມ; ຖ້າຕ້ອງການໃຫ້ຮູບແບບ ແລະ ສຳນວນຂອງຄຳຕອບເປັນເອກະພາບ, fine-tuning ຄືທາງເລືອກທີ່ຄວນພິຈາລະນາ. ໂຄງການຫຼາຍໆໂຄງການກໍ່ໃຊ້ທັງສອງວິທີຮ່ວມກັນ.


Agentic RAG ແມ່ນສະຖາປັດຕະຍະກຳທີ່ LLM ເຮັດໜ້າທີ່ເປັນ agent ໂດຍການສ້າງ query ການຄົ້ນຫາ, ປະເມີນຜົນລັບ, ແລະຕັດສິນໃຈຄົ້ນຫາຄືນໃໝ່ຢ່າງອັດຕະໂນມັດຊ້ຳໆ ເພື່ອບັນລຸຄວາມຖືກຕ້ອງຂອງຄຳຕອບທີ່ RAG ແບບຖາມ-ຕອບທຳມະດາບໍ່ສາມາດໃຫ້ໄດ້.

ການວິສະວະກຳ Prompt ແມ່ນເຕັກນິກການອອກແບບໂຄງສ້າງ, ການສະແດງອອກ, ແລະ ບໍລິບົດຂອງຂໍ້ຄວາມນຳເຂົ້າ (Prompt) ເພື່ອດຶງເອົາຜົນລັບທີ່ຕ້ອງການຈາກ LLM (Large Language Model - ໂມເດລພາສາຂະໜາດໃຫຍ່).

LLM (Large Language Model) ແມ່ນຊື່ເອີ້ນລວມຂອງໂມເດລ neural network ທີ່ມີພາລາມິເຕີຈຳນວນຫຼາຍພັນລ້ານຫາຫຼາຍລ້ານລ້ານຕົວ ຊຶ່ງໄດ້ຮັບການຝຶກອົບຮົມລ່ວງໜ້າດ້ວຍຂໍ້ມູນຂໍ້ຄວາມຈຳນວນຫຼວງຫຼາຍ ແລະ ສາມາດເຂົ້າໃຈ ແລະ ສ້າງພາສາທຳມະຊາດໄດ້ດ້ວຍຄວາມຖືກຕ້ອງສູງ.

ຖານຂໍ້ມູນ Vector ແມ່ນຫຍັງ? ຄູ່ມືຄົບຖ້ວນກ່ຽວກັບວິທີການເຮັດວຽກ, ການປຽບທຽບຜະລິດຕະພັນຊັ້ນນຳ, ແລະ ການນຳໃຊ້ RAG

ເຕັກນິກການໂຈມຕີທີ່ໃຊ້ການປ້ອນຂໍ້ມູນທີ່ເປັນອັນຕະລາຍເພື່ອຄວບຄຸມການເຮັດວຽກຂອງ LLM ໃຫ້ໄປໃນທິດທາງທີ່ບໍ່ໄດ້ຕັ້ງໃຈ. ຖືກຈັດປະເພດເປັນຄວາມສ່ຽງສຳຄັນທີ່ສຸດໃນ OWASP LLM Top 10.