ຖານຂໍ້ມູນເວັກເຕີ (Vector Database) ແມ່ນຖານຂໍ້ມູນທີ່ເກັບຮັກສາຂໍ້ຄວາມ ແລະ ຮູບພາບເປັນເວັກເຕີຕົວເລກ (Embedding) ແລະ ໃຫ້ບໍລິການຄົ້ນຫາໄວຕາມຄວາມຄ້າຍຄືກັນທາງຄວາມໝາຍ.
ຖານຂໍ້ມູນແບບດັ້ງເດີມຄົ້ນຫາດ້ວຍການຈັບຄູ່ຄຳສຳຄັນ. ຖານຂໍ້ມູນເວັກເຕີທະລຸຂໍ້ຈຳກັດນີ້ ໂດຍແປງຂໍ້ຄວາມເປັນເວັກເຕີຫຼາຍຮ້ອຍມິຕິຜ່ານໂມເດນ Embedding ແລ້ວຄົ້ນຫາຈາກ "ໄລຍະຫ່າງເຊີງຄວາມໝາຍ". ຄວາມຕ້ອງການພຸ່ງສູງຂຶ້ນພ້ອมກັບ RAG. ການນຳໃຊ້ຫຼັກໆ ມີ Pinecone, Weaviate ແລະ pgvector ຂອງ PostgreSQL ເຊິ່ງຖືກລວມເຂົ້າກັບ Supabase. HNSW ຖືກໃຊ້ຢ່າງແຜ່ຫຼາຍເປັນ Algorithm ທຳດັດສະນີ.


Remote Sensing ແມ່ນຄຳສັບລວມທີ່ໃຊ້ເອີ້ນເຕັກໂນໂລຊີທີ່ວັດແທກການສະທ້ອນ ແລະ ການແຜ່ລັງສີຂອງຄື້ນແມ່ເຫຼັກໄຟຟ້າຈາກດາວທຽມ, ອາກາດຍານ, ໂດຣນ ແລະ ອື່ນໆ ທີ່ຕິດຕັ້ງເຊັນເຊີ, ໂດຍບໍ່ຕ້ອງສຳຜັດກັບວັດຖຸໂດຍກົງ, ເພື່ອເກັບກຳ ແລະ ວິເຄາະສະພາບຂອງພື້ນຜິວໂລກ ແລະ ບັນຍາກາດ.

ເອັມເບັດດິງ (Embedding) ແມ່ນເທັກນິກທີ່ແປງຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງ ເຊັ່ນ ຂໍ້ຄວາມ, ຮູບພາບ ແລະ ສຽງ ໃຫ້ເປັນເວັກເຕີຕົວເລກຄວາມຍາວຄົງທີ່ ໂດຍຍັງຮັກສາຄວາມສຳພັນທາງຄວາມໝາຍ.

ຂະໜາດ chunk ແມ່ນຂະໜາດຂອງໜ່ວຍການແບ່ງ (ຈຳນວນ token ຫຼືຈຳນວນຕົວອັກສອນ) ທີ່ໃຊ້ໃນການແບ່ງເອກະສານເພື່ອເກັບໄວ້ໃນ vector store ພາຍໃນ RAG pipeline. ນີ້ແມ່ນ parameter ທີ່ສຳຄັນທີ່ສົ່ງຜົນໂດຍກົງຕໍ່ຄວາມຖືກຕ້ອງຂອງການຄົ້ນຫາ ແລະ ຄຸນນະພາບຂອງຄຳຕອບ.


ວິທີທີ່ອຸດສາຫະກຳການທ່ອງທ່ຽວໄທໃຊ້ AI Chatbot ເພື່ອອັດຕະໂນມັດການຮັບມືກັບນັກທ່ອງທ່ຽວຕ່າງຊາດ

ການຄົ້ນຫາແບບປະສົມ (Hybrid Search) ແມ່ນເທັກນິກທີ່ລວມການຄົ້ນຫາແບບຄຳສຳຄັນ (ເຊັ່ນ BM25) ກັບການຄົ້ນຫາແບບເວັກເຕີ (Semantic Search) ເພື່ອໃຊ້ຈຸດແຂງຂອງທັງສອງວິທີ.