ການຄົ້ນຫາແບບປະສົມ

ການຄົ້ນຫາແບບປະສົມ

ການຄົ້ນຫາແບບປະສົມ (Hybrid Search) ແມ່ນເທັກນິກທີ່ລວມການຄົ້ນຫາແບບຄຳສຳຄັນ (ເຊັ່ນ BM25) ກັບການຄົ້ນຫາແບບເວັກເຕີ (Semantic Search) ເພື່ອໃຊ້ຈຸດແຂງຂອງທັງສອງວິທີ.

ປັດໃຈສຳຄັນທີ່ສົ່ງຜົນຕໍ່ຄວາມແມ່ນຢຳໃນການຄົ້ນຫາຂອງ RAG ຄືການດຶງເອກະສານທີ່ກ່ຽວຂ້ອງໄດ້ຖືກຕ້ອງ. Vector Search ອ່ອນກັບການຈັບຄູ່ຊື່ສະເພາະ ຂະນະທີ່ BM25 ບໍ່ສາມາດຮັບມືກັບການຖອດຄວາມ. ການຄົ້ນຫາແບບປະສົມຊົດເຊີຍຈຸດອ່ອນທັງສອງ. ຮູບແບບທີ່ໃຊ້ຫຼາຍທີ່ສຸດຄື RRF (Reciprocal Rank Fusion). pgvector ກັບ Full-text Search ຂອງ PostgreSQL ສ້າງ Hybrid Search ໄດ້ໂດຍບໍ່ຕ້ອງເພີ່ມໂຄງສ້າງ. ການອອກແບບ Chunk Size ກໍ່ມີຜົນ ໃນການປະຕິບັດນິຍົມໃຊ້ Chunk 500-1000 Token ພ້ອມ Overlap.