ໜ້າຕ່າງບໍລິບົດ (Context Window)

ໜ້າຕ່າງບໍລິບົດ (Context Window)

Context window ແມ່ນຂີດຈຳກັດຂອງຈຳນວນ Token ທີ່ LLM ສາມາດປະມວນຜົນໄດ້ໃນຄັ້ງດຽວ, ເຊິ່ງໝາຍເຖິງຄວາມຍາວສູງສຸດຂອງ Input prompt ແລະ Output ລວມກັນ. ມັນສົ່ງຜົນໂດຍກົງຕໍ່ຄຸນນະພາບຂອງການປະມວນຜົນເອກະສານຍາວໆ ແລະ ການສົນທະນາແບບຫຼາຍຮອບ (Multi-turn conversation).

Context Window (ຄອນເທັກວິນໂດ) ແມ່ນຂີດຈຳກັດຂອງຈຳນວນ Token ທີ່ LLM ສາມາດຈັດການໄດ້ໃນການປະມວນຜົນການອະນຸມານ (Inference) ຄັ້ງດຽວ, ເຊິ່ງໝາຍເຖິງຄວາມຍາວສູງສຸດລວມກັນລະຫວ່າງ Prompt ທີ່ປ້ອນເຂົ້າ ແລະ ຜົນລັພທີ່ອອກມາ. ຂໍ້ຄວາມທີ່ເກີນຂີດຈຳກັດນີ້ຈະເຮັດໃຫ້ຕົວແບບ "ເບິ່ງບໍ່ເຫັນ", ສະນັ້ນມັນຈຶ່ງເປັນພາຣາມິເຕີທີ່ສຳຄັນທີ່ມີຜົນໂດຍກົງຕໍ່ຄວາມຖືກຕ້ອງໃນການປະມວນຜົນເອກະສານຍາວໆ ແລະ ຄຸນນະພາບຂອງການສົນທະນາແບບຫຼາຍຮອບ (Multi-turn conversation).

ເປັນຫຍັງ Context Window ຈຶ່ງສຳຄັນ?

LLM (Large Language Model) ຈະແບ່ງຂໍ້ຄວາມອອກເປັນໜ່ວຍທີ່ເອີ້ນວ່າ Token ເພື່ອປະມວນຜົນ. Context Window ເປຽບສະເໝືອນ "ພາຊະນະ" ບັນຈຸຈຳນວນ Token ເຫຼົ່ານີ້, ຖ້າພາຊະນະນ້ອຍກໍຈະບໍ່ສາມາດອ່ານເອກະສານຍາວໆໄດ້ໃນຄັ້ງດຽວ, ແຕ່ຖ້າພາຊະນະໃຫຍ່ກໍຈະສາມາດອ້າງອີງຂໍ້ມູນທີ່ກວ້າງຂວາງກວ່າໃນຂະນະທີ່ອະນຸມານ.

ຜົນກະທົບໃນທາງປະຕິບັດສາມາດສະຫຼຸບໄດ້ 2 ປະການດັ່ງນີ້:

  • ຄວາມສາມາດໃນການປະມວນຜົນຂໍ້ຄວາມຍາວ: ປ່ຽນແປງຄວາມສາມາດໃນການປ້ອນຂໍ້ມູນຈຳນວນຫຼາຍໝື່ນເຖິງຫຼາຍແສນ Token ໃນຄັ້ງດຽວ ເຊັ່ນ: ເອກະສານທາງກົດໝາຍ, ລາຍງານທາງການເງິນ, ຫຼື Repository ຂອງ Source Code ທັງໝົດ.
  • ຄວາມຕໍ່ເນື່ອງຂອງການສົນທະນາ: ຄວາມສາມາດຂອງ Chatbot ຫຼື AI Agent ໃນການ "ຈື່ຈຳ" ປະຫວັດການສົນທະນາໄດ້ຫຼາຍໜ້ອຍພຽງໃດ ຂຶ້ນຢູ່ກັບຂະໜາດຂອງ Context Window.

ຕົວແບບໃນປັດຈຸບັນມີບາງຕົວທີ່ມີ Context Window ຂະໜາດຫຼາຍແສນເຖິງໜຶ່ງລ້ານ Token, ແລະຕົວແບບຫຼັກໆຢ່າງ GPT, Claude, ແລະ Gemini ກໍມີການກຳນົດຂີດຈຳກັດທີ່ແຕກຕ່າງກັນ.

ກົນໄກທາງເຕັກນິກ ແລະ ຂໍ້ຈຳກັດ

ຂະໜາດຂອງ Context Window ມີຄວາມກ່ຽວຂ້ອງຢ່າງໃກ້ຊິດກັບສະຖາປັດຕະຍະກຳຂອງຕົວແບບ, ໂດຍສະເພາະການອອກແບບກົນໄກ Attention. ເນື່ອງຈາກ Transformer ຄຳນວນ Self-Attention ຕໍ່ກັບຂໍ້ມູນປ້ອນເຂົ້າທັງໝົດ, ເມື່ອຈຳນວນ Token ເພີ່ມຂຶ້ນ, ປະລິມານການຄຳນວນ ແລະ ການໃຊ້ໜ່ວຍຄວາມຈຳ GPU (Graphics Processing Unit) ຈະເພີ່ມຂຶ້ນຢ່າງມະຫາສານ. ນີ້ຄືເຫດຜົນພື້ນຖານທີ່ເຮັດໃຫ້ບໍ່ສາມາດຂະຫຍາຍ Window ໄດ້ຢ່າງບໍ່ຈຳກັດ.

ນອກຈາກນີ້, ຍັງມີການວິໄຈຊີ້ໃຫ້ເຫັນວ່າ ເຖິງແມ່ນວ່າ Context Window ຈະໃຫຍ່ ແຕ່ກໍມີແນວໂນ້ມທີ່ຈະ "ເບິ່ງຂ້າມຂໍ້ມູນທີ່ຢູ່ບໍລິເວນກາງຂອງ Window". ຂໍ້ມູນທີ່ຢູ່ຕົ້ນ ແລະ ທ້າຍຂອງບໍລິບົດຍາວໆຈະຖືກຈື່ຈຳໄດ້ງ່າຍກວ່າ, ເຊິ່ງເປັນບັນຫາທີ່ຮູ້ຈັກກັນໃນຊື່ "Lost in the Middle". ການຕັດສິນຄຸນນະພາບການປະມວນຜົນໂດຍເບິ່ງພຽງແຕ່ຕົວເລກຂອງ Context Window ນັ້ນມີຄວາມສ່ຽງ, ຈຳເປັນຕ້ອງປະເມີນຄຽງຄູ່ກັບຄວາມສ່ຽງຂອງ Hallucination.

ຄວາມສຳພັນກັບ RAG ແລະ Agent

ວິທີການຫຼັກໃນການແກ້ໄຂຂໍ້ຈຳກັດຂອງ Context Window ຄື RAG (Retrieval-Augmented Generation). ແທນທີ່ຈະຍັດເອກະສານທັງໝົດລົງໃນ Window, ການຄົ້ນຫາຂໍ້ມູນທີ່ຈຳເປັນແລ້ວປ້ອນເຂົ້າໄປແບບໄດນາມິກຈະຊ່ວຍຂະຫຍາຍຂອບເຂດການອ້າງອີງຕົວຈິງໄດ້. ການອອກແບບ Chunk Size ມີຄວາມສຳຄັນເປັນພິເສດໃນບໍລິບົດນີ້, ຖ້າ 1 Chunk ໃຫຍ່ເກີນໄປກໍຈະກົດດັນ Window, ແລະຖ້ານ້ອຍເກີນໄປກໍຈະເຮັດໃຫ້ບໍລິບົດຂາດຕອນ.

ໃນ AI Agent ແລະ Multi-agent System, ການອອກແບບໃຫ້ຫຼາຍ Agent ຮ່ວມມືກັນແບ່ງງານກັນເຮັດ ເພື່ອໃຫ້ສາມາດປະມວນຜົນວຽກທີ່ຍາວນານເກີນຂີດຈຳກັດຂອງຕົວແບບດຽວໄດ້ນັ້ນ ກໍກຳລັງກາຍເປັນເລື່ອງປົກກະຕິ. ແນວຄິດທີ່ເອີ້ນວ່າ Context Engineering ກໍກຳລັງໄດ້ຮັບຄວາມສົນໃຈ ແລະ ຖືກຈັດລະບົບເປັນເຕັກນິກໃນການອອກແບບຢ່າງມີຍຸດທະສາດວ່າ ຄວນໃສ່ຫຍັງລົງໃນ Window ທີ່ຈຳກັດ ແລະ ໃສ່ໃນລຳດັບໃດ.

ຂໍ້ຄວນລະວັງໃນການນຳໄປໃຊ້ງານ

ຈຸດທີ່ມັກຈະຖືກເບິ່ງຂ້າມໃນເວລາຈັດການກັບ Context Window ຄື ຜົນລວມຂອງຂໍ້ມູນປ້ອນເຂົ້າ ແລະ ຜົນລັພ. ຕົວຢ່າງເຊັ່ນ: ຖ້າໃຊ້ຕົວແບບທີ່ມີ Window 128,000 Token ແລ້ວປ້ອນ Prompt 120,000 Token ເຂົ້າໄປ, ຜົນລັພທີ່ຈະອອກມາໄດ້ຈະຖືກຈຳກັດຢູ່ທີ່ 8,000 Token ທີ່ເຫຼືອເທົ່ານັ້ນ. ໃນກໍລະນີທີ່ຕ້ອງການຜົນລັພຍາວໆ ເຊັ່ນ: ການໃຊ້ Reasoning Model ເພື່ອເຮັດ Multi-step Reasoning ຫຼື ວຽກງານສ້າງ Code ຢ່າງ Claude Code, ການອອກແບບພື້ນທີ່ຫວ່າງສຳລັບ Output Token ຈະເປັນຕົວຕັດສິນຄຸນນະພາບ.

Context Window ບໍ່ແມ່ນຕົວຊີ້ວັດງ່າຍໆທີ່ວ່າ "ໃຫຍ່ກວ່າຄືດີກວ່າ", ແຕ່ການນຳໄປໃຊ້ຢ່າງເໝາະສົມໂດຍພິຈາລະນາເຖິງການແລກປ່ຽນ (Trade-off) ລະຫວ່າງຕົ້ນທຶນ, Latency, ແລະ ຄວາມຖືກຕ້ອງ ຄືການຕັດສິນໃຈດ້ານການອອກແບບທີ່ສຳຄັນທີ່ສຸດໃນການນຳ LLM ໄປໃຊ້ງານໃນສະພາບແວດລ້ອມຈິງ.