Gemini Embedding 2 ແມ່ນໂມເດລ embedding ທີ່ຮອງຮັບ multimodal ທີ່ພັດທະນາໂດຍ Google ສາມາດແປງຂໍ້ຄວາມ, ຮູບພາບ, ວິດີໂອ, ສຽງ ແລະເອກະສານໃຫ້ເປັນພື້ນທີ່ vector ດຽວກັນໄດ້.
ບໍ່ເໝືອນກັບ embedding model ແບບດັ້ງເດີມທີ່ຮອງຮັບສະເພາະຂໍ້ຄວາມ, ຈຸດເດັ່ນທີ່ສຸດຂອງມັນຄືການ map ສື່ 5 ປະເພດເຂົ້າສູ່ semantic space ດຽວກັນ. ຕົວຢ່າງເຊັ່ນ: audio clip ຂອງສຽງຜິດປົກກະຕິໃນໂຮງງານ ແລະ ເອກະສານຂໍ້ຄວາມທີ່ອະທິບາຍຂັ້ນຕອນການແກ້ໄຂຄວາມຜິດປົກກະຕິຂອງອຸປະກອນ ຈະຖືກຈັດໃຫ້ຢູ່ໃກ້ກັນໃນ vector space — ດ້ວຍວິທີນີ້, ການຄົ້ນຫາຂ້າມ modality ຈຶ່ງສາມາດສຳເລັດໄດ້ດ້ວຍ model ດຽວ. ໃນສະຖານະການທີ່ຕ້ອງການໃຫ້ RAG pipeline ຄົ້ນຫາ knowledge ທີ່ບໍ່ແມ່ນຂໍ້ຄວາມດ້ວຍ, ຈຶ່ງຊ່ວຍຫຼຸດຄວາມຍຸ່ງຍາກໃນການກຽມ model ແຍກຕ່າງຫາກສຳລັບແຕ່ລະ modality ໄດ້ຢ່າງຫຼວງຫຼາຍ. input window ມີຂະໜາດ 8,192 token, ເຮັດໃຫ້ສາມາດກຳນົດ chunk size ໃຫ້ໃຫຍ່ຂຶ້ນໄດ້. output ມີຄວາມກວ້າງສູງສຸດ 3,072 ມິຕິ, ແຕ່ດ້ວຍໂຄງສ້າງ Matryoshka ຈຶ່ງສາມາດຫຍໍ້ລົງເຫຼືອ 1,536 (ສຳລັບຄວາມສົມດຸນ) ຫຼື 768 (ສຳລັບການຄົ້ນຫາທີ່ມີ latency ຕ່ຳ) ໄດ້ອີກດ້ວຍ. ນອກຈາກນີ້ຍັງມີ task optimization parameter ທີ່ຊ່ວຍປັບຄຸນສົມບັດທາງຄະນິດສາດຂອງ vector ໃຫ້ເໝາະສົມກັບການນຳໃຊ້ງານ ເຊັ່ນ: ການຄົ້ນຫາ, ການຈັດໝວດໝູ່ ແລະ ອື່ນໆ. ເນື່ອງຈາກຮອງຮັບພາສາຫຼາຍກວ່າ 100 ພາສາແບບ native, ຈຶ່ງເໝາະສົມສຳລັບ multilingual RAG ແລະ cross-lingual search ອີກດ້ວຍ. ມີການ integration ຢ່າງເປັນທາງການກັບ LangChain, LlamaIndex, Weaviate, Qdrant ແລະ ChromaDB, ເຮັດໃຫ້ສາມາດນຳໄປໃຊ້ກັບໂຄງສ້າງພື້ນຖານ vector database ທີ່ມີຢູ່ແລ້ວໄດ້ໂດຍກົງ. ລາຄາຢູ່ທີ່ $0.25 ຕໍ່ 1 ລ້ານ token, ແລະ ຍັງມີ free tier ໃຫ້ໃຊ້ງານອີກດ້ວຍ. ການຍ້າຍຈາກ text-embedding-004 ແບບເກົ່ານັ້ນ, ການປ່ຽນ model ID ໂດຍຕົວມັນເອງແມ່ນເຮັດໄດ້ງ່າຍ, ແຕ່ເນື່ອງຈາກ vector space ແຕກຕ່າງກັນ, ຈຶ່ງຈຳເປັນຕ້ອງ rebuild index ທີ່ມີຢູ່ໃໝ່. ໃນກໍລະນີທີ່ຕ້ອງການໃຊ້ multimodal input ຢ່າງເຕັມຮູບແບບ, ຈຳເປັນຕ້ອງມີການອອກແບບທີ່ຄຳນຶງເຖິງຄວາມລະອຽດໃນການລວມຮູບພາບ ແລະ ສຽງເຂົ້າໃນ index, ພ້ອມທັງຄວາມສົມດຸນລະຫວ່າງຄວາມຖືກຕ້ອງໃນການຄົ້ນຫາ ແລະ ຄ່າໃຊ້ຈ່າຍດ້ານ storage.


ເອັມເບັດດິງ (Embedding) ແມ່ນເທັກນິກທີ່ແປງຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງ ເຊັ່ນ ຂໍ້ຄວາມ, ຮູບພາບ ແລະ ສຽງ ໃຫ້ເປັນເວັກເຕີຕົວເລກຄວາມຍາວຄົງທີ່ ໂດຍຍັງຮັກສາຄວາມສຳພັນທາງຄວາມໝາຍ.

ຖານຂໍ້ມູນເວັກເຕີ (Vector Database) ແມ່ນຖານຂໍ້ມູນທີ່ເກັບຮັກສາຂໍ້ຄວາມ ແລະ ຮູບພາບເປັນເວັກເຕີຕົວເລກ (Embedding) ແລະ ໃຫ້ບໍລິການຄົ້ນຫາໄວຕາມຄວາມຄ້າຍຄືກັນທາງຄວາມໝາຍ.

A2A (Agent-to-Agent Protocol) ແມ່ນໂປຣໂຕຄໍການສື່ສານທີ່ຊ່ວຍໃຫ້ AI agent ທີ່ແຕກຕ່າງກັນສາມາດຄົ້ນຫາຄວາມສາມາດ, ມອບໝາຍໜ້າທີ່, ແລະ ເຊື່ອມຕໍ່ ຫຼື ຊິງຄ໌ຂໍ້ມູນສະຖານະລະຫວ່າງກັນໄດ້, ໂດຍ Google ໄດ້ເປີດຕົວໃນເດືອນເມສາ 2025.


ການຄຸ້ມຄອງ AI ຄືຫຍັງ? ຄູ່ມືປະຕິບັດຕົວຈິງຕັ້ງແຕ່ການຮັບມືກັບ EU AI Act ຈົນເຖິງການຈັດລະບຽບກົດລະບຽບພາຍໃນອົງກອນ

ຂະໜາດ chunk ແມ່ນຂະໜາດຂອງໜ່ວຍການແບ່ງ (ຈຳນວນ token ຫຼືຈຳນວນຕົວອັກສອນ) ທີ່ໃຊ້ໃນການແບ່ງເອກະສານເພື່ອເກັບໄວ້ໃນ vector store ພາຍໃນ RAG pipeline. ນີ້ແມ່ນ parameter ທີ່ສຳຄັນທີ່ສົ່ງຜົນໂດຍກົງຕໍ່ຄວາມຖືກຕ້ອງຂອງການຄົ້ນຫາ ແລະ ຄຸນນະພາບຂອງຄຳຕອບ.