การปรับขนาดในช่วงอนุมาน (Test-time Compute)

การปรับขนาดในช่วงอนุมาน (Test-time Compute)

การปรับขนาดการประมวลผลในช่วง Inference (Inference-Time Scaling) คือวิธีการที่เพิ่มหรือลดปริมาณการคำนวณในช่วง Inference ของโมเดลอย่างพลวัต โดยใช้ "ขั้นตอนการคิด" มากขึ้นสำหรับปัญหาที่ซับซ้อน และตอบทันทีสำหรับปัญหาที่ง่าย

ขยายการเรียนรู้ หรือยืดการอนุมาน

การพัฒนาประสิทธิภาพของ LLM แบบดั้งเดิมนั้นมุ่งเน้นที่ "การ scaling ในช่วงเรียนรู้" เป็นหลัก ไม่ว่าจะเป็นข้อมูลที่มากขึ้น โมเดลที่ใหญ่ขึ้น หรือเวลาเรียนรู้ที่นานขึ้น วิวัฒนาการจาก GPT-3 สู่ GPT-4 คือตัวอย่างที่ชัดเจนของแนวทางนี้

การ scaling ในช่วงอนุมานมีแนวคิดที่แตกต่างออกไป โดยคงขนาดของโมเดลไว้เท่าเดิม แต่ปรับปริมาณการคำนวณที่ใช้ในช่วงอนุมานตามระดับความยากของปัญหา คำถามอย่าง "วันนี้อากาศเป็นอย่างไร?" ตอบได้ในขั้นตอนเดียว ในขณะที่ "ช่วยตรวจสอบการพิสูจน์ทางคณิตศาสตร์นี้" อาจต้องใช้การอนุมานภายในหลายสิบขั้นตอน แนวทางนี้ถูกนำมาใช้ใน o1/o3 ของ OpenAI และ extended thinking ของ Claude จาก Anthropic

กลไกการทำงาน

โมเดลจะสร้าง "thinking token" ภายใน และแสดงกระบวนการอนุมานอย่างชัดเจนจนกว่าจะได้คำตอบสุดท้าย สิ่งที่แตกต่างจาก Chain-of-Thought (CoT) prompting แบบที่สั่งจากภายนอก คือตัวโมเดลเองจะสร้าง reasoning chain ที่ยาวตามความจำเป็น

วิธีการควบคุม computation budget นั้นแตกต่างกันไปตามแต่ละโมเดล เช่น การกำหนดจำนวน token สูงสุด การหยุดเมื่อค่าความเชื่อมั่นเกินเกณฑ์ที่กำหนด หรือการรัน reasoning path หลายเส้นทางแบบขนานแล้วใช้การโหวตเสียงข้างมาก (Best-of-N)

เหตุใดจึงได้รับความสนใจ

การ scaling ในช่วงเรียนรู้มีข้อจำกัดที่เรียกว่า "กำแพงข้อมูล" และ "กำแพงต้นทุน" ข้อมูลเรียนรู้ที่มีคุณภาพสูงนั้นมีจำกัด และต้นทุนในการขยายโมเดลให้ใหญ่ขึ้นสองเท่าก็ไม่ได้เพิ่มขึ้นเพียงแค่สองเท่าเท่านั้น ในทางกลับกัน การ scaling ในช่วงอนุมานมีลักษณะคล้ายกับระบบจ่ายตามการใช้งาน ที่เสียค่าใช้จ่ายเฉพาะเมื่อจำเป็น ในการใช้งานจริงที่ query ส่วนใหญ่เป็นคำถามง่าย จึงสามารถลดต้นทุนเฉลี่ยได้ในขณะที่ยังรับมือกับปัญหายากได้อย่างมีประสิทธิภาพ

ณ ปี 2026 "hybrid scaling" ที่ผสมผสานทั้งการ scaling ในช่วงเรียนรู้และการ scaling ในช่วงอนุมานเข้าด้วยกัน กำลังกลายเป็นแนวทางหลักที่ได้รับความนิยมมากขึ้นเรื่อยๆ

คำศัพท์ที่เกี่ยวข้อง

AI ROI (ผลตอบแทนจากการลงทุนด้าน AI)
AI สำหรับธุรกิจ

AI ROI (ผลตอบแทนจากการลงทุนด้าน AI)

AI ROI คือ ตัวชี้วัดที่ใช้วัดผลลัพธ์เชิงปริมาณของการปรับปรุงประสิทธิภาพการทำงานและการเพิ่มรายได้ที่ไ

AI พยากรณ์ความต้องการ (Demand Forecasting AI)
AI สำหรับธุรกิจ

AI พยากรณ์ความต้องการ (Demand Forecasting AI)

AI คาดการณ์ความต้องการ (Demand Forecasting AI) คือระบบที่วิเคราะห์ข้อมูลการขายในอดีตและปัจจัยภายนอกด

AI ออบเซอร์แวนบิลิตี้ (AI Observability)
AI สำหรับธุรกิจ

AI ออบเซอร์แวนบิลิตี้ (AI Observability)

แนวปฏิบัติในการดำเนินงานเพื่อติดตามและแสดงผลข้อมูลการทำงานของระบบ AI ที่ใช้งานจริงอย่างต่อเนื่อง ทั้

BPO (การจ้างภายนอกเพื่อดำเนินกระบวนการทางธุรกิจ)
AI สำหรับธุรกิจ

BPO (การจ้างภายนอกเพื่อดำเนินกระบวนการทางธุรกิจ)

BPO คือรูปแบบการ outsourcing ที่องค์กรมอบหมายกระบวนการทางธุรกิจเฉพาะด้านให้กับผู้ให้บริการภายนอกที่ม