โมเดลภาษาขนาดใหญ่ประเภทหนึ่งที่สร้างห่วงโซ่การคิดอย่างชัดเจนก่อนตอบคำถาม เพื่อแก้ปัญหาที่ซับซ้อนแบบทีละขั้นตอน
Reasoning Model คือ LLM ประเภทหนึ่งที่สร้าง Chain of Thought (ลำดับความคิด) อย่างชัดเจนภายในก่อนที่จะแสดงคำตอบ เพื่อแก้ปัญหาที่ซับซ้อนอย่างเป็นขั้นตอน ไม่ว่าจะเป็นการพิสูจน์ทางคณิตศาสตร์หรือการสร้างโค้ด
ในขณะที่ LLM ทั่วไปทำนายโทเค็นถัดไปแบบ "อัตโนมัติ" Reasoning Model จะแยกย่อยปัญหา ตรวจสอบขั้นตอนกลางด้วยตัวเอง แล้วจึงไปถึงคำตอบสุดท้าย ถือได้ว่าเป็นการออกแบบที่สะท้อนแนวคิดของ Test-time Compute (การปรับขนาดในช่วงอนุมาน)
ได้แก่ o series ของ OpenAI, DeepSeek-R1 และโหมด extended thinking ของ Anthropic Claude เป็นต้น โมเดลเหล่านี้มีแนวโน้มที่ความแม่นยำจะเพิ่มขึ้นตามระยะเวลาที่ใช้ "คิด" และจุดเด่นคือผู้ใช้สามารถควบคุม Trade-off ระหว่างจำนวน Reasoning Token กับความแม่นยำได้
Reasoning Model ไม่ใช่สิ่งที่ใช้ได้กับทุกสถานการณ์ สำหรับงานที่ต้องการคำตอบทันที เช่น การสรุปหรือการแปลที่ไม่ซับซ้อน LLM ทั่วไปจะได้เปรียบกว่าทั้งในด้านต้นทุนและความเร็ว จากประสบการณ์ของผู้เขียน การแบ่งการใช้งานโดยใช้โมเดลทั่วไปสำหรับ Q&A ความรู้ภายในองค์กร และใช้ Reasoning Model สำหรับการวิเคราะห์ความเสี่ยงในสัญญา มักจะคุ้มค่ากว่า
การจัดระเบียบล่วงหน้าว่างานใดบ้างที่ต้องการ "เวลาในการคิด" คือก้าวแรกของการนำ Reasoning Model มาใช้งาน


การอนุมานแบบหลายขั้นตอน (Multi-step Reasoning) คือวิธีการอนุมานที่ LLM ไม่ได้สร้างคำตอบในครั้งเดียว แต่ผ่านขั้นตอนกลางหลายขั้นตอน (เช่น การสร้างคำถามย่อย การตรวจสอบคำตอบบางส่วน การดึงข้อมูลเพิ่มเติม เป็นต้น) เพื่อให้ได้คำตอบสุดท้าย

เทคนิคการเขียนพรอมต์ที่ให้ LLM สร้างขั้นตอนการอนุมานระหว่างกลางอย่างชัดเจน เพื่อเพิ่มความแม่นยำในการตอบคำถามสำหรับงานที่ซับซ้อน

Dense Model (โมเดลแบบเชื่อมต่อหนาแน่น) คือสถาปัตยกรรมเครือข่ายประสาทเทียมที่ใช้พารามิเตอร์ทั้งหมดของโมเดลในการคำนวณระหว่างการอนุมาน ต่างจาก MoE (Mixture of Experts) ที่เปิดใช้งานเฉพาะบางส่วนของ Expert Dense Model จะให้ weight ทั้งหมดมีส่วนร่วมในการประมวลผลเสมอ ไม่ว่า input จะเป็นอะไรก็ตาม


AI Agent คืออะไร? คู่มือการใช้ AI ยุคใหม่สำหรับธุรกิจไทยที่ต้องการระบบอัตโนมัติแบบอิสระ