กลไกความปลอดภัยที่ตรวจสอบอินพุตและเอาต์พุตของ LLM เพื่อตรวจจับและบล็อกเนื้อหาที่เป็นอันตราย การรั่วไหลของข้อมูลที่เป็นความลับ และการละเมิดนโยบายโดยอัตโนมัติ
ガードレール (AI Guardrails) คือกลไกความปลอดภัยโดยรวมที่ทำหน้าที่ตรวจสอบ input และ output ของ LLM เพื่อตรวจจับและบล็อกการสร้างเนื้อหาที่เป็นอันตราย การรั่วไหลของข้อมูลที่เป็นความลับ และการละเมิดนโยบายโดยอัตโนมัติ เปรียบเสมือนกันชนข้างถนนที่ป้องกันไม่ให้รถออกนอกเส้นทาง ガードレール ทำหน้าที่จำกัดพฤติกรรมของ AI ให้อยู่ในขอบเขตที่ยอมรับได้
ガードレール ทำงานใน 2 เลเยอร์หลัก
Input Guardrails: ตรวจสอบ input ของผู้ใช้ก่อนที่จะถึง model ครอบคลุมการตรวจจับ Prompt Injection การ masking ข้อมูลส่วนบุคคล (PII) และการจำกัดหัวข้อ (บล็อกคำถามที่อยู่นอกเหนือขอบเขตงาน) เป็นต้น
Output Guardrails: ตรวจสอบการตอบสนองของ model ก่อนที่จะส่งกลับไปยังผู้ใช้ ดำเนินการกรองนิพจน์ที่เป็นอันตราย การตรวจสอบความถูกต้องของข้อเท็จจริง (Grounding) และการตรวจสอบการรั่วไหลของข้อมูลที่เป็นความลับ เป็นต้น
โดยทั่วไปจะใช้การผสมผสานระหว่าง Rule-based (Regular Expression, Keyword List) และ ML-based (Classification Model, การประเมินโดย LLM อื่น) การออกแบบ ガードレール ให้สอดคล้องกับหมวดหมู่ความเสี่ยงที่ระบุโดย OWASP LLM Top 10 จะช่วยเพิ่มความครอบคลุม
ガードレール ที่มากเกินไปจะส่งผลเสียต่อประสบการณ์ของผู้ใช้ หาก "False Positive" ที่คำถามทางธุรกิจที่ถูกต้องถูกบล็อกโดยผิดพลาดเกิดขึ้นบ่อยครั้ง ผู้ใช้จะเลิกใช้เครื่องมือ AI การปรับ Threshold และการให้ Feedback ที่โปร่งใสเกี่ยวกับเหตุผลในการบล็อกถือเป็นกุญแจสำคัญในการดำเนินงาน


วิธีการประเมินที่ทดสอบช่องโหว่ของระบบ AI อย่างเป็นระบบจากมุมมองของผู้โจมตี เพื่อระบุความเสี่ยงด้านความปลอดภัยล่วงหน้า

เทคนิคการโจมตีที่ใช้อินพุตที่เป็นอันตรายเพื่อควบคุมพฤติกรรมของ LLM ให้เบี่ยงเบนไปจากที่ตั้งใจไว้ ถูกจัดให้เป็นความเสี่ยงสูงสุดใน OWASP LLM Top 10

สถาปัตยกรรมที่รันการอนุมานด้วย AI บนอุปกรณ์โดยตรง แทนที่จะใช้ Cloud ช่วยให้มี latency ต่ำ ปกป้องความเป็นส่วนตัว และทำงานได้แบบออฟไลน์

วิธีที่ภาคการผลิตของไทยเริ่มต้นใช้ AI สำหรับการบำรุงรักษาเชิงพยากรณ์และการควบคุมคุณภาพ

Shadow AI หมายถึง เครื่องมือและบริการ AI ที่พนักงานนำมาใช้ในการทำงานโดยไม่ได้รับการอนุมัติจากฝ่าย IT หรือผู้บริหารขององค์กร ซึ่งมีความเสี่ยงต่อการรั่วไหลของข้อมูลและการละเมิดข้อกำหนดด้านการปฏิบัติตามกฎระเบียบ (Compliance)