Open AI เปิดสาเหตุแชทบอตหลอน อาการที่ AI สร้างคำตอบที่ ‘ดูน่าเชื่อถือ แต่ไม่ตรงกับข้อเท็จจริง’ เป็นเพราะระบบประเมินที่ให้ค่าความกล้าเดามากกว่าการไม่ตอบ
OpenAI บริษัทผู้พัฒนา ChatGPT เปิดเผยผลการศึกษาล่าสุดถึงสาเหตุของปรากฏการณ์ “hallucinations” หรือการที่แชตบอตตอบคำถามอย่างมั่นใจแม้ข้อมูลไม่ถูกต้อง โดยระบุว่า ปัญหานี้เกิดจากโครงสร้างการฝึกและประเมินผลที่เน้นให้โมเดลพยายามตอบ มากกว่าการยอมรับว่าไม่ทราบ
รายงานระบุว่า โมเดลภาษาขนาดใหญ่ (LLMs) ถูกออกแบบให้เป็น “นักสอบที่ดี” โดยระบบให้คะแนนกับคำตอบที่ถูกต้อง แต่ไม่ให้คะแนนกับการเว้นว่างหรือการตอบว่าไม่รู้ ส่งผลให้โมเดลเรียนรู้ว่าการเดาอาจให้ผลลัพธ์ดีกว่าการนิ่งเฉย
นักวิจัยเปรียบเทียบว่า โมเดลเหล่านี้มีพฤติกรรมคล้ายกับนักเรียนที่เลือกเดาคำตอบในข้อสอบแบบปรนัย เพราะการเว้นว่างหมายถึงศูนย์คะแนน ขณะที่การเดา แม้ไม่มีหลักฐานรองรับ ก็อาจได้คะแนนจากความบังเอิญ
แม้ GPT‑5 ซึ่งเป็นโมเดลล่าสุดจะลดอัตราการหลอนลงได้ถึง 46% จากรุ่นก่อนหน้า แต่ผลสำรวจจาก NewsGuard ยังพบว่าแชตบอตโดยรวมยังให้ข้อมูลคลาดเคลื่อนใน 40% ของคำตอบ
OpenAI ระบุเพิ่มเติมว่า แม้โมเดลจะมีขนาดใหญ่ขึ้น หรือมีความสามารถด้านการค้นหาและให้เหตุผลมากเพียงใด ก็ไม่อาจหลีกเลี่ยงข้อผิดพลาดได้ทั้งหมด เพราะคำถามบางประเภทในโลกจริงไม่สามารถตอบได้อย่างแน่ชัดโดยธรรมชาติของมันเอง
#TheStructure
#TheStructureNews
#OpenAI #ChatGPT