posttoday

OpenAI เปิดสาเหตุ ChatGPT "ประจบสอพลอ" เกินจริงหลังอัปเดตโมเดล

07 พฤษภาคม 2568

OpenAI ยอมรับผิด พร้อมแจงสาเหตุ ChatGPT "ประจบสอพลอ" เกินจริงหลังอัปเดตโมเดล GPT-4o ล่าสุด  คาดส่วนหนึ่งเกิดจากนำคำติชมของผู้ใช้มาปรับปรุงระบบ

ในช่วงหลายสัปดาห์ที่ผ่านมา ผู้ใช้งานจำนวนมากได้ตั้งข้อสังเกตว่า ChatGPT มีแนวโน้มที่จะเห็นด้วยกับสิ่งที่พวกเขากล่าวอยู่เสมอ แม้ในสถานการณ์ที่ไม่เหมาะสม 

 

ซึ่งต่อมา Sam Altman ซีอีโอของ OpenAI ก็ได้ออกมายอมรับว่าการอัปเดต GPT-4o ครั้งล่าสุดนั้น ทำให้แชทบอท AI มีลักษณะ "ประจบสอพลอและน่ารำคาญอย่างแท้จริง" 

 

หลังจากที่ OpenAI ได้ถอนการอัปเดตโมเดล GPT-4o สำหรับ ChatGPT ที่มีปัญหาออกไปเมื่อสัปดาห์ก่อน เนื่องจากพบว่าทำให้แชทบอท AI แสดงพฤติกรรม "ประจบสอพลอหรือเห็นด้วยง่ายจนเกินไป" 

 

ล่าสุดเมื่อวันศุกร์ที่ผ่านมา ทางบริษัทก็ได้ออกมายอมรับข้อผิดพลาดดังกล่าวอย่างเป็นทางการ พร้อมทั้งเผยแพร่บล็อกโพสต์เพื่ออธิบายถึงสาเหตุของปัญหาอย่างละเอียด

 

OpenAI ได้ชี้แจงผ่านบล็อกโพสต์ โดยระบุว่า สาเหตุส่วนหนึ่งมาจากความพยายามในการ "นำคำติชมจากผู้ใช้, คุณสมบัติหน่วยความจำ, และข้อมูลล่าสุดมาใช้ให้ดียิ่งขึ้น" ซึ่งส่งผลให้โมเดล AI มีแนวโน้มที่จะแสดงพฤติกรรม "ประจบสอพลอ" มากขึ้นกว่าที่เคยเป็น

 

OpenAI ได้อธิบายเพิ่มเติมเกี่ยวกับการอัปเดต ChatGPT โดยระบุว่า ในกระบวนการปรับปรุงโมเดล AI นั้น บริษัทได้นำข้อมูลจากการที่ผู้ใช้กดปุ่ม 'ชอบ' (thumbs−up) และ 'ไม่ชอบ' (thumbs−down) มาใช้เป็น "ส่วนเสริมในการให้รางวัล" เพื่อช่วยในการพัฒนาโมเดล 

 

 

อย่างไรก็ตาม แนวทางนี้อาจส่งผลให้ "ลดทอนประสิทธิภาพของระบบให้รางวัลหลัก" ซึ่งมีบทบาทสำคัญในการควบคุมให้โมเดลไม่แสดงพฤติกรรมโอนอ่อนผ่อนตามหรือประจบสอพลอมากเกินไป 

 

นอกจากนี้ OpenAI ยังตั้งข้อสังเกตว่า คำติชมจากผู้ใช้ "บางครั้งมีแนวโน้มที่จะชื่นชอบการตอบสนองที่ดูคล้อยตามง่าย" ซึ่งยิ่งส่งผลให้ ChatGPT มีพฤติกรรมเห็นด้วยหรือตอบตกลงง่ายๆ ชัดเจนยิ่งขึ้น

 

ประกอบกับความสามารถด้านหน่วยความจำของตัวโมเดลเองก็อาจเป็นปัจจัยที่ยิ่งเสริมให้ปัญหานี้เด่นชัดขึ้นไปอีก

 

บริษัทยอมรับว่า ปัญหาในการเปิดตัวส่วนหนึ่งเกิดจากกระบวนการทดสอบภายใน แม้ผลการประเมินแบบออฟไลน์และการทดสอบ A/B จะเป็นบวก

 

แต่ผู้ทดสอบที่เป็นผู้เชี่ยวชาญบางรายให้ข้อเสนอแนะว่าการอัปเดตทำให้แชทบอท AI มีพฤติกรรมที่ "ผิดปกติ" ซึ่ง OpenAI ตัดสินใจเดินหน้าเปิดตัวอัปเดตนี้ต่อไป

 

บริษัทระบุในบล็อกว่า "เมื่อมองย้อนกลับไป การประเมินเชิงคุณภาพบ่งชี้ถึงสิ่งสำคัญที่เราควรใส่ใจให้มากยิ่งขึ้น"

 

โดยยอมรับว่าข้อเสนอแนะเหล่านั้นชี้ให้เห็นถึงข้อจำกัดในวิธีการประเมินและตัววัดอื่นๆ ของบริษัท

 

ซึ่งการประเมินแบบออฟไลน์ไม่ละเอียดพอจะตรวจจับพฤติกรรมประจบสอพลอ และการทดสอบ A/B ก็ไม่มีตัววัดที่เพียงพอจะแสดงรายละเอียดของโมเดลในส่วนนี้ได้

 

 

เพื่อป้องกันปัญหาในลักษณะเดียวกันนี้ที่อาจเกิดขึ้นในอนาคต ทาง OpenAI จะให้ความสำคัญกับ "ประเด็นด้านพฤติกรรม" อย่างยิ่งยวด ซึ่งอาจเป็นปัจจัยให้ต้องพิจารณาชะลอการเปิดตัวโมเดลใหม่ 

 

นอกจากนี้ จะมีการนำระบบ "ช่วงทดสอบอัลฟ่าแบบเลือกเข้าร่วม" (opt-in alpha phase) มาใช้ เพื่อเปิดโอกาสให้ผู้ใช้กลุ่มแรกได้ให้ข้อเสนอแนะโดยตรงแก่ OpenAI ก่อนที่จะเปิดตัวสู่สาธารณะในวงกว้าง 

 

ข่าวล่าสุด

คนละครึ่งพลัส หนุน “พาสต้า บ่? - มีลาภ อุบลฯ" ยอดขายพุ่ง แชมป์ร้านต่างจังหวัดขายดี