OpenAI เปิดสาเหตุ ChatGPT "ประจบสอพลอ" เกินจริงหลังอัปเดตโมเดล

07 พฤษภาคม 2568

OpenAI ยอมรับผิด พร้อมแจงสาเหตุ ChatGPT "ประจบสอพลอ" เกินจริงหลังอัปเดตโมเดล GPT-4o ล่าสุด คาดส่วนหนึ่งเกิดจากนำคำติชมของผู้ใช้มาปรับปรุงระบบ

ในช่วงหลายสัปดาห์ที่ผ่านมา ผู้ใช้งานจำนวนมากได้ตั้งข้อสังเกตว่า ChatGPT มีแนวโน้มที่จะเห็นด้วยกับสิ่งที่พวกเขากล่าวอยู่เสมอ แม้ในสถานการณ์ที่ไม่เหมาะสม

ซึ่งต่อมา Sam Altman ซีอีโอของ OpenAI ก็ได้ออกมายอมรับว่าการอัปเดต GPT-4o ครั้งล่าสุดนั้น ทำให้แชทบอท AI มีลักษณะ "ประจบสอพลอและน่ารำคาญอย่างแท้จริง"

หลังจากที่ OpenAI ได้ถอนการอัปเดตโมเดล GPT-4o สำหรับ ChatGPT ที่มีปัญหาออกไปเมื่อสัปดาห์ก่อน เนื่องจากพบว่าทำให้แชทบอท AI แสดงพฤติกรรม "ประจบสอพลอหรือเห็นด้วยง่ายจนเกินไป"

ล่าสุดเมื่อวันศุกร์ที่ผ่านมา ทางบริษัทก็ได้ออกมายอมรับข้อผิดพลาดดังกล่าวอย่างเป็นทางการ พร้อมทั้งเผยแพร่บล็อกโพสต์เพื่ออธิบายถึงสาเหตุของปัญหาอย่างละเอียด

OpenAI ได้ชี้แจงผ่านบล็อกโพสต์ โดยระบุว่า สาเหตุส่วนหนึ่งมาจากความพยายามในการ "นำคำติชมจากผู้ใช้, คุณสมบัติหน่วยความจำ, และข้อมูลล่าสุดมาใช้ให้ดียิ่งขึ้น" ซึ่งส่งผลให้โมเดล AI มีแนวโน้มที่จะแสดงพฤติกรรม "ประจบสอพลอ" มากขึ้นกว่าที่เคยเป็น

OpenAI ได้อธิบายเพิ่มเติมเกี่ยวกับการอัปเดต ChatGPT โดยระบุว่า ในกระบวนการปรับปรุงโมเดล AI นั้น บริษัทได้นำข้อมูลจากการที่ผู้ใช้กดปุ่ม 'ชอบ' (thumbs−up) และ 'ไม่ชอบ' (thumbs−down) มาใช้เป็น "ส่วนเสริมในการให้รางวัล" เพื่อช่วยในการพัฒนาโมเดล

อย่างไรก็ตาม แนวทางนี้อาจส่งผลให้ "ลดทอนประสิทธิภาพของระบบให้รางวัลหลัก" ซึ่งมีบทบาทสำคัญในการควบคุมให้โมเดลไม่แสดงพฤติกรรมโอนอ่อนผ่อนตามหรือประจบสอพลอมากเกินไป

นอกจากนี้ OpenAI ยังตั้งข้อสังเกตว่า คำติชมจากผู้ใช้ "บางครั้งมีแนวโน้มที่จะชื่นชอบการตอบสนองที่ดูคล้อยตามง่าย" ซึ่งยิ่งส่งผลให้ ChatGPT มีพฤติกรรมเห็นด้วยหรือตอบตกลงง่ายๆ ชัดเจนยิ่งขึ้น

ประกอบกับความสามารถด้านหน่วยความจำของตัวโมเดลเองก็อาจเป็นปัจจัยที่ยิ่งเสริมให้ปัญหานี้เด่นชัดขึ้นไปอีก

บริษัทยอมรับว่า ปัญหาในการเปิดตัวส่วนหนึ่งเกิดจากกระบวนการทดสอบภายใน แม้ผลการประเมินแบบออฟไลน์และการทดสอบ A/B จะเป็นบวก

แต่ผู้ทดสอบที่เป็นผู้เชี่ยวชาญบางรายให้ข้อเสนอแนะว่าการอัปเดตทำให้แชทบอท AI มีพฤติกรรมที่ "ผิดปกติ" ซึ่ง OpenAI ตัดสินใจเดินหน้าเปิดตัวอัปเดตนี้ต่อไป

บริษัทระบุในบล็อกว่า "เมื่อมองย้อนกลับไป การประเมินเชิงคุณภาพบ่งชี้ถึงสิ่งสำคัญที่เราควรใส่ใจให้มากยิ่งขึ้น"

โดยยอมรับว่าข้อเสนอแนะเหล่านั้นชี้ให้เห็นถึงข้อจำกัดในวิธีการประเมินและตัววัดอื่นๆ ของบริษัท

ซึ่งการประเมินแบบออฟไลน์ไม่ละเอียดพอจะตรวจจับพฤติกรรมประจบสอพลอ และการทดสอบ A/B ก็ไม่มีตัววัดที่เพียงพอจะแสดงรายละเอียดของโมเดลในส่วนนี้ได้

เพื่อป้องกันปัญหาในลักษณะเดียวกันนี้ที่อาจเกิดขึ้นในอนาคต ทาง OpenAI จะให้ความสำคัญกับ "ประเด็นด้านพฤติกรรม" อย่างยิ่งยวด ซึ่งอาจเป็นปัจจัยให้ต้องพิจารณาชะลอการเปิดตัวโมเดลใหม่

นอกจากนี้ จะมีการนำระบบ "ช่วงทดสอบอัลฟ่าแบบเลือกเข้าร่วม" (opt-in alpha phase) มาใช้ เพื่อเปิดโอกาสให้ผู้ใช้กลุ่มแรกได้ให้ข้อเสนอแนะโดยตรงแก่ OpenAI ก่อนที่จะเปิดตัวสู่สาธารณะในวงกว้าง

OpenAI เปิดสาเหตุ ChatGPT "ประจบสอพลอ" เกินจริงหลังอัปเดตโมเดล

ข่าวล่าสุด

ศาลรัฐธรรมนูญสั่งยกเลิกดูงานต่างประเทศหลังครม.มีมติประหยัดงบประมาณภาครัฐ

Klook เผยยอดเที่ยวจีนพุ่ง 130% จัด Klook Travel Fest รับสงกรานต์

กองทุนน้ำมันแจงขึ้น 6 บาท เพราะราคาตลาดโลกพุ่ง-สภาพคล่องติดลบ

5 ภาคส่วน เซ่นพิษสงคราม SCB EIC หั่นเป้า GDP ไทยปีนี้เหลือโต 1.4%

Free Fire กางโรดแมปปี 69 ดันไทยฮับอีสปอร์ต-ครีเอเตอร์โลก