
VibeThinker-3B โมเดลใหม่ล่าสุดจาก Weibo ที่มีขนาดจิ๋วแต่แจ๋ว
VibeThinker-3B พิสูจน์ว่า AI ไม่จำเป็นต้องใหญ่เสมอไป เมื่อโมเดลขนาดจิ๋วสามารถทำงานด้านคำนวณและเขียนโค้ดได้ใกล้เคียงรุ่นเรือธงในต้นทุนที่ต่ำกว่ามหาศาล
Weibo แพลตฟอร์มโซเชียลมีเดียขนาดใหญ่ที่สุดของจีนเปิดตัว VibeThinker-3B โมเดล AI ที่มีจุดเด่นในด้านการใช้เหตุผลและคิดเชิงตรรกะที่สูงมาก โดยเฉพาะในด้านการคำนวณ แก้โจทย์คณิตศาสตร์ หรือเขียนโค้ด ที่มีประสิทธิภาพสูงในระดับน่าพอใจ แต่มีต้นทุนในการประมวลผลน้อยกว่านับร้อยเท่า
โดยพื้นฐานโมเดลเกิดจากการนำ Qwen2.5-Coder-3B ที่เป็นโอเพนซอร์สมาต่อยอด ด้วยการใช้เทคนิคอักอลิทึม MaxEnt-Guided Policy Optimizatio ที่ช่วยในการย่อข้อมูลฝึกฝน และระบบ Long2Short Math RL ที่ช่วยลดอาการเยิ่นเย้อในคำตอบของโมเดล พร้อมนำมาฝึกฝนเพิ่มเติมเพื่อเพิ่มประสิทธิภาพ
ผลลัพธ์ที่ได้คือ VibeThinker-3B เป็นโมเดลขนาดจิ๋วเพียง 3 พันล้านพารามิเตอร์ แต่มีประสิทธิภาพใกล้เคียงกับโมเดลขนาดใหญ่อย่าง DeepSeek V3.2, Gemini 3 Pro หรือ Claude Opus 4.5 ที่เป็นเรือธงของปีที่แล้วเป็นอย่างมาก ทั้งที่มีขนาดต่างกันกว่า 200 เท่า
เมื่อนำไปเทียบโมเดลเรือธงที่ให้บริการตามท้องตลาดจำพวก Claude Opus 4.8 หรือ GPT-5.5 ขีดความสามารถโดยรวมย่อมทิ้งห่างไม่เห็นฝุ่น แต่ถ้านับเฉพาะในด้านการคำนวณและเขียนโค้ดอย่างเดียว ก็เรียกได้ว่ามีขีดความสามารถในระดับ 70 – 80% แต่มีต้นทุนการประมวลผลต่างกันนับร้อยเท่า และสามารถรันได้แม้ในอุปกรณ์ทั่วไปที่มีแรม 6 - 8 GB
อย่างไรก็ตามตัวโมเดลยังถูกตั้งคำถามถึงขีดความสามารถโดยรวมอยู่บ้าง ซึ่งทางผู้พัฒนาก็ออกมาโต้แย้งว่า ตจัวโมเดลทำแบบทดสอบได้ดีในด้านคณิตศาสตร์และคำนวณ แต่อาจนำไปเชื่อมต่อกับเครื่องมือทำงานหรือใช้ในด้านอื่นได้จำกัด จึงอาจต้องนำไปปรับแต่งกันยกใหญ่ก่อนใช้งาน
สำหรับท่านที่สนใจ VibeThinker-3B เปิดให้ดาวน์โหลดสำหรับไช้งานแล้ววันนี้ ผ่านช่องทางโอเพนซอร์สทั่วไป







