posttoday

IBM เปิดตัว Granite 3.2 ที่ทำให้ AI คิดได้โดยไม่ต้องรอแบบ Deepseek

03 มีนาคม 2568

IBM เปิดตัว Granite 3.2 โมเดล AI ตัวใหม่ที่อาศัยเทคนิค Inference scaling ช่วยให้มีประสิทธิภาพและความเร็วในการตอบคำถามดีกว่า Deepseek

IBM เปิดตัวโมเดล AI รุ่นใหม่ Granite 3.2 ชูจุดเด่นในด้านขีดความสามารถทางคณิตศาสตร์ การคำนวณ และการเขียนโค้ด จากการปรับปรุงเกณฑ์มาตรฐานจากเดิมกว่า 20 จุด พร้อเทคนิค Inference scaling ช่วยให้โมเดล LLM สามารถตอบคำถามผู้ใช้งานได้ดีเท่า Deepseek แต่มีความเร็วการตอบสูงกว่าเดิมหลายเท่า

 

หนึ่งในเทคนิคสำคัญที่ทำให้ Deepseek มีขีดความสามารถสูงมากจากการอาศัยเทคนิค Long chain of thought ที่เมื่อได้โจทย์มาแล้วทำการคิดหาคำตอบ AI จะทำการตรวจทานทั้งคำถามที่ได้รับและคำตอบที่ออกมาซ้ำ ช่วยให้ได้คำตอบที่ถูกต้องแม่นยำตามรอยกระบวนการคิดได้ง่าย แลกกับความเร็วในการตอบคำถามที่ดลงแม้จะเป็นคำถามง่ายๆ

 

ในขณะที่ Granite 3.2 จะอาศัยเทคนิค Inference scaling เริ่มจากให้โมเดลคิดคำตอบหลายรูปแบบพร้อมกัน จากเดิมที่ต้องรอให้ AI คิดทุกวิธีเสร็จสิ้นแล้วตรวจทานคำตอบที่ดีที่สุด ระบบจะใช้ AI อีกตัวเข้ามาตรวจทานแบบเรียลไทม์ แล้วทำการประเมินว่าคำตอบไหนถูกต้องที่สุด จากนั้นจึงระงับการคิดวิธีอื่นแล้วมุ่งหาคำตอบที่ถูกเพียงอย่างเดียว

 

วิธีนี้จะช่วยให้คำตอบที่ได้รับจากโมเดลมีความถูกต้องสูงขึ้นใกล้เคียงกับการใช้เทคนิคเดียวกับ Deepseek แต่ช่วยประหยัดเวลาและทรัพยากรในการหาคำตอบลงจากเดิม โมเดลที่นำมาใช้ในการตรวจทานคำตอบคือ Qwen2.5 ที่มีขีดความสามารถทางการคำนวณสูง พร้อมมีการลงคะแนนเสียงคำตอบที่ตรวจเพื่อให้แน่ใจว่าได้คำตอบที่ถูกต้อง

 

ผลลัพธ์ที่ได้นอกจากช่วยให้ระยะเวลาในการค้นหาคำตอบสั้นลงแล้ว Granite 3.2 ยังทำคะแนนด้านการคำนวณและคณิตศาสตร์ได้ดีกว่าโมเดลรุ่นใกล้เคียงกันทั้ง GPT-4o-0513, Claude-3.5-Sonnet ไปจน Deepseek R1 ช่วยให้ประสิทธิภาพในการหาคำตอบสูงขึ้นกว่าเดิมถึง 60%

 

สำหรับท่านที่สนใจทดลองใช้งาน Granite 3.2 เปิดให้เข้าถึงและนำไปใช้งานได้ผ่านช่องทาง Hugging Face

ข่าวล่าสุด

กองทัพไทย ยืนยันทุกเหล่าทัพ ทุกเป้าหมายที่โจมตีล้วนเป็นเป้าหมายทางทหาร