posttoday

ยกระดับ Gemini ท้าชนการคิดเชิงลึกของ o3 และเขียนโค้ดของ deepseek

21 พฤษภาคม 2568

Gemini 2.5 เปิดตัวฟีเจอร์ใหม่ เสียงแม่นขึ้น โค้ดเก่งขึ้น คิดลึกขึ้น พร้อมชน ChatGPT และ Deepseek อย่างเต็มกำลังในเดือนมิถุนายนนี้

Google ประกาศอัปเดตให้กับ AI Chatbot ของบริษัทอย่าง Gemini 2.5 ในหลายด้าน ตั้งแต่การประกาศยกระดับการตรวจจับและสนทนาผ่านเสียง ไปจนเพิ่มความสามารถในการเขียนโค้ดและการคิดเชิงลึก เพื่อผลักดันให้สามารถแข่งขันกับ Deepseek และ ChatGPT ได้อย่างเท่าเทียม

 

ส่วนแรกที่ได้รับการพัฒนาคือ Live API หรือการอินพุดข้อมูลภาพและเสียงสู่ระบบ ช่วยให้ Gemini ตรวจจับโทนเสียง สำเนียง และรูปแบบการพูดของผู้ใช้งาน  ซึ่งจะช่วยให้การตรวจจับเนื้อหา อารมณ์ และความรู้สึกของคู่สนทนา สามารถจับได้แม้แต่รายละเอียดเล็กน้อย เช่น เสียงเปรยหรือการกระซิบต่างๆ

 

ฟีเจอร์ตอบกลับด้วยเสียงเองก็ได้รับการพัฒนาขึ้นมาเช่นกัน ผู้ใช้สามารถกำหนดแนวทางตอบโต้ให้เข้ากับรูปแบบการสนทนา ตัวโมเดลยังสามารถปรับรูปแบบการตอบสนองให้เข้ากับอารมณ์ในน้ำเสียงของผู้ใช้งาน พร้อมสามารถแยกแยะเสียงของผู้พูดได้ในกรณีคู่สนทนามีมากกว่าหนึ่งคน

 

ส่วนที่เป็นไฮไลท์คือ Gemini 2.5 Flash ที่ได้รับการอัปเดต จากเดิมเป็นโมเดลขนาดเล็กที่มีต้นทุนการใช้งานต่ำ ล่าสุดพวกเขาปรับปรุงให้มีประสิทธิภาพยิ่งขึ้นใช้โทเคนทำงานน้อยลง 20 – 30% พร้อมพัฒนาระบบการเขียนโค้ดของโมเดลให้ทรงพลังมากขึ้น จนมีศักยภาพเหนือกว่า Deepseek R1 พร้อมราคาค่าบริการที่ถูกกว่าโมเดลอื่นในรุ่นเดียวกัน

 

อีกหนึ่งระบบที่ได้รับการเพิ่มเติมขึ้นมาคือ Gemini 2.5 Pro กับฟีเจอร์ Deep Think ระบบการให้เหตุผลขั้นสูง อาศัยการพิจารณาคำตอบจากหลายมุมมองก่อนให้คำตอบ ช่วยให้สามารถรับมือกับปัญหาที่มีความซับซ้อนได้ดี ใกล้เคียงกับเทคโนโลยีคิดเชิงลึกของโมเดล o1 และ o3 ของทาง ChatGPT

 

ฟีเจอร์เหล่านี้เริ่มเปิดทดลองให้ใช้งานและคาดว่าจะสามารถเข้าถึงได้ในช่วงเดือนมิถุนายน