posttoday

Implicit Caching ฟีเจอร์ใหม่จาก Gemini ลดค่าใช้งานลงถึง 75%

13 พฤษภาคม 2568

Gemini เปิดตัว Implicit Caching ฟีเจอร์ใหม่ลดต้นทุน AI สูงสุด 75% ด้วยระบบหน่วยความจำอัตโนมัติ ตอบซ้ำไว ไม่เปลืองโทเคน

ปัจจุบันการนำ AI Chatbot มากลายเป็นเรื่องทั่วไปในชีวิตประจำวัน แต่ก็อาจมีข้อจำกัดทางค่าใช้จ่ายที่ทำให้กิจการบางส่วนไม่สะดวกและมีข้อติดขัดด้านงบประมาณ แต่ทุกอย่างอาจเปลี่ยนไปเมื่อ Google เปิดตัวฟีเจอร์ Implicit Caching ให้แก่ Gemini ที่อาจช่วยลดค่าใช้จ่ายถึง 75%

 

แนวทางนี้จะอาศัยการจัดทำ Cache หรือ หน่วยความจำชั่วคราว แบบเดียวกับที่ใช้งานบนคอมพิวเตอร์หรือหน้าเว็บไซต์ต่างๆ ที่จะบันทึกผลการเข้าถึงไว้กับหน่วยความจำภายใน เมื่อต้องการใช้งานก็เพียงไปดึงเนื้อหาเหล่านั้นให้กลับมาทำงานอีกครั้ง ช่วยให้ AI ทำงานได้เร็วขึ้น ใช้โทเคนลดลง ส่งผลต่อต้นทุนการใช้งานที่น้อยลงในที่สุด

 

Google จึงได้ประกาศฟ๊เจอร์ Implicit Caching ให้บันทึกเนื้อหา เอกสาร หรือข้อมูลที่ดึงขึ้นมาได้ ทำให้เมื่อมีการป้อนคำสั่งซ้ำ ใส่ชุดข้อความเดิม หรือต้องการคำตอบที่มีความใกล้เคียงกัน AI จะทำการดึงเนื้อหาที่ทำการบันทึกไว้มาตอบได้ทันที ส่วนนี้เป็นประโยชน์มากกับงานหลายชนิดที่ AI ต้องรับมือคำถามเดิมซ้ำๆ

 

จริงอยู่นี่อาจไม่ใช่ฟีเจอร์ใหม่เอี่ยมพลิกโลกแต่เป็นระบบที่เคยมีการเปิดให้ใช้งาน แต่ที่ผ่านมาหากต้องการใช้งาน Cache ผู้ใช้จำเป็นต้องไปตั้งค่าปรับแต่งและต้องเสียค่าใช้จ่ายข้อมูลที่สำรองไว้เอง ในขณะที่ Implicit Caching สามารถบันทึกเนื้อหาและ Cache ได้โดยอัตโนมัติ และช่วยลดต้นทุนค่าอินพุทโทเคนลงไปกว่า 75%

 

นี่ถือเป็นอีกหนึ่งความพยายามในการแข่งขันของ Gemini จาก Google โดยอาศัยการนำหน่วยความจำมาใช้เพิ่มขีดความสามารถของ AI แบบเดียวกับฟัเจอร์เก็บ Cache ที่ของ Deepseek ที่เปิดให้ใช้งานโดยอัตโนมัติ และสามารถเข้าถึงได้โดยไม่มีค่าใช้จ่ายเช่นกัน

ข่าวล่าสุด

ยุคทอง YouTube Podcast เดือนเดียวยอดชมบนทีวีพุ่ง 700 ล้านชั่วโมง