Google เผยโมเดล AI ใหม่ ปิดช่องโหว่สร้างภาพ "ตัวหนังสือเพี้ยน"
Google ปิดช่องโหว่ AI สร้างภาพ "ตัวหนังสือเพี้ยน" ส่งโมเดลใหม่ "Nano Banana Pro" แก้โจทย์งานดีไซน์ หวังเจาะตลาดงานกราฟิก
แม้ผู้ช่วยอัจฉริยะ AI ในปัจจุบันจะสามารถตอบคำถามได้อย่างฉะฉานน่าเชื่อถือ แต่เมื่อไรก็ตามที่เราสั่งให้ AI สร้างภาพ ที่มีข้อความประกอบ
ผลลัพธ์ที่ได้มักจะเต็มไปด้วยคำที่สะกดผิดๆ ถูกๆ หรือฟอนต์ที่บิดเบี้ยวจนอ่านไม่ออก ซึ่งปัญหานี้ถือเป็นอุปสรรคที่ทำให้การนำ AI มาใช้งานออกแบบเชิงวิชาชีพยังทำได้ไม่เต็มประสิทธิภาพนัก
แต่ล่าสุด ปัญหานี้กำลังจะหมดไป เมื่อ Alphabet (บริษัทแม่ของ Google) ได้เปิดตัวโมเดลสร้างและแก้ไขภาพรุ่นใหม่เมื่อวันพฤหัสบดี
โดยเคลมว่าสามารถแก้จุดอ่อนเรื่องการแสดงผลข้อความได้สำเร็จ หวังดึงดูดทั้งผู้ใช้งานทั่วไปและเอเจนซี่โฆษณาที่ต้องการสร้างกราฟิกและแผนภาพที่มีความซับซ้อนให้หันมาใช้เครื่องมือของ Google อย่างจริงจัง
ชูจุดเด่น 'Nano Banana Pro' อ่านง่าย-วางเลย์เอาต์แม่น
Google ระบุผ่านบล็อกอย่างเป็นทางการว่า หัวใจสำคัญของโมเดลใหม่ในชื่อ 'Nano Banana Pro' คือความสามารถในการสร้างภาพวิชวลคุณภาพสูงที่มาพร้อมข้อความที่คมชัดและถูกต้องตามหลักภาษา (รองรับหลายภาษา)
โดยเบื้องหลังความฉลาดนี้มาจากขุมพลังของ Gemini 3 โมเดล AI รุ่นเรือธงที่เพิ่งเปิดตัวไปเมื่อวันอังคาร ซึ่งทาง Google ยืนยันว่าเป็นก้าวกระโดดครั้งใหญ่ทั้งด้านตรรกะการคิดและการเขียนโค้ด
ส่งผลให้หุ้น Alphabet ดีดตัวทำจุดสูงสุดตลอดกาล (All-time high) ไปเป็นที่เรียบร้อย
ความเคลื่อนไหวครั้งนี้สะท้อนชัดเจนว่า Google กำลังเร่งเครื่องหารายได้จากเทคโนโลยี AI โดยผู้ใช้งาน Gemini แบบฟรีจะสามารถทดลองใช้ Nano Banana Pro ได้ภายใต้โควตาที่กำหนด (หากใช้เกินจะถูกตัดกลับไปใช้โมเดลรุ่นเก่า)
ส่วนลูกค้าที่สมัครแพ็กเกจรายเดือนจะได้รับสิทธิ์ใช้งานที่มากกว่า นอกจากนี้ โมเดลดังกล่าวยังถูกนำไปเชื่อมต่อกับเครื่องมือออกแบบยอดนิยมในตลาด ไม่ว่าจะเป็น Canva, Figma รวมถึงคู่แข่งในวงการกราฟิกอย่าง Adobe Firefly และ Photoshop
ฉลาดคิดก่อนทำ ตอบโจทย์งานดีไซน์
จุดที่น่าสนใจคือระบบการทำงานของ Nano Banana Pro ที่ 'คิดวางแผน' ก่อนจะสร้างภาพจริง โดยระบบจะคำนวณตำแหน่งข้อความ ลักษณะฟอนต์ และความสมดุลกับองค์ประกอบอื่นๆ ในภาพ
ทำให้สามารถแปลงข้อความธรรมดาๆ อย่างสูตรอาหาร ให้กลายเป็น Flow chart สวยๆ หรือทำภาพกราฟิกแสดงข้อมูลเรียลไทม์อย่างพยากรณ์อากาศหรือผลบอลได้ทันที
ฟีเจอร์ AI สร้างภาพ เอาใจสายโฆษณา
สำหรับแบรนด์ที่ต้องการคุม CI หรือสไตล์ของงานโฆษณา ระบบรองรับการอัปโหลด 'ภาพอ้างอิง' (Reference images) ได้สูงสุดถึง 14 ภาพ
เพื่อให้ AI นำไปประมวลผลสร้างสถานการณ์ใหม่ตามคำสั่งโดยไม่ทิ้งลายเซ็นและเอกลักษณ์ของแบรนด์
อีกทั้งยังเปิดให้ผู้ใช้ปรับแต่งงานภาพได้ละเอียดราวกับช่างภาพมือโปร ทั้งมุมกล้อง ระยะชัดลึกชัดตื้น (Depth of field) และการเกรดสี
นอกจากการอัปเกรดฟีเจอร์แล้ว Google ยังให้ความสำคัญกับการตรวจสอบที่มาของภาพ โดยผู้ใช้สามารถอัปโหลดรูปเข้าแอป Gemini เพื่อเช็กได้ว่ารูปนั้นสร้างโดย AI ของ Google หรือไม่
ซึ่งในอนาคตจะรองรับไฟล์เสียงและวิดีโอด้วย โดยปัจจุบันสื่อทุกชนิดจากเครื่องมือ AI ของ Google จะถูกฝังลายน้ำดิจิทัลที่มองไม่เห็นไว้
และสำหรับผู้ใช้ทั่วไป (Free/Pro) จะมีลายน้ำที่มองเห็นได้แปะอยู่บนภาพ ซึ่งลายน้ำนี้จะถูกลบออกให้เฉพาะลูกค้าที่สมัครแพ็กเกจ 'Ultra' ราคาสูงสุดเท่านั้น
อ้างอิง:


