posttoday

Typhoon โมเดล AI สัญชาติไทย สู่รากฐานอุตสาหกรรม AI ของประเทศ

27 พฤศจิกายน 2568

Typhoon โมเดล AI ภาษาไทยที่พัฒนาจากโอเพนซอร์สชั้นนำ ปรับแต่งด้วยข้อมูลไทยจำนวนมหาศาล จนรองรับการถอดเสียงและอ่านเอกสารไทยได้แม่นยำและเป็นธรรมชาติ

KEY

POINTS

  • Typhoon คือโมเดล AI สัญชาติไทยที่พัฒนาโดย SCB 10X เพื่อแก้ปัญหาที่โมเดลต่างชาติไม่สามารถเข้าใจภาษาและบริบทของไทยได้อย่างมีประสิทธิภาพ
  • ปัจจุบันได้เปิดตัวโมเดลหลัก 2 ตัว คือ Typhoon ASR สำหรับการถอดเสียงพูดเป็นข้อความแบบเรียลไทม์ด้วยความเร็วสูงและต้นทุนต่ำ และ Typhoon OCR ที่สามารถอ่านและวิเคราะห์เอกสารซับซ้อนได้อย่างแม่นยำ
  • การพัฒนานี้มีเป้าหมายเพื่อสร้างรากฐานและเพิ่มขีดความสามารถให้กับอุตสาหกรรม AI ของประเทศ ด้วยโมเดลที่ออกแบบมาเพื่อตอบโจทย์คนไทยโดยเฉพาะ

ที่ผ่านมาหลายท่านคงมีโอกาสเข้าถึงโมเดล AI จากต่างประเทศมาหลายเจ้า ตั้งแต่ GPT, Gemini, Claude, Deepseek, Qwen ที่ล้วนมีจุดเด่นและประสิทธิภาพสูง แต่โมเดลส่วนใหญ่ยังไม่สามารถทำความเข้าใจและใช้งานภาษาไทยได้ดีนัก เนื่องจากภาษาไทยเป็นเพียงภาษารองที่มีผู้ใช้งานน้อยทำให้ไม่ได้รับความสนใจพัฒนาเท่าที่ควร

 

นั่นเป็นเหตุผลนำไปสู่การพัฒนาโมเดลภาษาที่ถูกพัฒนาเพื่อภาษาไทยโดยเฉพาะ

 

Typhoon โมเดล AI สัญชาติไทย สู่รากฐานอุตสาหกรรม AI ของประเทศ

 

Typhoon โมเดลภาษาที่ถูกออกแบบสำหรับภาษาไทย

 

ผลงานนี้เป็นของบริษัทสตาร์ทอัพในประเทศไทยอย่าง SCB 10X  กับการวิจัยพัฒนา Typhoon โปรเจค AI สำหรับการพัฒนา AI โมเดลภาษา หรือ LLM ที่มีความเชี่ยวชาญภาษาไทยโดยเฉพาะ เพื่อจัดสร้างโมเดลที่มีความรู้ความเข้าใจเชิงลึกในภาษาและวัฒนธรรมไทย เป็นการออกแบบที่ตอบโจทย์และบริบทไทยอย่างแท้จริง

 

ทีมพัฒนาไม่ได้ริเริ่มทุกอย่างขึ้นจากศูนย์แต่นำโมเดลโอเพนซอร์สที่เปิดให้ใช้งานมาต่อยอด ในที่นี้พวกเขานำโมเดล Mistral-7B แล้วจึงขยับมาเป็น Llama3 มาเป็นรากฐาน จากนั้นจึงนำข้อมูลภาษาไทยจำนวนมหาศาลมาป้อนและเทรนโมเดล จนออกมาเป็น Typhoon ให้เราได้ใช้กัน

 

สำหรับท่านที่ใช้งานเป็นประจำย่อมทราบดีว่า เมื่อต้องใช้งานควบคู่กับภาษาไทยหลายครั้ง AI ก็ไม่ถูกต้องเสียทีเดียว บางครั้งในการแปลภาษาจากภาษาต่างประเทศมาเป็นภาษาไทย เราอาจเห็นศัพท์ที่ใช้แปลกตาไม่เป็นธรรมชาติคล้ายแปลจากอีกภาษามาห้วนๆ สาเหตุมาจากโมเดลเหล่านี้ขาดความเข้าใจและไม่ได้รับการเทรนภาษาไทยที่ดีพอ

 

กรณีนี้จะยิ่งเห็นได้ชัดหากต้องการทำงานที่ซับซ้อนขึ้น เช่น แปลงข้อมูลตัวอักษรภายในภาพมาเป็นข้อความที่ยังมีข้อจำกัดในการใช้งาน โดยเฉพาะเมื่อใช้งานกับเอกสารราชการ เช่นเดียวกับการถอดเนื้อหาเสียงเป็นข้อความ ที่ยังขาดความเข้าใจในบริบทจนเนื้อหาที่ถอดออกมาไม่แม่นยำนัก จึงยากต่อการพี่งพาหรือนำมาใช้งานเป็นวงกว้าง

 

นี่เป็นเหตุผลให้การพัฒนาโมเดล AI ในประเทศมีความสำคัญ AI ที่ผ่านการควบคุมและปรับแต่งภายในประเทศ สามารถทำความเข้าใจภาษา ความคิด และบริบททางวัฒนธรรมของเรา ทำให้ได้โมเดลที่มีประสิทธิภาพสูงที่รองรับภาษาไทยเต็มรูปแบบ และสามารถใช้งานในชีวิตประจำวันได้อย่างเป็นธรรมชาติ

 

สิ่งนี้จะช่วยเพิ่มความก้าวหน้าทางเทคโนโลยีและโอกาสทางอุตสาหกรรม AI ไทยต่อไป

 

Typhoon ทำอะไรได้บ้าง

 

ปัจจุบัน Typhoon ได้รับการออกแบบและพัฒนามาแล้วหลายเวอร์ชัน เพื่อรองรับรูปแบบการใช้งานที่แตกต่างกัน สำหรับโมเดลที่เปิดให้ใช้และเข้าถึงได้ทั่วไปมีคุณสมบัติดังนี้

 

Typhoon โมเดล AI สัญชาติไทย สู่รากฐานอุตสาหกรรม AI ของประเทศ

 

1.Typhoon ASR Real-Time

 

โมเดลนี้ได้รับการออกแบบสำหรับการถอดเสียงพูดให้ออกมาเป็นข้อความ ไม่เพียงรองรับการถอดไฟล์ทั่วไป แต่รองรับการสตรีมมิ่ง หรือการถอดเสียงพูดออกมาเป็นเนื้อหาได้ทันที ช่วยให้สามารถอดข้อความเสียงภาษาไทยออกมาเป็นเนื้อหาได้แบบเรียลไทม์ โดยไม่ต้องรอให้พูดจบแล้วนำไปประมวลผลภายหลัง

 

จุดเด่นของโมเดลนี้คือ ความเร็วประมวลผสูงมากถึง 4,097 RTFx เร็วกว่า Whisper โมเดลถอดเสียงจาก OpenAI ถึง 19 เท่า ในขณะที่ค่าความผิดพลาดในการถอดเนื้อหาอยู่ที่ 0.0984 ช่วยให้สามารถถอดเนื้อหาในระดับใกล้เคียงกับโมเดลชั้นนำระดับโลก

 

อีกหนึ่งส่วนที่ต้องพูดถึงคือ โมเดลมีขนาดเล็กสามารถทำงานได้บน CPU ทั่วไป ไม่ต้องพึ่งพากำลังประมวลซุปเปอร์คอมพิวเตอร์ ช่วยให้โมเดลทำงานได้บนคอมพิวเตอร์ส่วนตัวหรือเซิร์ฟเวอร์ขนาดเล็ก เหมาะสำหรับผู้ใช้งานที่กังวลปัญหาด้านความเป็นส่วนตัวและข้อมูลรั่วไหล

 

ไฮไลท์สำคัญของโมเดลนี้คือ ต้นทุนการใช้งาน ต้นทุนค่าบริการถอดเสียงด้วย Typhoon ASR Real-Time จะอยู่ที่ 8 สตางค์/ชั่วโมง ซึ่งเป็นค่าบริการที่ต่ำมากเมื่อเทียบกับการดึง API จากบริษัทชั้นนำ ถูกกว่า Whisper 156 เท่า และถูกกว่าบริการของ Google และ Azure ถึง 400 เท่าเลยทีเดียว

 

โมเดลนี้จึงเหมาะต่อการนำมาใช้งานต่อยอดได้หลากหลายรูปแบบ ตั้งแต่การเก็บข้อมูลรายงานประชุมหรือสัมมนาแบบเรียลไทม์ ถอดเนื้อหารายการออกมาเป็นคำบรรยาย ถอดเนื้อหาภายในวีดีโอหรือไฟล์เพื่อการศึกษา หรือแม้แต่การเป็นช่องทางให้ผู้บกพร่องทางการได้ยินเข้าใจเนื้อหาก็สามารถทำได้เช่นกัน

 

Typhoon โมเดล AI สัญชาติไทย สู่รากฐานอุตสาหกรรม AI ของประเทศ

 

2.Typhoon OCR

 

โมเดลนี้ได้รับการออกแบบให้อ่านอักษรจากภาพที่มีคุณสมบัติในการแยกแยะ ทำความเข้าใจ และวิเคราะห์เอกสารโดยเฉพาะ เพื่อแก้ปัญหาที่โมเดลส่วนใหญ่ไม่สามารถเข้าใจเนื้อหาอย่างเหมาะสม จากการแบ่งเนื้อหาออกแต่ละส่วนเป็นโทเคนแล้วค่อยนำมาตีความ ทำให้สูญเสียการทำความเข้าใจภาพรวมของเนื้อหาไป

 

ตัวโมเดล Typhoon OCR มีพื้นฐานมาจาก Qwen1.5-VL-Instruction 7 พันล้านพารามิเตอร์ จากนั้นจึงนำมาพัฒนาต่อยอดทำให้โมเดลมีขนาดเล็กลง จนสามารถลดขนาดโมเดลให้เหลือเพียง 2 พันล้านพารามิเตอร์โดยยังรักษาประสิทธิภาพเอาไว้ได้ ช่วยให้โมเดลใช้ทรัพยากรน้อย มีต้นทุนต่ำ แต่ทำงานได้รวดเร็วยิ่งขึ้น

 

จุดเด่นของโมเดลอยู่ที่การรองรับเนื้อหาหลายรูปแบบ ทั้งไฟล์ภาพหลายสกุลและ PDF วิเคราะห์รูปภาพ ตาราง และแผนภูมิในเอกสารพร้อมสร้างคำอธิบายให้สอดคล้องกับบริบทเนื้อหาภายในเอกสาร รวมถึงสามารถพิสูจน์และทำความเข้าใจสมการทางคณิตศาสตร์ เพื่อประกอบเอกสารทางงบการเงินหรือข้อมูลตัวเลขได้ดียิ่งขึ้น

 

นั่นทำให้ Typhoon OCR สามารถอ่านและทำความเข้าใจเนื้อหาเอกสารทางราชการได้อย่างแม่นยำ โดยเฉพาะการใช้งานภาษาที่มีความเฉพาะเจาะจงและตัวเลขไทย ซึ่งมักสร้างปัญหากับโมเดลทั่วไปก็ยังใช้งานได้อย่างราบรื่น แม้แต่เนื้อหาภาษาไทยที่ปะปนด้วยภาษาบาลีในเอกสารทางศาสนาก็สามารถอ่านและทำความเข้าใจได้

 

แม้แต่เอกสารในรูปแบบที่ไม่เป็นทางการประเภทใบเสร็จ เมนูอาหาร ตั๋ว หรือแม้แต่อินโฟกราฟิกก็สามารถทำความเข้าใจเนื้อหาได้ นอกจากนี้ยังสามารถอ่านและทำความเข้าใจข้อมูลที่ถูกบันทึกในรูปแบบของลายมือได้ด้วย แม้ส่วนนี้จะขึ้นอยู่กับหลายปัจจัยก็ตาม

 

นี่จึงถือเป็นโมเดลที่ไม่ได้แค่แปลงเนื้อหา แต่สามารถทำความเข้าใจเนื้อหาภายในเอกสารอย่างแท้จริง

 

 

 

 

โมเดลทั้งสองตัวสามารถเข้าถึงและใช้งานได้ทั่วไปทั้งบนแพลตฟอร์มของบริษัทและในฐานะโอเพนซอร์ส แต่แน่นอนโมเดลซีรีส์ Typhoon ยังไม่หมดแค่นี้ ปัจจุบันเริ่มมีการพัฒนา Agentic AI และเริ่มมีบางบริษัทและองค์กรที่มีการนำโมเดลเหล่านี้ไปใช้งานจริง ที่จะขอพูดถึงในโอกาสต่อไป

 

 

 

ที่มา

 

https://opentyphoon.ai/blog/th/typhoon-asr-realtime-release

 

https://opentyphoon.ai/blog/th/typhoon-ocr-release#-ocr-

 

https://www.youtube.com/watch?v=MQ6GuMG_SAI

 

ข่าวล่าสุด

Smart Money 25 สถาบันฯ ลุย ขับเคลื่อน การลงทุนมั่นคง