posttoday

SCB X เปิดตัว TYPHOON โมเดลภาษาไทยขนาดใหญ่ท้าทาย Chat GPT

11 มีนาคม 2567

สุธีรพันธุ์ สักรวัตร Chief Customer Officer บริษัท SCB X จำกัด (มหาชน) ชี้การทำ AI มีความสำคัญกับองค์กร และต้องลงทุนใส่ข้อมูลเชิงลึกด้วยตัวเอง เผยจุดเด่น “Typhoon” ที่สุดของ Large Language Model สำหรับภาษาไทยในตลาดขณะนี้ จาก SCB 10X

สปริงนิวส์ เปิดเวที อนาคตประเทศไทย Next Step Thailand 2024 : Tech & Sustain ก้าวต่อไปของนวัตกรรมและความยั่งยืน ณ โรงแรมอีสติน แกรนด์ พญาไท วันที่ 11 มีนาคม พ.ศ. 2567 เวลา 12.00 - 16.30 น.

สุธีรพันธุ์ สักรวัตร Chief Customer Officer บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) พูดถึงบทบาทของ AI ในปัจจุบันโลกว่ามีความสำคัญในการรวบรวมข้อมูลอย่างมาก ปัจจุบันมี Chat GPT , Gemini ส่วนของ SCB 10X มี Typhoon ที่ช่วยให้ชีวิตประจำวันง่ายขึ้น
 

SCB X  เปิดตัว TYPHOON โมเดลภาษาไทยขนาดใหญ่ท้าทาย Chat GPT

"การทำ AI มีความสำคัญกับองค์กร และต้องลงทุนข้อมูลเชิงลึกด้วยตัวเอง เรายอมรับว่า Chat GPT มีการจัดเรียงข้อมูลที่สวยงามและเป็นหัวข้ออ่านง่ายกว่า แต่ในอนาคต Typhoon จะพัฒนาเรื่องการจัดเรียงข้อความฝให้อ่านง่ายขึ้น" สุธีรพันธุ์ สักรวัตร Chief Customer Officer บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) กล่าว

สำหรับ Typhoon-7B” โมเดลภาษาขนาดใหญ่ที่พัฒนาให้เข้าใจและสื่อสารภาษาไทยโดยเฉพาะ (Large Language Model Optimized For Thai) เพื่อเอาชนะความท้าทายดังกล่าว 

Typhoon-7B เป็นโมเดลภาษาไทยขนาด 7 พันล้านพารามิเตอร์ ซึ่งได้รับการประเมินผลว่ามีประสิทธิภาพสูงสุดในตลาดในขณะนี้และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย จากการวัดผลด้วยข้อสอบภาษาไทยที่มีระดับความยากเทียบเท่าข้อสอบมัธยมปลาย เช่น O-NET, TGAT, TPAT, A-Level รวมถึงแบบทดสอบ IC (Investment Consultant) สำหรับผู้ให้คำปรึกษาด้านการลงทุน 

ที่สำคัญ Typhoon-7B สามารถประหยัดจำนวนโทเคนภาษาไทยได้มากกว่า GPT-4 ถึง 2.62 เท่า ซึ่งเป็นสัญญาณที่ดีของการพัฒนาโมเดลขนาดใหญ่ฝีมือคนไทย

Typhoon-7B ได้รับการพัฒนาต่อยอดจากโมเดล “Mistral-7B” โดยได้มีการเพิ่มคำศัพท์ภาษาไทยเข้าไปอีกกว่า 5,000 คำ ซึ่งได้รับการฝึกและปรับแต่ง (Finetuning) อย่างต่อเนื่องด้วยโมเดลเสริมอย่าง Low-Rank Adaptation (LoRA) ที่มีการใช้อย่างแพร่หลายและมีประสิทธิผลสูง

SCB X  เปิดตัว TYPHOON โมเดลภาษาไทยขนาดใหญ่ท้าทาย Chat GPT
 

เพื่อการต่อยอดและพัฒนาในวงกว้างและเป็นประโยชน์กับการพัฒนาโมเดลภาษาไทยขนาดใหญ่ในอนาคต SCB 10X ได้ปล่อยโมเดล Typhoon-7B เวอร์ชัน Pretrained ให้ใช้งานได้ฟรี โดยเป็นโมเดลเวอร์ชันพื้นฐานที่สามารถนำไปปรับแต่งและใช้งานต่อยอดได้ตามต้องการ

"ประเทศไทยอาจจะยังพึ่งพาเครื่องมือต่างชาติอยู่ แต่เราก็ต้องการข้อมูลที่ถูกต้อง หลายอย่างที่มากมายจะถูกนำมารวมกันเพื่อปลดล็อคบางอย่างในธุรกิจของเรา" สุธีรพันธุ์  ปิดท้าย

SCB X  เปิดตัว TYPHOON โมเดลภาษาไทยขนาดใหญ่ท้าทาย Chat GPT

โมเดล “Typhoon-7B” ถือเป็นข้อพิสูจน์ความก้าวหน้าในการสร้างโมเดลภาษาไทยขนาดใหญ่ ด้วยการก้าวข้ามความท้าทายของภาษาที่มีทรัพยากรจำกัด (Low-resource Language) อย่างภาษาไทย

Typhoon-7B ไม่เพียงแต่มีประสิทธิภาพเหนือกว่าโมเดลภาษาไทยอื่นๆ ที่มีอยู่ในตลาดเท่านั้น แต่ยังแข่งขันได้อย่างทัดเทียมกับโมเดลภาษาขนาดใหญ่ระดับโลกที่รองรับภาษาไทย จึงเป็นอีกก้าวสำคัญในการศึกษาเทคโนโลยีการประมวลผลภาษาธรรมชาติของภาษาไทย (Thai Natural Language Processing หรือ Thai NLP) เพื่อต่อยอดโมเดล AI ที่เข้าใจภาษา วัฒนธรรม และความต้องการของคนไทยมากยิ่งขึ้น 

สำหรับผู้ที่สนใจและนักพัฒนาสามารถทดลองใช้ Typhoon-7B เวอร์ชัน Pretrained Model ภายใต้ใบอนุญาต Apache 2.0 โดยไม่มีค่าใช้จ่าย ดาวน์โหลดได้ที่ https://huggingface.co/scb10x/typhoon-7b 
 

ข่าวล่าสุด

ดูบอลสด ถ่ายทอดสด บีจี ปทุม พบ เมืองทอง ฟุตบอลไทยลีก วันนี้ 14 ธ.ค.68