posttoday

Reinforcement พัฒนารูปแบบไร้ขีดจำกัด ของ Machine Learning

21 มิถุนายน 2560

พงศ์วุฒิ ไพรไพศาลกิจคงจะไม่มีใครกล้าปฏิเสธในวันนี้ว่า Machine Learning เป็นกระแสของเทคโนโลยีหลักที่เริ่มเข้าสู่ยุคของการปฏิวัติวงการอุตสาหกรรมของโลก มี Machine Learning เข้ามาเกี่ยวทั้งที่รู้ตัวและไม่รู้ตัว ที่เห็นได้ชัดที่สุดในการเปลี่ยนแปลงวงการอุตสาหกรรมเครื่องกลที่ใช้แขนกลหรือหุ่นยนต์ระดับอัจฉริยะมาทำงาน

พงศ์วุฒิ ไพรไพศาลกิจ

คงจะไม่มีใครกล้าปฏิเสธในวันนี้ว่า Machine Learning เป็นกระแสของเทคโนโลยีหลักที่เริ่มเข้าสู่ยุคของการปฏิวัติวงการอุตสาหกรรมของโลก มี Machine Learning เข้ามาเกี่ยวทั้งที่รู้ตัวและไม่รู้ตัว ที่เห็นได้ชัดที่สุดในการเปลี่ยนแปลงวงการอุตสาหกรรมเครื่องกลที่ใช้แขนกลหรือหุ่นยนต์ระดับอัจฉริยะมาทำงาน

จากข่าว AlphaGo ที่สามารถชนะแชมป์โลกได้จนเป็นที่ฮือฮาในกระแสสังคม มีการตั้งคำถามถึงรูปแบบในการ ทำงานว่าทำได้อย่างไร หากคิดง่ายๆ สามารถแปลได้ว่า Machine Learning ที่ถูกพัฒนาขึ้นมาใน AlphaGo มีความสามารถมากกว่า Machine Learning อื่นๆ หรือเปล่า??

Supervised Learning จะเป็นรูปแบบที่เจอมากที่สุด ใช้วิธีตั้งโจทย์ที่เหมาะสมให้กับระบบ ผู้ดูแลระบบจะใส่ข้อมูลให้เป็นไกด์ไลน์และให้ตัดสินใจ ภายหลัง โดยอ้างอิงจากข้อมูลที่ได้รับมาก่อนหน้านั้น แล้วระบบจะจดจำว่าหากมีข้อมูลเทียบเคียง หรือใกล้เคียงตามข้อกำหนด ระบบจะสามารถรู้ได้ว่าวัตถุชิ้นนี้คืออะไรได้นั่นเอง

จะว่าไปแล้วก็เหมือนการเรียนรู้ แบบท่องจำและเอาไปเปรียบเทียบประยุกต์ แต่หากเป็น Machine Learn ing รูปแบบ Unsupervised Learning จะต่างกันสุดขั้ว คือจะไม่มีการไกด์ไลน์ ทั้งสิ้น ระบบจะเป็นคนจัดกลุ่มของข้อมูลที่เห็นแล้วว่ามีคุณสมบัติเหมือนๆ กัน การกระทำอาจจะเกิดขึ้นเหมือนกัน

รูปแบบที่สามารถพัฒนาได้ นอกเหนือ จากทั้ง Supervised Learning และ Unsupervised Learning แล้ว ก็จะมี Reinforcement Learning (RL) ซึ่งเป็นรูปแบบที่พัฒนาไปถึงการเรียนรู้ความผิดพลาดซ้ำๆ และวิเคราะห์ออกมาเพื่อให้ได้ ผลลัพธ์ที่ดีขึ้นในครั้งต่อไป

ตัวอย่างจากรูปแบบของเจ้า RL นี้ ก็คงจะหนีไม่พ้น AlphaGo ซึ่ง Google ปล่อยให้ AlphaGo ไปทดสอบเล่นกับ ผู้คนมากมาย ทั้งการใส่รูปแบบตั้งต้นให้ บางส่วนและทำการตั้งเป้าหมาย เพื่อการ พัฒนารูปแบบการเล่นของตัวเองได้ใน ทุกสถานการณ์ แปลว่าการทำงานของ RL เป็นการคำนึงถึงปัจจัยภายนอกเป็น หลัก ทำให้การเรียนรู้สามารถพัฒนาไป ได้อย่างไม่จำกัด ซึ่งในอนาคตจะเริ่มมี ความแม่นยำและสามารถพัฒนารูปแบบ สินค้าได้พร้อมกับการผลิตในแต่ละครั้งโดยแทบจะไม่ต้องใช้นักวิเคราะห์เลย n

ข่าวล่าสุด

เลิกวนลูป! ส่อง 3 เป้าหมายยอดนิยมที่คนไทยตั้งไว้ทุกต้นปี เป็นจริงได้อย่างไร?