Reinforcement พัฒนารูปแบบไร้ขีดจำกัด ของ Machine Learning
พงศ์วุฒิ ไพรไพศาลกิจคงจะไม่มีใครกล้าปฏิเสธในวันนี้ว่า Machine Learning เป็นกระแสของเทคโนโลยีหลักที่เริ่มเข้าสู่ยุคของการปฏิวัติวงการอุตสาหกรรมของโลก มี Machine Learning เข้ามาเกี่ยวทั้งที่รู้ตัวและไม่รู้ตัว ที่เห็นได้ชัดที่สุดในการเปลี่ยนแปลงวงการอุตสาหกรรมเครื่องกลที่ใช้แขนกลหรือหุ่นยนต์ระดับอัจฉริยะมาทำงาน
พงศ์วุฒิ ไพรไพศาลกิจ
คงจะไม่มีใครกล้าปฏิเสธในวันนี้ว่า Machine Learning เป็นกระแสของเทคโนโลยีหลักที่เริ่มเข้าสู่ยุคของการปฏิวัติวงการอุตสาหกรรมของโลก มี Machine Learning เข้ามาเกี่ยวทั้งที่รู้ตัวและไม่รู้ตัว ที่เห็นได้ชัดที่สุดในการเปลี่ยนแปลงวงการอุตสาหกรรมเครื่องกลที่ใช้แขนกลหรือหุ่นยนต์ระดับอัจฉริยะมาทำงาน
จากข่าว AlphaGo ที่สามารถชนะแชมป์โลกได้จนเป็นที่ฮือฮาในกระแสสังคม มีการตั้งคำถามถึงรูปแบบในการ ทำงานว่าทำได้อย่างไร หากคิดง่ายๆ สามารถแปลได้ว่า Machine Learning ที่ถูกพัฒนาขึ้นมาใน AlphaGo มีความสามารถมากกว่า Machine Learning อื่นๆ หรือเปล่า??
Supervised Learning จะเป็นรูปแบบที่เจอมากที่สุด ใช้วิธีตั้งโจทย์ที่เหมาะสมให้กับระบบ ผู้ดูแลระบบจะใส่ข้อมูลให้เป็นไกด์ไลน์และให้ตัดสินใจ ภายหลัง โดยอ้างอิงจากข้อมูลที่ได้รับมาก่อนหน้านั้น แล้วระบบจะจดจำว่าหากมีข้อมูลเทียบเคียง หรือใกล้เคียงตามข้อกำหนด ระบบจะสามารถรู้ได้ว่าวัตถุชิ้นนี้คืออะไรได้นั่นเอง
จะว่าไปแล้วก็เหมือนการเรียนรู้ แบบท่องจำและเอาไปเปรียบเทียบประยุกต์ แต่หากเป็น Machine Learn ing รูปแบบ Unsupervised Learning จะต่างกันสุดขั้ว คือจะไม่มีการไกด์ไลน์ ทั้งสิ้น ระบบจะเป็นคนจัดกลุ่มของข้อมูลที่เห็นแล้วว่ามีคุณสมบัติเหมือนๆ กัน การกระทำอาจจะเกิดขึ้นเหมือนกัน
รูปแบบที่สามารถพัฒนาได้ นอกเหนือ จากทั้ง Supervised Learning และ Unsupervised Learning แล้ว ก็จะมี Reinforcement Learning (RL) ซึ่งเป็นรูปแบบที่พัฒนาไปถึงการเรียนรู้ความผิดพลาดซ้ำๆ และวิเคราะห์ออกมาเพื่อให้ได้ ผลลัพธ์ที่ดีขึ้นในครั้งต่อไป
ตัวอย่างจากรูปแบบของเจ้า RL นี้ ก็คงจะหนีไม่พ้น AlphaGo ซึ่ง Google ปล่อยให้ AlphaGo ไปทดสอบเล่นกับ ผู้คนมากมาย ทั้งการใส่รูปแบบตั้งต้นให้ บางส่วนและทำการตั้งเป้าหมาย เพื่อการ พัฒนารูปแบบการเล่นของตัวเองได้ใน ทุกสถานการณ์ แปลว่าการทำงานของ RL เป็นการคำนึงถึงปัจจัยภายนอกเป็น หลัก ทำให้การเรียนรู้สามารถพัฒนาไป ได้อย่างไม่จำกัด ซึ่งในอนาคตจะเริ่มมี ความแม่นยำและสามารถพัฒนารูปแบบ สินค้าได้พร้อมกับการผลิตในแต่ละครั้งโดยแทบจะไม่ต้องใช้นักวิเคราะห์เลย n


