posttoday

เรื่องฮิตๆ จากเสิร์ชเอนจิ้นถึงโซเชียลมีเดีย

21 กันยายน 2561

เมื่อปี 1997 กูเกิลถือกำเนิดขึ้นมา เพื่อให้บริการเสิร์ชเอนจิ้น 20 ปีผ่านไป กูเกิลกลายเป็นหนึ่งในบริษัทไอทีที่ประสบความสำเร็จมากที่สุดในโลก

เรื่อง ดร.ปรัชญา บุญขวัญ

เมื่อปี 1997 บริษัทสตาร์ทอัพเล็กๆ ที่ชื่อ กูเกิลถือกำเนิดขึ้นมา เพื่อให้บริการเสิร์ชเอนจิ้น (Search Engine) หรือระบบค้นหาข้อมูลบนอินเทอร์เน็ตผ่านไป 20 ปี กูเกิลกลายเป็นหนึ่งในบริษัทไอทีที่ประสบความสำเร็จมากที่สุดในโลก ทราบหรือไม่ครับว่า เสิร์ชเอนจิ้นของกูเกิลมีความลับอะไร ถึงเอาชนะคู่แข่งและสามารถอยู่รอดในสงครามธุรกิจดอทคอมมาได้ในช่วงปี 2000

ความลับที่ว่านั้นคืออัลกอริทึมที่ชื่อว่า PageRank (เพจแรงค์) ที่พัฒนาโดย Larry Page และ Sergei Brin เจ้าของบริษัท กูเกิล PageRank เป็นส่วนหนึ่งของวิทยานิพนธ์ปริญญาเอกที่มหาวิทยาลัยสแตนฟอร์ด โดยจะวิเคราะห์ความเชื่อมโยงของเว็บไซต์ในอินเทอร์เน็ต ทำให้สามารถจัดลำดับความสำคัญของเว็บไซต์ได้โดยดูจากลิงค์เหล่านี้ การค้นพบอัลกอริทึมดังกล่าวสร้างแรงสั่นสะเทือนต่อวงการการวิจัยด้านการค้นคืนสารสนเทศ และทำให้สองสหายตัดสินใจก่อตั้งบริษัทกูเกิลขึ้นมา

ความจริงนั้นอัลกอริทึม PageRank มีหลักการที่แสนง่าย สมมติฐานก็คือ หากเว็บไซต์ไหนมีลิงค์เข้าหามันน้อย เว็บไซต์นั้นก็น่าจะมีความจำเพาะเจาะจงมากและน่าจะมีสิ่งสำคัญแฝงอยู่ และหากเว็บไซต์ใดที่ถูกชี้ด้วยเว็บไซต์ที่จำเพาะมากหลายๆ ตัว เว็บไซต์นั้นก็ยิ่งน่าจะความสำคัญมาก ความสำคัญของแต่ละเว็บไซต์นี้จะมีศัพท์ทางคณิตศาสตร์เรียกว่า “เซ็นทราลิตี้” (Centrality) ซึ่งแปลว่าความสำคัญ ด้วยหลักการนี้ เราจึงสามารถนำความสัมพันธ์ระหว่างเว็บไซต์ต่างๆ มาเขียนให้อยู่ในรูปของกราฟได้ สมมติว่ามีเว็บไซต์อยู่ 6 แห่ง แต่ละแห่งมีลิงค์ไปหากันดังในภาพที่ 1

เมื่อได้กราฟของเว็บไซต์แล้ว เราจะมาให้คะแนนลิงค์แต่ละลิงค์ในกราฟโดยดูจากความจำเพาะของเว็บต้นทาง โดยสูตร “1/n” เมื่อ n เป็นจำนวนลิงค์ที่ชี้เข้าหาเว็บต้นทาง ยิ่งจำนวนลิงค์ที่ชี้เข้าหาเว็บต้นทางมีน้อย ความจำเพาะของเว็บต้นทางก็จะสูงมาก เช่น ให้คะแนนลิงค์จากเว็บไซต์เบอร์ 6 ไปหาเว็บไซต์เบอร์ 1 โดยดูจากจำนวนลิงค์ที่เข้ามาหาเว็บไซต์เบอร์ 6

กรณีนี้มีเว็บไซต์ 2 แห่ง ที่ชี้มาที่เบอร์ 6 เราจึงให้คะแนนลิงค์จากเบอร์ 6 ไปเบอร์ 1 ด้วยคะแนน 1/2 เป็นต้น ด้วยการให้คะแนนแบบนี้ เราจึงสามารถเขียนแทนกราฟของเว็บไซต์ด้วยแมทริกส์คะแนนลิงค์ได้ โดยเว็บต้นทางจะแทนด้วยแถว (Row) และเว็บปลายทางจะแทนด้วยหลัก (Column) ดังในภาพที่ 2 จะสังเกตว่าแมทริกส์ดังกล่าวเป็นแมทริกส์จัตุรัส เพราะมีจำนวนแถวเท่ากับจำนวนหลัก

จากนั้น เราจะนำแมทริกส์ดังกล่าวมาคำนวณความสำคัญของเว็บไซต์ที่อยู่ในกราฟ ขั้นตอนแรกจะนำแมทริกส์คะแนนลิงค์มาคูณกับเวกเตอร์ตัวหนึ่ง เพื่อคำนวณว่า หากปล่อยให้มีการสัญจรภายในกราฟเพียงหนึ่งรอบ เว็บไซต์แต่ละแห่งจะมีลิงค์มาหาเป็นจำนวนเท่าไร ต่อมาเราก็จะนำเวกเตอร์ผลลัพธ์ที่ได้มาบวกกับค่าคงที่น้อยๆ เช่น 0.1 ในทุกตำแหน่ง เพื่อปรับค่าไม่ให้เป็น 0 แล้วจึงแทนที่เวกเตอร์ตัวแรกนั้นด้วยเวกเตอร์ใหม่ที่เราได้มา เราจะคูณแมทริกส์คะแนนลิงค์กับเวกเตอร์ใหม่นี้และบวกกับค่าคงที่น้อยๆ ไปเรื่อยๆ จนกว่าเวกเตอร์ที่เราได้มาจะเริ่มมีค่าเหมือนกับเวกเตอร์ตัวก่อนหน้า เราจึงจะหยุดการคำนวณ

ในทางคณิตศาสตร์ เรียกการคำนวณในลักษณะนี้ว่า Power Method หรือ “วิธีการยกกำลัง” ซึ่งใช้ในการหาเวกเตอร์คุณสมบัติเฉพาะหรือ “ไอเกนเวกเตอร์” (Eigenvector) ของแมทริกส์ เมื่อได้ไอเกนเวกเตอร์ของแมทริกส์คะแนนลิงค์มา เราจะพบว่าสมาชิกแต่ละตัวในไอเกนเวกเตอร์สามารถบอกเซ็นทราลิตี้หรือความสำคัญของแต่ละเว็บไซต์ได้ด้วย ด้วยเหตุนี้ กูเกิลจึงสามารถจัดลำดับผลลัพธ์การค้นหาข้อมูลตามคำค้นโดยดูจากค่าเซ็นทราลิตี้นี้นั่นเอง

ปัจจุบันอัลกอริทึม PageRank ถูกนำไปประยุกต์ใช้อย่างหลากหลาย เช่น นำไปคำนวณหา Micro-influencer หรือผู้มีอิทธิพลในโลกโซเชียลมีเดีย โดยจะคำนวณค่าเซ็นทราลิตี้ของผู้ใช้โซเชียลมีเดียได้จากลิงค์ในรายการเพื่อน นอกจากนี้ยังสามารถนำไปหาคำสำคัญในเอกสารได้โดยอัตโนมัติ โดยดูจากลิงค์ระหว่างคำที่ติดกันภายในเอกสาร และคำนวณเป็นค่าเซ็นทราลิตี้ของคำ คำใดที่สำคัญมากก็จะมีค่าเซ็นทราลิตี้สูง และน่าจะเป็นคำสำคัญของเอกสาร

PageRank จึงเป็นความลับเล็กๆ ที่ยิ่งใหญ่ ที่แสดงความฮิตในเครือข่ายอันกว้างใหญ่ และเปลี่ยนโลกไอทีไปตลอดกาลครับ