'Hadoop' วิเคราะห์ข้อมูลเชิงลึกธุรกิจ
โดย...OnePen
โดย...OnePen
ปัจจุบันองค์กรต่างๆ เริ่มมีการแข่งขันกันด้านการวิเคราะห์ข้อมูลมากยิ่งขึ้น ขณะที่ปัจจัยทางด้านเทคโนโลยีที่เลือกใช้กันในปัจจุบันก็มีหลายรูปแบบโครงสร้างและหนึ่งในเทคโนโลยีที่กำลังถูกกล่าวถึงมากในขณะนี้ คือ เทคโนโลยี Hadoop เนื่องจากเป็นโซลูชั่นที่ราคาไม่สูงมาก แต่ด้วยจำนวนข้อมูลที่เข้ามามากมายมหาศาล นักวิเคราะห์ข้อมูลจะมีวิธีการรับมือกับข้อมูลบนเทคโนโลยี Hadoop ได้อย่างไร เพื่อให้ได้การแสดงผลข้อมูลด้วยภาพ (Visualization) แบบแม่นยำ
ไลฟง ทราน นักกลยุทธ์เชิงเทคโนโลยีระดับภูมิภาค แซส กล่าวว่า เทคโนโลยี Hadoop มีองค์ประกอบ 2 ส่วน คือ ระบบที่มีราคาประหยัดสำหรับการจัดเก็บข้อมูลเรียกว่า Hadoop distributed file system (HDFS) และระบบที่มีเครื่องมือประมวลที่กระจายข้อมูลไปยังส่วนต่างๆ ของการปฏิบัติงานเพื่อนำข้อมูลไปใช้งาน หรือการประมวลผล Big Data ที่เรียกว่า MapReduce
อย่างไรก็ตาม เทคโนโลยี Hadoop ยังมีข้อจำกัดอยู่บ้างเมื่อมีการวิเคราะห์ข้อมูลขั้นสูง เนื่องจากซอฟต์แวร์ที่ทำงานรายล้อมเทคโนโลยี Hadoop มีหลากหลายโครงสร้าง และหากไปถึงการวิเคราะห์ข้อมูลขั้นสูงในรูปแบบโครงสร้างอีโคซิสเต็มส์ขนาดใหญ่ของเครื่องมือที่ล้ำหน้า ซอฟต์แวร์ช่วยเชื่อมข้อมูลที่ถูกสร้างขึ้นมารายรอบ จึงต้องพิจารณาถึงการวิเคราะห์ภายในหน่วยความจำที่ถูกออกแบบมาเพื่อช่วยให้ผู้ใช้เรียกดูการแสดงผลข้อมูลได้ง่ายขึ้นและรวดเร็วแบบเรียลไทม์ได้ในทุกที่
ทั้งนี้ เทคนิคการวิเคราะห์ขั้นสูง เช่น สถิติขั้นสูง คลังข้อมูล การเรียนรู้ของกลไกการทำงาน คลังข้อความ และระบบแนะนำข้อมูล ได้รับประโยชน์จากการประมวลผลแบบ In-Memory ด้วย และเป็นเหตุผลให้ผู้ค้าเทคโนโลยีหลายรายในปัจจุบันให้ความสำคัญกับการนำเสนอการประมวลผลแบบ In-Memory โดยยกข้อมูลจากเทคโนโลยี Hadoop ไปไว้ในเครื่องมือภายในหน่วยความจำเพื่อวิเคราะห์โดยใช้การคำนวณซ้ำ
ทวีศักดิ์ แสงทอง กรรมการผู้จัดการ บริษัท แซส ซอฟท์แวร์ (ไทยแลนด์) กล่าวว่า ทักษะของการทำงานก็มีความสำคัญ เพราะการทำงานในระบบเทคโนโลยี Hadoop จำเป็นต้องมีทักษะพิเศษสำหรับการวิเคราะห์บิ๊กดาต้า ซึ่งปัจจุบันจะเห็นว่านักวิเคราะห์ข้อมูลขั้นสูง เริ่มมีบทบาทมากขึ้นในฐานะผู้ที่คอยผสานรวมทักษะที่แตกต่างในเรื่องของเทคโนโลยีใหม่ๆ ที่เข้ามา เพื่อนำไปใช้ในทางปฏิบัติตามเป้าหมายที่วางไว้


