วันนี้เราจะมาเปรียบเทียบการจัดการกับข้อมูล 3 แบบ ได้แก่ Data Fabric ที่ใช้แนวคิดการเชื่อมโยงข้อมูลเข้าด้วยกัน, Data Mesh ที่เป็นการออกแบบโครงสร้างที่ขับเคลื่อนด้วยโดเมนปฏิบัติการและการวิเคราะห์ และ Knowledge Graph ที่เป็นแนวคิดที่ใช้กราฟแสดงการเชื่อมโยง ทั้ง 3 แบบนี้เหมือนหรือต่างกันอย่างไรบ้าง ไปดูกันเลย
เป็นเวลาเกือบหนึ่งทศวรรษหรือมากกว่านั้นแล้วที่เวนเดอร์ ผู้ให้คำปรึกษา ตลอดไปจนถึงลูกค้าของพวกเขาได้พูดคุยกันในแง่ของโครงสร้างข้อมูลหรือ Data Fabric ถ้าหาก “Big Data (ข้อมูลขนาดใหญ่)” เป็นปัญหาที่ต้องแก้ไข Data Fabric ก็แนะนำทางแก้ไว้เสร็จสรรพแล้ว
John Mashey (จอห์น แมชีย์) หัวหน้านักวิทยาศาสตร์ที่ Silicon Graphics ใช้ศัพท์คำว่า “Big Data” เพื่อบรรยายถึงชุดข้อมูลขนาดใหญ่ที่ไม่มีโครงสร้างและผลกระทบที่ของมันมีต่อโครงสร้างพื้นฐานในสไลด์นำเสนอในปี 1998 อีกทั้ง Apache Hadoop ได้รับความนิยมขึ้นมาหลังจากวิศวกรคนหนึ่งที่ New York Times ได้เขียนบล็อกในปี 2009 เกี่ยวกับการผสมผสาน PDF แบบอัตโนมัติโดยใช้ Hadoop
ศัพท์คำว่า “Data Lake” เริ่มมาเป็นที่นิยมในต้นทศวรรษ 2010 เพื่อบรรยายถึงวิธีที่ไม่เป็นทางการในการทำให้ทีมวิเคราะห์สามารถเข้าถึงข้อมูลหลายประเภทได้ Data Lake ช่วงแรก ๆ เกี่ยวข้องกับคลังแบบกระจายตามแนวทางของ Hadoop สำหรับการวิเคราะห์ที่เรียบง่าย (10000 โหนดคลัสเตอร์ของ Yahoo ซึ่งได้แรงบันดาลใจจากการเก็บข้อมูลแบบกระจายภายในช่วงแรก ๆ ของ Google )
แต่เมื่อองค์กรเพิกเฉยต่อ Data Lake ของพวกเขา นักวิจารณ์จึงรีบเรียกมันว่า “Data Swamp” แต่การใช้ Data Lake ยังคงมีต่อไปไม่น้อยลงเลย อาจเพราะว่า Data warehouse ก็มักไม่ได้รับการดูแลอย่างดีเช่นกัน
Data Fabric
ในปี 2014 SAP ใช้ “In-memory Data Fabric” เพื่ออธิบายถึงคลังข้อมูลออนไลน์ ซึ่งเป็นองค์ประกอบหลักของสายผลิตภัณฑ์ “360-degree Customer View ” จาก HANA ทุกวันนี้ Gartner ก็ใช้ศัพท์คำว่า “Data Fabric” เพื่อหมายถึงวิธีครบวงจรของการผสมผสานข้อมูลที่ต่างชนิดกัน เมื่ออ้างอิงจากโพสต์ในปี 2021 เรื่องสถาปัตยกรรม Data Fabric:
“Data Fabric ใช้ประโยชน์จากศักยภาพของทั้งมนุษย์และเครื่องจักรเพื่อเข้าถึงข้อมูลที่มีอยู่ อีกทั้งยังระบุและเชื่อมโยงข้อมูลจากการใช้งานที่แตกต่างกันเพื่อค้นพบความสัมพันธ์เชิงธุรกิจใหม่ ๆ ระหว่าง Data Point ที่มีอยู่”
แนวคิดเรื่อง Data Mesh ยังอยู่ในระยะเริ่มต้น วิสาหกิจผู้ทำความเข้าใจเรื่อง Data Mesh บอกว่า Data Mesh ไม่ใช่จุดหมายปลายทางแต่เป็นการเดินทางมากกว่า ความพยายามในช่วงแรกมักใช้ไปกับการค้นคว้า หาวิธีที่จะนำไปใช้ให้เกิดประโยชน์ที่สุด และจัดสรรทรัพยากรที่ Data Mesh จำเป็นต้องใช้
การวิเคราะห์ของ Google Trends เรื่องความนิยมในการค้นหาคำศัพท์สามคำนั้นในปีที่ผ่านมายกให้ Knowledge Graph เป็นอันดับหนึ่ง Data Mesh เป็นอันดับสองและ Data Fabric เป็นอันดับสาม
ไม่มีวิธีไหนในสามวิธีนี้ที่ง่ายและสามารถนำมาใช้งานได้เลย แม้ว่า Data Fabric จะใช้การลงทุนด้านองค์กรน้อยทีสุด แต่ก็ให้ผลลัพธ์ที่คุ้มค่าน้อยที่สุดเช่นกัน ขณะที่ Data Mesh ก็ถูกพูดถึงโดยผู้พัฒนาและหลักการทำงานของมันมากกว่า ส่วน Knowledge Graph มีพื้นฐานมาจากการใช้นำเสนอข้อมูลและ Logic Programming จึงไม่ใช่หัวข้อที่เจ้าหน้าที่ไอทีทั่วไปจะคุ้นเคยนัก
KM Shop ในองค์กรแห่งหนึ่งจะสามารถมีทักษะภายในเทียบเท่าเจ้าหน้าที่วิศวกรไอทีได้ ก็ต่อเมื่อมีพรสวรรค์เท่านั้น กราฟต้องอาศัยความสามารถในการจูงใจมากกว่า และต้องพึ่งความสามารถในการหาผู้ฟังที่เปิดรับ พร้อมกับงบประมาณให้เสี่ยง แต่ประโยชน์จากการนำไปใช้งานได้จริงอาจมีมากกว่าที่คิด และส่วนมากขึ้นอยู่กับเห็นคุณค่าในประโยชน์ที่ตามมาเหล่านี้และทำความเข้าใจให้มากขึ้น