ข้อมูลของเรา เวลามีขนาดไม่เยอะ ใช้เครื่องมือธรรมดาอย่าง spreadsheet ก็น่าจะเพียงพอแล้ว แต่เวลาข้อมูลมีขนาดใหญ่ มันก็จะไม่ง่ายอย่างนั้น วันนี้คุณไอซ์ วรุฒ กฤษรุ่งเรือง Senior Data Engineer จากบริษัท Data Wow จะมาเล่าให้ฟัง ตั้งแต่ต้นทาง ไปจนถึงปลายทาง Data Pipeline ทำอย่างไร ยากไหม ติดตามได้ในตอนนี้
คำถาม
1. Data Pipeline คืออะไร แล้วมันมีประโยชน์อย่างไรครับ
2. อะไรเป็นองค์ประกอบของ Data Pipeline แล้วแต่ละส่วนมันเชื่อมโยงกันอย่างไร
3. อะไรเป็นความท้าทายเวลาเราต้องสร้าง หรือ Maintain Data Pipeline ครับ
4. ระหว่าง Batch Processing กับ Real-Time/ Streaming Data Pipeline เราเลือกใช้อย่างไร
5. คำว่า Data Pipeline คือการเอาข้อมูลมายัดใส่พวกตระกูล BigQuery หรือ RedShift หรือเปล่า
6. มีเคสที่ Data Pipeline มีบทบาทสำคัญกับธุรกิจมาเล่าให้ฟังไหม
7. อะไรเป็น Technology ที่น่าสนใจและต้องจับตามองสำหรับการทำ Data Pipeline
8. ถ้าวันนี้เราจัดการกับข้อมูลจำนวนหนึ่ง แล้วในอนาคตข้อมูลเยอะขึ้นมากๆ เราจะจัดการหรือเตรียมความพร้อมกับ Data Pipeline ได้อย่างไร
9. เราสามารถทดสอบได้ไหม ว่า Data Pipeline เราทำงานได้อย่างถูกต้อง
10. Data Pipeline มีผลกับการทำ Machine Learning หรือ Data Analytics ไหม
11. มีข้อแนะนำให้คนฟัง เวลาที่คิดจะสร้าง Data Pipeline ควรจะต้องคิดถึงเรื่องอะไรบ้างไหม