25 มี.ค. 2022 เวลา 05:19 • วิทยาศาสตร์ & เทคโนโลยี
การจะสร้าง Data Visualization จำเป็นต้องทำข้อมูลให้อยู่ในรูปแบบที่เหมาะจะนำไปทำ Dashboard ต่อ ซึ่งใน Power BI จะมีเครื่องมือที่เรียกว่า DAX ที่จะช่วยจัดการข้อมูล
แล้ว DAX คืออะไร? ใช้งานอย่างไร?
วันนี้เราจะมาทำความเข้าใจการใช้ DAX ขั้นพื้นฐานกัน ถ้าพร้อมแล้วก็ไปกันเลย!
พื้นฐานการใช้งาน Data Analysis Expressions (DAX)
ในการสร้าง Data Visualization จะต้องมีการจัดการข้อมูลเพื่อให้อยู่ในรูปแบบที่เหมาะสมสำหรับในไปใช้ในการสร้าง Dashboard สำหรับใน Power BI เรามีเครื่องมือที่ใช้ในการจัดการข้อมูลที่เรียกว่า DAX สำหรับบทความนี้ เราจะสำรวจว่า DAX คืออะไร และจัดเตรียมข้อมูลในขั้นลึกขึ้นโดยใช้เครื่องมือตัวนี้กัน
DAX คืออะไร
Data Analysis Expressions หรือที่เรียกกันโดยทั่วไปว่า DAX คือชุดฟังก์ชันเพื่อทำงานกับข้อมูลในผลิตภัณฑ์ของไมโครซอฟต์ เช่น Power Pivot, Power BI และ SQL Analysis Server ชุดฟังก์ชันของ DAX จะคล้ายกับชุดฟังก์ชันที่ใช้งานบนโปรแกรม Excel โดยชุดฟังก์ชันที่ใช้งานบน Excel จะทำงานกับข้อมูลในลักษณะที่เป็น แผ่นงาน (Worksheet), ตาราง (Table) และเซล (Cell) ในขณะที่ชุดฟังก์ชันของ DAX จะทำงานกับข้อมูลในลักษณะที่เป็น ตาราง (Table), คิวรี่ (Query), คอลัมน์ข้อมูล (Column) และแถวข้อมูล (Row)
จึงทำให้การออกแบบฟังก์ชันและอากิวเมนต์ของชุดฟังก์ชันของ DAX และชุดฟังก์ชันที่ใช้งานบน Excel แตกต่างกัน ในบทความนี้เราจะพูดถึงสิ่งที่ควรทราบในการใช้งานชุดฟังก์ชันของ DAX และพื้นฐานในการใช้งานชุดฟังก์ชันของ DAX โดยอ้างอิงการใช้งานในโปรแกรม Power BI
ความหมายของ DAX และข้อมูลใน DAX
การอ้างอิงถึงตารางข้อมูล
การอ้างอิงถึงตารางข้อมูลใน DAX จะใช้เครื่องหมาย Single Quotation Marks ‘…’ ครอบชื่อตารางข้อมูล เช่น ตารางข้อมูล FacotoryData จะถูกเขียนอ้างอิงด้วย ‘FactoryData’ (ถ้าชื่อตารางไม่มีช่องว่าง สามารถยกเว้นการใส่เครื่องหมาย Single Quotation Marks ได้)
การอ้างอิงถึงคอลัมน์ข้อมูลในตาราง
การอ้างอิงถึงคอลัมน์ข้อมูลในตาราง จะใช้เครื่องหมาย Square Brackets […] ครอบชื่อคอลัมน์ข้อมูล เช่น คอลัมน์ชื่อ Country จะถูกเขียนอ้างอิงด้วย [Country] เช่น คอลัมน์ชื่อ Country ในตาราง Province จะถูกเขียนอ้างอิงด้วย ‘Province'[Country]
คอลัมน์คำนวณ (Calculated Column)
คอลัมน์คำนวณ เป็นการสร้างคอลัมน์ใหม่เพิ่มเติมเข้าไปในตารางข้อมูลใน Data Model ของ Power BI (ไม่ได้เพิ่มคอลัมน์ใหม่ในไฟล์ข้อมูลต้นทาง) การประมวลผลค่าข้อมูลใน Calculated Column จะเกิดขึ้นเมื่อมีการประมวลผลข้อมูลจาก Data Model แล้วนำผลที่ได้จากการประมวลผลจัดเก็บลงในคอลัมน์ใหม่ที่สร้างขึ้น ค่าที่ได้จะปรากฏในตารางข้อมูล
คอลัมน์คำนวณจะทำงานกับแถวข้อมูลปัจจุบัน (Current Row) การคำนวณจะอยู่บนพื้นฐานของข้อมูลแถวนั้น ๆ และนำค่าที่ได้มาใส่ไว้ในคอลัมน์ใหม่ที่สร้างขึ้นบนแถวข้อมูลเดียวกัน เช่น ในรูปที่ 1 ตารางข้อมูล Order ทำการสร้างคอลัมน์ใหม่เพื่อเก็บข้อมูลยอดขาย ตั้งชื่อคอลัมน์ว่า Sales โดยคอลัมน์นี้เกิดจากการคำนวณของคอลัมน์จำนวน (Amount) และคอลัมน์ราคาต่อหน่วย (UnitPrice) บนแถวข้อมูลปัจจุบัน สามารถสร้างคอลัมน์คำนวณโดยเขียนคำสั่งดังรูป
Calculated Column vs Measure
สูตรคำนวณ (Measure)
สูตรคำนวณ เป็นการสร้างสูตรสำหรับการคำนวณข้อมูล โดยสูตรจะอยู่ในรูปของนิพจน์ Expression ในตารางข้อมูล ส่วนใหญ่มักใช้งานร่วมกับฟังก์ชันผลรวม (Aggregate) ต่าง ๆ เช่น การหาค่าผลรวม, การหาค่าเฉลี่ย, การหาค่าต่ำสุดหรือสูงสุด ฟังก์ชันหรือสูตรจะถูกประมวลผลเมื่อมีการเรียกดูข้อมูลหรือแสดงผล
ดังนั้นผลของการคำนวณ Measure จะไม่ปรากฏในตารางข้อมูล แต่จะเป็นการบันทึกสูตรเก็บไว้สำหรับการเรียกคำนวณเมื่อมีการต้องการแสดงผล เช่น ในรูปที่ 2 ตารางข้อมูล Order ต้องการคำนวณค่าผลรวมของยอดขาย ตั้งชื่อ Measure ว่า SumSales สามารถสร้างสูตรคำนวณโดยเขียนคำสั่งดังรูปด้านบน
ตารางคำนวณ (Calculated Table)
ตารางคำนวณ คือตารางข้อมูลที่เกิดขึ้นจากการใช้ฟังก์ชันตารางใน DAX เช่น FILTER, VALUES, ALL โดยเมื่อสั่งให้ฟังก์ชันทำงานแล้ว ฟังก์ชันจะส่งค่ากลับมาเป็นตารางข้อมูล ไม่ใช่ค่าข้อมูลเพียงค่าเดียว และเมื่อได้ตารางข้อมูลแล้วอาจจะมีการนำตารางเข้าไปทำงานต่อในสูตรคำนวณหรือคอลัมน์คำนวณทันที
หรืออาจจะเก็บไว้เป็นตารางในระบบเพื่อไว้ใช้งานต่อ เช่น จากตารางข้อมูล Order ทำการสร้างตารางใหม่ ตั้งชื่อว่า ItemSales โดยทำการกรองข้อมูลจากตาราง Order เลือกค่าของข้อมูลที่คอลัมน์ Amount มีค่ามากกว่า 10
แสดงตัวอย่างการประมวลผลค่าข้อมูลใน Calculated Table
ชุดฟังก์ชันใน DAX
ชุดฟังก์ชันใน DAX สามารถแบ่งเป็นหมวดหมู่ได้ประมาณ 11 หมวดหมู่ แยกตามลักษณะการใช้งานได้ดังต่อไปนี้
ชุดฟังก์ชันใน DAX
1.ฟังก์ชันวันที่และเวลา (Date and Time Functions) เป็นชุดฟังก์ชันที่ใช้ในการประมวลผลข้อมูลเรื่องวันที่และเวลา ตัวอย่างฟังก์ชัน CALENDAR, DATE, YEAR, MONTH, DAY, WEEKDAY, WEEKNUM
2.ฟังก์ชันการกรองข้อมูล (Filter Functions) เป็นชุดฟังก์ชันที่ใช้ในการจัดการการกรองข้อมูล เพื่อให้ได้ชุดข้อมูลตามที่ต้องการ ตัวอย่างฟังก์ชัน ALL, ALLEXCEPT, ALLSELECTED, CALCULATE, FILTER, RELATED, SELECTED VALUE
3.ฟังก์ชันทางการเงิน (Finance Functions) เป็นชุดฟังก์ชันที่เกี่ยวข้องกับการคำนวณด้านการเงิน ตัวอย่างฟังก์ชันเช่น FV, PMT, RATE
4.ฟังก์ชันข้อมูล (Information Functions) เป็นชุดฟังก์ชันที่ให้ข้อมูลเกี่ยวกับคุณลักษณะของข้อมูล ตัวอย่างฟังก์ชัน CONTAINS, ISBLANK, ISERROR, ISNUMBER, ISTEXT, LOOKUPVALUE ฟังก์ชันในกลุ่มนี้จะให้ผลลัพธ์เป็นข้อมูลแบบ Boolean คือ True (1) หรือ False (0) เท่านั้น
5.ฟังก์ชันตรรกศาสตร์ (Logical Functions) เป็นชุดฟังก์ชันที่ใช้ในการปฏิบัติการเชิงตรรกศาสตร์ ตัวอย่างฟังก์ชัน AND, OR, IN, IF, SWITCH
6.ฟังก์ชันทางคณิตศาสตร์ (Math and Trigonometry Functions) เป็นชุดฟังก์ชันการคำนวณทางคณิตศาสตร์ และการคำนวณทางตรีโกณมิติ เช่น ABS, PI, ROUND
7. ฟังก์ชันความสัมพันธ์ระหว่างตาราง (Relationship Functions) เป็นชุดฟังก์ชันสำหรับจัดการและใช้งานที่เกี่ยวข้องกับความสัมพันธ์ระหว่างข้อมูล ตัวอย่างฟังก์ชัน CROSSFILTER, RELATED, RELATEDTABLE, USERELATIONSHIP
8. ฟังก์ชันทางสถิติ (Statistical Functions) เป็นชุดฟังก์ชันสำหรับการคำนวณทางสถิติ เช่น CHISQ.DIST, MEDIAN, NORM.DIST
9. ฟังก์ชันข้อความ (Text Functions) เป็นชุดฟังก์ชันสำหรับการจัดการตัวอักษรและข้อความ เช่น FIXED, FORMAT, LEN
10.ฟังก์ชันเวลาอัจฉริยะ (Time-Intelligence Functions) เป็นชุดฟังก์ชันที่ใช้จัดการข้อมูลเชิงมิติของเวลา เพื่อให้ได้ชุดข้อมูลในช่วงเวลาที่ต้องการ ตัวอย่างฟังก์ชัน DATEADD, DATESBETWEEN, ENDOFYEAR, PARALLELPERIOD, TOTALYTD
11.ฟังก์ชันการรวม (Aggregation Functions) เป็นชุดฟังก์ชันสำหรับการคำนวณค่าตัวเลขพื้นฐาน ตัวอย่างฟังก์ชัน AVERAGE, COUNT, MAX, MIN, SUM
อ่านตัวอย่างการใช้งาน DAX และบทความเพิ่มเติมได้ที่
#BigData #ดาต้า #Data #ข้อมูล #digital #ดิจิทัล #Tech #Technology #เทคโนโลยี #DAX #DataAnalysisExpressions
โฆษณา