Blockdit Logo
Blockdit Logo (Mobile)
สำรวจ
ลงทุน
คำถาม
เข้าสู่ระบบ
มีบัญชีอยู่แล้ว?
เข้าสู่ระบบ
หรือ
ลงทะเบียน
Nat Petpaisit
•
ติดตาม
22 ก.ค. 2021 เวลา 04:29 • ธุรกิจ
อย่าเริ่มวิเคราะห์ข้อมูลใน Excel ถ้าคุณยังไม่ได้ทำสิ่งต่อไปนี้!
Basic Data Cleansing Checklist for Excel
เราๆท่านๆเวลาทำข้อมูลก็คงต้องมีการเช็คทุกครั้ง แต่ Checklist นี้ถือเป็นขั้นตอนพื้นฐานที่นักวิเคราะห์ข้อมูลทุกคนควรทำก่อนเริ่มการวิเคราะห์ข้อมูลใน Excel
1. Format as Table
การทำข้อมูลให้เป็นตารางจะทำให้โปรแกรมรู้ว่าขอบเขตข้อมูลอยู่ตรงไหน และทำให้การใช้ฟังก์ชั่นต่างๆของโปรแกรมง่ายขึ้น
2. เช็คว่าทุก Column มี Heading
เพราะการที่แต่ละ Column ขาดชื่อไป จะทำให้โปรแกรมไม่สามารถวิเคราะห์ข้อมูลได้ จะพบบ่อยเวลาที่เราจะ Pivot ข้อมูลแต่เกิด Error นั่นก็เป็นเพราะว่าบาง Column ของเราไม่มีชื่อนั่นเอง
3. เช็ค Blank แปลว่าในทุกช่องของตาราง ต้องมีข้อมูล การที่ช่องบางช่องไม่มีข้อมูล จะทำให้โปรแกรมทำงานผิดพลาด หรือเราได้ข้อมูลที่ไม่ครบถ้วน ทำให้การวิเคราะห์ผิดพลาด
มีนักเรียนบางคนถามว่า อ้าว บางช่องมันไม่มีข้อมูลจริงๆ เช่น ในตารางข้อมูลรายงานผู้ป่วยโควิด จะมีช่องนึงเรื่องผู้ที่หายดีแล้ว แต่คนที่ไม่หาย ก็จะไม่มีข้อมูล เราก็จะแนะนำว่า แทนที่จะปล่อยว่าง ก็ให้ใส่เป็น "ยังไม่หาย" ไปแทน เพื่อให้ข้อมูลครบทุกช่อง
อีกอย่าง การที่กำหนดค่าลงไป จะทำให้เราเห็นว่า คอลัมน์นั้นของเราต้องทำการปรับปรุงหรือเปลี่ยนแปลงเพราะมันไม่สามารถแสดงภาพความเป็นจริงได้ ยกตัวอย่างช่องเดียวกัน เรื่องสถานะการหายจากโควิดแล้ว จะมีคนที่หาย กับคนที่ยังไม่หาย และจริงๆคือมีคนที่เสียชีวิต ดังนั้น ช่อง"สถานะการหายจากโควิด" อาจจะไม่ใช่การสร้างข้อมูลที่ดี การสร้างข้อมูลที่ดี เราอาจจะสร้างแค่ "สถานะ" แล้วมีตัวเลือกคือ "1.มีอาการ" "2.ตรวจเชื้อรอผล" "3.ติดเชื้อรอเตียง" "4.ติดเชื้อรักษารพ." "5.ติดเชื้อกักตัวที่บ้าน" ฯลฯ ซึ่งถ้ากำหนดดีๆ ใน Column เดียวจะสามารถแสดงผลทุกอย่างได้โดยไม่ต้องแยกออกมาเป็นหลายๆช่อง
4. เช็คสะกดคำผิด
ในขั้นตอนนี้ ให้เช็คสองเรื่อง เรื่องแรกคือการสะกดคำผิด สามารถใช้ฟังก์ชั่น spelling check ของ Excel ได้ เรื่องที่สองคือ เช็คตัวสะกดให้ เรื่องเดียวกัน สถานที่เดียวกัน บริษัทเดียวกัน ให้เป็นตัวสะกดแบบเดียวกัน
5. Check format
ตรวจดูว่า
ตัวเลข = number
วันที่ = date (สำหรับคนไทย อย่าลืมดูด้วยว่าใช้ ค.ศ.หรือพ.ศ. ให้เหมือนกัน)
ค่าเงิน = currency
เนื่องจาก format พวกนี้ เค้าจะมีฟังก์ชั่นบางอย่างมาช่วยให้ชีวิตเราง่ายขึ้น เช่น Slicer หรือ Timeline
เชื่อว่าถ้าก่อนวิเคราะห์ข้อมูลแล้วได้ทำตาม checklist นี้ จะทำให้ชีวิตทุกคนง่ายขึ้นอีกเยอะค่ะ
Happy Data Analyzing!
#dataanalysis #dataanalyst #วิเคราะห์ข้อมูล #excel #มือใหม่หัดโค้ด
บันทึก
โฆษณา
ดาวน์โหลดแอปพลิเคชัน
© 2024 Blockdit
เกี่ยวกับ
ช่วยเหลือ
คำถามที่พบบ่อย
นโยบายการโฆษณาและบูสต์โพสต์
นโยบายความเป็นส่วนตัว
แนวทางการใช้แบรนด์ Blockdit
Blockdit เพื่อธุรกิจ
ไทย