15 ก.ย. 2023 เวลา 04:34 • การศึกษา

Ep12:: รักพี่เสียดายน้อง อิอิ ใช้ library ไหนทำงานกับ excel file ดีนะ

ผมละเป็นคนหนึ่งที่ทำงานกับexcel เป็นประจำ ส่วนใหญ่ยอมรับว่าใช้ VBA เป็นหลัก แต่ก็มีบ้างที่ใช้ python เข้ามาช่วยเพราะต้องยอมรับว่าตัวนี้มี library ให้เลือกใช้เยอะ และมาแรง เหมาะกับงานวิเคราะห์ และจัดการข้อมูลมากๆ เอามาใช้กับ excel คงไม่เสียหลาย
แต่เนื่องจากมี libraryเยอะจนปวดหัว เลือกมาสองตัวพอ ดูสิ ตัวไหนดี ตัวไหนเด่น library Panda และ openpyxl เป็น library ที่ใช้ในการอ่านและเขียนไฟล์ excel ด้วยภาษา python แต่มีความแตกต่างกันในหลายด้าน เช่น ประสิทธิภาพ ความยืดหยุ่น ความง่ายในการใช้งาน และความสามารถในการจัดการข้อมูล
ส่วนดีของ library Panda เป็นดังนี้
เป็น library ที่มีประสิทธิภาพสูงในการอ่านและเขียนไฟล์ excel เพราะใช้ engine xlrd และ openpyxl เป็น backend
เป็น library ที่มีความยืดหยุ่นในการจัดการข้อมูล เช่น สามารถ filter, sort, group, pivot, merge, join, concatenate, reshape, aggregate, transform และ apply function ได้
เป็น library ที่มีความง่ายในการใช้งาน เพราะมี syntax ที่เข้าใจง่ายและเป็นมาตรฐาน
เป็น library ที่มีความสามารถในการจัดการข้อมูลที่หลากหลาย เช่น text, numeric, datetime, categorical, missing, duplicate, outliers และ unstructured data
ส่วนด้อยของ library Panda เป็นดังนี้
เป็น library ที่ต้องการหน่วยความจำ RAM มากเพื่อจัดการข้อมูลขนาดใหญ่
เป็น library ที่ไม่สามารถอ่านและเขียนไฟล์ excel ที่มี format พิเศษ เช่น chart, image, macro, formula, comment, validation, filter, conditional formatting
เป็น library ที่ไม่สามารถอ่านและเขียนไฟล์ excel ที่มี password protection
เดี๋ยวจะหาว่ารำเอียง มา ดู openpyxl บ้าง นะ
ส่วนดีของ library openpyxl เป็นดังนี้
เป็น library ที่ไม่ต้องการหน่วยความจำ RAM มากเพื่อจัดการข้อมูลขนาดใหญ่
เป็น library ที่สามารถอ่านและเขียนไฟล์ excel ที่มี format พิเศษ เช่น chart, image, macro, formula, comment, validation, filter, conditional formatting
เป็น library ที่สามารถอ่านและเขียนไฟล์ excel ที่มี password protection
ส่วนด้อยของ library openpyxl เป็นดังนี้
เป็น library ที่มีประสิทธิภาพต่ำในการอ่านและเขียนไฟล์ excel เพราะต้อง load workbook object เข้า memory
เป็น library ที่มีความยืดหยุ่นน้อยในการจัดการข้อมูล เช่น ไม่สามารถ filter, sort, group, pivot, merge, join, concatenate, reshape, aggregate, transform และ apply function ได้
เป็น library ที่มีความยุ่งยากในการใช้งาน เพราะมี syntax ที่ซับซ้อนและไม่เป็นมาตรฐาน
เป็น library ที่มีความสามารถในการจัดการข้อมูลที่จำกัด เช่น ไม่สามารถจัดการ text, numeric, datetime, categorical, missing, duplicate, outliers และ unstructured data ได้
จากการเปรียบเทียบข้างต้น สรุปได้ว่า library Panda และ openpyxl มีข้อดีและข้อเสียที่แตกต่างกันอย่างชัดเจน โดย library Panda เหมาะสำหรับการจัดการข้อมูลที่ซับซ้อนและหลากหลาย แต่ library openpyxl เหมาะสำหรับการอ่านและเขียนไฟล์ excel ที่มี format พิเศษ ดังนั้นผู้ใช้ควรเลือก library ที่เหมาะสมกับงานและความต้องการของตนเอง
โฆษณา