22 ก.ย. เวลา 14:31 • การศึกษา
Ai By Shoper Gamer

Overfitting คืออะไร

โดย
Overfitting หรือ การเรียนรู้แบบจำลองมากเกินไป ในภาษาไทย หมายถึง สถานการณ์ที่โมเดล Machine Learning เรียนรู้ข้อมูลฝึกสอนได้ดีเกินไปจนสามารถจำรูปแบบของข้อมูลฝึกสอนได้หมด แต่กลับไม่สามารถนำไปทำนายข้อมูลใหม่ที่ไม่เคยเห็นมาก่อนได้อย่างแม่นยำ คิดง่ายๆ เหมือนกับนักเรียนที่ท่องจำคำตอบในข้อสอบได้หมด แต่พอเจอโจทย์ที่ไม่เคยทำมาก่อนกลับทำไม่ได้
1
  • ​หลักการทำงาน
○ โมเดลซับซ้อนเกินไป
โมเดลมีพารามิเตอร์มากเกินไป ทำให้สามารถจับรูปแบบที่ซับซ้อนของข้อมูลฝึกสอนได้ละเอียดมาก
○ ข้อมูลฝึกสอนมีขนาดเล็ก ข้อมูลฝึกสอนมีจำนวนน้อย ทำให้โมเดลเรียนรู้จากรูปแบบที่เฉพาะเจาะจงของข้อมูลนั้นๆ มากเกินไป
○ Noise ในข้อมูล
ข้อมูลฝึกสอนมีสัญญาณรบกวน (Noise) ทำให้โมเดลเรียนรู้รูปแบบที่ไม่ใช่สัญญาณที่แท้จริงของข้อมูล
  • ​ประเภทของ Overfitting
○ Overfitting ในการเรียนรู้ของเครื่อง
เกิดขึ้นเมื่อโมเดล Machine Learning เรียนรู้ข้อมูลฝึกสอนได้ดีเกินไปจนไม่สามารถทำนายข้อมูลใหม่ได้
○ Overfitting ในสถิติ
เกิดขึ้นเมื่อโมเดลทางสถิติมีความซับซ้อนเกินไปจนสามารถอธิบายความแปรปรวนของข้อมูลได้ทั้งหมด รวมถึงความแปรปรวนที่เกิดจากสัญญาณรบกวน
  • ​ผลกระทบ
○ โมเดลไม่สามารถ Generalize
โมเดลไม่สามารถนำไปใช้กับข้อมูลใหม่ได้อย่างแม่นยำ
○ ประสิทธิภาพในการทำนายต่ำ
โมเดลให้ผลการทำนายที่ไม่ดีบนข้อมูลทดสอบ
○ ความซับซ้อนของโมเดลสูงโมเดลมีความซับซ้อนและใช้ทรัพยากรในการคำนวณมาก
  • ​วิธีแก้ไข
○ ลดความซับซ้อนของโมเดลลดจำนวนพารามิเตอร์ในโมเดล
○ เพิ่มขนาดของข้อมูลฝึกสอนรวบรวมข้อมูลฝึกสอนให้มากขึ้น
○ Regularization
เพิ่มเทอมการลงโทษในฟังก์ชันวัตถุประสงค์เพื่อลดความซับซ้อนของโมเดล
○ Cross-Validation
แบ่งข้อมูลออกเป็นหลายส่วนเพื่อประเมินประสิทธิภาพของโมเดล
○ Early Stopping
หยุดการฝึกโมเดลเมื่อประสิทธิภาพบนข้อมูลตรวจสอบเริ่มลดลง
  • ​ตัวอย่างการใช้งาน
○ การพยากรณ์ราคาหุ้น
ถ้าโมเดลเรียนรู้ข้อมูลราคาหุ้นในช่วงเวลาสั้นๆ มากเกินไป อาจทำให้โมเดลจับรูปแบบที่เฉพาะเจาะจงของช่วงเวลานั้นได้ แต่ไม่สามารถทำนายราคาหุ้นในอนาคตได้อย่างแม่นยำ
○ การจำแนกภาพ
ถ้าโมเดลเรียนรู้ภาพฝึกสอนที่มุมมองเดียว อาจทำให้โมเดลจำแนกภาพที่มุมมองอื่นได้ผิดพลาด
✏️ Shoper Gamer
Credit :
👇
  • ​http://jitce.fti.unand.ac.id/index.php/JITCE/article/view/68
  • ​https://medium.com/@704/regularization-more-than-one-way-to-solve-a-problem-under-construction-f8e84e179c8c
  • ​https://machinelearningmastery.com/overfitting-and-underfitting-with-machine-learning-algorithms/

ดูเพิ่มเติมในซีรีส์

โฆษณา