Blockdit Logo
Blockdit Logo (Mobile)
สำรวจ
ลงทุน
คำถาม
เข้าสู่ระบบ
มีบัญชีอยู่แล้ว?
เข้าสู่ระบบ
หรือ
ลงทะเบียน
อาจวรงค์ จันทมาศ
•
ติดตาม
21 ธ.ค. 2022 เวลา 08:06 • วิทยาศาสตร์ & เทคโนโลยี
Correlation และ Regression ในวิชาสถิติคืออะไร?
เวลาเรียนวิชาสถิติ คำว่า สหสัมพันธ์ (Correlation) และ Regression นั้นปรากฏขึ้นมาบ่อยมาก หลายๆคนอาจจะเคยคำนวณเกี่ยวกับตัวแปรทั้งสองนี้ แต่อาจไม่ทราบว่ามันคืออะไรกันแน่ บทความนี้จะอธิบายให้เห็นความหมายกว้างๆและความแตกต่างของสองอย่างนี้ครับ
3
ก่อนอื่นต้องเข้าใจว่า เวลามีเหตุการณ์อะไรสักอย่างเกิดขึ้น มนุษย์เรามีความสนใจว่า มันมีความเกี่ยวข้องกับอีกเหตุการณ์หนึ่งมากน้อยแค่ไหน เช่น การใส่เสื้อสีนี้มีความสัมพันธ์กับยอดขายสินค้าหรือไม่? , การล้างรถมีความสัมพันธ์กับฝนที่จะตกตามมาหรือไม่ ฯลฯ
1
เมื่อเราเกิดข้อสงสัยในลักษณะนี้ สิ่งที่ทำได้ก็คือ คอยสังเกตและเก็บข้อมูล พอเวลาผ่านไปสักระยะ เราจะเริ่มมองเห็นรูปแบบและสร้างทฤษฎีส่วนตัวขึ้นจากข้อมูลที่มี เช่น การใส่เสื้อสีสดใสมักจะทำให้ขายของได้ดี หรือ การล้างรถเหนี่ยวนำให้เกิดฝนฟ้าคะนองได้ *
1
อย่างไรก็ตาม การเก็บข้อมูลอย่างไม่เป็นระบบและการวิเคราะห์ด้วยความรู้สึกอาจทำให้ทฤษฎีของเราผิดพลาด หรืออย่างน้อยก็ขาดความแม่นยำได้
Correlation และ Regression เป็นอุปกณ์ทางสถิติที่จะมาช่วยตอบคำถามและวิเคราะห์ โดย Correlation บอกเราได้ว่าตัวแปรที่เราสนใจมีความสัมพันธ์กันหรือไม่ และมันสัมพันธ์กันมากน้อยแค่ไหน ส่วน Regression จะทำให้เรารู้ว่าเมื่อตัวแปรหนึ่งมีค่าเท่านี้ อีกตัวจะมีค่าเท่าไหร่
2
ตัวอย่าง Correlation ที่เป็นไปได้
ตัวอย่างคลาสสิคที่มักมีการหยิบยกขึ้นมาคือ สมมติว่า ยอดขายชุดว่ายน้ำ กับ ไอศครีม ในตลาดแห่งหนึ่งมีความสัมพันธ์กัน โดยยิ่งยอดขายชุดว่ายน้ำมีค่ามาก ยอดขายไอศครีมก็ยิ่งมากตามไปด้วย สิ่งหนึ่งที่ต้องระมัดระวังคือ แม้ตัวแปรสองอย่างจะมีความสัมพันธ์กัน แต่ไม่ได้หมายความว่ามันจะเป็นสาเหตุของกันและกัน
3
แน่นอนว่าการเพิ่มขึ้นของยอดขายชุดว่ายน้ำ ไม่ได้แปลว่า การซื้อชุดว่ายน้ำกระตุ้นให้คนอยากกินไอสครีมเพิ่มขึ้น หรือ การกินไอศครีมเป็นการกระตุ้นให้คนอยากว่ายน้ำมากขึ้น สาเหตุที่แท้จริงนั้นอาจเป็นอย่างอื่น เช่น ช่วงที่ยอดขายสองอย่างนี้ดีมากๆ คือฤดูร้อน ซึ่งอากาศที่ร้อนต่างหากเป็นสาเหตุที่ทำให้ทั้งสองอย่างนี้ขายดีพร้อมๆกัน
ยอดขายไอศกรีม กับ ชุดว่ายน้ำ สัมพันธ์กัน แต่ไม่ได้เป็นเหตุเป็นผลกัน
จะเห็นได้ว่าการวิเคราะห์ความสัมพันธ์นั้นเป็นเครื่องมือที่มีประโยชน์มาก ทั้งแง่การวิจัย ไปจนถึง ความเป็นเอกฉันท์ในการตัดสินอะไรสักอย่าง
คราวนี้ สมมติว่าถ้าเราจะเปิดร้านค้าขนาดย่อมๆร้านหนึ่ง ไม่ได้เล็กอย่างร้านสะดวกซื้อ แต่ก็ไม่ได้ใหญ่โตอย่างห้างสรรพสินค้า หนึ่งในคำถามสำคัญคือ ควรจะใช้พนักงานกี่คนจึงจะพอดีกับลูกค้า เพราะถ้าพนักงานน้อยไปย่อมดูแลลูกค้าได้ไม่ทั่วถึง แต่ถ้าพนักงานมากไปก็จะเสียค่าใช้จ่ายต่อเดือนมาก
เราจึงไปเก็บข้อมูลร้านลักษณะเดียวกันที่มีขนาดเล็ก ใช้พนักงานน้อย ที่พอดีกับลูกค้าจำนวนน้อย รวมทั้งร้านใหญ่ๆที่ใช้พนักงานมาก พอดีกับลูกค้าจำนวนมาก แล้วนำข้อมูลมาวิเคราะห์ด้วย Regression จะได้เส้นกราฟออกมา ซึ่งเส้นกราฟดังกล่าวจะบอกเราได้ว่า ร้านค้าขนาดกลางๆของเราที่กะประมาณจำนวนลูกค้าไว้แล้ว ควรจะต้องใช้พนักงานกี่คนจึงจะพอดี
1
จำนวนพนักงานที่เหมาะสมกับจำนวนลูกค้า อยู่ในตำแหน่งจุดเขียว
กล่าวได้ว่า Regression ช่วยเราทำนายค่าของตัวแปรหนึ่ง เมื่อเรารู้ค่าอีกตัวแปรหนึ่งที่สัมพันธ์กันอยู่
1
สรุปสั้นๆได้ว่า Correlation ช่วยให้เรารู้ว่าตัวแปรสองอย่างสัมพันธ์กันแค่ไหน ส่วน Regression ช่วยเราวิเคราะห์ต่อไปว่าเหล่าตัวแปรที่สัมพันธ์นั้น สัมพันธ์กันอย่างไร ถ้าตัวแปรหนึ่งมีค่าเท่านี้ อีกตัวจะมีค่าเท่าไหร่
1
แนวคิดกว้างๆก็ประมาณนี้ ที่เหลือเป็นเทคนิคเชิงการคำนวณเพื่อให้ได้คำตอบ ซึ่งไม่ยากเกินกว่าความพยายามครับ
*จริงๆเราทำการทดลองเพื่อทดสอบทฤษฎีเหล่านี้ได้ไม่ยาก อย่างเรื่องสีเสื้อสดใสนั้นอาจทดลองใส่เสื้อสีสดแบบสะท้อนแสงไปจนถึงย้อมผมให้สีสุดโต่งไปเลย แล้วบันทึกผล
16 บันทึก
33
1
11
16
33
1
11
โฆษณา
ดาวน์โหลดแอปพลิเคชัน
© 2024 Blockdit
เกี่ยวกับ
ช่วยเหลือ
คำถามที่พบบ่อย
นโยบายการโฆษณาและบูสต์โพสต์
นโยบายความเป็นส่วนตัว
แนวทางการใช้แบรนด์ Blockdit
Blockdit เพื่อธุรกิจ
ไทย