28 ธ.ค. 2024 เวลา 10:06 • การศึกษา

การวิเคราะห์ความสัมพันธ์ (Correlation): ความสัมพันธ์หรือความบังเอิญ? 🤔

ในชีวิตประจำวัน เรามักพบเห็นปรากฏการณ์ที่ดูเหมือนจะมีความสัมพันธ์กัน เช่น การเพิ่มชั่วโมงการอ่านหนังสือส่งผลให้คะแนนสอบสูงขึ้น ดูเหมือนจะสัมพันธ์กันนะ เช่นยอดขายน้ำอัดลมที่เพิ่มขึ้นในช่วงหน้าร้อน แต่คำถามคือ มันร้อนทั้งปีหรือเปล่าในเมืองไทยเรา? 🤔 หรือยอดขายยาแก้ไอและยอดขายร่มที่เพิ่มขึ้นพร้อมกัน ซึ่งอาจเกิดจากสาเหตุร่วม เช่น ช่วงฤดูฝน ☔
คำถามคือ สิ่งเหล่านี้เป็นเพียงความบังเอิญหรือมีความสัมพันธ์กันจริงๆ? และความสัมพันธ์มีลักษณะอย่างไร มากน้อยแค่ไหน
คำตอบ สามารถใช้การวิเคราะห์ความสัมพันธ์ (Correlation) หรือเครื่องมือที่ช่วยให้เราตอบคำถามนี้โดยการอ้างอิงข้อมูลจริงได้อย่างมีหลักการ 📊✨
Correlation คืออะไร? 🧪
Correlation หรือ สหสัมพันธ์ เป็นการวัดความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรสองตัวว่า:
มีความสัมพันธ์กันจริงหรือไม่ มีทิศทางเดียวกันหรือไม่ และ สัมพันธ์กันมากน้อยอย่างไร
ก่อนการคำนวนค่า Correlation เพื่อตอบคำถามเหล่านี้ เราอาจเริ่มจากการ สร้าง Scatter Diagram หรือกราฟที่แสดงการกระจายของข้อมูลตัวแปรสองตัวก่อน เพื่อเป็นการตรวจสอบความสัมพันธ์ในลักษณะภาพ (Visual Detection) ✨ เป็นการดูว่าตัวแปรสองตัวที่ต้องการศึกษามีรูปแบบการกระจายอย่างไร เช่น:
จุดที่เรียงตัวในแนวเส้นตรงแสดงถึงความสัมพันธ์ทางบวกหรือลบ ขึ้นกับความชันที่มองเห็น หรือ จุดที่กระจัดกระจายแบบไม่มีรูปแบบแสดงถึงการไม่มีความสัมพันธ์
ถ้าเราพบว่าการกระจายพอที่จะเห็นความสัมพันธ์ในเชิงเส้นตรง ก็คือพอที่จะลากเส้นตรงเส้นหนึ่งแทนความสัมพันธ์ได้ เราก็อาจจะมาคำนวนค่าความสัมพันธ์ว่ามีจริงมั้ย มากน้อยแค่ไหน โดยคำนวนค่าที่เรียกว่า
ค่า Correlation Coefficient หรือ ค่าสัมประสิทธิ์ความสัมพันธ์ (r) ซึ่งจะมีค่าตั้งแต่ -1 ถึง 1:
ถ้าค่า r มีค่าเข้าใกล้ +1 หรือ -1 แสดงว่ามีค่าความสัมพันธ์สูง โดยเครื่องหมายจะบอกทิศทางของความสัมพันธ์ กล่าวคือ
r เป็นค่า + : หมายความว่าตัวแปรทั้งสองสัมพันธ์กันในทิศทางเดียวกัน คือเพิ่มด้วยกัน ลดไปด้วยกัน
r เป็นค่า - : หมายความว่าตัวแปรทั้งสองสัมพันธ์กันในทิศทางตรงข้ามกัน คือถ้าตัวนึงเพิ่ม อีกตัวจะลด
r เข้าใกล้ค่า 0: แสดงว่าความสัมพันธ์มีน้อย หรือไม่เกี่ยวข้องกัน
สูตรการคำนวนจะยาวหน่อย ไม่พูดถึงแล้วกัน ใช้เครื่องคำนวนแหละ ถ้าใช้ SPSS กดตามนี้เลย Analyze—>correlate—>bivariate ก็จะได้ค่า r ออกมาเพื่อนำไปวิเคราะห์ต่อ
Correlation กับความสัมพันธ์แบบเหตุและผล 🤔📉
Correlation หรือการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสองตัว อาจทำให้เราสับสนว่า "ความสัมพันธ์" ที่เห็นนั้นหมายถึงความเป็นเหตุและผล (Causal Relationship) หรือไม่ ตัวอย่างเช่น:
- การเพิ่มขึ้นของยอดขายไอศกรีมและอัตราการเกิดอาชญากรรมในหน้าร้อนมี ค่า Correlation สูง แต่ไม่ได้หมายความว่าไอศกรีมทำให้เกิดอาชญากรรม ทั้งสองอาจเกิดจากปัจจัยร่วมกัน เช่น อากาศร้อน ☀️
- การเพิ่มขึ้นของการใช้น้ำมันในช่วงเทศกาลและจำนวนอุบัติเหตุทางถนนก็มี Correlation สูง แต่ไม่ได้หมายความว่าการใช้น้ำมันทำให้เกิดอุบัติเหตุ ทั้งสองอาจเกี่ยวข้องกับปัจจัยร่วม เช่น การเดินทางในช่วงเทศกาล 🚗
ดังนั้น เราต้องแยกความหมายของ Correlation และ Causal Relationship อย่างชัดเจน ค่า Correlation ไม่สามารถใช้สรุปว่าเป็นความสัมพันธ์แบบเหตุและผลได้โดยตรง จำเป็นต้องมีข้อมูลสนับสนุนเพิ่มเติมหรือการวิจัยเพิ่มเติมเพื่อยืนยันความเป็นเหตุเป็นผล
ตัวอย่างง่ายๆ 🎯
บริษัทต้องการทราบว่าค่าใช้จ่ายที่ใช้ในการโฆษณา (X) มีผลต่อยอดขาย (Y) หรือไม่
1. เก็บข้อมูล: ลักษณะการเก็บข้อมูลนั้น ข้อมูล X และ Y จะเก็บมาเป็นคู่ ๆ
- ค่าใช้จ่ายที่ใช้ในการโฆษณา (ล้านบาท) : 1.2, 1.8, 1.5, 2.0, 2.2, ...
- ยอดขาย (ล้านบาท): 115, 120, 112, 190, 200, ...
2. วิเคราะห์ Correlation:
- คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ (r) โดยใช้โปรแกรม SPSS เลือก Analyze—>correlate—>bivariate จะได้ผลออกมาเป็น ค่า r (Pearson Correlation และค่า Sig.)
- ถ้าได้ผลออกมาคือ Pearson Correlation เป็น 0.68 และ ค่า Sig. (p\_value) เป็น 0.0032 (อันนี้สมมตินะ ไม่ต้องงงว่าตัวเลขนี้มายังไง สมมติครับ) แสดงว่าความสัมพันธ์ของค่าใช้จ่ายที่ใช้ในการโฆษณาและยอดขายเป็นไปในทิศทางเดียวกัน
- สรุปเบื้องต้นได้ว่าค่าใช้จ่ายที่ใช้ในการโฆษณาและยอดขายมีความสัมพันธ์ทางบวก มีค่าค่อนข้างสูง แต่ทั้งนี้ ข้อมูลที่เราคำนวน เป็นเพียงแค่ข้อมูลจากตัวอย่าง เพื่อความมั่นใจ การวิเคราะห์นี้สามารถนำไปทดสอบเพิ่มเติมด้วยการทดสอบสมมติฐาน โดย
ตั้งสมมติฐานหลัก H₀: 'ค่าใช้จ่ายที่ใช้ในการโฆษณาไม่มีผลต่อยอดขาย'
และ สมมติฐานแย้ง H₁: 'ค่าใช้จ่ายที่ใช้ในการโฆษณามีผลต่อยอดขาย'
เพื่อยืนยันว่าความสัมพันธ์นี้เกิดขึ้นอย่างมีนัยสำคัญทางสถิติหรือไม่
เปรียบเทียบค่า sig. (p_value) กับค่า alpha เราพบว่า
0.0032 < 0.05 ดังนั้น ทำการ ปฏิเสธสมมติฐานหลัก ยอมรับสมมติฐานแย้ง แสดงว่า ค่าใช้จ่ายที่ใช้ในการโฆษณามีผลต่อยอดขาย อย่างมีนัยสำคัญ
สรุปง่ายๆ 🌟📌
การวิเคราะห์สหสัมพันธ์ (Correlation) เป็นเครื่องมือที่มีประโยชน์ในการทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว ได้อย่างหลากหลายบริบท เช่น การวิเคราะห์ความสัมพันธ์ระหว่างการใช้เงินโฆษณากับยอดขาย การวิเคราะห์ความสัมพันธ์ระหว่างชั่วโมงการเรียนกับผลการสอบ หรือการวิเคราะห์ความสัมพันธ์ระหว่างการออกกำลังกายกับระดับน้ำตาลในเลือด แต่ต้องใช้อย่างระมัดระวังและไม่สรุปความเป็นเหตุและผลโดยตรง 🌟
ลองนำ Correlation ไปใช้ในงานของคุณ! และคุณจะพบว่าการใช้สถิติเพื่อวิเคราะห์ข้อมูลไม่ใช่เรื่องยากอย่างที่คิด แต่กลับเป็นตัวช่วยที่ทำให้ชีวิตง่ายขึ้นและตัดสินใจได้ดียิ่งขึ้น😊
#สถิติ #ชีวิตง่ายขึ้น #คำตอบของชีวิต #สถิติง่ายนิดเดียว #วิเคราะห์ข้อมูล
#correlations #ความสัมพันธ์

ดูเพิ่มเติมในซีรีส์

โฆษณา