20 ธ.ค. 2022 เวลา 12:34 • วิทยาศาสตร์ & เทคโนโลยี
"กลุ่มตัวอย่าง" หนึ่งหัวใจสำคัญของวิชาสถิติ
ในชีวิตจริงการที่เราจะรู้ข้อมูลของประชากรเป็นเช่นไรเป็นไปได้ยากมาก จำเป็นต้องอาศัยทั้งงบประมาณและระยะเวลา หรืออาจจะมีปัจจัยอื่นๆที่เยอะและวุ่นวาย (แน่นอนรวมไปถึงความขยันของนักสถิติด้วย แหะๆ) การสุ่มกลุ่มตัวอย่างนั้นจึงเป็นหัวใจสำคัญหนึ่งทางสถิติ ที่จะทำให้เราพอจะรู้ว่าประชากรนั้นมีข้อมูลเป็นอย่างไรจากการสุ่มผ่านกลุ่มตัวอย่างนั้นเอง
ตัวอย่างเช่น ค่าเฉลี่ยของประชากร เราจะเรียกว่า µ แต่เมื่อสุ่มกลุ่มตัวอย่าง จะกลายเป็น x̄ แล้วไอ้สองค่านี้มันใช้แทนกันได้จริงๆหนะหรอ จากโพสต์ที่แล้วเรื่องของ Central limit theorem นั้น หนึ่งในข้อจำกัดเของทฤษฏีนี้นั้นก็คือ การสุ่มกลุ่มตัวอย่างแบบ Random หรือการสุ่มแบบอิสระไม่มีเงื่อนไขหรือกรอบมากำหนดนั้นเองและแน่นอนการสุ่มแบบ Random นั้นในชีวิตจริงมันก็ทำได้อยากอีกเช่นกันครับ ดังนั้นจึงเกิดวิธีการสุ่มกลุ่มตัวอย่างมาให้เราเลือกใช้ ในโพสต์นี้เราจะมาทำความรู้จักกับวิธีสุ่มกลุ่มตัวอย่างคร่าวๆกันครับ
แบบแรก : การสุ่มกลุ่มตัวอย่างแบบไม่อาศัยความน่าจะเป็น (Non-Probability sampling)
วิธีนี้จะเป็นการสุ่มตัวอย่างแบบที่ไม่ใชวิธีสุ่ม เอ๊ะ ทำไมมันย้อนแย้ง สุ่มแบบไม่สุ่ม 55555 ทำให้ประชากรที่ถูกเลือกมานั้นมีความน่าจะเป็นที่ไม่เท่ากัน มีประชากรบางกลุ่มถูกเลือกได้มากกว่า แน่นอนครับ จากที่อ่านมาแล้วจะพอรู้ได้ว่ามันไม่ใช่วิธีสุ่มตัวอย่างที่จะแสดงถึงค่าประชากรที่ดีได้เลย แต่ข้อดีของมันคือ สะดวกนั้นเองครับ
  • แบบบังเอิญ (Accidental sampling) แบบนี้ถ้าพูดง่ายๆคือ เดินเจอใครหรืออยากให้ใครทำ ลุยเลย ขึ้นอยู่กับความอินดี้ผู้วิจัยล้วนๆ ชอบใครก็เลือก ไม่ชอบใครก็ Say No
  • แบบเจาะจง (Judgment sampling) อันนี้ก็ตรงตามชื่อเช่นกันครับ เอาตามที่ผู้วิจัยกำหนดขึ้นมา
  • แบบกำหนดสัดส่วน (Quota sampling) เป็นการกำหนดกลุ่มตัวอย่างขึ้นมาโดยแบ่งโควตาสัดส่วนขึ้นมา เช่น ชาย 40 คน หญิง 40 คน
  • แบบลูกโซ่ (Snowball sampling) แบบนี้เรียกได้ว่าเป็นแบบที่พบเจอได้ในชีวิตประจำวันที่นักศึกษามหาวิทยาลัยใช้กันบ่อยที่สุด จะเป็นการสุ่มตัวอย่างโดยที่เน้นการบอกต่อเป็นลูกโซ่ หรือภาษาอังกฤษ ที่เรียกว่า Snowball เพราะเหมือนลูกหิมะกลิ้งต่อกันไปเรื่อยๆ เช่น การตั้งแบบสอบถามขึ้นมาแล้วให้เพื่อนๆในชั้นจากนั้นให้เพื่อนๆในชั้นส่งต่อให้คนที่รู้จักต่อไป ไปได้เรื่อยๆ จึงจะสามารถพบเห็นแบบสอบถามที่โผล่มตามไลน์แล้วบอกว่า “รบกวนช่วยทำแบบสอบถามและส่งต่อทีครับ”
Snowball Sampling
แบบสอง : การเลือกสุ่มกลุ่มตัวอย่างแบบอาศัยความน่าจะเป็น (Probability sampling)
แบบที่สองนี้ผู้วิจัยจะต้องตั้งกรอบๆหนึ่งขึ้นมา โดยจะเรียกกรอบนั้นว่า Sampling frame เพื่อเป็นเป้าหมาย โดยแต่ละเป้าหมายนั้นจะมีโอกาสถูกเลือกด้วยความน่าจะเป็นที่เท่ากัน ซึ่งการสุ่มแบบนี้จะมีความน่าเชื่อถือของการประมาณค่าในประชากรได้มากกว่าแบบแรก โดยตัวอย่างของการสุ่มตัวอย่างประเภทนี้ เช่น
  • Simple Random sampling ตรงตัวเลยครับสำหรับวิธีนี้นั้นคือ สุ่มมันเลย อาจจะใช้การจับฉลาก หรือ ใช้คอมพิวเตอร์ในการสุ่มกลุ่มตัวอย่างจากกลุ่มประชากรขึ้นมาตรงๆ
  • Stratified Random sampling การสุ่มแบบนี้ถ้าพูดแบบง่ายๆคือการสุ่มเป็นชั้นๆ ซึ่งในแต่ละชั้นนั้นจะมีความเหมือนกัน แต่ต่างชั้นจะมีคุณสมบัติที่แตกต่างกัน ที่แบ่งเพื่อต้องการให้กลุ่มตัวอย่างที่สุ่มมานั้น ปะปนไปด้วยกลุ่มตัวอย่างที่ครบทุกลักษณะ ยกตัวอย่างเช่น การสุ่มกลุ่มตัวอย่างของนักเรียนโรงเรียนหนึ่ง โดยแบ่งเป็นชั้น ม1 ,ม2 , ม3 (ถือว่าในแต่ละ ชั้นก็จะมีคุณสมบัติที่เหมือนกัน) แล้วสุ่มในแต่ละชั้นมัธยมขึ้นมาด้วยวิธี Sample อีกที
Stratified Random sampling
  • Cluster or Area sampling มักใช้กับกรณีที่มีประชากรขนาดใหญ่ ซึ่งประชากรนั้นกระจัดกระจายเป็นลักษณะองค์ประกอบที่คล้ายคลึง ซึ่งแต่ละกลุ่มย่อยนั้นจะมีลักษณะที่ต่างกันปนออกไป จะเห็นได้ว่ารูปแบบนี้จะตรงข้ามกับแบบ Stratified random sampling เช่น ในแต่ละอำเภอมีหลากหลายหมู่บ้าน ซึ่งในแต่ละหมู่บ้านก็มีลักษณะของประชากรที่ต่างกัน แต่ว่ากลุ่มย่อยแต่ละกลุ่มย่อยนั้นคล้ายคลึงกันนั้นคือเป็ฯหมู่บ้าน จึงเลือกสุ่มหมู่บ้านขึ้นมา แล้วจึงค่อยสุ่มคนในหมู่บ้านที่โดนสุ่มได้มาอีกที
Cluster or Area sampling
  • Multistage sampling เป็นการที่สุ่มตัวอย่างโดยที่ใช้วิธีการข้างต้นโดยมักใช้มากกว่า 3 ขั้นตอนขึ้นไป โดยส่วนใหญ่มักจะทำเพื่อลดขนาดของประชากรที่จะสุ่มกลุ่มตัวอย่าง ดังนั้นข้อเสียของวิธีนี้คือ เมื่อเกิดการที่สุ่มหลายครั้งจะเกิดความคลาดเคลื่อนจากการสุ่มเพราะว่าแต่ละหน่วยนั้นไม่ได้เป็นอิสระต่อกัน
จะเห็นได้ว่าหัวใจหลักอย่างหนึ่งของวิชาสถิติคือการสุ่มกลุ่มตัวอย่าง แต่มันไม่ใช่ขั้นตอนที่จะเลือกทำได้ง่ายๆเลย แต่ละวิธีมีข้อดีข้อเสียที่แตกต่างกันออกไป อยู่ที่ความสะดวก ความเหมาะสม และการรู้ข้อจำกัดของวิธีการสุ่มแต่ละอย่างว่าผู้วิจัยนั้นจะเลือกวิธีใดให้เหมาะสมกับงานวิจัยของตนนั้นเอง
Ref :
  • ตำราวิจัยทางระบาดวิทยาสำหรับนิสิตแพทย์ (TEXTBOOK OF EPIDEMIOLOGICAL RESEARCH FOR MEDICAL STUDENTS) ,กิตติพงษ์ คงสมบูรณ์
  • Reading Statistics and Research ,Schuyler W. Huck University of Tennessee,Knoxville
โฆษณา