21 พ.ย. 2022 เวลา 05:55 • วิทยาศาสตร์ & เทคโนโลยี
95% Confidence Interval สิ่งนี้คืออะไร ??
95% Confidence Interval สิ่งนี้ๆ เป็นสิ่งที่พบเห็นได้บ่อยตามแวดวงของสถิติมากมาย ผมว่าสิ่งๆนี้น่าจะเคยผ่านตาทุกๆคนมากันบ้างแล้ว แต่ว่าจริงๆแล้วความหมายของเจ้าสิ่งๆนี้มันคืออะไรกันหละ ทางเพจ GGEZ Statistics จะมาอธิบายให้อย่างเข้าใจง่ายๆกันครับ
ถ้าย้อนกลับไปในวิชาสถิติที่เราเรียนมา จุดประสงค์หนึ่งของวิชานี้คือการสุ่มตัวอย่าง เพราะอะไรหนะหรอทำไมเราถึงต้องสุ่มตัวอย่างกันหล่ะ นั้นก็เพราะว่าเราไม่มีทางรู้ค่าที่แท้จริงของประชากรได้ยังไงหละครับ ยกตัวอย่างเช่น สมมติคุณอยากรู้ว่ามีคนในประเทศไทยที่ชอบกินแซลม่อนกี่คน ถ้าในทางทฤษฏี เราคงต้องลงพื้นที่ในประเทศไทยทั่วทั้ง 77 จังหวัดแล้วไล่ถามทีละคนเลยว่า คุณชอบกินแซลม่อนหรือไม่ ? ซึ่งในชีวิตจริงมันแทบจะเป็นไปไม่ได้เลย (ยกเว้นว่าคุณมีเวลาว่างและจำนวนเงินในการทำแบบสอบถามนี้ 555555)
ใช่แล้วครับ ในชีวิตจริงเรามีปัจจัยอะไรหลายๆอย่างที่มาจำกัดเรา เช่น เวลา งบประมาน รวมไปจนถึง ความขี้เกียจของผู้วิจัยเป็นต้น (ขำๆนะครับ) เราจึงต้องเกิดการสุ่มตัวอย่างขึ้นมาเพื่อให้กลุ่มตัวอย่าง(Sample Size) นี้เป็นตัวแทนของประชากร (Population) ที่เราไม่สามารถไปเก็บข้อมูลได้นั้นเอง
ภาพอธิบายการสุ่มกลุ่มตัวอย่าง
ทีนี้เราก็จะเกิดคำถามขึ้นมาว่า แล้วไอ้กลุ่มตัวอย่างที่สุ่มขึ้นมาเนี่ย มันจะน่าเชื่อถือได้อย่างไร แล้วไอ้การสุ่มแต่ละครั้งเนี่ยมันจะมีค่าเท่ากันหรอ ยกตัวอย่างเช่น ถ้าคุณสุ่มตัวอย่างครั้งที่ 1 อาจจะมีคนที่ชอบกินแซลม่อนอยู่ 80% แต่พอสุ่มครั้งที่ 2 มีคนที่ชอบกินแซลม่อนอยู่ 74% แน่นอนครับ มันเป็นไปไม่ได้เลยที่การสุ่มตัวอย่างแต่ละครั้งมันจะได้ค่าที่เท่ากัน แล้วแบบนี้เราจะต้องสุ่มตัวอย่างกี่ครั้งหละ
แน่นอนครับในชีวิตจริงเก็บตัวอย่างแค่ครั้งเดียวก็เหนื่อยแล้ว ชาวนักสถิติอย่างเราทำไม่ไหวครับ ดังนั้นพวกเราเลยทำข้อตกลงกันขึ้นมาว่าเราจะสร้างช่วงความเชื่อมั่นขึ้นมาเป็นเป็นการประมาณว่า ต่อให้สุ่มไปอีกกี่ครั้ง ค่าที่ได้มันก็จะตกอยู่ประมาณนี้ ยกตัวอย่างเช่น สุ่มตัวอย่างครั้งที่ 1 มีคนที่ชอบกินแซลม่อนอยู่ 80%(71%-85%) จึงเกิดคำว่า Confident interval(CI) ขึ้นมา แล้วเรียกจุดตรงกลางที่อยู่ระกว่าง Confident Interval (CI) นี้ว่า Point estimation
Confidence Interval and Point estimation
ทีนี้ แล้วไอ้ 95% ตัวเลขนี้มันมาจากไหน นักสถิติจะสมมติขึ้นมาว่าเราสุ่มตัวอย่างไปทั้งหมดด้วยกัน 100 ครั้ง นั่นจะหมายความว่าตอนนี้นั้นจะเกิด CI ที่เป็นปีกขึ้นมา 100 เส้น ซึ่งไอ้ 100 เส้นนี้มันจะมีค่าที่คร่อมค่าที่แท้จริง (True Value -> ในชีวิตจริงเราไม่มีทางรู้ได้) เมื่อไรก็ตามที่ปีกของ CI นี้ไม่คร่อม True Value อยู่ 5 ตัว เราจะเรียกค่าความเชื่อมั้นครั้งนี้ว่า 95% Confidence Interval
95% Confidence Interval
สรุปง่ายๆก็คือค่า 95% Confidence Interval นั้นหมายความว่า เมื่อเราสุ่มตัวอย่าง 100 ครั้งจะมีแค่การสุ่มตัวอย่างเพียง 5 ครั้งเท่านั้นที่หลุดจากค่า True Value ส่วนการคำนวนนั้น ค่า 95%CI ก็จะมีสูตรที่ใช้คำนวน ตามวิธีการทางสถิติซึ่งขอละไว้ในโพสต์นี้นะครับ (ในชีวิตจริงเราจะใช้Program คำนวนกันหมดเลย)
ในชีวิตจริงเราไม่มีทางหาที่แท้จริงในกลุ่มประชากรได้ และไม่มีทางสุ่มกลุ่มตัวอย่างเป็นร้อยๆครั้งได้ ค่า 95% Confidence Interval ก็คือหนึ่งในเครื่องมือที่จะมาใช้เพื่อเพิ่มความน่าเชื่อถือของกลุ่มตัวอย่างที่เราสุ่มขึ้นมานั้นเองครับผม .นโพตส์หน้า GGEZ Statistics จะนำเรื่องราวทางสถิติเรื่องอะไรมานำเสนออีก โปรดติดตามชมครับผม
REF : Reading Statistics and Research , Sixth Edition , Schuyler W. Huck
University of Tennessee,Knoxville
โฆษณา