Blockdit Logo
Blockdit Logo (Mobile)
สำรวจ
ลงทุน
คำถาม
เข้าสู่ระบบ
มีบัญชีอยู่แล้ว?
เข้าสู่ระบบ
หรือ
ลงทะเบียน
Capydata เรียนรู้ Data สไตล์ Capybara
•
ติดตาม
25 พ.ย. 2022 เวลา 13:20 • วิทยาศาสตร์ & เทคโนโลยี
Central Limit Theorem (CLT) หนึ่งในทฤษฏีที่แสนจะสวยงามในทางสถิติ
ถ้าพูดถึงทฤษฏีทางสถิตินั้นในโลกของสถิติคงจะมีมากมายเป็นร้อยๆทฤษฏีแต่จะมีอยู่หนึ่งทฤษฏี ที่จะปฎิเสธที่จะไม่พูดถึงไม่ได้เลยนั้นคือทฤษฏีที่เรียกว่า Central Limit Theorem (CLT) ถ้าแปลเป็นไทยก็คงจะประมาน ทฤษฎีแนวโน้มเข้าสู่ศูนย์กลาง แล้วไอ้ทฤษฏีที่ว่าเนี่ย ทำไมมันถึงเป็นหนึ่งในทฤษฏีที่ยิ่งใหญ่อีกหนึ่งทฤษฏีในทางสถิติวันนี้เราจะมาดูกันครับ
ทฤษฎีแนวโน้มเข้าสู่ศูนย์กลาง : Central Limit Theorem (CLT) ถูกตั้งขึ้นมาโดยนักคณิตศาสตร์ Moivre และ Abraham (1733) และถูกพิสูจน์โดย Laplace และ Pierre Simonde (1824) เรียกได้ว่าทฤษฏีนี้เป็นทฤษฏีที่ถือกำเนิดขึ้นมาบนโลกนี้ประมาณ 200 กว่าปีมากแล้ว
แล้วทฤษฏีที่ว่านี้มันทำงานอย่างไรกันหละ ย้อนกลับไปที่หัวใจของสถิตินั้นคือการสุ่มตัวอย่าง เนื่องจากว่า เราไม่มีทางที่จะรู้ค่าที่แท้จริงของประชากรได้ การสุ่มตัวอย่างจึงต้องถือกำเนิดขึ้นมา โดยทฤษฏีนี้มีใจความสำคัญคือ "ไม่ว่าประชากรนั้นจะกระจายตัวรูปแบบใด ค่าเฉลี่ยของการสุ่มตัวอย่างที่เกิดขึ้นมา n ครั้งนั้น จะกระจายตัวแบบปกติ"
ใช่แล้วและครับ ทฤษฏีนี้กล่าวได้ว่าการสุ่มตัวอย่างที่เกิดขึ้นมานั้น เมื่อเราเอาค่าเฉลี่ย n ครั้งที่เราสุ่มได้มา มาวางเรียงกันโดยที่ดูแบบ Histogram นั้นจะกระจายตัวเป็นรูปแบบปกติหรือเป็นระฆังคว่ำ
แต่ว่าทฤษฏีนี้จะมีเงื่อนไขด้วยกันอยู่ด้วยกันทั้งหมด 2 เงื่อนไข ถึงจะสมบูรณ์
เงื่อนไขที่ 1 : การสุ่มตัวอย่างนั้นจะต้องเป็นไปอย่างอิสระ (Random sampling)
หมายความว่าจะต้องเป็นการสุ่มที่ไม่มีเงื่อนไขใดใด มาตีกรอบการสุ่ม
เงื่อนไขที่ 2 : จะต้องมีจำนวนกลุ่มตัวอย่างมากเพียงพอ ยิ่งมากเท่าไร การกระจายตัวก็จะยิ่งเข้าใกล้ Normal distribution มากยิ่งขึ้น โดยทั่วไปแล้วนั้นในทางสถิติตัวเลขที่นิยมใช้กันนั้นก็คือ n>= 30
เมื่อครบ 2 เงื่อนไขนี้ ทฤษฏีนี้ก็จะเป็นไปอย่างที่กล่าว
จริงๆแล้วมีเงื่อนไขและข้อจำกัดมากกว่านี้แต่ในที่นี้จะขอกล่าวคร่าวๆแค่นี้นะครับ แหะๆ เพื่อความเข้าใจที่ง่าย
แล้วนักสถิติได้นำทฤษฏีนี้ไปใช้อย่างไรกันหละ ??
ในการสุ่มกลุ่มตัวอย่างนั้น ค่ากลางหรือค่าเฉลี่ยที่เราได้มา เราไม่มีทางรู้ได้เลยว่ามันเข้าใกล้ค่าเฉลี่ยของกลุ่มประชากรได้ไหม ยกตัวอย่างเช่น สมมติเราสุ่มตัวอย่างความสูงของชายไทยมา ได้ค่าเฉลี่ยสมมติอยู่ที่ 180 cm ซึ่งเราไม่มีทางรู้ได้ว่าจริงๆแล้วค่าเฉลี่ยของคนไทยทั้งประเทศนั้นอยู่ใกล้เคียง 180 cm นี้ไหม
เต่ถ้าเราเอา CLT นี้เข้ามาจับแล้ว เราจะสามารถกล่าวได้ว่าความน่าจะเป็นที่ไอ้ค่า 180 นี้มันจะวิ่งอยู่ใกล้ค่าที่แท้จริงนั้นมันจะเป็นกราฟระฆังความแบบ Normal distribution นั้นเอง หมายความว่าเราพอจะมั่นใจได้เป็น Percent ว่า ค่าที่เราหยิบขึ้นมนี้พอจะใกล้เคียงความเป็นจริงอยู่เป็น % โดยที่เราเรียกค่า Percent นี้ว่า Confident Interval นั้นเอง
ในชีวิตจริงเราไม่สามรถที่จะสุ่มตัวอย่างได้เป็นจำนวนครั้งเยอะๆ เพราะว่าทรัพยากรต่างๆที่มีจำกัด รวมไปถึงความขี้เกียจของเราด้วย 555555 การที่มี CTL นี้นั้นทำให้เราสามารถสร้างช่วงความน่าจะเป็นขึ้นมาเพื่อที่จะสามารถกำหนดความเชื่อมั่นว่าค่าที่เราสุ่มมานั้น มันอยู่ในช่วงที่เราจะเชื่อถือได้จริงๆนั่นเอง
REF : The concise encyclopedia of statistics , BYadolah Dodge
บันทึก
1
3
1
3
โฆษณา
ดาวน์โหลดแอปพลิเคชัน
© 2024 Blockdit
เกี่ยวกับ
ช่วยเหลือ
คำถามที่พบบ่อย
นโยบายการโฆษณาและบูสต์โพสต์
นโยบายความเป็นส่วนตัว
แนวทางการใช้แบรนด์ Blockdit
Blockdit เพื่อธุรกิจ
ไทย