1.27k likes | 1.55k Vues
การวิเคราะห์ข้อมูลโดยใช้ สถิติอ้างอิง. รศ.อดิศักดิ์ พงษ์พูลผลศักดิ์ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี. การประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐาน. การประมาณค่าจากการสุ่มอย่างง่าย (Simple Random Sampling) การประมาณค่าจากการเลือกตัวอย่างแบบมีระบบ (Systematic Sampling)
E N D
การวิเคราะห์ข้อมูลโดยใช้สถิติอ้างอิงการวิเคราะห์ข้อมูลโดยใช้สถิติอ้างอิง รศ.อดิศักดิ์ พงษ์พูลผลศักดิ์ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี
การประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐานการประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐาน • การประมาณค่าจากการสุ่มอย่างง่าย (Simple Random Sampling) • การประมาณค่าจากการเลือกตัวอย่างแบบมีระบบ(Systematic Sampling) • การประมาณค่าจากการเลือกตัวอย่างสุ่มแบบแบ่งพวก (Stratified Random Sampling) • การประมาณค่าจากการเลือกตัวอย่างแบบกลุ่ม
การประมาณค่าจากการสุ่มอย่างง่ายการประมาณค่าจากการสุ่มอย่างง่าย • จากประชากรขนาด N ที่มีลักษณะคล้ายคลึงกันหรือเหมือนกัน ถ้าเลือกสุ่มตัวอย่างขนาด n โดยวิธีสุ่มตัวอย่างอย่างง่าย เราจะได้ชุดตัวอย่างที่เป็นทั้งหมด ชุด และในการใช้ ชุดตัวอย่างจะเลือกใช้เพียงชุดเดียว ทำให้ได้โอกาสที่จะเลือกใช้แต่ละชุด จะมีโอกาสเป็น • การเลือกตัวอย่างโดยวิธีนี้ประเด็นสำคัญคือลักษณะประชากรจะต้องมีความคล้ายคลึงกันหรือเหมือนกันมากที่สุด จึงจะประมาณค่าประชากรได้ถูกต้องแม่นยำ ทั้งนี้ในการประมาณค่าพารามิเตอร์จะคำนวณค่าประมาณต่างๆมาจากการให้โอกาสของการถูกเลือกของหน่วยตัวอย่างมาด้วยโอกาสเท่าๆกัน และก่อนที่จะกล่าวถึงค่าประมาณต่างๆ ในขั้นต้นจะกล่าวถึงสัญลักษณ์ของค่าพารามิเตอร์และค่าประมาณพารามิเตอร์ที่ได้จากการสุ่มตัวอย่าง ดังนี้
การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ) ตารางที่ 5.1แสดง ความหมายสัญลักษณ์ของค่าพารามิเตอร์และค่าประมาณพารามิเตอร์ที่ได้จากการสุ่มตัวอย่าง
การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ) • ในการเลือกตัวอย่างสุ่มอย่าง่าย(SRS) ขนาด n จากประชากรขนาด N ค่าประชากรที่เราสนใจอาจเป็นค่ารวม ค่าเฉลี่ย อัตราส่วน หรือสัดส่วน ตัวประมาณค่าพารามิเตอร์ ในตารางที่ 5.2 จะมี คุณสมบัติของตัวประมาณค่าดังนี้ • ต้องเป็นตัวประมาณค่าที่ไม่เอนเอียง • เป็นตัวประมาณที่คงเส้นคงวาในลักษณะที่ว่าถ้าขนาดตัวอย่างn มีขนาดใหญ่เข้าใกล้ประชากรขนาดจะทำให้ตัวประมาณมีค่าเข้าใกล้ค่าพารามิเตอร์ • ตัวประมาณจะมีความแปรปรวนดังตารางที่ 5.2
ตารางที่ 5.2 แสดงค่าเฉลี่ย (Mean) ยอดรวม (Total) และสัดส่วน (Proportion) และความแปรปรวนของค่าเฉลี่ย ความแปรปรวนของยอดรวมความแปรปรวนของค่าสัดส่วน ของประชากรและค่าประมาณพารามิเตอร์
ตารางที่ 5.2 แสดงค่าเฉลี่ย (Mean) ยอดรวม (Total) และสัดส่วน (Proportion) และความแปรปรวนของค่าเฉลี่ย ความแปรปรวนของยอดรวมความแปรปรวนของค่าสัดส่วน ของประชากรและค่าประมาณพารามิเตอร์
การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ) • จากที่กล่าวมาแล้วเป็นการประมาณค่าเฉลี่ยของประชากร แบบจุดจากการสุ่มตัวอย่างอย่างง่ายสำหรับการประมาณแบบช่วงของค่าเฉลี่ยของการสุ่มตัวอย่างอย่างง่ายจะกำหนดดังนี้
การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)
การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)
ตัวอย่างที่ 5.1 หมู่บ้านแห่งหนึ่งมีครัวเรือนทั้งหมด 4,000 ครัวเรือนสุ่มตัวอย่างอย่างง่ายจากครัวเรือนทั้งหมดมาจำนวน 40 ครัวเรือนสอบถามจำนวนสมาชิกในครัวเรือนที่ไม่มีงานทำได้ผลดังนี้ 3 , 2 , 0 , 1 , 2 2 , 4 , 0 , 0 , 1 3 , 2 , 1 , 1 , 1 2 , 3 , 4 , 0 , 2 2 , 5 , 0 , 1 , 3 0 , 2 , 1 , 2 , 0 0 , 2 , 1 , 1 , 2 1 , 1 , 1 , 2 , 0 ก. จงประมาณค่าเฉลี่ยและความแปรปรวนของจำนวนสมาชิกในครัวเรือนที่ไม่มีงานทำต่อครัวเรือน ข. จงใช้ช่วงความเชื่อมั่น 95% เพื่อกะประมาณค่าเฉลี่ยที่แท้จริง
ตัวอย่างที่ 5.2 สุ่มตัวอย่างบางครัวเรือนมา 30 ครัวเรือน จากในพื้นที่แห่งหนึ่งซึ่งประกอบไปด้วยครัวเรือน 14,848 ครัวเรือน ปรากฏจำนวนบุคคลต่อครัวเรือนเป็นดังนี้ 5 6 3 3 2 2 2 2 4 4 3 2 7 4 3 5 4 4 3 3 4 3 3 1 2 4 3 4 2 4 ตามลำดับจงกะประมาณจำนวนประชากรทั้งหมดในพื้นที่ดังกล่าวและค่าประมาณจะคลาดเคลื่อนไปจากค่าจริงไม่เกิน
นั่นคือคาดว่าจำนวนประชากรจะอยู่ระหว่าง 44200 ถึง 55777 คน ทั้งนี้ การกะประมาณกำหนดให้มีระดับความเชื่อมั่น 90%
ตัวอย่างที่ 5.3 ก.ให้หาค่าประมาณอัตราส่วน(ratio) ของจำนวนนักเรียนต่อจำนวนครูสำหรับโรงเรียนแต่ละประเภทในประชากร ข. หาStandard error ของตัวประมาณในข้อ ก.
ตัวอย่างที่ 5.4 ตัวอย่าง 5.4ในการสำรวจภาวะเศรษฐกิจและสังคมของประชากรในเขตกรุงเทพฯ ซึ่งมุ่งที่จะกะประมาณสัดส่วนของประชากรที่มีอยู่อาศัยเป็นของตนเองจากการสำรวจด้วยตัวอย่างขนาดครัวเรือนพบว่ามีอยู่ 360 ครัวเรือนเท่านั้นที่มีที่อยู่อาศัยเป็นของตัวเอง จงหาค่าประมาณสัดส่วน (หรือ ร้อยละ) ของประชากรในเขตกรุงเทพ ฯที่มีที่อยู่อาศัยเป็นของตัวเอง พร้อมทั้งหาช่วงความเชื่อมั่น 99%
ตัวอย่างที่ 5.5 ในการศึกษาระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3432 โรงงาน ผู้วิจัยได้ทำการสุ่มตัวอย่างโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A มาอย่างง่าย (SRS) จำนวน 338 คน และเก็บรวบรวมข้อมูลตัวอย่างโดยการสัมภาษณ์เจ้าของโรงงานเพื่อสอบถามระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ได้ผลแสดงในแฟ้มข้อมูล SPSS ดังนี้
จงประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐาน พร้อมทั้งแปลผลจากข้อมูลดังกล่าว
เนื่องจากเป็นการสุ่มตัวอย่างอย่างง่าย และต้องการสรุปไปถึงประชากรทั้งหมด3,432 โรงงาน ในการประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐานจะใช้ และ ถ้า Nมีขนดโตมากๆและ n มีขนาดน้อย ซึ่งSPSSจะคำนวณด้วย คำสั่ง Mean และ S.E.mean
นำผลที่ได้มาปรับแต่งเพื่อนำเสนอเป็นรายงานวิจัยต่อไป และแปลผลค่าเฉลี่ยให้เป็นระดับความสามารถดังนี้ การกำหนดความหมายของค่าเฉลี่ยความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3,432 โรงงาน 4.50-5.00 หมายถึงระดับความสามารถมากที่สุด 3.50-4.49 หมายถึงระดับความสามารถมาก 2.50-3.49 หมายถึงระดับความสามารถปานกลาง 1.50-2.49 หมายถึงระดับความสามารถน้อย 1.00-1.49 หมายถึงระดับความสามารถน้อยที่สุด
จากการศึกษาความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3432 โรงงานตามความคิดเห็นของหัวหน้างาน พบว่าเฉลี่ยโดยรวม ความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือมีความสามารถอยู่ใน ระดับมาก
เมื่อพิจารณาเป็นรายข้อจะพบว่า • ความสามารถอ่านแบบ เขียนแบบเทคนิคและเลือกใช้วัสดุอุตสาหกรรม เชื่อมโลหะและประกอบขึ้นรูปผลิตภัณฑ์โลหะแผ่นเบื้องต้น ถอด ตรวจสอบและประกอบชิ้นส่วนเครื่องยนต์ ปรับ แปรรูปและขึ้นรูปงานด้วยเครื่องมือกล บำรุงรักษาเครื่องยนต์แก๊สโซลีนและดีเซลตามคู่มือ ถอดประกอบเครื่องยนต์แก๊สโซลีนและดีเซลตามคู่มือ ถอดประกอบคลัตช ์ เกียร์และเพลาขับตามคู่มือ บำรุงรักษาระบบรองรับ บังคับเลี้ยวและเบรกตามคู่มือ หัวหน้างานของนักศึกษามีความคิดเห็นว่านักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ มีความสามารถอยู่ในระดับมาก และสำหรับความสามารถประกอบ ทดสอบวงจรและ อุปกรณ์ไฟฟ้า อิเล็กทรอนิกส์เบื้องต้น บำรุงรักษาคลัตช์ เกียร์และเพลาขับตามคู่มือ ถอดประกอบระบบรองรับ บังคับเลี้ยวและเบรกตามคู่มือ บำรุงรักษา แบตเตอรี่ ระบบสตาร์ท ระบบประจุไฟฟ้า ระบบแสงสว่าง ระบบไฟเตือนและสัญญาณตามคู่มือ ซ่อมเครื่องยนต์แก๊สโซลีนตามคู่มือ ซ่อมเครื่องยนต์ดีเซลตามคู่มือ ซ่อมเครื่องยนต์ดีเซลตามคู่มือ หัวหน้างานของนักศึกษามีความคิดเห็นว่านักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ มีความสามารถอยู่ในระดับปานกลาง
ในการแปลผลเนื่องจากเป็นการทำนายโดยการกำหนดเป็นช่วงแล้วนำค่าเฉลี่ยที่คำนวณได้มาพิจารณาว่าตกอยู่ในช่วงใด แล้วแปลผลเป็นระดับ มากที่สุด มาก ปานกลาง น้อย น้อยที่สุด ตามช่วงที่กำหนด มักจะมีคำถามเสมอว่าควรจะกำกับ ค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย หรือไม่ • คำตอบคือ จะกำกับไว้ก็ได้ก็ไม่ผิดอะไร หรือจะไม่กำกับไว้ความหมายก็ไม่เสียไป แต่เมื่อพิจารณาแล้วจะเขียนได้ความหมายและอ่านแล้วได้ความหมายกว่า การกำกับ ค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐาน • และในอีกประเด็นหนึ่งที่เป็นคำถามเสมอว่า ทำไมใช้ ค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย ทำไมไม่ใช้ ค่าเฉลี่ย และ ค่าส่วนเบี่ยงเบนมาตรฐาน คำตอบคือ กรณีนี้เป็นการสุ่มตัวอย่างและสรุปผลไปถึงประชากรทั้งหมด จึงใช้การหาค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย เป็นการอ้างอิงถึงประชากร แต่ถ้าสุ่มตัวอย่างเพื่อสรุปถึงตัวอย่างก็จะใช้ ค่าเฉลี่ย และ ค่าส่วนเบี่ยงเบนมาตรฐาน ดังที่แสดงไว้ในบทที่ 4 ซึ่งเป็นสถิติเชิงพรรณนา • และประเด็นสุดท้ายที่เป็นคำถามในการสรุปผลคือ จะถามว่าจะสรุปผลเป็นอย่างอื่นได้หรือไม่ คำตอบคือ ได้เช่นต้องการพิจารณาลำดับความสำคัญก็ควรจะใช้ ค่าสัมประสิทธิ์ความผันแปรในการสรุป ทั้งนี้เนื่องจาก ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยแตกต่างกัน มีค่าไม่เท่ากัน ดังนั้นก่อนการจัดอันดับควรที่จะเปลี่ยนหน่วยให้เป็นหน่วยเดียวกันจึงค่อยจัดอันดับก็จะทำให้ผลถูกต้องขึ้น ดังตารางตัวอย่างข้างล่างนี้
ในการศึกษาลำดับความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3,432 โรงงาน ตามความคิดเห็นของหัวหน้างานพบว่านักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ มีความสามารถปรับ แปรรูปและขึ้นรูปงานด้วยเครื่องมือกล เป็นอันดับแรก รองลงมาอันดับสองคือ มีความสามารถเชื่อมโลหะและประกอบขึ้นรูปผลิตภัณฑ์โลหะแผ่นเบื้องต้น อันดับสามมีความสามารถบำรุงรักษาเครื่องยนต์แก๊สโซลีนและดีเซลตามคู่มือ และความสามารถในสามอันดับสุดท้ายคือ มีความสามารถถอดประกอบระบบรองรับ บังคับเลี้ยวและเบรกตามคู่มือในอันดับ 13 มีความสามารถบำรุงรักษา แบตเตอรี่ ระบบสตาร์ท ระบบประจุไฟฟ้า ระบบแสงสว่าง ระบบไฟเตือนและสัญญาณตามคู่มือในอันดับ 14 และ มีความสามารถอ่านแบบในอันดับ 15 • จากการแปลผลข้างต้นจะพบว่าการแปลผลใน 2 วิธีจะให้ผลทางความหมายแตกต่างกันดังนั้นในการแปลผลจะขึ้นอยู่กับว่าผู้ใช้ผลในการแปลผลให้สอดคล้องกับวัตถุประสงค์อย่างไร ถ้าต้องการแปลผลระดับความคิดเห็นก็จะใช้ช่วงระดับความคิดเห็น แต่ถ้าผู้วิจัยสนใจลำดับก็ควรปรับหน่วยของค่าเฉลี่ยให้เป็นร้อยละด้วยค่าสัมประสิทธิ์ความผันแปรแล้วจึงจัดลำดับ
ตัวอย่างที่ 5.6 • ในการศึกษาโครงการสำรวจทางลาดสำหรับผู้พิการ ทุพลภาพและคนชรา ในอาคารห้างสรรพสินค้าทั่วประเทศ ซึ่งมีจำนวนอาคาร ทั้งหมดจำนวน 639 อาคาร • ผู้วิจัยได้ทำการสุ่มตัวอย่างอย่างง่าย(SRS)จำนวน 284 อาคาร และเก็บรวบรวมข้อมูลตัวอย่างโดยการสังเกตอาคารห้างสรรพสินค้าตัวอย่างที่สุ่มมาได้ เพื่อสังเกตทางลาดสำหรับผู้พิการ ทุพลภาพและคนชรา โดยใช้แบบสังเกตและสังเกตอาคารเหล่านั้นว่ามี หรือ ไม่มี ทางลาดสำหรับผู้พิการ ทุพลภาพและคนชรา ได้ผลแสดงในแฟ้มข้อมูล SPSS ดังนี้
จงประมวลผลข้อมูลจากแฟ้มข้อมูลดังกล่าวพร้อมทั้งสรุปผลข้อมูล ในแฟ้มข้อมูลข้อ 2.1-2.9
จากการศึกษาสิ่งอำนวยความสะดวกทางลาดสำหรับผู้พิการ ทุพลภาพและคนชราในอาคารห้างสรรพสินค้าทั่วประเทศ ซึ่งมีจำนวนอาคาร ทั้งหมดจำนวน 639 อาคาร พบว่า • ส่วนมากห้างสรรพสินค้าทั่วประเทศ จะสร้างทางลาดที่มีความกว้างของทางลาดไม่น้อยกว่า 90 เซนติเมตรร้อยละ 70.85 รองลงมาพื้นผิวทางลาดผิวไม่ลื่นร้อยละ 68.75 พื้นที่มีความต่างระดับมีทางลาดที่ผู้ใช้รถเข็นสามารถเข้าถึงได้ ร้อยละ 67.99 มีพื้นที่หน้าทางลาดเป็นที่ว่างยาวไม่น้อยกว่า 1.50 เมตร ร้อยละ 54.61 ทางลาดที่มีความยาวรวม 6 เมตรขึ้นไปมีความกว้างไม่น้อยกว่า 1.50 เมตร ร้อยละ 51.66 ทางลาดมีความชันไม่เกิน 1: 12 ร้อยละ 48.16 ทางลาดแต่ละช่วงยาวไม่เกิน 6.00 เมตรร้อยละ 45.19 ทางลาดที่มีความยาว 2.50 เมตรขึ้นไปมีราวจับทั้ง 2 ด้านร้อยละ 30.40 และมีป้ายแสดงทิศทางหรือตำแหน่งของทางลาดให้ผู้ใช้รถเข็นและคนชราทราบ ร้อยละ 6.00
การประมาณค่าจากการเลือกตัวอย่างแบบมีระบบการประมาณค่าจากการเลือกตัวอย่างแบบมีระบบ • สำหรับกรณีที่หน่วยต่างๆในประชากรอยู่เรียงกันอย่างสุ่ม เราหาค่าประมาณความแปรปรวนอย่างคร่าว ๆ ได้โดยคิดเหมือนกับเป็น SRS ขนาด n จาก N ได้จากวิธีต่าง ๆ เช่น