1 / 41

การวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวน. การวิเคราะห์ความแปรปรวนสามารถนำมาใช้ประโยชน์ในการหาคำตอบเกี่ยวกับเรื่องต่างๆ ที่ทำการวิเคราะห์โดยวิธีอื่นไม่สามารถทำได้ดังนี้.

Télécharger la présentation

การวิเคราะห์ความแปรปรวน

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. การวิเคราะห์ความแปรปรวนการวิเคราะห์ความแปรปรวน

  2. การวิเคราะห์ความแปรปรวนสามารถนำมาใช้ประโยชน์ในการหาคำตอบเกี่ยวกับเรื่องต่างๆ ที่ทำการวิเคราะห์โดยวิธีอื่นไม่สามารถทำได้ดังนี้ 1. ใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรพร้อมๆ กันตั้งแต่ 3 ประชากรขึ้นไป โดยที่ตัวแปรหรือลักษณะที่สนใจศึกษาในประชากรมี 1 ตัว หรือ 1 ลักษณะได้ การวิเคราะห์ความแปรปรวนโดยที่ตัวแปรหรือลักษณะที่สนใจศึกษาในประชากรมี 1ตัว หรือ 1 ลักษณะ นี้เรียกว่า การวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว (One - way analysis of variance)

  3. 2. ใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรพร้อมๆ กันตั้งแต่ 2 ประชากรขึ้นไป โดยที่ตัวแปรหรือลักษณะที่สนใจในประชากรที่มากกว่า 1 ตัว หรือ 1ลักษณะ โดยใช้ การวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง (Two - way analysis of variance)

  4. 3. ใช้แยกปัจจัยของหน่วยทดลอง (experimental unit) หรือสิ่งแวดล้อมอื่นๆ ที่มีผลต่อการเปลี่ยนแปลงของลักษณะที่ต้องการทดสอบความแตกต่างระหว่างประชากร เพื่อให้ผลการทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรตั้งแต่ 2 ประชากรขึ้นไปมีความถูกต้องเชื่อถือได้มากขึ้น

  5. ข้อตกลงเบื้องต้นสำหรับการวิเคราะห์ความแปรปรวนข้อตกลงเบื้องต้นสำหรับการวิเคราะห์ความแปรปรวน ข้อมูลจากแต่ละประชากรที่นำมาใช้ทดสอบจะต้องมี คุณสมบัติที่สำคัญต่อไปนี้ 1. เป็นข้อมูลที่ได้จากตัวอย่างที่เลือกมาจากแต่ละประชากรที่นำมาทดสอบ ข้อมูลที่นำมาใช้สำหรับการวิเคราะห์จะต้องเป็นข้อมูลที่เก็บรวบรวมได้ จากตัวอย่างที่เลือก มาเป็นตัวแทนของประชากร เท่านั้น จะใช้ข้อมูลทั้งหมดที่เก็บจากทุกๆ หน่วย ของประชากรไม่ได้

  6. 2. เป็นข้อมูลที่มีการแจกแจงแบบปกติในแต่ละประชากร ข้อมูลของลักษณะที่สนใจศึกษาในแต่ละประชากรซึ่งนำมาทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรตั้งแต่ 2 ประชากรขึ้นไป จะต้องมีการแจกแจงปกติ 3. ข้อมูลของแต่ละประชากรจะต้องมีความแปรปรวน เท่ากัน

  7. วิธีวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียววิธีวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว ความหมายของสัญลักษณะที่ใช้สำหรับเรื่องนี้ เพื่อ ความสะดวกในการคำนวณและการวิเคราะห์ มีดังนี้ สัญลักษณ์ k คือ จำนวนประชากรที่นำมาทดสอบ คือ ค่าเฉลี่ยประชากรที่ i, i = 1, 2, 3, …, k ni คือ จำนวนตัวอย่างที่เลือกจากประชากรที่ i nคือ จำนวนตัวอย่างทั้งหมดที่เลือกมาจากทุกประชากร

  8. xij คือ ค่าสังเกตที่ได้จากตัวอย่างที่ j ที่เลือกมาจาก ประชากรที่ i , j = 1, 2, 3, …, ni T1 คือ ผลรวมของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรที่ i คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรที่ i T คือ ยอดรวมของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรทุกประชากร คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรทุกประชากร

  9. T คือ ยอดรวมของค่าสังเกตจากตัวอย่าง ที่เลือกมาจากประชากรทุกประชากร คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างที่ เลือกมาจากประชากรทุกประชากร

  10. ผลรวมกำลังสองเฉลี่ยทั้งหมด (total mean square) เขียนแทนด้วยสัญลักษณะMS (T) โดยที่ SS(T) คือ ผลรวมกำลังสองทั้งหมด (Total sum of square) df(T) คือ องศาแห่งความเป็นอิสระของทั้งหมด (total deree of freedom)

  11. ผลรวมกำลังสองเฉลี่ยระหว่างประชากรผลรวมกำลังสองเฉลี่ยระหว่างประชากร (between mean square) เขียนแทนด้วยสัญลักษณ์MS(B) โดยที่ SS(B) คือ ผลรวมกำลังสองระหว่างประชากร (between sum of square) df(T) คือ องศาแห่งความเป็นอิสระระหว่างประชากร (between degree of freedom) = k-1

  12. ผลรวมกำลังสองเฉลี่ยภายในประชากรผลรวมกำลังสองเฉลี่ยภายในประชากร (within mean square) เขียนแทนด้วยสัญลักษณะMS(W) โดยที่ SS(W) คือ ผลรวมกำลังสองภายในประชากร (within sum of square) df(W) คือ องศาแห่งความเป็นอิสระของภายในประชากร (within degree of freedom) = n-k

  13. ถ้าประชาทั้ง k ประชากรมีการแจกแจงปกติ ที่มีความแปรปรวนเท่ากันแล้ว อัตราส่วน มีการแจกแจงแบบF (F-distribution) ที่มีองศาความเป็นอิสระk-1 และ n-k การแจกแจงแบบ F มีลักษณะเป็นโค้งไม่สมมาตร (asymmetrical shape) ขอบเขตของการปฏิเสธ สมมุติฐานว่างอยู่ทางขวาของโค้ง

  14. ถ้าต้องการทดสอบสมมุติฐานว่างที่ว่าค่าเฉลี่ยของ ประชากรทั้ง k ประชากรไม่มีความแตกต่างกัน หรือ ที่ระดับนัยสำคัญ จะปฏิเสธ Ho ถ้าอัตราส่วน มีค่ามากกว่าค่า F ที่อ่านได้จากตารางที่องศาแห่งความเป็นอิสระของระหว่างประชากร และภายในประชากร

  15. การปฏิเสธ Ho หรือยอมรับ H1 นี้ หมายความว่ามีค่าเฉลี่ยของประชากรอย่างน้อยหนึ่งประชากรที่แตกต่างจากค่าเฉลี่ยของประชากรอื่นๆ ที่เหลือ โดยทั่วๆ ไป การทดสอบสมมุติฐานโดยวิธีความแปรปรวน นิยมเขียนอยู่ในรูปตารางวิเคราะห์ความแปรปรวน ดังนี้

  16. ตารางวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียวตารางวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว สาเหตุของความ แปรปรวน องศาแห่ง ความ เป็นอิสระ (df) ผลรวมกำลังสอง (SS) ผลรวมกำลังสองเฉลี่ย (MS) อัตราส่วน F k-1 ระหว่างประชากร ภายในประชากร n-k รวม n-1

  17. ตัวอย่างที่ 1 ข้อมูลต่อไปนี้แสดงปริมาณผงซักฟอกชนิดหนึ่ง ที่แม่บ้านแต่ละคนใช้ซึ่งเลือกมาเป็นตัวอย่างจากจังหวัดภูเก็ต ลำปาง สุรินทร์ และอยุธยา โดยใช้พนักงาน 4 คน สำรวจในช่วง 3 เดือน จงทดสอบว่ามีความแตกต่างระหว่างปริมาณการใช้ผงซักฟอกโดยเฉลี่ยของแม่บ้านในจังหวัดต่างๆ ในรอบ 3 เดือน ที่ผ่านมาหรือไม่ ที่ระดับนัยสำคัญ 0.05

  18. ปริมาณผงซักฟอก (กล่อง) แม่บ้าน ภูเก็ต 5 8 8 5 4 อยุธยา 11 8 12 19 ลำปาง 2 7 8 10 11 12 สุรินทร์ 7 9 10 9 10

  19. วิธีทำ สมมุติฐาน Ho : แม่บ้านในจังหวัดภูเก็ต ลำปาง สุรินทร์ และอยุธยา ใช้ผงซักฟอกโดยเฉลี่ยเท่ากัน H1 : แม่บ้านในจังหวัด ภูเก็ต ลำปาง สุรินทร์ และอยุธยา ใช้ผงซักฟอกโดยเฉลี่ยไม่เท่ากัน หรือ อย่างน้อยหนึ่งคู่ที่ i j

  20. ปริมาณผงซักฟอก ตัวอย่างที่ 1 2 3 4 5 6 5 8 8 5 4 2 7 8 10 11 12 4 49 64 100 121 144 7 9 10 9 10 49 81 100 81 100 11 8 12 19 121 64 144 361 25 64 64 25 16 Ti 30 50 45 50

  21. T = 175

  22. สรุปตารางวิเคราะห์ความแปรปรวนสรุปตารางวิเคราะห์ความแปรปรวน สาเหตุของความแปรปรวน MS d.f. SS อัตราส่วน f SS(B)=1,626.67-1531.25 95.42/3 31.81/9.4 ระหว่างจังหวัด 3 = 95.42 =31.81 =3.38 SS(W)=1,777-1,626.67 150.33/16 16 ภายในจังหวัด =150.33 =9.4 SS(T)=1,777-1,531.25 รวม 19 =245.75 จากตารางแจกแจงความถี่ F ของค่า F ที่ระดับนัยสำคัญ 0.05 และ d.f. (3,16) เท่ากับ 3.24

  23. อัตราส่วน F ที่คำนวณได้ 3.38 > 3.24 ดังนั้น ปฏิเสธ Ho ยอมรับ H1 สรุปได้ว่า ปริมาณผงซักฟอกที่แม่บ้านทั้ง 4 จังหวัดใช้มีความแตกต่างกัน หรือมีแม่บ้านอย่างน้อยหนึ่งจังหวัดที่ใช้ผงซักฟอกในปริมาณไม่เท่ากับแม่บ้านในจังหวัดอื่นๆ อีก 3 จังหวัด ที่ระดับนัยสำคัญ 0.05

  24. หมายเหตุ ถ้าต้องการทราบว่าค่าเฉลี่ยของประชากรใดบ้างแตกต่างกัน ต้องทดสอบหาความแตกต่างระหว่างค่าเฉลี่ยของสองประชากรใดๆ ภายหลังการวิเคราะห์ความแปรปรวน โดยใช้วิธีของ Tukey หรือ LSD หรือ Scheffe หรือ Student-Newman

  25. การวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง (two-way analysis of variance) ใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากร ตั้งแต่สองชุดขึ้นไป โดยที่ประชากรมีความแตกต่างกัน เนื่องจากสองลักษณะ -ยอดจำหน่ายสินค้าแตกต่างกันเนื่องจากพนักงานขาย และวันในแต่ละสัปดาห์หรือไม่ -อัตราค่าจ้างของคนงานในโรงงานอุตสาหกรรมแตกต่าง เนื่องจากประเภทโรงงาน/เพศของคนงานหรือไม่

  26. ขั้นตอนการวิเคราะห์ ความแปรปรวนแบบจำแนกสองทาง ความหมายของสัญลักษณ์ที่จะใช้สำหรับการวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง เมื่อข้อมูลประกอบด้วยค่าสังเกตของค่าเดียว มีดังนี้ r คือ จำนวนแถว c คือ จำนวนสดมภ์ n คือ ค่าตัวอย่างทั้งหมด

  27. Xij คือ ค่าสังเกตที่ได้จากแถวที่ i สดมภ์ที่ j คือ ค่าเฉลี่ยของค่าสังเกตจากสดมภ์ที่ j ทุกๆ แถว คือ ค่าเฉลี่ยของค่าสังเกตจากแถวที่ i ทุกๆ สดมภ์ คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างทั้งหมด คือ ผลรวมของค่าสังเกตจากแถวที่ i ทุกๆ สดมภ์ คือ ผลรวมของค่าสังเกตจากสดมภ์ที่ j ทุกๆ แถว T คือ ผลรวมของค่าสังเกตจากตัวอย่างทั้งหมด

  28. ตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทางเมื่อข้อมูลประกอบด้วยค่าสังเกตเพียงค่าเดียวตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทางเมื่อข้อมูลประกอบด้วยค่าสังเกตเพียงค่าเดียว สาเหตของความแปรวปรวน d.f. SS MS F r-1 ระหว่างแถว ระหว่างสดมภ์ c-1 ภายในแถวและสดมภ์ (r-1)(c-1) รวม rc-1

  29. ในการทดลองปลูกมะเขือเทศในห้องทดลองที่อุณหภูมิต่างกัน 4 ระดับ และมีวิธีให้อาหารที่ต่างกัน 3 วิธี ได้ตาราง ANOVA มีค่าต่างๆ ดังนี้ สาเหตุของ ความแปรปรวน df SS MS F 10.53 237 79 ระหว่างอุณหภูมิ 3 (237/3) (79/7.5) (302-20-45) 1.33 10 2 ระหว่างอาหาร 20 (20/2) (10/7.5) ภายในอุณหภูมิ และอาหาร 7.5 45 6 [(6)(7.5)] รวม 11 302

  30. สมมุติฐาน ก) H0: มะเขือเทศที่ปลูกในอุณหภูมิต่างกัน 4 ระดับ ให้ผลผลิตโดยเฉลี่ยเท่ากัน H1: มะเขือเทศที่ปลูกในอุณหภูมิต่างกัน 4 ระดับ ให้ผลผลิตโดยเฉลี่ยไม่เท่ากัน ข) H0: มะเขือเทศที่ปลูกโดยให้อาหารต่างกัน 3 อย่าง ให้ผลผลิตโดยเฉลี่ยเท่ากัน H1: มะเขือเทศที่ปลูกโดยให้อาหารต่างกัน 3 อย่าง ให้ผลผลิตโดยเฉลี่ยไม่เท่ากัน

  31. ก) ค่าวิกฤต F0.5,3,6 = 4.76 5.14 ข) ค่าวิกฤต F0.5,2,6 = ก) เพราะว่าอัตราส่วน F ในการทดสอบเรื่องอุณหภูมิ เท่ากับ 10.53 > 4.76 ดังนั้น ปฏิเสธ H0ยอมรับ H1 ข) เพราะว่าอัตราส่วน F ในการทดสอบเรื่องอาหาร เท่ากับ 1.33 < 5.14 ดังนั้น ยอมรับ H0ปฏิเสธ H1 สรุปได้ว่าการปลูกมะเขือเทศในอุณหภูมิที่ต่างกันจะให้ ผลผลิตโดยเฉลี่ยต่างกัน แต่การให้อาหารต่างกันไม่ทำ ให้ผลผลิตโดยเฉลี่ยต่างกันนั่นคืออาหารไม่มีผลต่อผลผลิต

  32. ตัวอย่างที่ 2 บริษัทผลิตกระดาษเช็ดหน้า ทำกล่องบรรจุกระดาษเช็ดหน้าต่างกัน 3 แบบ ถ้าจำนวนกล่องของกระดาษเช็ดหน้าแต่ละแบบที่ขายได้ในห้างสรรพสินค้าขนาด ใหญ่ 4 ห้าง ดังนี้

  33. ห้างสรรพสินค้า แบบของกล่องบรรจุ รวม C R L M ลีลา ฟ้าสวย นวยนาด รวม 17 34 23 74 15 26 21 62 1 23 8 32 6 22 16 44 39 105 68 212 กระดาษเช็ดหน้าที่บรรจุกล่องทั้งสามแบบขายได้ต่างกันหรือไม่ และห้างสรรพสินค้าทั้งสี่ห้างขายกระดาษเช็ดหน้าได้ต่างกันหรือไม่ ที่ระดับนัยสำคัญ 0.05

  34. วิธีทำ สมมุติฐาน ก. Ho: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขาย ได้ทั้ง 3 แบบ ไม่แตกต่างกัน H1: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขาย ได้ทั้ง 3 แบบแตกต่างกัน ข. Ho: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้าง ทั้ง 4 ขายได้ไม่แตกต่างกัน H1: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้าง ทั้ง 4 ขายได้แตกต่างกัน

  35. ห้าง Ti. แบบ C X2 R L X2 M X2 X2 ลีลา ฟ้าสวย นวยนาด 15 26 21 289 1,156 529 225 676 441 1 23 8 1 529 64 6 22 16 36 484 256 39 105 68 17 34 23 = 4,292.5 62 74 32 T.j 44 =4,093.32 T = 212 = 3,745.33

  36. สรุปตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทางสรุปตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง สาเหตุของความแปรปรวน SS MS F d.f. SS(R)=4,292.5-3,745.33 ระหว่างแบบ 2 =547.17 =273.585 =36.07(ก) SS(C)=4,093.32-3,745.33 ระหว่างห้าง 3 =347.99 =115.99 =15.29(ข) ภายในแบบและห้าง SS(W)=940.67-547.17-347.99 6 =45.51 =7.585 SS(T)=4,686-3,745.33 รวม 11 =940.67

  37. ทดสอบที่ระดับนัยสำคัญ 0.05 ดังนั้น ค่าวิกฤติ F(0.05,3,6) = 5.14 และ F(0.05,3,6) = 4.76 นั่นคือ อัตราส่วน F ของการทดสอบ Ho ที่ว่าจำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขายได้ทั้ง 3 แบบไม่แตกต่างกันซึ่งเท่ากับ 36.07 มากกว่า 5.14 และ อัตราส่วน F ของการทดสอบ Ho จำนวนกล่อง โดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้างทั้ง 4 ขายได้ ไม่แตกต่างกันซึ่งเท่ากับ 15.29 มากกว่า 4.76

  38. ดังนั้น จึงปฏิเสธ Ho ของการทดสอบสมมุติฐานทั้งสองสมมุติฐาน นั้นคือ จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขายได้ทั้ง 3 แบบแตกต่างกัน และจำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้างทั้ง 4 ห้างขายได้แตกต่างกัน

  39. จบหน่วยที่ 4 การวิเคราะห์ ความ แปรปรวน

More Related