13
บทที7(ต่อ) การวิเคราะห์ความแปรปรวน 7.1 แนวคิดเรื่องการวิเคราะห์ความแปรปรวน การวิเคราะห์ความแปรปรวน (analysis of variance) หรือเรียกอีกอย่างหนึ่งว่าการวิเคราะห์ anova เป็นส่วนหนึ่งของการวางแผนการทดลองเพื่อเปรียบเทียบความแตกต่างของประชากรที่มากกว่า 2 กลุ่มขึ้นไปด้วยการทดสอบเพียงครั้งเดียว โดยใช้วิธีการทางคณิตศาสตร์ที่แบ่งความแปรปรวนของข้อมูล ออกเป็นส่วน ๆ ตามแหล่งที่มาหรือสาเหตุของความแปรปรวนนั้น แล้วทาการทดสอบโดยเปรียบเทียบความ แปรปรวนด้วยตัวสถิติ F (F–statistic) เพื่อตรวจสอบว่าความแตกต่างของแหล่งที่มาของความแปรปรวนนั้น มีนัยสาคัญทางสถิติหรือไม่ ข้อมูลที่จะนามาวิเคราะห์ความแปรปรวน ต้องสอดคล้องกับข้อกาหนดเบื้องต้นดังนี1. กลุ่มตัวอย่างถูกสุ่มมาจากประชากรที่มีการแจกแจงปกติ 2. ประชากรแต่ละกลุ่มเป็นอิสระกัน 3. ความแปรปรวนของแต่ละประชากรต้องเท่ากัน การแยกสาเหตุ หรือแหล่งที่มาของความแปรปรวนของข้อมูลในการวิเคราะห์ความแปรปรวนนั้น โดยทั่วไปจะ แยกเป็น 3 ส่วน คือ ความแปรปรวนรวม (sum square total : SST) เป็นความแปรปรวนรวมของข้อมูลทั้งหมด จากประชากรทุกกลุ่ม ความแปรปรวนระหว่างกลุ่ม (sum square between group : SSB) เป็นความ แปรปรวนระหว่างค่าเฉลี่ยของข้อมูลของแต่ละกลุ่ม ความแปรปรวนภายในกลุ่ม (sum square within group หรือ sum square error : SSE) เป็นความแปรปรวนระหว่างข้อมูลภายในกลุ่มเดียวกัน ความสัมพันธ์ของสาเหตุความแปรปรวนทั้งหมดอธิบายได้ดังสมการ ความแปรปรวนรวม = ความแปรปรวนระหว่างกลุ่ม + ความแปรปรวนภายในกลุ่ม สถิติที่ใช้ในการทดสอบความแปรปรวนของประชากร คือสถิติ F ซึ่งเป็นตัวสถิติที่ใช้ในการทดสอบ อัตราส่วนของความแปรปรวนระหว่างกลุ่มและความแปรปรวนภายในกลุ่ม F = ความแปรปรวนระหว่างกลุ่ม ความแปรปรวนภายในกลุ่ม

บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

บทที่ 7(ต่อ)

การวิเคราะห์ความแปรปรวน

7.1 แนวคิดเรื่องการวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวน (analysis of variance) หรือเรียกอีกอย่างหนึ่งว่าการวิเคราะห์ anova เป็นส่วนหนึ่งของการวางแผนการทดลองเพ่ือเปรียบเทียบความแตกต่างของประชากรที่มากกว่า 2 กลุ่มขึ้นไปด้วยการทดสอบเพียงครั้งเดียว โดยใช้วิธีการทางคณิตศาสตร์ที่แบ่งความแปรปรวนของข้อมูลออกเป็นส่วน ๆ ตามแหล่งที่มาหรือสาเหตุของความแปรปรวนนั้น แล้วท าการทดสอบโดยเปรียบเทียบความแปรปรวนด้วยตัวสถิติ F (F–statistic) เพ่ือตรวจสอบว่าความแตกต่างของแหล่งที่มาของความแปรปรวนนั้น มีนัยส าคัญทางสถิติหรือไม่ ข้อมูลที่จะน ามาวิเคราะห์ความแปรปรวน ต้องสอดคล้องกับข้อก าหนดเบื้องต้นดังนี้

1. กลุ่มตัวอย่างถูกสุ่มมาจากประชากรที่มีการแจกแจงปกติ 2. ประชากรแต่ละกลุ่มเป็นอิสระกัน 3. ความแปรปรวนของแต่ละประชากรต้องเท่ากัน

การแยกสาเหตุ หรือแหล่งที่มาของความแปรปรวนของข้อมูลในการวิเคราะห์ความแปรปรวนนั้น โดยทั่วไปจะแยกเป็น 3 ส่วน คือ

ความแปรปรวนรวม (sum square total : SST) เป็นความแปรปรวนรวมของข้อมูลทั้งหมดจากประชากรทุกกลุ่ม

ความแปรปรวนระหว่างกลุ่ม (sum square between group : SSB) เป็นความ แปรปรวนระหว่างค่าเฉลี่ยของข้อมูลของแต่ละกลุ่ม

ความแปรปรวนภายในกลุ่ม (sum square within group หรือ sum square error : SSE) เป็นความแปรปรวนระหว่างข้อมูลภายในกลุ่มเดียวกัน

ความสัมพันธ์ของสาเหตุความแปรปรวนทั้งหมดอธิบายได้ดังสมการ

ความแปรปรวนรวม = ความแปรปรวนระหว่างกลุ่ม + ความแปรปรวนภายในกลุ่ม

สถิติที่ใช้ในการทดสอบความแปรปรวนของประชากร คือสถิติ F ซึ่งเป็นตัวสถิติที่ใช้ในการทดสอบอัตราส่วนของความแปรปรวนระหว่างกลุ่มและความแปรปรวนภายในกลุ่ม

F = ความแปรปรวนระหว่างกลุ่ม ความแปรปรวนภายในกลุ่ม

Page 2: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

2

ถ้าค่าของตัวสถิติ F มีค่ามาก หมายความว่าความแปรปรวนระหว่างกลุ่มมีค่ามากกว่าความ แปรปรวนภายในกลุ่ม จึงน าไปสู่ข้อสรุปว่าประชากรแต่ละกลุ่มมีความแตกต่างกัน แต่ถ้าค่าของตัวสถิติทดสอบ F มีค่าน้อย นั่นคือความแปรปรวนระหว่างกลุ่มกับความแปรปรวนภายในกลุ่มมีค่า ใกล้เคียงกัน จึงไม่อาจกล่าวได้ว่าความแปรปรวนทั้งหมดเป็นความแตกต่างระหว่างกลุ่ม

7.2 การวิเคราะห์ความแปรปรวนแบบจ าแนกทางเดียว

ในการวิเคราะห์ความแปรปรวนแบบจ าแนกทางเดียว (one-way anova) เป็นการเปรียบเทียบค่าเฉลี่ยระหว่างประชากรหลาย ๆ กลุ่ม โดยเป็นการจ าแนกข้อมูลแต่ละกลุ่มด้วยคุณลักษณะที่สนใจเพียงคุณลักษณะเดียวที่เป็นเงื่อนไขให้ข้อมูลแตกต่างกัน เรียกว่า กรรมวิธี หรือทรีทเมนต์ (treatment) เชน่ การเปรียบเทียบอายุการใช้งานของถ่านไฟฉายแต่ละชนิด กรรมวิธีคือชนิดของถ่านไฟฉาย หรือเปรียบเทียบวิธีขายสินค้า 4 วิธี ในกรณีนี้ กรรมวิธีคือวิธีขาย ฯลฯ

การวิเคราะห์ข้อมูลท าได้โดยการจัดรูปแบบของข้อมูลในรูปตาราง เมื่อก าหนดสัญลักษณ์ต่าง ๆ ที่ใช้ในการค านวณคือ xij คือ ค่าสังเกตที่ i ใน กรรมวิธีที่ j

เมื่อ i = 1 , 2 , 3 , … , n j = 1 , 2 , 3 , … , k

Tj คือ ผลรวมของค่าสังเกตในกรรมวิธี ที่ j

T คือ ผลรวมของค่าสังเกตทุก ๆ ค่า nj คือ จ านวนข้อมูลในกลุ่มที่ j N คือ จ านวนข้อมูลทั้งหมด

จัดข้อมูลให้อยู่ในรูปตารางเพ่ือง่ายต่อการค านวณ

ข้อมูล ล าดับที่

กรรมวิธี 1 2 3 k

1 x11 x12 x13 x1k

2 x21 x22 x23 x2k 3 x31 x32 x33 x3k

n xn1 xn2 xn3 xnk

รวม T1 T2 T3 Tj T.

เฉลี่ย 1x 2x 3x … jx p X .

Page 3: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

3

ในการวิเคราะห์ข้อมูลเพื่อเปรียบเทียบอิทธิพลของแต่ละกรรมวิธี จะพิจารณาจากความสัมพันธ์ของความแปรปรวนทั้ง 3 คือ

ความแปรปรวนรวม = ความแปรปรวนระหว่างกลุ่ม + ความแปรปรวนภายในกลุ่ม หรือ

SST = SSB + SSE

โดยที่ ความแปรปรวนรวม (SST) ค านวณได้จาก

SST =

k

1j

2n

1iij )xx(

=

k

1j

n

1i

2ijx -

2

N

.T

ความแปรปรวนระหว่างกลุ่ม (SSB) ค านวณได้จาก

SSB =

k

1j

2j )xx(

=

k

1j j

2j

n

T -

2

N

.T

ความแปรปรวนภายในกลุ่ม (SSE) ค านวณได้จาก

SSE =

k

1j

n

1i

2jij )xx(

=

k

1j j

2jk

1j

n

1i

2ij

n

Tx

หรือ SSE = SST - SSB

โดยที่ ค่า 2

N

T เรียกว่าเป็นค่าปรับแก้ (correction term) ในการค านวณ

สถิติที่ใช้ในการทดสอบความแปรปรวนของประชากร คือสถิติ F ซึ่งเป็นตัวสถิติที่ใช้ในการทดสอบอัตราส่วนของความแปรปรวนประชากร โดยมีสูตรที่ใช้ในการค านวณ คือ

F = )kn/(SSE

)1k/(SSB

= MSE

MSB

ที่องศาเสรี = (k-1 , n-k)

Page 4: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

4

การแจกแจงของตัวสถิติ F เป็นการแจกแจงแบบเบ้ขวา ที่มีอาณาเขตวิกฤตอยู่ด้านขวาเพียงด้านเดียว อาณาเขตยอมรับสมมุติฐาน และอาณาเขตปฏิเสธสมมุติฐานพิจารณาได้ดังรูป

F (k-1,n-k)

ขั้นตอนการทดสอบสมมุติฐาน 1. ก าหนดสมมุติฐาน

H0 : 1 = 2 = 3 = = k H1 : มีค่าเฉลี่ยประชากรอย่างน้อย 1 กลุ่มท่ีต่างจากกลุ่มอ่ืน ๆ

2. ก าหนดอาณาเขตวิกฤต

ก าหนดค่าของ เพ่ือน าไปสู่ค่าวิกฤตของการตัดสินใจยอมรับหรือปฏิเสธ H0 ที่องศาเสรี d.f. = (k-1 , n-k)

3. สถิติทดสอบ

F = MSE

MSB

4. ค านวณ 4.1 ค านวณหาตัวปรับแก้ (correction term : c.t.) โดย

c.t. = 2

N

T

4.2 ค านวณ SST โดย

SST =

k

1j

n

1i

2ij

x - c.t.

4.3 ค านวณ SSB โดย

SSB =

k

1j j

2j

n

T - c.t.

4.4 ค านวณ SSE โดย SSE = SST - SSB

4.5 สร้างตาราง anova

0

Page 5: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

5

แหล่งความแปรปรวน S.S. d.f. M.S. F-ratio

ระหว่างกลุ่ม SSB k-1 MSB F =

MSE

MSB

ภายในกลุ่ม SSE N-k MSE

รวม SST N-1

5. ตัดสินใจ เปรียบเทียบค่า F-ratio ที่ค านวณได้จากตาราง anova กับ ค่าวิกฤตที่เปิดจากตาราง และ

ตัดสินใจปฏิเสธ H0 เมื่อ Fค านวณ > Fวิกฤต

6. สรุป อธิบายผลการทดสอบ

ตัวอย่าง 1 นักวิจัยตลาดคนหนึ่งต้องการทราบว่า รถตู้ที่ก าลังได้รับความนิยมในตลาด 3 ยี่ห้อ คือ A , B และ C จะกินน้ ามันต่างกันหรือไม่ จึงสุ่มตัวอย่างรถแต่ละยี่ห้อ มาอย่างละ 4 คัน แล้วให้น้ ามัน คันละ 3 ลิตร บันทึกระยะทางที่รถแต่ละคันวิ่งได้จนน้ ามันหมด ดังตาราง

ยี่ห้อรถ ระยะทางที่วิ่งได้ (กิโลเมตร) รวม A 21 26 25 20 92 B 23 26 25 18 92 C 35 38 35 32 140

จงสรุปผลการทดสอบดังกล่าว ที่ระดับนัยส าคัญ 0.05

ตัวอย่าง 2 ข้อมูลต่อไปนี้ เป็นจ านวนผลผลิตที่ช ารุดจากการตรวจพบในแต่ละวันของเครื่องจักร 5 เครื่องในระยะเวลา 5 วัน จงทดสอบว่าประสิทธิภาพของเครื่องจักรทั้ง 5 เครื่องแตกต่างกันหรือไม่ ที่ระดับนัยส าคัญ 0.01

วัน เครื่องจักร

A B C D E 1 7 12 14 19 7 2 7 17 18 25 10 3 15 12 18 22 11 4 11 18 19 19 15 5 9 18 19 23 11

รวม 49 77 88 108 54

Page 6: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

6

7.3 การวิเคราะห์ความแปรปรวนแบบจ าแนกสองทาง

การวิเคราะห์ความแปรปรวนแบบจ าแนกสองทาง (two–way anova) แตกต่างจากการวิเคราะห์ความแปรปรวนแบบจ าแนกทางเดียวคือ ในการวิเคราะห์ความแปรปรวนแบบจ าแนกทางเดียว หน่วยตัวอย่างภายในกลุ่มเดียวกันจะต้องมีความแตกต่างกันน้อยมาก เพื่อที่จะมั่นใจได้ว่าเมื่อเกิดความแปรปรวนในการทดลอง จะน าไปสู่ข้อสรุปได้ชัดเจนว่าเป็นความแปรปรวนระหว่างกลุ่ม แต่ในทางปฏิบัติ อาจพบว่าการใช้หน่วยตัวอย่างที่เหมือนกันหรือมีความคล้ายคลึงกัน จะเป็นไปได้ยากมาก เช่น ถ้าจะเปรียบเทียบยอดขายประกันของบริษัทจากวิธีขายที่แตกต่างกัน 3 วิธี อาจเป็นได้ว่าความสามารถที่แตกต่างกันของพนักงานก็เป็นส่วนหนึ่งที่ท าให้ยอดขายแตกต่างกันได้ แม้จะใช้วิธีขายวิธีเดียวกัน ดังนั้นเมื่อเกิดความแปรปรวนของข้อมูล จึงท าให้สรุปได้ไม่ชัดเจนว่าเป็นเพราะวิธีขายที่ต่างกัน หรือเป็นเพราะความสามารถของพนักงานที่แตกต่างกันที่เป็นสาเหตุท าให้ยอดขายแตกต่างกัน ดังนั้นจึงอาจจะแบ่งหน่วยทดลองออกเป็นกลุ่ม ๆ เรียกว่า บล็อค (block) โดยให้ภายในแต่ละบล็อค ประกอบไปด้วยหน่วยตัวอย่างที่มีความคล้ายคลึงกัน ส่วนในต่างบล็อคก็จะเป็นหน่วยตัวอย่างที่แตกต่างกัน และจ านวนหน่วยทดลองภายในแต่ละบล็อคจะได้รับกรรมวิธีต่าง ๆ ครบชุด สรุปตารางข้อมูลส าหรับการวิเคราะห์ความแปรปรวนแบบจ าแนกสองทาง ดังนี้

บล็อค กรรมวิธี

รวม 1 2 3 j

1 x11 x12 x13 x1j T1

2 x21 x22 x23 x2j T2

3 x31 x32 x33 x3j T3

.

.

.

. . . . . . . .

. . . .

.

.

.

i xi1 xi2 xi3 xij Ti

รวม T.1 T.2 T.3 Tj T..

อธิบายสัญลักษณ์ต่าง ๆ ได้ดังนี้ xij คือ ค่าสังเกตที่ i ใน กรรมวิธี ที่ j เมื่อ i = 1 , 2 , 3 , ….... , n j = 1 , 2 , 3 , ……. , k

Tj คือ ผลรวมของค่าสังเกตในกรรมวิธี ที่ j Ti คือ ผลรวมของค่าสังเกตในบล็อคท่ี i T คือ ผลรวมของค่าสังเกตทุก ๆ ค่า ในกรณีนี้ จะแยกแหล่งความแปรปรวนทั้งหมดออกได้เป็น

Page 7: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

7

ความแปรปรวนรวม = ความแปรปรวนระหว่างกรรมวิธี + ความแปรปรวนระหว่างบล็อค + ความแปรปรวนอื่น ๆ

หรือ SST = SSR + SSC + SSE

เมื่อ SST คือ ความแปรปรวนรวม ค านวณได้โดย

SST =

k

1j

2n

1iij )xx(

=

k

1j

n

1i

2ij

x - c.t.

SSC คือ ความแปรปรวนระหว่างกรรมวิธี ในแต่ละคอลัมน์ ค านวณได้โดย

SSC =

k

1j

2j )xx(

=

k

1j j

2j

n

T - c.t.

SSR คือ ความแปรปรวนระหว่างบล็อคในแต่ละแถว ค านวณได้โดย

SSR =

n

1i

2i )xx(

=

n

1i i

2i

n

T - c.t.

SSE คือ ความผันแปรภายในอ่ืน ๆ ที่ไม่ทราบสาเหตุ ค านวณได้โดย

SSE = SST - SSR - SSC

ขั้นตอนการทดสอบสมมุติฐาน

1. ก าหนดสมมุติฐาน ก) H0 : 1 = 2 = 3 = = j

H1 : มีอย่างน้อย 1 กรรมวิธีทีม่ีค่าเฉลี่ยต่างจากกรรมวิธีอ่ืน ๆ

ข) H0 : 1 = 2 = 3 = = i

H1 : มีอย่างน้อย 1 บล็อคทีม่ีค่าเฉลี่ยต่างจากบล็อคอ่ืน ๆ

2. ก าหนดอาณาเขตวิกฤต ก าหนดค่าของ เพ่ือน าไปสู่ค่าวิกฤตของการตัดสินใจยอมรับหรือปฏิเสธ H0 โดย

Page 8: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

8

ก) ถ้าก าหนดสมมุติฐานเพ่ือทดสอบความแตกต่างระหว่างบล็อคแต่ละแถว ค่าวิกฤต F ก าหนดที่ d.f. = r-1 , (r-1)(c-1)

ข) ถ้าก าหนดสมมุติฐานเพ่ือทดสอบความแตกต่างระหว่างกรรมวิธีแต่ละคอลัมน์ ค่าวิกฤต F ก าหนดที ่ d.f. = c-1 , (r-1)(c-1)

3. สูตร

ก) F = MSE

MSR

ข) F = MSE

MSC

4. ค านวณ

4.1 ค านวณค่า c.t. โดย

c.t. = 2

N

T

4.2 ค านวณ SST โดย

SST =

k

1j

n

1i

2ij

x - c.t.

4.3 ค านวณ SSR โดย

SSR =

n

1i i

2i

n

T - c.t.

4.4 ค านวณ SSC โดย

SSC =

k

1j j

2j

n

T - c.t.

4.5 ค านวณ SSE โดย

SSE = SST - SSR - SSC

4.6 สร้างตาราง anova

แหล่งความแปรปรวน d.f. S.S. M.S. F - ratio

ระหว่างแถว r – 1 SSR MSR F = MSE

MSR

ระหว่างหลัก c – 1 SSC MSC F = MSE

MSC

ความผิดพลาดอ่ืน ๆ (r-1)(c-1) SSE MSE

รวม N-1 SST

Page 9: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

9

5. ตัดสินใจ ที่ระดับนัยส าคัญท่ีก าหนด ในการพิจารณาบริเวณวิกฤต ถ้า H0 ไม่จริง MSR และ MSC จะต้องมีค่ามาก ดังนั้นสถิติ

ทดสอบ F จะต้องมีค่ามากด้วย เปรียบเทียบค่าท่ีค านวณได้จากตาราง anova กับค่าวิกฤตจากตาราง และตัดสินใจปฏิเสธ H0 เมื่อ Fค านวณ > Fตาราง

6. สรุป อธิบายผลการทดสอบ

ตัวอย่าง 3 ข้อมูลต่อไปนี้ คือยอดขายขนมจากร้านค้า 5 แห่งจากต าแหน่งที่วางขนม 3 ต าแหน่ง

ต าแหน่งที่วางขนม

ร้านค้า รวม

A B C D E ระดับบน

ระดับกลาง ระดับล่าง

7 8 9 10 11 9 9 9 9 12 10 10 12 12 14

45 48 58

รวม 26 27 30 31 37 151

ที่ระดับนัยส าคัญ 0.05 จงทดสอบว่ายอดขายขนมของแต่ละร้าน และต าแหน่งที่วางขนมแต่ละระดับแตกต่างกันหรือไม่

ตัวอย่าง 4 ในการผลิตสินค้าของโรงงานที่มีเครื่องจักร 4 เครื่อง และคนงาน 5 คน ที่ผลัดเปลี่ยนกันเข้าท างานเป็นผลัด ตรวจนับจ านวนสินค้าที่เครื่องจักรแต่ละเครื่องและคนงานแต่ละคนผลิตได้ในรอบสัปดาห์ที่ผ่านมา ได้ข้อมูลดังตาราง

คนงาน เครื่องจักร

รวม 1 2 3 4 5

คนที่ 1 20 21 19 24 16 100 คนที่ 2 7 8 7 9 9 40 คนที่ 3 10 10 9 7 12 48 คนที่ 4 24 24 23 20 21 112 รวม 61 63 58 60 58 300

ที่ระดับนัยส าคัญ 0.01 จงทดสอบว่าประสิทธิภาพของคนงานทั้ง 4 คนแตกต่างกันหรือไม่ และ ประสิทธิภาพของเครื่องจักรทั้ง 5 เครื่องแตกต่างกันหรือไม่

Page 10: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

10

7.4 การเปรียบเทียบความแตกต่างระหว่างค่าเฉลี่ยภายหลังการวิเคราะห์ความแปรปรวน

เมื่อกระบวนการทดสอบสมมุติฐานในการเปรียบเทียบค่าเฉลี่ย k กลุ่ม (k > 3) น าไปสู่การตัดสินใจปฏิเสธสมมุติฐานหลัก แสดงว่ามีค่าเฉลี่ยของประชากรอย่างน้อย 1 คู่ ที่แตกต่างกัน ประเด็นค าถามที่น่า สนใจก็คือ ในจ านวน k กลุ่มท่ีน ามาทดสอบนั้นมีค่าเฉลี่ยที่แตกต่างกันทุกกลุ่ม หรือมีเพียงบางกลุ่มท่ีแตกต่างออกไปจากส่วนใหญ่ เพื่อจะหาค าตอบส าหรับข้อสงสัยเหล่านั้น จะน าค่าเฉลี่ยของแต่ละกลุ่มมาเปรียบเทียบกันทีละคู่ โดยใช้สถิติทดสอบ t ด้วยวิธีการที่เหมาะสมซึ่งมีอยู่หลายวิธี ในที่นี้จะใช่วิธีทดสอบที่เรียกว่า วิธี LSD (least significant different method) โดยมีขั้นตอนการทดสอบดังนี้

1. ค านวณหาค่า LSD ที่ระดับนัยส าคัญท่ีก าหนด เพื่อใช้เป็นค่าวิกฤตในการทดสอบความแตกต่างระหว่างแต่ละคู่ท่ีสนใจเปรียบเทียบ โดยที่

LSD =

ji2

n

1

n

1MSEt

เมื่อ ni , nj คือขนาดของกลุ่มตัวอย่างที่เปรียบเทียบ ที่ i และ j

2

t คือค่าของสถิติทดสอบ t ที่ d.f. = N-k

และมีพ้ืนที่ปลายหางด้านขวาเป็น2

MSE คือค่าเฉลี่ยก าลังสองของความคลาดเคลื่อน ที่อ่านค่าได้จากตาราง วิเคราะห์ความแปรปรวน

2. ค านวณหาค่าสัมบูรณ์ของผลต่างของค่าเฉลี่ยระหว่างกลุ่มที่ต้องการเปรียบเทียบ ji xx

3. ตัดสินใจ โดยที่ ถ้า ji xx > LSD หมายความว่าค่าเฉลี่ยของกลุ่มที่ i และ j แตกต่างกัน

แต่ถ้า ji xx < LSD หมายความว่า ค่าเฉลี่ยของกลุ่มที่ i และ j ไม่แตกต่างกัน

ตัวอย่าง 5 จากตัวอย่าง 1 เมื่อการตัดสินใจน าไปสู่การปฏิเสธสมมุติฐาน จงทดสอบว่ามีรถยนต์ยี่ห้อใดบ้างที่กินน้ ามันแตกต่างกัน

Page 11: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

11

แบบฝึกหัด บทที่ 7.2 1. จากการสุ่มถามแม่บ้านใน 4 จังหวัดถึงจ านวนอาหารกระป๋องที่ซื้อในระยะเวลา 3 เดือนที่ผ่านมา ได้

ข้อมูลดังตาราง ที่ระดับนัยส าคัญ 0.05 จงทดสอบว่า ปริมาณอาหารกระป๋องที่แม่บ้านซื้อ โดยเฉลี่ยทั้ง 4 จังหวัดแตกต่างกันหรือไม่

เชียงใหม่ สงขลา ขอนแก่น กรุงเทพ 5 8 8 5 4

2 7 8 10 11 12

7 9 10 9 10

11 8 12 19 8 10

2. จากการสอบถามรายได้ต่อสัปดาห์ (บาท) ของคนงานซึ่งได้รับการสุ่มเลือกเป็นตัวอย่างจาก โรงงานอุตสาหกรรม 3 แห่ง ปรากฏผล ดังนี้

โรงงาน A โรงงาน B โรงงาน C 400 450 750 380 450 600 550 1,000 500 900 800 800 700 500 950

ที่ระดับนัยส าคัญ 0.01 จงทดสอบว่ารายได้ของคนงานจากโรงงานอุตสาหกรรมทั้งสามแห่งแตกต่าง กันหรือไม่ 3. ถ้าต้นทุนต่อหน่วยในการผลิตสินค้าชนิดหนึ่ง (บาท) ของโรงงานซึ่งตั้งอยู่ในเขตกรุงเทพฯ ปทุมธานี และ

อยุธยา เป็นดังนี้

กรุงเทพฯ 69 72 72 66 76 72 70 72 ปทุมธานี 75 70 80 74 68 80 72 76 อยุธยา 83 77 80 74 86 75 85 80

จงทดสอบว่าต้นทุนการผลิตในจังหวัดทั้ง 3 แตกต่างกันหรือไม่ ที่ระดับนัยส าคัญ 0.10 4. ในการทดสอบประสิทธิภาพของคนท างาน 4 คน โดยวัดจากจ านวนสินค้าท่ีคนงานทั้ง 4 ผลิตได้ในเวลา

4 วัน ปรากฏว่าได้ผลการวิเคราะห์ข้อมูล ดังตาราง แหล่งความแปรปรวน d.f. S.S. M.S. F-ratio Treatment 88.66 Error Total 675.00

Page 12: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

12

จงเติมตัวเลขในตารางให้สมบูรณ์ และตรวจสอบผลการวิเคราะห์ครั้งนี้ว่า ประสิทธิภาพของคนงานทั้ง 4 คน แตกต่างกันหรือไม่ ที่ระดับนัยส าคัญ 0.10

5. แผนกวิจัยตลาดของบริษัทผลิตยาสีฟันชนิดหนึ่ง ต้องการศึกษาผลของรสซ่าที่ใส่เข้าไปในยาสีฟันต่อยอดขายในจังหวัดต่าง ๆ 4 จังหวัด คือ A, B, C และ D ถ้าจากการส ารวจพบว่า ยอดขายใน 1 สัปดาห์ (พันบาท) ของยาสีฟันแต่ละรส ในแต่ละจังหวัดเป็นดังนี้

รส จังหวัด

A B C D

ธรรมดา เย็นซ่า มินท์

15 12 10

10 8 10

13 9 12

12 14 15

จงทดสอบว่ามีความแตกต่างระหว่างยอดขายของยาสีฟันแต่ละรสชาดหรือไม่ และมีความแตกต่างของยอดขายยาสีฟันระหว่าง 4 จังหวัดหรือไม่ที่ระดับนัยส าคัญ 0.01

6. จากการศึกษาถึงยอดขายสินค้าของพนักงาน 4 คนในสัปดาห์ที่ผ่านมา ได้ข้อมูลดังตาราง

ที่ระดับนัยส าคัญ 0.05 7.1 ยอดขายสินค้าของพนักงานแต่ละคนแตกต่างกันหรือไม่ 7.2 ยอดขายสินค้าในแต่ละวันแตกต่างกันหรือไม่

7. ถ้ายอดขายสินค้า (แสนบาท) ในแผนกต่าง ๆ 4 แผนก ของร้านสรรพสินค้า 3 แห่ง ในรอบอาทิตย์ที่ผ่านมา เป็นดังนี้

แผนก ร้านสรรพสินค้า

1 2 3

เครื่องส าอาง เสื้อผ้า

ของเด็กเล่น เครื่องไฟฟ้า

5 8 4 2

7 8 9 12

6 5 7 4

น้ ามัน รถยนต์ สมชาย สมหญิง วีระ ดวงสมร

จันทร์ 120 89 78 50 อังคาร 75 95 72 100 พุธ 80 40 50 61 พฤหัสบดี 82 15 42 76 ศุกร์ 85 20 70 31

Page 13: บทที่ 7(ต่อ) การวิเคราะห์ความ ......7.2 การว เคราะห ความแปรปรวนแบบจ าแนกทางเด

13

ร้านสรรพสินค้าทั้ง 3 ร้าน มียอดขายแตกต่างกันหรือไม่ และแต่ละแผนกมียอดขายสินค้าแตกต่างกันหรือไม่ ที่ระดับนัยส าคัญ 0.01

8. ในการทดสอบประสิทธิภาพของเครื่องจักร 4 ยี่ห้อ และคนงานคุมเครื่องจักร 4 คน โดยให้ คนงานแต่ละคนคุมเครื่องจักรทั้ง 4 ยี่ห้อ และวัดประสิทธิภาพของเครื่องจักรและคนงานคุมเครื่องจักรจากจ านวนผลิตผลที่ได้จากเครื่องจักรเหล่านั้น ปรากฏว่าได้ผลวิเคราะห์ดังแสดงไว้ในตารางวิเคราะห์ความแปรปรวนต่อไปนี้

สาเหตุของความแปรปรวน d.f. S.S. M.S. F-ratio

ระหว่างคนงาน

ระหว่างเครื่องจักร 312.50

ความผิดพลาดอ่ืน ๆ 10.72

รวม 675.00

จงเติมตัวเลขในช่องว่างของตารางวิเคราะห์ความแปรปรวนให้สมบูรณ์ แล้วตรวจสอบว่าประสิทธิภาพของเครื่องจักร 4 ยี่ห้อ แตกต่างกันหรือไม่ และประสิทธิภาพของคนงานที่คุมเครื่องจักรทั้ง 4 คน ต่างกันหรือ ไม่ที่ระดับนัยส าคัญ 0.05