20
第第第第 第第第第第 12.1 單單單單單單單單 1-way ANOVA Subject : 第第第第第第第第 第第第 k 第第第 第第 第第第第 ,體 μ 1 , …, μ i , …, μ k Data : k 第第第 第第第第 n 1 ,…, n k . x ij --- 第 i 第第第 j 第第第第 N = n 1 +…+ n k 第第第 G roup 1 i k x 11 x i1 x k1 x 12 x i2 x k2 x 1n1 x ini x knk

第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

  • View
    223

  • Download
    3

Embed Size (px)

Citation preview

Page 1: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

第十二章 變異數分析

12.1 單因子變異數分析 1-way ANOVA

Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ1 , …, μi , …, μk

Data : k 組資料,樣本數為 n1 ,…, nk . xij --- 第 i 組的第 j 個觀察值 N = n1 +…+ nk 總個數

Group 1 i k

x 11 x i1 x k1

x 12 x i2 x k2

… … …

x 1n1 x ini x knk

Page 2: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

【主題】 : To test the equality of the k popultions.

somefor :

0...:Test

1

210

jiH

H

ji

k

【方法】 : 變異數分析 ANOVA

註 :

1. 多組資料比較時,以平均數之間的變異代表各均值差異程度,其基本精神事實上和二組比較的想法是一致的。

2. ANOVA 假設 k 組資料有不同的平均數,相同的變異數,且為常態分配。

Page 3: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 3

Review : 二組資料之比較

資料 A: 67, 68, 69, 70, 71

資料 B: 70, 71, 72, 73, 74

資料 C: 68.5, 69.5, 70.5, 71.5, 72.5

資料 D: 71.2, 71.6, 72, 72.4, 72.8

資料 E: 69.7, 70.1, 70.5, 70.9, 71.3

A、 B 之差異是否顯著? B、 C 之差異是否顯著?D、 E 之差異是否顯著?

Page 4: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 4

t = D / SE,

二組資料比較之檢定量 = 平均數差 / 標準誤,

A 組與 B 組比較t = 3/1=3, p-value = .017結論為二組差異 顯著

B 組與 C 組比較t = 1.5/1=1.5, p-value = .172結論為二組差異 不顯著

D 組與 E 組比較t = 1.5/0.4=3.75, p-value = .0056結論為二組差異 顯著

BAa

BA

H

H

:

:.1 0

CBa

CB

H

H

:

:.2 0

EDa

ED

H

H

:

:.3 0

平均數差愈大時,愈能顯示出二組差異偏大標準誤愈小時,愈能顯示出二組差異

Page 5: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 5

【 Notation 】

mean) total(the

) of estimate mean, treatment(the

1..

i1

.

i jijn

jijni

xx

xx

T

i

reatment) within tsquares of sum the( )(SS

reatments)between t squares of sum the( )(SS

1 1

2.E

1

2...Tr

組內資料變異之平方和

之平方和各組樣本平均數間差異

k

i

n

jiij

k

iii

i

xx

xxn

異之平方和不考慮分組時,資料變

squares) of sum total the( )(SS 2..T

i jij xx

Page 6: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 6

【MS 】 變異數 = 平方和 / 自由度

組間變異數 1

MSTr

k

SSTr 組內變異數 MSE kN

SSE

SST = SSTr + SSE

【檢定值及結論】 f = MSTr / MSE

p-value = P( F > f ) ,當 p-value <α ,差異顯著。

註: 1 、 MSE 就是 k 組資料的 pooled variance , k=2 時, MSE=

Sp2

2、MSE 與 MSTr 皆為變異數,相除後產生一 F 分布之統計量

平均數變異愈大,顯示各組之間差異愈大組內變異數愈小,愈能顯示各組間之差異

Page 7: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 7

說明: H0: μ1= μ2= …= μm vs. H1 :差異存在

若差異存在, MSTr 值偏大,將產生一較大的 f 值,故 p-

值 = p( F > f ), p- 值愈小,差異愈顯著。可視為一單尾檢定。 變方分析之結果可整理成一 ANOVA Table 如下:

Source SS df MS f-值 p-值Treatment SSTr k-1 MSTr f = MSTr / MSE

Error SSE n-m MSE

Total SST n-1

ANOVA table for 1-way model

p-value = P( F- 值 > f ),

Page 8: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 8

【例 12.1 】比較 A、 B、 C 三食品品質之差別

1 2 3 4平均A 7 3 10 4 6B 4 10 6 8 7C 10 14 9 11 11

方法 : 1-way ANOVA

Source SS df MS f-值 p-值

食品 56 2 28

誤差 64 9 7.11

整體 120 11

ANOVA table

p-value = .059 ,結論此 3 組均值之差異不顯著,食品對 增重之影響不顯著。 。

Page 9: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 9

【例 12.2 】比較 A、 B、 C 三食品品質之差別

1 2 3 4平均A 7 8 5 4 6B 9 8 6 5 7C 10 13 11 10 11

方法 : 1-way ANOVA

Source SS df MS f-值 p-值

食品 56 2 28

誤差 26 9 2.89

整體 82 11

ANOVA table

f =9.69 , p-value = .0057 ,結論此 3 組均值之差異顯著,食品對增重之影響不顯著。

Page 10: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 10

例 12.1 12.2 資料圖比較,三組平均值皆為 6, 7, 11

02468

10121416

0 1 2 3 402468

10121416

0 1 2 3 4

Page 11: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 11

EXCEL: 輸入資料→ 工具 →資料分析 → 單因子變異數分析

EXCEL

資料: p260 表 12.1

Page 12: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 12

當 ANOVA 結果是差異顯著,需作進一步比較,稱為事後多重比較,它能提供更詳細的訊息,多重比較可進行許多方面的比較,最常用的是對對比較,即,同時將各組中有明顯差異的找出來。

Multiple Comparisons

對對比較只有近似法,至少有 10 種方法存在,本教科書介紹的是 Bonferroni 法,其它常用方法有 LSD , HSD , Duncan 法。 LSD

法是化學分析中常用的方法,但是太容易分出差異。

當 ANOVA結果是差異不顯著,無需作進一步比較。若 ANOVA結果是差異顯著,表示至少有一對組差異存在,必需進一步分析差異之處,稱為 multiple comparison, 或 pairwise comparison.

Page 13: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 13

成對均值比較

目的: 同時比較 m(m-1)/2 對之間的差異是否顯著。

基本原理: 設定一判定值 DM ,當 i 組與 j 組之均值差異大於 MD

時,判斷此一組間的平均數差異顯著,否則不顯著 每一方法的判定值不同 判定值愈小,愈容易得到有顯著差異

ji n1

n1

..

s.e. where

, .).)(( ,||

MSE

es表值DDxx MMji

Page 14: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 14

【例 10.5 】對對比較 A、 B、 C 三食品各對組品質之差別 (p286)

HSD 法 : DM(0.05)=3.3538 , DM(0.01)=4.6160

列出下表,分析各對組的差異顯著性均值差 C (11) B (7)

C (11) --

B (7) 4** --

A (6) 5* 1

說明: * 表示兩處理均值差異達 5% 顯著水準; ** 表示兩處理均值差異達 5% 顯著水準。

4.6160 .).)(84.3( 0.01,

3538.3.).)(79.2( 0.05,

89.2 s.e. 41

41

esD

esD

M

M

Page 15: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 15

說明:在研究報告中,常以相同文字表示兩處理均值間差異不顯著, 反之差異顯著,如下例:

Page 16: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 16

深入應用 ( 參考 excel 結果 )

• 【例 12.1 】比較三實驗室之差別 (p260)

由 ANOVA F 檢定得 p-值 = 0.052,差異不顯著

Page 17: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 17

contral 2%葡萄糖 2%果糖 2%蔗糖75 57 58 62

67 58 61 66

70 60 56 65

75 59 58 63

65 62 57 64

71 60 56 62

67 60 61 65

67 57 60 65

76 59 57 62

68 61 58 67

【例 12.2 】研究添加不同醣類對碗豆生長長度的影響。實驗分為四組,第一組為控制組,其它實驗組分為 2%葡萄糖, 2%果糖,以及 2%蔗糖。資料如下:

50

55

60

65

70

75

80

0 1 2 3 4 5

Page 18: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 18

由 ANOVA , F 檢定得到 p- 值 <0.0001 ,判斷五組有的差異顯著

Page 19: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 19

Means with the same letter are notsignificantly different.

Tukey Grouping Mean N GROUP

A 70.100 10 contral

B 64.100 10 cane sugar

C 59.300 10 glucose

C 58.200 10 fructose

根據以下的 SAS 報表分析由 Tukey HSD 對對比較法得到:添加醣類對碗豆的生長有顯著差異,但是,加葡萄糖與加果糖對碗豆的生長並無顯著差異,加蔗糖與加其它兩種醣類卻是有顯著不同的。

組別 控制組 蔗糖 果糖 葡萄糖Mean±SD 70.1±3.98a 64.1±1.64b 59.3±1.87c 58.2±1.87c

結論列表:

Page 20: 第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data

ANOVA 20

非常態資料使用 ANOVA 之條件是常態母體、變異數相同有時資料違背此二條件,如:有離群值出現時違背此二條件的資料是不應該使用 ANOVA 作為分析

方法,可使用無母數法中的 Kruskal Wallias 替代對於滿足此二條件的資料,應使用 ANOVA 的結果