15
3 t-検定 22 3 t-検定(分布を利用した検定) t-検定は,分散などの分布を用いて群間差を検定する検定で,通常は一標本および二群間検定に用いる.正規 分布を仮定している検定である.検定の結果,有意差が認められれば群間差は何%増減または定量値に単に差 があったという表現ができる.毒性試験の分野では, 2 群の設定を採用しないことから t-検定の使用が激減して いる. 1. 1 標本の t-検定 ある病棟のエアコンの温度調節が正常かどうか調べたい.エアコンの温度を 26℃に設定し,毎晩 8 時頃,閉 め切った部屋の中で作動後 1 時間経過時のデータを採取した.7 日分のデータは1 の如くであった. 1. エアコンの温度調節記録結果 測定日 1 日目 2 日目 3 日目 4 日目 5 日目 6 日目 7 日目 測定値() 26.5 26.2 26.3 25.7 26.8 25.8 26.8 データ数:7,平均値:26.3,標準誤差:0.166 807 . 1 166 . 0 0 . 26 3 . 26 = - = cal t tcal = 1.807 数表 3-1t-分布表[両側(]のタテ軸(自由度)7-1=6 5%(0.05)2.447 と比較する.この 場合,差があるかないか吟味したいことから両側検定を用いる. tcal 2.447 より小さいことから差の 0.3℃は有意差なし(P>0.05)と判断する. したがって,有意水準 5%で帰無仮説は棄却されず,エアコンの温度設定は間違っていないとの結論となる. 上記の計算式に注目:検討したい差(群間)に占める標準誤差の割合を t 値として示している. 数表 3-1. t-分布表(吉村ら,1987DF2α* 0.2 0.1 0.05 0.02 0.01 0.002 0.001 DFα** 0.1 0.05 0.025 0.01 0.005 0.001 0.0005 5 1.476 2.015 2.571 3.365 4.032 5.893 6.869 6 1.440 1.943 2.447 3.143 3.707 5.208 5.959 7 1.415 1.895 2.365 2.998 3.499 4.785 5.408 *両側検定,**片側検定 SAS JMP では,サンプルデータの「ダイエット」の Quack の体重変化を開く.分析一変量の分布→Quack の体重変化を Y, 列へアクション OK→図の赤三角をクリック平均値の検定P=0.0367 で有意差を示す. 2. 2 標本の t-検定 t-検定は一般的に1 に示すように分散比の大きさおよび各群の標本数によって三種類が常用されている.し かし,Cochran-Cox は検出力が低いので使用を避けた方がよいとされている(医薬安全性研究会,1995).した がって,等分散の場合は Student, 不等分散の場合は Aspin-Welch t-検定が使用されている.t-分布表を棄却限 界値として使用する検定を全て t-検定という. 最近の生物・公衆衛生に対する試験・調査では 3 群以上の多群を設定することら, 2 群間検定の t-検定の使用 は少なくなってきた.また 2 群設定の場合,不等分散の検定を省略して Aspin-Welch t-検定を使用している場 合が多い.Student と比較しても大きな検出力の差はないといわれている.

第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

22

第 3 章 t-検定(分布を利用した検定) t-検定は,分散などの分布を用いて群間差を検定する検定で,通常は一標本および二群間検定に用いる.正規

分布を仮定している検定である.検定の結果,有意差が認められれば群間差は何%増減または定量値に単に差

があったという表現ができる.毒性試験の分野では,2 群の設定を採用しないことから t-検定の使用が激減して

いる. 1. 1 標本の t-検定 ある病棟のエアコンの温度調節が正常かどうか調べたい.エアコンの温度を 26℃に設定し,毎晩 8 時頃,閉

め切った部屋の中で作動後 1 時間経過時のデータを採取した.7 日分のデータは表 1 の如くであった.

表 1. エアコンの温度調節記録結果 測定日 1 日目 2 日目 3 日目 4 日目 5 日目 6 日目 7 日目

測定値(℃) 26.5 26.2 26.3 25.7 26.8 25.8 26.8 データ数:7,平均値:26.3,標準誤差:0.166

807.1166.0

0.263.26=

-=calt

tcal= 1.807 を数表 3-1,t-分布表[両側(2α)]のタテ軸(自由度)7-1=6 の 5%(0.05)値 2.447 と比較する.この

場合,差があるかないか吟味したいことから両側検定を用いる. tcal は 2.447 より小さいことから差の 0.3℃は有意差なし(P>0.05)と判断する. したがって,有意水準 5%で帰無仮説は棄却されず,エアコンの温度設定は間違っていないとの結論となる. 上記の計算式に注目:検討したい差(群間)に占める標準誤差の割合を t 値として示している.

数表 3-1. t-分布表(吉村ら,1987) DF\2α* 0.2 0.1 0.05 0.02 0.01 0.002 0.001 DF\α** 0.1 0.05 0.025 0.01 0.005 0.001 0.0005

5 1.476 2.015 2.571 3.365 4.032 5.893 6.869 6 1.440 1.943 2.447 3.143 3.707 5.208 5.959 7 1.415 1.895 2.365 2.998 3.499 4.785 5.408

*両側検定,**片側検定

SAS JMP では,サンプルデータの「ダイエット」の Quack の体重変化を開く.分析→一変量の分布→Quackの体重変化をY, 列へ→アクション OK→図の赤三角をクリック→平均値の検定→P=0.0367 で有意差を示す. 2. 2 標本の t-検定 t-検定は一般的に図 1 に示すように分散比の大きさおよび各群の標本数によって三種類が常用されている.し

かし,Cochran-Cox は検出力が低いので使用を避けた方がよいとされている(医薬安全性研究会,1995).した

がって,等分散の場合は Student, 不等分散の場合は Aspin-Welch の t-検定が使用されている.t-分布表を棄却限

界値として使用する検定を全て t-検定という. 最近の生物・公衆衛生に対する試験・調査では 3 群以上の多群を設定することら,2 群間検定の t-検定の使用

は少なくなってきた.また 2 群設定の場合,不等分散の検定を省略して Aspin-Welch の t-検定を使用している場

合が多い.Student と比較しても大きな検出力の差はないといわれている.

Page 2: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

23

分散比の検定

有意差なし 有意差あり

両群の標本数

同じ 異なる

Student の t-検定 Aspin-Welch の t-検定 Cochran-Cox の t-検定 図 1. t-検定の決定樹

3. Student の t-検定(2 標本,対応なし) 両群の分布がほぼ同様な場合のみに実施する検定である.すなわち,両群の分散を算出し,分散比(分散の

小さい群を分母に)を F 表と比較し同様の分散か否かを有意水準 5%で検定する.もし同様の分布を示した

(P>0.05,有意差なし)ならば下記の式を用いて吟味する.Student は,W. S. Gosset (1876-1937) の筆名である.

彼は,英国のギネス麦酒会社の技師で,統計の方法を研究した.会社は,論文発表 (1908) を賛成しないため筆

名を使用した(統計教育推進会,1989)のである.最近では Student の t-検定は,Aspin-Welch の検定にとって

代わり使用例が減少の傾向にある. 両群の分散がほぼ同様な場合.

( )22121

21 -++´

´+

-= NN

NNNN

BA

BAtcal

群の平方和群の平方和

群の平均値群の平均値

t-分布表の自由度 N1+N2-2 の値と比較し,tcal 値が大であれば有意差を示す.

各群内標本数を N1, N2で示す. ある学校の男・女学生各 10 人の無作為抽出による身長を表 2 に示した.男女間に差はあるか吟味する.

表 2. 男・女学生各 10 人の無作為抽出による身長(cm) 群 男子 女子

170 160 168 154 170 162 169 160 179 151 162 159 172 148 169 159 169 150

個体値

179 162 平均値±標準偏差 170.7±5.1 156.5±5.3

標本数 10 10 上記の群間の解析を表 3 に示した算出数値を用いて計算する.

Page 3: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

24

表 3. 算出数値

群 男子 女子 平均値 170.7 156.5 分 散 25.8 27.6 平方和 232.1 248.5 標本数 10 10

分散比の検定:

07.18.256.279

9 ==F (分散の小さい数値を分母に置く)

5%の F-分布表(数表 3-2)の N1=9, N2=9 の交点は 3.17,したがって,分散比 1.07 は 3.17 より小さく,すな

わち,5%水準より大きい確率になるので両群の分布に差がなく極めて同様の分布をしていることになる.した

がって,Student の t-検定に進む.

数表 3-2. F 分布のパーセント点(5%水準点, α=5%) (吉村ら,1987)

N2\N1 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 30

7 5.59 4.73 4.34 4.12 3.97 3.86 3.78 3.72 3.67 3.63 3.57 3.52 3.49 3.46 3.44 3.37

8 5.31 4.45 4.06 3.83 3.68 3.58 3.50 3.43 3.38 3.34 3.28 3.23 3.20 3.17 3.15 3.07

9 5.11 4.25 3.96 3.63 3.48 3.37 3.29 3.22 3.17 3.13 3.07 3.02 2.98 2.96 2.93 2.86

10 4.96 4.10 3.70 3.47 3.32 3.21 3.13 3.07 3.02 2.97 2.91 2.86 2.82 2.79 2.77 2.69

11 4.84 3.98 3.58 3.35 3.20 3.09 3.01 2.94 2.89 2.85 2.78 2.73 2.70 2.67 2.64 2.57 N1=分子の標本数マイナス 1, N2=分母の標本数マイナス 1. F 分布の F は,R. A. Fisher に由来している.

145.6)21010(10101010

5.2481.232

5.1567.170=-+

´+

-=tcal

tcal = 6.14 を数表 3-3,t 分布表[片側(α)=0.05]のタテ軸 10+10-2=18 の 1.73 と比較する.tcal は 1.73 より大

きいことからこの二群間の差は,5%水準で有意差を認めたことになる.厳密にいえば 0.1%水準の 2.61 よりも

大きいことから 0.1%水準でも有意差が認められたことになる.この場合,身長は,女子学生に比較して男子学

生の方が大きいことを期待していることから片側検定を採用した.

数表 3-3. t 分布のパーセント点(吉村ら,1987)

0.20 0.10 0.05 0.02 0.01 0.002 0.001 有意水準点 2α α 0.10 0.05 0.025 0.01 0.005 0.001 0.0005

自由度 16 1.337 1.746 2.120 2.583 2.921 3.686 4.015

自由度 17 1.333 1.740 2.110 2.567 2.898 3.646 3.965

自由度 18 1.330 1.734 2.101 2.552 2.878 2.610 3.922

自由度 19 1.328 1.729 2.093 2.539 2.861 3.579 3.883

自由度 20 1.325 1.725 2.086 2.528 2.845 3.552 3.850 α=片側検定,2α=両側検定.

Page 4: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

25

SAS JMP による解析結果を下記に示した.

SAS JMP と手計算による値は同じく 6.145(絶対値)を示した.

Page 5: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

26

等分散で標本数の異なる場合. 最近の男子学生もおしゃれになってきて,朝の支度に時間がかかっているようだ.朝の支度時間(起きてか

ら家を出るまでの時間)に男女差があるかどうかある大学で調査した結果(岩崎,2000)を表 4 に示した.

表 4. 朝の支度時間の男女別データ(分)

男子学生 45 30 75 45 60 70 60 平均:55,分散:250 平方和:1500

女子学生 60 90 45 70 80 - - 平均:69,分散:305 平方和:1220

4496.1)257(5757

12201500

6955=-+

´+

-tcal

tcal = 1.4496 を数表 3-4,t-分布表[両側(2α)=0.05]のタテ軸 7+5-2=10 の 2.228 と比較する.tcal は 2.228 より

小さいことからこの二群間(男子および女子学生間)の差は有意差なし(P>0.05)と判断する.この場合,片側検

定も考えられるが一応両者に差がないという設定で解析した. したがって,有意水準 5%で男女間に朝の支度時間の平均に差があるとはいえないという結論となる.

数表 3-4. t 分布のパーセント点 (吉村ら,1987) 有意水準点 2α 0.20 0.10 0.05 0.02 0.01 0.002 0.001 有意水準点 α 0.10 0.05 0.025 0.01 0.005 0.001 0.0005

自由度=8 1.397 1.860 2.306 2.896 3.355 4.297 4.781 自由度=9 1.383 1.833 2.262 2.821 2.250 4.297 4.781 自由度=10 1.372 1.812 2.228 2.764 3.169 4.144 4.587

α=片側検定,2α=両側検定. 4. Aspin-Welch の t-検定(2 標本,対応なし) 両群の分布が異なるが,標本数が同一(最近では異なっていても実施する場合が多い)の場合に実施する検

定である.最近では,不等分散性を考慮して,はじめからこの手法を応用している例が多い.したがって,二

群間の手法では,この手法で分析するのが最良である.表 5 に高脂肪摂取後 1 週間後の GPT 活性値を示した.

GPT 活性値に差があるか検定する. 両群の分散が異なる場合.

動物数

群の分散

動物数

群の分散

群の平均値群の平均値

BA

BAtcal

+

-=

動物数

群の分散

動物数

群の分散

群の平均分散

BAAC

+=

自由度(N)の算出

1)1(

1

122

--

+-

=

群の標本数群の標本数 BC

AC

N

N を自由度として t-分布表の値と tcal 値を比較し,tcal 値が大であれば有意差を示す.

Page 6: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

27

表 5. 高脂肪摂取後 1 週間後の GPT 活性値

群 高脂肪摂取 通常食摂取 42 30 60 34 26 35 48 32 56 36 31 41 30 42 80 28 79 71

個体値

93 35 平均値±標準偏差 55±23 38±12

標本数 10 10 上記の群間の解析を表 6 に示した算出数値を用いて計算する.

表 6. 算出数値 高脂肪摂取 通常食摂取

平均値 55 38 分 散 548 150 標本数 10 10

分散比の検定:

65.31505489

9 ==F (分散の小さい数値を分母に置く)

5%の F-分布表(数表 3-2)の N1=9, N2=9 の交点は 3.17,したがって,分散比 3.65 は 3.17 より大きいことか

ら 5%水準で両群の分布に差を示したことになり,また標本数が同一のため,Aspin-Welch の t-検定に進む.

03.2

10150548

3855=

+

-=tcal 79.0

0.158.548.54

=+

=C

5.13

9)79.01(

979.0

122 =

-+

=N

t-分布表(数表 3-5) (α)=0.05,自由度値 14(計算値は 13.5)の交点 1.76, この値に比べて,tcal 2.03 は大きいこ

とから,この二群間には,有意差あり(P<0.05)と判断する.この場合,一方向の影響を期待することから片側検

定を用いる.

数表 3-5. t 分布のパーセント点 (吉村ら,1987)

有意水準点 2α 0.20 0.10 0.05 0.02 0.01 0.002 0.001 有意水準点 α 0.10 0.05 0.025 0.01 0.005 0.001 0.0005

自由度=14 1.345 1.761 2.145 2.624 2.977 3.787 4.140 α=片側検定,2α=両側検定. 等分散で両群の標本数が同一の場合,Aspin-Welch の検定以外に Student の t-検定で実施し,有意水準を判定

の際の自由度を N-1 にする(Gad et al., 1986)手法も報告されている.いずれも有意差検出に大きな差はない.

Page 7: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

28

5. Cochran-Cox の t-検定 両群の分布および標本数が異なる場合に実施する検定である. 我が国では最近検出力が低いとして使用されなくなりつつあるが,諸外国では,種々の論文に常用されてい

る.表 7 に 高脂肪摂取後 1 週間後の GPT 活性値を示した.GPT 活性値に差があるか検定する. 両群の分散および標本数が異なる場合.

動物数

群の分散

動物数

群の分散

群の平均値群の平均値

BA

BAtcal

+

-=

t-分布表から対照群および投与群の動物数を自由度として各々の t 値を引き出し,これをそれぞれ t1と t2とす

る.

動物数

群の分散

動物数

群の分散動物数

群の分散

動物数

群の分散

BA

BtAt

calt+

´+

´

=

21

'

tcal と t'cal の値を比較し,tcal 値が大であれば有意差を示す.

表 7. 高脂肪摂取後 1 週間後の GPT 活性値 群 高脂肪摂取 通常食摂取

42 57 60 45 26 55 48 46 56 26 31 33 30 41 80 35 79 43

個体値

93 - 平均値±標準偏差 55±23 42±10

標本数 10 9 上記の群間の解析を表 8 に示した算出数値を用いて計算する.

表 8. 算出数値 群 高脂肪摂取 通常食摂取

平均値 55 42 分 散 548 101 標本数 10 9

分散比の検定:

43.51015489

9 ==F (分散の小さい数値を分母に置く)

5%の F-分布表(数表 3-2)の N1=9, N2=8(分散比を求めたときの分母の値を縦軸の N2に,分子の値を横軸

の N1に,この交点の値を読む)の交点は 3.38,したがって,分散比 5.43 は 3.38 より大きいことから 5%水準で

両群の分布に差を示したことになり,また両群の標本数も異なるため,Cochran-Cox の t-検定に進む.

Page 8: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

29

21.1

9101

10548

4255=

+

-=calt

83.1

9101

10548

9101860.1

10548833.1

' =+

´+

´

=calt

tcal < t'cal であり二群間の差は有意差なし(P>0.05)と判断する. t1の 1.833 と t2の 1.860 は t-分布表(片側)(数表 3-4)から自由度 9=(10-1)と 8=(9-1)に対応する値を代入する.

Page 9: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

30

SAS JMP による解析結果を下記に示した.SAS JMP では等分散性を前提としている.したがって,参考程度

として参照すること.

Page 10: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

31

6. 対応のある t-検定 同一サンプルを用いて使用前・使用後の差の検定である.ダイエット食品の効果の証明や社会動向・経時的

変化などの調査に適している.降圧剤の効果を調べるため,5 人の被験者に投与し,投薬前および投薬後の最

高血圧を測定した結果(岩崎, 2000)を表 9 に示した.

表 9. 投与前と投与後の最高血圧およびその差

被験者 1 2 3 4 5 平均値 分散

投薬前 174 168 186 170 166 - -

投薬後 168 155 176 166 154 - -

差 6 13 10 4 12 9 15

差の標本平均と分散は 9 および 15,差の標準誤差(S.E.)は 732.15

15=

186.5732.19

==calt

tcal = 5.186 を数表 3-6, t-分布表[片側(α)=0.05]のタテ軸 5-1=4 の 2.132 と比較する.tcal は 5.186 で表の 2.132より大きいことからこの差は有意差あり(P<0.05)と判断する.したがって,有意水準 5%でこの降圧剤に効果は

あるという結論となる. この場合の期待は血圧を下げる方向にある.したがって,片側検定で実施する.両側検定では 2.776 が棄却

限界値となる.

数表 3-6. t 分布のパーセント点(吉村ら,1987) 有意水準点 2α 0.20 0.10 0.05 0.02 0.01 0.002 0.001 有意水準点 α 0.10 0.05 0.025 0.01 0.005 0.001 0.0005

自由度=4 1.533 2.132 2.776 3.747 4.604 7.173 8.610 α=片側検定,2α=両側検定.

t-検定の注意:二群間のみの 1 回の比較で 5%水準を維持している.したがって,多群を設定し一つの対照群

に対していくつかの群間の比較は,第一種の過誤を招くことから多重比較検定で検定すること. 7. 対応がなく差の特定仮説に対する適合検定 ある製薬会社のAホルモン剤はブロイラーに経口投与すると 70日齢で鶏の体重が 80g増加するとパンフレッ

トに述べていた.今各群 10 羽ずつ用いて確認試験を実施した.結果は表 10 に示した.この結果は,宣伝通り

と見なすか(柴田,1970)?実際の試験結果の差は 53 g であった.

Page 11: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

32

表 10. ブロイラーに対する A ホルモン剤の効果

A ホルモン投与群(x), g 対照群(y), g 940 885 980 870 950 920 955 880 975 915 940 840 920 935 985 905 895 910 910 860

合計=9450 合計=8920 平均値=945 平均値=892 分散=916.66 分散=895.55

標準誤差=91.66 標準誤差=89.55

分散比の検定 02.15.8956.9169

9 ==F

となりこれに対応する確率は,P>0.2 となり,極めて同一な分散を示している. 次に t-検定に進む.仮説は A ホルモン投与群の母平均値-対照群の母平均値=80g というのが仮説である.

01.246.13

2755.8966.9180892945

)220( -=-

=+

--=-t

91.66 と 89.55 は各群の分散を動物数で割った値(標準誤差)を示す.

となり DF=18 の t 値は,数表 3-3 から両側検定で 2.01 に対応する確率は,0.05-0.1 の間にありこの仮説を捨

てることができない.したがって,宣伝通りの効果があったと結論する. 次に測定値そのものについて Student の t-検定で実施する.80gを考えずに実施する.

93.3)21010(10101010

95.805994.8249892945

=-++´

´+

-tcal

8249.94 と 8059.95 は平方和である.分散に N-1 をかけた値である. つまり平均値 945-892 の差 53g は,有意差(P<0.001)を示す.

Page 12: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

33

SAS JMP による解析結果を下記に示した.

8. 補足説明 ・ゴルファーの腕比べ(佐藤,1968)・・・・・平均値の差の検定,検定手法はどれか?・・・・・・ ゴルフを始めて間もない A, B 2 人のゴルファーが,ゴルフ談義に花を咲かせたあげく,腕比べをすることに

なった.その方法について散々検討した結果,とにかく 6 ヶ所のゴルフ場を回って勝負を決めることになった.

結果は表 11 に示した.

表 11. ゴルファーA と B のスコア ゴルフ場 イ ロ ハ ニ ホ ヘ 平均 勝回数

A 209 205 210 208 207 207 207.7 2 B 201 197 211 200 208 199 202.7 4

A-B +8 +8 -1 +8 -1 +8 +5

・勝ちは勝ち,負けは負けか? ・勝ち負けの内容(スコア)か? 符号検定:こうして,二つの平均値の差を検定することになったが,A が提案した検定法は,符号検定と呼

ばれる次のような検定法であった.まず表に示すように,各ゴルフ場で A のスコアから B のスコアを引き,+と-の符号だけを問題にする.すると,+が 4 個,-が 2 個得られる.そして,A と B の腕前の母集団に差がない

という帰無仮説をたてる.もしこの仮説が正しければ,+は三個,-も三個が期待される.

Page 13: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

34

そこでこの食い違いを検定する.

67.03

)32(3

)34( 222 =

-+

-=X

計算値 0.67 は自由度 1 のカイ二乗分布表 5%の点(数表 3-7)の値 3.841 に比較して小さい.したがって,両

者の成績が同一という帰無仮説は,捨てられない.つまり B の腕前が上だとはいえないというのが A の主張な

のである.2×2 のカイ二乗検定の入力数値を表 12 に示した.

表 12. カイ二乗検定の入力数値 勝ち数 負け数 計

A 2 4 6 B 4 2 6 計 6 6 12

333.112961728

6666)4422(12 2

2 ==´´´´-´

=X

計算値 1.333 は自由度 1 のカイ二乗分布表 0.05 の点(数表 3-7)の値 3.841 に比較して小さい.したがって,

仮説は捨てられない.符号検定と同様な結果となった.

数表 3-7. カイ二乗分布のパーセント点 (吉村ら,1987)

有意水準点,α

自由度 0.100 0.050 0.010 0.001

1 2.705 3.841 6.634 10.82 2 4.605 5.991 9.210 13.81

t-検定:そこで,B が提案した検定法は,スコアの差の符号ではなく,差の値を取り上げる.すると 6 試合の

差の平均値は 5 である.もし,A と B の腕前に差がなければ,この平均値はゼロであることが期待できる.そ

こで「二つの平均値,207.7 と 202.7 の差はほんものだろうか」という問題を「5 という平均値は,平均 0 の平

均値の母集団から抽出した試料と考えるべきであろうか」という問題に置き換える.

の標準誤差X05-

この値が十分に大きければ,5 は平均値ゼロの平均値の母集団から抽出されたものではないと決定できる.

すなわち,差があると結論できる. 上記の量は,t 分布に従うのである.t の値を計算する.4.648 は標準偏差を示す.

63.2

6648.4

05=

-=t

t-分布表(数表 1-1)から自由度 6-1=5 の 2α(この場合単に両者に差があるか否かであるので両側検定となる)

=5%の点の値は,2.57 が得られる.つまり分布の中心から 2.57 以上離れた t の出現する確率は 5%である.ここ

で計算された値 2.63 は,2.57 より大きいことから,中心ゼロから 2.63 以上離れた t 値が出現する確率は 5%以

下となる. つまり,「5 という平均値は,母平均ゼロの母集団から抽出した試料である」という仮説が捨てられ,A と Bの平均値の差 5 は,ほんものであるということになる.

Page 14: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

35

結論:同一データを異なった検定法で吟味した場合,その結果にさほど差がない場合が多い.しかし,今回

の場合はどう考察したらよいでしょうか?著者は t-検定を推奨したい. ・t-分布表による検定例 病院内の機器および病棟内の消毒は,経時的に SOP(標準操作手順書)によって実施されている.通常定め

られた計量カップまたはプラスティック製メスシリンダーによって所定量を測り水道水と混合して一定の濃度

に調製する.今回,所定の計量カップにて担当者に 2 回測ってもらった後直ちにガラス製メスシリンダーにて

容量を精秤した結果,32 と 22 mL であった.2 回に意味があるわけではない.このデータによってこの計量方

法が 1 回 30 mL であるかどうか検定する.

計量カップ 1 回の mL・・・・・ 32, 22

27)2232(21

=+=平均値

}{ 50)2722()2732(12

1 22 =-+--

=不偏分散

07.750 ==標準偏差

6.0

207.7

302730=

-=

-=

N

t標準偏差

平均値値

t-分布(数表 3-8. t-分布のパーセント点)表から自由度 1 の 5%で導く.

数表 3-8. t 分布のパーセント点 (吉村ら,1987) 有意水準点 2α 0.20 0.10 0.05 0.02 0.01 0.002 0.001 有意水準点 α 0.10 0.05 0.025 0.01 0.005 0.001 0.0005

自由度=1 3.078 6.314 12.706 31.821 63.567 318.30 636.61 α=片側検定,2α=両側検定. 計算された t 値 0.6 は棄却限界値の 12.71 より小さい.したがって,仮説は捨てられない. 今回の測りかたで 30 mL 以下・以上であるとはいえないことになる. しかし,測定回数を増すならば,SOP から逸脱しているかもしれない.N の数を増せば,平均値の精度が良

くなるからである. ・F-分布:時計の当たりはずれ(佐藤,1968) ストップウォッチは,病院などでは今でも多くの場面で使用している.水晶発振は高精度で差がないがゼン

マイ式のものには精度に差がある可能性がある.そこで A 社製を 5 個,B 社製を 4 個購入して 1 日の進みと遅

れを測定した.表 13 の結果を得たがメーカーによる精度の差があるか?

表 13. A・B 両社の 1 日の進み・おくれ

時計 イ ロ ハ ニ ホ 平均

A 社 -30 0 +10 -10 +30 0

B 社 0 +10 -15 +5 -- 0

平均値は AB 両者ともゼロ秒であるが,不偏分散は

Page 15: 第 章 t-検定(分布を利用した検定)arima/lectures/JT-3.pdf · 2012-11-15 · 第3章 t-検定 24 表3. 算出数値 群 男子 女子 平均値 170.7 156.5 分 散 25.8

第 3 章 t-検定

36

}{ 500)0(15

1 22 =--

= の総和社分散の xuA

}{ 7.116)0(14

1 22 =--

= の総和社分散の yvB

となって,A 社の分散が大きい. これは少数例の試料についてである.我々が知りたいのは,母集団についての知識である.この A 社と B 社

とに本当の差があるかどうかの問題である.2 組のデータを抽出した母集団の分散が同じかどうか調べるには,

どうすればよいだろうか? 分散比 F:両者の比を採ればよい.必ず分母に小さい分散を置く.

28.47.116

500===

BAF

同一の母集団から選ばれたとすれば分散比は 1 に近づく. 数表 3-8 の F 分布のパーセント点,5%水準の表,縦軸 4-1=3, 横軸 5-1=4 の交点 9.11 と計算値 4.28 を比較す

ると,計算値の方が小さい.したがって,仮説を捨てることができない.つまり,この試験だけでは A 社の分

散が B 社の分散に比較して大きいとはいえない.A 社の時計は,当たりはずれが大きいとはいえないことにな

る.

数表 3-8. F 分布のパーセント点(5%水準点, α=5%)(吉村ら,1987) N1\N2 1 2 3 4 5 6 7

3 10.51 9.55 9.27 9.11 9.01 8.94 8.88 N1=分母の標本数マイナス 1, N2=分子の標本数マイナス 1.

【引用文献および引用資料】

統計教育推進会(1989):統計小辞典,pp134,日本評論社,東京.

岩崎 学(2000):成蹊大学工学部岩崎研究室 HP.

吉村功ら(1987):毒性・薬効データの統計解析,サイエンティスト社,東京.

佐藤 信(1968):推計学のすすめ,講談社,東京.

柴田寛三(1970):生物統計学講義,東京農業大学.

Gad, Shayne and Weil, S. Carrol (1986): Statistics and experimental design for toxicologists, pp18, The Telford press, New Jersey, U.S.A.