Upload
others
View
16
Download
0
Embed Size (px)
Citation preview
分散分析の不確かさ評価への利用
産業技術総合研究所
計測標準研究部門
城野克広
1
2015 Feb. 20th 最終改訂
2
この資料は産業技術総合研究所 計測標準研究部門 城野克広 主任研究員が作成したものです。
http://staff.aist.go.jp/k.shirono/download_j.htmlにて公開しております。
上のサイトでは分散分析プログラム(Microsoft® Excel® のマ
クロ)も公開しています。他にも初歩的なセミナーなどでは飛ばしてしまいがちな話やトピカルな話題、研究レベルの話題をとりあげております.個人的な勉強などの私的利用
を想定してアップロードしておりますので、私的利用の範囲を越えると判断される場合にはご一報下さい.プログラム
や資料に誤りがあった場合にも責任は持ちませんので、ご自身で内容をよく精査してお使い下さい.誤りなどを指摘して下さいますとありがたいです.
とりあえず、やってみよう
とりあえず、やってみよう
3
リボンを3名の方に配ります。めいめいが10 cmと思う長さに切って下さい。
最初に切ったものを目安にして、同じ長さにリボンをあと2本切ってください。(計3本)
4
測定結果
甲 さん 乙 さん 丙 さん
9.6 cm 10.4 cm 8.2 cm
9.2 cm 10.7 cm 8.3 cm
9.4 cm 10.5 cm 8.7 cm
5
これを単純に9回の繰返しと見ますと、
標準偏差 = 0.964 cm
およそ大人が10 cmと思って切ったリボンのばらつきは上のようなものと言えるでしょうか?
6
3つの平均値に着目します。
これを単純に3回の繰返しと見ますと、
標準偏差 = 1.067 cm
甲 さん 乙 さん 丙 さん
9.400 cm 10.533 cm 8.400 cm
7
なんだか、そう簡単な話じゃなそうです。
甲 乙 C
要員の効果
Difference in operators
繰返しの効果
Errors in repetitions
8
分散分析
いくつかの要因がばらつきに関与しているとき、適切な実験が行われていれば、それらを分離して評価することができる分析手法。
普通はその要因のいくつかの効果があるかないかを定性的に判断するために使うが、不確かさ評価では定量的に用いる。
9
分散分析しますと、
要員の標準偏差 = 1.060 cm
繰返しの標準偏差 = 0.211 cm
それで、どうするの?というのは、また後で。とりあえずは、「適切な実験」について。
10
実験計画
じっけんけいかく
11
因子/水準
因子:施設・要員・日などの調べたい対
象。施設と要員について調べるときには因子数は2。
水準:因子を調べるために準備される
品目。施設が因子の場合に、施設Aと施設Bで試験するとき、施設Aと施設Bが水準で、水準数は2。
12
母数因子/変量因子
母数因子というのは、取りうる水準の全てを調べることができる因子。
変量因子というのは、取りうる水準のいくつかしか調べることができない因子。
不確かさ評価の対象となるのは、変量因子が多い。母数因子が考えられることは少ない。
13
対応がある/対応がない
施設と要員の影響を調べるため、施設Aで2名の要員(甲と乙)に、施設Bで2名の要員(甲と乙)に試験をしてもらいました。
施設A 施設B甲 甲
乙 乙
14
さて、甲は何人いるでしょうか?
甲 乙
A
甲 乙
B
15
実は、ひとりかも知れない。
甲 乙
A B
甲 乙
16
甲 乙
A
甲 乙
B
甲 乙
A B
甲 乙要員に対応がある。Operators are crossed.
要員に対応がない。Personnel are nested.
17
要員には対応があるが、施設に対応がない場合のシナリオを考えてみて下さい。
クイズ①
甲
A
甲
B
乙 乙
A B
18
メモ
19
多元配置(一元配置、二元…)
すべての因子に対応がある。
甲 乙
A B
甲 乙
20
多元配置のよいところと思う方にチェック。
□ 要員や施設が少なくて済む。
□ 交互作用が調べられる。
21
交互作用
甲は施設Aで高い値を出し、施設Bでは低い値を出す。
乙は施設Aで高い値を出し、施設Bでは低い値を出す。
こういう相性のことを
交互作用と呼ぶ。A B
甲 乙
22
多段枝分かれ(二段枝分かれ、…)
ひとつをのぞいて、因子に対応がない。
甲 乙
A
甲 乙
B
ひとつしか因子がないときは一元配置です。
23
枝分かれのよいところと思う方にチェック。
□ 同じ実験回数で多くの要員を調べられる。
□ 交互作用を考えなくてもよい。
☝施設に対応があり、要員に対応がない場合。
24
二段枝分かれ繰返し2回とすると、8回の実験から、4人分検討できる。(二元配置では2人分。)
甲 乙
A
甲 乙
B
25
■多元配置では同じ実験の規模では小さい水準数しか検討できない。あるいは、一定の水準数を調べようとすると、実験の規模が大きくなる。
■多段枝分かれでは、交互作用について検討することができない。交互作用があると思われる場面で、使用するのは難しい。
利点 欠点
多元配置 交互作用の検討可
実験回数が大きくなる
多段枝分かれ
実験回数が小さくなる
交互作用の検討不可
26
クイズ②
下のシナリオが3元配置でも、3段枝分かれでもないことを確かめて下さい。
甲 乙
A
甲 乙
B1日目
甲 乙
A
甲 乙
B2日目
27
メモ
28
実験計画
必要な情報が得られるように、シナリオ
立てをすることを実験計画を立てるという。
実験計画を立てるとき、ランダム化が必要。
29
甲 乙
A B
甲 乙
各施設で、各要員が2回繰り返しの二元配置。どんな順序で、どの条件で実験するのがよいでしょうか?
クイズ③
30
メモ
31
完全なランダム化はかなり大変
例えば、因子をまとめて一元配置に。例えば、交互作用はないとして枝分かれ法。
不確かさ評価では、多元配置はあまりやらない。
32
ほかの実験計画用語
交互作用を調べたい。完全なランダム化は難しい。
コストがかかっても、なんとかしたい。
分割法
余分な因子を増やして対応する。不確かさ評価ではあまり使われない。 33
ほかの実験計画用語
いくつかの交互作用を調べたい。因子数が増えると実験回数が膨大に。
実験数をなんとか減らしたい。
直交表
他の交互作用は無視して回数を減らす。不確かさ評価ではあまり使われない。 34
メモ
35
一元配置の計算
いちげんはいちのけいさん
36
甲 さん 乙 さん 丙 さん
9.6 cm 10.4 cm 8.2 cm
9.2 cm 10.7 cm 8.3 cm
9.4 cm 10.5 cm 8.7 cm
リボンの例で考えましょう。
37
甲 だけ見れば、繰返しの分散は、
3−1(9.6−9.4)2+(9.2 −9.4)2+(9.4−9.4)2
0.040 cm2
38
乙 だけなら、0.023 cm2
乙 だけなら、0.070 cm2
平均をとって 0.044 cm2
39
3回繰返しなのだから、その平均値の分散は、
30.044
0.015 cm2
40
3つの平均値に着目します。
甲 さん 乙 さん 丙 さん
9.400 cm 10.533 cm 8.400 cm
これを単純に3回の繰返しと見ますと、
分散 = 1.139 cm2
41
このうち、繰返しで説明しきれない分が要員の効果となります。
1.139 − 0.015 = 1.124 cm2
甲 乙 C
42
こんなの、面倒くさくて、やってられない。
分散分析表
よく使われる実験計画の解析のために準備された表
43
因子S
(平方和)f
(自由度)V
(平均平方)平均平方の
期待値
A fA = a‐1 VA = SA/fA e2 + n∙a
2
繰返し fe = a(n‐1) Ve = Se/fe e2
総和 f = an‐1
a
i
n
ji xxS
1 1
2
A
a
i
n
jiij xxS
1 1
2e
a
i
n
jij xxS
1 1
2
一つ目の因子をA(水準数a ) 、繰返しn回とする。A
2は因子Aの分散。e2は繰返しの分散。
一元配置の分散分析表
44
この分散分析表から、平均平方と因子の分散の関係が求まる。
VA ≈ e2 + n∙a
2
Ve ≈ e2
a2 ≈ (VA−Ve)/n
45
要注意
先の式はあくまで近似( “ = ”ではなく“ ≈ ”)。ばらつきの範囲で、VA < Veとなり、sA2がマイナスになることがある。
そういうときには、因子Aの効果は小さ
いと判断して、一元配置ではなく、単なる繰返しとして、解析すればよい。
46
事例とポイント
じれいとぽいんと
47
マイクロピペットの校正
マイクロピペットの操作は人によって違う。(要員の違い)
同じ人でも日によってばらつきがある。(日の違い)
■
■
48
乙 丙
1日目
こんな実験計画?
甲 乙 丙
2日目
甲
49
実際はこうした。
1日目
甲
2日目
乙
3日目
丙
50
さて、どちらでしょう?
□ 要員と日間が分けられない。だから、これじゃダメだ。
□ 要員と日間が分けられない。だけど、これでよい。
51
実際の試験でも一名が一日で校正するなら、分けなくても構わない。もちろん、余裕があれば、3日間それぞれ3人にやってもらった方がよい。
どうせ足すのだから、
要員の効果の標準偏差
日間の効果の標準偏差
2 2
52
クイズ④
いつもは一つの施設で、一名の要員が測定する。下の二元配置でなく、一元配置にしても、必要な情報を得ることができるか?
甲 乙
A B
甲 乙
53
メモ
54
恒温槽内の温度分布
恒温槽の温度は場所によって異なる。(場所の違い)
■
1
2 3
55
一元配置各か所2回の繰り返し。
1か所目 3か所目
温度計
2
2か所目
温度計
2
温度計
2
56
以下のように求まりました。
場所の効果の標準偏差
= 1.0 ⁰C
繰返しの
標準偏差
= 0.5 ⁰C
全平均と設定温度のずれは0.0 ⁰Cとします。 57
次にこの恒温槽を実験で使うとき、温度は設定温度の40.0 ⁰Cと報告しますが、その不確かさは下の式で計算してよいでしょうか?
場所の効果の標準偏差
繰返しの
標準偏差
2 2
3 3×258
正解
場所の効果の標準偏差
繰返しの
標準偏差
2 2
3 3×2
場所の効果の標準偏差
2
全平均の不確かさ☝どこを選ぶか分からないので、もうひとつ足しておく
59
メモ
60
クイズ⑤
100個の抵抗を標準抵抗として売ります。
10個をサンプルとして選び、分散分析します。平均は10.0 でした。サンプルごとの違いの標準偏差は0.1 。繰返しの標準偏差は小さいので無視する。
残り90個の抵抗に10.0 と値を付けて売ります。どんな不確かさを付けたらよいでしょう?(サンプルごとの違い以外の不確かさは無視。)
61
メモ
62
特殊な事例
周波数によって(特性が変わるべきでないのに、)変わってしまう。
入力電圧によって(特性が変わるべきではないのに、)変わってしまう。
■
■
63
分散分析するべき
この範囲で使う
特性
この不確かさを知りたい。
周波数入力電圧
使用範囲で、入力の変化に対して、出力の平均的な変化はゼロ(傾きゼロ)。しかし、不確かさはある。
64
分散分析するべきでない
周波数入力電圧
この範囲で使う
特性
この不確かさを知りたい。
やっても構わないが、直線の傾きを求めて、それを感度係数とする方法の方が簡単だし、応用性も高い。
65
メモ
66
まとめ
まとめ
67
基本的には、要員、施設、場所、日など、物理的に意味のある数値を与えられないものが因子となる。もっというと、物理的な不確かさの背景がよく分からなかったり、そこにはあんまり興味がない場合。
甲 乙
A
甲 乙
B
□
□
68
参考書:田中秀幸著「分析・測定データの統計処理-分析化学データの扱い方」(朝倉書店、2014)。
付録:二元配置と二段枝分かれ
ふろく:いちげんはいちとにだんえだわかれ
69
因子 S(変動) f (自由度) V (平均平方) 平均平方の期待値
A SA fA = a‐1 VA = SA/fA e2 + n∙A×B
2+ bn∙A2
B SB fB = b‐1 VB = SB/fB e2 + n∙A×B
2+ an∙B2
A×B交互作用
SA×B fA×B = (a‐1)(b‐1) VA×B = SA×B/fA×B e2 + n∙A×B
2
繰返し Se fe =ab(n‐1) Ve = Se/fe e2
総和 S f = abn‐1
a
i
b
j
n
ki xxS
1 1 1
2
A
a
i
b
j
n
kj xxS
1 1 1
2
B
a
i
b
j
n
kijijk xxS
1 1 1
2e
a
i
n
j
n
kijk xxS
1 1 1
2
a
i
b
j
n
kjiij xxxxS
1 1 1
2
BA
二元配置の分散分析表一つ目の因子をA(水準数a)、二つ目の因子をB (水準数b) 、繰返しn回とする。A2、B2は因子A、Bの分散。 A×B
2は因子Aと因子Bの交互作用の分散。 e2は繰返しの分散。
70
二元配置の分散分析表(交互作用無視)
因子 S(変動) f (自由度) V (平均平方) 平均平方の期待値
A SA fA = a‐1 VA = SA/fA e2 + bn∙A
2
B SB fB = b‐1 VB = SB/fB e2 + an∙B
2
繰返し Se fe = abn‐a‐b+1 Ve = Se/fe e2
総和 S f = abn‐1
a
i
b
j
n
ki xxS
1 1 1
2
A
a
i
b
j
n
kj xxS
1 1 1
2
B
a
i
b
j
n
kjiijk xxxxS
1 1 1
2
e
a
i
n
j
n
kijk xxS
1 1 1
2
一つ目の因子をA(水準数a)、二つ目の因子をB (水準数b) 、繰返しn回とする。A2、B2は因子A、Bの分散。 e2は繰返しの分散。
71
二段枝分かれの分散分析表
因子 S (変動) f (自由度) V (分散) 分散の期待値
A SA fA = a‐1 VA = SA/fA e2 + n∙B
2+ bn∙A2
B SB fB = a(b‐1) VB = SB/fB e2 + n∙B
2
繰返し(e) Se fe =ab(n‐1) Ve = Se/fe e2
総和 S f = abn‐1
a
i
b
j
n
ki xxS
1 1 1
2
A
a
i
b
j
n
kiij xxS
1 1 1
2
B
a
i
b
j
n
kijijk xxS
1 1 1
2e
a
i
n
j
n
kijk xxS
1 1 1
2
一つ目の因子をA(水準数a)、二つ目の因子をB (水準数b) 、繰返しn回とする。A2、B2は因子A、Bの分散。 e2は繰返しの分散。
72
クイズの答え
くいずのこたえ
73
要員には対応があるが、施設に対応がない場合のシナリオを考えてみて下さい。
クイズ①
甲
A
甲
B
乙 乙
A* B*
74
クイズ②
下のシナリオが3元配置でも、3段枝分かれでもないことを確かめて下さい。
施設は対応あり。要員は対応なし。実験日は対応あり。すべて対応がありが多元配置。1つを除き対応なしが枝分かれ。今回はどちらでもない。
ちなみに、このような状況で、実験日が積極的な興味の対象でなく、仕方なく分けざるを得ないと解釈される場合には、実験日はブロックと呼ばれ、各ブロックの中でランダムに実験を行うことから、2因子の乱塊(らんかい)法と呼ばれる。
75
クイズ③
施設A 施設B要員甲 ① ⑤
② ⑥
要員乙 ③ ⑦
④ ⑧
上の①~⑧の実験をすべてランダムに実施する。
各施設で、各要員が2回繰り返しの二元配置。どんな順序で、どの条件で実験するのがよいでしょうか?
76
クイズ④
いつもは一つの施設で、一名の要員が測定する。下の二元配置でなく、一元配置にしても、必要な情報を得ることができるか?
甲 乙
A Bこのようにすると、要員と施設の効果が区別できなくなる。因子が区別できなくなることを交絡(こうらく)するという。通常の分散分析では、交絡は避けるべきものだが、不確かさ評価では積極的に交絡させることがある。
77
クイズ⑤
100個の抵抗を標準抵抗として売ります。
10個をサンプルとして選び、分散分析します。平均は10.0 でした。サンプルごとの違いの標準偏差は0.1 。繰返しの標準偏差は無視できるほど小さい。
残り90個の抵抗に10.0 と値を付けて売ります。どんな不確かさを付けたらよいでしょう?(サンプルごとの違い以外の不確かさは無視。)
1011
≈ 0.105 0.12
78