7
1 MAD ロバストな統計量 Kobe.R #14 2015.01.31 @florets1

Mad kobe.r14

Embed Size (px)

Citation preview

Page 1: Mad kobe.r14

1

MADロバストな統計量

Kobe.R #14

2015.01.31

@florets1

Page 2: Mad kobe.r14

2

外れ値がないとき~

平均

標準偏差

Page 3: Mad kobe.r14

3

外れ値があるとき~

外れ値が一個あるだけで、平均や標準偏差がずいぶん影響を受けてしまいました。

Page 4: Mad kobe.r14

4

中央値は外れ値の影響を受けにくい

外れ値の影響を受けにくいことを「ロバスト」といいます。

Page 5: Mad kobe.r14

5

MADも外れ値の影響を受けにくい

MAD (Median Absolute Deviation) 中央絶対偏差

Page 6: Mad kobe.r14

6

MADはどんな計算なの?

実はけっこう簡単です。これだけ。

Page 7: Mad kobe.r14

7

まとめ

外れ値の影響を受けにくいことを「ロバスト」といいます。ロバストな統計量を2種類ご紹介しました。

データの代表値としては、平均値よりも中央値がロバストです。

ばらつきを示す値としては標準偏差よりも、中央絶対偏差(MAD)のほうがロバストです。