22
4 正規性の検定 37 4 正規性の検定 分布を利用する検定,t-検定,分散分析および各種多重比較・範囲検定などは,正規分布が前提となる.同時 に群間の分散の一様性も要求される.しかし,一般的に等分散性の検定は利用されているが,正規分布の検定 を実施した後の多重比較検定などの例は極めて少ない(野村,2002).おそらく等分散性を確認すれば正規性 をカバーできるということで正規性の検定を省略していると考えられる.正規性の検定法は,あまり使用して いないためかその手法について知られていない.正規性を検定するためには,いつかの手法(武藤,2000)が 紹介されている.「標本が抽出された母集団の分布は正規分布である」という帰無仮説を検定する. 下記に幾つかの解析法を示した. Kolmogorov-Smirnov 検定 Lilliefors 検定 Shapiro-Wilk W 検定(後述) カイ分布を用いる適合度検定(後述) 1. Shapiro-Wilk(シャピロウィルク)の W 検定 計算し易いように少数例を用い説明する.1 F344 ラットの 3 週間の増体重である. 1. 雄若齢 F344 ラットの増体重 動物番号 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 増体重(g) 71 86 92 95 100 102 105 108 118 123 観察度数 1 1 2 4 1 1 Shapiro-Wilk W 検定の計算(椿ら, 2001 平方和=2072 123-71=52, 118-86=32, 108-92=16, 105-55=10, 102-100=2 これら算出した値はいずれもバラツキを表す値である.標本数が奇数の場合,残った値は使用しない. 次にこれらの値と算出した係数(数表 4-1)との積を算出して結合する. この場合,標本数は,10(n)i=1, 2, 3, 4, 5 に対する値,0.5739, 0.3291, 0.2141, 0.1224, 0.0399 を下記の式に代 入する. (0.5739)(52)+(0.3291)(32)+(0.2141)(16)+(0.1224)(10)+(0.0399)(2)=45.10 そして,統計量 W を算出する. 98166 . 0 2072 10 . 45 2 = = W 数表 4-2 から 0.98166 P>0.95 (P=0.950.98)で,これらの 10 個の値は,非常に正規分布に近いことがわか る. SAS JMP による解析結果を2 に示した. 2. SAS JMP による Shapiro-Wilk W 検定結果(W 値と P 値) W P (Prob<W) 0.981120 0.9673 数表 4-1. Coefficient for Shapiro-Wilk Test (Conover, 1999) in 2 3 4 5 6 7 8 9 10 1 0.7071 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5885 0.5739 2 - 0.0000 0.1667 0.2413 0.2806 0.3031 0.3164 0.3244 0.3291 3 - - - 0.0000 0.0875 0.1401 0.1743 0.1976 0.2141 4 - - - - - 0.0000 0.0561 0.0947 0.1224 5 - - - - - - - 0.0000 0.0399

W P (Prob< 0.981120 0arima/lectures/JT-4.pdf第4章 正規性の検定 37 第4章 正規性の検定 分布を利用する検定,t-検定,分散分析および各種多重比較・範囲検定などは,正規分布が前提となる.同時

Embed Size (px)

Citation preview

第 4 章 正規性の検定

37

第 4 章 正規性の検定 分布を利用する検定,t-検定,分散分析および各種多重比較・範囲検定などは,正規分布が前提となる.同時

に群間の分散の一様性も要求される.しかし,一般的に等分散性の検定は利用されているが,正規分布の検定

を実施した後の多重比較検定などの例は極めて少ない(野村,2002).おそらく等分散性を確認すれば正規性

をカバーできるということで正規性の検定を省略していると考えられる.正規性の検定法は,あまり使用して

いないためかその手法について知られていない.正規性を検定するためには,いつかの手法(武藤,2000)が

紹介されている.「標本が抽出された母集団の分布は正規分布である」という帰無仮説を検定する. 下記に幾つかの解析法を示した. Kolmogorov-Smirnov 検定 Lilliefors 検定 Shapiro-Wilk の W 検定(後述) カイ分布を用いる適合度検定(後述) 1. Shapiro-Wilk(シャピロウィルク)の W 検定 計算し易いように少数例を用い説明する.表 1 は F344 ラットの 3 週間の増体重である.

表 1. 雄若齢 F344 ラットの増体重 動物番号 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 増体重(g) 71 86 92 95 100 102 105 108 118 123 観察度数 1 1 2 4 1 1

Shapiro-Wilk の W 検定の計算(椿ら,2001) 平方和=2072

123-71=52, 118-86=32, 108-92=16, 105-55=10, 102-100=2

これら算出した値はいずれもバラツキを表す値である.標本数が奇数の場合,残った値は使用しない. 次にこれらの値と算出した係数(数表 4-1)との積を算出して結合する. この場合,標本数は,10(n)で i=1, 2, 3, 4, 5 に対する値,0.5739, 0.3291, 0.2141, 0.1224, 0.0399 を下記の式に代

入する. (0.5739)(52)+(0.3291)(32)+(0.2141)(16)+(0.1224)(10)+(0.0399)(2)=45.10

そして,統計量 W を算出する.

98166.02072

10.45 2==W

数表 4-2 から 0.98166 は P>0.95 (P=0.95~0.98)で,これらの 10 個の値は,非常に正規分布に近いことがわか

る. SAS JMP による解析結果を表 2 に示した.

表 2. SAS JMP による Shapiro-Wilk の W 検定結果(W 値と P 値)

W P 値(Prob<W) 0.981120 0.9673

数表 4-1. Coefficient for Shapiro-Wilk Test (Conover, 1999)

i\n 2 3 4 5 6 7 8 9 10 1 0.7071 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5885 0.5739 2 - 0.0000 0.1667 0.2413 0.2806 0.3031 0.3164 0.3244 0.3291 3 - - - 0.0000 0.0875 0.1401 0.1743 0.1976 0.2141 4 - - - - - 0.0000 0.0561 0.0947 0.1224 5 - - - - - - - 0.0000 0.0399

第 4 章 正規性の検定

38

数表 4-1.つづき i\n 11 12 13 14 15 16 17 18 19 20

1 0.5601 0.5475 0.5359 0.5251 0.5150 0.5056 0.4968 0.4886 0.4808 0.4734 2 0.3315 0.3325 0.3325 0.3318 0.3306 0.3290 0.3273 0.3253 0.3232 0.3211 3 0.2260 0.2347 0.2412 0.2460 0.2495 0.2521 0.2540 0.2553 0.2561 0.2565 4 0.1429 0.1586 0.1707 0.1802 0.1878 0.1939 0.1988 0.2027 0.2059 0.2085 5 0.0695 0.0922 0.1099 0.1240 0.1353 0.1449 0.1524 0.1587 0.1641 0.1686 6 0.0000 0.0303 0.0539 0.0727 0.0880 0.1005 0.1109 0.1197 0.1271 0.1334 7 - - 0.0000 0.0240 0.0433 0.0593 0.0725 0.0837 0.0932 0.1013 8 - - - - 0.0000 0.0196 0.0359 0.0496 0.0612 0.0711 9 - - - - - - 0.0000 0.0163 0.0303 0.0422

10 - - - - - - - - 0.0000 0.0140

数表 4-1.つづき i\n 21 22 23 24 25 26 27 28 29 30

1 0.4643 0.4590 0.4542 0.4493 0.4450 0.4407 0.4366 0.4328 0.4291 0.4254

2 0.3185 0.3156 0.3126 0.3098 0.3069 0.3043 0.3018 0.2992 0.2968 0.2944

3 0.2578 0.2571 0.2563 0.2554 0.2543 0.2533 0.2522 0.2510 0.2499 0.2487

4 0.2119 0.2131 0.2139 0.2145 0.2148 0.2151 0.2152 0.2151 0.2150 0.2148

5 0.1736 0.1764 0.1787 0.1807 0.1822 0.1836 0.1848 0.1857 0.1864 0.1870

6 0.1399 0.1443 0.1480 0.1512 0.1539 0.1563 0.1584 0.1601 0.1616 0.1630

7 0.1092 0.1150 0.1201 0.1245 0.1283 0.1316 0.1346 0.1372 0.1395 0.1415

8 0.0804 0.0878 0.0941 0.0997 0.1046 0.1089 0.1128 0.1162 0.1192 0.1219

9 0.0530 0.0618 0.0696 0.0764 0.0823 0.0876 0.0923 0.0965 0.1002 0.1036

10 0.0263 0.0368 0.0459 0.0539 0.0610 0.0672 0.0728 0.0778 00822 0.0862

11 0.0000 0.0122 0.0228 0.0321 0.0403 0.0476 0.0540 0.0598 0.0650 0.0697

12 - - 0.0000 0.0107 0.0200 0.0284 0.0358 0.0424 0.0483 0.0537

13 - - - - 0.0000 0.0094 0.0178 0.0253 0.0320 0.0381

14 - - - - - - 0.0000 0.0084 0.0159 0.0227

15 - - - - - - - - 0.0000 0.0076

数表 4-1.つづき i\n 31 32 33 34 35 36 37 38 39 40

1 0.4220 0.4188 0.4156 0.4127 0.4096 0.4068 0.4040 0.4015 0.3989 0.3964 2 0.2921 0.2898 0.2876 0.2854 0.2834 0.2813 0.2794 0.2774 0.2755 0.2737 3 0.2475 0.2462 0.2451 0.2439 0.2427 0.2415 0.2403 0.2391 0.2380 0.2368 4 0.2145 0.2141 0.2137 0.2132 0.2127 0.2121 0.2116 0.2110 0.2104 0.2098 5 0.1874 0.1878 0.1880 0.1882 0.1883 0.1833 0.1883 0.1881 0.1880 0.1878 6 0.1641 0.1651 0.1660 0.1667 0.1673 0.1678 0.1683 0.1686 0.1689 0.1691 7 0.1433 0.1449 0.1463 0.1475 0.1487 0.1496 0.1505 0.1513 0.1520 0.1526 8 0.1243 0.1265 0.1284 0.1301 0.1317 0.1331 0.1344 0.1356 0.1366 0.1376 9 0.1066 0.1093 0.1118 0.1140 0.1160 0.1179 0.1196 0.1211 0.1225 0.1237

10 0.0899 0.0931 0.0961 0.0988 0.1013 0.1036 0.1056 0.1075 0.1092 0.1108 11 0.0739 0.0777 0.0812 0.0844 0.0873 0.0900 0.0924 0.0947 0.0967 0.0986 12 0.0585 0.0629 0.0699 0.0706 0.0739 0.0770 0.0798 0.0824 0.0848 0.0870 13 0.0435 0.0485 0.0530 0.0572 0.0610 0.0645 0.0677 0.0706 0.0733 0.0759 14 0.0289 0.0344 0.0395 0.0441 0.0484 0.0523 0.0559 0.0592 0.0622 0.0651 15 0.0144 0.0206 0.0262 0.0314 0.0361 0.0404 0.0444 0.0481 0.0515 0.0546 16 0.0000 0.0068 0.0131 0.0187 0.0239 0.0287 0.0331 0.0372 0.0409 0.0444 17 - - 0.0000 0.0062 0.0119 0.0172 0.0220 0.0264 0.0305 0.0343 18 - - - - 0.0000 0.0057 0.0110 0.0158 0.0203 0.0244 19 - - - - - - 0.0000 0.0053 0.0101 0.0146 20 - - - - - - - - 0.0000 0.0049

第 4 章 正規性の検定

39

数表 4-1.つづき

i\n 41 42 43 44 45 46 47 48 49 50 1 0.3940 0.6917 0.3894 0.3872 0.3850 0.3830 0.3808 0.3789 0.3770 0.3751 2 0.2719 0.2701 0.2684 0.2667 0.2651 0.2635 0.2620 0.2604 0.2589 0.2574 3 0.2357 0.2345 0.2334 0.2323 0.2313 0.2302 0.2291 0.2281 0.2271 0.2260 4 0.2091 0.2085 0.2078 0.2072 0.2065 0.2058 0.2052 0.2045 0.2038 0.2032 5 0.1876 0.1874 0.1871 0.1868 0.1865 0.1862 0.1859 0.1855 0.1851 0.1847 6 0.1693 0.1694 0.1695 0.1695 0.1695 0.1695 0.1695 0.1693 0.1692 0.1691 7 0.1531 0.1535 0.1539 0.1542 0.1545 0.1548 0.1550 0.1551 0.1553 0.1554 8 0.1384 0.1392 0.1398 0.1405 0.1410 0.1415 0.1420 0.1423 0.1427 0.1430 9 0.1249 0.1259 0.1269 0.1278 0.1286 0.1293 0.1300 0.1306 0.1312 0.1317

10 0.1123 0.1136 0.1149 0.1160 0.1170 0.1180 0.1189 0.1197 0.1205 0.1212 11 0.1004 0.1020 0.1035 0.1049 0.1062 0.1073 0.1085 0.1095 0.1105 0.1113 12 0.0891 0.0909 0.0927 0.0943 0.0959 0.0972 0.0986 0.0998 0.1010 0.1020 13 0.0782 0.0804 0.0824 0.0842 0.0860 0.0876 0.0892 0.0906 0.0919 0.0932 14 0.0677 0.0701 0.0724 0.0745 0.0765 0.0783 0.0801 0.0817 0.0832 0.0846 15 0.0575 0.0602 0.0628 0.0651 0.0673 0.0694 0.0713 0.0731 0.0748 0.0764 16 0.0476 0.0506 0.0534 0.0560 0.0584 0.0607 0.0628 0.0648 0.0667 0.0685 17 0.0379 0.0411 0.0422 0.0471 0.0497 0.0522 0.0546 0.0568 0.0588 0.0608 18 0.0283 0.0318 0.0352 0.0383 0.0412 0.0439 0.0465 0.0489 0.0511 0.0532 19 0.0188 0.0227 0.0263 0.0296 0.0328 0.0357 0.0385 0.0411 0.0436 0.0459 20 0.0094 0.0136 0.0175 0.0211 0.0245 0.0277 0.0307 0.0355 0.0361 0.0386 21 0.0000 0.0045 0.0087 0.0126 0.0163 0.0197 0.0229 0.0259 0.0288 0.0314 22 - 0.0000 0.0042 0.0081 0.0118 0.0153 0.0185 0.0215 0.0244 23 - - - - 0.0000 0.0039 0.0076 0.0111 0.0143 0.0174 24 - - - - - - 0.0000 0.0037 0.0071 0.0104 25 - - - - - - - - 0.0000 0.0035

数表 4-2.Quantiles of the Shapiro-Wilk Test Statistic

n 0.01 0.02 0.05 0.10 0.50 0.90 0.95 0.98 0.99 3 0.753 0.756 0.767 0.789 0.959 0.998 0.999 1.000 1.000 4 0.387 0.707 0.748 0.792 0.935 0.987 0.992 0.996 0.997 5 0.386 0.715 0.762 0.806 0.927 0.979 0.986 0.991 0.993 6 0.713 0.743 0.788 0.826 0.927 0.974 0.981 0.986 0.989 7 0.730 0.760 0.803 0.838 0.928 0.972 0.979 0.985 0.988 8 0.749 0.778 0.818 0.851 0.932 0.972 0.978 0.984 0.987 9 0.764 0.791 0.829 0.859 0.935 0.972 0.978 0.984 0.986

10 0.781 0.806 0.842 0.869 0.938 0.972 0.978 0.983 0.986 11 0.792 0.817 0.850 0.876 0.940 0.973 0.979 0.984 0.986 12 0.805 0.828 0.859 0.883 0.943 0.973 0.979 0.984 0.986 13 0.814 0.837 0.866 0.889 0.945 0.974 0.979 0.984 0.986 14 0.825 0.846 0.874 0.895 0.947 0.975 0.980 0.984 0.986 15 0.835 0.855 0.881 0.901 0.950 0.975 0.980 0.984 0.987 16 0.844 0.863 0.887 0.906 0.852 0.976 0.981 0.985 0.987 17 0.851 0.869 0.892 0.910 0.954 0.977 0.981 0.985 0.987 18 0.858 0.874 0.897 0.914 0.956 0.978 0.982 0.986 0.988 19 0.863 0.879 0.901 0.917 0.957 0.978 0.982 0.986 0.988 20 0.868 0.884 0.905 0.920 0.959 0.979 0.983 0.986 0.988 21 0.873 0.888 0.908 0.923 0.960 0.980 0.983 0.987 0.989 22 0.878 0.892 0.911 0.926 0.961 0.980 0.984 0.987 0.989 23 0.881 0.895 0.914 0.928 0.962 0.981 0.984 0.987 0.989 24 0.884 0.898 0.916 0.930 0.963 0.981 0.984 0.987 0.989

第 4 章 正規性の検定

40

数表 4-2.つづき

n 0.01 0.02 0.05 0.10 0.50 0.90 0.95 0.98 0.99 25 0.888 0.901 0.918 0.931 0.964 0.981 0.985 0.988 0.989 26 0.891 0.904 0.920 0.933 0.965 0.982 0.985 0.988 0.989 27 0.894 0.906 0.923 0.935 0.965 0.982 0.985 0.988 0.990 28 0.896 0.908 0.924 0.936 0.966 0.982 0.985 0.988 0.990 29 0.898 0.910 0.926 0.937 0.966 0.982 0.985 0.988 0.990 30 0.900 0.912 0.927 0.939 0.967 0.983 0.985 0.988 0.990 31 0.902 0.914 0.929 0.940 0.967 0.983 0.986 0.988 0.990 32 0.904 0.915 0.930 0.941 0.968 0.983 0.986 0.988 0.990 33 0.906 0.917 0.931 0.942 0.968 0.983 0.986 0.989 0.990 34 0.908 0.919 0.933 0.943 0.969 0.983 0.986 0.989 0.990 35 0.910 0.920 0.934 0.944 0.969 0.984 0.986 0.989 0.990 36 0.912 0.922 0.935 0.945 0.970 0.984 0.986 0.989 0.990 37 0.914 0.924 0.936 0.946 0.970 0.984 0.987 0.989 0.990 38 0.916 0.925 0.938 0.947 0.971 0.984 0.987 0.989 0.990 39 0.917 0.927 0.939 0.948 0.971 0.984 0.987 0.989 0.991 40 0.919 0.928 0.940 0.949 0.972 0.985 0.987 0.989 0.991 41 0.920 0.929 0.941 0.950 0.972 0.985 0.987 0.989 0.991 42 0.922 0.930 0.942 0.951 0.972 0.985 0.987 0.989 0.991 43 0.923 0.932 0.943 0.951 0.973 0.985 0.987 0.990 0.991 44 0.924 0.933 0.944 0.952 0.973 0.985 0.987 0.990 0.991 45 0.926 0.934 0.945 0.953 0.973 0.985 0.988 0.990 0.991 46 0.927 0.935 0.945 0.953 0.974 0.985 0.988 0.990 0.991 47 0.928 0.936 0.946 0.954 0.974 0.985 0.988 0.990 0.991 48 0.929 0.937 0.947 0.954 0.974 0.985 0.988 0.990 0.991 49 0.929 0.937 0.947 0.955 0.974 0.985 0.988 0.990 0.991 50 0.930 0.938 0.947 0.955 0.974 0.985 0.988 0.990 0.991

第 4 章 正規性の検定

41

SAS JMP による解析結果を下記に示した.

第 4 章 正規性の検定

42

SAS JMP では,サンプルデータの「ダイェット」の Quack および Quick の体重変化を開く.分析→一変量

の分布→Quack および Quick の体重変化を Y, 列へ→アクション OK→各図の赤三角をクリック→表示オプシ

ョン→より高次のモーメントのひずみ度およびとがり度を読み取る.表 3 にひずみ度ととがり度からデー

タの分布を把握する.

表 3. ひずみ度ととがり度の把握 データ Quack の体重変化 Quick の体重変化

ひずみ度 -0.12 1.3 とがり度 0.13 2.8

Skewness:

ワ イ ド

歪度・歪み度・ゆがみ:ひずみ度は,左右対称か否かを判定する統計量である.正

規分布では,歪み度は 0 である.右に裾を引く場合は,正である.左に裾を引く場合は,負にな

る.スキューネスと読む. Kurtosis:

センド

尖度・尖り度:とがり度は,正規分布の場合 0 となる.扁平の分布は負となる.カート-シスと読

む(新村,2000). 歪み度と尖り度を加えて絶対値 2 以上の場合,正規性は保証できない傾向にある. 同様の例題(表 1)に対してカイ分布を用いた適合検定によって実施してみる.解析ソフトは群馬大学の青

木先生の無料ソフト(http://aoki2.si.gunma-u.ac.jp/JavaScript/ )を使用した.解析結果を表 3 に示した. ★正規分布へのあてはめ(面積を計算する方法)★ 平均値 = 100.950(各クラスにおける個体数を入力するため前述の 100.0 とは異なる.したがって,分散およ

び標準偏差も同様に異なる) 分散 = 184.000 標準偏差 = 13.5647

表 3. 雄若齢 F344 ラットの増体重の分布 階級開始値 観察度数 相対度数 理論比 期待値

60.0000 0 0.00000 0.01115 0.11146 70.0000 1 0.10000 0.04965 0.49648 80.0000 1 0.10000 0.14791 1.47908 90.000 2 0.20000 0.26191 2.61913

100.000 4 0.40000 0.27588 2.75875 110.000 1 0.10000 0.17286 1.72857 120.000 1 0.10000 0.06439 0.64390 130.000 0 0.00000 0.06439 0.16262 合計 10 1.00000 1.00000 10.00000

★ 適合度の検定 ★ 最初の 3 カテゴリーを併合した.最後の 3 カテゴリーを併合した カイ二乗値 = 0.82141 自由度 = 1(カテゴリーマイナス 3= 4-3=1),したがって,カテゴリー(区間)は 4 以上を設定する. 有意確率 = 0.36477 有意差を認めず正規性を確認できた.したがって,この場合 Shapiro-Wilk の W 検定と同一の結果となった.

第 4 章 正規性の検定

43

2. カイ分布を用いた手計算(柴田,1970)および SAS JMP による Shapiro-Wilk の W 検定 ある学生が Crimson clover の花粉粒の直径を測定しクラス分けをした結果(表 4)である.この標本の母集団

は正規分布をしているといえるか?カイ分布を用いた手計算および SAS JMPによる Shapiro-Wilkの W検定の結

果を示す. カイ分布を用いた計算・適合検定,標本分布(観測値)が正規分布(理論値)に一致しているかどうかを検

定する.

表 4. Crimson clover の花粉粒の 直径を測定

クラス* 観測値(x) 17-19 - 19-21 1 21-23 1 23-25 9 25-27 12 27-29 31 29-31 40 31-33 20 33-35 13 35-37 6 37-39 1 39-41 2 41-43 1 43-45 -

*接眼ミクロメータの目盛り数. 1 目盛は約 1.43μs である. この表では観測値の実際の分布よりも上下 1 区間(クラス)各々余分にとっている.これは正規分布が限り

なく続くことを考慮してある. 表 4 から計算に必要な数値を表 5 の如く作成する.

表 5. 計算に必要な諸数値

xx - Sx

xx - ⊿(面積)* ⊿の差 ⊿の差×N

19 -10.90 3.07 0.4989 0.0052 0.71 21 -8.90 2.51 0.4937 0.0199 2.73 23 -6.90 1.94 0.4738 0.0576 7.89 25 -4.90 1.38 0.4162 0.1223 16.76 27 -2.90 0.82 0.2939 0.1952 26.74 29 -0.09 0.25 0.0987 0.2204** 30.19 31 1.10 0.31 0.1217 0.1862 25.51 33 3.10 0.87 0.3079 0.1172 16.06 35 5.10 1.44 0.4251 0.0522 7.15 37 7.10 2.00 0.4773 0.0175 2.40 39 9.10 2.56 0.4948 0.0043 0.59 41 11.10 3.13 0.4991 0.0008 0.11 43 13.10 3.69 0.4999 - -

x は観測値, x は平均値=29.90,Sx は標準偏差=3.55,N は総観察数=137 *正規分布の面積表(数表 4-3)による.**ここだけは和で,0.0987+0.1217=0.2204 とする.

第 4 章 正規性の検定

44

数表 4-3. 正規分布の面積と高さ(柴田,1970)

Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 0.00 .39894 .00000 0.45 .36053 .17364 0.90 .26609 .31594 1.35 .16038 .41149 0.01 .39892 .00399 0.46 .35889 .17724 0.91 .26369 .31859 1.36 .15822 .41309 0.02 .39886 .00798 0.47 .35723 .18082 0.92 .26129 .32121 1.37 .15608 .41466 0.03 .39876 .01197 0.48 .35553 .18439 0.93 .25888 .32381 1.38 .15395 .41621 0.04 .39862 .01595 0.49 .35381 .18793 0.94 .25647 .32639 1.39 .15183 .41774

0.05 .39884 .01994 0.50 .35207 .19146 0.95 .25406 .32894 1.40 .14973 .41924 0.06 .39822 .02392 0.51 .35029 .19497 0.96 .25164 .33147 1.41 .14764 .42073 0.07 .39797 .02790 0.52 .34849 .19847 0.97 .24923 .33398 1.42 .14556 .42220 0.08 .39767 .03188 0.53 .34667 .20194 0.98 .24681 .33646 1.43 .14350 .42364 0.09 .39735 .03586 0.54 .34482 .20540 0.99 .24439 .33891 1.44 .14146 .42507

0.10 .39695 .03983 0.55 .34294 .20884 1.00 .24197 .34134 1.45 .13943 .42647 0.11 .39654 .04380 0.56 .34105 .21226 1.01 .23955 .34375 1.46 .13742 .42786 0.12 .39608 .04776 0.57 .33912 .21566 1.02 .23713 .34614 1.47 .13542 .42922 0.13 .39559 .05172 0.58 .33718 .21904 1.03 .23471 .34850 1.48 .13344 .43056 0.14 .39505 .05567 0.59 .33521 .22240 1.04 .23230 .35083 1.49 .13147 .43189

0.15 .39448 .05962 0.60 .33322 .22575 1.05 .22988 .35314 1.50 .12952 .43319 0.16 .39387 .06356 0.61 .33121 .22907 1.06 .22747 .35543 1.51 .12758 .43448 0.17 .39322 .06749 0.62 .32918 .23237 1.07 .22506 .35769 1.52 .12566 .43574 0.18 .39253 .07142 0.63 .32713 .23565 1.08 .22265 .35993 1.53 .12376 .43699 0.19 .39181 .07535 0.64 .32506 .23891 1.09 .22025 .36214 1.54 .12188 .43822

0.20 .39104 .07926 0.65 .32297 .24215 1.10 .21785 .36433 1.55 .12001 .43943 0.21 .39024 .08317 0.66 .32086 .24537 1.11 .21546 .36650 1.56 .11816 .44062 0.22 .38940 .08706 0.67 .31874 .24857 1.12 .21307 .36864 1.57 .11632 .44179 0.23 .38853 .09095 0.68 .31659 .25175 1.13 .21069 .37076 1.58 .11450 .44295 0.24 .38762 .09483 0.69 .31443 .25490 1.14 .20831 .37286 1.59 .11270 .44408

0.25 .38667 .09871 0.70 .31225 .25840 1.15 .20594 .37493 1.60 .11092 .44562 0.26 .38568 .10257 0.71 .31006 .26115 1.16 .20357 .37698 1.61 .10915 .44630 0.27 .38466 .10642 0.72 .30785 .26424 1.17 .20121 .37900 1.62 .10741 .44738 0.28 .38361 .11026 0.73 .30563 .26730 1.18 .19886 .38100 1.63 .10567 .44845 0.29 .38251 .11409 0.74 .30339 .27035 1.19 .19652 .38298 1.64 .10396 .44950

0.30 .38139 .11791 0.75 .30114 .27337 1.20 .19419 .38493 1.65 .10226 .45053 0.31 .38023 .12172 0.76 .29887 .27637 1.21 .19186 .38686 1.66 .10059 .45154 0.32 .37903 .12552 0.77 .29659 .27935 1.22 .18954 .38877 1.67 .09893 .45254 0.33 .37780 .12930 0.78 .29431 .28230 1.23 .18724 .39065 1.68 .09728 .45352 0.34 .37654 .13307 0.79 .29200 .28524 1.24 .18494 .39251 1.69 .09566 .45449

0.35 .37524 .13683 0.80 .28969 .28814 1.25 .18265 .39435 1.70 .09405 .45543 0.36 .37391 .14058 0.81 .28737 .29103 1.26 .18037 .39617 1.71 .09246 .45637 0.37 .37255 .14431 0.82 .28504 .29389 1.27 .17810 .39796 1.72 .09089 .45728 0.38 .37115 .14803 0.83 .28269 .29673 1.28 .17585 .39973 1.73 .08933 .45818 0.39 .36973 .15173 0.84 .28034 .29955 1.29 .17360 .40147 1.74 .08780 .45907

0.40 .36827 .15542 0.85 .27798 .30234 1.30 .17137 .40320 1.75 .08628 .45994 0.41 .36678 .15910 0.86 .27562 .30511 1.31 .16915 .40490 1.76 .08478 .46080 0.42 .36526 .16276 0.87 .27324 .30785 1.32 .16694 .40658 1.77 .08329 .46164 0.43 .36371 .16640 0.88 .27086 .31057 1.33 .16474 .40824 1.78 .08183 .46246 0.44 .36213 .17003 .0.89 .26848 .31327 1.34 .16256 .40988 1.79 .08038 .46327

第 4 章 正規性の検定

45

数表 4-3. つづき

Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 1.80 .07895 .46407 2.25 .03174 .48778 2.70 .01042 .49653 3.15 .00279 .49918 1.81 .07754 .46485 2.26 .03103 .48809 2.71 .01014 .49664 3.16 .00271 .49921 1.82 .07614 .46562 2.27 .03034 .48840 2.72 .00987 .49674 3.17 .00262 .49924 1.83 .07477 .46638 2.28 .02965 .48870 2.73 .00961 .49683 3.18 .00254 .49926 1.84 .07341 .46712 2.29 .02898 .48899 2.74 .00935 .49693 3.19 .00246 .49929

1.85 .07206 .46784 2.30 .02833 .48928 2.75 .00909 .49702 3.20 .00238 .49931 1.86 .07074 .46856 2.31 .02768 .48956 2.76 .00885 .49711 3.21 .00231 .49934 1.87 .06943 .46926 2.32 .02705 .48983 2.77 .00861 .49720 3.22 .00224 .49936 1.88 .06814 .46995 2.33 .02643 .49010 2.78 .00837 .49728 3.23 .00216 .49938 1.89 .06687 .47062 2.34 .02582 .49036 2.79 .00814 .49736 3.24 .00210 .49940

1.90 .06562 .47128 2.35 .02522 .49061 2.80 .00792 .49774 3.25 .00203 .49942 1.91 .06439 .17193 2.36 .02463 .49086 8.81 .00770 .49752 3.26 .00196 .49944 1.92 .06316 .47257 2.37 .02406 .49111 2.82 .00748 .49760 3.27 .00190 .49946 1.93 .06195 .47320 2.38 .02349 .49134 2.83 .00727 .49767 3.28 .00184 .49948 1.94 .06077 .47381 2.39 .02294 .49158 2.84 .00707 .49774 3.29 .00178 .49950

1.95 .05959 .47441 2.40 .02239 .49180 2.85 .00687 .49781 3.30 .00172 .49952 1.96 .05844 .47500 2.41 .02186 .49202 2.86 .00668 .49788 3.31 .00167 .49953 1.97 .05730 .47558 2.42 .02134 .49224 2.87 .00649 .49795 3.32 .00161 .49955 1.98 .05618 .47615 2.43 .02083 .49245 2.88 .00631 .49801 3.33 .00156 .49957 1.99 .05508 .47670 2.44 .02033 .49266 2.89 .00613 .49807 3.34 .00151 .49958

2.00 .05399 .47725 2.45 .01984 .49286 2.90 .00595 .49813 3.35 .00146 .49960 2.01 .05292 .47778 2.46 .01936 .49305 2.91 .00578 .49819 3.36 .00141 .49961 2.02 .05186 .47831 2.47 .01889 .49324 2.92 .00562 .49825 3.37 .00136 .49962 2.03 .05082 .47882 2.48 .01842 .49343 2.93 .00545 .49831 3.38 .00132 .49964 2.04 .04980 .47932 2.49 .01797 .49361 2.94 .00530 .49836 3.39 .00127 .49965

2.05 .04879 .47982 2.50 0.1753 .49379 2.95 .00514 .49841 3.40 .00123 .49966 2.06 .04780 .48060 2.51 .01709 .49396 2.96 .00499 .49846 3.41 .00119 .49968 2.07 .04682 .48077 2.52 .01667 .49413 2.97 .00485 .49851 3.42 .00115 .49969 2.08 .04586 .48124 2.53 .01625 .49430 2.98 .00471 .49856 3.43 .00111 .49970 2.09 .04491 .48169 2.54 .01585 .49446 2.99 .00457 .49861 3.44 .00107 .49971

2.10 .04398 .48214 2.55 .01545 .49461 3.00 .00443 .49865 3.45 .00104 .49972 2.11 .04307 .48257 2.56 .01506 .49477 3.01 .00430 .49869 3.46 .00100 .49973 2.12 .04217 .48300 2.57 .01468 .49492 3.02 .00417 .49874 3.47 .00097 .49974 2.13 .04128 .48341 2.58 .01431 .49506 3.03 .00405 .49878 3.48 .00094 .49975 2.14 .04041 .48382 2.59 .01394 .49520 3.04 .00393 .49882 3.49 .00090 .49976

2.15 .03955 .48422 2.60 .01358 .49534 3.05 .00381 .49886 3.50 .00087 .49977 2.16 .03871 .48461 261 .01323 .49547 3.06 .00370 .49889 3.51 .00084 .49978 2.17 .03788 .48500 2.62 .01289 .49560 3.07 .00358 .49893 3.52 .00081 .49978 2.18 .03706 .48537 2.63 .01256 .49573 3.08 .00348 .49897 3.53 .00089 .49979 2.19 .03626 .48574 2.64 .01223 .49585 3.09 .00337 .49900 3.54 .00076 .49980

2.20 .03547 .48610 2.65 .01191 .49598 3.10 .00327 .49903 3.55 .00073 .49981 2.21 .03470 .48645 2.66 .01160 .49609 3.11 .00317 .49906 3.56 .00071 .49981 2.22 .03394 .48679 2.67 .01130 .49621 3.12 .00307 .49910 3.57 .00068 .49982 2.23 .03319 .48713 2.68 .01100 .49632 3.13 .00298 .49913 3.58 .00066 .49983 2.24 .03246 .48745 2.69 .01071 .49643 3.14 .00288 .49916 3.59 .00063 .49983

第 4 章 正規性の検定

46

数表 4-3. つづき

Z* 高さ 面積 Z* 高さ 面積 3.60 .00061 .49984 3.80 .00029 .49993 3.61 .00059 .49985 3.81 .00028 .49993 3.62 .00057 .49985 3.82 .00027 .49993 3.63 .00055 .49986 3.83 .00026 .49994 3.64 .00053 .49986 3.84 .00025 .49994

3.65 .00051 .49987 3.85 .00024 .49994 3.66 .00049 .49987 3.86 .00023 .49994 3.67 .00047 .49988 3.87 .00022 .49995 3.68 .00046 .49988 3.88 .00021 .49995 3.69 .00044 .49989 3.89 .00021 .49995

3.70 .00042 .49989 3.90 .00020 .49995 3.71 .00041 .49990 3.91 .00019 .49995 3.72 .00039 .49990 3.92 .00018 .49996 3.73 .00038 .49990 3.93 .00018 .49996 3.74 .00037 .49991 3.94 .00017 .49996

3.75 .00035 .49991 3.95 .00016 .49996 3.76 .00034 .49992 3.96 .00016 .49996 3.77 .00033 .49992 3.97 .00015 .49996 3.78 .00031 .49992 3.98 .00014 .49997 3.79 .00030 .49999 3.99 .00014 .49997

4.00 .000134 .4999683 4.50 .000016 .4999966 5.00 .000001 .4999997

*=σ

X

表 6. 計算過程および計算結果

クラス 粒数・観測値

)(x 理論値

⊿の差×N=T Tx - 2)( Tx - TTx 2)( -

17-19 - - - - - 19-21 1 21-23 1 23-25 9

0.71 +2.73

+7.89=11.33 -0.33 0.11 0.010

25-27 12 16.76 -4.76- 22.66 1.352 27-29 31 26.74 4.26 18.15 0.678 29-31 40 30.19 9.81 96.24 3.188 31-33 20 25.51 -5.51 30.36 1.190 33-35 13 16.06 -3.06 9.36 0.583 35-37 6 37-39 1 39-41 2 41-43 1

7.15 +2.40 +0.59

+0.11=10.25

-0.25 0.06 0.006

43-45 - - - - - Total のカイ二乗値= 0.010+1.352+0.678+3.188+1.190+0.583+0.006= 7.007

この場合の自由度であるが,当初は 12 にクラス分けされたが,理論値 5 以下のクラス分けに統合したため

T=⊿の差×N で見られる如く 7 クラスになった.故に自由度は 7-3=4 である. カイ二乗計算値 = X2 = 7.007(表 6) 自由度 4,X2の分布表(数表 4-3)から 7.007 に対する確率は,5%水準値が 9.488 でこの値より小さいことか

ら 5%水準で有意(P>0.05)を認められなかったことになる.カイ分布から逸脱していないことがわかる.すなわ

ち,標本の母集団は正規分布をしていると結論される.本検定法は階級幅(クラス)を幾つに設定するかによ

って有意水準が異なってくる.

第 4 章 正規性の検定

47

数表 4-3. カイ二乗分布のパーセント点(吉村ら,1987) 有意水準点,α

階級-3 0.100 0.050 0.010 0.001

1 2.706 3.841 6.635 10.828 2 4.605 5.991 9.210 13.816 3 6.251 7.815 11.345 16.266 4 7.779 9.488 13.277 18.467 5 9.236 11.070 15.086 20.515 6 10.645 12.592 16.812 22.458

クラス(階級幅)の設定により有意差が変化する.3 種類のクラス設定による検出力の違いを表 7 に示した

(前述の青木先生のプログラムによる).

表 7. クラス(階級幅)の設定による有意差の変化 観測値 観察個数 クラス 観測値 観察個数 クラス 観測値 観察個数 クラス

17 - 15 - 13 0 19 1 19 4 4 19 11 11

21 1 2

23 21 21 25 83 83 23 9 9 27 71 71 31 39 39 25 12 12 31 33 33 37 4 27 31 31 35 7 43 0 4

29 40 40 39 3 31 20 20 43 0

10

33 13 13 35 6 6 37 1 39 2 41 1

データの 整理

43 -

4

クラスの数 9 5 4 カイ二乗値 8.197 6.983 4.093

自由度 9-3=6 5-3=2 4-3=1 有意水準

(直接確率) P=0.223 P=0.030 P=0.043

判定 正規性 非正規性 非正規性 区間の分けの選び方は,自由度を,なるべく 5 以上 20 以下に設定する.自由度は,クラス数を k で表せば

k-3 で表される.この理由は,通常は k-1 となるが,平均値と標準偏差を標本から推定したので自由度はさらに

2 へるから,D.F.= (k-1)-2= k-3 となる.したがって,正規性の検定は,解析者によって検出力が異なることが示

唆される.

第 4 章 正規性の検定

48

SAS JMP による解析結果を下記に示した.

Shapiro-Wilk の W 検定の結果は,0.9545 より大きな値をとる確率が 0.0009 であることを示している.したが

って,標本は正規母集団より抽出されたものではないと統計処理の結果は述べている. 数表 4-2 では自由度が 50 までにとどまっているため正確な棄却はできないが,自由度が大きくなるにしたが

って,W 値が 0.947 でも正規性が棄却されることから 0.954 はおそらく高い水準で有意差を示したことになるこ

とが推測される.カイ分布を用いる適合度検定とは,結果が大きく異なる.しかし,Shapiro-Wilk の W 検定は,

極端に大きい数値から極端に小さい数値の差を利用していることから,分布の違いを検定していることが肌で

感じられる. 3. ほぼ同一分布で標本数が異なるデータに対する Shapiro-Wilk の W 検定の検出力 Shapiro-Wilk の W 検定は,標本数の違いによって検出力が異なることが示唆されることからほぼ同一の分布

を設定して,標本数を異なる場合を想定して Shapiro-Wilk の W 検定を実施した.使用したデータはラットの 3週間の増体重から抜粋したデータを使用した. 例 1 では,70, 80, 85, 90, 94, 99, 101, 102, 104, 105, 108, 111, 112, 114, 121, 125, 131 の 17 標本.例 2 では,例 1のデータを 2 回(34 標本)繰り返し使用した.例 3 では,例 1 のデータを 3 回(51 標本)繰り返し使用した.

例 4 では,例 1 のデータを 4 回(68 標本)繰り返し使用した.

第 4 章 正規性の検定

49

例 1:標本数 17

ラット 13 週間の増体重(g), N=17

例 2:標本数 34 ラット 13 週間の増体重(g), N=34

第 4 章 正規性の検定

50

例 3:標本数 51

ラット 13 週間の増体重(g), N=51

例 4:標本数 68 ラット 13 週間の増体重(g), N=68

第 4 章 正規性の検定

51

以上の結果を表 8 に集約する.

表 8. 数の違いによる Shapiro-Wilk の W 検定の検出力 Shapiro-Wilk の W 検定

標本数 ヒストグラム 平均値 変動係数 (%) W 値 有意水準

17 15.5 0.987278 0.9891(NS)

34 15.3 0.968746 0.5017(NS)

51 15.2 0.959888 0.1486(NS)

68 70 80 90 100 110 120 130

N=68

103

15.2 0.954862 0.0383(S)

NS, 有意差を示さない,正規性を示す.S,有意差を示す.正規性を示さない. ほぼ同一な分布(ヒストグラム)の場合,標本数が小さいと W 値が大きくなる.標本数が大きくなるに従っ

て正規性の検出が低下する. カイ分布を利用した場合は,グループ数を適当に調節できるが,Shapiro-Wilk の W 検定ではグループの設定

ができない.したがって,大標本の場合,Shapiro-Wilk の W 検定は,正規性の確保が難しいことが推測される. 以上を総括するとカイ分布を用いる適合度検定とは,階級幅の設定の違いによって正規性の判断が異なる.

すなわち,階級に所属する個体数が大きい場合,正規性を保つことが困難となり,逆にクラス数を多く設定す

ると正規性が保たれる傾向にある.実際の使用場面では,Shapiro-Wilk の W 検定またはカイ分布を用いる適合

度検定のどちらを選択するかは,試験責任者にお任せする. 4. 正規分布の不思議 実際の毒性試験から得られた定量データに対して正規分布の検定を実施した結果,興味ある現象が認められ

たので報告する.定量値の中でも最も正規分布が保証されている項目の1つに体重がある.Table 9 に示すよう

に 10 試験の各対照群は正規分布をしているが群内標本数が増加すると正規分布は保たれなくなる. 次に正規分布が保証できないといわれている血小板について同様に吟味した結果を Table 10 に示した.各試

験に用いる対照群で正規分布を示さない項目は,群内標本数が増加しても正規分布は保証されない.このよう

に正規性の検定は,標本数が増加することによって,正規分布は保証できなくなる.

Table 9. Influence of number of samples on normal distribution of body weight of F344 control male rats at week 52 obtained from 10 toxicity studies

Study No. Item 1 2 3 4 5 6 7 8 9 10 Mean±S.D. 355±20 396±26 344±24 351±21 361±22 384±20 355±18 358±18 371±29 358±16

N 59 70 50 60 49 69 50 50 50 49 CV (%) 5.6 6.6 7.0 6.0 6.1 5.2 5.1 5.0 7.8 4.5

Skewness -0.70911 0.33990 0.02128 -0.14887 0.40923 0.26216 0.23044 0.39612 -0.28367 -0.19555 Kurtosis 5.775852 -0.38485 -0.40960 -0.23998 0.14793 0.01995 -0.12768 0.72421 -0.11968 0.50738 W value 0.958792 0.972164 0.980042 0.792880 0.974313 0.978060 0.976035 0.976787 0.977877 0.978780

P (Prob<W) 0.0912 0.3140 0.7299 0.3964 0.5262 0.5499 0.5809 0.6089 0.6496 0.6895 0.1069

0.1218 0.0144

0.0070 0.1449

0.0460 0.0141

0.0365

P (Prob<W) for cumulative

effect

0.0153

第 4 章 正規性の検定

52

Table 10. Influence of number of samples on non-normal distribution of platelet counts of F344 control male rats

at week 104 obtained from 7 toxicity studies Study No. Item 1 2 3 4 5 6 7

Mean±S.D. 611±136 648±137 647±104 797±194 679±125 724±115 733±150 N 41 38 40 37 40 38 41

CV (%) 22 21 16 24 18 16 20 Skewness 1.972014 1.708086 1.290418 0.240257 -1.178269 -1.864571 1.457151 Kurtosis 7.148736 7.770058 4.467973 5.235356 6.786090 8.887765 4.885960 W value 0.787694 0.848761 0.917248 0.869061 0.873100 0.836600 0.850105

P (Prob<W) <0.0001 <0.0001 0.0069 0.0003 0.0002 <0.0001 <0.0001 0.0000

<0.0001 0.0000

<0.0001 <0.0001

P (Prob<W) for cumulative effect

0.0000

5. 正規分布を利用した段階の評価 正規分布は,ガウス(Gauss, 1777~1855)によって発見された分布です.ガウスの活躍は幅広く,純粋数学から

物理,天文学,測地学などに至る.その中の天文学において,天体の位置を測定するときできる誤差から誕生

した分布で,一度は皆さんも受験のとき目にした分布である. ヒトを含めた生物から得られる多くの定量値のデータは,正規分布を示すといわれている.したがって,多

くの正書では,正規性を確認してから群間比較の手法を用いることを奨めている (NTP report, 1997).しかし,

一般的には等分散性の検定のみで正規性は,確認されず分散を利用した解析法で検定しているのが現状である. 正規分布の特性 図 1 に示すように綺麗な釣り鐘状の分布となる. すなわち,[平均値+1.96×標準偏差]~[平均値-1.96×標準偏差]の間にあるのは全体のうちの 95%に相当す

る.同じようにして次のよく使われる数値が得られる. [平均値+1×標準偏差]~[平均値-1×標準偏差]の間にあるのは全体のうちの 68.3% [平均値+3×標準偏差]~[平均値-3×標準偏差]の間にあるのは全体のうちの 99.7%

図 1. 標準正規分布. 正規分布の性質は, (1)y軸に対し左右対称になっている.面積は左半分 0.5,右半分 0.5. (2)平均は,対称軸になっている. (3)平均のところで最も大きな値を持つ. 正規分布の利用 ある 200 点満点の模擬テストを 5000 人に行い,平均 123.5 点,標準偏差 21.3 点を得た.このとき, (1)180 点以上取った学生は何人いるか?

を計算する.変数3.21

5.123-=

ux

00400.0653.23.21

5.123180=+=

-

第 4 章 正規性の検定

53

+2.653 から 0.00400 の計算は,数表 4-4 から 2.653%点に対応する上側確率 0.00400 である. +の場合は以上(180 点)を示す.

数表 4-4. 規準正規分布のパーセント点 両側確率 上側確率 %点

2α α u(α) 0.00001 0.000005 4.417173 0.00002 0.000010 4.264891 0.00003 0.000015 4.173466 0.00004 0.000020 4.107480 0.00005 0.000025 4.055627 0.00006 0.000030 4.012811 0.00007 0.000035 3.976286 0.00008 0.000040 3.944400 0.00009 0.000045 3.916081

0.00010 0.000050 3.890592 0.00020 0.000100 3.719016 0.00030 0.000150 3.615300 0.00040 0.000200 3.540084 0.00050 0.000250 3.480756 0.00060 0.000300 3.431614 0.00070 0.000350 3.389579 0.00080 0.000400 3.352795 0.00090 0.000450 3.320054

0.00100 0.000500 3.290527 0.00200 0.001000 3.090232 0.00300 0.001500 2.967738 0.00400 0.002000 2.878162 0.00500 0.002500 2.807034 0.00600 0.003000 2.747781 0.00700 0.003500 2.696844 0.00800 0.004000 2.652070 0.00900 0.004500 2.612054

0.01000 0.005000 2.575829 0.02000 0.010000 2.326348 0.03000 0.015000 2.170090 0.04000 0.020000 2.053749 0.05000 0.025000 1.959964 0.06000 0.030000 1.880791 0.07000 0.035000 1.811911 0.08000 0.040000 1.750686 0.09000 0.045000 1.695398

0.10000 0.050000 1.644854 0.11000 0.055000 1.598193 0.12000 0.060000 1.554774 0.13000 0.065000 1.514102 0.14000 0.070000 1.475791 0.15000 0.075000 1.439531 0.16000 0.080000 1.405072 0.17000 0.850000 1.372204 0.18000 0.090000 1.340755

0.19000 0.095000 1.310579 0.20000 0.100000 1.281552 0.30000 0.150000 1.036433

第 4 章 正規性の検定

54

0.40000 0.200000 0.841621 0.50000 0.250000 0.674490 0.60000 0.300000 0.524401 0.70000 0.350000 0.385320 0.80000 0.400000 0.253347 0.90000 0.450000 0.125661

1.00000 0.500000 0.000000

両側 5%点は,2α=0.05 に対応する u(α)の列より 1.959964 となる.

したがって,0.00400 となり,5000×0.004=20 人となる.

(2)50 点から 100 点までの間に何人の学生がいるか?

0003000.04507.33.21

5.12350=-=

-

100000.0150000.01033.13.21

5.123100~=-=

-

0.15~0.1 の間は 0.135 とした.

したがって,マイナスの数値は以下を示すので 100 点以下から 50 点以下を引く. 1.35-0.0003=1.3497 となる.5000×0.13497=675 人となる.

第 4 章 正規性の検定

55

5 段階評価 正規分布を利用してあるデータを段階に評価してみる.この手法は,小中学校の成績評価に応用されている

ようである.某本学の成績評価指針(A, B, C および D)に記載されている.ここでは 5 段階評価のための計算

法を手計算にて説明する. 表 11 のデータは,著者が担当していた 2001-2003 年度の「多変量解析/慶大」の実際の試験結果である.2 名

を除外して 100 名に改変した. 表 11. 試験結果

100, 100, 100, 100, 98, 98, 98, 96, 96, 96, 96, 95, 95, 94, 93, 92, 92, 92, 92, 91,90, 90, 90, 90, 90, 89, 88, 87, 86, 86, 86, 86, 84, 84, 84, 84, 84, 83, 82, 82,80, 80, 80, 78, 78, 78, 77, 77, 76, 76, 75, 75, 74, 74, 74, 74, 72, 72, 71, 70,70, 70, 70, 70, 69, 68, 68, 68, 68, 66, 66, 65, 65, 65, 63, 62, 62, 60, 58, 56, 54, 52, 51, 51, 50, 50, 48, 47, 46, 41, 40, 40, 37, 32, 32, 27, 27, 27, 20, 4 SAS JMP による解析結果を下記に示した.

SAS JMP で正規性を吟味した結果,正規性(W=0.919671)は認められなかった(P<0.001).

第 4 章 正規性の検定

56

SAS JMP のヒストグラム結果を参照して下さい.ヒストグラムと曲線のズレはさほど大きいとはいえないが

統計学的には大きなズレがあるようである. Shapiro-Wilk の W 検定では正規性が 0.1%水準で棄却されている.正規性がないということになる. 新村(2000)は,正規分布からの呪縛からの解放の項で「正規分布であれば,平均は分布のよい代表値であり,標準偏差は,データのバラツキを表している.そしてこの 2 つのパラメータで,完全に正規分布は決定される.さらに,歪み度と尖り度は,0 になる.多くのデータを分析すると,特に人が介在するような人文社会学分野で観測される変数は,正規性にならず右に裾を引く様な分布がよく現れる.このような場合,平均値の代わりに中央値,標準偏差の代わりに四分位偏差を用いるべきである.そして歪み度と尖り度でもって,分布の形状が分かる」と述べています.

前述のように正規性の検定法はいくつかあり標本数の変化によっても検定結果が大きく左右される.著者は,

Shapiro-Wilk の W 検定をあまり推奨していない.標本数が増加すると正規性が保たれにくい傾向にある (Kobayashi, 2004).

5 段階評価の結果 正規性を認めた試験得点データの入手は難しいようである.したがって,表 11 データを使用して各段階に評

価(表 12)する. 平均得点 72,標準偏差 21,受験者 100 人.N(72, 212)と表示する.

表 12. 5 段階評価の結果 計算式 点数の範囲 修正点数の範囲 評点 人数 割合(%)

72+1.5×21 102 以上 100 5 4 4 72+0.5×21 101~83 99~83 4 34 34 72-0.5×21 82~62 82~62 3 39 39 72-1.5×21 61~41 61~41 2 13 13

40 以下 40 以下 1 10 10

図 2. 正規分布データを 5 段階評価したときの 各段階に占める割合 表 12 と図 2 を比較するとかなりのズレがある.

(1)83 点以上取った学生は何人いるか?

を計算する.変数21

72-=

ux

300000.05238.021

7283=+=

-

+0.5238 を数表 1 の規準正規分布のパーセント点から 0.3 を導き出す. 100 人×0.3=30 人となる.実際は 38 人となる.非正規性のためと推測する.

第 4 章 正規性の検定

57

附録:分布を利用した検定のための正規分布と等分散検定 一般的には,二標本の t-検定は,正規分布かつ等分散である必要があり,正規分布でも,不等分散の場合に

は,Welch の方法が必要になる.等分散とは各群のヒストグラムの形が似ているものである.等分散の検定に

は,二群間検定の場合は,F 検定が用いられる.三群以上の場合は,Bartlett や Levene の等分散検定がある.

図 3. 2 群とも正規分布で等分散 図 4. 非正規分布で等分散 図 5. 非正規分布で不等分散

正規性の検定(Shapiro-Wilk 検定など)では,データ数が 30 程度は必要である.よって,少数例では正規性の確認ができない.この場合どうするかというと,あまりにせず,t-検定や分散分析を行ってもよいというものと,正規性が確認できない場合には,最初からノンパラメトリック法を使用すべきという学者がいる. 正規分布と等分散との組み合わせを図 3~5に示した.図 3の場合が最も検出力が高く統計解析に適している. 附録;SAS JMP による男女の差の検定:生データは獲得点に対する男女の区別がある.ここでついでに,男

女間の得点差について吟味する.SAS JMP による結果を図 6,表 13 および 表 14 に示した.

図 6. 男女による得点の一元配置分析

得点

0

10

20

30

40

50

60

70

80

90

100

110

F M

男女

ペアごとStudentのt検定 0.05

表 13. 平均と標準偏差 水準 数 平均 標準偏差

F 28 80.0357 13.6775 M 72 69.3611 22.2535

表 14. 検定結果

水準 平均 F A 80.035714 M B 69.361111

同じ文字でつながっていない水準は有意に異なります. 結論:男女間の差 11 点は 5%水準で有意差を認めた.したがって,女性の方が男性に比較して点数が 11 高い

ことになる.

第 4 章 正規性の検定

58

【引用文献および引用資料】

柴田寛三(1970):生物統計学講義,東京農業大学,東京.

椿美智子,椿 広計共訳(2001):医学研究のための統計的方法,pp356-357,サイエンティスト社,東京.

新村秀一(2000):パソコン楽々統計学,pp53,ブルーバックス B-1198,講談社,東京.

野村 護(2002):GLP 試験の日・欧相互承認協定発効に伴う統計解析の問題点,医薬安全性研究会会報,

No. 47, pp41, サイエンティスト社,東京.

武藤眞介(2000):STATISTICA によるデータ解析,朝倉書店,東京.

Conover, W.J. (1999): Practical nonparametric statistics, Third edition, pp450-452, and 550-553. John Wiley & Sons Inc. New York, U.S.A.

Katsumi Kobayashi: Evaluation of toxicity dose levels by cluster analysis, Journal of Toxicological Science, 29, No. 2, 125-129, 2004.

National Toxicology Program (1997): Toxicology and carcinogenesis studies of t-butylhydroquinone, No. 459, pp27, National Institutes of Health (NIH), USA.