159
医薬統計で汎用される検定と 多重比較法 東京理科大学 浜田知久馬 2014/4/3 「医薬統計入門セミナー/第17EXSUSユーザー会」

医薬統計で汎用される検定と 多重比較法 - 株式会社CACクロア...2018/11/17  · 医薬統計で汎用される検定と 多重比較法 東京理科大学 浜田知久馬

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • 医薬統計で汎用される検定と 多重比較法

    東京理科大学

    浜田知久馬

    2014/4/3

    「医薬統計入門セミナー/第17回EXSUSユーザー会」

  • 要旨

    医薬品開発関連の統計業務の経験数年程度の方を想定して,医薬統計で汎用される検定と多重比較法についてチュートリアルを行う.

    複数の検定の組み全体を1つの解析とみなして,全体で誤って有意とする確率を有意水準以下に抑える手法の総称を,多重比較とよび,一元配置型を中心に様々な方法が提案されている.基準群との比較を行なう方法としてDunnett法,全ての群間の対比較を対象としたTukey法等が用いられる.

    分散分析,回帰分析,多重比較の違いを対比(contrast)との関連で解説し,また,EXSUSでの解析についてデモンストレーションを行う.

  • 内容

    基本的な多重比較法

    Bonferroni,Dunnett,Tukey,Scheffe

    DunnettとWilliams

    ノンパラ多重比較 Steel,Steel-Dwass,Shirley-Williams

    対比と最大対比法

    分散分析,回帰分析の対比による表現

  • JPS分散分析使用論文数

    n % n % n % n %

    1-way ANOVA 46 34.3% 75 50.7% 74 55.6% 49 50.5%

    2-way ANOVA 6 4.5% 11 7.4% 11 8.3% 6 6.2%Kruskal-Wallis test 8 6.0% 3 2.0% 5 3.8% 2 2.1%Friedman test 0 0.0% 0 0.0% 1 0.8% 0 0.0%Repeated measures 1-way ANOVA 10 6.8% 4 3.0% 8 8.2%Repeated measures 2-way ANOVA 2 1.4% 8 6.0% 3 3.1%Repeated measures MANOVA0 0.0% 1 0.7% 0 0.0% 0 0.0%

    手法名1996 年

    (n = 134)2002 年

    (n = 148)2007 年

    (n = 133)2012 年

    (n = 97)

    3 2.2%

    JPS : Journal of Pharmacological Sciences

  • 5

    分散分析

    ANOVA: ANalyisis Of VAriance 分散(variance):ばらつきを表す統計用語

    分散分析:データのばらつきを構成する要素が存在

    するときに個々の要素に分解

    二元配置(two-way)分散分析

    例)抗酸化剤(A,B,C),濃度,誤差

    薬剤,時点,誤差

  • 6

    A B C

    バラツキを抗酸化剤(A,B,C),濃度,誤差に分解

  • JPS多重比較使用論文数

    n % n % n % n %

    Dunnett test 49 36.6% 45 30.4% 34 25.6% 21 21.6%

    Williams test 0 0.0% 3 2.0% 2 1.5% 3 3.1%Tukey test 5 3.7% 16 10.8% 21 15.8% 23 23.7%Bonferroni test 5 3.7% 13 8.8% 16 12.0% 16 16.5%Scheffe test 8 6.0% 8 5.4% 9 6.8% 3 3.1%Fisher(P)LSD test 5 3.7% 5 3.4% 13 9.8% 2 2.1%Newman-Keuls test 1 0.7% 4 2.7% 5 3.8% 5 5.2%Duncan test 10 7.5% 2 1.3% 4 3.0% 0 0.0%Steel Dwass test 0 0.0% 0 0.0% 0 0.0% 1 1.0%contrast mean test 0 0.0% 0 0.0% 0 0.0% 2 2.1%

    手法名1996 年

    (n = 134)2002 年

    (n = 148)2007 年

    (n = 133)2012 年

    (n = 97)

  • 8

    検定の結果と2つの誤り 真実

    検定

    結果

    差がない 差がある

    有意差なし

    有意差あり αエラー

    (あわて者の誤り)

    βエラー

    (ぼんやり者の誤り) 正しく判定できた

    正しく判定できた

  • 9

    p値と第1種の過誤α

    • p値:本当は差がないときに,偶然で 差が生じる確率 • 検定:p値

  • 薬剤師国家試験 2013 98回

    問192 薬物治療の効果判定の統計処理に用いられるTukey法に関する記述のうち,正しいのはどれか.2つ選べ.

    1 すべての群の同時対比較を行う検定方法である.

    2 1つの対照群と2つ以上の処理群を比較検定する

    方法である.

    3 分散が等しくないデータの比較検定に適している.

    4 正規分布に従わないデータの比較検定に適している.

    5 パラメトリックなデータの比較検定に適している.

    10

  • 基本的な多重比較法

    正規分布と等分散性が前提

    分散分析:多群全体で差があるか

    Dunnett:対照群との対比較

    Tukey :全ての群間の対比較

    4群における例

    Dunnett:1-2,1-3,1-4

    Tukey :1-2,1-3,1-4,2-3,2-4,3-4

    11

  • 時計を止める超能力

    ユリ・ゲラーが「わたしがTVをご覧のみなさんの

    もとに念を送って,みなさんの手元にある時計を止めて見せます」というのです. たとえば,番組の15分間,彼が念を送りますと番組の視聴者から「TVを見ていたら時計が本当に止

    まってしまった!」という驚きの知らせが番組に何件も寄せられます

    12

    http://nigaoe.hp.infoseek.co.jp/images/urigera.GIF

  • 時計を止める超能力

    13

  • 超能力か?

    1)1つの時計が15分間に止まる可能性は非常に低い.電池の寿命を1年として

    1/(4×24×365)=1/35040

    2)当時視聴率は高かった.

    500万世帯が視て,1世帯に4個時計があるとすると,2000万個の時計が対象

    2000万/3.504万=570個

    が止まる個数の期待値

    14

  • 有料アダルトサイト等の 架空料金請求メール

    あなた様がご利用された当社が運営するアダルト番組の利用料が未納となっています. 未納料金は下記のとおりとなっていますので,○月○○日○時までに下記口座まで,御入金して頂くようお願い申し上げます. 合計お支払い金額:○万円 【振込先口座】○○銀行:○○支店

    速やかに御入金して頂けない場合は,私共から各地域の債権代行関連業者へ債権譲渡を致しますので,最終的に集金専門担当員を御自宅などに訪問をさせて頂きます.その際には上記の合計支払額の約○倍の請求させて頂く場合が御座いますので,お忘れなく必ず御入金して下さい

    15

  • 架空料金請求メール

    請求金額はそれなりに高額 例)10万円

    身に覚えのある人はそれなりに存在

    会社や家族には知られたくない

    莫大な数の人にメールを送付 例)100万人

    詐欺の元ではあまりかからない 例)数100万円

    成功率はかなり低い 例)0.1%

    報酬 10万円× 100万人×0.001=1億円

    十分詐欺ビジネスとして成り立つ

    16

  • 典型的な毒性試験

    ラット(雄)のRBC(赤血球数) 単位(×104/mm3)

    対照群 低用量群 中用量群 高用量群

    平均値 926.0 911.9 891.5 893.0

    標準偏差 25.7 20.1 39.8 35.4

    N 10 10 10 10

    17

    1y

    01.112 t 47.213 t

    36.214 t

    2y

    3y 4y

    自由度36のt分布の5%点:2.03

     

    ij

    ij

    ij

    nns

    yyt

    112

  • 検定の多重性と多重比較 1回の比較あたりの有意水準:5% 3回の比較全体で偶然で 有意差が出る確率:>>5%(12.5%程度)

    検定の多重性(multiplicity):複数の検定を同時に行うことによって,偶然によって有意になる確率が大きくなる現象.

    多重比較(multiple comparison):1回の実験で多数比較を行うとき,実験全体での第Ⅰ種の過誤の確率を有意水準以下に制御しようとする統計手法の総称.

    18

    のいずれかが有意141312 ,, ttt

  • 帰無仮説の下でのp値の累積分布関数 p値:0~1の一様分布

    19 p値

    帰無仮説の下での p値の分布: x以下の値を とる確率:x 例)0.6以下の値を とる確率:0.6

  • 20

    独立な最小p値の分布

    1

    m

    m

    )1()'()(

    )1(1)(

    p

    )(1

    )1(1

    1

    mxmxFxf

    xxF

    m

    m

    確率密度関数:

    分布関数:

    値の分布個の最小

    α未満最小p値が有意つ以上が有意

    αα水準で有意: 

    つ以上が個の独立な検定のうち

  • m個の最小p値の確率密度関数

    21

    1

    2

    3

    4

    5

    m=10 )( pf 1)1()( mpmpf

    p

  • m個の最小p値の累積分布関数

    )( pF

    22

    1

    2

    3 4

    5 m=10

    に近いときが

    Bonferroni

    pm)(

    0

    )1(1)( m

    pF

    p

    Sidak

    ppF

    0.40126

  • αエラーのシミュレーション

    23

      

    =既知,が

    2

    1

    1

    1

    1

    11

    11

    j

    2

    2

    ijij

    ij

    i

    ij

    ij

    ij

    yyyyt

    nn

    nn

    yyt

    yi:標準正規分布(N(0,1))

    tも標準正規分布にしたがう

    シミュレーション回数10万回

  • αエラーのシミュレーション

    24

    1-2群の 比較

    度数 パーセント 累積 度数

    累積 パーセント

    * 5054 5.05 5054 5.05

    ns 94946 94.95 100000 100.00

    1-3群の 比較

    度数 パーセント 累積 度数

    累積 パーセント

    * 4936 4.94 4936 4.94

    ns 95064 95.06 100000 100.00

    1-4群の 比較

    度数 パーセント 累積 度数

    累積 パーセント

    * 5036 5.04 5036 5.04

    ns 94964 94.96 100000 100.00

    いずれかの比較

    度数 パーセント 累積 度数

    累積 パーセント

    * 12551 12.55 12551 12.55

    ns 87449 87.45 100000 100.00

  • 独立性

    の正の相関は+と

    は小さくなる)がたまたま大きいと

    の負の相関はと

    を共通して引くため

    の正の相関)(

    は非独立

    は独立

    0.71

    (

    0.712/1

    5.0

    ,,

    ,,,

    212

    121

    112

    1

    141312

    4321

    yt

    ty

    yt

    y

    ttt

    yyyy

    25

  • 26

    y1 y2 y3 y4 t12 t13 t14 y1 1 -0.00453 -0.00351 -0.0022 -0.70744 -0.70884 -0.70616 y2 -0.00453 1 -0.00476 -0.00644 0.70997 -0.00015 -0.00137 y3 -0.00351 -0.00476 1 -0.00018 -0.00089 0.70785 0.00234 y4 -0.0022 -0.00644 -0.00018 1 -0.003 0.00143 0.70961 t12 -0.70744 0.70997 -0.00089 -0.003 1 0.49909 0.49634 t13 -0.70884 -0.00015 0.70785 0.00143 0.49909 1 0.50046 t14 -0.70616 -0.00137 0.00234 0.70961 0.49634 0.50046 1

    Pearson の相関係数, N = 100000

    変数 N 平均 標準偏差

    y1 100000 -0.00186 0.99762

    y2 100000 0.00289 1.00122

    y3 100000 -0.0007764 0.99621

    y4 100000 -0.00326 1.00252

    t12 100000 0.00336 1.00168

    t13 100000 0.0007669 0.99867

    t14 100000 -0.0009883 1.00118

  • 27

    N=400の場合の散布図

    71.0r

    71.0r

    5.0r

    0r

    y1

    y2

    y3

    t12

    t13

  • 28

    y1 y2 y3 y4 t12 t13 t14 y1 1 0 0 0 -0.71 -0.71 -0.71 y2 0 1 0 0 0.71 0 0 y3 0 0 1 0 0 0.71 0 y4 0 0 0 1 0 0 0.71 t12 -0.71 0.71 0 0 1 0.5 0.5 t13 -0.71 0 0.71 0 0.5 1 0.5 t14 -0.71 0 0 0.71 0.5 0.5 1

    Pearson の相関係数(真値)行列

  • 基本的な多重比較法 A,B,Cの比較

    29

    A

    B

    C

    AB

    AC

    BC

    Tukey:AB,AC,BC

    Dunnett:AB,AC

    Scheffe:AB,AC,BC,A-BC

    A-BC

    m:比較の数

    Bonferroni:p値をm倍

    Sidak:独立性を前提

    に多重性調整

  • Bonferroni (比較の数だけ問題にする)

    ex) 比較3回 対照群 -低用量群a 対照群 -中用量群b

    対照群 -高用量群c a 1 誤りの種類 1 aのみ 4 6 2 bのみ 7

    3 cのみ b c 4 aとb 2 5 3 5 bとc 6 aとc 7 aとbとc 30

  • Bonferroni

    5/3=1.66% aの円の面積

    5/3=1.66% bの円の面積 に制御

    5/3=1.66% cの円の面積

    + + >

    3回比較を行うときは,1回あたりの比較を有意水準5/3%に抑えれば全体での誤りは5%以下になる.

    31

  • Bonferroni の方法

    • Bonferroniの不等式

    – Ei: 正しい帰無仮説H0(i)が誤って棄却される事象

    Pr(Ea∪Eb∪Ec)≦Pr(Ea)+Pr(Eb)+Pr(Ec)

    32

    Type I FWE = Pr(正しい帰無仮説のうち少なくとも1つが誤って棄却される)

    ≦Σi Pr(正しい帰無仮説H0(i)が誤って棄却される) (1)

    Eb Ec

    Ea

  • Bonferroni 比較の回数を増やす場合には,その回数に応じて 1回の比較当たりの有意水準を変化させる. ex) 対照群との比較の他に 低用量ー高用量 中用量ー高用量 この2つの比較にも興味があるものとする.

    比較の回数の合計は5回であるので,1回当たりの比較を1%(5/5)の有意水準で行えばよい.

    Bonferroniは群間でnが異なるような場合にも 正当である. 独立性を前提のSidak法を近似 比較に負の相関があってもよい.

    33

  • Dunnett

    対照群,低用量,中用量,高用量群

    対照群との比較だけを対象にするような場合

    の面積がちょうど5%になるようにする.

    Bonferroniよりも少し有意になりやすい.

    nが等しいことを前提に導かれた方法であるが,最近ではnが等しくない場合の正確な方法(PROBMC関数)および近似法(GLM)が可能である.

    *2群と3群の平均値の差がかなり大きくても,比較の対象外であるので有意といってはならない.

    34

  • Tukey

    すべての対比較を対象とするような場合

    対照群 6つの比較を対象

    低用量群 ○

    中用量群 ○ ○

    高用量群 ○ ○ ○

    対照群 低用量群 中用量群 高用量群

    nが等しくないときの精度が高い近時法として

    Tukey-Kramer法(GLM,PROBMC関数)がある.

    35

  • Scheffe

    群間でnが等しくなくてもよい

    対比較でもよい

    群を併合してもよい

    1群,2群,3群,4群 1群,4群,2群,3群

    群間の対比較のときにScheffeを用いると

    過度に保守的

    36

    対照群 無処置群 5mg群 10mg群 20mg群

  • 多重比較まとめ

    D:Dunnett,T:Tukey,S:Scheffe,B:Bonferroni

    比較の対象数 少 多

    検出力 高 低

    D T S

    nが等しくない時の妥当性 妥当 改良法

    B,S T,D

    37

  • 例 Repeated toxicity study RBC(Red Blood Cell counts)

    group dose raw data mean SD

    Control 0mg 925 917 912 912 949 926.0 25.7

    908 908 989 931 909

    low-dose 1mg 898 925 908 873 908 911.9 20.1

    941 893 920 922 931

    mid-dose 3mg 874 876 916 908 873 891.5 39.8

    807 874 919 952 916

    high-dose 10mg 869 919 874 852 830 893.0 35.4

    906 914 898 933 935

    38

  • RBCデータ

    Vehicle Low Middle High800

    850

    900

    950

    1000 mean±SEM

    Compound

    *# #

    $$

    RBC(×

    10

    4m

    m3)

    926.0 911.9 891.5 893.0

  • Dunnett法の結果

    group y の最小 2 乗平均

    H0:LSMean=Control

    t 値 Pr > |t|

    1 926.000000

    2 911.900000 -1.01 0.6221

    3 891.500000 -2.47 0.0478

    4 893.000000 -2.36 0.0609

    40

  • 他の多重比較法

    proc glm;class group;model y=group;

    lsmeans group /adj=tukey pdiff tdiff;

    run;

    proc glm;class group;model y=group;

    lsmeans group /adj=scheffe pdiff tdiff;

    run;

    proc glm;class group;model y=group;

    lsmeans group /adj=bonferroni pdiff tdiff;

    run;

    41

  • Tukey法 効果 group に対する最小 2 乗平均

    H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t|

    従属変数 : y

    i/j 1 2 3 4

    1 1.01022 2.471815 2.364345

    0.7445 0.0818 0.1025

    2 -1.01022 1.461595 1.354125

    0.7445 0.4706 0.5355

    3 -2.47181 -1.46159 -0.10747

    0.0818 0.4706 0.9995

    4 -2.36434 -1.35412 0.10747

    0.1025 0.5355 0.9995 42

  • GLMのTukey法の結果の図示

    43

    差の信頼区間が対角線と交わらなければ有意

  • Scheffe法 効果 group に対する最小 2 乗平均 H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t|

    従属変数 : y

    i/j 1 2 3 4

    1 1.01022 2.471815 2.364345

    0.7964 0.1261 0.1533

    2 -1.01022 1.461595 1.354125

    0.7964 0.5512 0.6121

    3 -2.47181 -1.46159 -0.10747

    0.1261 0.5512 0.9997

    4 -2.36434 -1.35412 0.10747

    0.1533 0.6121 0.9997 44

  • Bonferroni 効果 group に対する最小 2 乗平均

    H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t|

    従属変数 : y

    i/j 1 2 3 4

    1 1.01022 2.471815 2.364345

    1 0.1098 0.1415

    2 -1.01022 1.461595 1.354125

    1 0.9152 1

    3 -2.47181 -1.46159 -0.10747

    0.1098 0.9152 1

    4 -2.36434 -1.35412 0.10747

    0.1415 1 1 45

  • 各手法の性能比較(全ての対比較)

    data rbc;

    do group=1 to 4;

    do i=1 to 10;

    input y @@;output;end;end;

    cards;

    925 917 912 912 949 908 908 989 931 909

    898 925 908 873 908 941 893 920 922 931

    874 876 916 908 873 807 874 919 952 916

    869 919 874 852 830 906 914 898 933 935

    proc glm;class group;model y=group;

    lsmeans group

    /TDIFF ADJUST=SIMULATE(REPORT SEED=4989);run;

    46

  • 各手法の性能比較(全ての対比較)

    47

    シミュレーション結果

    手法 95% 分位点 (棄却限界値)

    正確なアルファ

    Simulated 2.732637 0.0457

    Tukey 2.693227 0.0500

    Bonferroni 2.791972 0.0398

    Sidak 2.783564 0.0405

    GT-2 2.774853 0.0414

    Scheffe 2.932370 0.0284

    T 2.028094 0.1968

  • 各手法の性能比較(基準群との比較)

    proc glm;

    class group;

    model y=group;

    lsmeans group

    /PDIFF=CONTROL TDIFF

    ADJUST=SIMULATE

    (REPORT SEED=4989);run;

    48

  • 各手法の性能比較(基準群との比較) シミュレーション結果

    手法 95% 分位点

    (棄却限界値) 正確なアルファ

    Simulated 2.472055 0.0478

    Dunnett, two-sided

    2.452127 0.0500

    Bonferroni 2.511040 0.0437

    Sidak 2.503954 0.0444

    GT-2 2.499104 0.0449

    Scheffe 2.932370 0.0158

    T 2.028094 0.1236 49

  • Williams検定の特徴 Dunnett検定の結果(両側5%) 群1 群2 群3 群4 926.0 911.9 891.5* 893.0 Williams検定の特徴 1)どの用量から対照群に比べて有意に変化 しているかを明らかにできる. 2)対立仮説に用量反応関係の単調性を仮定 μ1≧μ2≧μ3≧μ4(少なくとも1つは>) 3)多重性を考慮して第Ⅰ種の過誤を制御 4)下降手順であり,用量の高い群から比較を 行い,有意差がなくなった用量で終了 5)RBCへの適用結果 群3と群4で有意

    50

  • Dunnett検定とWilliams検定の比較

    51

    解析法 Dunnett検定 Williams検定

    想定 用量反応関係が単調・ 非単調

    用量反応関係が単調

    対立仮説 両側と片側が可 本質的に片側(両側はBonferroni 法で,2.5%水準で下側と上側)

    検討内容 対照群とどの群で違いがあるか

    対照群とどの用量から違いがあるか

    適用 対照群 A群 B群 C群 対照群 D1群 D2群 D3群

    αエラー 多重性を考慮して制御 多重性を考慮して制御

    手順 一段階手順 多段階手順(下降手順)

    単調な場合 検出力が低い 検出力が高い

    非単調な場合 解釈しやすい 解釈しにくい

  • Williams検定の統計量

    52

    },,,max{

    ,,

    )1(

    )(

    11

    32

    2

    22

    2

    1

    1 1

    2

    2

    2

    1

    ppppp

    p

    pp

    pp

    p

    pp

    p

    k

    i

    i

    k

    i

    ni

    j

    iij

    ap

    p

    yyyM

    n

    yny

    nn

    ynyny

    n

    yy

    s

    nns

    yMt

      

  • contr

    ol

    low

    mid

    dle

    hig

    h

    0

    20

    40

    60

    80

    100

    %R

    esp

    on

    se

    contr

    ol

    low

    mid

    dle

    hig

    h

    0

    20

    40

    60

    80

    100

    %R

    esp

    on

    se

    Williamsのイメージ(再掲) Williams

    53

    • 反応が単調な場合

    (逐次t検定に等しい)

    • 反応に逆転ありの場合 (逆転部分は平均化する)

    ① ② ③ ①=② ③

  • 検討①down turn(反応の逆転)のない場合

    54

    Δ=1.5を検討

  • 検討①down turn(反応の逆転)のない場合

    55

    • 結果

    Linear Saturated at mid Saturated at low

  • 検討② 弱いdown turn(反応の逆転)のある

    場合

    56

    Δ=1.5を検討

  • 検討② 弱いdown turn(反応の逆転)のある

    場合

    57

    • 結果

    down turn 85% down turn 75% down turn 65%

  • 検討③ 強いdown turn(反応の逆転)のある

    場合

    58

    Δ=1.5を検討

  • 検討③ 強いdown turn(反応の逆転)のある

    場合

    59

    • 結果

    Trapezoid down turn 0% fall

  • ウイリアムス(Williams)検定(WILP)

    SASマクロWILP

    データセット名{data=}, 群数{g=}, 有意水準{a=}, 群を表す変数{group=}, 反応変数{y=},対立仮説の方向{tail= 1:上側 2:下側}

    60

    OBS control group mean adjmean t wp wtc star

    1 926 2 911.9 911.90 1.01022 0.15957 1.68830

    2 926 3 891.5 891.50 2.47181 0.01027 1.76560 *

    3 926 4 893.0 892.25 2.41808 0.01213 1.79073 *

  • 61

  • Downturnデータへの Dunnett法の適用(downturn)

    g y の最小 2 乗平均

    H0:LSMean=Control

    t 値 Pr > |t|

    1 1.26550000

    2 1.08280000 -5.51

  • Downturnデータへの Williams法の適用(下側2.5%)

    63

    OBS control group mean adjmean t wp wtc star

    1 1.2655 2 1.0828 1.08280 5.51187 .000000824 1.67943 *

    2 1.2655 3 1.1492 1.11600 4.51026 .000024164 1.75550 *

    3 1.2655 4 1.1993 1.14377 3.67257 .000341217 1.78015 *

    4 1.2655 5 1.2433 1.16865 2.92186 .003070230 1.79200 *

  • パラメトリック多重比較の前提

    64

    Y

    P群 A群

    μ1

    μ2

    帰無仮説H0: μ1= μ2 = μ3= μ4

    B群 C群

    μ3

    μ4

  • 美女と野獣 パラとノンパラ

    65

  • 美女:名前はBell

    66

    http://www.google.co.jp/url?sa=i&rct=j&q=&esrc=s&frm=1&source=images&cd=&cad=rja&docid=1r0HKBmq-VcwaM&tbnid=Nmg2EroyyHBzOM:&ved=0CAUQjRw&url=http://item.rakuten.co.jp/acomes/34671/&ei=GtxQUZbLPMaVkgXyt4GQDA&bvm=bv.44158598,d.dGI&psig=AFQjCNEzeDC1QRvqVFol_kL_YYlIduBWlA&ust=1364340108593857

  • 野獣:Beast

    67

    Binomial カテゴリカル

    Exponential 指数分布 生存時間

    T 分布 対称だが 尖り大

    Abnormal 異常値

    Skewed 歪んだ分布

    http://www.google.co.jp/url?sa=i&rct=j&q=&esrc=s&frm=1&source=images&cd=&cad=rja&docid=yk7_xRG1eipfFM&tbnid=dg9OfdxOgNll5M:&ved=0CAUQjRw&url=http://www.amazon.co.jp/%E3%83%87%E3%82%A3%E3%82%BA%E3%83%8B%E3%83%BC%E3%83%88%E3%83%A9%E3%83%87%E3%82%A3%E3%82%B7%E3%83%A7%E3%83%B3-%E3%83%87%E3%82%A3%E3%82%BA%E3%83%8B%E3%83%BC%E3%83%88%E3%83%A9%E3%83%87%E3%82%A3%E3%82%B7%E3%83%A7%E3%83%B3-%E7%BE%8E%E5%A5%B3%E3%81%A8%E9%87%8E%E7%8D%A3-%E9%87%8E%E7%8D%A3%E3%81%A8%E3%83%97%E3%83%AA%E3%83%B3%E3%82%B9/dp/B002ZL39KA&ei=tt1QUerPDcq_kgWm1oH4Cw&bvm=bv.44158598,d.dGI&psig=AFQjCNF88c3ehpY4PKQHmsv7ToeqK0im4Q&ust=1364340462569807

  • パラに対応するノンパラの多重比較

    パラ

    ノンパラ

    対照群と の比較

    Dunnett Steel (STEEL)

    群間の 対比較

    Tukey Steel-Dwass (STEELD)

    単調性を前提に 対照群との比較

    Willimas

    (WILP)

    Shirley-Williams (WILN)

    68 ()内:作成マクロ名

  • パラメトリック多重比較

    69

    k

    i

    i

    k

    i

    ni

    j

    iij

    ab

    ab

    knkkk

    n

    n

    n

    yy

    s

    nns

    yyt

    yyykGroup

    yyyGroup

    yyyGroup

    1

    1 1

    2

    2

    2

    ,21

    22,2221

    11,1211

    )1(

    )(

    11

    ,,:

    ,,:2

    ,,:1

      

        

    tを多重比較の数表と比較する.

  • ノンパラメトリック多重比較 Joint-ranking

    70

    k

    i

    i

    k

    i

    ni

    j

    ij

    ab

    ab

    knkkk

    n

    n

    n

    rr

    s

    nns

    rrz

    rrrkGroup

    rrrGroup

    rrrGroup

    1

    1 1

    2

    2

    2

    ,21

    22,2221

    11,1211

    1

    )(

    11

    ,,:

    k,,:2

    ,,:1

      

    変換       順位に    

    群を一緒にして  

    zを自由度無限大の多重比較の数表と比較する.

  • ノンパラメトリック多重比較 Separate-ranking(a-b群比較)

    71

    1

    )()(

    11

    ,,:b

    ,,:a

    1 1

    22

    2

    2

    ,21

    ,21

    ba

    na

    j

    nb

    j

    bjaj

    ab

    ab

    bnbbb

    anaaa

    nn

    rrrr

    s

    nns

    rrz

    rrrGroup

    rrrGroup

      

        順位に変換 

       比較する2群を

    z2はWilcoxon検定のカイ2乗に一致

  • パラ・ノンパラ多重比較の違い

    1)データを全群を一緒にして順位に置き換える.

    (separate rankingでは比較する2群ごとに)

    2)s2を群内分散をプールしたものから , 全分散に置き換える.

    3)自由度を無限大にする.

    (検定統計量を正規近似する)

    72

  • PROBMC関数

    value=probmc(string,c,prob,df,k,); value :計算の結果:累積分布か%点 string :多重比較のタイプの指定 "DUNNETT1":片側Dunnett "DUNNETT2":両側Dunnett "WILLIAMS” : Williams検定 "RANGE" :スチューデント化範囲(Tukey) "MAXMOD":最大絶対値 c :検定統計量の値の指定 prob :下側確率の指定 cとprobのどちらか一方のみを指定, 指定しない方は欠測

    (.) df :自由度の指定, 自由度無限大のときは欠測値(.) k :"DUNNETT1","DUNNETT2"と“WILLIAMS”:g-1 "RANGE"と"MAXMOD" :g parameters:Dunnett型で例数が異なる場合に指定

    73

  • マクロの仕様

    マクロ変数

    %let data=解析対象SASデータセット;

    %let y=反応変数(数値変数);

    %let group=群変数(1から連続した整数値) ;

    %let g=対照群を含めた群の数;

    %let a=有意水準(0~1)

    %let tail=1(上側検定),2(下側検定) tailはマクロS_WILLのみ

    74

  • Steel検定のマクロ %macro STEEL;

    data wil;set &data;

    do i1=1;do i2=i1+1 to &g; pair=compress(i1||i2);

    if &group=1 then output;if &group=i2 then output;

    end;end;

    proc sort data=wil;by pair;

    proc npar1way wilcoxon data=wil noprint;class &group;var &y;

    by pair i1 i2;output out=out ;

    proc summary data=&data;var y;class &group;output out=n n=n;

    proc transpose data=n out=n prefix=n;var n;id &group;

    data n;set n;df=.;

    array n(&g) n1-n&g;array r(&g) r1-r&g;

    do i=1 to &g;r(i)=sqrt(n(i)/(n(i)+n1));end;

    data out;set out;df=.;

    data out;merge out n;by df;

    z=sqrt(_kw_);

    dp=1-probmc('dunnett2',abs(z),.,df,&g-1,of r2--r&g);

    dzc=probmc('dunnett2',.,1-&a,df,&g-1,of r2--r&g);

    proc print data=out; var pair i1 i2 z p2_wil p_kw dp dzc;run; %mend ;

    75

  • Steel-Dwass検定のマクロ %macro STEEL_D;

    data wil;set &data;

    do i1=1 to &g;do i2=i1+1 to &g;

    pair=compress(i1||i2);

    if &group=i1 then output;

    if &group=i2 then output;

    end; end;

    proc sort data=wil;by pair;

    proc npar1way wilcoxon data=wil noprint;

    class &group;var &y;

    by pair i1 i2;output out=out ;

    data out;set out;

    z=sqrt(_kw_);df=.;

    tp=1-probmc('range',abs(z*2**.5),.,df,&g);

    tzc=probmc('range',.,1-&a,df,&g)/2**0.5;

    proc print data=out;

    var pair i1 i2 z p2_wil p_kw tp tzc;run;

    %mend;

    76

  • Steel検定の実行例(STEEL) data test1; do group=1 to 3; do j=1 to 10; input y @@;output; end;end; cards; 50 55 65 63 60 68 69 60 52 49 80 86 74 66 79 81 70 62 60 72 42 48 58 63 62 55 63 60 53 45 ; %let data=test1;%let g=3;%let a=0.05; %let group=group;%let y=y; %STEEL;

    77

  • Steel検定の結果

    PAIR :比較を行う群の対 Z :Z統計量 P_KW :ウイルコクソン検定のp値 P2_WIL:連続修正後のp値 DP :Steel検定のp値 DZC :Steel検定の棄却限界値

    78

    OBS pair i1 i2 z P2_WIL P_KW dp dzc

    1 12 1 2 2.95257 0.00356 0.00315 0.00610 2.21213

    2 13 1 3 1.17567 0.25523 0.23972 0.39282 2.21213

  • Steel-Dwass検定の実行例(STEELD)

    data test2;

    do group=1 to 4;

    do j=1 to 11;

    input y @@;output;end;end;

    cards;

    6.9 7.5 8.5 8.4 8.1 8.7 8.9 8.2 7.8 7.3 6.8

    9.6 9.4 9.5 8.5 9.4 9.9 8.7 8.1 7.8 8.8 .

    5.7 6.4 6.8 7.8 7.6 7.0 7.7 7.5 6.8 5.9 .

    7.6 8.7 8.5 8.5 9.0 9.2 9.3 8.0 7.2 7.9 7.8

    ;

    %let data=test2;%let g=4;%let a=0.05;

    %let group=group;%let y=y;

    %STEEL_D; 79

  • Steel-Dwass検定の結果

    TP :Steel-Dwass検定のp値 TZC :Steel-Dwass検定の棄却限界値

    80

    OBS pair i1 i2 z P2_WIL P_KW tp tzc

    1 12 1 2 2.68023 0.00817 0.00736 0.03696 2.56903

    2 13 1 3 2.54000 0.01225 0.01109 0.05398 2.56903

    3 14 1 4 1.28264 0.21139 0.19962 0.57401 2.56903

    4 23 2 3 3.74608 0.00021 0.00018 0.00103 2.56903

    5 24 2 4 2.04678 0.04427 0.04068 0.17097 2.56903

    6 34 3 4 3.38446 0.00081 0.00071 0.00398 2.56903

  • Shirley-Williams検定の実行例(WILN) data test3; do group=1 to 4; do i=1 to 12; input y @@;output;end;end; cards; 13 23 8 17 25 34 18 26 10 28 18 21 26 22 30 38 15 24 18 11 21 30 31 23 22 10 29 37 22 13 29 28 21 16 21 26 26 34 30 45 17 19 27 18 36 24 25 31 ; %let data=test3;%let g=4;%let group=group; %let y=y; %let a=0.05; %let tail=1; %S_WILL;

    81

  • Shirley-Williams検定の結果

    各ステージの平均順位

    ステージ 群1 群2 群3 群4 2 10.708 14.292 3 15.375 21.167 18.958 4 18.375 25.667 23.083 30.875

    82

    OBS stage control g mean adjmean

    z wp wtc star

    1 2 10.7083 2 14.2917 14.2917 1.24347 0.10685 1.64485

    2 3 15.3750 3 18.9583 20.0625 1.09179 0.16385 1.71619

    3 4 18.3750 4 30.8750 30.8750 2.18990 0.01666 1.73900 *

  • Joint versus Separate ranking

    83

    group

    control 34.6 37.5 53.6 50.0 58.3 29.4 43.3 45.2

    A 46.4 43.5 52.6 55.2 51.7 50.0 57.1 40.0

    B 56.5 57.1 53.3 55.6 72.2 50.0 51.7 47.4

    C 65.0 53.6 61.9 53.6 44.4 72.7 61.5 51.9

    平均 p値

    44.0 Joint Separate

    49.6 0.7327 0.4866

    55.5 0.0859 0.1044

    58.1 0.0155 0.0418

  • 84

    1 2 3 4

    g

    30

    40

    50

    60

    70

    y

    group

    反応 変数

  • Joint vs. Separate ranking

    1) Joint rankingは平均値の差が大きいところで有意になりやすい.

    2) Separate rankingは平均値の差が小さいところで有意になりやすい.

    3) どちらを用いるベキかはコンセンサスはない.

    4) 米国ではノンパラの多重比較はあまり用いられない.

    85

  • 平均値の差のt検定の前提 不偏性(unbiased)

    測定に系統的な偏りがない

    独立性(independence)

    観測値が互いに影響を受けない

    等分散性(homogeneity of variance)

    ばらつきの大きさが一定

    正規性(normality)

    左右対称な山形の分布

    86

  • 平均値の差のt検定の前提

    87 0],[

    ][

    ][

    ),(::

    ),(::

    ,,:

    ,,:2

    ,,:1

    ''

    2

    2

    1

    2

    0

    ,21

    22,2221

    11,1211

    jiij

    ij

    iij

    iij

    ij

    knkkk

    n

    n

    yyCov

    yV

    yE

    NyH

    NyH

    yyykGroup

    yyyGroup

    yyyGroup

    独立性:

    等分散:

    不偏性:

        

  • 前提条件の図示

    88

    Y

    P群 A群

    μ1

    μ2

    帰無仮説H0: μ1= μ2 = μ3= μ4

    B群 C群

    μ3

    μ4

  • 多群比較のt統計量

    89

    散群をプールした群内分

      

        

    ks

    n

    yy

    s

    nns

    yyt

    yyykGroup

    yyyGroup

    yyyGroup

    k

    i

    i

    k

    i

    ni

    j

    iij

    ab

    ab

    knkkk

    n

    n

    :

    )1(

    )(

    11

    ,,:

    ,,:2

    ,,:1

    2

    1

    1 1

    2

    2

    2

    ,21

    22,2221

    11,1211

    yij: 第i群のj番目 の観測値

  • 多群比較(a-b)のt統計量

    90

    abab

    ab

    ba

    ab

    abab

    yy

    nns

    yyt

    nnn

    nns

    yyt

    11

    11

    2

    2

     

    t統計量はnが等しいときは 平均値の差に比例

  • 対比(contrast)とは

    91

    水準で有意を越えるとが

    サンプルサイズ群の平均値

    対比の係数

    対比統計量

    5%1.96

    1

    ,:,

    0:

    1

    2

    1 12

    1

    1

    22

    1

    t

    n

    yy

    s

    iny

    CC

    n

    sC

    yC

    t

    k

    i

    i

    k

    i

    ni

    j

    iij

    ii

    k

    i

    ii

    k

    i i

    i

    k

    i

    ii

    44332211yCyCyCyC

  • 対比:4群の場合

    92

    )(2

    4

    2

    3

    2

    2

    2

    1

    2

    44332211

    4321

    4

    22

    4

    3

    22

    3

    2

    22

    2

    1

    22

    1

    44332211

    CCCCn

    s

    yCyCyCyCt

    nnnnnif

    n

    sC

    n

    sC

    n

    sC

    n

    sC

    yCyCyCyCt

  • 分散についての重要な公式

    93

    nn

    n

    n

    nn

    n

    YYYVYV

    YYV

    YYV

    CCYV

    n

    i

    n

    2

    2

    2

    12

    2

    2

    2

    2

    2

    21

    2222

    21

    222

    21

    22

    ][

    2)1(][

    2][

    ][

    確率変数Y1, Y2, ・・・ ,Ynが互いに独立に

    期待値μ,分散σ2の分布にしたがうとき

  • 対比統計量の分子の期待値と分散

    94

    k

    i i

    i

    k

    i

    ii

    k

    i

    i

    k

    i

    ii

    n

    C

    nC

    nC

    yCVyCVyCV

    CyCE

    1

    22

    2

    22

    2

    1

    22

    1

    2211

    1

    11

    0

  • C1 C2 C3 C4 =-1 0 0 1

    95

    41

    14

    4

    2

    1

    2

    41

    4

    22

    3

    22

    2

    22

    1

    22

    4321

    11

    1001

    001

    nns

    yy

    n

    s

    n

    s

    yy

    n

    s

    n

    s

    n

    s

    n

    s

    yyyyt

  • C1 C2 C3 C4 =-2 0 0 2 対比の係数を定数倍してもZは不変

    96

    41

    14

    4

    2

    1

    2

    41

    4

    22

    3

    22

    2

    22

    1

    22

    4321

    112

    22

    2002

    2002

    nns

    yy

    n

    s

    n

    s

    yy

    n

    s

    n

    s

    n

    s

    n

    s

    yyyyt

  • 対比の係数の例

    ex1) Dunnett法の対比の係数の例

    -1 1 0 0 -1 0 1 0

    -1 0 0 1

    ex2) Tukey法の対比の係数の例

    -1 1 0 0 -1 0 1 0

    -1 0 0 1 0 -1 1 0

    0 -1 0 1 0 0 -1 1

    97

  • 対比統計量tの分布 1)帰無仮説:用量反応なし

    2)対立仮説:用量反応あり

    薬効の大きさに比例するように対比係数Cを

    設定するとμは大きくなる.

    98

    0

    N(0,1)

    平均0,SD1 の正規分布

    μ

    N(μ,1)

    平均0,SD1 の正規分布

  • 最大対比法

    tmax(複数の対比の最大値):検定統計量

    • Robertson(1988):multiple contrast tests

    • 様々な多重比較法を統一的に表現

    Tukey, Dunnett, Max t, Williams (Yoshimura(1997)による分母の拡張)

    Bartholomew(三輪(1997))

    2重修正Williams(三輪(1997))

    • 用量反応パターンの解析

    Hamada(1997)

    99

  • 最大対比法 多重性調整p値 • 複数の対比を同時に評価→多重性 (Scheffe Bonferroni法は過度に保守的) • Max tのp値 積分法 正確な方法 (広津(1989)) • 任意の対比の多重性調整p値の多重積分によ

    る計算(岸本・浜田(1994)) • SAS/MULTTESTを用いたresamplingによる多重

    性調整p値の計算 (Hamada(1997)) • adj=simulate 乱数によるシミュレーション • モンテカルロ積分による最大対比法の棄却限界値の計

    算(西山(2003))

    100

  • 用量相関性検定の各手法と 対比との関連

    帰無仮説 H0:μ 1=μ 2=・・・=μ a

    対立仮説 H1:μ 1≦μ 2≦・・・≦μ a

    (1つの不等号は厳密に成り立つものとする.

    μ 1<μ a 単調減少を検定する場合は,≦ → ≧)

    用量相関性の検定:対立仮説の下で有意にでやすいように検定統計量を工夫

    回帰分析,Max t,ウイリアムス,ヨンキー,累積カイ2乗,コクラン・アミテージ,タローン検定

    101

  • 回帰分析

    proc glm;class group;

    model y=group;

    contrast 'linear' group -3 -1 1 3;

    run;

    102

    対比 自由度 対比平方和

    平均平方 F 値 Pr > F

    linear 1 7128.180 7128.180 7.32 0.0104

  • 最小2乗法による傾きの推定値

    103

    2

    4321

    2

    43211

    4321

    221

    )(

    ]5.1)5(.)5.0()5.1[(

    )(

    ])5.24()5.23()5.22()5.21[(

    5.2 4,3,2,14

    )()()(

    )()()()(

    )(

    )()(

    )(

    )()(

    xx

    yyyyn

    xx

    yyyynb

    nnnnn

    xx

    yxxxxyyxx

    yxxyxxyyxx

    xx

    yxx

    xx

    yyxx

    S

    Sb

    i

    i

    i

    iiiii

    iiiii

    i

    ii

    i

    ii

    XX

    XY

    群の場合

    432213113 yyyCy

  • 回帰分析(regression analysis)

    正規分布と等分散を仮定した方法

    ・例)-3 -1 1 3(等差的),

    -7 -5 -1 13(等比的)

    ・多項式回帰 2次成分(1 -1 -1 1),

    3次成分 (-1 3 -3 1)

    ・単回帰分析はPearsonの相関係数が0であるかを検定することと等価

    ・REG,GLM,CORR,MULTTEST

    104

  • 分散分析,回帰分析,多重比較

    3つの統計手法

    分散分析 Analysis of Variance

    バラツキの大きさを分解

    回帰分析 Regression analysis

    XとYの線形関係のモデル化

    多重比較 Multiple comparison

    多群の比較

    105

  • 6つのt統計量

    106

    効果 group に対する最小 2 乗平均 H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t|

    従属変数 : y i/j 1 2 3 4

    1 1.01022 2.471815 2.364345 0.3191 0.0183* 0.0236*

    2 -1.01022 1.461595 1.354125 0.3191 0.1525 0.1841

    3 -2.47181 -1.46159 -0.10747 0.0183 0.1525 0.915

    4 -2.36434 -1.35412 0.10747 0.0236 0.1841 0.915

  • 分散分析の結果 FA=2.78

    107

    要因 自由度 平方和 平均平方 F 値 Pr > F

    Model 3 8134.20000 2711.40000 2.78 0.0548

    Error 36 35065.40000 974.03889

    Corrected Total

    39 43199.60000

    要因 自由度

    Type I 平方和

    平均平方 F 値 Pr > F

    group 3 8134.200000 2711.400000 2.78 0.0548

  • 回帰分析の結果 FR=7.32

    108

    Dependent Variable: y

    対比 自由度 対比平方和 平均平方 F 値 Pr > F

    linear 1 7128.180000 7128.180000 7.32 0.0104

  • 分散分析,回帰分析,多重比較の関係

    109

    22

    342423141312

    2222

    2

    342423141312

    2

    2

    34

    2

    24

    2

    23

    2

    14

    2

    13

    2

    12

    34

    2423

    141312

    10

    36

    6

    2/)31)1()3((

    )(

    6

    ij

    R

    ijA

    ttttttt

    ttttttF

    ttttttt

    F

    t

    tt

    ttt

    abab

    ab yy

    nns

    yyt

    112

  • 群間平方和の別表現

    110

    2

    43

    2

    42

    2

    32

    2

    41

    2

    31

    2

    21

    434232313121

    2

    4

    2

    3

    2

    2

    2

    1

    4

    1

    24

    1

    24

    1

    2

    4

    1

    24

    1

    2

    4

    1

    24

    1

    2

    )()()(

    )()()(

    222222

    3333

    4)(4

    4/

    )()(

    yyyyyy

    yyyyyy

    yyyyyyyyyyyy

    yyyy

    yyyy

    yy

    yyyyn

    i i

    ii

    i

    i

    i i

    ii

    i

    i

    i

    ii

    次のスライド参照

  • 群間平方和の別表現

    111 434232413121

    2

    4

    2

    3

    2

    2

    2

    1

    2

    4342414

    43

    2

    32313

    4232

    2

    212

    413121

    2

    1

    2

    4321

    24

    1

    222222

    )(

    yyyyyyyyyyyy

    yyyy

    yyyyyyy

    yyyyyyy

    yyyyyyy

    yyyyyyy

    yyyyyi

    i

  • 分散分析,回帰分析, 多重比較の関係

    data ana;

    t12=-1.01022;t13=-2.471815;t14=-2.364345;

    t23=-1.461595;t24=-1.354125;t34=0.10747;

    FA=(t12**2+t13**2+t14**2+t23**2

    +t24**2+t34**2)/6;

    FR=(t12+t13+t14+t23+t24+t34)**2/10;

    proc print round;run;

    112

    OBS t12 t13 t14 t23 t24 t34 FA FR

    1 -1.01 -2.47 -2.36 -1.46 -1.35 0.1 2.78 7.32

  • 対比較と回帰分析

    113

    比較 係数 平均値の差 1-2 -1 1 0 0 14.1 1-3 -1 0 1 0 34.5 1-4 -1 0 0 1 33 2-3 0 -1 1 0 20.4 2-4 0 -1 0 1 18.9 3-4 0 0 -1 1 -1.5 和 -3 -1 1 3 119.4

    Y=a+bX

  • 分散分析,回帰分析, 多重比較の関係

    分散分析:t統計量の2乗和に基づく検定 すべての対比較の重みを同等に評価. 2乗することによって群の間の順序関係を無視 回帰分析:t統計量の和に基づく検定 高い用量群から低い方の平均値を引くという操作

    によって順序関係の情報を利用 Tukey法:t統計量がすべての対比較のうちの最大値

    であることを考慮して多重性の調整 Dunnett法:t統計量が対照群との対比較のうちの 最大値であることを考慮して多重性の調整

    114

    tij 2ijt 2 ijt

    )( ijtMax

    2ijt

    2 ijt

    )( ijtMax

    )( ijtMax

  • 分散分析,回帰分析,多重比較の関係

    tij ),,(

    :

    141312 tttMax

    Dunnett

    )(:

    ),,,,,(: 342423141312

    tpossibleanyMaxScheffe

    ttttttMaxTukey

    2ijt分散分析:

    2 ijt

    回帰分析:

  • ヨンキー(Jonckheere)検定

    ・ノンパラメトリックな傾向性検定

    ・すべての対比較をウイルコクソン検定で行い

    その結果を足し合わせたもの

    ・順位変換したデータについて-3 -1 1 3という対比 に よ っ て 1 次 成 分 を 抽 出 す る ( separate ranking)

    ・ Kendallの相関係数が0であるか検定するのと等価

    ・ CORR,FREQ

    116

    342423141312 zzzzzzz

  • ウイリアムス(Williams)検定

    ・正規分布と等分散性を仮定した方法 ・特徴 1)どの用量から対照群に比べて有意に変化しているかを明

    らかにできる. 2)対立仮説として用量反応関係に単調性を仮定する. 3)多重性を考慮して第1種の過誤が制御できる. 4)下降手順であり,用量の高い群から対照群との比較を行

    い , 有意差がなくなった用量で終了する. ・対照群と高用量の比較 -1 0 0 1 -1 0 1/2 1/2 -1 1/3 1/3 1/3 ・対照群と中用量の比較 -1 0 1 0 -1 1/2 1/2 0 ・対照群と低用量の比較 -1 1 0 0 ・PROBMC関数,MULTTEST(厳密には異なる)

    117

    ),,( 234134114 tttMax

  • Max t

    t1-234 t12-34 t123-4

    -1 1/3 1/3 1/3 -1/2 -1/2 1/2 1/2 -1/3 -1/3 -1/3 1

    1-234群 12-34群 123-4群のt検定

    3つのt統計量の最大値に基づいた検定

    ・用量間のギャップを調べるのに適した方法

    ・IMLの積分のマクロ,MULTTEST

    118

    ),,(: 412334122341 tttMaxtMax

  • 累積カイ(t) 2乗

    t1-234 t12-34 t123-4

    -1 1/3 1/3 1/3 -1/2 -1/2 1/2 1/2 -1/3 -1/3 -1/3 1

    1-234群 12-34群 123-4群のt検定

    ・3つのt統計量の2乗和に基づいた検定

    ・2乗することにより方向性が無視されるので

    本質的に両側検定

    119

    2

    4123

    2

    3412

    2

    2341:t2 ttt乗累積

  • 用量相関性検定間の関係

    tij zij: ウイルコクソン

    2

    4123

    2

    3412

    2

    2341

    412334122341

    :t2

    ),,(:

    ttt

    tttMaxtMax

    乗累積

    ),,(

    :

    234134114 tttMax

    Williams

    2 ijt

    回帰分析:

    2z ij

    ヨンキー検定:

  • 回帰分析

    proc multtest data=rbc ;

    test mean(y);

    class group;

    contrast 'linear' -3 -1 1 3;

    contrast 'reg' -7 -5 -1 13;

    run;

    121

  • 回帰分析

    122

    Contrast Coefficients

    Contrast

    group

    1 2 3 4

    linear Centered -3 -1 1 3

    reg Centered -7 -5 -1 13

    Continuous Variable Tabulations

    Variable group NumObs Mean Standard Deviation

    y 1 10 926.0000 25.6775

    y 2 10 911.9000 20.1243

    y 3 10 891.5000 39.7555

    y 4 10 893.0000 35.3742

    p-Values

    Variable Contrast Raw

    y linear 0.0104

    y reg 0.0426

  • ヨンキー検定(両側検定)

    proc corr kendall;var group y; run;

    proc freq;tables y*group/norow nocol nopercent jt;

    exact jt/mc; run;

    123

    Kendall の tau-b 相関係数, N = 40

    H0: Tau=0 に対する Prob > |tau|

    group y

    group 1 -0.28285

    0.021

  • ヨンキー検定の結果(FREQV8)

    124

    Jonckheere-Terpstra 検定

    統計量 (JT) 284.5000

    Z -2.3087

    片側 Pr < Z 0.0105

    両側 Pr > |Z| 0.0210 正確検定のモンテカルロ推定値

    片側 Pr = |JT|

    推定値 0.0207

    99% 信頼下限 0.0170

    99% 信頼上限 0.0244

    サンプル数 10000

    初期シード 603656001

  • ウイリアムス(Williams)検定

    SASマクロWILP

    データセット名{data=}, 群数{g=}, 有意水準{a=}, 群を表す変数{group=}, 反応変数{y=},対立仮説の方向{tail= 1:上側 2:下側}

    125

    OBS control group mean adjmean t wp wtc star

    1 926 2 911.9 911.90 1.01022 0.15957 1.68830

    2 926 3 891.5 891.50 2.47181 0.01027 1.76560 *

    3 926 4 893.0 892.25 2.41808 0.01213 1.79073 *

  • Max t

    proc multtest data=rbc permutation nsample=10000 seed=4989;

    test mean(y);

    class group;

    contrast '1-234' -3 1 1 1;

    contrast '12-34' -1 -1 1 1;

    contrast '123-4' -1 -1 -1 3;

    126

  • Max t法の実行結果

    127

    p-Values

    Variable Contrast Raw Permutation

    y 1-234 0.0224 0.0548

    y 12-34 0.0104 0.0234

    y 123-4 0.1491 0.3192

  • 用量相関性検定間の関係

    tij zij: ウイルコクソン

    2

    4123

    2

    3412

    2

    2341

    412334122341

    :t2

    ),,(:

    ttt

    tttMaxtMax

    乗累積

    ),,(

    :

    234134114 tttMax

    Williams

    2 ijt

    回帰分析:

    2z ij

    ヨンキー検定:

  • 129

    手法名 統計量 4群の統計量の例 結果(両側)

    分散分析 対比較のtの2乗和 p=0.0548

    回帰分析 対比較のtの和

    p=0.0104

    Tukey すべての対比較の 最大値

    有意差なし

    Dunnett 基準群との対比較の最大値

    1-3有意

    Scheffe 可能な比較のtの 最大値

    有意差なし

    Williams 単調性を前提に対照群との比較

    3群から 有意

    Jonckheere 対比較のウイルコクソンのzの和

    p=0.0210

    Max t 分割t統計量の最大値

    p=0.0245

    累積t2乗 分割t統計量の2乗和

    p=0.0423

    各手法とt(z)統計量との関連

    2

    34

    2

    24

    2

    23

    2

    14

    2

    13

    2

    12 tttttt

    2

    342423141312 )( tttttt

    ),,,,,( 342423141312 ttttttMax

    ),,( 141312 tttMax

    )( tpossibleanyMax

    ),,( 234134114 tttMax

    2

    342423141312 )( zzzzzz

    2

    4123

    2

    3412

    2

    2341 ttt

    ),,( 412334122341 tttMax

  • 対比の係数の設定法

    130

    13,1,5,7

    5.6,5.0,5.2,5.3

    5.3,10,3,1,0

    ,,,,,,

    /,0

    ,,,,,,

    4321

    4321

    4321

    121

    2121

    CCCC

    CCCC

    CCC

    kC

    CCC

    kk

    ii

    kk

  • 対比の係数の設定法

    131

    0 1 3 10

    C4=13

    μ

    C3=-1

    C2=-5

    C1=-7

  • 期待値を最大にする対比

    132

    kk

    iiii

    i

    iii

    i

    iiii

    CCC

    CCdC

    dS

    CCS

    C

    CYCE

    ,,,,,,

    2,02

    )1(

    1

    ,

    2121

    2

    2

    の制約付での最大化

  • 結果を得た後で,最大の対比

    133 kk

    iiii

    i

    iii

    i

    ii

    YYYCCC

    CYCYdC

    dS

    CYCS

    C

    YC

    ,,,,,,

    2,02

    )1(

    1

    2121

    2

    2

    の制約付での最大化

  • 結果を得た後で,最大の対比

    134

    2

    2

    )(

    )(

    )()(

    )(

    YYYC

    YY

    YYYY

    YYYYC

    YYC

    iii

    i

    ii

    iiii

    ii

  • 適合度

    135

    100%

    )(

    )(2

    適合度は

    のとき

    適合度=

    いは群間平方和を越えな

    YYC

    YY

    YC

    YC

    ii

    i

    ii

    ii

  • Scheffe の方法 検定統計量

    • 検定統計量F

    • 全ての対比 ci=(C1,C2, ... ,Ca) について

    F≧F(φA,φE,α) のとき棄却

    • シュワルツ(Schwarz)の不等式

    136

    1,

    1

    2

    2

    1

    knCV

    yCF Ak

    i iiE

    A

    k

    i ii

    k

    i

    i

    k

    i

    i

    k

    i

    ii

    kk

    tsts

    tttsss

    1

    2

    1

    2

    2

    1

    2121 ...,,,;...,,, 任意の実数

  • Maximum Contrast Method Example of contrast

    control low-dose mid-dose high-dose

    (a) -3 -1 1 3 linear

    (b) -5 -1 3 3 m-end

    (c) -3 1 1 1 l-end

    (d) -7 -5 -1 13 exp

    (e) -3 -3 1 5 m-start

    (f ) -1 -1 -1 3 h-start

    137

  • Maximum Contrast Method Example of contrast

    -3 -1 1 3 -5 -1 3 3 -3 1 1 1

    138

    (a) linear (b) m-end (c) l-end

  • Maximum Contrast Method Example of contrast

    139

    -7 -5 -1 13 -3 -3 1 5 -1 -1 -1 3 (d)exp (e)m-start (f) h-start

  • GLMのプログラム proc glm data=rbc outstat=out;class group; model y=group/ss1; contrast 'linear' group -3 -1 1 3; contrast 'reg' group -7 -5 -1 13; contrast 'l-end' group -3 1 1 1; contrast 'm-end' group -5 -1 3 3; contrast 'm-start' group -3 -3 1 5; contrast 'h-start' group -1 -1 -1 3; data out;set out;retain ssb 0;drop ss; If _source_=‘group‘ then ssb=ss; percent=ss*100/ssb; proc print;run;

    140

  • 調整しない解析結果 MF(model Fitness)=Z2/(F×DF)

    141

    OBS _NAME_ _SOURCE_ DF F (Z2) PROB ssb Percent

    (MF)

    1 y ERROR 36 . . 0.0 .

    2 y group 3 2.78367 0.05476 8134.2 100.000

    3 y linear 1 7.31817 0.01036 8134.2 87.632

    4 y reg 1 4.41696 0.04265 8134.2 52.891

    5 y m-end 1 8.28195 0.00669 8134.2 99.173

    6 y m-start 1 5.76602 0.02163 8134.2 69.046

    7 y h-start 1 2.17322 0.14912 8134.2 26.023

  • MULTTESTのプログラム

    proc multtest data=rbc out=out permutation nsample=10000 seed=4989;

    test mean(y);class group;

    contrast 'linear' -3 -1 1 3;

    contrast 'reg' -7 -5 -1 13;

    contrast 'l-end' -3 1 1 1;

    contrast 'm-end' -5 -1 3 3;

    contrast 'm-start' -3 -3 1 5;

    contrast 'h-start' -1 -1 -1 3;

    proc print;run;

    142

  • MULTTESTの実行結果

    143

    OBS _test_ _var_ _contrast_

    _value_ _se_ _nval_

    raw_p perm_p sim_se

    1 MEAN y linear -4776 1765.48 36 0.01036 0.0249 .001558204

    2 MEAN y reg -12960 6166.56 36 0.04265 0.0975 .002966374

    3 MEAN y l-end -3264 1367.54 36 0.02237 0.0551 .002281753

    4 MEAN y m-end -7536 2618.63 36 0.00669 0.0159 .001250887

    5 MEAN y m-start

    -6288 2618.63 36 0.02163 0.0533 .002246311

    6 MEAN y h-start -2016 1367.54 36 0.14912 0.3089 .004620398

  • MIXEDによる最大対比法

    proc mixed data=rbc; class group;

    model y=group;

    lsmestimate group

    'linear' -3 -1 1 3,

    'reg' -7 -5 -1 13,

    'l-end' -3 1 1 1,

    'm-end' -5 -1 3 3,

    'm-start' -3 -3 1 5,

    'h-start' -1 -1 -1 3

    / adjust=simulate(seed=4989);run; 144

  • MIXEDによる最大対比法 Least Squares Means Estimates Adjustment for Multiplicity: Simulated

    効果 ラベル 推定値 標準誤差

    自由度

    t 値 Pr > |t| 調整済 P

    group linear -119.40 44.1370 36 -2.71 0.0104 0.0308

    group reg -324.00 154.16 36 -2.10 0.0426 0.1087

    group l-end -81.6000 34.1884 36 -2.39 0.0224 0.0596

    group m-end -188.40 65.4658 36 -2.88 0.0067 0.0209

    group m-start -157.20 65.4658 36 -2.40 0.0216 0.0570

    group h-start -50.4000 34.1884 36 -1.47 0.1491 0.3150 145

  • Maximum Contrast:m-end Perm-p=0.0177 MF=99.2%

    146

  • 3群の場合

    147

    -2 1 1

    -1 0 1

    -1 -1 2

  • 完全に直線の場合

    148

    1 2 3

    g

    2

    4

    6

    8

    y

    Source DF Type III SS F Value Pr > F g 2 40.0 20.0 8.00 0.0062 Contrast DF Contrast SS F Value Pr > F linear 1 40.0 40.0 16.00 0.0018 quadratic 1 0.0 0.00 0.00 1.0000

    100%040

    40

    (MF)

    適合率

    (-1,2,-1): 2次の対比

    02

    2

    22

    321

    312

    31131

    YYY

    YYY

    YYYYY

  • 曲線的な関係がある場合

    149

    1 2 3

    g

    2

    4

    6

    8

    10

    y

    Source DF Type III SS F Value Pr > F g 2 93.3 18.7 0.0002 Contrast DF Contrast SS F Value Pr > F linear 1 40.0 16.0 0.0018 quadratic 1 53.3 21.3 0.0006

    43%53.340

    40

    (MF)

    適合率

    02

    2

    321

    312

    YYY

    YYY

  • 150

    降圧薬の実験データ

    1 対照群 187 160 197 232 218 186 168 156 188 187

    2 B 168 170 181 176 182 154 191 155 159 150

    3 A 195 207 178 137 176 144 123 138 156 153

    4 A+B 129 138 159 149 155 130 113 126 94 133

    群 対照群 B A A+B

    平均 188 161 169 133

    SD 24 27 14 20

  • 1 対照群 2 B群 3 A群 4 A+B群

    一元配置分散分析 全体の平方和 32801.9 群間の平方和 15796.1 群内の平方和 17005.8 45.162y

    187.9

    160.7 168.6

    132.6

    151

  • 二元配置のモデル μ:母平均 α:薬剤A β:薬剤B

    Y1=μ Y2=μ+β

    Y3=μ+α

    Y4=μ+α+β

    t12

    t34

    t13 t24 t23

    t14 α α

    β

    β

    152

  • 二元配置のモデル

    Y1=μ Y2=μ+β

    Y3=μ+α

    Y4=μ+α+β

    t12(2.80)

    t34(3.70)

    t13(1.99) t23 t14

    t24(2.89)

    153

  • 二元配置の分散分析表

    要因 自由度 平方和 平均平方

    F 値 Pr > F

    A 1 5616.90 5616.90 11.89 0.0015

    B 1 9985.60 9985.60 21.14

  • αの推定 検定は(t0-A+tB-AB)/2

    2

    )()( 0

    0

    4

    3

    2

    01

    BABA

    BABA

    AB

    A

    B

    YYYY

    YYYY

    YY

    YY

    YY

    YY

    155

  • βの推定 検定は(t0-B+tA-AB)/2

    2

    )()( 0

    0

    4

    3

    2

    01

    AABB

    AABB

    AB

    A

    B

    YYYY

    YYYY

    YY

    YY

    YY

    YY

    156

  • 交互作用を含む場合,αβの推定 検定は(tB-AB –t0-A)/2 = (tA-AB-t0-B)/2

    Aの有無によるBの効果の差

    )()(

    )(

    0

    0

    4

    3

    2

    01

    YYYY

    YYYY

    YY

    YY

    YY

    YY

    ABAB

    ABAB

    AB

    A

    B

    157

  • Fとt統計量

    15.113

    41.014.2189.11

    3

    41.02

    )80.270.3(

    2

    )(

    2

    )99.189.2(

    2

    )(

    14.212

    )70.380.2(

    2

    )(

    89.112

    )89.299.1(

    2

    )(

    22

    0

    22

    0

    22

    0

    22

    0

    BABA

    BABA

    AABBBA

    ABABB

    ABBAA

    FFFF

    tt

    ttF

    ttF

    ttF

    158

  • まとめ

    2

    )(

    2

    )(

    2

    )(

    2

    )(

    3

    6

    2

    1234

    2

    1324

    2

    3412

    2

    2413

    2

    34

    2

    24

    2

    23

    2

    14

    2

    13

    2

    12

    ttttF

    ttF

    ttF

    FFF

    ttttttF

    BA

    B

    A

    BABA

    159

    t13 t24

    t12

    t34

    1Y 2Y

    3Y 4Y