80
のののの の GRADE2: のののののののののののの のののの ののののののののののののののののの ののののののののののののののののののののののののののの の 27 ののののの 2016/12/18( の ) ののののののの のののののののの GRADE: のののののののの

GRADE: エビデンスの確実性の評価

Embed Size (px)

Citation preview

Page 1: GRADE: エビデンスの確実性の評価

GRADEの基礎2:エビデンスの確実性の評価

横光健吾公益財団法人たばこ総合研究センター

臨床疫学研究における報告の質向上のための統計学の研究会第 27回研究集会

2016/12/18(土 )「GRADEの基礎と実際:治療法の推奨を極める」

東京医科歯科大学

Page 2: GRADE: エビデンスの確実性の評価

 発表の構成

■ アウトカム毎にエビデンスをまとめる ・アウトカム毎にシステマティックレビュー  (含メタアナリシス) ・アウトカム毎にエビデンスの確実性の評価 ・エビデンスプロファイル作成

  ※  RevMan ・ GRADE pro の使い方

1

Page 3: GRADE: エビデンスの確実性の評価

2

実 施 体 制 実  施  内  容

ガイドライン作成委員会

・ガイドラインパネル編成、プロセス確立・ガイドラインスコープ:患者・臨床医の疑問収集・計画書作成( 1: 疑問の定式化、 2: アウトカム選択、 3: アウトカムの相対的な重要性の判定、 4: 疾患定義・適格基準等)

システマティックレ

ビュー( SR )作成担当者

(プロファイル等の作成は、作成委員会が行う場合もある)

SR 作成

・網羅的な検索 ・適格基準での論文選択・アウトカム毎にデータ収集・アウトカム毎に個々の研究及び研究全般のバイアスのリスクを評価・メタ分析を実施

アウトカム毎にエビデンスの確実性を評価

・研究デザイン: RCT か観察研究・グレードダウン5要因・グレードアップ3要因・アウトカム毎に、エビデンスの確実性  を評価

・エビデンスプロファイルと Summary of Finding 表作成・医療資源(コスト等)に関する資料作成

Page 4: GRADE: エビデンスの確実性の評価

3

実 施 体 制 実  施  内  容

ガイドラインパネル会議

・アウトカムの相対的な重要性の再評価・患者・臨床医の疑問におけるアウトカム全般にわたる エビデンスの確実性

推奨の強さと方向の評価 作成

・推奨決定の4要因

・ Evidence to Recommendation テーブル、 Evidence to Decision テーブルの準備・推奨評価の合意形成

ガイドライン作成委員会

・診療ガイドラインの草案作成・外部評価

診療ガイドライン作成後

・配布と普及・ガイドラインの管理と更新・質の改善と実行

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  29頁を改変

※水色部分が GRADE システム

Page 5: GRADE: エビデンスの確実性の評価

実 施 体 制 実  施  内  容

ガイドライン作成委員会

・ガイドラインパネル編成、プロセス確立・ガイドラインスコープ:患者・臨床医の疑問収集・計画書作成( 1: 疑問の定式化、 2: アウトカム選択、 3: アウトカムの相対的な重要性の判定、 4: 疾患定義・適格基準等)

システマティックレ

ビュー( SR )作成担当者

(プロファイル等の作成は、作成委員会が行う場合もある)

SR 作成

・網羅的な検索 ・適格基準での論文選択・アウトカム毎にデータ収集・アウトカム毎に個々の研究及び研究全般  のバイアスのリスクを評価・メタ分析を実施

アウトカム毎にエビデンスの確実性を評価

・研究デザイン: RCT か観察研究・グレードダウン5要因・グレードアップ3要因・アウトカム毎に、エビデンスの確実性  を評価

・エビデンスプロファイルと Summary of Finding 表作成・医療資源(コスト等)に関する資料作成

4 発表担当箇所(黄色)

Page 6: GRADE: エビデンスの確実性の評価

Clinical Question(CQ)P I C

O

重大

重要

重要でない

987654321

アウトカムの重要性判定

アウトカムごとに SR 作成

Risk of bias summary

Risk of bias graph

Forest Plot

アウトカム毎のエビデンスの確実性評価

Evidence Profile Summary of Findings Table

アウトカム全般のエビデンスの確実性評価

high / modearate / low / very low

Evidence-to-Decision テーブルの作成

推奨の作成

推奨度と推奨文の作成

CPG の完成

【 CPG 作成の流れ】

相原守夫 . GRADE アプローチの概要改変

444

5

Page 7: GRADE: エビデンスの確実性の評価

1. アウトカム毎にエビデンスをまとめる

 エビデンスプロファイルとは…6

エビデンスの確実性を決定する要因の評価( SR を参考に)

その介入の効果( SR )

A

A:最終評価( GRADE)を4段階評価

B

B:アウトカムの重要性

2015 International Consensus on Cardiopulmonary Resuscitation and

Emergency Cardiovascular Care Science With Treatment

Recommendations

Page 8: GRADE: エビデンスの確実性の評価

1. アウトカム毎にエビデンスをまとめる

 エビデンスプロファイルについて7

エビデンスの確実性を決定する要因の評価( SR を参考に)

その介入の効果( SR )

A B

Page 9: GRADE: エビデンスの確実性の評価

1. アウトカム毎にエビデンスをまとめる

■ ガイドラインパネルにおいて、推奨の強さ (強/弱)・方向性(推奨/反対)を決定する。

 最終的には、推奨の決定を行う。そのために…8

    日本歯科保存学会  (2015). う蝕治療ガイドライン第 2 版

推奨の判断に必要な情報を提供するため、エビデンスプロファイルを作成

Page 10: GRADE: エビデンスの確実性の評価

Clinical Question(CQ)

P I C O

重大

重要

重要でない

987654321

アウトカムの重要性判定

アウトカムごとに SR 作成

Risk of bias summary

Risk of bias graph

Forest Plot

アウトカム毎のエビデンスの確実性評価

Evidence Profile Summary of Findings Table

アウトカム全般のエビデンスの確実性評価high / modearate / low / very low

Evidence-to-Decision テーブルの作成

推奨の作成

推奨度と推奨文の作成

CPG の完成

【 CPG 作成の流れ】

相原守夫 . GRADE アプローチの概要改変

9

Page 11: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー 10

実 施 体 制 実  施  内  容

ガイドライン作成委員会

・ガイドラインパネル編成、プロセス確立・ガイドラインスコープ:患者・臨床医の疑問収集・計画書作成( 1: 疑問の定式化、 2: アウトカム選択、 3: アウトカムの相対的な重要性の判定、 4: 疾患定義・適格基準等)

システマティックレ

ビュー( SR )作成担当者

(プロファイル等の作成は、作成委員会が行う場合もある)

SR 作成

・網羅的な検索 ・適格基準での論文選択・アウトカム毎にデータ収集・アウトカム毎に個々の研究及び研究全般のバイアスのリスクを評価・メタ分析を実施

アウトカム毎にエビデンスの確実性を評価

・研究デザイン: RCT か観察研究・グレードダウン5要因・グレードアップ3要因・アウトカム毎に、エビデンスの確実性  を評価

・エビデンスプロファイルと Summary of Finding 表作成・医療資源(コスト等)に関する資料作成

Page 12: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 システマティックレビュー11

■ 疑問を定義する

■ 文献検索を行う

■ 組み入れ基準と除外基準を適用する

■ データの抽出を行う

■ 解析を行う

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  39 頁を改変

Page 13: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 システマティックレビュー15

■ 疑問を定義する   PICO (適格基準の明確化)■ 文献検索を行う  研究論文等の収集■ 組み入れ基準と除外基準を適用する  最終的なレビュー採用文献を決定  (タイトル/アブスト→全文)■ データの抽出を行う  レビュー必要な情報を抽出■ 解析を行う  メタアナリシス、異質性の検定など

アウトカム毎に実施    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  39 頁を改

Page 14: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 アウトカム毎にデータの収集16

癌患者に対する非経口抗凝固薬に関するシステマティックレビュー

著者アウトカム1 アウトカム2 アウトカム3 アウトカム4 アウトカム5 アウトカム6

全死亡率 症候性 VTE 大出血 小出血 QOL 血小板減少

1 Agnelli 2009 ✔ ✔ ✔ ✔

2 Altinbas 2004 ✔ ✔ ✔ ✔

3 Kakkar 2004 ✔ ✔ ✔ ✔

4 Klerk 2005 ✔ ✔ ✔

5 Lebeau 1994 ✔ ✔ ✔ ✔

6 Pelzer 2009 ✔ ✔ ✔

7 Perry 2010 ✔ ✔ ✔

8 Sideras 2006 ✔ ✔ ✔ ✔ ✔

9 Weber 2008 ✔ ✔ ✔Akl et al. (2011) Cochrane Databases Syst Rev. doi:

10.1002/14651858.CD006652.pub2.

Page 15: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 アウトカム毎に解析(効果量等)17

Akl et al. (2011) Cochrane Databases Syst Rev. doi: 10.1002/14651858.CD006652.pub2.

著者アウトカム1 アウトカム3

全死亡率 大出血

1 Agnelli 2009 ✔ ✔

2 Altinbas 2004 ✔ ✔

3 Kakkar 2004 ✔ ✔

4 Klerk 2005 ✔ ✔

5 Lebeau 1994 ✔ ✔

6 Pelzer 2009 ✔ ✔

7 Perry 2010 ✔ ✔

8 Sideras 2006 ✔ ✔

9 Weber 2008 ✔ ✔

Page 16: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 アウトカム毎に解析(出版バイアス等)18

Akl et al. (2011) Cochrane Databases Syst Rev. doi: 10.1002/14651858.CD006652.pub2.

著者アウトカム1 アウトカム3

全死亡率 大出血

1 Agnelli 2009 ✔ ✔

2 Altinbas 2004 ✔ ✔

3 Kakkar 2004 ✔ ✔

4 Klerk 2005 ✔ ✔

5 Lebeau 1994 ✔ ✔

6 Pelzer 2009 ✔ ✔

7 Perry 2010 ✔ ✔

8 Sideras 2006 ✔ ✔

9 Weber 2008 ✔ ✔

Page 17: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 アウトカム毎にデータの収集( risk of bias )19

Akl et al. (2011) Cochrane Databases Syst Rev. doi: 10.1002/14651858.CD006652.pub2.

著者アウトカム1 アウトカム2 アウトカム3 アウトカム4 アウトカム5 アウトカム6

全死亡率 症候性 VTE 大出血 小出血 QOL 血小板減少

Page 18: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  risk of bias ( RCT の場合)について20

Risk of bias 説明 Low risk of bias の例乱数生成( Random sequence generation )

割付が適切に乱数を用いて行われているか?

コンピュータを用いた乱数生成

割付の隠蔽 (Allocation concealment )

患者を組み入れる者が、どの群に属するかを知っているか?(第三者が割付を行っているか?)

中央登録方式の利用

盲検化( Blinding of participants, personnel, and outcome assessment )

患者、評価者、データ解析者が、割付を知っているか?

盲検化されている

不完全なアウトカムデータ(incomplete outcome data)

不完全なアウトカムデータに適切に対処しているか?

欠測値がない適切な欠測値処理

選択的なアウトカムの報告(selective reporting)

事前に設定されたアウトカムが報告されているか?

研究プロトコルと報告内容が一致

その他のバイアス(other bias)

早期に試験を中止、クロスオーバー試験における持ち越し効果、妥当性のないアウトカムの使用

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  43 頁を改変Risk of bias の詳細は、市倉加奈子様の資料に掲載( http://researchmap.jp/index.php?

action=multidatabase_action_main_filedownload&download_flag=1&upload_id=33805&metadata_id=49144 )

Page 19: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  risk of bias ( RCT以外の場合)について21

Page 20: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)22

Page 21: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)23

Page 22: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)24

1

2

Page 23: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)25

Page 24: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)26

1

2

Page 25: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)27

Page 26: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)28

Page 27: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)29

1

2

Page 28: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)30

1

2

Page 29: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)31

1

2

Page 30: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)32

1 2

3

Page 31: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)33

1

2

Page 32: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)34

Page 33: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)35

1

2

Page 34: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)36

Page 35: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)37

1

2

Page 36: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan (効果量等を出すまで)38

Page 37: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan ( risk of bias の評価)39

1

2

Page 38: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan ( risk of bias の評価)40

1 2

Page 39: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan ( risk of bias の評価)41

Page 40: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan ( risk of bias の評価)42

Page 41: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

  RevMan ( risk of bias の評価)43

Page 42: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 アウトカム毎にデータの収集( risk of bias )44

Akl et al. (2011) Cochrane Databases Syst Rev. doi: 10.1002/14651858.CD006652.pub2.

著者アウトカム1 アウトカム2 アウトカム3 アウトカム4 アウトカム5 アウトカム6

全死亡率 症候性 VTE 大出血 小出血 QOL 血小板減少

Page 43: GRADE: エビデンスの確実性の評価

Clinical Question(CQ)

P I C O

重大

重要

重要でない

987654321

アウトカムの重要性判定

アウトカムごとに SR 作成

Risk of bias summary

Risk of bias graph

Forest Plot

アウトカム毎のエビデンスの確実性評価

Evidence Profile Summary of Findings Table

アウトカム全般のエビデンスの確実性評価high / modearate / low / very low

Evidence-to-Decision テーブルの作成

推奨の作成

推奨度と推奨文の作成

CPG の完成

【 CPG 作成の流れ】

相原守夫 . GRADE アプローチの概要改変

45

Page 44: GRADE: エビデンスの確実性の評価

2. アウトカム毎にシステマティックレビュー

 先行研究に関する SR について46

■ 既に同じ臨床疑問に関する、  システマティックレビューがある場合は?   当該の SR が適切に作成され、報告されているかを  PRISMAチェックリスト等を用いて、評価し、活用     相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  39 頁を改変

Page 45: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価 47

実 施 体 制 実  施  内  容

ガイドライン作成委員会

・ガイドラインパネル編成、プロセス確立・ガイドラインスコープ:患者・臨床医の疑問収集・計画書作成( 1: 疑問の定式化、 2: アウトカム選択、 3: アウトカムの相対的な重要性の判定、 4: 疾患定義・適格基準等)

システマティックレ

ビュー( SR )作成担当者

(プロファイル等の作成は、作成委員会が行う場合もある)

SR 作成

・網羅的な検索 ・適格基準での論文選択・アウトカム毎にデータ収集・アウトカム毎に個々の研究及び研究全般のバイアスのリスクを評価・メタ分析を実施

アウトカム毎にエビデンスの確実性を評価

・研究デザイン: RCT か観察研究・グレードダウン5要因・グレードアップ3要因・アウトカム毎に、エビデンスの確実性  を評価

・エビデンスプロファイルと Summary of Finding 表作成・医療資源(コスト等)に関する資料作成

Page 46: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 診療ガイドラインにおける定義 「ある特定の推奨を支持するうえで、  効果推定値に対する確実性が、どの程度十分か」     ※ SR におけるエビデンスの確実性の定義   「ある効果推定値が正しいという確信が、どの程度か」

 エビデンスの確実性について48

GRADE guide 3: Balshem et al. (2011). J of Clin Epi, 64, 401-406.

Page 47: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

 エビデンスの等級について49

エビデンスの確実性

新しい定義 従来の定義

高( High )

真の効果が効果推定値に近いことに大きな確信がある。

今後の研究によって効果推定値に対する確信性が変わる可能性は低い。

中( Moderate )

真の効果が効果推定値に近いと考えられるが、大きく異なる可能性も否めない。

効果推定値に対する確信性に重要な影響が及ぶ可能性が高く、推定値が変わる可能性。

低( Low )

真の効果は効果推定値とは大きく異なるかもしれない。

効果推定値に対する確信性に重要な影響が及ぶ可能性が非常に高く、推定値が変わる可能性。

非常に低( Very low )

真の効果は、効果推定値とは大きく異なるものと考えられる。

あらゆる効果推定値が不確実である。

Page 48: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

 エビデンスの等級付けのための GRADE アプローチ

50

RCT

観察研究

RCT(5 要因 )

GRADE down   

観察研究 (3 要因 )

GRADE up

バイアスのリスク

非一貫性

非直接性

不精確さ

出版バイアス

効果の大きさ

用量反応勾配

交絡因子

G.H. Guyatt et al. / Journal of Clinical Epidemiology 64 (2011) 383-94増澤様のスライド拝借

Page 49: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 研究の限界( risk of bias )■ 結果の非一貫性( inconsistency )■ エビデンスの非直接性( indirectness )■ データの不精確さ( imprecision )■ 出版バイアス( publication bias )

 グレードダウンに関する5つの要因51

ダウン

アップ

Page 50: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 研究に重大な限界がある場合、効果推定値と  その後の推奨における確実性は低くなる  →深刻な限界があると、グレードは下げられる。

■ SR の対象となったそれぞれの研究の risk of bias   を評価し、研究の限界についてグレードの判定 

 グレードダウン:研究の限界52

GRADE guide 4: Guyatt et al. (2011). J of Clin Epi, 64, 407-415.

割付の順番

割付の隠蔽

盲検化

不完全なアウトカム

アウトカム報告バイアス

その他のバイアス

Page 51: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

 グレードダウン:研究の限界53

■ SR の各アウトカム毎に見ていくので、  「この SR の、死亡率のアウトカムに関する  盲検化は、 low RoBである」と評価する。

Page 52: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

 グレードダウン:研究の限界54

R o B 研究全般 解釈 考察 グレード評価

低( Low )

ほとんどの情報が low risk of bias から得られている

深刻に結果を変える可能性はない

明確な限界なし 深刻な限界なし下げない

不明( Uncle

ar )

ほとんどの情報が unclear risk of bias から得られている

結果に疑念を持たせる

* を下げる可能性が低い。

深刻な限界なし下げない

* を下げる可能性がある。

深刻な限界あり1 段階下げる。

高( High )

High risk of bias からの情報の割合は、結果解釈に影響を与えるには十分である

考えられるバイアスは結果の確信を大きく弱める

1 つの基準に重大な限界、多数の基準に何らかの限界があり、 * を下げるには十分。

深刻な限界あり1 段階下げる。

1 つ以上の基準に重大な限界があり、 * を大幅に低くする。

非常に深刻な限界あり2 段階下げる。

* 効果推定値の確信性

Page 53: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

 グレードダウン:研究の限界(事例)55

■ 癌患者に対する非経口抗凝固薬に関する SR■ アウトカムは、死亡率■ 8件の RCT が組み込まれ、(アウトカム測定の)  盲検化は実施されていなかった。また、 1件では     割付の隠蔽が明確ではない。全体的な限界は深刻で      はないことから、 RoB を理由としたグレードダウン  は行われなかった。

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  63 頁Akl et al. (2011) Cochrane Databases Syst Rev. doi:

10.1002/14651858.CD006652.pub2.

Page 54: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

 グレードダウン:研究の限界(事例)56

■ 癌患者に対する非経口抗凝固薬に関する SR■ アウトカムは、 QOL

■ RCT は1件のみであり、盲検化の欠如、 ITT 解析の  の実施が不明。なお患者数は 138名であった。   限界は非常に深刻であり、2グレードダウン。

Risk of bias summary

Study-1

(stopped early for benefit, etc)その他のバイアス

(random sequence generation)割付の順序

(allocation concealment)割付の隠蔽

(incomplete outcome data)不完全なアウトカム

(selective reporting)選択的な報告

(blinding of participants and personnel )参加者と研究者の盲検化

(blinding of data analyst)アウトカム評価者の盲検化

http://aihara.la.coocan.jp/archives/2012/07/12/

Page 55: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 研究の限界の判定を行う際の5原則 ①複数の研究の平均値をとってはならない。 (深刻、非常に深刻、限界を含まない研究が存在) ②推定効果量に対し、各試験の寄与について評価。  ※サンプルサイズとアウトカムイベント数 

③相当な risk of bias が存在することを確認。 ④他の限界と照合したうえで、勘案。 ⑤判断の根拠は明確にする。 (難しい判断について、具体的に説明できる必要)

 グレードダウン:研究の限界57

GRADE guide 4: Guyatt et al. (2011). J of Clin Epi, 64, 407-415.

Page 56: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 結果に関する説明のつかない  異質性( heterogeneity )を指す。

■ 介入効果が各研究で異なる場合に考えられる要因  1)集団(例:重症の集団で効果が高い)  2)介入(例:比較介入が異なる)   3)アウトカム(例:追跡期間が長いほど、効果が減少)  4)研究方法( LRoB と HRoB の RCT間で効果が異なる)          が影響を及ぼしている可能性。 

  ⇒1)~3) 原因となりうる要因について         サブグループ解析  ⇒4) LRoB の研究のみによる効果推定値を算出

 グレードダウン:結果の非一貫性58

GRADE guide 7: Guyatt et al. (2011). J of Clin Epi, 64, 1294-1302.

Page 57: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 非一貫性のグレードダウンの判定を行う際の   4基準   ①点推定値が研究間で異なり、その差異が大きい。 ②各信頼区間の重なりがほとんど、または全くない。 ③異質性検定において、 p<.05で帰無仮説を棄却可。 ④I 2値(点推定値のバラつきの割合)が大きい。

 グレードダウン:結果の非一貫性59

GRADE guide 7: Guyatt et al. (2011). J of Clin Epi, 64, 1294-1302. Higgins & Green (2008) Cochrane Handbook for Systematic Reviews of

Intervention.

30 – 60%:    中程度の異質性50 – 90%:    かなりの異質性75 – 100%:    無視できない異

質性

Page 58: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 癌患者に対する非経口抗凝固薬に関する SR■ アウトカムは、死亡率■ 死亡率に関して、研究間には点推定値のばらつきが  があり、中等度の異質性( I2 = 35% )がある。

 グレードダウン:結果の非一貫性(事例)60

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  68 頁Akl et al. (2011) Cochrane Databases Syst Rev. doi:

10.1002/14651858.CD006652.pub2.

Page 59: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ サブグループ解析において、小細胞肺がんでは RR = 0.85 、その他の進行がんでは  RR = 0.97で、  両者の間には有意差はなかった。

■ 上記から、 1グレードダウンとした。

 グレードダウン:結果の非一貫性(事例)61

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  69 頁Akl et al. (2011) Cochrane Databases Syst Rev. doi:

10.1002/14651858.CD006652.pub2.

Page 60: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 適用可能性( applicability )と同義であり、  以下の4つの非直接性の原因がある。  1)対象集団の差異  (例: CQ は●歳未満だが、研究論文は制限を設けていない)

  2)介入の差異(例:薬剤の用量、用法の違い)  3)アウトカム指標の差異(例:代理アウトカムが使用)  4)間接比較

  ⇒ 代理アウトカムの使用は、 1 段階以上のダウン  ⇒ 間接比較の場合、 1 段階以上のダウン

 グレードダウン:エビデンスの非直接性62

GRADE guide 8: Guyatt et al. (2011). J of Clin Epi, 64, 1303-1310.

Page 61: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 対象集団の差異

鳥インフルエンザに関するガイドラインパネル  質の高い RCT によって、季節性インフルエンザに  対する抗ウィルス療法の有効性が示されている。  季節性インフルエンザの生物学的特徴は、鳥  インフルエンザとは大きく異なることから(鳥  インフルエンザの病原体は季節性と比較して抗  ウィルス剤への反応が著しく悪い)、2グレード  ダウンと判断した。 

 エビデンスの非直接性(事例)63

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  70 頁

Page 62: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 介入の差異

大腸内視鏡検査による大腸癌検診の価値に関する ガイドライン  大腸癌死亡率の減少を示唆する便潜血検査に関する  RCT が見つかるであろう。この場合、非直接性を  理由に1か2段階グレードダウンする判断をする。

シンバスタチンの夜の服用を提案  シンバスタチンの試験により、心血管死亡率の  減少が示されている。これらの試験では朝の服用  が取り上げられている。介入の差異を理由とした  グレードダウンとはならない。 

 エビデンスの非直接性(事例)64

Page 63: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価 65

GRADE guide 8: Guyatt et al. (2011). J of Clin Epi, 64, 1303-1310.

状態 重要なアウトカム 代理アウトカム

糖尿病 糖尿病関連症状、入院、合併症 血統、 A1C

高血圧 心血管死、心筋梗塞、脳卒中 血圧

認知症 患者の機能、行動、介護負担 認知機能検査

骨粗鬆症 骨折 骨密度

ARDS 死亡率 酸素分圧

末期の腎不全 QOL 、罹患率、死亡率 ヘモグロビン

静脈血栓症 症候性静脈血栓症 無症候性静脈血栓症

慢性呼吸器系疾患 QOL 、症状の憎悪、死亡率 肺機能、運動能力

心血管疾患 心筋梗塞、死亡率 冠動脈石灰化、カルシウム代謝

 エビデンスの非直接性(アウトカム指標の差異)

Page 64: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 間接比較とネットワークメタアナリシス A vs B の直接比較は無いが、 A vs C 、 B vs C は  実施されている。

 エビデンスの非直接性(事例)66

土井他 (2016). 臨床心理学, 16, 207 - 218.    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  73 頁

No study treat1 treat2 TE seTE1 Dimidgian et al. (2006a) Control Behavioral Activation -0.95 2.012 Dimidgian et al. (2006a) Control Behavioral Activation -1.28 1.753 Dimidgian et al. (2006a) Control Behavioral Activation 3.91 1.974 Dimidgian et al. (2006b) Control Behavioral Activation 5.73 2.555 Dimidgian et al. (2006b) Control Behavioral Activation 0.38 1.496 Dimidgian et al. (2006b) Control Behavioral Activation 11.14 2.247 Wagner et al. (2007) Control Behavioral Activation with value 9 11.68 Papa et al. (2013) Control Behavioral Activation 8.6 4.179 O'Mahen et al. (2013) Control Behavioral Activation 3.34 0.71

10 Hopko et al. (2003) Control Behavioral Activation 11.1 6.3611 Snarski et al. (2011) Control Behavioral Activation with value 0.36 1.0912 Moore et al. (2013) Control Behavioral Activation with value 1.82 0.1313 Gawrysiak et al. (2009) Control Behavioral Activation with value 6.6 1.4214 Reynolds et al. (2011) Control Behavioral Activation with value -2.49 1.9115 Armento et al. (2012) Control Behavioral Activation with value 2.8 2.3616 Hopko et al. (2011, 2013) Control Behavioral Activation with value -0.4 0.9917 Ekers et al. (2011) Control Behavioral Activation 15.47 4.3218 Chen et al. (2013) Control Behavioral Activation with value 8.91 0.6419 Ly et al. (2014) Control Behavioral Activation 2.05 1.86

Page 65: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ ネットワークメタアナリシスの GRADE 評価 ネットワークメタアナリシスにおける質の高い   エビデンスが認められ、かつ効果サイズが   大きければ、推定値に対する確信は高い。  ・個々の研究の RoB が低く、出版バイアスの可能性が低い。  ・直接比較と間接比較との間で結果が一致していること。                          など

 エビデンスの非直接性(事例)67

Page 66: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ GRADEでは、バイアス(系統誤差)を RoBで、  ランダム誤差をデータの不正確さ、として評価。

■ 信頼区間と最適情報量を基に、不精確さを判断。  以下の基準で評価。  1)信頼区間の上限と下限が、臨床決断の閾値    をまたぐかどうか。  2)最適情報量( optimal information size )    の基準が満たされているか  3)イベント発生率が非常に低くても、    サンプルサイズが非常に大きいか  ⇒ いずれの基準も満たされていない場合、ダウン

 グレードダウン:データの不精確さ68

GRADE guide 6: Guyatt et al. (2011). J of Clin Epi, 64, 1283-1293.

Page 67: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 臨床決断の閾値   抗凝固薬のリスクは、対照群より4%低い。  → 100÷4=25 から、 1名多くの事象発生させるには、    25名を治療する必要がある。 (有害事象発生も含 )

■ 閾値として、治療推奨を提示できる値を -0.10 と   するか、 -0.01 とするかを決め、判断。  

 グレードダウン:データの不精確さ69

Akl et al. (2011) Cochrane Databases Syst Rev. doi: 10.1002/14651858.CD006652.pub2.

Page 68: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 最適情報量 ・ SR に組み込まれた患者総数が、単一の試験のサンプルサイズ計算によって算出された患者数よりも少ない場合、グレードダウンを検討。 ・ OIS算出には、 α エラー( 0.05 )、 β エラー( 0.10 – 0.20 )、現実的な効果の大きさ、対照群でのイベント発生率(中央値 :0.64 など)を設定。

 グレードダウン:データの不精確さ70

GRADE guide 6: Guyatt et al. (2011). J of Clin Epi, 64, 1283-1293.

Page 69: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

1. 小規模研究によってより大きな効果が示されていないかa ファンネルプロットの目視評価b ファンネルプロットの統計学的解析

2. 想定される出版バイアスを復元するa Trim and Fill 法b. フェイルセーフ数の検討

3. 統計学的有意水準に応じた、出版の確立を推定4. 累積メタアナリシスによって、継時的・研究数による効果  サイズの変化を調べる

■ 研究が偏って出版されることが原因で、本来の効果  が系統的に、過小、または課題に評価される。

 グレードダウン:出版バイアス71

GRADE guide 5: Guyatt et al. (2011). J of Clin Epi, 64, 1277-1282.

Page 70: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 研究が1件しかない場合でも、機械的に評価を  下げることは不適切。

■ グレードダウンに関連する5つの要因すべて  を勘案し、評価をする。   

  RCT が1件しかない場合について72

    相原  (2015). 診療ガイドラインのための GRADE システム-第 2 版-  29頁を改変

Page 71: GRADE: エビデンスの確実性の評価

3. アウトカム毎にエビデンスの確実性を評価

■ 効果の程度が大きい( large magnitude of effect )■ 用量反応関係( dose-response gradient )■ 交絡因子のための過小評価( plausible confunders )

※ RCTではエビデンスの確実性は「高」からスタート  なんらかの理由でグレードダウンとなった、確実性   が効果が大きいからといって、アップすることはない  →観察研究においてのみ、該当

 グレードアップに関する3つの要因73

GRADE guide 9: Guyatt et al. (2011). J of Clin Epi, 64, 1311-1316.

Page 72: GRADE: エビデンスの確実性の評価

Clinical Question(CQ)

P I C O

重大

重要

重要でない

987654321

アウトカムの重要性判定

アウトカムごとに SR 作成

Risk of bias summary

Risk of bias graph

Forest Plot

アウトカム毎のエビデンスの確実性評価

Evidence Profile Summary of Findings Table

アウトカム全般のエビデンスの確実性評価high / modearate / low / very low

Evidence-to-Decision テーブルの作成

推奨の作成

推奨度と推奨文の作成

CPG の完成

【 CPG 作成の流れ】

相原守夫 . GRADE アプローチの概要改変

74

Page 73: GRADE: エビデンスの確実性の評価

4. エビデンスプロファイル作成

■ エビデンスプロファイルを作成するツール

  GRADE pro75

https://gradepro.org/

Page 74: GRADE: エビデンスの確実性の評価

4. エビデンスプロファイル作成

  GRADE pro76

https://gradepro.org/

Page 75: GRADE: エビデンスの確実性の評価

4. エビデンスプロファイル作成

  GRADE pro77

https://gradepro.org/

Page 76: GRADE: エビデンスの確実性の評価

4. エビデンスプロファイル作成

  GRADE pro78

https://gradepro.org/

Page 77: GRADE: エビデンスの確実性の評価

4. エビデンスプロファイル作成

  GRADE pro79

https://gradepro.org/

Page 78: GRADE: エビデンスの確実性の評価

4. エビデンスプロファイル作成

  GRADE pro80

https://gradepro.org/

Page 79: GRADE: エビデンスの確実性の評価

4. エビデンスプロファイル作成

  GRADE pro を用いた例81

※グレードダウン等については、根拠を説明する必要がある。

Page 80: GRADE: エビデンスの確実性の評価

Take home messages■ アウトカム毎にエビデンスをまとめる ・アウトカム毎にシステマティックレビュー  (含メタアナリシス) ・アウトカム毎にエビデンスの確実性の評価 ・エビデンスプロファイル作成

  ※  RevMan ・ GRADE pro の使い方

82