Upload
naomi-kawashima
View
4.495
Download
2
Embed Size (px)
DESCRIPTION
データマイニング+WEB第36回 国立病院機構における診療情報分析
Citation preview
国立病院機構における診療情報分析
川島 直美
1
自己紹介 • 川島直美です
– (独)国立病院機構 本部 総合研究センター 診療情報分析部 システム開発専門職
• 情報処理学会誌 デジタルプラクティス
特集「ヘルスケアの現場を支えるIT」 『国立病院機構における診療情報分析 システムについて ―構築と運用に関する現状と課題―』
2
今日のお話 1. 診療情報分析部について
2. 収集データの処理
3. 処理によって得られた効果
4. 時間があれば… 個人情報の取り扱いについて
3
1. 診療情報分析部
4
診療情報分析部 since 2010
• 機構143病院の診療データを収集・分析 –医療の可視化・比較 –医療の質の向上・均てん化への貢献
5
MIA Medical Information Analysis databank
• データ収集基盤 –テキストファイル収集・RDB化 – SQLで自由分析
6
Oracle
MIA収集データ • 業務で作成するデータを二次利用
1. DPC調査データ
Diagnosis Procedure Combination
2. レセプトデータ
7
MIA収集データ 1.DPC調査データ
• DPC/PDPS参加病院に提出義務 Diagnosis Procedure Combination/Per-Diem Payment System
–タブ区切り行列 –体系的なコードの記載 –曖昧なデータにはペナルティ
\リッチで正確、分析しやすいデータ/
でも作成病院が少ない 機構57/全国1500+
8
• の前に日本の健康保険制度のおさらい 治療
一部支払い
2.レセプトデータ (診療報酬明細書)
9
被保険者 (みなさんのこと) 医療機関
審査支払機関 保険者 (健康保険組合等)
治療明細提出 審査・残額支払 保険料納付
請求
残額支払
MIA収集データ 2.レセプトデータ(診療報酬明細書)
• 保険診療をする全医療機関が月一作成
二次利用は念頭にない仕様 orz...
– 請求用の一意なだけのコード – 行列ではないCSV – 審査の都合で… でも作成病院が多い 機構143/全国8万+
10
2. 収集データの処理 レセプトデータとの戦い
11
レセプトデータとの戦い 1. 請求用コード
–体系的なコードに変換しよう!
2. 行列ではないCSV –成形しよう!
3. 審査の都合で…
–どうしよう!
12
レセプトデータとの戦い 1. 請求用コード
–体系的なコードに変換しよう!
2. 行列ではないCSV –成形しよう!
3. 審査の都合で… –どうしよう!
13
レセプトデータって 2011年度から原則電子運用
こころの目で見ると…
14
社会保険診療報酬支払基金WEBサイトより抜粋
IR,1,13,1,9999905,,サンプル医科病院,42405,00,03-9999-9999 RE,61,1119,42404,サンプル 61,1,3160927,,4240124,,,,,sample-ika-061,,,,,,,,14,,,,,,,,,,,,,, HO,06132013,1234567,61,7,16794,,20,13150,,,44400,,, SY,4319018,4240124,1,,,01, SY,8839792,4240124,1,,,, SY,8120005,4240124,1,8002,,, … IY,21,1,613330003,3,,3,,,,,,,,,,1,1,1,,,,,,,,,,,,,,,,,,,,,,,,, IY,,1,620002332,1,4,3,,,,,,,,,,1,1,1,,,,,,,,,,,,,,,,,,,,,,,… CO,90,1,840000013,240407 SI,90,1,190118610,,,7,,,,,,,1,1,1,1,1,1,1,,,,,,,,,,,,,,,,,,…
レセプトデータとの戦い 請求用コード
• 請求用マスタで日本語に翻訳
15
請求用マスタ レセプト電算処理コード/印字例 診療行為 160020910 中性脂肪(検査) 特定器材 700080000 四ツ切(レントゲンフィルム) 医薬品 610444041 ガスターD錠10mg 傷病名 0703025 C型慢性肝炎 修飾語 8002 の疑い コメント 840000013 退 院 年 月 日
体系的な コードへ
体系的なコードに変換しよう! 薬剤(約20,000種)
• 様々な薬品のためのコード –薬価基準収載医薬品コード – HOTコード – JANコード
• 何をもって1種類の薬? – 薬効(解熱鎮静剤/血圧降下剤…) – 剤形(飲み薬/注射/塗り薬…) – 製造元(先発メーカー/後発メーカー…)
16
体系的なコードに変換しよう! 例えば薬価基準収載医薬品コード
2 3 2 5 0 0 3 F 3 0 3 5 • 2*:個々の器官系医薬品 • 23*:消化器官用薬 • 232*:消化性潰瘍剤 • 2325*:H2遮断剤 • 2325003*:ファモチジン • 2325003F*:の、飲み薬 • 2325003F3035:アステラス製薬のガスターD錠10mg
17
IY,21,1,610444041,3,3,2,,,,,…
任意の粒度で集計・分析
ガスターD錠10mg
体系的なコードに変換しよう 傷病名コード(約25,000種)
• 世界的な傷病統計用コード – ICDコード
International Statistical Classification of Diseases and Related Health Problems 疾病及び関連保健問題の国際統計分類
18
体系的なコードに変換しよう ICDコード
C161
• C*:新生物 • C16*:胃の悪性新生物 • C161:胃の悪性新生物, 胃底部
19
SY,1513002,4240124,1,8002,,,
胃底部癌
任意の粒度で集計・分析
体系的なコードに変換したいのに 未コード化傷病名
• マスタは全病名を網羅してはいない –新種の病気 –何とも診断がつかない状態
不明コード+テキスト病名
入力時に検索できてない 20
SY,0000999,4240124,1,,二型糖尿病,,
『2500015 2型糖尿病』では?
体系的なコードに変換しよう! テキスト病名で集計はしたくない
• DPC調査データの病名欄 –診断病名 + ICDコード
21
DPC調査データ ICD 病名
E119 2型糖尿病 E119 II型糖尿病 E119 二型糖尿病 E119 糖尿病(2型) E119 インスリン非依存性糖尿病
レセプトデータ 病名 ICD
2型糖尿病 NULL 二型糖尿病 NULL 2型糖尿病合併症なし NULL
E119 E119
医師の知見を利用
レセプトデータとの戦い 1. 請求用コード
–体系的なコードに変換しよう!
2. 行列ではないCSV –成形しよう!
3. 審査の都合で… –どうしよう!
22
成形しよう! 記載の省略 -最低限記載主義-
埋める!
23
IY,21,1,620004915,1,,… IY, ,1,620003619,1,,… IY, ,1,620000167,1,,… IY, ,1,610443053,1,,… IY, ,1,620002429,1,15,…
21 21 21 21
成形しよう! 行ごとに異なる種類の情報
テーブル化!
24
RE,61,1119,42404,サンプル 61,1,3160927… HO,06132013,1234567,61,7,16794,,20,… SY,4319018,4240124,1,,,01, SY,8839792,4240124,1,,,, … SI,13,1,180016110,,250,1,,,,,,,,,,,,,1,,,,,,,,,,,… IY,21,1,613330003,3,3,2,,,,,,,,1,1,,,,,,,,,,,,,,,…
医療行為 病院ID 患者ID 診療月 医療行為
プロフィール 病院ID 患者ID 診療月 生年月日 性別
病名 病院ID 患者ID 診療月 病名
成形しよう! 1日の情報、2日の情報、3日の情報…31日の情報
縦積み! 25
IY,21,1,620004915,1,,11,,,,,,,1,1,1,1,1,1,5… IY,,1,620003619,1,,11,,,,,,,1,1,1,1,1,1,5… IY,,1,620000167,1,,11,,,,,,,1,1,1,1,1,1,5…
1日の情報
2日の情報
3日の情報
実施日 医療行為 数 2014/04/01 620004915 1 2014/04/02 620004915 1 2014/04/03 620004915 1
… 620004915 … 2014/04/07 620004915 5
成形しよう! だんだん集計できそうになってきたけど…
• 集計の単位は何? –のべ人月? –ユニーク患者数?
• 医療者が知りたいのは症例数
–発症/治療開始~治癒/治療終了 –便宜上、入院~退院
26
成形しよう! 1入院1レコード化
入退院日を抽出してソート
27
RE,1,1115,42604,国病太郎,1,358311,,4260225,… … CO,90,1,840000013,260301 CO,,1,840000014,260305
病院ID 患者ID 入院日 退院日 123456789 000000123 2014/02/25 2014/03/01 123456789 000000123 2014/03/05 NULL 123456789 000000246 2014/03/01 2014/03/04 123456789 000000482 2014/03/05 2014/03/07
和暦→西暦へ
レセプトデータとの戦い 1. 請求用コード
–体系的なコードに変換しよう!
2. 行列ではないCSV –成形しよう!
3. 審査の都合で… –どうしよう!
28
どうしよう! 病名の記載多すぎ
• 病名/医療行為の整合性審査 –その病名の患者にそれをすべきだったか?
• 病名別 入院患者数 上位
–高血圧症 –高脂血症 –糖尿病 –便秘症 –不眠症
29
これらの治療のための 入院ではないはず!
どうしよう! 主傷病欄は助けてくれない
• あることにはある『主傷病』欄
–1つも主傷病を持たない患者 –何十個も主傷病を持つ患者
別に重みづけは審査に関係ないし… 30
オンライン又は光ディスク等による請求に係る記録条件仕様(医科用)より抜粋
どうしよう! どうしよう
お医者さんに聞きました 『メインの病名から順に書くよ』 • 一番上の病名を暫定主病名とする
#発症順に書いてる人もいるよなー • 機械学習する?
–医療行為+記載病名 31
どうしよう! 主病名が選べても…
• 様々な患者状態像 –重症/軽症 –初期/末期 –急性期/慢性期 –一時的/永続的 –初発/再発 –手術あり/なし –合併症あり/なし
32
混ぜたら 比較出来ない
どうしよう! 解決策1 丁寧な患者抽出ロジックで集団を捕捉
• 学会の治療ガイドライン • 専門医の知見
–重症/軽症 •この病気の重症者に投与される注射薬は?
–急性期/慢性期 •この病気で手術ありということは急性期?
33
どうしよう! 解決策2 診断群分類でグループ化
• 診断群分類 –メインの病名と手術・処置の組合せ
入院患者を重複なく1,500種+に分類
34
胃がん
手術なし 処置なし
合併症なし
合併症あり 処置あり
手術あり 処置なし
3. 処理によって得られた効果 戦いの果てに…
35
コード変換、成形による効果 各種統計との比較
• DPC導入の影響評価に関する調査 –国病以外の病院との比較
• 国勢調査/患者調査 –地域の推計患者数
• 将来推計人口 –将来推計患者数
36
平成24年度 診療機能分析レポートより抜粋 推計患者数におけるシェア
丁寧な抽出ロジックによる効果 病院横断的比較
• 臨床評価指標 –医療の質を定量的に評価
37
平成24年度医療の質の評価・公表推進事業に おける臨床評価指標より抜粋
終わりに データとの戦いは続く
• データの二次利用 = ゴミ箱あさり –綺麗なゴミを捨てて下さいとは言えず…
• ゴミの山 = 宝の山 –磨けば光ると信じて
• JSON化+Riak実験中 – GitHub kuenishi/meddatum/src/rezept_parser.erl
38
ありがとうございました
39