12
光田醫學雜誌�� �� �� 31 以資料探勘技術建立ICD-9-CM編碼決策系統 陳鎮揮 1 楊鎮嘉 2* 吳效文 1 光田醫療社團法人光田綜合醫院 資訊室 1 管理中心 2 目的:本研究之目是利用資料探勘的技術,嘗試找出潛藏在診斷碼資料庫中症狀、疾病處置碼 和診斷碼三者之關係,並探討如何利用可能的醫囑來推論診斷碼與手術碼 方法:本研究分析某區域醫院於91年至94年出院案件資料共58,507件作為研究的資料來源。再 利用關聯式規則之方式找出醫囑與疾病分類代碼出現的機率值,分析其住院期間診斷碼、手術 碼與執行的醫囑之間所隱含的關聯資訊。 結果:系統整體平均約2.5分鐘將可推論一件出院案件,本系統決策的醫囑與案件實際產生的 醫囑碼進行比對,結果發現本系統之正確率為72.8%結論:本系統分析、歸納、統計疾病診斷碼╱手術碼及醫囑各自隱含的資訊,正確地由診斷碼 ╱手術碼進行醫囑之推論,以輔助醫師決策醫囑,並對其進行異常檢查以確定醫囑的正確性。 關鍵字:ICD-9-CM,資料探勘,決策支援系統,醫囑 *通訊作者 收件日期:200818日;接受日期:2008218原著研究

以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����30 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 31

以資料探勘技術建立ICD-9-CM編碼決策系統陳鎮揮1��楊鎮嘉2*��吳效文1

光田醫療社團法人光田綜合醫院�資訊室1�管理中心2

摘��要

目的:本研究之目是利用資料探勘的技術,嘗試找出潛藏在診斷碼資料庫中症狀、疾病處置碼

和診斷碼三者之關係,並探討如何利用可能的醫囑來推論診斷碼與手術碼

方法:本研究分析某區域醫院於91年至94年出院案件資料共58,507件作為研究的資料來源。再

利用關聯式規則之方式找出醫囑與疾病分類代碼出現的機率值,分析其住院期間診斷碼、手術

碼與執行的醫囑之間所隱含的關聯資訊。

結果:系統整體平均約2.5分鐘將可推論一件出院案件,本系統決策的醫囑與案件實際產生的

醫囑碼進行比對,結果發現本系統之正確率為72.8%。

結論:本系統分析、歸納、統計疾病診斷碼╱手術碼及醫囑各自隱含的資訊,正確地由診斷碼

╱手術碼進行醫囑之推論,以輔助醫師決策醫囑,並對其進行異常檢查以確定醫囑的正確性。

關鍵字:ICD-9-CM,資料探勘,決策支援系統,醫囑

*通訊作者

收件日期:2008年1月8日;接受日期:2008年2月18日

原著研究

Page 2: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����32 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 33

陳鎮揮 楊鎮嘉 吳效文

序論

資訊科技進步為企業帶來許多便利與效益,

因此電腦系統已逐漸成為各行各業提升競爭力的

利器,大多數的醫院都跟上電子化的腳步,順應

醫療大環境的現況與衛生署的政策,也希望能透

過經營管理及建立醫院資訊系統,以降低營運成

本、提高醫療品質。

醫院由原本單純文字書寫為主的病歷資料,

改為電子化之方式儲存,藉此可以快速的存取

病人的病歷資料,這些資料不僅是病史記錄之呈

現,最重要的這些資料也記錄過去診斷經驗,隨

著醫療系統廣泛使用資料庫中的資料日益增加,

所儲存的資訊也愈來愈豐富,這將能幫助醫師更

有效掌握病人狀況,當然這也包含資訊提供輔助

的資訊來減少錯誤的產生,例如:檢驗臨危值之

通知、藥物交互作用之提示等等。

此外電子簽章法,已經於民國九十年十一月

份通過,未來電子病歷的實行以及合法性應該是

必然的趨勢,加上未來電腦已經不再只有單一型

態,資料的傳輸也不再需要透過有形的線路來傳

遞,但隨著資訊系統的廣泛使用,資料庫中資料

量大幅增加,其中所隱藏的資訊也相對的增加。

若能將這些資料透過資訊分析轉換成有意義的資

訊,將能提供醫師做醫療決策前的依據,例如找

出某病徵之疾病之相關性,可幫助醫生在診斷時

給於協助,進而提升醫療品質。然而也因為醫學

資料庫之龐大,若只依賴人力進行分析,將會耗

費許多人力成本,加上醫療的複雜性要開發決策

支援系統更是增加其困難度。

因此許多學者致力於結合資訊科技的技術,

發展從醫學資料庫中挖掘所需資訊的輔助工具,

以目前台灣的醫療環境每天門診量之大,在加上

急診、住院等病人,醫師針對不同的病例開立不

同的處置與檢驗等皆不相同,若能找出其中關聯

規則,並定可為醫師提供幫助,本研究之目的亦

是利用資料探勘的技術,嘗試找出潛藏在診斷碼

資料庫中症狀、疾病處置碼和診斷碼三者關係,

並探討如何利用可能的醫囑來推論診斷碼與手術

碼,以修正醫師或疾病分類人員誤植診斷碼及手

術碼的情形,並使該項技術系統化,讓患者在住

院治療期間醫院便能發現錯誤而修正之,以提供

醫師開立住院醫囑時決策之參考依據,減少不必

要的醫療處置之浪費。

文獻探討

自1980年代以來,照護住院病人的資訊系統(Inpatient Care Information System)逐漸地由各個醫療院所開發出來,然而各醫院的特性及人員

對電腦操作習性的不同,加上醫院經費預算等問

題,使得系統各自的發展有極大的差異。有些醫

院的資訊系統能以Web-Base方式處理及顯示影像圖形資料,有些醫院至今仍然停留在傳統的

DOS文字模式(1)。然而不論各家醫院發展的基礎為何,住院醫

囑系統在醫院資訊系統中都佔著非常重要的一

環。美國約翰霍普金斯(Johns Hopkins)醫學中心在1999年針對164位醫師及107位護理人員做調查,有30%的醫師及56%的護理人員認為醫囑系統可以改進醫療照護的品質;但是78%的醫師認為與病患相處的時間減少了,60%的住院醫師及41%的主治醫師認為錯誤的醫囑增加了,而69%的護士認為錯誤減少或沒有改變。結論是住院醫

囑系統讓大部分的護理人員覺得有好處,但是大

部份的醫師卻是持負面的看法,住院醫囑系統開

始施行時,遇到醫師的反彈是難以避免,但實施

一段時間後,大部分的醫師反而都能接受,因

為醫師開立的醫囑中,藥品處方佔大部份,如

果藥品的錯誤能夠減少,對於醫療的品質提升將

有顯著的幫助,根據美國波士頓醫院(BWH)的報告,住院醫囑系統可以減少55%的嚴重處方錯

Page 3: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����32 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 33

誤,處方內可避免的藥品副作用減少了17%,有可能發生副作用的藥品減少了84%,他們的結論是住院醫囑系統對於醫師開立藥品處方的影響是

正面的(2)。隨著資訊技術的進步,資料庫中資料量大幅

增加,面對這麼龐大的醫療歷史資料庫,若無

善用這些資料則是浪費儲存成本,但若能利用這

些資料從中找出有用的資訊並轉換為知識,在這

知�經濟的時代唯有將資�轉化為知�,將可替

醫院但來競爭優勢提供決策上的參考。為了解決

在分析與處理這些儲存在資料庫中的大量資料所

遇到的問題,許多學者從龐大的資料庫中找尋所

需之資訊並從中挖掘知識,這種從資料庫裡找出

「規則」或者推論出「知識」以支援決策之途徑

稱為「資料庫知識發掘」(Knowledge Discovery in Database,簡稱為KDD)(3),知識挖掘是個連續的程序不斷的重複、循環,結果就是為了能擷

取出有用的知識。而資料探勘是知�挖掘過程中

的一個步驟及工具,但其還包含幾個重要的步驟

分別為資料篩選、前置處理、資料轉換、資料探

勘、規則解釋。

所謂資�探勘是從大量資料中去發掘潛在有

意義資料,利用由各種不同的資料分析方式來

獲得知識或資訊;並能透過資料庫自動比對並分

析資料,最後建立可能的結果或規則關聯,以提

供決策人員作決策時參考(4)。資料探勘通常被視為知識發現(Knowledge Discovery in Database, KDD)過程的核心,資�探勘技術利用許多統計分析的方法,�挖掘資�中有用的特徵與關�

性。例如關聯規則(association rules)、分類分析(classification)、群集(clustering)及次序相關分析(sequential pattern analysis)。所謂關聯式規則為在一個交易資料庫中,每

筆交易包含一些交易項目,關聯分析的目的是

從這些交易資料中,找出交易項目之關聯規則

(association rules),也就是當某交易項目(Items)

在交易中出現,其它交易項目也會同時出現在這

個交易中,舉例來說,購買鉛筆同時又會購買橡

皮擦的顧客的約有85%,自然商家會將這些經常被一起購買之產品一起擺放以方�顧客。

關聯規則的形式表示在項目集合X與Y之間有一關聯規則存在,則X與Y是交易項目的集合,表示當項目集合X時產生,可能會再產生項目集合Y。X、Y I且X∩Y=φ,I為所有項目的集合。關聯規則X→Y是否成立須滿足以下兩個條件,一是關聯規則X→Y的支持度,必須大於或等於指定的支持度;其次是關聯規則X→Y的信賴度,必須大於或等於指定的最小信賴度,

信賴度(Conf idence)是指這樣的規則要在所有資料的樣式中出現的條件機率,而最小支持度

(Minimum Support)是指在所有資料中出現的比率,也就是此規則在所有資料中是不是有代表性

(5)。舉個例子來說,醫療市場可以找出某產品與病人屬性之間的關聯性:『年齡(X,「40歲∼50歲」),且月收入(X,「5萬元∼8萬」)=>購買(X,「高級健檢」)[支持度=2%,信賴度= 70%]』,利用這些數值來檢視資料是否有達到門檻。

而在探勘關聯規則的方法中,Apriori 演算法是最具代表性的方法之一,其主要包含兩個步

驟,分別為搜尋資料庫以找出所有的高頻項目

組,用高頻項目組推導出所有的關聯法則。資

料庫中出現的頻率必須要大於或等於所定之最小

支持度限制,滿足此條件限制的稱之為高頻項目

組。若其出現的頻率太低,則其相對地沒有意

義,出現次數較多的項目組,在統計學上而言,

這也是比較能作為決策參考的,之後再根據可靠

度來判斷此關聯法則是否有意義。相同地,可靠

度值也必須要≥使用者所定之最小限制,若其可靠度太低,即使其出現的頻率高於使用者所定之

最小支持度限制,則其依然是較沒意義的關聯法

故不考量(6)。此外亦有學者採用統計學的方式

以資料探勘技術建立ICD-9-CM編碼決策系統

Page 4: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����34 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 35

(7),例如機率分佈、估計、假設的測試、模型的評分、預測模型、模糊理論等分析方法,

對資料挖掘提出決策分析的方式。

此外決策樹亦是一種資料挖掘經常要用到的

技術(8),可以用於分析資料,同樣也可以作預測,決策樹是一棵語意樹(Semantic Tree),是一個�似�程圖的樹�結構,每一個節點都被安排

一個適當的測試,每個分支代表著其測試後的結

果�而樹的�子則代表其最後的分�,是一項建

�分�模式的方式�用歸納的方式產生樹�結構

的模式。

所謂決策支援系統 ( D e c i s i o n S u p p o r t System,DSS)是結合人類智慧與電腦功能,協助管理者面對半結構化之問題時,能改善其決

策品質之電腦系統」;決策支援系統(DSS)主要特點是以電腦支援的交談式系統,協助決策者使

用資�及模式,�解決非結構性的問題。總而言

之,任何支援決策制定的系統�可稱為決策支援

系統,包括資訊存取、模式分析和工具支援等。

而醫療決策支援系統常被用來解決特定醫療

問題,美國醫療資訊業界研究顯示,資料倉儲、

資料挖掘與決策支援能力,將提供醫療產業中龐

大資訊處理的需求,及促使醫療專業知識能快速

的導入資訊基礎架構,使能在達成品質目標的前

提上有效降低成本(9)。

研究方法

住院患者的醫囑可分成三個部分,分別是臨

時醫囑、長期醫囑、及出院帶藥。臨時醫囑屬於

立即且僅執行一次的醫囑;長期醫囑是指有效時

間超過24小時以上者,如無停止醫囑的情形,則醫囑會持續有效,當然如果患者轉科、出院或死

亡,其醫囑自動停止;出院帶藥是患者出院時,

因病情尚未痊癒須繼續在家中治療所開立之醫

囑。本研究利用某區域醫院於分析91年至94年

出院案件資料共58,507件作為研究的資料來源。將病歷紀錄以資料庫型態儲存方式,再利用

關聯式規則之方式找出疾病分類代碼與醫囑出現

的機率值,分析其住院期間診斷碼、手術碼與執

行的醫囑之間所隱含的關聯資訊;系統演算法之

開發主要是以Microsoft Visual Basic6.0 為程式開發工具,搭配Oracle7.3.2資料庫,利用統計分析機率值的高低找出高頻項目組,再以統計分類

方法產生所要結果,建構醫囑協助開立ICD編審的輔助系統。

系統實作

一、診斷碼╱手術碼與醫囑間之關係

在患者就醫資料中,最能代表所患者之疾病

的莫過於診斷碼與手術碼,而醫囑的開立是為了

治療患者疾病,所以疾病與醫囑間應該存在著一

定的關係。但每位病患的病症、體質及康復情形

不同,醫師在治療的過程中也會隨著病情、住院

時間而開立不同的醫囑,如何從患者住院期間歸

納出疾病與醫囑間關係則是本研究之重點。

為了能夠完整的保留每一個診斷所對應的醫

囑,以及解決診斷輸入的順序問題,在執行診斷

與醫囑關係建檔,將依下述之步驟來進行(如圖

一)。

(一)讀取出院患者共可得到 s個出院患者,並依序存放在陣列patient[1,2,…,s]中;令t=1。(二)讀取pat ient [ t ]的診斷碼及手術碼,

假設有n個(診斷碼╱手術碼之個數總合最多為10),再依診斷碼╱手術碼大小各自排序,並取Cn

i , i=1,2,...n,假設得到m組診斷組合,且存放在陣列IcdGrp[1,2,…,m]中。(三)讀取p a t i e n t [ t ]的醫囑記錄,得到p

筆臨時醫囑及其開立時的住院天數、q筆長期醫囑及 r筆出院帶藥醫囑,而各自存放於陣列

陳鎮揮 楊鎮嘉 吳效文

Page 5: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����34 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 35

State[1,2,…,p],Inday[1,2,…,p],Long[1,2,…,q]及OutDrg[1,2,…,r]中,再依(如圖二)演算法進行診斷碼╱手術碼與醫囑關係資料庫建檔。

(四)t=t+1;如果t>s則停止,否則執行步驟(2)。

而建檔過程中,演算法對資料庫進行搜尋、

新增之時間乃是依資料庫內建之鍵值結構及儲存

方法為基準,本研究以Oralce所開發之資料庫為儲存工具,其索引結構為B-Tree。整體演算法之時間複雜度(time complexity)為O(n3)。

以資料探勘技術建立ICD-9-CM編碼決策系統

Page 6: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����36 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 37

陳鎮揮 楊鎮嘉 吳效文

Page 7: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����36 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 37

二、醫囑先後執行次序分析

病患在住院治療期間若沒有其他併發病,在

正常情況下,病情將因住院天數的增加而逐漸

減緩,而相同的疾病,醫師開立醫囑的順序,

常因患者體質、年齡…等因素而有所不同,有些

患者在第一天執行A醫囑,第二天執行B醫囑;

但某些患者可能是第一天執行A醫囑,第三天才執行B醫囑。也就是說住院醫囑應該有階段性的差異,以下將分析醫囑與醫囑之間執行的先後關

係。醫囑執行先後次序之分析方法,將依下述步

驟來進行,整體演算法(如圖三)之時間複雜度

為O(n4)。

(一)讀取所有出院患者記錄,共得m個出院患者,並存放陣列OutPat[1,2,…m]中,令i=1。(二)讀取患者OutPat[i]個人當次住院時的

醫囑資料,並依執行日期排序。患者住院天數為

n;令j=1。

(三)讀取患者第j天執行醫囑共得到s筆資料,將之存放於陣列PreOrder[1,2,…,s];讀取患者第j+1天執行的醫囑共有t筆資料,存放於陣列NxtOrder[1,2,…t]。(四)j=j+1;如果j<n則執行步驟(3)。(五)i=i+1;如果i<=m則執行步驟(2)。

以資料探勘技術建立ICD-9-CM編碼決策系統

Page 8: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����38 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 39

陳鎮揮 楊鎮嘉 吳效文

三、醫囑與診斷碼╱手術碼關係分析

假設某患者某一次住院之診斷碼為N 1, N 2,…,Ns,手術碼為M1,M2,…,Mt,執行醫囑A1,A2,…,Ap,則為每一Ai列出所有Ni,i=1,2,…,s,及Mj,j=1,2,…,t。而長期醫囑是依醫囑設定機率展開,例如,長期醫囑A1,醫師設定為一天使用4次,並於5天後停用,則將會有20筆A1醫囑。若醫師開立醫囑A1,A2,A3,A4,A5,則系統將先找

尋對應的診斷碼╱手術碼,其次再統計每個診

斷碼和手術碼出現的次數機率。通常患者的住院

期間愈長,醫師所開立的醫囑也會相對的增加,

為了增加推論診斷碼╱手術碼的效率,我們先加

總各醫囑所對應的診斷碼╱手術碼出現次數,再

針對醫囑進行相對的統計,如此將能迅速找到各

診斷碼╱手術碼所對應之醫囑機率。綜合上述之

描述,醫囑推論診斷碼╱手術碼之演算法(如圖

四),其時間複雜度亦為O(n3)。

(一)讀取出院患者共m件案件,並依序存放於陣列patient[1,2,…,m]中;令i=1。(二)讀取pat ient [ i ]之診斷碼╱手術碼得

n個,並依序存放於陣列icd[1,2,…,n],再讀取patient[i]之執行醫囑,共有r筆,並存放於陣列order[1,2,…,r]。(三)讀取目前I C D - 9 - C M所編之診斷碼

╱手術碼得t筆資料,並由小到大進行排序,且存放於陣列icd9[1,2 ,…,t]中。要推論的患者共有n個,分別存放於陣列patient[1,2,…,n]中;令i=1。(四)讀取pa t ien t [ i ]執行的醫囑共m筆資

料,依序存放於陣列order[1 ,2 ,…,m];設定計算各診斷碼╱手術碼出現次數的陣列icdcnt[1,2,…,t]各元素值為0;令j=1。(五)讀取o r d e r [ j ]所對應的診斷碼 /手術

碼,共r筆資料,分別存放於陣列ordericd[1,2,…r]中;令k=1。(六)搜尋ordericd[k]於陣列icd9[1,2,…t]中

的索引p,並執行icdcnt[p]=icdcnt[p]+1。(七)k=k+1;如果k<=r則執行步驟(6)。(八)j=j+1;如果j<=m則執行步驟(5)。(九)i=i+1;如果i>n則停止,否則執行步

驟(4)。

Page 9: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����38 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 39

系統驗證

本系統整體平均約2.5分鐘將可推論一件出院案件,但如果當醫師每次開立醫囑,系統便進

行患者診斷碼╱手術碼的推論,將對系統造成沈

重的負載,因此通常是安排在系統離峰時間較適

合。為驗證本系統之成效,本研究以過去4年之診療資料為基礎,再於95年度中隨機取395件做實際測試,以系統決策的ICD碼與案件實際產生的結果進行比對,結果發現本系統驗證之正確率

為72.8%。經分析其有二個主要原因:一、相同的疾病,醫囑卻不相同:在驗證推

論結果與醫師輸入診斷碼╱手術碼是否一致的

作業中,發現有些診斷碼╱手術碼,可以得到百

分之百的準確度,但有些卻不佳。探究其因,部

份是因為相同的疾病卻有不同的治療方式,醫囑

自然也有些許差異。部份則起因於診斷碼/手術碼最多為5個的限制,有些診斷碼╱手術碼只是用來輔助病情的描述,而不是治療的主要對象,

例如,某位患者患了心臟及眼睛疾病,而後者的

病情較輕,醫囑中治療眼睛疾病之醫囑比治療心

臟疾病的醫囑較少,以該次住院的醫囑推論其結

果,仍會以心臟診斷碼╱手術碼為優先,治療眼

疾的診斷碼╱手術碼將無法列在第一順位,這部

份應屬於合理的誤差,本系統依據關聯式規則推

論較具高頻項目之醫囑,故可能會忽略部分不具

顯著之項目。

二、資料庫中的出院患者案件數量不足:本

研究系統僅針對91至94年度之住院資料進行挖掘約58,507人,共156,900個診斷碼,73,183個手術碼,3,071,437個臨時醫囑,而疾病的種類之多,某些疾病種類及其案件數量尚嫌不足,例

如,急性耳翼軟骨膜炎的診斷碼380.01,在建檔資料庫中只有5次記錄,因此推論時參考依據不足,易受其他常見疾病之影響,而使推論結果

有誤,例如,急性耳翼軟骨膜炎在這5次的治療

過程中,共使用了A1,A2,A3,A4等4種醫囑,但醫囑A1,A2,A3,A4,A5,A6曾治療過心臟病,因此醫囑

A1,A2,A3,A4將包含著治療急性耳膜炎及心臟病兩

種診斷資訊,而醫囑A5,A6則有心臟病的診斷資

訊,若有一位醫師以A1,A2,A3,A4,A5,A6來治療急

性耳翼軟骨膜炎,那麼經由系統推論將以心臟病

為主,但醫師的治療行為是正確的,只不過建檔

的案件中急性耳膜炎沒有使用醫囑A5,A6而影響

了推論的結果。

結論

本研究將醫囑與診斷碼/手術碼進行關係分析及建檔,當醫師輸入可能執行的醫囑資料,

系統將產生患者診斷碼╱手術碼資料,輔助醫

師進行編碼之決策,讓醫師或疾病分類人員參考

比對,使醫囑更切合診斷碼╱手術碼。其次,分

析醫囑之間執行次序關係,再由過去開立的醫囑

資料,推論可能狀況並進行排列,目前台灣尚無

這方面之研究,本研究在這方面是一大突破,若

能詳細考慮所有關聯之因素,找出其中隱含的資

訊,並將演算法系統模組化,這將對於輔助醫護

人員將有更大的效益,此外本系統更可依據患者

的ICD碼推斷醫師可執行之醫囑。本系統最終是在提供ICD編碼時的決策,提供一個可能的解,然而決策支援系統的目的在於提供輔助,最終的

決策者還是在於醫師本身的專業與疾病人員的判

斷。

本研究主要的目的是希望協助醫師方便快速

地開立醫囑,並驗證醫囑與診斷碼╱手術碼是

否切合,然而診斷碼╱手術碼無法完全表示病

情嚴重程度,嚴重程度不同治療的過程也會有所

差異,因此若能將患者病情的資料一起分析,必

能更符合患者的需要。此外執行了相同的醫療行

為,並不一定能夠得到相同醫療效果,雖然本研

究歸納了醫囑與診斷碼╱手術碼之間的關係,但

以資料探勘技術建立ICD-9-CM編碼決策系統

Page 10: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����40 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 41

是在過程中並沒有明確地歸納醫囑與疾病之

間的關係,例如為患者開立治療心臟與腎臟的醫

囑時,若能確定某一個醫囑是專門治療那一項疾

病,再分析兩者間關係,那麼在分類上將更加明

確,這些也未來可持續研究之方向。

參考文獻

1. 李彥良:Web-Base診間醫令系統之開發與建置。臺北醫學大學醫學資訊研究所。碩士論

文2000。2. 張慧郎醫師:醫療資訊管理學。偉華書局有限公司2001。

3. Fayyad U. Data mining and knowledge d i s c o v e r y i n d a t a b a s e s : i m p l i c a t i o n s for sc ient i f ic databases . Proc. of Ninth International Conference on Scientific and Statistical Database Management, 1997;2-11.

4. Cabena P, Hadjinian P, Stadler R, Verhees J, and Zanasi A. Discovering Data Mining Form Concept to Implemention. Prentice Hall PTR 1997.

5. Agrawal R, Imiel inski T, and Swami A. Mining association rules between sets of items in large database, Proc. ACM-SIGMOD -International Conference on Management of Data 1993;207-216.

6. Agarwal R, Aggarwal C, and Prasad VVV. A tree projection algorithm for generation of frequent itemsets. Journal of Parallel and Distributed Computing(Special Issue on High Performance Data Mining) 2000; 3: 350-371.

7. 蔣肇慶、林熙禎。資料開採在醫療資訊的研究。醫療資訊雜誌。1999 ; 9 : 71-82。

8. Quinlan JR. Induction of Decision Trees. Machine Learning 1996;1:81-106.

9. Alter S. A Taxonomy of Decision Support Systems. Sloan Management Review 1977; 19 : 39-56.

陳鎮揮 楊鎮嘉 吳效文

Page 11: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����40 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 41

Establishment ICD-9-CM Decision Support SystemUsing Data Mining Techniques

Cheng-Hui Chen1, Cheng-Chia Yang2* and Hsiao-Wen Wu1

Department of information technology1 and Administration2 Kuang-Tien General Hospital

*Corresponding authorReceived:8 Jan 2008;Accepted:18 Feb 2008

Abstract

Object: our research tried to represent the relationships of the symptom, procedure code and diagnosis code by data mining and that can automatically generate prescriptions (possible orders) from diagnosis code and procedure code.Methods: We collected 58,507 discharged cases from a regional hospital since 2002 to 2005. We calculated probability of their occurrence to analyzed association rule among diagnosis code, procedure code and prescriptions (possible orders).Result: Our system can generate an ICD code of discharge cases average of 2.5 minute, we mapping the system inference cases and the actually practical cases; the ratio of accuracy is 72.8%Conclusion: Our system analyze the statistical information of diagnosis code, procedure code and prescription and is helpful for physicians to generate suggest prescriptions accuracy by diagnosis code and procedure code.

Key Words: ICD-9-CM , Data Mining , Decision Support System , doctor’s advice.

Original Article

Page 12: 以資料探勘技術建立ICD-9-CM編碼決策系統 · 利器,大多數的醫院都跟上電子化的腳步,順應 醫療大環境的現況與衛生署的政策,也希望能透

��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ����42 ��������������������������������������������������� 光田醫學雜誌 � �第�卷 � �第�期 ���� 43