
文章介紹
疾病分類記錄,是醫療體系很重要的事情,目前最被廣泛使用的是 ICD 系統。不過,從 ICD-9 轉到 ICD-10 時,種類繁多且編碼複雜,對輸入者來說造成很大的工作負擔。陳醫師與其團隊,預計使用機器學習,看看能不能協助輸入者增加正確率,並縮短工作時間。
經使用台大醫院的自然語言病例系統做訓練,團隊建立了一個機器學習的 ICD-10 自動編碼系統,並檢查其正確性。之後將這個系統作為編碼者的輔助後,發現人類編碼者的正確率顯著上升,但卻沒有縮減到時間。
一般臨床醫師常不清楚類神經網路(或機器學習)與多變項迴歸之間的差異,以及分別適合怎樣的研究題目,這個論文做了很好的示範。
機器學習,適合的是之後要拿來用的題目,先做訓練,接著做確認,然後可以應用並觀察影響。多變項迴歸則是用來解釋,以及找出解釋力強的因子。兩者之間當然有些重疊之處,但像是本例這種應用性很強的主題,就明顯是適合機器學習的題目。
恭喜陳醫師!





