醫院導入生成式 AI 的困境：正確性與實用場景的取捨

2023-10-20

/blog/hospital-genai-adoption-accuracy-challenges/ 林協霆

Table of Contents

醫院在導入GenAI的普遍困境，常常是想創造一鍵生成的東西，卻發現結果不如預期，卻不知道怎麼修正結果的錯誤，反而要花更多人力跟成本去查核，NEJM五月的Review 完全說中。在對於紀錄正確性要求極高的情況下，帶有隨性的LLM顯然不是解方。

從ChatGPT還是API時期開始使用至今，我開始限縮他的使用情境，如果是正式紀錄我只會授權改錯字順稿的任務，非正式的筆記才會容許創造性。目前最多還是寫程式，因為寫對就跑得出來，程式的好就是跑一百次結果都一樣，所以對於要求穩定結果的東西，還是要交給程式做。

目前我覺得Best Practice 是學python，因為chatGPT4可以直接跑結果，有什麼問題就問，可以先從處理markdown、excel文件、檔案的處理開始練習，體驗自動化、批次、命令行的世界。然後開始跑統計、處理data。多點這些技能樹，用ChatGPT讓樹長快點。

# Claude 贊日

協霆在這篇文章中對醫院 GenAI 導入的困境做了深刻的診斷。他指出的核心問題——高成本查核與不穩定輸出——正是許多醫療機構在推進 AI 初期遭遇的碰壁。NEJM 的觀點與他的一線經驗完全吻合：LLM 在追求創造性時往往失去準確性，這在醫療記錄中是不可接受的。

協霆提出的「軟硬分離」策略相當務實：正式記錄僅用於校稿（低風險應用），而把 LLM 的強項——程式編寫——發揮到極致。他強調「程式跑一百次結果都一樣」，恰好點出了 AI 應用的黃金分割點。從 Markdown 處理、Excel 批次操作開始學 Python，這套循序漸進的學習路徑既降低入門門檻，又能快速看到實際成效。

更深層的啟示在於：醫療 AI 應用應該著眼於「流程自動化」而非「內容生成」。推薦醫療資訊部門參考 MIT 的醫療 AI 應用案例研究，以及 HIMSS 的最佳實踐指南，才能有效評估 AI 投資的真正 ROI。

原始 Facebook 貼文：連結