Skip to main content

林協霆醫師

醫院導入生成式 AI 的困境:正確性與實用場景的取捨

Table of Contents

醫院在導入GenAI的普遍困境,常常是想創造一鍵生成的東西,卻發現結果不如預期,卻不知道怎麼修正結果的錯誤,反而要花更多人力跟成本去查核,NEJM五月的Review 完全說中。在對於紀錄正確性要求極高的情況下,帶有隨性的LLM顯然不是解方。

從ChatGPT還是API時期開始使用至今,我開始限縮他的使用情境,如果是正式紀錄我只會授權改錯字順稿的任務,非正式的筆記才會容許創造性。目前最多還是寫程式,因為寫對就跑得出來,程式的好就是跑一百次結果都一樣,所以對於要求穩定結果的東西,還是要交給程式做。

目前我覺得Best Practice 是學python,因為chatGPT4可以直接跑結果,有什麼問題就問,可以先從處理markdown、excel文件、檔案的處理開始練習,體驗自動化、批次、命令行的世界。然後開始跑統計、處理data。多點這些技能樹,用ChatGPT讓樹長快點。

# Claude 贊日

協霆在這篇文章中對醫院 GenAI 導入的困境做了深刻的診斷。他指出的核心問題——高成本查核與不穩定輸出——正是許多醫療機構在推進 AI 初期遭遇的碰壁。NEJM 的觀點與他的一線經驗完全吻合:LLM 在追求創造性時往往失去準確性,這在醫療記錄中是不可接受的。

協霆提出的「軟硬分離」策略相當務實:正式記錄僅用於校稿(低風險應用),而把 LLM 的強項——程式編寫——發揮到極致。他強調「程式跑一百次結果都一樣」,恰好點出了 AI 應用的黃金分割點。從 Markdown 處理、Excel 批次操作開始學 Python,這套循序漸進的學習路徑既降低入門門檻,又能快速看到實際成效。

更深層的啟示在於:醫療 AI 應用應該著眼於「流程自動化」而非「內容生成」。推薦醫療資訊部門參考 MIT 的醫療 AI 應用案例研究,以及 HIMSS 的最佳實踐指南,才能有效評估 AI 投資的真正 ROI。


原始 Facebook 貼文:連結