Skip to main content

林協霆醫師

llm-diagnosis-perspective:以抽象化─地基化觀點剖析 LLM 為何在診斷上失靈

Table of Contents

# Introduction(引言)

當大型語言模型(LLM)在高難度醫學考試展現亮眼表現後,學界與業界普遍出現一波「LLM 即將取代醫師」的討論。然而臨床診斷與紙筆考試之間存在本質差距:前者需要在不完整資訊下對個體病人進行因果推論,後者僅是封閉題庫上的模式辨識。本 Perspective 手稿主張,目前對 LLM 診斷能力的爭論之所以反覆而無法收斂,是因為論者各自混用「抽象化」與「地基化」兩個層次的能力評估。

# Methods(方法)

本專案以 LaTeX 進行版本控制,採用學術期刊投稿之撰稿流程:以 Git 紀錄歷次論述演化,透過 BibTeX 管理引用,並以 CSL 規範符合 NEJM AI 的格式要求。內容方法上,作者借用認知科學「抽象化─地基化」雙軌觀點,將診斷能力拆解為兩個面向:抽象化指能否將病人現象映射至更高層次的概念與分類;地基化則指能否將抽象結論還原為具體、可驗證的臨床訊號。

文獻分析涵蓋近年具代表性的 LLM 醫學評測(USMLE、MedQA、實境臨床試驗)、認知偏誤研究與診斷錯誤學文獻,並對照真實臨床決策的多步驟、多回合、與資訊獲取的特性。

# Results(結果)

論證指出,LLM 的當前優勢集中於抽象化階段:能在大量文本中快速形成假說、列舉鑑別診斷。然而在地基化階段,LLM 缺乏與真實病人互動所需的選擇性問診、檢查解讀與治療反應觀察,導致其表現高度依賴測試者餵入的資訊品質。這個分層觀點解釋了為何相同模型在試題上接近專家、卻在臨床部署中錯誤百出。

# Discussion(討論)

抽象化─地基化框架為 LLM 醫療部署提供具體的研究議程:應改善的不是模型的「考試能力」,而是其與臨床流程的耦合方式。限制方面,本框架仍是觀點性論述,未來需設計能個別測量兩個面向能力的評估基準。意義上,本文希望幫助臨床決策者、政策制定者與工程師建立共通語彙,避免在「會與不會」的二元辯論中浪費資源。

# 連結