ngs-tertiary-analysis-paper：以 Agentic AI 對照 AMP/ASCO/CAP 規則式分類的 NGS 證據調和方法論

Sat, 25 Apr 2026 00:00:00 +0000

# Introduction（引言）

癌症次世代定序的變異臨床意義評估目前主要依循 AMP／ASCO／CAP 共識指引：將變異依證據強度分為 Tier I 至 Tier IV，提供臨床決策依據。然而此規則式分類仰賴專家逐筆比對文獻、藥物資料庫與功能研究，工作量極高且易因資料庫更新而落後。隨著大型語言模型展現出整合多源文本的能力，是否能以 Agentic AI 動態調和臨床證據成為值得驗證的方法論問題。本專案即為相關投稿手稿之研究與寫作倉庫。

# Methods（方法）

本研究採用 Agentic AI 架構：每筆變異由協調 Agent 接收後，分派給多個專門 Agent 分別查詢文獻、藥物適應症、功能研究與臨床指引，最終由仲裁 Agent 彙整證據並輸出建議分類。系統以 R 語言撰寫主要分析管線，呼叫 LLM API 並嚴格紀錄每一步證據來源。基準對照為人工依 AMP／ASCO/CAP 指引產出的 Tier 分類，使用一組標註過的癌症 NGS 變異資料集進行比較。

評估指標包含一致率、敏感度／特異度與分類差異的根因分析；同時記錄 Agentic 流程的 token 用量、執行時間與失敗模式，作為實務部署的參考。

# Results（結果）

初步結果顯示 Agentic AI 在多數高證據變異上能達到與人工相當的一致率，但於罕見變異與證據邊界情境下出現分類飄移。仔細分析顯示，誤分類常源於文獻檢索 Agent 對近期摘要的解讀不夠精確，提示後續可加入人類在環（human-in-the-loop）審核。

# Discussion（討論）

本研究展示 Agentic AI 在臨床基因體學的實質潛力：不只是文字生成，更能負擔結構化證據蒐集任務。其貢獻在於提供可重複的方法論模板與基準測試流程，而非主張取代人工。限制方面，研究使用單一資料庫快照與單一 LLM 家族，泛化能力需更多驗證。未來方向包括：跨模型比較、多機構資料集驗證，以及將 Agentic 評估嵌入既有臨床報告平台的接口設計。

# 連結