Skip to main content

林協霆醫師

ngs-tertiary-analysis-skills:從 BAM 到 ESMO 2024 臨床報告的 R 語言三級分析管線

Table of Contents

# Introduction(引言)

次世代定序(NGS)已成為腫瘤學臨床決策的核心工具,但「次級」與「三級」分析之間的鴻溝仍是落地阻礙。次級分析輸出的是變異列表,而三級分析必須將每個變異映射到臨床可行性、藥物選擇與證據等級,並輸出符合 ESMO Scale for Clinical Actionability of molecular Targets(ESCAT)等臨床指引的書面報告。多數商用平台費用昂貴或不透明,本專案以 R 語言實作可重現的開源管線,作為臨床醫師與研究者學習與驗證的教材。

# Methods(方法)

管線從 BAM 檔起始,經由變異呼叫、註解與過濾,產出可信變異集合。在三級分析階段,系統以 OncoKB 進行致病性與可行藥物的對照、查詢 PubMed 與 Scopus 進行文獻證據蒐集,並依 ESMO ESCAT 框架(Tier I 至 Tier X)為每個變異賦予證據等級。R 套件生態提供豐富的生物資訊工具與報表能力(Quarto/R Markdown),使整份臨床報告可在單一管線內以可重現方式產出。

設計著重於:模組化(每個步驟可獨立替換)、可審計(所有外部資料庫查詢皆紀錄版本與日期)、以及符合 ESMO 2024 報告的結構化輸出。此架構可作為單一機構建置自有 NGS 報告平台的範本。

# Results(結果)

管線可將原始 BAM 檔在合理時間內轉化為包含臨床建議、文獻證據與 ESCAT 分級的完整報告。R 為主的實作降低了腫瘤科醫師參與的門檻,並能與既有統計分析環境無縫整合。整體流程可重現性高,每次執行皆能標註所引用之資料庫快照版本,以滿足臨床稽核要求。

# Discussion(討論)

本專案展示開源工具鏈在臨床基因體學的潛力,特別適合資源有限的醫學中心建構自有報告系統。其價值在於透明化:每一個臨床建議的來源皆可被追溯。限制方面,R 在大規模 BAM 處理上的效能仍不及 C/Python 實作,且 OncoKB 與 ESCAT 的更新節奏需要持續追蹤。未來可擴充為涵蓋藥物代謝基因(PGx)與免疫治療生物標記的整合報告,並結合 LLM 進行臨床敘事化摘要。

# 連結