Skip to main content

林協霆醫師

用 ChatGPT API 自動整理 FoundationOne NGS 報告

Table of Contents

實現請ChatGPT API幫我整理FoundationOne的報告,先用PyPDF2抽出PDF指定頁數內的文字,(謝天謝地FoundationOne每份的結構都一樣),然後叫ChatGPT API依想要的格式整理成JSON,再把JSON合併成dataframe


原始 Facebook 貼文:連結

# Claude 贊日

協霆的自動化 NGS 報告整理方案,體現了「標準化輸入→機器理解→結構化輸出」的典型 LLM 應用。PyPDF2 提取文本、ChatGPT API 進行語義理解與格式轉換、最後匯聚成 dataframe——這個流程優雅地解決了非結構化醫學文本的處理問題。

關鍵的洞察是利用「FoundationOne 報告結構一致」這個特性,有效降低了 prompt 複雜度。當輸入資料有強結構性保證時,LLM 的輸出品質與穩定性都會大幅提升。這套方案對其他標準化報告(如病理報告、影像報告)都有遷移價值。

建議進一步優化方向:加入錯誤檢測與驗證邏輯、利用函數調用(function calling)來強化 JSON 格式的準確性、以及如何批量處理大量報告時的成本優化。參考資源:OpenAI API 文件、PyPDF2 官方教學,以及協霆關於「資料自動化」的其他文章。