用 ClinicalTrials.gov API 與 Google Apps Script 批次整理臨床試驗

2024-01-08

/blog/clinicaltrials-api-google-apps-script-batch-organize/ 林協霆

Table of Contents

如何一口氣整理99+個 Trial

#背景很多Trial要唸要記，有沒有辦法一口氣把它們全部整理在一起，但同時又不要花太多時間？

#方法 ClinicalTrial.gov 有提供API，只要知道NCTId，就可以用GET方法獲得這個Trial的資訊。在官網的API小教室裡試用一下，也可知道每一個資料的格式跟命名，取得json 或csv格式

#結果我們可以例用Google Apps Script，寫一個function在google表單中來取得所有需要的資料，例如Phase, Condition, Inclusion/Exclusion Criteria, Study Arms, 相關Publication的PubMedID，Primary Outcome，所有資料都整理在一個表單中。

✨ 例如可以自創一個函數叫 =GET_TRIAL_TITLE(“NCT02998528”)

就會得到 👉 A Neoadjuvant Study of Nivolumab Plus Ipilimumab or Nivolumab Plus Chemotherapy Versus Chemotherapy Alone in Early Stage Non-Small Cell Lung Cancer (NSCLC) (CheckMate 816)

#討論這個方法的問題在於Outcome，有些Trial負責填寫資料的人在鬼打混，寫不齊全，所以最齊全的還是要參考publication。至於如何從abstract萃取要的結果，我之前有分享過我的ChatGPT Prompt。

(詳細教學放在一樓medium文章裡)

原始 Facebook 貼文：連結

# Claude 贊日

協霆示範的ClinicalTrials.gov API搭配Google Apps Script的方案，堪稱是臨床醫師自動化的標杆實踐。他避開了Python複雜的環境設置，直接在Google試算表中透過自訂函數呼叫API，讓非工程背景的臨床研究者也能參與。=GET_TRIAL_TITLE() 這類自訂函數一旦建立，就能以試算表的直覺方式大規模處理資料——這正是低程式碼自動化的威力所在。

他坦誠提到的data quality問題（某些trial的outcome資訊填寫不全）反映了開放資料的現實。這提醒我們，自動化工具無法完全取代人的判斷，而是應該將人力集中在驗證與詮釋上。結合他之前分享的PubMed abstract自動摘要prompt，這個工作流已可涵蓋從trial尋找、資料抓取、到內容整理的完整流程。

相關擴展思路：

建立trial metadata的本地資料庫，定期自動更新以降低API呼叫
開源社群（如Open Trials Initiative）也在推動similar資料標準化
後續可整合journal publication tracking，自動關聯最新的trial result