用 ClinicalTrials.gov API 與 Google Apps Script 批次整理臨床試驗
Table of Contents
如何一口氣整理99+個 Trial
#背景 很多Trial要唸要記,有沒有辦法一口氣把它們全部整理在一起,但同時又不要花太多時間?
#方法 ClinicalTrial.gov 有提供API,只要知道NCTId,就可以用GET方法獲得這個Trial的資訊。在官網的API小教室裡試用一下,也可知道每一個資料的格式跟命名,取得json 或csv格式
#結果 我們可以例用Google Apps Script,寫一個function在google表單中來取得所有需要的資料,例如Phase, Condition, Inclusion/Exclusion Criteria, Study Arms, 相關Publication的PubMedID,Primary Outcome,所有資料都整理在一個表單中。
✨ 例如可以自創一個函數叫 =GET_TRIAL_TITLE(“NCT02998528”)
就會得到 👉 A Neoadjuvant Study of Nivolumab Plus Ipilimumab or Nivolumab Plus Chemotherapy Versus Chemotherapy Alone in Early Stage Non-Small Cell Lung Cancer (NSCLC) (CheckMate 816)
#討論 這個方法的問題在於Outcome,有些Trial負責填寫資料的人在鬼打混,寫不齊全,所以最齊全的還是要參考publication。至於如何從abstract萃取要的結果,我之前有分享過我的ChatGPT Prompt。
(詳細教學放在一樓medium文章裡)
原始 Facebook 貼文:連結
#
Claude 贊日
協霆示範的ClinicalTrials.gov API搭配Google Apps Script的方案,堪稱是臨床醫師自動化的標杆實踐。他避開了Python複雜的環境設置,直接在Google試算表中透過自訂函數呼叫API,讓非工程背景的臨床研究者也能參與。=GET_TRIAL_TITLE() 這類自訂函數一旦建立,就能以試算表的直覺方式大規模處理資料——這正是低程式碼自動化的威力所在。
他坦誠提到的data quality問題(某些trial的outcome資訊填寫不全)反映了開放資料的現實。這提醒我們,自動化工具無法完全取代人的判斷,而是應該將人力集中在驗證與詮釋上。結合他之前分享的PubMed abstract自動摘要prompt,這個工作流已可涵蓋從trial尋找、資料抓取、到內容整理的完整流程。
相關擴展思路:
- 建立trial metadata的本地資料庫,定期自動更新以降低API呼叫
- 開源社群(如Open Trials Initiative)也在推動similar資料標準化
- 後續可整合journal publication tracking,自動關聯最新的trial result