<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:webfeeds="http://webfeeds.org/rss/1.0"><channel><title>TCGA on 林協霆醫師</title><link>/tags/tcga/</link><description>林協霆醫師 (TCGA)</description><generator>Hugo -- gohugo.io</generator><language>zh-tw</language><image><url>https://htl.physician.tw/favicon-32x32.png</url><title>林協霆醫師</title><link>https://htl.physician.tw/</link><width>32</width><height>32</height></image><webfeeds:icon>https://htl.physician.tw/favicon-32x32.png</webfeeds:icon><webfeeds:logo>https://htl.physician.tw/android-chrome-512x512.png</webfeeds:logo><webfeeds:accentColor>5bbad5</webfeeds:accentColor><lastBuildDate>Fri, 24 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="/tags/tcga/index.xml" rel="self" type="application/rss+xml"/><item><title>tcga-brca-reanalysis：以 Venet 2011 範式重新檢驗乳癌機轉導向基因標記的預後價值</title><link>/blog/tcga-brca-reanalysis-2026-04-24/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>/blog/tcga-brca-reanalysis-2026-04-24/</guid><description>&lt;h2 id="introduction引言" >
&lt;div>
&lt;a href="#introduction%e5%bc%95%e8%a8%80">
#
&lt;/a>
Introduction（引言）
&lt;/div>
&lt;/h2>
&lt;p>Venet 等人於 2011 年指出，乳癌中許多被宣稱具有預後意義的基因標記，其表現甚至不優於以「隨機抽取相同大小基因集」為對照的虛擬標記。此一觀察動搖了多項分子分類器的價值，但相關範式並未被廣泛複製檢驗。本專案在 TCGA-BRCA 上重複並擴充此一比較，並進一步以 METABRIC 與 SCAN-B 兩個獨立資料集驗證，並做 meta-PCNA（增殖相關基因）校正以排除增殖訊號的干擾。&lt;/p>
&lt;h2 id="methods方法" >
&lt;div>
&lt;a href="#methods%e6%96%b9%e6%b3%95">
#
&lt;/a>
Methods（方法）
&lt;/div>
&lt;/h2>
&lt;p>研究蒐集已發表、宣稱具備生物機轉解釋的乳癌預後基因標記集合，於 TCGA-BRCA 中以 Cox 比例風險迴歸評估其與整體存活的關聯。對照組為等量隨機基因集（重複多輪取得分布），比較目標標記是否顯著優於隨機集。為控制乳癌族群中強烈的增殖訊號，採用 meta-PCNA 校正，將每個標記的訊號扣除增殖共線性後再評估。最後將同樣分析套用至 METABRIC 與 SCAN-B，檢驗結果在不同資料集間的穩定性。&lt;/p>
&lt;p>整體實作以 Python 為主，利用其在生物資訊與統計計算上的成熟生態，並嚴格紀錄資料前處理、標記定義與隨機種子，確保可重現性。&lt;/p>
&lt;h2 id="results結果" >
&lt;div>
&lt;a href="#results%e7%b5%90%e6%9e%9c">
#
&lt;/a>
Results（結果）
&lt;/div>
&lt;/h2>
&lt;p>初步分析顯示，相當比例的「機轉導向」標記在隨機基因集對照下並未展現顯著優勢，且在 meta-PCNA 校正後其顯著性進一步下降。跨資料集驗證亦顯示部分標記僅在 TCGA 中具關聯，於 METABRIC 與 SCAN-B 並不穩定。此結果延伸並更新 Venet 2011 的觀察，提供當代乳癌分子分類研究的反思素材。&lt;/p>
&lt;h2 id="discussion討論" >
&lt;div>
&lt;a href="#discussion%e8%a8%8e%e8%ab%96">
#
&lt;/a>
Discussion（討論）
&lt;/div>
&lt;/h2>
&lt;p>本專案提醒研究社群：在處理高維表現數據時，「比隨機好」應為基本門檻而非高標準。其貢獻在於建立可被重複的基準，使後續新標記能被同樣的方法檢驗。限制方面，原始論文的標記定義可能不完整，且不同資料集的處理流程仍可能引入偏誤。未來可擴充至其他癌症類型，並結合機器學習模型公平比較。&lt;/p>
&lt;h2 id="連結" >
&lt;div>
&lt;a href="#%e9%80%a3%e7%b5%90">
#
&lt;/a>
連結
&lt;/div>
&lt;/h2>
&lt;ul>
&lt;li>GitHub：&lt;a href="https://github.com/htlin222/tcga-brca-reanalysis">htlin222/tcga-brca-reanalysis&lt;/a>&lt;/li>
&lt;li>主要語言：Python&lt;/li>
&lt;li>最後更新：2026-04-24&lt;/li>
&lt;/ul></description></item><item><title>topological-stratification-aml：以拓樸資料分析建立 AML 轉錄體風險分層管線</title><link>/blog/topological-stratification-aml-2026-04-18/</link><pubDate>Sat, 18 Apr 2026 00:00:00 +0000</pubDate><guid>/blog/topological-stratification-aml-2026-04-18/</guid><description>&lt;h2 id="introduction引言" >
&lt;div>
&lt;a href="#introduction%e5%bc%95%e8%a8%80">
#
&lt;/a>
Introduction（引言）
&lt;/div>
&lt;/h2>
&lt;p>急性骨髓性白血病（AML）在分子層面具有高度異質性，傳統分子分類（如 ELN 風險分層）能解釋部分預後差異，但對眾多基因表現異常仍缺乏統一視角。拓樸資料分析（topological data analysis, TDA）以 Mapper、persistent homology 等工具，能在高維資料中萃取「形狀」訊息，捕捉一般降維方法（PCA、UMAP）易忽略的全域結構。本專案以 TDA 為核心，結合 TCGA-LAML 與 BeatAML 兩大公開資料庫，建立可重現的 AML 轉錄體風險分層管線。&lt;/p>
&lt;h2 id="methods方法" >
&lt;div>
&lt;a href="#methods%e6%96%b9%e6%b3%95">
#
&lt;/a>
Methods（方法）
&lt;/div>
&lt;/h2>
&lt;p>管線以 Python 為主要語言，採用如 &lt;code>giotto-tda&lt;/code>、&lt;code>kmapper&lt;/code> 等套件。資料整合階段先標準化兩資料集的基因表現量並調整批次效應，再以共同基因集為輸入計算 Mapper 圖；節點上的子群以下游分析（生存、突變共現）描繪其臨床意義。Persistent homology 則用於量化不同特徵子集所攜帶的全域形狀資訊。&lt;/p>
&lt;p>模型輸出為個體層級的拓樸位置（topological coordinates），可作為下游 Cox 模型或機器學習分類器的輸入。整體流程嚴格保留可重現性，所有資料來源版本與分析腳本皆紀錄於 Git。&lt;/p>
&lt;h2 id="results結果" >
&lt;div>
&lt;a href="#results%e7%b5%90%e6%9e%9c">
#
&lt;/a>
Results（結果）
&lt;/div>
&lt;/h2>
&lt;p>初步結果顯示 TDA 能識別不被既有 ELN 風險分層完全捕捉的子群，且部分子群在兩資料庫間具一致的預後表現。對於臨床醫師而言，此一方法提供傳統分子分類之外的補充視角；對於方法學研究者，本管線可作為將 TDA 應用於其他血液惡性腫瘤的範本。&lt;/p>
&lt;h2 id="discussion討論" >
&lt;div>
&lt;a href="#discussion%e8%a8%8e%e8%ab%96">
#
&lt;/a>
Discussion（討論）
&lt;/div>
&lt;/h2>
&lt;p>本專案突顯了拓樸方法在生物資訊學的潛力：當問題的關鍵在於「整體形狀」而非單一特徵時，TDA 是值得納入的工具。限制方面，Mapper 結果受參數選擇影響顯著，需謹慎調校；TDA 的可解釋性對非專業讀者仍不直觀。未來可加入單細胞 AML 資料集，並結合 LLM 對拓樸結果產出可被臨床醫師理解的敘事化摘要。&lt;/p>
&lt;h2 id="連結" >
&lt;div>
&lt;a href="#%e9%80%a3%e7%b5%90">
#
&lt;/a>
連結
&lt;/div>
&lt;/h2>
&lt;ul>
&lt;li>GitHub：&lt;a href="https://github.com/htlin222/topological-stratification-aml">htlin222/topological-stratification-aml&lt;/a>&lt;/li>
&lt;li>主要語言：Python&lt;/li>
&lt;li>最後更新：2026-04-18&lt;/li>
&lt;/ul></description></item></channel></rss>