<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:webfeeds="http://webfeeds.org/rss/1.0"><channel><title>orchestration on 林協霆醫師</title><link>/tags/orchestration/</link><description>林協霆醫師 (orchestration)</description><generator>Hugo -- gohugo.io</generator><language>zh-tw</language><image><url>https://htl.physician.tw/favicon-32x32.png</url><title>林協霆醫師</title><link>https://htl.physician.tw/</link><width>32</width><height>32</height></image><webfeeds:icon>https://htl.physician.tw/favicon-32x32.png</webfeeds:icon><webfeeds:logo>https://htl.physician.tw/android-chrome-512x512.png</webfeeds:logo><webfeeds:accentColor>5bbad5</webfeeds:accentColor><lastBuildDate>Sat, 09 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="/tags/orchestration/index.xml" rel="self" type="application/rss+xml"/><item><title>agentic-holdem：以德州撲克為示範的多 Agent Claude Code 編排框架</title><link>/blog/agentic-holdem-2026-05-09/</link><pubDate>Sat, 09 May 2026 00:00:00 +0000</pubDate><guid>/blog/agentic-holdem-2026-05-09/</guid><description>&lt;h2 id="introduction引言" >
&lt;div>
&lt;a href="#introduction%e5%bc%95%e8%a8%80">
#
&lt;/a>
Introduction（引言）
&lt;/div>
&lt;/h2>
&lt;p>多 Agent 系統已成為 AI 工程的關鍵研究方向，但多數討論仍停留在抽象架構或工作流圖示，缺乏直觀的場域可供觀察其行為。德州撲克因其資訊不完全、需要心理博弈、且具備明確賽制與輪次規則，是檢驗多 Agent 推理、決策與互動的理想實驗場。本專案以撲克為載體，建構一個可觀察 Agent 行為的最小編排框架。&lt;/p>
&lt;p>研究問題在於：當 N 個獨立、不共享內部狀態的 LLM Agent 必須在同一個遊戲狀態之下競爭時，如何確保每個 Agent 僅能取得其應該知道的資訊（手牌、籌碼、歷史下注），並讓整體系統的推理過程可被外部觀察與審計。&lt;/p>
&lt;h2 id="methods方法" >
&lt;div>
&lt;a href="#methods%e6%96%b9%e6%b3%95">
#
&lt;/a>
Methods（方法）
&lt;/div>
&lt;/h2>
&lt;p>框架以 TypeScript 撰寫，並深度整合 Claude Code 作為 Agent 後端。每個 Agent 為獨立進程或對話 session，遊戲狀態以中央化資料結構維護，並透過明確的訊息協定向各 Agent 廣播其視角下的狀態切片。Agent 的決策過程（包含思考鏈）會被結構化記錄，產生可重播、可分析的牌局逐手紀錄。&lt;/p>
&lt;p>設計重點包括：嚴格的資訊隔離（避免 Agent 跨界讀取他人手牌）、可插拔的決策策略、以及將 LLM 的不確定性轉化為可分析的訊號。整體架構接近 actor model，便於後續擴充至其他多 Agent 場景，例如臨床決策模擬或多科會診。&lt;/p>
&lt;h2 id="results結果" >
&lt;div>
&lt;a href="#results%e7%b5%90%e6%9e%9c">
#
&lt;/a>
Results（結果）
&lt;/div>
&lt;/h2>
&lt;p>目前實作可支援多個 AI Agent 同桌進行德州撲克，並完整輸出每位 Agent 的內部推理。研究者得以觀察 LLM 在面對虛張聲勢、跟注、加注等情境下的決策模式，並在不同模型版本之間比較其風險偏好與穩定性。框架本身與遊戲規則弱耦合，撲克僅是初始示範，可被替換為其他規則性博弈。&lt;/p>
&lt;h2 id="discussion討論" >
&lt;div>
&lt;a href="#discussion%e8%a8%8e%e8%ab%96">
#
&lt;/a>
Discussion（討論）
&lt;/div>
&lt;/h2>
&lt;p>本專案的價值不在於打造強撲克 AI，而在於以撲克為「可控的多 Agent 觀測平台」，使我們能以較低成本研究 LLM 的協作與對抗行為。限制方面，目前的決策完全依賴 LLM 即時推理，缺乏 Monte Carlo 等傳統博弈論優化；資訊隔離雖然嚴格，但 LLM 在多回合下仍可能因 prompt 工程不慎而洩漏線索。未來可擴充為臨床多科決策模擬，例如多位 LLM 分別扮演主治醫師、住院醫師與藥師，於同一虛擬病案中協作。&lt;/p>
&lt;h2 id="連結" >
&lt;div>
&lt;a href="#%e9%80%a3%e7%b5%90">
#
&lt;/a>
連結
&lt;/div>
&lt;/h2>
&lt;ul>
&lt;li>GitHub：&lt;a href="https://github.com/htlin222/agentic-holdem">htlin222/agentic-holdem&lt;/a>&lt;/li>
&lt;li>主要語言：TypeScript&lt;/li>
&lt;li>最後更新：2026-05-09&lt;/li>
&lt;/ul></description></item><item><title>conductor-playground：多代理人編排框架的探索性 TypeScript 實驗</title><link>/blog/conductor-playground-2026-03-18/</link><pubDate>Wed, 18 Mar 2026 00:00:00 +0000</pubDate><guid>/blog/conductor-playground-2026-03-18/</guid><description>&lt;h2 id="introduction引言" >
&lt;div>
&lt;a href="#introduction%e5%bc%95%e8%a8%80">
#
&lt;/a>
Introduction（引言）
&lt;/div>
&lt;/h2>
&lt;p>當 LLM 應用從單一 Agent 進入多 Agent 階段，「指揮（conductor）」的角色變得關鍵：誰決定哪個 Agent 處理哪個任務？如何協調彼此的輸出？如何避免無限循環？這些問題並無業界標準解，需要透過實作累積經驗。本專案即是作者探索多 Agent 編排設計的私人實驗場，以 TypeScript 撰寫不同編排策略並比較其行為。&lt;/p>
&lt;h2 id="methods方法" >
&lt;div>
&lt;a href="#methods%e6%96%b9%e6%b3%95">
#
&lt;/a>
Methods（方法）
&lt;/div>
&lt;/h2>
&lt;p>實作以 TypeScript 為主，以模組化方式設計多種編排原型：中央指揮型（一個 conductor 分派任務）、消息總線型（Agent 之間自由訂閱事件）、流水線型（任務依序傳遞）。每種原型皆以同樣的範例任務（如「對一組病例做摘要與分類」）測試，量化比較其延遲、token 用量與正確率。&lt;/p>
&lt;p>整體採取「先嘗試再評論」原則：不預設哪種編排最佳，而是透過實際運行收集行為資料。所有實驗紀錄與結論留存於倉庫內，作為日後設計決策的參考。&lt;/p>
&lt;h2 id="results結果" >
&lt;div>
&lt;a href="#results%e7%b5%90%e6%9e%9c">
#
&lt;/a>
Results（結果）
&lt;/div>
&lt;/h2>
&lt;p>不同編排在不同情境下展現各自優勢：中央指揮在任務界線清晰時最穩定，但 conductor 本身成為瓶頸；消息總線在開放式探索任務上表現靈活，但更難除錯；流水線適合線性流程但缺乏彈性。這些觀察直接影響了作者其他多 Agent 專案（如 &lt;code>agentic-holdem&lt;/code>）的架構選擇。&lt;/p>
&lt;h2 id="discussion討論" >
&lt;div>
&lt;a href="#discussion%e8%a8%8e%e8%ab%96">
#
&lt;/a>
Discussion（討論）
&lt;/div>
&lt;/h2>
&lt;p>本專案實踐了「實驗倉庫驅動工程決策」的方法：在缺乏明確最佳解時，以可觀察的小型原型代替長篇辯論。限制方面，實驗任務簡化過後可能與真實場景行為差異；TypeScript 語言生態雖適合 web 整合，對於後端編排亦有 Python 等替代選項值得比較。未來可擴展為公開的多 Agent 編排基準測試，並接入更多 LLM 供應商以排除模型特異性。&lt;/p>
&lt;h2 id="連結" >
&lt;div>
&lt;a href="#%e9%80%a3%e7%b5%90">
#
&lt;/a>
連結
&lt;/div>
&lt;/h2>
&lt;ul>
&lt;li>GitHub：&lt;a href="https://github.com/htlin222/conductor-playground">htlin222/conductor-playground&lt;/a>&lt;/li>
&lt;li>主要語言：TypeScript&lt;/li>
&lt;li>最後更新：2026-03-18&lt;/li>
&lt;/ul></description></item></channel></rss>