agentic-holdem：以德州撲克為示範的多 Agent Claude Code 編排框架

Sat, 09 May 2026 00:00:00 +0000

# Introduction（引言）

多 Agent 系統已成為 AI 工程的關鍵研究方向，但多數討論仍停留在抽象架構或工作流圖示，缺乏直觀的場域可供觀察其行為。德州撲克因其資訊不完全、需要心理博弈、且具備明確賽制與輪次規則，是檢驗多 Agent 推理、決策與互動的理想實驗場。本專案以撲克為載體，建構一個可觀察 Agent 行為的最小編排框架。

研究問題在於：當 N 個獨立、不共享內部狀態的 LLM Agent 必須在同一個遊戲狀態之下競爭時，如何確保每個 Agent 僅能取得其應該知道的資訊（手牌、籌碼、歷史下注），並讓整體系統的推理過程可被外部觀察與審計。

# Methods（方法）

框架以 TypeScript 撰寫，並深度整合 Claude Code 作為 Agent 後端。每個 Agent 為獨立進程或對話 session，遊戲狀態以中央化資料結構維護，並透過明確的訊息協定向各 Agent 廣播其視角下的狀態切片。Agent 的決策過程（包含思考鏈）會被結構化記錄，產生可重播、可分析的牌局逐手紀錄。

設計重點包括：嚴格的資訊隔離（避免 Agent 跨界讀取他人手牌）、可插拔的決策策略、以及將 LLM 的不確定性轉化為可分析的訊號。整體架構接近 actor model，便於後續擴充至其他多 Agent 場景，例如臨床決策模擬或多科會診。

# Results（結果）

目前實作可支援多個 AI Agent 同桌進行德州撲克，並完整輸出每位 Agent 的內部推理。研究者得以觀察 LLM 在面對虛張聲勢、跟注、加注等情境下的決策模式，並在不同模型版本之間比較其風險偏好與穩定性。框架本身與遊戲規則弱耦合，撲克僅是初始示範，可被替換為其他規則性博弈。

# Discussion（討論）

本專案的價值不在於打造強撲克 AI，而在於以撲克為「可控的多 Agent 觀測平台」，使我們能以較低成本研究 LLM 的協作與對抗行為。限制方面，目前的決策完全依賴 LLM 即時推理，缺乏 Monte Carlo 等傳統博弈論優化；資訊隔離雖然嚴格，但 LLM 在多回合下仍可能因 prompt 工程不慎而洩漏線索。未來可擴充為臨床多科決策模擬，例如多位 LLM 分別扮演主治醫師、住院醫師與藥師，於同一虛擬病案中協作。

# 連結

GitHub：htlin222/agentic-holdem
主要語言：TypeScript
最後更新：2026-05-09

conductor-playground：多代理人編排框架的探索性 TypeScript 實驗

Wed, 18 Mar 2026 00:00:00 +0000

# Introduction（引言）

當 LLM 應用從單一 Agent 進入多 Agent 階段，「指揮（conductor）」的角色變得關鍵：誰決定哪個 Agent 處理哪個任務？如何協調彼此的輸出？如何避免無限循環？這些問題並無業界標準解，需要透過實作累積經驗。本專案即是作者探索多 Agent 編排設計的私人實驗場，以 TypeScript 撰寫不同編排策略並比較其行為。

# Methods（方法）

實作以 TypeScript 為主，以模組化方式設計多種編排原型：中央指揮型（一個 conductor 分派任務）、消息總線型（Agent 之間自由訂閱事件）、流水線型（任務依序傳遞）。每種原型皆以同樣的範例任務（如「對一組病例做摘要與分類」）測試，量化比較其延遲、token 用量與正確率。

整體採取「先嘗試再評論」原則：不預設哪種編排最佳，而是透過實際運行收集行為資料。所有實驗紀錄與結論留存於倉庫內，作為日後設計決策的參考。

# Results（結果）

不同編排在不同情境下展現各自優勢：中央指揮在任務界線清晰時最穩定，但 conductor 本身成為瓶頸；消息總線在開放式探索任務上表現靈活，但更難除錯；流水線適合線性流程但缺乏彈性。這些觀察直接影響了作者其他多 Agent 專案（如 agentic-holdem）的架構選擇。

# Discussion（討論）

本專案實踐了「實驗倉庫驅動工程決策」的方法：在缺乏明確最佳解時，以可觀察的小型原型代替長篇辯論。限制方面，實驗任務簡化過後可能與真實場景行為差異；TypeScript 語言生態雖適合 web 整合，對於後端編排亦有 Python 等替代選項值得比較。未來可擴展為公開的多 Agent 編排基準測試，並接入更多 LLM 供應商以排除模型特異性。

# 連結

GitHub：htlin222/conductor-playground
主要語言：TypeScript
最後更新：2026-03-18

orchestration on 林協霆醫師

agentic-holdem：以德州撲克為示範的多 Agent Claude Code 編排框架

# Introduction（引言）

# Methods（方法）

# Results（結果）

# Discussion（討論）

# 連結

conductor-playground：多代理人編排框架的探索性 TypeScript 實驗

# Introduction（引言）

# Methods（方法）

# Results（結果）

# Discussion（討論）

# 連結