conductor-playground:多代理人編排框架的探索性 TypeScript 實驗
Table of Contents
#
Introduction(引言)
當 LLM 應用從單一 Agent 進入多 Agent 階段,「指揮(conductor)」的角色變得關鍵:誰決定哪個 Agent 處理哪個任務?如何協調彼此的輸出?如何避免無限循環?這些問題並無業界標準解,需要透過實作累積經驗。本專案即是作者探索多 Agent 編排設計的私人實驗場,以 TypeScript 撰寫不同編排策略並比較其行為。
#
Methods(方法)
實作以 TypeScript 為主,以模組化方式設計多種編排原型:中央指揮型(一個 conductor 分派任務)、消息總線型(Agent 之間自由訂閱事件)、流水線型(任務依序傳遞)。每種原型皆以同樣的範例任務(如「對一組病例做摘要與分類」)測試,量化比較其延遲、token 用量與正確率。
整體採取「先嘗試再評論」原則:不預設哪種編排最佳,而是透過實際運行收集行為資料。所有實驗紀錄與結論留存於倉庫內,作為日後設計決策的參考。
#
Results(結果)
不同編排在不同情境下展現各自優勢:中央指揮在任務界線清晰時最穩定,但 conductor 本身成為瓶頸;消息總線在開放式探索任務上表現靈活,但更難除錯;流水線適合線性流程但缺乏彈性。這些觀察直接影響了作者其他多 Agent 專案(如 agentic-holdem)的架構選擇。
#
Discussion(討論)
本專案實踐了「實驗倉庫驅動工程決策」的方法:在缺乏明確最佳解時,以可觀察的小型原型代替長篇辯論。限制方面,實驗任務簡化過後可能與真實場景行為差異;TypeScript 語言生態雖適合 web 整合,對於後端編排亦有 Python 等替代選項值得比較。未來可擴展為公開的多 Agent 編排基準測試,並接入更多 LLM 供應商以排除模型特異性。
#
連結
- GitHub:htlin222/conductor-playground
- 主要語言:TypeScript
- 最後更新:2026-03-18