Skip to content
雲里
里雾

10 Agent Teams——多代理协作

claude code guide AI 更新于 2026/3/26

原文:Orchestrate teams of Claude Code sessions
⚠️ 实验性功能,默认禁用

什么是 Agent Teams

Agent Teams 让多个独立的 Claude Code 实例作为一个团队协作。一个 Lead 会话负责协调,多个 Teammate 会话独立工作,它们通过共享任务列表和点对点消息通信。

类比:如果 SubAgent 是 Worker Thread(后台线程),那 Agent Teams 就是微服务架构——每个 Teammate 是一个独立服务,通过消息队列交换信息。

Agent Teams vs SubAgent

SubAgentAgent Teams
上下文独立窗口,结果回传独立窗口,完全独立
通信只能向主 agent 汇报Teammates 之间直接通信
协调主 agent 管理共享任务列表 + 自协调
Token 成本较低(结果摘要回传)较高(每个 teammate 是独立实例)
适用只需要结果的聚焦任务需要讨论和协作的复杂工作

决策点:如果你的并行任务之间需要互相分享发现、互相质疑,用 Agent Teams。否则用 SubAgent。

架构组件

组件角色
Team Lead主会话,创建团队、分配任务、综合结果
Teammates独立的 Claude Code 实例
Task List共享任务列表(pending → in_progress → completed)
MailboxAgent 间的消息系统

最佳使用场景

  1. 并行 Code Review:安全审查 + 性能审查 + 测试覆盖率审查同时进行
  2. 竞争假设调试:多个 Agent 分别验证不同的 bug 假设,互相质疑
  3. 新模块开发:每个 Agent 负责一个独立模块
  4. 跨层协调:前端 + 后端 + 测试分别由不同 Agent 负责

关键操作

启用

// settings.json
{
  "env": {
    "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
  }
}

启动团队

Create an agent team to review PR #142. Spawn three reviewers:
- One focused on security implications
- One checking performance impact
- One validating test coverage

显示模式

质量门控(Hook)

实际案例:竞争假设调试

Users report the app exits after one message instead of staying connected.
Spawn 5 agent teammates to investigate different hypotheses. Have them talk to
each other to try to disprove each other's theories, like a scientific
debate. Update the findings doc with whatever consensus emerges.

为什么有效:单个 Agent 调查倾向于找到一个合理解释就停止(锚定偏见)。多个 Agent 互相质疑,存活下来的假设更可能是真正的根因。

当前限制


知识检测

概念理解题

  1. Agent Teams 的”竞争假设调试”模式为什么比单个 Agent 调试更有效?这和科学方法论中的什么概念类似?

  2. 为什么文档建议”3-5 个 teammates,每个 5-6 个任务”?更多 teammates 会带来什么问题?

应用题

  1. 你要做一个大型 Web 应用的性能优化。设计一个 Agent Team 配置:Lead 做什么、Teammates 分别负责什么、如何协调。

迁移思考题

  1. OpenClaw 没有 Agent Teams 的等价物。如果你要在 OpenClaw 上实现类似的多 Agent 协作,你会用什么底层机制?(提示:考虑 webhook + isolated session)

参见

参考答案

1. 竞争假设调试的有效性

单个 Agent 调查倾向于锚定偏见——找到第一个合理解释就停止。多个 Agent 互相质疑,每个假设都被挑战,存活下来的更可能是真正的根因。这和科学方法论中的同行评审(peer review)和可证伪性(falsifiability)一致:一个假设如果经不起其他研究者的质疑,就不够可靠。

2. “3-5 个 teammates,5-6 个任务”

每个 teammate 是独立的 Claude 实例——更多意味着更高的 token 成本(线性增长)、更复杂的协调(二次增长)、更多的消息传递开销。而且任务分得太细会导致 teammate 之间的依赖关系复杂化,反而降低效率。3-5 个是经验上的平衡点——足够并行化,又不至于失控。

3. Web 应用性能优化 Agent Team

Lead:总体协调,综合各 teammate 发现,制定优先级修复计划。Teammate 1(Bundle 分析):分析 bundle 大小、依赖树、tree-shaking 和 code splitting 机会。Teammate 2(运行时性能):检查 React re-render、内存泄漏、useMemo/useCallback 使用。Teammate 3(网络与加载):检查 API 调用瀑布、缓存策略、图片优化、Core Web Vitals。协调方式:每个 teammate 把发现写入共享任务列表,Lead 综合后制定优先级。

4. OpenClaw 的多 Agent 协作

OpenClaw 的 Multi-Agent Routing 是路由型(根据消息内容选择哪个 Agent 处理),不是协作型(多个 Agent 讨论同一个问题)。要实现协作型,可以:(1) 多个 isolated session 通过 webhook 互相传递消息 (2) 一个”协调者” Agent 通过 agent RPC 调用其他 Agent (3) 用共享的 Memory 文件作为”白板”——每个 Agent 把发现写入,其他 Agent 读取。但这比 Claude Code Agent Teams 的原生支持复杂得多。