乐于分享
好东西不私藏

OpenClaw 实战第 11 篇:多 Agent 协作——让 AI 自己管 AI

OpenClaw 实战第 11 篇:多 Agent 协作——让 AI 自己管 AI

OpenClaw 实战第 11 篇:多 Agent 协作——让 AI 自己管 AI

上一篇讲了记忆系统,让 AI 真正认识你。今天往上走一层:

一个 AI 不够用的时候怎么办?再来一个。

这不是科幻。OpenClaw 原生支持"主 Agent 派活给子 Agent",就像你在公司安排下属干活一样——你说需求,它分配任务,各自独立执行,完成后汇报。

你终于可以当甩手掌柜了。


1. 为什么需要多 Agent?

先说一个场景。

你让 AI 帮你做三件事:

  1. 查一下最近的行业新闻
  2. 把昨天写的文章改一版
  3. 搜一下某个 API 的用法

如果只有一个 Agent,它只能串行处理——做完第一件才做第二件。你等着,它忙着,效率极低。

更糟的是,这三件事的上下文完全不同。新闻搜索的结果塞进对话里,污染了你改文章的上下文。到第三件事,前面的内容已经把窗口挤满了。

多 Agent 解决的核心问题:并行 + 隔离。

每个子 Agent 有自己的会话、自己的上下文、自己的 token 预算。互不干扰,同时开工。


2. OpenClaw 的两种协作模式

2.1 模式一:Sub-agent(原生子代理)

这是 OpenClaw 自己的多 Agent 系统。主 Agent 通过 sessions_spawn 工具派生子 Agent,子 Agent 跑完后自动把结果汇报回来。

适合场景:

  • 后台调研、搜索汇总
  • 数据处理、批量操作
  • 任何"帮我做个事,做完告诉我"的需求

实际操作:

你只需要用自然语言说:

“帮我同时做三件事:查今天科技新闻、总结昨天的会议纪要、看看我的邮箱有没有重要邮件。”

OpenClaw 会自动:

  1. 拆解成三个独立任务
  2. 派生三个子 Agent 并行执行
  3. 各自完成后汇报结果
  4. 主 Agent 汇总给你

你也可以用命令精确控制:


  
    
    
    
  
  bash
/subagents spawn default "搜索最近一周 AI Agent 领域的重要新闻,整理成中文摘要"

2.2 模式二:ACP(Agent Client Protocol)

如果你想用外部的编程 Agent——比如 Codex、Claude Code、Gemini CLI——OpenClaw 通过 ACP 协议把它们接入。

适合场景:

  • 写代码、改代码、审代码
  • 需要专业编程能力的任务
  • 想在聊天里直接操控编程 Agent

实际操作:

“用 Codex 帮我写一个 Python 脚本,抓取豆瓣电影 Top 250。”

或者用命令:


  
    
    
    
  
  bash
/acp spawn codex --thread auto

Codex 会在一个独立线程里工作,你可以随时跟它对话、调整需求,完全不影响主 Agent。


3. 一个真实例子:我如何用多 Agent 写公众号

我写这个系列就在用多 Agent 协作。流程大概是这样:

第一步:主 Agent 规划选题

我说:“写下一篇公众号。”

主 Agent 读记忆系统,知道前 10 篇写了什么、下一篇预告了什么,给出大纲。

第二步:派子 Agent 搜索素材

主 Agent 派一个子 Agent 去搜索最新的多 Agent 协作案例、技术文章、用户反馈。

第三步:主 Agent 撰写全文

素材回来后,主 Agent 结合大纲和素材,写完整篇文章。

第四步:派子 Agent 做排版发布

写完后,再派一个子 Agent 把 Markdown 转成公众号格式,调用发布工具。

四步下来,整个过程我只说了一句话。其余全是 AI 自己在协调。


4. Sub-agent 的关键设计

OpenClaw 的子 Agent 不是简单的"多开几个对话框"。它有几个精心设计的点:

4.1 1. 完全隔离

每个子 Agent 有独立的 session、独立的上下文窗口、独立的 token 计数。主 Agent 的对话不会被子 Agent 的内容污染。

4.2 2. 自动汇报

子 Agent 跑完会自动把结果发回主 Agent 所在的对话。你不需要去找它、等它、问它——它做完了就来告诉你。

4.3 3. 模型可配

子 Agent 可以用不同的模型。比如主 Agent 用 Claude Opus(贵但聪明),子 Agent 用 GPT-4o-mini(便宜但够用)。

在配置文件里设:


  
    
    
    
  
  yaml
agents:
  defaults:
    subagents:
      model: openai/gpt-4o-mini

省钱秘诀: 把"搜索汇总"这类不需要高智商的任务扔给便宜模型,主 Agent 只负责最终决策和输出。

4.4 4. 可管理

随时查看、介入、终止子 Agent:


  
    
    
    
  
  bash
/subagents list          # 看看谁在跑
/subagents log 1         # 看某个子 Agent 的输出
/subagents steer 1 "重点关注价格信息"  # 中途调整方向
/subagents kill 1        # 取消某个任务

5. ACP 模式深入:把编程 Agent 当同事用

ACP 最酷的地方在于线程绑定(Thread Binding)

在 Discord 或飞书这类支持线程/话题的平台上,你可以:

  1. 创建一个线程
  2. 把 Codex 或 Claude Code 绑定到这个线程
  3. 在线程里直接跟编程 Agent 对话
  4. 主频道继续跟主 Agent 聊

就像公司里有个程序员同事,你在一个群里给他派活,其他事在其他群聊。

一个实际场景:

你在主对话里说:

“帮我起一个 Codex 线程,把我的爬虫脚本改成异步的。”

OpenClaw 会:

  1. 创建一个新线程
  2. 在线程里启动 Codex
  3. 把你的代码仓库挂载进去
  4. Codex 开始工作

你可以切到那个线程里看进度、提修改意见,也可以不管——它做完会通知你。


6. 常见问题

Q:子 Agent 能访问我的文件吗?

默认情况下,子 Agent 继承主 Agent 的沙箱环境。如果你需要更严格的隔离,可以设 sandbox: "require"

Q:子 Agent 之间能互相通信吗?

不能直接通信。它们只跟主 Agent 汇报。如果需要协调,由主 Agent 做中间人。这是有意的设计——防止子 Agent 之间形成不可控的通信链。

Q:会不会很贵?

每个子 Agent 有自己的 token 用量,所以确实会多花钱。但关键是——你可以给子 Agent 配便宜模型。一般来说,用 gpt-4o-mini 做搜索和汇总,成本几乎可以忽略。

Q:最多能同时跑几个?

没有硬限制,但建议控制在 3-5 个。太多了你也管不过来,而且会增加协调复杂度。


7. 给你一个最小行动

  1. 跟你的 OpenClaw 说:“帮我同时查两件事——今天的天气和最近的科技新闻。”
  2. 观察它是否自动派了子 Agent(或者提示它:“用子 Agent 并行处理”)
  3. 等结果回来,体验一下"AI 帮你管 AI"的感觉
  4. 试试 /subagents list 看看后台在跑什么
  5. 如果你有编程需求,试试 /acp spawn codex 感受 ACP 模式

一旦习惯了多 Agent,你会觉得以前一个 Agent 串行干活的方式,就像用记事本写代码一样原始。


下一篇:《OpenClaw 实战第 12 篇:插件系统——给你的 AI 装上新能力》

系列持续更新中,关注不迷路。