乐于分享
好东西不私藏

OpenClaw 多 Agent 编排实战:像管理团队一样管理你的 AI

OpenClaw 多 Agent 编排实战:像管理团队一样管理你的 AI

当你的 AI 助理不止一个,谁来当它们的老板?

你有没有遇到过这种情况:

跟 AI 聊着代码,它突然记不清上下文了。让它写文章,又怕它编造事实。让它操作文件,又担心权限太大。

一个 AI 助理包打天下,本身就是个 bug。

现实世界的团队从来不是这样的——CEO 做决策,工程师写代码,设计师做 UI,QA 测 Bug。各司其职。

那么,AI 能不能也这么干?

答案是:可以。在 OpenClaw 里,这件事叫做 多 Agent 编排。今天的文章,就来拆解我是怎么用这个机制搭了一套「内容工厂」的。


一、为什么需要多 Agent?

先看看单 Agent 模式的几个死穴:

  • 上下文窗口有限:聊二十分钟就开始「失忆」
  • 任务切换混乱:刚在写代码,突然让它查天气,再回来写代码——上下文早就窜了
  • 模型各有短板:Claude 写长文强,但代码不如 GPT;DeepSeek 便宜但创意不够
  • 权限边界模糊:能读你文件的 Agent,也能执行命令,安全上睡不踏实

多 Agent 编排的思路很简单:把一个大问题拆成多个小问题,每个交给最擅长它的 Agent 去处理。

像管团队一样管 AI。


二、OpenClaw 的多 Agent 机制

OpenClaw 通过两个核心机制实现多 Agent 编排:

1. subagents.allowAgents:定义系统中有哪些 Agent 类型可用

2. sessions_spawn:动态创建子 Agent 任务会话

架构长这样:

主编 Agent(Content Director)
    ├── 写手 Agent(Content Writer)
    ├── 设计师 Agent(Content Designer)
    ├── 审核 Agent(Content Reviewer)
    └── 排版 Agent(Content Formatter)

主编负责拆任务、派活、收成果。子 Agent 各自在自己的 workspace 里干活,互不干扰。


三、实战拆解:内容工厂工作流

这是我目前在跑的一套「内容工厂」,专职生产公众号文章。完整流程:

主编定方向 → 写手出初稿 → 审核过一遍 → 设计师配图 → 排版美化 → 发布

每个 Agent 都有自己的配置:

主编:大脑

{
  id: 「content-director」,
  name: 「内容主编」,
  model: { primary: 「deepseek/deepseek-v4-flash」 },
  tools: {
    allow: [「read」, 「write」, 「edit」, 「exec」, 「sessions_spawn」, 「sessions_send」],
  },
  subagents: {
    allowAgents: [「content-writer」, 「content-designer」, 「content-reviewer」, 「content-formatter」]
  }
}

主编用最强模型(DeepSeek V4 Flash),因为它要决策、拆任务、判断质量。最关键的是它拥有 sessions_spawn 权限——只有它能创建子 Agent

写手:执行者

{
  id: 「content-writer」,
  name: 「文案专家」,
  model: { primary: 「mimo/mimo-v2-flash」 },
  tools: {
    allow: [「read」, 「write」, 「edit」, 「exec」, 「browser」],
    deny: [「sessions_spawn」, 「sessions_send」, 「cron」]
  }
}

写手用轻量模型(Mimo V2 Flash,免费且够用),专注于写作本身。它没有权限 spawn 子 Agent,这就避免了权限扩散。

审核:把关人

{
  id: 「content-reviewer」,
  name: 「质量审核」,
  model: { primary: 「mimo/mimo-v2-flash」 },
  tools: {
    allow: [「read」, 「write」, 「edit」, 「exec」],
    deny: [「browser」, 「sessions_spawn」, 「sessions_send」, 「cron」, 「image」]
  }
}

审核的权限更少——不能上网、不能发消息、不能创建新 Agent。它只管一件事:读稿子、挑毛病、改到满意。

设计师:美化

{
  id: 「content-designer」,
  name: 「视觉设计师」,
  model: { primary: 「mimo/mimo-v2-omni」 },
  skills: [「kling-image-generator」, 「xqx-image-generator」, 「pure-png-generator」]
}

设计师用多模态模型(Mimo V2 Omni),能理解和生成图片。它不写文章、不执行命令,只做视觉。

排版:产出成品

{
  id: 「content-formatter」,
  name: 「排版助手」,
  skills: [「aws-wechat-article-formatting」]
}

排版最轻量,专门做 Markdown → 公众号 HTML 的转换。


四、协同方式:主编怎么「管人」

当我说「帮我写一篇关于 OpenClaw 多 Agent 的文章」,主编是这样干活的:

1. 拆任务:先理解需求,拆出大纲

2. spawn 写手:把大纲传给写手

sessions_spawn({
  agentId: 「content-writer」,
  task: 「按大纲写一篇 3000 字的文章...」
})

3. spawn 审核:初稿出来后,发给审核

sessions_spawn({
  agentId: 「content-reviewer」,
  task: 「审核这篇文章,检查事实准确性和可读性...」
})

4. 收结果、合并:把所有子 Agent 的产出收回来,做最终整合

每个子 Agent 跑在独立的 session 里,上下文隔离、权限隔离。主编通过 sessions_spawn 的返回值拿到结果,再决定下一步。

关键机制:子 Agent 完成任务后自动通知主编,不需要轮询。主编收到通知后继续推进流程。


五、踩坑总结

跑了一个多月,几个真实经验:

模型选型别上头

主编用最强模型(DeepSeek V4 / Claude),其他子任务用便宜模型(Mimo Flash)就够了。写文章这种活儿,Mimo Flash 免费且够用,省钱的同时还快。

权限隔离是安全底线

大胆 deny。审核 Agent 不需要 sessions_spawn,写手不需要 cron,设计师不需要 exec给每个 Agent 最低必要权限,出问题也炸不到别的地方。

子 Agent 超时要兜底

有些任务(比如生成图片)可能会跑很久。主编层要做好超时处理——超时就换个模型重试,或者降级成文本占位。

信息传递要简洁

sessions_spawn 传 context 时,别把整篇文章都塞进去。传大纲、关键词就够了,让子 Agent 自己去读文件。context 越小,启动越快。


六、什么时候该用多 Agent?

适合你:

  • 工作流涉及多个不同领域的技能(写稿 + 配图 + 排版)
  • 需要不同模型处理不同类型任务
  • 对安全隔离有要求
  • 流程是确定性的,可以拆成步骤

不适合:

  • 只是简单对话,一个 Agent 绰绰有余
  • 需要极低延迟的实时交互
  • 任务高度不可预测,没法提前拆解

七、结语

多 Agent 编排这件事,本质上是一种架构思维:不要试图造一个全能的 AI,而是造一个能调用其他 AI 的 AI。

OpenClaw 的 subagents.allowAgents + sessions_spawn 机制,让这件事的门槛低到了「写几行配置就能跑」的程度。

我现在的内容工厂已经稳定跑了一个多月。这篇文章本身就是它生产的——主编派活、写手撰稿、排版美化。你正在读的每一个字,都是一个 AI 团队协作的结果。

你的 AI 助理,不需要什么都会。它只需要知道该叫谁来干。


本文由 OpenClaw 内容工厂多 Agent 系统协作完成。