OpenClaw 多 Agent 编排实战:像管理团队一样管理你的 AI
当你的 AI 助理不止一个,谁来当它们的老板?
你有没有遇到过这种情况:
跟 AI 聊着代码,它突然记不清上下文了。让它写文章,又怕它编造事实。让它操作文件,又担心权限太大。
一个 AI 助理包打天下,本身就是个 bug。
现实世界的团队从来不是这样的——CEO 做决策,工程师写代码,设计师做 UI,QA 测 Bug。各司其职。
那么,AI 能不能也这么干?
答案是:可以。在 OpenClaw 里,这件事叫做 多 Agent 编排。今天的文章,就来拆解我是怎么用这个机制搭了一套「内容工厂」的。
一、为什么需要多 Agent?
先看看单 Agent 模式的几个死穴:
- 上下文窗口有限:聊二十分钟就开始「失忆」
- 任务切换混乱:刚在写代码,突然让它查天气,再回来写代码——上下文早就窜了
- 模型各有短板:Claude 写长文强,但代码不如 GPT;DeepSeek 便宜但创意不够
- 权限边界模糊:能读你文件的 Agent,也能执行命令,安全上睡不踏实
多 Agent 编排的思路很简单:把一个大问题拆成多个小问题,每个交给最擅长它的 Agent 去处理。
像管团队一样管 AI。
二、OpenClaw 的多 Agent 机制
OpenClaw 通过两个核心机制实现多 Agent 编排:
1. subagents.allowAgents:定义系统中有哪些 Agent 类型可用
2. sessions_spawn:动态创建子 Agent 任务会话
架构长这样:
主编 Agent(Content Director)
├── 写手 Agent(Content Writer)
├── 设计师 Agent(Content Designer)
├── 审核 Agent(Content Reviewer)
└── 排版 Agent(Content Formatter)
主编负责拆任务、派活、收成果。子 Agent 各自在自己的 workspace 里干活,互不干扰。
三、实战拆解:内容工厂工作流
这是我目前在跑的一套「内容工厂」,专职生产公众号文章。完整流程:
主编定方向 → 写手出初稿 → 审核过一遍 → 设计师配图 → 排版美化 → 发布
每个 Agent 都有自己的配置:
主编:大脑
{
id: 「content-director」,
name: 「内容主编」,
model: { primary: 「deepseek/deepseek-v4-flash」 },
tools: {
allow: [「read」, 「write」, 「edit」, 「exec」, 「sessions_spawn」, 「sessions_send」],
},
subagents: {
allowAgents: [「content-writer」, 「content-designer」, 「content-reviewer」, 「content-formatter」]
}
}
主编用最强模型(DeepSeek V4 Flash),因为它要决策、拆任务、判断质量。最关键的是它拥有 sessions_spawn 权限——只有它能创建子 Agent。
写手:执行者
{
id: 「content-writer」,
name: 「文案专家」,
model: { primary: 「mimo/mimo-v2-flash」 },
tools: {
allow: [「read」, 「write」, 「edit」, 「exec」, 「browser」],
deny: [「sessions_spawn」, 「sessions_send」, 「cron」]
}
}
写手用轻量模型(Mimo V2 Flash,免费且够用),专注于写作本身。它没有权限 spawn 子 Agent,这就避免了权限扩散。
审核:把关人
{
id: 「content-reviewer」,
name: 「质量审核」,
model: { primary: 「mimo/mimo-v2-flash」 },
tools: {
allow: [「read」, 「write」, 「edit」, 「exec」],
deny: [「browser」, 「sessions_spawn」, 「sessions_send」, 「cron」, 「image」]
}
}
审核的权限更少——不能上网、不能发消息、不能创建新 Agent。它只管一件事:读稿子、挑毛病、改到满意。
设计师:美化
{
id: 「content-designer」,
name: 「视觉设计师」,
model: { primary: 「mimo/mimo-v2-omni」 },
skills: [「kling-image-generator」, 「xqx-image-generator」, 「pure-png-generator」]
}
设计师用多模态模型(Mimo V2 Omni),能理解和生成图片。它不写文章、不执行命令,只做视觉。
排版:产出成品
{
id: 「content-formatter」,
name: 「排版助手」,
skills: [「aws-wechat-article-formatting」]
}
排版最轻量,专门做 Markdown → 公众号 HTML 的转换。
四、协同方式:主编怎么「管人」
当我说「帮我写一篇关于 OpenClaw 多 Agent 的文章」,主编是这样干活的:
1. 拆任务:先理解需求,拆出大纲
2. spawn 写手:把大纲传给写手
sessions_spawn({
agentId: 「content-writer」,
task: 「按大纲写一篇 3000 字的文章...」
})
3. spawn 审核:初稿出来后,发给审核
sessions_spawn({
agentId: 「content-reviewer」,
task: 「审核这篇文章,检查事实准确性和可读性...」
})
4. 收结果、合并:把所有子 Agent 的产出收回来,做最终整合
每个子 Agent 跑在独立的 session 里,上下文隔离、权限隔离。主编通过 sessions_spawn 的返回值拿到结果,再决定下一步。
关键机制:子 Agent 完成任务后自动通知主编,不需要轮询。主编收到通知后继续推进流程。
五、踩坑总结
跑了一个多月,几个真实经验:
模型选型别上头
主编用最强模型(DeepSeek V4 / Claude),其他子任务用便宜模型(Mimo Flash)就够了。写文章这种活儿,Mimo Flash 免费且够用,省钱的同时还快。
权限隔离是安全底线
大胆 deny。审核 Agent 不需要 sessions_spawn,写手不需要 cron,设计师不需要 exec。给每个 Agent 最低必要权限,出问题也炸不到别的地方。
子 Agent 超时要兜底
有些任务(比如生成图片)可能会跑很久。主编层要做好超时处理——超时就换个模型重试,或者降级成文本占位。
信息传递要简洁
sessions_spawn 传 context 时,别把整篇文章都塞进去。传大纲、关键词就够了,让子 Agent 自己去读文件。context 越小,启动越快。
六、什么时候该用多 Agent?
✅ 适合你:
- 工作流涉及多个不同领域的技能(写稿 + 配图 + 排版)
- 需要不同模型处理不同类型任务
- 对安全隔离有要求
- 流程是确定性的,可以拆成步骤
❌ 不适合:
- 只是简单对话,一个 Agent 绰绰有余
- 需要极低延迟的实时交互
- 任务高度不可预测,没法提前拆解
七、结语
多 Agent 编排这件事,本质上是一种架构思维:不要试图造一个全能的 AI,而是造一个能调用其他 AI 的 AI。
OpenClaw 的 subagents.allowAgents + sessions_spawn 机制,让这件事的门槛低到了「写几行配置就能跑」的程度。
我现在的内容工厂已经稳定跑了一个多月。这篇文章本身就是它生产的——主编派活、写手撰稿、排版美化。你正在读的每一个字,都是一个 AI 团队协作的结果。
你的 AI 助理,不需要什么都会。它只需要知道该叫谁来干。
本文由 OpenClaw 内容工厂多 Agent 系统协作完成。
夜雨聆风