乐于分享
好东西不私藏

我用OpenClaw搭了一支AI开发团队,现在我只跟一个人说话

我用OpenClaw搭了一支AI开发团队,现在我只跟一个人说话

你只需要跟一个人说话

如果你是一个人开发者,或者带着一个小团队在做产品,你一定熟悉这种感觉——一个功能从需求到上线,你得先当产品经理梳理逻辑,再当架构师设计方案,然后切换成程序员写代码,写完还得自己测试,最后才能部署。一个人在五个角色之间反复横跳,不仅耗尽耐心,更关键的是——每个角色的思维模式都不一样,切换的代价比你想象的要大得多。

我之前也是这样。直到我用 OpenClaw 搭了一整支 AI 开发团队,事情变了。现在我只需要在飞书群里发一条消息,说清楚我要什么,然后去泡杯咖啡——等我回来,需求文档写好了,技术方案出来了,代码写完了,测试也跑通了。全程我不需要跟任何一个“人”对话,只跟一个名叫 Director 的 Agent 沟通。它会自己协调团队里其他几个 Agent,把事情干完。

这篇文章,我就把这套方案的原理和搭建过程彻底拆解给你看。不吹不黑,只讲干货,让你看完就能自己动手搭一套。

图 1:从“一个人当五个人用”到“五个 AI 帮你干活”

为什么单 Agent 不够用

在聊多 Agent 之前,先说说单 Agent 的问题。如果你用过 OpenClaw,你很可能一直在用默认的 main Agent 做所有事情。写代码找它,写文档找它,整理会议纪要找它,甚至周末想让它推荐部电影也找它。刚开始感觉还好,用久了你会发现三个致命问题。

第一个问题叫“上下文污染”。你让它写代码的时候,它的记忆里充满了代码片段、错误日志和技术讨论;等你切换到让它写产品文档,它可能会在文档里冒出一段 TypeScript 代码。这不是模型的错,而是因为同一个 Agent 的记忆和系统提示词里混杂了太多不同领域的信息。就像你让一个人同时兼职产品经理和后端开发,很快他就会在两个角色之间互相污染。

第二个问题是“人设混乱”。当你的系统提示词里同时定义了“你是一个严谨的代码审查员”和“你是一个善于倾听的需求分析师”,模型会在两种性格之间摇摆不定,输出质量显著下降。它可能在审查代码时突然变得很“客气”,不指出问题;或者在分析需求时突然开始写代码。这种角色混乱是单 Agent 架构的结构性缺陷。

第三个问题是“Token 浪费”。每次请求都要加载整个系统提示词和所有相关记忆,其中大量内容对当前任务完全无用。写代码的时候不需要加载会议纪要的记忆,写文档的时候也不需要加载代码库的信息。这不仅增加了成本,还降低了响应质量,因为模型的注意力被无关信息分散了。

OpenClaw 的多 Agent 架构正是为解决这些问题而生的。每个 Agent 都是一个完全独立的“虚拟员工”,有自己的工作区、自己的记忆、自己的性格设定。产品经理的工作区里只有需求文档和用户故事,开发工程师的工作区里只有代码和技术方案。它们各司其职,互不干扰,通过标准化的任务派发和结果回调完成协作。这就像一个真实的公司里,产品部和技术部各有各的办公室和文件柜,谁也不会去翻别人的桌子。

架构设计:一个“项目总监”带四个“打工人”

整个方案的核心思路其实很简单:你只跟一个 Agent 打交道,这个 Agent 就是“项目总监”,我们叫它 Director。它负责接收你的需求,然后把任务拆解后派发给团队里的其他专业 Agent。其他 Agent 完成任务后,结果会回传给 Director,由 Director 汇总后统一回复给你。

从你的角度看,你永远只跟 Director 对话。你不需要知道后面有几个 Agent、它们怎么分工的、用的什么模型。就像在真实公司里,你作为老板只跟项目经理沟通,不会直接去找每个程序员说“你帮我写个登录接口”。这就是整套方案最核心的价值——降低你的认知负担,让你只需要说清楚“我要什么”就够了。

图 2:星形架构 —— Director 作为中枢协调全部子 Agent

五个角色各司其职

我的团队里配置了五个 Agent,每个都有明确的职责边界。这一点非常重要,很多人搭多 Agent 时最容易犯的错误就是角色职责重叠,比如让“开发工程师”和“架构师”做太多相似的事情,最后变成了两个人写重复的代码。

Agent 角色               AgentID                                               核心职责                                      

项目总监

director

接收需求,拆解任务,调度子 Agent,汇总结果

产品经理

pm

需求分析、场景梳理、验收标准定义

架构师

architect

技术选型、接口设计、数据库方案

开发工程师

developer

代码编写、单元测试、代码提交

测试工程师

tester

测试用例设计、自动化测试、Bug 报告

其中 Director 是唯一跟外部渠道(Channel)直接连接的 Agent。你在飞书、Telegram、Discord 或企业微信里发的每一条消息,都会被路由到 Director。而 pm、architect、developer、tester 这四个子 Agent 对你来说是不可见的,它们只跟 Director 沟通,完成自己的工作后把结果交回给 Director。你只会看到 Director 汇报的最终结果。

OpenClaw 里实现这种主从关系的关键机制叫 Sub-Agents。Director 通过 sessions_spawn 工具调用子 Agent,设置超时时间和任务描述,等待结果返回。整个过程是同步的——Director 发出任务后会阻塞等待,直到子 Agent 返回结果或者超时。这就像项目经理把任务派给程序员后,等着收到交付物再继续下一步。

工作流:从一句话到完整项目

说完架构,再看具体的工作流是怎么跑的。假设你在飞书群里发了一条消息:“我需要一个用户登录功能,支持手机号和邮箱两种方式,包含短信验证码登录。”

图 3:软件开发全流程流转示意

第一步,Director 收到你的消息后,会先判断这是一个开发任务,然后把需求转发给产品经理 Agent。产品经理会在自己的工作区里生成一份结构化的需求文档,包括功能描述、用户故事、边界条件和验收标准。它不会像普通聊天机器人那样给你一段全文,而是会按照正规的产品文档格式输出,甚至会主动问你一些潜在的模糊点——“短信验证码的过期时间是多少?”“登录失败几次后需要锁定账号吗?”

第二步,需求文档回到 Director 手里后,Director 会把它发给架构师 Agent。架构师的工作是根据需求文档出技术方案:选用什么技术栈、数据库表怎么设计、接口怎么定义、第三方短信服务用哪家的。这个过程中,架构师会在自己的工作区里创建技术方案文档,保存在自己的文件目录里。你看不到这份文档的创建过程,但它确实存在于架构师 Agent 的工作空间中。

第三步,技术方案确定后,Director 把它转发给开发工程师 Agent。开发工程师是真正干活的人,它会根据需求文档和技术方案写代码。不是写在聊天框里,而是真实地在它自己的工作区里创建文件、写入代码。写完后,它会自己跑一遍单元测试,确保基本能跑通,然后把代码提交给 Director。

第四步,Director 把代码和需求文档一起发给测试工程师 Agent。测试工程师会先根据需求文档里的验收标准设计测试用例,然后运行测试。如果发现 Bug,它会把 Bug 报告回传给 Director。Director 再把 Bug 报告转发给开发工程师修复,修复完再跑测试,形成一个闭环。这个过程会自动循环,直到测试全部通过。

最后,Director 把所有结果汇总成一份清晰的报告发给你:需求文档在哪、技术方案在哪、代码在哪、测试结果怎么样。你只需要去各个 Agent 的工作区查看它们生成的文件,进行 Review 就行了。

图 4:你只需要像这样,发一条消息,剩下的事交给团队

手把手搭建你的 AI 开发团队

接下来进入实操环节。我会从零开始,把整个搭建过程拆解得清清楚楚。前提条件很简单:你的机器上已经安装好了 OpenClaw,配置好了至少一个模型的 API Key,并且已经连接了一个聊天渠道(比如飞书或者 Telegram)。如果你还没有完成这些,OpenClaw 官方文档里的快速开始指南很容易跟随。

第一步:创建五个 Agent

在终端里运行以下命令,五个 Agent 就创建好了。每个 Agent 会自动生成一个独立的工作区目录。

openclaw agents add director –workspace director

openclaw agents add pm –workspace pm

openclaw agents add architect –workspace architect

openclaw agents add developer –workspace developer

openclaw agents add tester –workspace tester

运行 openclaw agents list 可以确认创建成功。此时你的机器上会多出几个目录,每个 Agent 都有自己的一方天地。

图 5:每个 Agent 都有独立的工作区和配置文件

第二步:给每个 Agent 定义“灵魂”

创建完成后,每个 Agent 的工作区目录里会有两个关键文件:SOUL.md 和 AGENTS.md。这两个文件决定了每个 Agent “是谁”和“干什么”。

SOUL.md 是人格定义文件,它告诉这个 Agent “我是一个怎样的人”。比如产品经理的 SOUL.md 可以写:“你是一位细心的产品经理,擅长把模糊的需求变成清晰的产品文档。你会主动追问不明确的点,不会自己脑补。”而开发工程师的 SOUL.md 可以写:“你是一位严谨的后端开发工程师,只写可运行的代码,不写伪代码。代码要干净、有注释、遵循团队规范。”

AGENTS.md 是工作流程定义文件,它告诉这个 Agent “怎么工作”。比如 Director 的 AGENTS.md 里会明确写出它的协调逻辑:收到需求后先调用 pm,等 pm 返回需求文档后调用 architect,然后是 developer,最后是 tester。这种显式的工作流定义让每个 Agent 的行为可预测、可控。

下面是一个 Director 的 SOUL.md 示例,你可以直接拿去用,根据自己的情况调整:

# SOUL.md – Director

你是一位经验丰富的项目总监,负责协调团队完成软件开发任务。

你的工作顺序是:pm -> architect -> developer -> tester。

每个环节完成后检查质量,不过关不放行。

最终向用户汇报全部结果,包括文档位置和质量评估。

第三步:配置渠道绑定

这一步是让 Director 成为你唯一的入口。编辑 OpenClaw 的主配置文件,在 bindings 配置里把你的聊天群绑定到 director。这样,你在这个群里发的每一条消息都会被路由到 Director,而不是其他 Agent。

{

“bindings”:[{

“agentId”:“director”,

“match”:{

“channel”:“feishu”,

“peer”:{ “kind”: “group”, “id”: “你的群ID” }

}

}]

}

配置完成后重启 OpenClaw Gateway,整个系统就跑起来了。你可以在群里发一条简单的消息测试一下:“帮我开发一个用户注册功能。”然后观察 Director 是否正确地调用了 pm、architect 等子 Agent。第一次跑的时候建议用简单的任务,确认整个流转通畅后再逐步加大任务的复杂度。

我踩过的坑,你不用再踩

坑一:子 Agent 之间的信息传递不是自动的

刚开始我以为 Director 调用 pm 后,pm 生成的需求文档会自动传给 architect。其实不是。每个子 Agent 完成任务后,结果只会返回给 Director。Director 需要在自己的 AGENTS.md 里明确定义“拿到 pm 的需求文档后,把它作为上下文发给 architect”。如果你不写清楚这个流转逻辑,Director 可能会把上一步的结果丢失,导致下一个 Agent 拿不到必要的输入。解决办法很简单:在 Director 的 AGENTS.md 里用清晰的步骤写明每个环节的输入输出。

坑二:超时设置太短会导致流程中断

sessions_spawn 有一个 runTimeoutSeconds 参数,控制 Director 等待子 Agent 的最长时间。我初始设的 120 秒,结果开发工程师写一个稍微复杂一点的功能就超时了。Director 收到超时返回后会认为任务失败,整个流程就断了。建议根据任务复杂度设置合理的超时时间,一般的开发任务建议设 600 秒以上。另外,超时返回的 status 为 timeout 并不一定代表失败,消息往往已经到达了。可以用 sessions_history 工具确认子 Agent 的实际状态。

坑三:SOUL.md 写得太模糊会让 Agent “精分裂”

有一段时间我发现开发工程师 Agent 写的代码总是不夯专业,后来发现是因为我在它的 SOUL.md 里写了“你是一位全栈开发工程师”。这个“全栈”让它什么都想管,什么都想做,反而什么都做不好。后来我改成“你是一位后端开发工程师,专注于 TypeScript 和 Node.js,严格按照技术方案写代码”,输出质量立刻提升了一个台阶。记住:每个 Agent 的职责越聚焦,输出越稳定。

坑四:别忘了给 Agent 装技能

OpenClaw 的 Skills 是 Agent 的“手脚”,没有技能的 Agent 只能说不能做。开发工程师需要安装代码执行和文件操作的技能,测试工程师需要安装测试运行和报告生成的技能。如果你发现某个 Agent 总是只能给你“建议”而不能真正执行,十有八九是因为缺少对应的 Skill。安装方式很简单,在各个 Agent 的工作区下的 skills 目录放入对应的 SKILL.md 文件就行了。你也可以从 ClawHub 技能市场直接安装现成的技能包,那里有超过一万三千个社区贡献的技能可以直接用。

什么时候这套方案不适合

写到这里,我得说点实话。多 Agent 协作不是银弹,它有明确的适用场景和局限性。

首先,如果你的任务很简单,比如就是写一个简单的脚本或者码一段小功能,搭五个 Agent 是纯粹的过度设计。这时候一个 Agent 就够了,直接让 main 干完了事。多 Agent 的价值在于“复杂任务的专业分工”,它的成本是配置复杂度和调试时间。简单任务不值得。

其次,多 Agent 会带来额外的 Token 消耗。每个 Agent 都有自己的系统提示词和会话历史,五个 Agent 就是五份。如果你的模型费用比较敏感,需要权衡一下效率和成本。不过有一个缓解方法:不同的 Agent 可以配置不同的模型。简单的任务用便宜的小模型,复杂的任务用贵的大模型,这样总体成本反而可能比全用大模型更低。

第三,当前 Sub-Agents 模式支持最多两层嵌套。也就是说,Director 调用子 Agent,子 Agent 不能再调用子子 Agent。如果你的工作流需要更深的嵌套层级,目前的架构可能支撑不了。不过对于绝大多数软件开发场景,一层嵌套已经够用了。从需求分析到测试验证,四步流转已经覆盖了标准的软件开发流程。

未来的可能性

我的这套方案目前跑得很稳定,但我觉得这只是刚刚开始。OpenClaw 的多 Agent 生态还在快速迭代,社区里已经有人在尝试更复杂的协作模式。比如有人在探索多个 Agent 并行工作——架构师在设计方案的同时,产品经理就开始写用户故事,两个任务同时进行,最后在 Director 那里合并。这种模式如果成熟,整个流程的速度还会再提升一大截。

另一个让我很期待的方向是“自主审查”。现在的流程里,Director 对每个环节的质量检查比较粗糙,基本上是看“有没有返回结果”。如果能加入一个专门的“代码审查员”Agent,在开发工程师和测试工程师之间加一道质量门禁,整个流程的可靠性会好很多。社区里已经有开源项目做了类似的事情,比如 OpenClaw IT Team 这个开源配置里就包含了五个角色,还加了一个专门的“鼓励师”角色,整个协作氛围会更加真实。

说实话,我第一次看到它们在飞书群里自己开会的时候,有点毛骨怪然的。产品经理自己把需求梳理成文档发到群里,项目经理看到文档开始排期,工程师接单写代码,QA 跑测试发现 Bug 直接 @ 工程师。全程我没有说过一句话。

AI 协作的上限到底在哪里,我不确定。但我确定的是,当你亲眼看到五个 AI 在聊天群里自己开会、排期、写代码、测试、修 Bug、再测试、通过、上线——而你只需要坐在旁边喝咖啡的时候,你会觉得这个技术的未来,已经到了。

参考资料

[1] OpenClaw 官方文档: https://docs.openclaw.ai

[2] OpenClaw 多 Agent 协同开发指南, CSDN, 2026-03

[3] 我用 OpenClaw 龙虾组了一支 AI 研发团队, CSDN, 2026-03

[4] OpenClaw 多 Agent 协作研发: 5 个 AI 员工从需求到代码自动流转, CSDN, 2026-04

[5] OpenClaw 多 Agent 沟通方案与实践总结, 博客园, 2026-03

[6] OpenClaw 概念扫盲:Gateway、Channel、Agent、Session, CSDN, 2026-03

[7] OpenClaw 多 Agent 软件开发最佳实践指南, 掘金, 2026-03

[8] OpenClaw IT Team 开源项目: https://github.com/jefferyjob/openclaw-it-team