乐于分享
好东西不私藏

实战复盘:OpenClaw 6人Agent Team险些全军覆没

实战复盘:OpenClaw 6人Agent Team险些全军覆没

如果你也在用 AI 搞自动化或搭建 Agent Team,这篇文章可能帮你少走很多弯路。读完记得点「在看」,转发给也在做 AI 的朋友。


全文约 2500 字 | 阅读约 8 分钟


一、为什么突然想做"体检"

三个月前,我用 OpenClaw 搭了一个 6 人 Agent Team:1 个 CEO 级 Agent 负责统筹,5 个专项 AI Agent 分管选题、写作、配图、发布和数据分析。

从外面看,这个 Agent Team 运转得还不错——每天自动发内容,自动跟踪数据,偶尔还会主动给我发汇报。我一度觉得,这就是我理想中的"数字员工团队"。

但最近有几件事让我开始怀疑:

  • 明明交代过的事,Agent 说"第一次听说"
  • 同一件事被反复派发,像是卡在循环里出不来
  • 有个任务明显做错了,但没有人汇报,也没有人纠错

出问题了,但找不到根源。就像一台机器表面在转,但齿轮已经开始磨损。

于是我决定做一次全面体检——把 OpenClaw 里每个 Agent 的配置文件、任务日志、工作记忆全部翻出来,逐一检查。

结果,我发现了 6 个让我出冷汗的系统性问题


二、六大问题

问题一:员工手册越写越厚,反而没人看了

每次遇到问题,我的第一反应是加规定。

员工漏了一个步骤?——加一条"必须检查步骤 X"。输出格式不对?——加一条"格式必须按照 Y"。

就这样,原本只有薄薄几页的员工手册,慢慢膨胀到了 447 行、72 条铁律,文件体积从 3KB 涨到了 22KB。

但有个我忽略的现实:AI 每次启动时,能读进去的内容是有上限的。当手册超过系统能处理的长度,后面的内容会被自动截断——也就是说,我后来加的那些"重要规定",Agent 根本没看到过。

这就像公司规章制度印了 200 页,新人入职第一天只翻到第 30 页,后面全没看——然后你还纳闷为什么他们不遵守第 150 页的规定。

规定越多,不一定管越好。管得太细,反而失控。


问题二:老板忍不住自己下场干活

我给 CEO Agent 的设定是:你是管理者,负责调度、决策、监督,不要亲自执行细节任务。

但实际上呢?它一看到具体问题就冲上去:自己查数据、自己调参数、自己写报告……

这不是系统故障,这是"角色设定"和"实际诱惑"之间的冲突。

配置写"你是管理者",但没有强制隔离它的执行权限;一旦它能访问工具,它就会用——就像让一个勤快的总监兼顾所有细节工作,不是因为他不懂放权,而是因为他看不下去、忍不住。

结果就是:CEO 疲于奔命,但真正的管理动作——任务追踪、进度督导、结果验收——全部被挤掉了。

管理者最大的敌人,往往不是懒惰,而是"忍不住亲自干"。


问题三:员工每次上班都像第一天

每个 AI Agent 都有一个"工作记忆"文件,用来记录它学到的经验、总结的规律、待处理的事项。

理论上,这个文件应该越来越"聪明"——记录越多,Agent 越懂你的需求。

但打开一看,我的 Agent 的记忆文件已经变成一个垃圾桶:

  • 三个月前的一次性任务,还在里面没删
  • 每次调试留下的临时笔记,堆了几十条
  • 真正重要的工作方法论,被淹没在杂务里

8.6KB 的记忆文件,真正有用的内容可能不到 1KB。

每次新对话开始,Agent 要读这个文件,但有用信息早已淹没在噪音里——它等于每次上班都是"第一天",过去积累的经验形同虚设。

记忆不是越多越好,信噪比才是关键。


问题四:闹钟定太多,老板每天被叫醒 100 次

为了让 AI 系统自动运转,我设置了大量定时提醒:每天早上发内容、每小时检查数据、每周生成报告……

但我犯了一个错误:任务用完之后,忘记清理了。

那个"三月初发布的一次性推送"定时提醒,现在每天还在触发。那个"上周调试用的测试任务",每小时还在唤醒 Agent。

翻出任务列表一数:28 个定时任务,其中大量是"用完即弃"却从未删除的残留。

CEO Agent 一天被唤醒 100 多次,大部分是来处理这些没有意义的触发,真正的战略思考时间被切成了碎片。

这就是为什么它总是忙,但感觉没干多少正事。

定时任务是双刃剑,不清理就是自己给自己挖坑。


问题五:员工汇报了,但老板没收到

有一天,我发现一个 Agent 已经完成了一个任务,但我的任务列表里这个任务还是"进行中"。

深入排查,发现了一个严重的链路问题:子 Agent 完成任务后,会发送一条汇报消息,但这条消息走的通路,CEO 那边没有接收配置——消息发出去了,但发进了黑洞。

所以 CEO 以为任务还没做,又重新派发了一遍。于是同一件事被做了两遍,有时甚至三遍。

信息链路断裂,比没有信息更危险——因为它制造了"虚假的已知"。


问题六:同一条规定,写了四个版本,互相矛盾

图片尺寸,是个看起来很小的参数,但影响每一篇内容的呈现效果。

我的配置里,这个参数分散在四个不同的地方:

  • 员工手册里写的是 1080×1440
  • 配图规范里写的是 1792×2400
  • 某个 Agent 的专项设置里写的是 1080
  • 某次临时备忘里写的是 1792

四个版本,四个地方,谁说了算?

每个 Agent 读到的版本不同,输出的图片尺寸就不一样。有时候一套内容里,封面 1792,正文图 1080——放在一起明显违和,但没有人"发现",因为每个 Agent 都觉得自己是对的。

没有"单一真相源",分布式系统会各自为政。


三、我是怎么修的

发现问题之后,我花了一个下午,集中修复:

① 手册瘦身

把 447 行的员工手册提炼到核心原则,砍掉重复的、过时的、细枝末节的条目,最终缩减 93%,只保留真正影响行为的规定。不是"更少规则",而是"更精准的规则"。

② 角色隔离

给 CEO Agent 设立明确的边界——什么事该自己决策,什么事必须转交给对应 Agent。建立强制的"不能自己执行"约束,把管理动作单独列出来,每次启动都要检查是否履行。

③ 记忆清洁

清空记忆文件里的临时笔记、过期任务、调试痕迹,重新整理成结构化的"经验库"。清理后,记忆文件体积减少 91%,核心经验第一屏就能看到。

④ 定时任务审计

逐条检查 28 个定时任务,删除所有一次性残留,精简 26%,只保留真正需要持续运行的周期性任务。

⑤ 汇报链路修复

排查每个子 Agent 的汇报路径,确保消息能到达 CEO,补上了原来缺失的接收配置。现在每个任务完成后,我的任务看板能实时更新。

⑥ 建立单一真相源

把所有分散的规范文件整合成一份唯一的共享标准,所有 Agent 读同一份。谁要改规范,只改那一份,其他地方自动同步。


四、修复之后

修完之后,我用了一周时间观察系统表现。

感受最明显的变化是:

安静了。 之前总有奇怪的重复任务、莫名其妙的二次执行,现在少了很多。

可靠了。 交代下去的事,大概率能做完并汇报回来,不用我主动追。

可读了。 打开任何一个配置文件或记忆文件,我能快速找到我需要的信息,不再是一大堆噪音。

数字上的变化一目了然:

  • 员工手册瘦身 93%
  • 工作记忆清理 91%
  • 定时任务精简 26%
  • 规范文档从 4 份合并为 1 份

五、Agent Team 管理,和管理真实团队一样难

做完这次体检,我有一个很强烈的感受:

管理 Agent Team,和管理人类团队,本质上面对的是同一类问题。

规则太多导致无人执行、管理者越级干活抢了下属的活儿、信息传递断层导致任务重做、文档各说各话导致标准混乱——这些不是 AI 的 Bug,这是组织管理的经典难题,只是在 Multi-Agent 系统里被数字化放大了,暴露得更赤裸。

AI 不会因为"公司文化"或"主管的眼神"就自动对齐——你的配置就是它的"规则",你的设计就是它的"文化"。设计多烂,它就跑多偏。

这次体检让我意识到:一个跑在 OpenClaw 上的 Agent Team,跑一段时间之后,是需要"重构"的,就像一家真实的公司需要定期的组织审视。

不是因为出了大问题,而是因为熵增是必然的——你不主动整理,它就自然混乱。


六、如果你也在搭 Agent Team,建议做一次体检

具体可以检查这几点:

  1. 把所有配置文件打开,看看有没有"越写越厚但越来越没用"的
  2. 查一查有没有过期的定时提醒、残留的临时任务
  3. 追踪一次完整的工作流,看看信息传递有没有中断
  4. 找找有没有同一条规定写在了多个地方

大概率,你会发现几个让你意想不到的问题。


如果这篇文章对你有帮助,点个「在看」、转发给一起搞 AI 的朋友,让更多人少走这个弯路。

欢迎在评论区聊聊你的 AI 系统体检结果,或者你遇到过哪些奇怪的问题——我会认真看每一条。

关注「Wesley AI 日记」,持续分享 AI Agent、Agent Team 实战经验。