乐于分享
好东西不私藏

OpenClaw 多 Agent 到底是利器还是噱头?系列二:我扒了多个真实案例,发现了被忽略的问题

OpenClaw 多 Agent 到底是利器还是噱头?系列二:我扒了多个真实案例,发现了被忽略的问题

这是「OpenClaw多 Agent 到底是利器还是噱头?」系列第 2 集,共 3 集。
上集讲了阿里大佬岚遥的 6 Agent 实战:效果炸裂,但运维成本巨大。
OpenClaw多Agent到底是利器还是噱头?系列一:6 个 Agent 运转半个月 VS 全团队瘫痪
他自己砍掉了 3 个 Agent 角色,原话是:
“这几个角色基本没什么实际产出——它们的能力和Zoe + ACP编码专家的组合高度重叠,反而增加了通信复杂度和调试成本。后来全砍了。”
这句话引出了一个更大的问题:
很多被包装成”多Agent”的场景,真的需要多Agent吗?
为了回答这个问题,我扒了中英文社区 9 个真实案例,逐个拆解。
结论可能和你想的不一样。

先看国外:3 个案例,3 种真相

案例 1:GrowwStacks —— “我构建了 14 个 AI Agent”

这位作者花了三天时间,用 OpenClaw 构建了 14 个 Agent。
数据看起来很诱人:
  • 初始未优化成本:$75/天
  • 优化后:$12/天(14个Agent)
  • Orchestrator 模式降低 68% API 成本
核心有价值的 Agent 只有 3 个:
  • Trend Analyst:爬 Reddit 和X,总结行业趋势→ 节省每周 10 小时
  • Lead Magnet Generator:根据趋势生成引流素材→ 带来 200+ 线索
  • Content Repurposer:把 TikTok 内容改编到多个平台→ 内容覆盖 6 倍
但问题来了:这 3 个核心Agent,用单 Agent + Cron 定时任务也能做到。
而且文章结尾直接导流到自家咨询业务(“Book Free Consultation”)。
判定:⚠️半真半营销。

案例 2:Gustavo Gondim —— 确定性多 Agent 开发流水线

这个案例最有价值。
这位开发者花了2个月,试了5种方案,想实现一个代码→ 审查→ 测试的自动化开发流水线。
他的经历就是一部避坑指南:
  • 方案1:Ralph Orchestrator —— 不支持 Agent 间协调
  • 方案2:OpenClaw原生 sub-agents —— 嵌套深度受限,并发上限太低
  • 方案3:自己搭事件总线—— 过度工程化了
  • 方案4:Skill驱动的自编排—— 状态机活在 LLM 脑子里,容易出错
  • 方案5:Plugin Hooks 做事件总线—— 接近了,但还是不够确定
最终方案:用Lobster(OpenClaw工作流引擎)做确定性编排,YAML定义流程,LLM只管执行。
他的结论只有一句话,但值千金:
“Don’t orchestrate with LLMs. Every time I tried to put flow control in a prompt, I introduced a failure mode. LLMs are unreliable routers. Use them for creative work, use code for plumbing.”
翻译一下:LLM是不可靠的路由器。用它们做创造性工作,用代码做管道。
他还给 Lobster 项目贡献了代码(sub-workflow steps with loop support),并且没有导流到任何商业服务。
判定:✅高度真实,最有参考价值。

案例 3:Trebuh —— “4 Agent 小团队”

这位 solo founder 在 X 上分享了他的 4 Agent 团队:
  • Milo(StrategyLead):战略决策
  • Josh(Business):业务处理
  • Marketing Agent:营销
  • Dev Agent:开发
全部通过一个 Telegram 群控制,@milo、@josh 等标签路由,共享 GOALS.md 和 PROJECT_STATUS.md。
看起来很酷?
但本质是用 Telegram @ 标签做了个“人肉路由”——用户自己决定该 @ 谁,而不是 AI 自动路由。
而且“a real small team available 24/7” 这句话,营销感太重。
判定:⚠️有趣的实验,但不是”多 Agent 才做得到的事”。

再看国内:2 个案例,更深的坑

案例 1:退役小学生 —— AIOps 多智能体协同团队

这篇博客提供了完整的 OpenClaw 多 Agent 配置教程:
  • 程序开发团队:总监→ 产品经理→ 前端开发→ 后端开发
  • AIOps 团队:架构师→ Linux 专家→ 容器专家→ K8s 专家
  • 每个 Agent 配置独立的飞书机器人,通过 bindings 路由
  • 开启 agentToAgent 实现多智能体对话
教程非常详细,包含了 IDENTITY.md、SOUL.md、AGENTS.md 的完整编写方法。
但缺少了什么?
运行数据。实际效果反馈。遇到的问题和修复经验。
判定:✅高价值教程,但缺实战验证。

案例 2:亚马逊云开发者 —— 电商多角色助手

一个 OpenClaw 实例跑 3 个Agent:
  • 销售助手:查销售额、分析订单趋势
  • 售后客服:处理退款、查工单状态
  • 运营助手:库存预警、补货建议、自动日报
3 个群 @ 同一个飞书Bot,但回复风格和能力完全不同。
提供了完整的配置命令和 SOUL.md/Skill 示例,场景设计贴合实际需求。
但同样的问题:没有运行效果数据,没有记录遇到的问题。
判定:✅务实的配置实战,但效果待验证。

对比之后,我发现了什么

把这些案例放在一起看,三个发现让我意外:

发现 1:国内技术深度反而更深

岚遥案例详细记录了 P0/P1/P2 事故和修复过程,这种坦诚的失败分享,在国外案例里几乎看不到。
国外更多是配置教程和”体验好”的叙事,国内岚遥直接把事故数据摊开给你看。

发现 2:但结论惊人地一致

不管国内国外,所有认真跑过多 Agent 的人,都得出了同一个结论:
多Agent的复杂度问题,全球通用。
  • 岚遥:“每加一个新 Agent 都需要半天到一天的调试”
  • Gustavo:“LLM 是不可靠的路由器”
  • HN 用户:“同步两个心智的状态极其昂贵和缓慢”

发现 3:很多”多 Agent”场景,本质是流水线

电商的销售→ 售后→ 运营,开发的总监→ PM → 前端→ 后端,金融的 Macro → Trading —— 这些都是流水线
而流水线,真的需要多 Agent 吗?

回到核心问题

岚遥砍掉了 3 个角色。Gustavo说 LLM 做路由器不可靠
这两个案例的核心发现,恰好印证了同一个判断:
流水线式的任务,应该用代码/配置做编排,而不是用多个Agent互相传递。
但很多人还在把流水线包装成”多 Agent”。
为什么?
因为”多Agent”听起来更先进,更好卖。
下集预告:流水线式任务到底需不需要多Agent?一个帮你 3 分钟做判断的简单框架。系列最终集。
这是「OpenClaw多 Agent 到底是利器还是噱头?」系列第 2 集,共 3 集。关注公众号,不错过下一集。