OpenClaw 多 Agent 到底是利器还是噱头?系列二:我扒了多个真实案例,发现了被忽略的问题

这是「OpenClaw多 Agent 到底是利器还是噱头？」系列第 2 集，共 3 集。

上集讲了阿里大佬岚遥的 6 Agent 实战：效果炸裂，但运维成本巨大。

OpenClaw多Agent到底是利器还是噱头？系列一：6 个 Agent 运转半个月 VS 全团队瘫痪

他自己砍掉了 3 个 Agent 角色，原话是：

“这几个角色基本没什么实际产出——它们的能力和Zoe + ACP编码专家的组合高度重叠，反而增加了通信复杂度和调试成本。后来全砍了。”

这句话引出了一个更大的问题：

很多被包装成”多Agent”的场景，真的需要多Agent吗？

为了回答这个问题，我扒了中英文社区 9 个真实案例，逐个拆解。

结论可能和你想的不一样。

先看国外：3 个案例，3 种真相

案例 1：GrowwStacks —— “我构建了 14 个 AI Agent”

这位作者花了三天时间，用 OpenClaw 构建了 14 个 Agent。

数据看起来很诱人：

初始未优化成本：$75/天
优化后：$12/天（14个Agent）
Orchestrator 模式降低 68% API 成本

核心有价值的 Agent 只有 3 个：

Trend Analyst：爬 Reddit 和X，总结行业趋势→ 节省每周 10 小时
Lead Magnet Generator：根据趋势生成引流素材→ 带来 200+ 线索
Content Repurposer：把 TikTok 内容改编到多个平台→ 内容覆盖 6 倍

但问题来了：这 3 个核心Agent，用单 Agent + Cron 定时任务也能做到。

而且文章结尾直接导流到自家咨询业务（“Book Free Consultation”）。

判定：⚠️半真半营销。

案例 2：Gustavo Gondim —— 确定性多 Agent 开发流水线

这个案例最有价值。

这位开发者花了2个月，试了5种方案，想实现一个代码→ 审查→ 测试的自动化开发流水线。

他的经历就是一部避坑指南：

方案1：Ralph Orchestrator —— 不支持 Agent 间协调
方案2：OpenClaw原生 sub-agents —— 嵌套深度受限，并发上限太低
方案3：自己搭事件总线—— 过度工程化了
方案4：Skill驱动的自编排—— 状态机活在 LLM 脑子里，容易出错
方案5：Plugin Hooks 做事件总线—— 接近了，但还是不够确定

最终方案：用Lobster（OpenClaw工作流引擎）做确定性编排，YAML定义流程，LLM只管执行。

他的结论只有一句话，但值千金：

“Don’t orchestrate with LLMs. Every time I tried to put flow control in a prompt, I introduced a failure mode. LLMs are unreliable routers. Use them for creative work, use code for plumbing.”

翻译一下：LLM是不可靠的路由器。用它们做创造性工作，用代码做管道。

他还给 Lobster 项目贡献了代码（sub-workflow steps with loop support），并且没有导流到任何商业服务。

判定：✅高度真实，最有参考价值。

案例 3：Trebuh —— “4 Agent 小团队”

这位 solo founder 在 X 上分享了他的 4 Agent 团队：

Milo（StrategyLead）：战略决策
Josh（Business）：业务处理
Marketing Agent：营销
Dev Agent：开发

全部通过一个 Telegram 群控制，@milo、@josh 等标签路由，共享 GOALS.md 和 PROJECT_STATUS.md。

看起来很酷？

但本质是用 Telegram @ 标签做了个“人肉路由”——用户自己决定该 @ 谁，而不是 AI 自动路由。

而且“a real small team available 24/7” 这句话，营销感太重。

判定：⚠️有趣的实验，但不是”多 Agent 才做得到的事”。

再看国内：2 个案例，更深的坑

案例 1：退役小学生 —— AIOps 多智能体协同团队

这篇博客提供了完整的 OpenClaw 多 Agent 配置教程：

程序开发团队：总监→ 产品经理→ 前端开发→ 后端开发
AIOps 团队：架构师→ Linux 专家→ 容器专家→ K8s 专家
每个 Agent 配置独立的飞书机器人，通过 bindings 路由
开启 agentToAgent 实现多智能体对话

教程非常详细，包含了 IDENTITY.md、SOUL.md、AGENTS.md 的完整编写方法。

但缺少了什么？

运行数据。实际效果反馈。遇到的问题和修复经验。

判定：✅高价值教程，但缺实战验证。

案例 2：亚马逊云开发者 —— 电商多角色助手

一个 OpenClaw 实例跑 3 个Agent：

销售助手：查销售额、分析订单趋势
售后客服：处理退款、查工单状态
运营助手：库存预警、补货建议、自动日报

3 个群 @ 同一个飞书Bot，但回复风格和能力完全不同。

提供了完整的配置命令和 SOUL.md/Skill 示例，场景设计贴合实际需求。

但同样的问题：没有运行效果数据，没有记录遇到的问题。

判定：✅务实的配置实战，但效果待验证。

对比之后，我发现了什么

把这些案例放在一起看，三个发现让我意外：

发现 1：国内技术深度反而更深

岚遥案例详细记录了 P0/P1/P2 事故和修复过程，这种坦诚的失败分享，在国外案例里几乎看不到。

国外更多是配置教程和”体验好”的叙事，国内岚遥直接把事故数据摊开给你看。

发现 2：但结论惊人地一致

不管国内国外，所有认真跑过多 Agent 的人，都得出了同一个结论：

多Agent的复杂度问题，全球通用。

岚遥：“每加一个新 Agent 都需要半天到一天的调试”
Gustavo：“LLM 是不可靠的路由器”
HN 用户：“同步两个心智的状态极其昂贵和缓慢”

发现 3：很多”多 Agent”场景，本质是流水线

电商的销售→ 售后→ 运营，开发的总监→ PM → 前端→ 后端，金融的 Macro → Trading —— 这些都是流水线。

而流水线，真的需要多 Agent 吗？

回到核心问题

岚遥砍掉了 3 个角色。Gustavo说 LLM 做路由器不可靠。

这两个案例的核心发现，恰好印证了同一个判断：

流水线式的任务，应该用代码/配置做编排，而不是用多个Agent互相传递。

但很多人还在把流水线包装成”多 Agent”。

为什么？

因为”多Agent”听起来更先进，更好卖。

下集预告：流水线式任务到底需不需要多Agent？一个帮你 3 分钟做判断的简单框架。系列最终集。

这是「OpenClaw多 Agent 到底是利器还是噱头？」系列第 2 集，共 3 集。关注公众号，不错过下一集。