用了2个月 Openclaw��,我放弃了

说实话，写这篇文章之前我犹豫了一下。

因为前几篇文章，我花了不少篇幅介绍 Openclaw——怎么部署、怎么连飞书、怎么选云服务器。写的时候我是真心觉得这东西厉害，也确实花了很多时间在上面。

但用了2个月之后，我觉得还是得跟大家说点实话。

我的 Openclaw 现在基本就干两件事——每天中午帮我跑一份 AI 新闻摘要，再跑一份 AI 圈推文汇总。

就这两个定时任务。

其他的？不用了。

怎么会变成这样的？

其实不是突然有一天觉得不行的，是慢慢的。

一开始我挺兴奋的，搞了好几个子智能体——健康管理的、内容创作的、工作进度的、投资管理的。每个都有飞书群，每个都配了不同的 skill。

然后问题就来了。

推送个天气预报，有时候正常，有时候就不推了。也不报错，就是静悄悄地没了。

让它帮我整理运动数据，前几次还行，后面慢慢就开始乱——把上周的数据和这周的搞混了。

我还试了 GitHub 上星星很多的那些 skill，下载量几千的那种。照理说应该很成熟了吧？

结果也不稳定。跑几天就出问题。

能不能完成任务？能。

稳定吗？不稳定。

我身边几个朋友也在玩 Openclaw，后来我问他们用得怎么样。

答案都差不多——玩着玩着就不玩了。

🛠 其实我早就在做另一件事

在玩 Openclaw 的同时，一个多月前，我其实已经在做一件事——给公司开发一个专用的 Agent。

因为我的公司是做跨境电商的，选品是最核心的环节之一。我们的B端的客户很多都是做线上生意的客户。

以前帮客户选品是怎么做的？

前端的业务同事要从很多供应商的报价表格里面，根据客户的需求——材质、尺寸、价格范围、MOQ、认证要求等等——手动筛选出合适的产品，然后手动做报价表。

一个询盘进来，光选品做报价表，有时候就要30分钟到1个小时。有时候客户要得急，同事加班到很晚在翻 Excel。

这件事我一直想用 AI 来解决。

所以我用Cursor（ AI 编程工具），开发了一个专用的选品 Agent。简单来说——前端同事打开一个网页，输入客户需求，比如 "速度25km/h以上，尺寸比例1:16，Buggy造型，FCC 认证，MOQ 300"。Agent 自动去商品数据库里筛选、自动匹配、自动生成报价表。

这个 Agent 一个多月前就上线了，大大提高了销售同事的报价效率，之前是询盘太多回不过来，现在回过头来多出很多时间跟进老客户，甚至开发新客户。

但说实话，当时我并没有想清楚一件事——它跟 Openclaw 到底有什么本质区别？

🧠 想继续深入，反而想明白了

选品 Agent 做好之后，我想继续深入开发公司的其他 Agent——自动接待的，客户开发的。

但我觉得自己对 Agent 的理解还不够深，想先学习一下。

正好前几天 Claude Code 的源码泄漏了，社区出了不少拆解和教学项目。我就花了一些时间研究这些项目，还把我们公司选品 Agent 的代码拿给 Claude Code 看，跟它讨论。

在这个学习和讨论的过程中，我慢慢想明白了一件事。

其实开发一个实际能落地的 Skill 和开发一个 Agent，技术上做的事情差不多——都是写工具加写提示词。

那区别在哪？

区别在于：谁控制整个循环。

开发 Skill，是把你的工具插进别人的 Agent 里跑——比如插进 Openclaw、插进 Claude Code。循环不是你控制的。

开发 Agent，是你自己控制整个循环——循环怎么跑、状态怎么管、界面长什么样，全是你说了算。

那什么时候该做 Skill，什么时候该做 Agent？

判断标准其实就一条——你的用户是谁。

如果用户是开发者自己，Skill 够了。

如果用户是不碰终端的业务同事——那就得自建 Agent。

为什么？

因为我不可能给每个同事都配一个 Claude Code或者Openclaw🦞，让他们在终端里用 Skill 来选品。

成本不可控——每个人一个订阅，选个品可能跑几十轮，一个月费用远超自建 Agent 调 API 的成本。

操作门槛高——同事要学终端、学写提示词、学排错，这不现实。

质量不一致——每个人写的提示词不一样，选品结果也不一样，没法标准化。

数据散落——选品记录在每个人的会话里，我看不到、统计不了、追溯不了。

自建 Agent 本质上是把一个高手用 Claude Code + Skill 能做的事，固化成任何人打开网页就能用的产品。

📌 想明白之后，回头看 Openclaw，拼图就拼上了

想清楚这件事之后，我再回头看 Openclaw 为什么跑不了业务——整个拼图就拼上了。

为什么连推送天气都不稳定？

因为 Openclaw 做每一件事，每一步都是大模型在"判断"。

什么意思呢？

你让它推送天气，它要判断：现在几点了？该不该推送了？去哪个工具拿天气？拿到数据后怎么组织语言？发到哪个群？

这些步骤，在我们看来很简单。但对大模型来说，每一步都是一次"思考"。

今天它思考对了，跑通了。

明天你换个措辞，或者上下文稍微变一下，它可能就跑偏了。

但我那个选品 Agent 呢？

AI 模型其实只负责两件事——理解同事输入的需求，和决定用哪个工具去查。

剩下的呢？

筛选条件怎么转换成查询语句、商品数据怎么匹配、报价表怎么生成——这些全是确定性的代码，写死的，不会出错。

通用 Agent 的每一步，包括怎么执行工具，都是模型在"判断"。

专用 Agent 的大部分步骤，是代码在"执行"。

就像去工厂看产线上的机器人——每天做一万个同样的动作，一模一样，不会今天拧螺丝拧对了、明天突然拧到别的地方去。

业务流要的是确定性，不是智能性。

智能只需要出现在少数关键节点上——理解需求、做判断。其他环节，靠代码保证稳定就好了。

所以 Openclaw 不好吗？

不是。它很强。

但它是一个通用 Agent，不是一个业务产品。

什么意思呢？

现在市面上越来越多这种"通用 Agent"——Openclaw、Manus、腾讯的 WorkBuddy、Claude 的 Cowork、Trae Solo、Codex……它们的边界越来越模糊，原来写代码的现在也能帮你做研究、整理文件、操作电脑。

它们有一个共同点——什么都能干一点。

就像一个什么都会的全能实习生，你让它干什么它都能试试。

但业务产品是什么？

是一个训练好的老员工——只干一件事，但每次都干得又快又稳。

我的选品 Agent 就是后者。它是用 Cursor 这类 AI 编程工具造出来的。

所以这里面有两个东西，很多人搞混了：

通用 Agent——Openclaw、Manus、WorkBuddy 这些，什么都能干一点，但干不稳你的业务。

专用 Agent——专门为你的业务逻辑定制的，只干一件事，但稳定可靠。

至于 Cursor、Claude Code、Trae 这些？它们既是开发工具（帮你写代码造 Agent），也可以当通用 Agent 用。但不管它们多强，本质上还是"通用"的——不认识你的数据库，不理解你的业务流程。

很多公司现在犯的错，就是拿通用 Agent 来跑业务。

拿 Openclaw 来做业务流的中心、来执行实际业务——这个起点不对。它可以是你探索 AI 的入口，但不是你跑业务的工具。

当然，如果你真的想把龙虾🦞养成一个专用 Agent，其实也不是不行——但那就意味着你要自己开发很多业务流程上的程序，让龙虾作为启动器和中枢控制，去调度这些程序。这样的话，其实也是一个可行方案。只不过这条路，门槛也就不低了。

写这篇文章不是要劝大家卸载 Openclaw。

我自己也还在用，每天跑几个 Skills（技能）挺好的。

但用了这几个月，我慢慢形成了一个判断——

Agent 不是工具，是可以协作的同事。

既然是同事，你就不能指望一个什么都会一点的通用实习生，来替你跑所有业务。

你要做的，是根据你的业务流程，去搭建一个个专精某个岗位的工作流——选品的归选品，接待的归接待，跟单的归跟单。说白了，专用 Agent 就是一套固定的工作流，只不过在关键节点上加了 AI 的判断能力。它现在不够强，没关系，去打造它，让它在那个岗位上越来越稳。

未来不是人被 Agent 取代，而是人和 Agent 协作。

协作的前提是——你得先把你的业务想清楚。

如果你也想探索 AI 怎么应用到自己的实际业务中，欢迎加入我们一起交流探讨。

请私聊我获取群聊二维码吧。

写作协助: Claude Code

生图AI：🍌NanoBanana