
说实话,写这篇文章之前我犹豫了一下。
因为前几篇文章,我花了不少篇幅介绍 Openclaw——怎么部署、怎么连飞书、怎么选云服务器。写的时候我是真心觉得这东西厉害,也确实花了很多时间在上面。
但用了2个月之后,我觉得还是得跟大家说点实话。
我的 Openclaw 现在基本就干两件事——每天中午帮我跑一份 AI 新闻摘要,再跑一份 AI 圈推文汇总。
就这两个定时任务。
其他的?不用了。

怎么会变成这样的?
其实不是突然有一天觉得不行的,是慢慢的。
一开始我挺兴奋的,搞了好几个子智能体——健康管理的、内容创作的、工作进度的、投资管理的。每个都有飞书群,每个都配了不同的 skill。
然后问题就来了。
推送个天气预报,有时候正常,有时候就不推了。也不报错,就是静悄悄地没了。
让它帮我整理运动数据,前几次还行,后面慢慢就开始乱——把上周的数据和这周的搞混了。
我还试了 GitHub 上星星很多的那些 skill,下载量几千的那种。照理说应该很成熟了吧?
结果也不稳定。跑几天就出问题。
能不能完成任务?能。
稳定吗?不稳定。
我身边几个朋友也在玩 Openclaw,后来我问他们用得怎么样。
答案都差不多——玩着玩着就不玩了。

🛠 其实我早就在做另一件事
在玩 Openclaw 的同时,一个多月前,我其实已经在做一件事——给公司开发一个专用的 Agent。
因为我的公司是做跨境电商的,选品是最核心的环节之一。我们的B端的客户很多都是做线上生意的客户。
以前帮客户选品是怎么做的?
前端的业务同事要从很多供应商的报价表格里面,根据客户的需求——材质、尺寸、价格范围、MOQ、认证要求等等——手动筛选出合适的产品,然后手动做报价表。
一个询盘进来,光选品做报价表,有时候就要30分钟到1个小时。有时候客户要得急,同事加班到很晚在翻 Excel。
这件事我一直想用 AI 来解决。
所以我用Cursor( AI 编程工具),开发了一个专用的选品 Agent。简单来说——前端同事打开一个网页,输入客户需求,比如 "速度25km/h以上,尺寸比例1:16,Buggy造型,FCC 认证,MOQ 300"。Agent 自动去商品数据库里筛选、自动匹配、自动生成报价表。
这个 Agent 一个多月前就上线了,大大提高了销售同事的报价效率,之前是询盘太多回不过来,现在回过头来多出很多时间跟进老客户,甚至开发新客户。
但说实话,当时我并没有想清楚一件事——它跟 Openclaw 到底有什么本质区别?

🧠 想继续深入,反而想明白了
选品 Agent 做好之后,我想继续深入开发公司的其他 Agent——自动接待的,客户开发的。
但我觉得自己对 Agent 的理解还不够深,想先学习一下。
正好前几天 Claude Code 的源码泄漏了,社区出了不少拆解和教学项目。我就花了一些时间研究这些项目,还把我们公司选品 Agent 的代码拿给 Claude Code 看,跟它讨论。
在这个学习和讨论的过程中,我慢慢想明白了一件事。
其实开发一个实际能落地的 Skill 和开发一个 Agent,技术上做的事情差不多——都是写工具加写提示词。
那区别在哪?
区别在于:谁控制整个循环。
开发 Skill,是把你的工具插进别人的 Agent 里跑——比如插进 Openclaw、插进 Claude Code。循环不是你控制的。
开发 Agent,是你自己控制整个循环——循环怎么跑、状态怎么管、界面长什么样,全是你说了算。
那什么时候该做 Skill,什么时候该做 Agent?
判断标准其实就一条——你的用户是谁。
如果用户是开发者自己,Skill 够了。
如果用户是不碰终端的业务同事——那就得自建 Agent。
为什么?
因为我不可能给每个同事都配一个 Claude Code或者Openclaw🦞,让他们在终端里用 Skill 来选品。
成本不可控——每个人一个订阅,选个品可能跑几十轮,一个月费用远超自建 Agent 调 API 的成本。
操作门槛高——同事要学终端、学写提示词、学排错,这不现实。
质量不一致——每个人写的提示词不一样,选品结果也不一样,没法标准化。
数据散落——选品记录在每个人的会话里,我看不到、统计不了、追溯不了。
自建 Agent 本质上是把一个高手用 Claude Code + Skill 能做的事,固化成任何人打开网页就能用的产品。

📌 想明白之后,回头看 Openclaw,拼图就拼上了
想清楚这件事之后,我再回头看 Openclaw 为什么跑不了业务——整个拼图就拼上了。
为什么连推送天气都不稳定?
因为 Openclaw 做每一件事,每一步都是大模型在"判断"。
什么意思呢?
你让它推送天气,它要判断:现在几点了?该不该推送了?去哪个工具拿天气?拿到数据后怎么组织语言?发到哪个群?
这些步骤,在我们看来很简单。但对大模型来说,每一步都是一次"思考"。
今天它思考对了,跑通了。
明天你换个措辞,或者上下文稍微变一下,它可能就跑偏了。
但我那个选品 Agent 呢?
AI 模型其实只负责两件事——理解同事输入的需求,和决定用哪个工具去查。
剩下的呢?
筛选条件怎么转换成查询语句、商品数据怎么匹配、报价表怎么生成——这些全是确定性的代码,写死的,不会出错。
通用 Agent 的每一步,包括怎么执行工具,都是模型在"判断"。
专用 Agent 的大部分步骤,是代码在"执行"。
就像去工厂看产线上的机器人——每天做一万个同样的动作,一模一样,不会今天拧螺丝拧对了、明天突然拧到别的地方去。
业务流要的是确定性,不是智能性。
智能只需要出现在少数关键节点上——理解需求、做判断。其他环节,靠代码保证稳定就好了。

所以 Openclaw 不好吗?
不是。它很强。
但它是一个通用 Agent,不是一个业务产品。
什么意思呢?
现在市面上越来越多这种"通用 Agent"——Openclaw、Manus、腾讯的 WorkBuddy、Claude 的 Cowork、Trae Solo、Codex……它们的边界越来越模糊,原来写代码的现在也能帮你做研究、整理文件、操作电脑。
它们有一个共同点——什么都能干一点。
就像一个什么都会的全能实习生,你让它干什么它都能试试。
但业务产品是什么?
是一个训练好的老员工——只干一件事,但每次都干得又快又稳。

我的选品 Agent 就是后者。它是用 Cursor 这类 AI 编程工具造出来的。
所以这里面有两个东西,很多人搞混了:
通用 Agent——Openclaw、Manus、WorkBuddy 这些,什么都能干一点,但干不稳你的业务。
专用 Agent——专门为你的业务逻辑定制的,只干一件事,但稳定可靠。
至于 Cursor、Claude Code、Trae 这些?它们既是开发工具(帮你写代码造 Agent),也可以当通用 Agent 用。但不管它们多强,本质上还是"通用"的——不认识你的数据库,不理解你的业务流程。
很多公司现在犯的错,就是拿通用 Agent 来跑业务。
拿 Openclaw 来做业务流的中心、来执行实际业务——这个起点不对。它可以是你探索 AI 的入口,但不是你跑业务的工具。
当然,如果你真的想把龙虾🦞养成一个专用 Agent,其实也不是不行——但那就意味着你要自己开发很多业务流程上的程序,让龙虾作为启动器和中枢控制,去调度这些程序。这样的话,其实也是一个可行方案。只不过这条路,门槛也就不低了。
写这篇文章不是要劝大家卸载 Openclaw。
我自己也还在用,每天跑几个 Skills(技能)挺好的。
但用了这几个月,我慢慢形成了一个判断——
Agent 不是工具,是可以协作的同事。
既然是同事,你就不能指望一个什么都会一点的通用实习生,来替你跑所有业务。
你要做的,是根据你的业务流程,去搭建一个个专精某个岗位的工作流——选品的归选品,接待的归接待,跟单的归跟单。说白了,专用 Agent 就是一套固定的工作流,只不过在关键节点上加了 AI 的判断能力。它现在不够强,没关系,去打造它,让它在那个岗位上越来越稳。
未来不是人被 Agent 取代,而是人和 Agent 协作。
协作的前提是——你得先把你的业务想清楚。
如果你也想探索 AI 怎么应用到自己的实际业务中,欢迎加入我们一起交流探讨。
请私聊我获取群聊二维码吧。
写作协助: Claude Code
生图AI:🍌NanoBanana
夜雨聆风