最近一个月,一项名为 OpenClaw 的技术迅速引爆了中文互联网。
无论是技术社区、开发者论坛,还是各种社交平台,你都能看到大家发表意见讨论。它的传播速度,已经明显超出了一个正常技术项目的扩散节奏。
但如果你本身就在 AI 相关领域工作,你其实很难对这个项目产生所谓“技术震撼”。
从技术角度来看,OpenClaw 的核心能力并不难:
1. 依赖现有大模型能力
2. 通过 agent 做任务拆解
3. 结合工具调用执行
这些组件,都不是今天才出现的东西。多智能体协作、工具调用、自动化链路、环境感知、任务规划,这些概念在过去几年里早就被讲烂了。OpenClaw 真正做的,是把这些能力以一种更激进、更具观感、更适合传播的方式组合起来。如果说它像什么。很像一个加强版的 claude code,只不过用户从码农变成了普罗大众。
1. 多 agent 协作失控
任务一旦被拆成多个 agent 节点,问题就变成了:
多个 agent 如何稳定协同?
某个中间步骤出错,是否有可靠回滚?
错误是否会沿着链路扩散并被放大?
举个普通的用户场景:“帮我整理今天的重要邮件,并给客户发一封确认函”。
表面上只是一个简单需求,背后可能被拆成:
读取邮箱
判断哪些邮件重要
提取关键信息
总结上下文
生成回复
调用发信工具发送
问题在于,只要前面某一环理解错了,比如误判了一封邮件的优先级、误读了客户诉求,那么后面的链路会在错误前提上继续正确执行。最后你看到的是一封逻辑完整、措辞流畅、但方向全错的邮件,这就是 agent 最不可控的地方
2. 执行过程中“循环与卡死”
这是几乎所有 agent 系统都会遇到的问题:
步骤重复执行
无意义循环
卡在某个子任务无法退出
同样举个例子:
你让它“帮我找一份最新的半导体行业报告,下载并整理到文件夹里”。
听起来很简单,但 agent 在执行时会遇到大量模糊判断:
哪一份算“最新”?
哪个来源算“权威”?
哪个按钮是真下载,哪个是广告?
页面跳转之后是否还在原任务路径内?
结果经常就是:
尝试点击下载 → 失败 → 重新搜索 → 再点击 → 再失败 → 再判断 → 再搜索……
它不会意识到自己应该停下来,也不会主动承认“这个任务目前做不成”。
它只会在错误路径上反复消耗 token,重复执行一堆看起来勤奋、实际上毫无意义的动作。
而目前来看,OpenClaw 并没有给出真正可靠的解决方案。
3. 调试困难
当系统行为异常时:
很难快速定位问题
中间状态不可解释
debug 成本极高
我相信没人会把 openclaw 真的部署在生产环境上
4. 被严重低估的复杂度
OpenClaw 在传播中,刻意强化了“简单可用”的印象,但真实情况往往是:
配置链路复杂
依赖环境敏感
参数调优成本高
甚至衍生出了上门安装服务...
5. 最重要的一点,成本与支出不成正比
这也是 claude 老生常谈的问题了,任务在执行过程中,往往多轮调用叠加,错误执行额外烧钱,便宜的 token 效果不稳定,用贵的 token 成本又太高。
但是即便有这些缺点,大众的热情依旧不减,腾讯、阿里、字节、甚至小米纷纷跟随热度,推出自家的“龙虾”服务,完全可以印证,这根本不是什么技术难题、技术壁垒。而是一次普通的应用革新,而最后,这次应用革新又沦为流量和渠道的争夺战。
但真正可怕的是狂热的人群,OpenClaw 的热度已经不只是产品热度,而是延伸出了明显的亚文化符号:龙虾帽、手势、线下聚会、社区身份认同,甚至硬件厂商、安装服务和本地政策都在蹭这股风。
人们害怕落后、害怕错过风口,但又缺乏对复杂世界的认知。人们不喜欢那些需要思考的枯燥道理,只喜欢“男人来自火星,女人来自金星”这种现成的结论,于是把“大家都在说”误当成了“这件事一定对”。OpenClaw 给了大众一个非常廉价的幻觉:
你不需要更聪明,也不需要更专业,只要装上它,你就 suddenly 拥有了更强的执行力
一旦技术产品主要靠这种心理快感传播,它吸引来的就不再是认真评估工具的人,而是一群急于通过新玩具修补自我匮乏感的人
说到底,人群追逐的从来不是技术,而是借技术给自己贴金的机会。
夜雨聆风