从OpenClaw到Codex:AI Agent该回头打地基了
今年3月,OpenClaw像一场龙卷风席卷了AI圈。让AI替你操作电脑、自动完成任务的画面,点燃了无数人的想象。
三个月过去,热度已经明显退潮。到4月,OpenClaw访问量直接腰斩,腾讯旗下的QClaw跌幅甚至超过99%。“全民养虾”从一个文化符号,变成了一个尴尬的过去式。
OpenClaw凉了,但它还用肉身替整个行业探了一遍雷区,然后告诉所有人——雷在这儿,路还没修好。
新的玩家已经在补位。Claude Code、Codex、WorkBuddy、Hermes——它们修复了OpenClaw留下的部分创伤,但有些更根本的问题,依然还没能解决。
一、新玩家解决了什么?
Claude Code把决策过程从黑盒变成流式透明,用户能亲眼看到AI每一步在想什么。Codex补上了跨平台部署和“智能拒绝”——当指令可能丢代码或覆写同事工作时,它会拒绝执行。WorkBuddy主打零部署、沙箱隔离,用半自动确认让用户始终保有控制权。Hermes则让AI学会“长记性”,每次纠正都会被沉淀为可复用的技能。
但你会发现,新玩家解决的问题集中在“应用层””,而真正的“基础设施层的缺失”,依然摆在那里。AI Agent的落地还需要翻过下面几座大山。

二、人人都知道的四座山
先说那些已经被反复讨论的障碍。
算力成本。 这是最直观的拦路虎。OpenClaw早期的“免费盛宴”,本质上是钻了API订阅套利的空子。当厂商把漏洞堵上,普通用户发现让AI干点活,Token费用累积起来比雇个人还贵。本地部署能解决一部分问题,但代价是——你得先有一台能跑大模型的机器。
硬件可及性。 这正是我自己的亲身体验。为了本地部署一个70B参数的模型,我调研了一圈国产迷你主机,发现随着存储芯片涨价,它们也跟着暴涨。最后无奈入手了一台96GB内存的Mac Studio,花了三万多。一台能跑大模型的设备,目前仍然不是大多数人愿意承受的支出。
安全隐私。 让AI Agent接管你的电脑、读取你的文件、替你发邮件——这事想想就头皮发麻。工信部专门发布过风险提示,OpenClaw自己也出过不少安全事故。把一个拥有系统级权限的黑盒放在电脑里,需要比我们现在有的多得多的信任。
软件生态。 Windows on Arm喊了好多年,真正适配的软件寥寥无几。AI Agent的框架更是碎片化严重,OpenClaw的一套技能换个平台就不认了。开发者花大力气写好的智能体,没法在不同环境下复用。
这四座山已经被讨论得足够多。但我想说的是,OpenClaw退潮之后暴露出来的,其实是更深处的另外三座山。
三、被忽略的三座更底层的山
数据质量与治理
这是最脏最累、但最绕不开的活。
AI Agent的表现好坏,很多时候不取决于模型多强,而是喂给它的数据有多干净。你想象一下:给智能体一份客户名单,里面同一个人的名字有三种写法,地址字段一半是空的,电话号码有的是座机有的是手机——它做出的任何决策,都像是在沙地上盖楼。
更麻烦的是,大部分企业连自己的数据资产都没梳理清楚。IDC预测,到2027年因数据质量问题导致的生产力倒退可能高达15%。
在AI Agent的世界里,数据治理不是后台的“成本中心”,而是决定智能体是聪明还是愚蠢的起跑线。可惜,这个活不出彩,被大部分人选择性地忽略了。
可观测性与黑盒困境
你有没有遇到过这种情况:让AI Agent处理一件事,它办砸了,但你完全不知道为什么。
这不是你的问题,是AI Agent的先天缺陷。传统软件的bug可以逐行代码排查;大模型驱动的智能体,内部决策路径像一团黑雾。它可能因为训练数据里的偏见拒绝了一笔贷款,可能因为提示词里的一个歧义删错了文件——你永远无法像查账一样回溯它的思考过程。
这就是所谓的“黑盒困境”。与之相伴的是“评估失能”——你不知道该怎么衡量它做得好不好。传统的测试基准对大模型已经失效,有模型会“刷分”而不是“解题”。SWE-bench上一半被标记为“解决”的方案,维护者表示根本不会采纳。
没有可观测性,就没有审计;没有审计,就没有信任。而信任,是所有To B应用的入场券。
多智能体协作
你可能觉得,一个智能体不够用,那我多装几个不就行了?一个管邮件,一个管日历,一个管文件整理,各司其职。
理想很丰满,现实很骨感。研究数据显示,当智能体数量超过3到4个时,协作效率反而会崩盘。原因很简单:沟通通道数随着智能体数量平方级增长;谁来仲裁冲突?用户自己变成了多个智能体的项目经理;抢算力、抢内存、抢API额度,甚至互相踩踏。
这还不是最麻烦的。未来的趋势恰恰是“专用化”——每个智能体聚焦一个任务,做深做精。但你越专用,需要的智能体数量就越多;智能体越多,协作的复杂度越高。这是一个天然的悖论。
解决它需要的不是更聪明的智能体,而是让智能体能互相“说话”的底层协议,以及一个类似操作系统的“智能体调度器”。

四、地基打好了,楼才能盖起来
把这七座山放在一起看,你会发现一个清晰的层次:
最底层是数据治理——输入智能体的“原料”必须干净。往上一层是可观测性——你能知道智能体在里面做了什么。再往上是协作协议——多个智能体能有序配合。最上面才是我们日常看到的应用。
现在的情况是,大家都在抢着盖顶楼,地基还没打好。
OpenClaw的退潮不是灾难,是一次及时的回撤。它告诉我们:别急着让AI Agent满街跑了,先把路修好、把信号灯装上、把交规写清楚。
这个过程不会太短,可能还需要一两年。但我并不悲观——因为每一座被翻越的山,都会变成下一波爆发的护城河。
而数据治理、可观测性、协作协议这些听起来又脏又累的基础设施,恰恰是下一阶段最值得关注的方向。谁先在这些“脏活”上站稳脚跟,谁就可能成为AI Agent时代的另一个英伟达。
毕竟,没有地基的空中楼阁,再漂亮也撑不了多久。
——完——

夜雨聆风