从OpenClaw到Codex:AI Agent该回头打地基了

今年3月，OpenClaw像一场龙卷风席卷了AI圈。让AI替你操作电脑、自动完成任务的画面，点燃了无数人的想象。

三个月过去，热度已经明显退潮。到4月，OpenClaw访问量直接腰斩，腾讯旗下的QClaw跌幅甚至超过99%。“全民养虾”从一个文化符号，变成了一个尴尬的过去式。

OpenClaw凉了，但它还用肉身替整个行业探了一遍雷区，然后告诉所有人——雷在这儿，路还没修好。

新的玩家已经在补位。Claude Code、Codex、WorkBuddy、Hermes——它们修复了OpenClaw留下的部分创伤，但有些更根本的问题，依然还没能解决。

一、新玩家解决了什么？

Claude Code把决策过程从黑盒变成流式透明，用户能亲眼看到AI每一步在想什么。Codex补上了跨平台部署和“智能拒绝”——当指令可能丢代码或覆写同事工作时，它会拒绝执行。WorkBuddy主打零部署、沙箱隔离，用半自动确认让用户始终保有控制权。Hermes则让AI学会“长记性”，每次纠正都会被沉淀为可复用的技能。

但你会发现，新玩家解决的问题集中在“应用层””，而真正的“基础设施层的缺失”，依然摆在那里。AI Agent的落地还需要翻过下面几座大山。

二、人人都知道的四座山

先说那些已经被反复讨论的障碍。

算力成本。 这是最直观的拦路虎。OpenClaw早期的“免费盛宴”，本质上是钻了API订阅套利的空子。当厂商把漏洞堵上，普通用户发现让AI干点活，Token费用累积起来比雇个人还贵。本地部署能解决一部分问题，但代价是——你得先有一台能跑大模型的机器。

硬件可及性。 这正是我自己的亲身体验。为了本地部署一个70B参数的模型，我调研了一圈国产迷你主机，发现随着存储芯片涨价，它们也跟着暴涨。最后无奈入手了一台96GB内存的Mac Studio，花了三万多。一台能跑大模型的设备，目前仍然不是大多数人愿意承受的支出。

安全隐私。 让AI Agent接管你的电脑、读取你的文件、替你发邮件——这事想想就头皮发麻。工信部专门发布过风险提示，OpenClaw自己也出过不少安全事故。把一个拥有系统级权限的黑盒放在电脑里，需要比我们现在有的多得多的信任。

软件生态。 Windows on Arm喊了好多年，真正适配的软件寥寥无几。AI Agent的框架更是碎片化严重，OpenClaw的一套技能换个平台就不认了。开发者花大力气写好的智能体，没法在不同环境下复用。

这四座山已经被讨论得足够多。但我想说的是，OpenClaw退潮之后暴露出来的，其实是更深处的另外三座山。

三、被忽略的三座更底层的山

数据质量与治理

这是最脏最累、但最绕不开的活。

AI Agent的表现好坏，很多时候不取决于模型多强，而是喂给它的数据有多干净。你想象一下：给智能体一份客户名单，里面同一个人的名字有三种写法，地址字段一半是空的，电话号码有的是座机有的是手机——它做出的任何决策，都像是在沙地上盖楼。

更麻烦的是，大部分企业连自己的数据资产都没梳理清楚。IDC预测，到2027年因数据质量问题导致的生产力倒退可能高达15%。

在AI Agent的世界里，数据治理不是后台的“成本中心”，而是决定智能体是聪明还是愚蠢的起跑线。可惜，这个活不出彩，被大部分人选择性地忽略了。

可观测性与黑盒困境

你有没有遇到过这种情况：让AI Agent处理一件事，它办砸了，但你完全不知道为什么。

这不是你的问题，是AI Agent的先天缺陷。传统软件的bug可以逐行代码排查；大模型驱动的智能体，内部决策路径像一团黑雾。它可能因为训练数据里的偏见拒绝了一笔贷款，可能因为提示词里的一个歧义删错了文件——你永远无法像查账一样回溯它的思考过程。

这就是所谓的“黑盒困境”。与之相伴的是“评估失能”——你不知道该怎么衡量它做得好不好。传统的测试基准对大模型已经失效，有模型会“刷分”而不是“解题”。SWE-bench上一半被标记为“解决”的方案，维护者表示根本不会采纳。

没有可观测性，就没有审计；没有审计，就没有信任。而信任，是所有To B应用的入场券。

多智能体协作

你可能觉得，一个智能体不够用，那我多装几个不就行了？一个管邮件，一个管日历，一个管文件整理，各司其职。

理想很丰满，现实很骨感。研究数据显示，当智能体数量超过3到4个时，协作效率反而会崩盘。原因很简单：沟通通道数随着智能体数量平方级增长；谁来仲裁冲突？用户自己变成了多个智能体的项目经理；抢算力、抢内存、抢API额度，甚至互相踩踏。

这还不是最麻烦的。未来的趋势恰恰是“专用化”——每个智能体聚焦一个任务，做深做精。但你越专用，需要的智能体数量就越多；智能体越多，协作的复杂度越高。这是一个天然的悖论。

解决它需要的不是更聪明的智能体，而是让智能体能互相“说话”的底层协议，以及一个类似操作系统的“智能体调度器”。

四、地基打好了，楼才能盖起来

把这七座山放在一起看，你会发现一个清晰的层次：

最底层是数据治理——输入智能体的“原料”必须干净。往上一层是可观测性——你能知道智能体在里面做了什么。再往上是协作协议——多个智能体能有序配合。最上面才是我们日常看到的应用。

现在的情况是，大家都在抢着盖顶楼，地基还没打好。

OpenClaw的退潮不是灾难，是一次及时的回撤。它告诉我们：别急着让AI Agent满街跑了，先把路修好、把信号灯装上、把交规写清楚。

这个过程不会太短，可能还需要一两年。但我并不悲观——因为每一座被翻越的山，都会变成下一波爆发的护城河。

而数据治理、可观测性、协作协议这些听起来又脏又累的基础设施，恰恰是下一阶段最值得关注的方向。谁先在这些“脏活”上站稳脚跟，谁就可能成为AI Agent时代的另一个英伟达。

毕竟，没有地基的空中楼阁，再漂亮也撑不了多久。

——完——