Claude Code源码泄露,智谱与MiniMax咬住harness-夜雨聆风

Claude Code源码泄露,智谱与MiniMax咬住harness

市场对国产AI的乐观情绪，再次被Claude Code点燃。

年初，Claude Code在编码及白领工业领域的突破，不仅推动Anthropic进入爆发期，也为中国厂商提供了清晰的追赶坐标；而昨晚那场意外的“开源”，为市场强化了一种更具想象力的叙事，仿佛中国厂商直接获得了智能体系统的工程蓝图。

昨日，智谱股价涨幅约32%，总市值至4080亿港元（约520亿美元）；MiniMax涨幅14%，超3300亿港元（约420亿美元）。

时隔一日，开发者社区仍然沉浸在拆解Claude Code源代码的窃喜之中。这无异于一场“面向未来的考古”。

在已经泄露的1906个文件，512000行代码，40多个工具中，埋藏着Anthropic构建生产级智能体系统的全套工程方法论。那些围绕“harness工程”的系统化设计正被逐一还原。数十项尚未发布的功能（Unshipped Features）所指向的未来，比Anthropic官方博客所描绘的未来，还要“超前”得多。

一个长期在线、自主执行、递归进化的Agentic AI时代正扑面而来。KAIROS 是一个常驻后台的智能体，通过做梦（autoDream）自动进行记忆蒸馏；Coordinator Mode 是多智能体协作系统，负责派遣和协调工作者智能体（Worker Agent）完成具体任务；而PROACTIVE允许智能体无需用户提示就能自主行动。

这种长时间无人值守、可持续运行的智能体体系，一直被视为通往AGI的关键路径之一。Claude Code的源码泄露表明，这些组件已经准备好了，距离现实不再遥远。

早在今年2月，Anthropic曾披露，用户让Claude Code不间断自动执行任务的时长已超过45分钟，几乎是三个月前的两倍。在达沃斯世界经济论坛上，Anthropic创始人阿莫迪（Dario Amodei）坚信，到2026或2027年，大模型将通过“自我设计”与“递归进化”，在多数领域达到诺奖得主水平。

除战略布局外，泄露的源码更揭示了Anthropic在战术层面如何打磨harness工程：流式工具并行，允许模型生成和只读操作的工具调用并行执行，“等待”的延迟被藏在了时间里；四种粒度的上下文管理，可以有序地剪裁、缓存、归档与压缩，解决长程任务“注意力不支”问题，等等。

当智能体演化为能够长时运行、分工协作并进行反复自我评估的系统后，其记忆管理、延迟控制与权限体系的重要性愈发凸显。人人都知道，2026年的竞争重点，不只是谁模型更大，而是谁的智能体系统更工程化。

然而，实现这一目标的路径并非显而易见。Claude Code的源代码提供了经过验证的方法，虽然它既不是唯一方案，也不一定是最优方案，但实实在在地提升了可见性，降低了快速跟随者的实验成本和时间门槛。如今，不少智能体初创团队，可以选择直接跳过昂贵与漫长的试错与迭代，并将它接入中国的开源模型。

肯定会有团队这么做。年初以来，有关智能体的一切都在加速，包括harness工程支持的token消耗，以及它在各大应用场景的渗透。harness工程的上限，也意味着智能体系统的生产可用性和经济价值的上限。用Claude Opus 4.5做一个2D复古游戏制作器，solo版本运行20分钟，成本9美元，而全套harness环境下需要运行6小时，成本高达200美元。但是，只有后者的产出，才是真正能用的。

Harness正在如何改变token经济学

2026/03/31 完整阅读 >

市场普遍预期，这一加速趋势将持续深化。在编码领域取得突破后，Claude Code的应用边界不断外延，其企业服务应用Cowork旗下的系列智能体，已渗透至十多个高经济价值的白领工作领域。这些垂直领域也需要自己的harness工程。Anthropic的年度经常性收入（ARR），也因此达到了190亿美元，而去年底仅为90亿美元。

这吓得OpenAI拉响红色警报。在迅速调整战略方向后，目前，OpenAI面向企业的收入显著提升，营收占比达到40%，预计年底与消费者业务持平。其中，Codex的周活跃用户超过200万，过去三个月增长了5倍。第一方API的token消耗也在急剧攀升，每分钟处理量超150亿，是去年10月的2.5倍，料与谷歌接近（去年底100亿/分钟）。

中国开源模型已证明其足以胜任大多数AI编程任务。500亿美元估值的Cursor便是一个鲜活例证，它宣称自研的Composer 2模型，底层基座实为Kimi-K2.5开源模型。此外，年初以来，其他开源模型，如智谱的GLM-5，以及Minimax的M2.5，也都称编码性能逼平 Claude Opus 4.6，价格却低至只有其1/20。现在的挑战在于，它们需证明这些模型在harness工程的支持下，智能体系统能取得同等增速的商业成绩。

OpenAI与Anthropic正在筹备上市，公司最新估值分别达到了8520亿美元与3800亿美元。在这之前，抢先上市的MiniMax与智谱，享受到了时间的红利。年初至今的股价走势，正是市场对智能体的焦虑与亢奋的映射，今日再次引爆。它们已成为Claude Code在中国的完美镜像。

国内企业服务市场的迅猛成长，为市场解读此次代码泄露事件，提供了一定程度的基本面支撑。昨晚，恰逢智谱发布上市后首份年度业绩，其中开放平台和API收入，去年至今增幅近3倍至1.9亿元人民币，远超公司整体收入增幅。公司API的ARR已达约17亿人民币（约2.5亿美元），同比增长60倍；即便一季度API涨价83%，调用量仍逆势增长4倍。

（来自智谱）

此前，MiniMax年报亦披露API收入约1.8亿人民币，增长约200%；截至2月，其ARR达1.5亿美元，M2系列模型的Token消耗量较去年底增长了6倍。

它们也都在转向高价值经济任务。智谱提出了“Token架构能力”（TAC）概念。该指标不仅考量“智能质量”与“调用量”等模型层价值，更融入了“转化为经济价值的效率”这一关键因子。这标志着国内AI行业的竞争重心，也正从单纯的模型竞赛转向架构竞赛，首当其冲的便是智能体架构与harness工程的比拼。

MiniMax也明确表示，将从研发型AI公司向平台型AI公司转型，并指出当前最具经济价值与使用价值的，往往正是当下最好的模型的不足之处。

市场已开始畅想，若一年后智谱或MiniMax能复刻Anthropic的爆发路径，实现ARR十倍增长，其估值天花板则仍未触及。Anthropic在ARR约14亿美元时，对应估值615亿美元。

然而，市场简单地将研读源代码等同于“复刻”Claude Code，甚至将其直接映射为Anthropic式的收入增长，未免失之草率。源码泄露并不等同于模型权重、API基础设施、用户信任及生态系统的全面泄露。而笃定这是中国团队实现技术创新与价值创造的唯一方式，也未免失之粗鲁。

月之暗面Agentic AI研究员Yufeng He，用Opus“读完”Claude Code的代码后最大的感受，是Anthropic把“实验驱动+可验证性”这套科研方法，搬进了工程系统。他发现，Claude Code内置了一套消融实验基础设施，启用后会关掉相关功能，允许团队每上线一个新功能，都可以跑一组对照实验，量化它的价值。这种追求“可解释性”的工程文化，比任何技术都值得效仿。