乐于分享
好东西不私藏

Claude Code源码泄露,智谱与MiniMax咬住harness

Claude Code源码泄露,智谱与MiniMax咬住harness

市场对国产AI的乐观情绪,再次被Claude Code点燃。

年初,Claude Code在编码及白领工业领域的突破,不仅推动Anthropic进入爆发期,也为中国厂商提供了清晰的追赶坐标;而昨晚那场意外的开源,为市场强化了一种更具想象力的叙事,仿佛中国厂商直接获得了智能体系统的工程蓝图。

昨日,智谱股价涨幅约32%,总市值至4080亿港元(约520亿美元);MiniMax涨幅14%,超3300亿港元(约420亿美元)。

时隔一日,开发者社区仍然沉浸在拆解Claude Code源代码的窃喜之中。这无异于一场面向未来的考古

在已经泄露的1906个文件,512000行代码,40多个工具中,埋藏着Anthropic构建生产级智能体系统的全套工程方法论。那些围绕“harness工程的系统化设计正被逐一还原。数十项尚未发布的功能(Unshipped Features)所指向的未来,比Anthropic官方博客所描绘的未来,还要超前得多。

一个长期在线、自主执行、递归进化的Agentic AI时代正扑面而来。KAIROS 是一个常驻后台的智能体,通过做梦(autoDream)自动进行记忆蒸馏;Coordinator Mode 是多智能体协作系统,负责派遣和协调工作者智能体(Worker Agent)完成具体任务;而PROACTIVE允许智能体无需用户提示就能自主行动。

这种长时间无人值守、可持续运行的智能体体系,一直被视为通往AGI的关键路径之一。Claude Code的源码泄露表明,这些组件已经准备好了,距离现实不再遥远。

早在今年2月,Anthropic曾披露,用户让Claude Code不间断自动执行任务的时长已超过45分钟,几乎是三个月前的两倍。在达沃斯世界经济论坛上,Anthropic创始人阿莫迪(Dario Amodei)坚信,到20262027年,大模型将通过自我设计递归进化,在多数领域达到诺奖得主水平。

除战略布局外,泄露的源码更揭示了Anthropic在战术层面如何打磨harness工程:流式工具并行,允许模型生成和只读操作的工具调用并行执行,等待的延迟被藏在了时间里;四种粒度的上下文管理,可以有序地剪裁、缓存、归档与压缩,解决长程任务注意力不支问题,等等。

当智能体演化为能够长时运行、分工协作并进行反复自我评估的系统后,其记忆管理、延迟控制与权限体系的重要性愈发凸显。人人都知道,2026年的竞争重点,不只是谁模型更大,而是谁的智能体系统更工程化。

然而,实现这一目标的路径并非显而易见。Claude Code的源代码提供了经过验证的方法,虽然它既不是唯一方案,也不一定是最优方案,但实实在在地提升了可见性,降低了快速跟随者的实验成本和时间门槛。如今,不少智能体初创团队,可以选择直接跳过昂贵与漫长的试错与迭代,并将它接入中国的开源模型。

肯定会有团队这么做。年初以来,有关智能体的一切都在加速,包括harness工程支持的token消耗,以及它在各大应用场景的渗透。harness工程的上限,也意味着智能体系统的生产可用性和经济价值的上限。用Claude Opus 4.5做一个2D复古游戏制作器,solo版本运行20分钟,成本9美元,而全套harness环境下需要运行6小时,成本高达200美元。但是,只有后者的产出,才是真正能用的。

Harness正在如何改变token经济学

  2026/03/31  完整阅读 >

市场普遍预期,这一加速趋势将持续深化。在编码领域取得突破后,Claude Code的应用边界不断外延,其企业服务应用Cowork旗下的系列智能体,已渗透至十多个高经济价值的白领工作领域。这些垂直领域也需要自己的harness工程。Anthropic的年度经常性收入(ARR),也因此达到了190亿美元,而去年底仅为90亿美元。

这吓得OpenAI拉响红色警报。在迅速调整战略方向后,目前,OpenAI面向企业的收入显著提升,营收占比达到40%,预计年底与消费者业务持平。其中,Codex的周活跃用户超过200万,过去三个月增长了5倍。第一方APItoken消耗也在急剧攀升,每分钟处理量超150亿,是去年10月的2.5倍,料与谷歌接近(去年底100亿/分钟)。

中国开源模型已证明其足以胜任大多数AI编程任务。500亿美元估值的Cursor便是一个鲜活例证,它宣称自研的Composer 2模型,底层基座实为Kimi-K2.5开源模型。此外,年初以来,其他开源模型,如智谱的GLM-5,以及MinimaxM2.5,也都称编码性能逼平 Claude Opus 4.6,价格却低至只有其1/20。现在的挑战在于,它们需证明这些模型在harness工程的支持下,智能体系统能取得同等增速的商业成绩。

OpenAIAnthropic正在筹备上市,公司最新估值分别达到了8520亿美元与3800亿美元。在这之前,抢先上市的MiniMax与智谱,享受到了时间的红利。年初至今的股价走势,正是市场对智能体的焦虑与亢奋的映射,今日再次引爆。它们已成为Claude Code在中国的完美镜像。

国内企业服务市场的迅猛成长,为市场解读此次代码泄露事件,提供了一定程度的基本面支撑。昨晚,恰逢智谱发布上市后首份年度业绩,其中开放平台和API收入,去年至今增幅近3倍至1.9亿元人民币,远超公司整体收入增幅。公司APIARR已达约17亿人民币(约2.5亿美元),同比增长60倍;即便一季度API涨价83%,调用量仍逆势增长4倍。

(来自智谱)

此前,MiniMax年报亦披露API收入约1.8亿人民币,增长约200%;截至2月,其ARR1.5亿美元,M2系列模型的Token消耗量较去年底增长了6倍。

它们也都在转向高价值经济任务。智谱提出了“Token架构能力TAC)概念。该指标不仅考量智能质量调用量等模型层价值,更融入了转化为经济价值的效率这一关键因子。这标志着国内AI行业的竞争重心,也正从单纯的模型竞赛转向架构竞赛,首当其冲的便是智能体架构与harness工程的比拼。

MiniMax也明确表示,将从研发型AI公司向平台型AI公司转型,并指出当前最具经济价值与使用价值的,往往正是当下最好的模型的不足之处。

市场已开始畅想,若一年后智谱或MiniMax能复刻Anthropic的爆发路径,实现ARR十倍增长,其估值天花板则仍未触及。AnthropicARR14亿美元时,对应估值615亿美元。

然而,市场简单地将研读源代码等同于复刻”Claude Code,甚至将其直接映射为Anthropic式的收入增长,未免失之草率。源码泄露并不等同于模型权重、API基础设施、用户信任及生态系统的全面泄露。而笃定这是中国团队实现技术创新与价值创造的唯一方式,也未免失之粗鲁。

月之暗面Agentic AI研究员Yufeng He,用Opus“读完”Claude Code的代码后最大的感受,是Anthropic实验驱动+可验证性这套科研方法,搬进了工程系统。他发现,Claude Code内置了一套消融实验基础设施,启用后会关掉相关功能,允许团队每上线一个新功能,都可以跑一组对照实验,量化它的价值。这种追求“可解释性”的工程文化,比任何技术都值得效仿。