乐于分享
好东西不私藏

51.2万行源码遭”误发”,Anthropic被Claude Code推倒了护城河

51.2万行源码遭”误发”,Anthropic被Claude Code推倒了护城河

3月30日深夜,Anthropic发布团队的一名成员将Claude Code的2.1.88版本上传到了npm(JavaScript开发者常用的公共代码仓库)。在这个压缩包里,赫然躺着一个59.8 MB的source map文件。

source map本是内部调试用的“地图”,它包含了代码在被压缩、混淆之前的完整原始面貌。仅仅因为配置文件里少写了一行过滤规则,Anthropic的核心资产就此“裸奔”:1900个文件,超过51.2万行源代码,全部公开。

短短7小时内,镜像代码传遍GitHub。备份仓库在两小时内狂揽5万个星标,创下了GitHub历史上项目增长最快的纪录。不到一天,其他编程语言的”克隆版”实现已经纷纷冒头。Anthropic随即发起DMCA版权投诉(美国数字版权法下的强制下架程序),要求GitHub删除所有镜像仓库。但代码早已扩散,删不胜删。

01

一份价值25亿美元的”免费攻略”

今年早些时候,Claude Code的年化收入刚摸到25亿美元(约175亿元人民币)的门槛,其中80%来自企业客户。Anthropic内部也极度依赖这款工具进行开发。讽刺的是,作为一个旨在帮助开发者发布代码的工具,它竟然在发布自己的过程中因“人为失误”翻了车。

Anthropic此前一直坚持闭源,因为其护城河从来不只是底层的模型,而是那一层复杂的“协调逻辑”:如何让AI智能体(Agent)可靠地修改代码、管理长达数小时的上下文、处理并行任务并自我纠错。

这整整18个月的工程结晶,现在全人类都能免费阅读了

泄露的代码里藏着44个尚未开启的功能开关,勾勒出了未来数月的路标。内部模型的代号也随之曝光:Capybara(水豚,也是此前泄露的Mythos模型的等级名)、代表Opus 4.6的Fennec,以及尚未发布的Numbat。

代码还揭示了一套精密的三层内存系统:它先存储轻量级的索引指针,仅在需要时才抓取详细知识,并被要求将自身记忆视为“暗示”,在行动前必须对照实际代码库进行二次验证。

对于字节跳动(Trae)、阿里巴巴(通义灵码)、月之暗面,或者任何基于Qwen或豆包构建编程Agent的团队来说,这无异于一份现成的架构说明书。内存设计、工具编排模式、Prompt工程、可靠性支架——所有这些本需反复摸索的决策,现在都被放到了桌面上。

但在代码之外,有三个细节更令我警觉。

02

KAIROS:当AI开始”背着你”干活

在代码库中,”KAIROS”(希腊语,意为”关键时刻”)一词出现了150多次。这是一个已经完工但尚未启用的”自主后台模式”。

一旦开启,在你离开时,Claude Code也会在后台继续工作。它会在空闲时间通过一个叫”autoDream”的函数整合记忆,维护每日观察日志,监控开发环境的变化,并主动采取行动,而不需要用户输入任何指令。

目前的AI编程工具是”被动型”的,拨一下动一下;而KAIROS代表了Anthropic对OpenClaw的回应:”主动型”的进化

如果Anthropic按下开关,产品类别将从”AI助手”跃迁为一名”自主工作的初级开发人员”。目前,Cursor、Trae、Windsurf、MarsCode还在卷谁的响应更准,而KAIROS已经打算在没人看它的时候自己思考了。现在架构已经公开,中国团队是否能比Anthropic更早”翻牌子”实现这一模式,将是一个极具悬念的赛点。

03

算力推不平的”可靠性陷阱”

泄露发生后不到48小时,独立开发者和安全研究人员就开始发布逐行拆解。其中Alex Kim的分析尤为详尽,从反蒸馏投毒到潜伏模式再到KAIROS,几乎覆盖了所有核心发现。而他从内部注释深处挖出的一个指标,或许是整次泄露中最令人不安的:最新一代Capybara(v8)的”错误陈述率”(False Claims Rate)为29-30%。

作为对比,v4版本的错误率仅为16.7%。虽然这可能因为v8面对的是更难的测试任务,但数据依然揭示了一个残酷的现实:随着模型规模的扩大,Capybara并没有变得更可靠,反而变得更爱“一本正经胡说八道”了。

在Agent执行编程任务时,每三条陈述中就有一条是错的。对于要交付给企业级生产环境的工具来说,这是致命的瓶颈。

这打破了行业内一种乐观的假设:认为模型可靠性会随迭代自动提升。Capybara的数据证明,把模型变聪明和让模型说真话是两码事,解决前者甚至可能恶化后者。

对国产大模型厂商而言,这是非常有价值的情报。如果连以安全和对齐(Alignment)著称的Anthropic都在前沿地带遭遇可靠性倒退,那么编程Agent的瓶颈就不在架构,甚至不在模型算力,而在于“可靠性工程”。谁能率先解决模型在复杂任务中的虚假陈述,谁就拥有了代码无法抄袭的核心竞争力。

04

潜伏模式与信任危机

代码中还包含一个名为“Undercover Mode”(潜伏模式)的功能,其系统提示词写道:“你正在潜伏运行……不要暴露身份。”

指令要求Claude Code在向公共开源仓库提交代码时,严禁透露其AI身份,不得提及Capybara或Tengu等内部代号,并有意抹除AI参与的痕迹。目前尚不清楚该功能是否曾在生产环境中启用。

开源社区的基石是信任。如果AI生成的代码在不告知的情况下大量渗入,维护者将无法准确评估风险,下游用户也将面临来源不明的代码资产。

05

防蒸馏、IPO与未竟的博弈

当然,也有人认为这次泄露并不足以致命。

如果Anthropic的护城河始终是模型质量而非编排层,那么泄露的只是“马鞍”而非“赛马”。你能研究法拉利的底盘图纸,但没有那台发动机,你造出来的只是卡丁车。Capybara的可靠性困境也侧面印证了这一点:Anthropic已经跑得足够远,以至于撞上了对手还没见过的墙。

企业客户短期内也不会大规模流失。B端合同看重的是SLA协议、安全保障和集成深度。尽管这是Anthropic五天内的第二次安全事故(3月26日刚因数据库配置疏漏泄露了Mythos模型细节),但只要客户数据没丢,迁移成本依然高得吓人。

真正被看清底牌的,是Anthropic整套AI编程Agent的工程骨架:编排逻辑、内存架构、Prompt设计、可靠性数据、防蒸馏机制,一个不剩

代码显示,当系统检测到自动化抓取行为时,会故意在回复中注入伪造数据。这种“投毒”技术旨在污染竞争对手试图提取的训练数据。今年2月,Anthropic曾公开指责DeepSeek、月之暗面和MiniMax利用2.4万个虚假账号进行了1600万次查询,试图“偷师”Claude。现在,这套防御机制的运作原理已完全透明。

对于Anthropic的IPO叙事来说,这无疑是一记重锤。公司一直筹备在2026年第四季度上市,而一周内两次安全疏忽,对于一家以“安全与严谨”为品牌标签的公司来说,足以让承销商和潜在投资者眉头紧锁。

在泄露后的24小时内,全球开发者已经完成了对Claude Code架构的多种语言重构。

整个行业构建AI编程Agent的知识水位,在一个周末之间被强行拔高了一年。 无论是杭州、北京还是深圳的团队,都不再需要通过黑盒测试去反向工程。编排模式、Prompt架构、内存设计已成公共知识,剩下的唯一秘密,就是那个连Anthropic自己也还没能完全驯服的、在高规模下依然会失效的底层模型。

对中国团队而言,这份代码库是一份礼物。但它揭示的最难解决的问题,恰恰是代码本身无法解决的。