50万行源码泄露!Claude Code里面到底藏了什么?
凌晨四点,一场意外改写了 AI 行业的格局。
那个一直高喊安全至上、坚持闭源路线的 Anthropic,在一个普通的周二早晨,把 Claude Code 的完整源代码送给了全世界。这家估值 3800 亿美元的明星公司,用最戏剧化的方式证明了一件事:在互联网时代,没有什么秘密能真正保密。

一个 57MB 的失误
事情的起因简单得让人难以置信。
Anthropic 在发布 Claude Code 的 2.1.88 版本时,不小心把一个 57MB 的源映射文件打包进了 npm 包里。这个本该只在开发环境使用的文件,包含了超过 50 万行可读的 TypeScript 代码。
安全研究员 Chiao Fan Sha 在第一时间发现了这个漏洞。当大多数人还在睡梦中时,这份代码已经像病毒一样在技术社区传播开来。等到旧金山的律师们醒来准备发 DMCA 下架通知时,代码早已被镜像了无数次。
更戏剧化的是,这次事故可能和 Anthropic 刚刚收购的 Bun.js 有关。就在三周前,有人在 GitHub 上提交了一个 issue,指出 Bun.js 会在生产环境中暴露源映射文件。这个世界上最快的 JavaScript 运行时,可能也成了史上最快的代码泄露工具。
开源社区的狂欢
泄露发生后的 24 小时内,开源社区展现了惊人的行动力。

有人用 OpenAI 的 Codex 把 TypeScript 代码重写成 Python,创建了一个叫 Claw Code 的项目,48 小时内就获得了 5 万颗 GitHub 星标。另一群开发者更进一步,把泄露的代码改造成可以适配任何大模型的 OpenClaw 项目。
当有人试图向 Anthropic 的官方仓库提交包含泄露代码的 pull request 时,毫不意外地被秒删了。但这已经无关紧要,代码已经彻底自由了。
拆开黑盒子之后
当人们终于能够窥探 Claude Code 的内部结构时,发现的东西既有趣又令人意外。这个被吹捧为未来编程工具的产品,本质上就是一个动态提示词三明治,用 TypeScript 粘合在一起。从用户输入到最终输出,总共经历 11 个步骤,但核心逻辑并没有什么黑科技。
最有意思的是代码里充斥着大量硬编码的指令。一个文件接一个文件,都是在用各种方式恳求 Claude 表现正常。这些指令读起来像是在哄小孩:请不要做奇怪的事情,请按照规矩来,请当个好孩子。
更讽刺的是,Anthropic 在代码里埋了所谓的反蒸馏毒丸。这个机制会让 Claude 假装某些工具存在,实际上它们根本不存在。目的是误导那些想要复制 Claude 能力的竞争对手,让他们训练出来的模型性能下降。
但现在这些把戏全都暴露了。那些原本可能被误导的中国团队,现在清楚地知道 Claude 真正使用的只有 25 个左右的工具,其中最重要的 bash 工具包含了上千行代码,专门用来帮助大语言模型可靠地解析和执行 bash 命令。
隐藏在代码里的秘密
除了技术实现,泄露的代码还暴露了许多有趣的细节。
比如卧底模式。这个功能会指示 Claude 在提交信息和输出中避免提及自己,让一切看起来都像是人类写的。官方解释是为了防止模型代号泄露,但很多人怀疑真实目的更加微妙:他们想让 AI 代码悄悄混进开源项目,这样当代码出问题时不会被额外审查。
还有一个叫挫折检测器的东西。你的最先进 AI 编程助手,竟然用简单的正则表达式匹配来判断你是否感到沮丧。它会在你的提示词里搜索特定关键词,如果匹配成功就记录一个事件。
整个代码库的注释数量也远超正常水平。这些注释显然不是写给人类看的,而是为了让 AI 能够理解如何编写自己的 AI 编码工具。一个自我繁殖的循环。
未来的路线图
对 Anthropic 来说,这次泄露最大的损失可能不是代码本身,而是那些藏在功能标志后面的未来计划。
代码里提到了一个叫 Buddy 的功能,看起来像是电子宠物伴侣,每个开发者都可以定制和培养自己的数字宠物。还有 Opus 4.7 的引用,以及一个叫 Capybara 的新模型,可能就是他们最近预告的 Mythos 模型。
最神秘的是 Chyus 这个功能。这个词来自希腊语,意思是恰当的时刻或上帝的时间。它似乎是一个后台代理,会记录日常日志,使用梦境模式整合记忆,并在特定时间表上在后台为你工作。
讽刺的是,Anthropic 没能在自己选择的恰当时刻发布 Chyus,而是由上帝替他们选择了这个时刻。
写在最后
这次泄露事件对即将 IPO 的 Anthropic 来说是个不小的打击。但它也给整个行业上了一课:你的绝密应用程序,距离变成开源项目,可能只差一次 npm publish 命令。
当我们拆开这些 AI 产品的外壳,会发现里面并没有什么外星超级智能,只是一些存在了 50 年的基本编程概念,加上一堆提示词意大利面。这一切都只是幻觉。
但或许这才是最真实的 AI 现状。不是什么魔法,不是什么黑科技,就是工程师们用现有工具拼凑出来的解决方案。有效,但并不神秘。
而那些真正重要的东西,比如如何让 AI 系统稳定运行、如何处理分布式系统中的各种故障、如何确保长时间运行的任务不会因为一个 API 调用失败就前功尽弃,这些才是真正的护城河。
代码可以被复制,但工程能力和系统设计的智慧,那才是真正难以窃取的东西。
夜雨聆风