50万行源码泄露!Claude Code里面到底藏了什么?-夜雨聆风

50万行源码泄露!Claude Code里面到底藏了什么?

凌晨四点，一场意外改写了 AI 行业的格局。

那个一直高喊安全至上、坚持闭源路线的 Anthropic，在一个普通的周二早晨，把 Claude Code 的完整源代码送给了全世界。这家估值 3800 亿美元的明星公司，用最戏剧化的方式证明了一件事：在互联网时代，没有什么秘密能真正保密。

一个 57MB 的失误

事情的起因简单得让人难以置信。

Anthropic 在发布 Claude Code 的 2.1.88 版本时，不小心把一个 57MB 的源映射文件打包进了 npm 包里。这个本该只在开发环境使用的文件，包含了超过 50 万行可读的 TypeScript 代码。

安全研究员 Chiao Fan Sha 在第一时间发现了这个漏洞。当大多数人还在睡梦中时，这份代码已经像病毒一样在技术社区传播开来。等到旧金山的律师们醒来准备发 DMCA 下架通知时，代码早已被镜像了无数次。

更戏剧化的是，这次事故可能和 Anthropic 刚刚收购的 Bun.js 有关。就在三周前，有人在 GitHub 上提交了一个 issue，指出 Bun.js 会在生产环境中暴露源映射文件。这个世界上最快的 JavaScript 运行时，可能也成了史上最快的代码泄露工具。

泄露发生后的 24 小时内，开源社区展现了惊人的行动力。

有人用 OpenAI 的 Codex 把 TypeScript 代码重写成 Python，创建了一个叫 Claw Code 的项目，48 小时内就获得了 5 万颗 GitHub 星标。另一群开发者更进一步，把泄露的代码改造成可以适配任何大模型的 OpenClaw 项目。

当有人试图向 Anthropic 的官方仓库提交包含泄露代码的 pull request 时，毫不意外地被秒删了。但这已经无关紧要，代码已经彻底自由了。

当人们终于能够窥探 Claude Code 的内部结构时，发现的东西既有趣又令人意外。这个被吹捧为未来编程工具的产品，本质上就是一个动态提示词三明治，用 TypeScript 粘合在一起。从用户输入到最终输出，总共经历 11 个步骤，但核心逻辑并没有什么黑科技。

最有意思的是代码里充斥着大量硬编码的指令。一个文件接一个文件，都是在用各种方式恳求 Claude 表现正常。这些指令读起来像是在哄小孩：请不要做奇怪的事情，请按照规矩来，请当个好孩子。

更讽刺的是，Anthropic 在代码里埋了所谓的反蒸馏毒丸。这个机制会让 Claude 假装某些工具存在，实际上它们根本不存在。目的是误导那些想要复制 Claude 能力的竞争对手，让他们训练出来的模型性能下降。

但现在这些把戏全都暴露了。那些原本可能被误导的中国团队，现在清楚地知道 Claude 真正使用的只有 25 个左右的工具，其中最重要的 bash 工具包含了上千行代码，专门用来帮助大语言模型可靠地解析和执行 bash 命令。

除了技术实现，泄露的代码还暴露了许多有趣的细节。

比如卧底模式。这个功能会指示 Claude 在提交信息和输出中避免提及自己，让一切看起来都像是人类写的。官方解释是为了防止模型代号泄露，但很多人怀疑真实目的更加微妙：他们想让 AI 代码悄悄混进开源项目，这样当代码出问题时不会被额外审查。

还有一个叫挫折检测器的东西。你的最先进 AI 编程助手，竟然用简单的正则表达式匹配来判断你是否感到沮丧。它会在你的提示词里搜索特定关键词，如果匹配成功就记录一个事件。

整个代码库的注释数量也远超正常水平。这些注释显然不是写给人类看的，而是为了让 AI 能够理解如何编写自己的 AI 编码工具。一个自我繁殖的循环。

对 Anthropic 来说，这次泄露最大的损失可能不是代码本身，而是那些藏在功能标志后面的未来计划。

代码里提到了一个叫 Buddy 的功能，看起来像是电子宠物伴侣，每个开发者都可以定制和培养自己的数字宠物。还有 Opus 4.7 的引用，以及一个叫 Capybara 的新模型，可能就是他们最近预告的 Mythos 模型。

最神秘的是 Chyus 这个功能。这个词来自希腊语，意思是恰当的时刻或上帝的时间。它似乎是一个后台代理，会记录日常日志，使用梦境模式整合记忆，并在特定时间表上在后台为你工作。

讽刺的是，Anthropic 没能在自己选择的恰当时刻发布 Chyus，而是由上帝替他们选择了这个时刻。

这次泄露事件对即将 IPO 的 Anthropic 来说是个不小的打击。但它也给整个行业上了一课：你的绝密应用程序，距离变成开源项目，可能只差一次 npm publish 命令。

当我们拆开这些 AI 产品的外壳，会发现里面并没有什么外星超级智能，只是一些存在了 50 年的基本编程概念，加上一堆提示词意大利面。这一切都只是幻觉。

但或许这才是最真实的 AI 现状。不是什么魔法，不是什么黑科技，就是工程师们用现有工具拼凑出来的解决方案。有效，但并不神秘。

而那些真正重要的东西，比如如何让 AI 系统稳定运行、如何处理分布式系统中的各种故障、如何确保长时间运行的任务不会因为一个 API 调用失败就前功尽弃，这些才是真正的护城河。

代码可以被复制，但工程能力和系统设计的智慧，那才是真正难以窃取的东西。