51万行源码全裸奔!Claude Code史诗级泄露,我们扒出了AI编程的终极秘密
|
constleak=awaitnpm.install(‘@anthropic-ai/claude-code@2.1.88’); // 一个忘了删的 .js.map 文件,把价值数十亿美元的 AI 编程工具扒得一丝不挂 “512,000 lines of TypeScript. 1,906 source files. Zero encryption.” |
你可能听说过代码泄露,但你大概率没见过这种泄露方式——一个忘了删的调试文件,把价值数十亿美元的AI编程工具扒得一丝不挂。
2026年3月31日,开发者Chaofan Shou在Anthropic发布的npm包里,发现了一个59.8MB的source map文件。这个本该在发布前删除的调试文件,包含了Claude Code全部1906个源文件、512,000行TypeScript代码的完整映射。
不需要反编译,不需要逆向工程,写十行脚本就能把源码原封不动地还原出来。
消息一出,GitHub上立刻出现了镜像仓库,2小时内狂揽5万Star,成为GitHub历史上增长最快的仓库。全球开发者连夜拆解、用Python和Rust重写、发论文分析架构……
这不是一次普通的安全事故。这是一堂价值亿元的AI工程公开课。
> Step_01.一场”低级错误”引发的地震
事情的起因出乎意料地简单。
Anthropic在发布Claude Code v2.1.88版本时,npm包的发布配置里忘记排除.js.map文件。这个source map本质上是一个JSON文件,里面有两个关键字段:sources(文件路径列表)和sourcesContent(完整源代码)。
换句话说,Anthropic把自己产品的”建筑蓝图”直接打包发给了全世界。
更讽刺的是,这不是第一次。2025年2月就发生过类似的source map泄露事件。而就在这次泄露的5天前,Anthropic的CMS配置错误还暴露了3000份内部资产,包括尚未发布的Claude Mythos模型信息。
Anthropic随后紧急发起DMCA Takedown请求,但操作再次翻车——误删了数千个无关的GitHub仓库,引发了更大的社区反弹。
> Step_02.核心架构:比你想的更”朴素”
当所有人都在猜测Claude Code用了什么黑科技时,源码给出了一个意外的答案:最合适的技术,而非最新的技术。
运行时:Bun(不是Node.js)
语言:TypeScript,51.2万行
UI渲染:React + Ink(终端渲染框架,借鉴游戏引擎技术)
校验层:Zod v4
代码搜索:grep 和 ripgrep(传统命令行工具)
没错,Claude Code的代码搜索用的是grep和ripgrep——而不是向量数据库或语义检索。对于精确的代码搜索,传统工具的准确性和速度远超当前的语义搜索方案。
> Step_03.Agent循环:46000行的”心脏”
Claude Code的核心是一个46000行的查询引擎(Query Engine),负责LLM调用、流式传输、缓存和上下文管理。它实现了一个”自愈查询循环”——当上下文预算接近上限时,自动触发压缩,在达到天花板之前预留缓冲区,生成结构化摘要。
Agent循环采用了协调者/工人(Coordinator/Worker)多智能体模式。工人可以自主执行任务,但危险操作必须路由到协调者的邮箱等待审批。系统通过原子性认领机制,防止多个工人同时处理同一个审批请求。
|
ARCHITECTURE: 40+工具的插件架构 每个工具独立定义输入Schema、权限等级和执行逻辑,防止跨工具状态泄漏。正如源码注释所写:”BashTool和FileReadTool在同一个注册表中,但它们的风险画像完全不同。”更巧妙的是延迟加载机制——当MCP工具数量超过阈值时,系统只加载轻量级存根,让模型按需发现完整Schema,有效控制Token消耗。 |
> Step_04.六级安全架构:每次调用都要”过安检”
Claude Code的权限模型是源码中最精密的部分之一。每一次工具调用都要经过四层权限流水线:
Layer 1 历史规则匹配:查看是否有已存在的规则可以直接放行
Layer 2 低风险判断:低风险操作自动跳过审核
Layer 3 只读白名单:只读工具直接通过
Layer 4 AI分类器:独立Claude Sonnet模型(温度=0)进行安全分类
分类结果分为三档:Allow(允许)、Soft Deny(软拒绝)、Hard Deny(硬拒绝)。
|
CIRCUIT BREAKER: 连续3次被拒 或 累计20次被拒 → 自动降级为手动确认模式 权限规则的评估顺序是 deny → ask → allow,第一个匹配的规则胜出,拒绝规则永远优先。即使AI分类器出现偏差,系统也不会失控。 |
> Step_05.记忆系统:不记代码,只记人
Claude Code的记忆系统设计哲学令人印象深刻:代码可以实时读取,不需要持久化;但用户偏好和项目上下文需要被记住。
用户偏好:你的角色、习惯、技术栈
行为反馈:你说过”别这样做”、”保持这个风格”
项目信息:截止日期、决策背景、团队分工
外部资源:Linear看板地址、Grafana仪表板链接
为什么不记代码?因为”代码会变,记了就可能成为错误的上下文”。这个判断看似反直觉,实则深刻——过时的记忆比没有记忆更危险。
|
autoDream: 当距上次整理超过24小时且新会话累计超过5个时,后台自动整理记忆。 AI在”做梦”的时候整理记忆,颇有些浪漫。 |
> Step_06.上下文压缩:三层递进式策略
大模型最大的工程挑战之一是上下文窗口管理。Claude Code用了三层压缩策略:
MicroCompact:本地编辑级压缩,零API开销
AutoCompact:接近上限时自动触发,预留13000 Token缓冲区,生成最多20000 Token摘要,内置熔断器
Full Compact:完整对话压缩,选择性重新注入文件内容(每文件上限5000 Token)
压缩时采用9段式结构化提取:核心请求、关键概念、文件和代码、错误和修复、解决过程、所有用户消息、待办任务、当前工作、下一步行动。
|
GOLDEN RULE: “所有用户消息必须完整保留,不得删减。” AI可以遗忘自己的推理过程,但不能篡改用户的意图。 |
> Step_07.未发布的秘密武器
泄露源码中最劲爆的部分,是那些尚未发布的功能。108个模块使用编译时Feature Flag控制,通过Bun的死代码消除在发布版本中隐藏。
|
KAIROS — 永不下线的AI助手 来自古希腊语,意为”恰当的时机”。在源码中出现154次。这是一个自主守护进程模式——通过claude assistant [sessionId]保持持续运行,订阅MCP Channel通知和GitHub Webhooks,与cron定时任务、远程控制模块深度集成。 简单来说,KAIROS要把Claude Code从”你叫它才动”的工具,变成一个7×24小时在线、持续待机、随时响应的AI操作系统。 |
|
ULTRAPLAN — 30分钟深度规划 使用Opus 4.6模型进行长达30分钟的深度任务规划,暗示Anthropic正在探索让AI花更多时间”想清楚再动手”的路线。 |
|
BUDDY — 赛博宠物 一个完整的虚拟宠物系统。18种物种、6种眼睛样式、稀有度体系,还有五维属性:调试能力、耐心、混沌值、智慧和毒舌程度。开发者甚至用String.fromCharCode()混淆代码来躲避内部扫描器。考虑到发现时间是3月31日,这很可能是一个精心准备的愚人节彩蛋。 |
|
UNDERCOVER MODE — 卧底模式 当检测到Anthropic员工操作公开GitHub仓库时激活,会”抹除所有AI生成代码的痕迹”。System prompt甚至要求模型”不要暴露你的身份”。 |
> Step_08.遥测系统:AI比你更懂你的情绪
源码中的遥测设计透露了Anthropic对用户体验的量化思路:
“烦躁指标”:记录用户在终端对Claude爆粗口的频率
“动力流失指标”:追踪用户连续输入”continue”的次数
这些不是用来评判用户的——它们是产品体验的量化信号。”continue”输入过多,意味着Agent的单次执行深度不够;粗口频率上升,意味着用户体验正在恶化。
> Step_09.AI Agent开发的五大最佳实践
这51万行代码,浓缩了Anthropic在AI Agent工程化上的核心经验:
1. 用成熟技术解决问题:代码搜索用grep,格式校验用Zod,终端渲染用React——选工具看场景,不看热度
2. 权限模型要分层、要熔断:每个工具有独立风险画像,熔断机制确保异常时自动降级
3. 记忆要克制:代码可以实时读取就不要持久化,过时的记忆比没有记忆更危险
4. 上下文压缩要分级:从零成本本地压缩到全量对话压缩,逐级递进,永远保留用户原始意图
5. 用Feature Flag管理未来:108个编译时Flag让未发布功能安全存在于代码库中——虽然这次还是泄露了
> Step_10.泄露之后:护城河还在吗?
这次泄露确实削弱了Anthropic的一些优势。权限模型的实现、遥测设计、工具架构、远程控制思路都被迅速拆解和模仿。
但Claude Code真正的护城河从来不只是代码本身:
模型能力:源码展示的是”怎么用”,而不是”怎么训练”
推理成本:大规模部署的成本优化不在客户端代码里
品牌信任:企业客户选择的是生态,不是某个工具
迭代速度:你今天Fork的代码,明天就过时了
Claude Code目前占Anthropic年化总收入的18%,2026年初六周内实现收入翻倍,年化规模是OpenAI Codex的2.5倍。一次源码泄露,显然不足以动摇这个根基。
|
CONCLUSION: 秘密可以被复制,能力不能。 51万行代码摊开在阳光下,我们看到的不是什么惊天黑科技,而是一个顶级工程团队在”把正确的事做对”上的极致追求。用grep而不是向量数据库做搜索,用熔断机制而不是祈祷来保证安全,用克制而不是贪婪来设计记忆系统——这些选择背后的判断力,才是真正难以复制的东西。 毕竟,AI时代最稀缺的资源,不是算力,不是数据,而是工程判断力。 |
夜雨聆风