学习 Claude Code 泄露源码:一堂价值亿元的 AI 工程课-夜雨聆风

学习 Claude Code 泄露源码:一堂价值亿元的 AI 工程课

开篇

2026 年 3 月 31 日， Anthropic 犯了一个很低级的错误。

打包 Claude Code 的 npm 包时，忘记删掉 .map 文件——Source Map ，本来是给开发者调试用的，结果直接把 1906 个源文件、 51.2 万行 TypeScript 代码，原封不动地暴露在互联网上。

这不是第一次了。 2025 年 2 月，同样的原因泄露过一次。一年后又来一遍。

讽刺的是， Claude Code 的源码里有一个叫 Undercover Mode 的子系统，专门用来防止 Anthropic 内部代号出现在 git commit 里。他们精心设计了防泄露机制，然后把整个源码打包进了 npm 。

但抛开 Anthropic 的失误不谈，我想聊的是另外一件事：

这次泄露，可能是 2026 年 AI 工程领域最有价值的一次意外公开课。

因为源码公开后，我第一次有机会完整看完一个生产级 AI Agent 系统的真实实现。不是论文，不是技术博客，不是 PPT——是代码本身。看完之后，我对 AI Agent 的判断被彻底重塑了。

一、最反直觉的发现：它用的是 grep

先来个最让人意外的。

很多人以为 Claude Code 这种级别的 AI 编程工具，搜索代码肯定用上了向量数据库、 Embedding 索引之类的 RAG 方案。毕竟现在谁不聊向量检索都不好意思说自己做 AI 。

但源码显示——

它用的是 grep 和 ripgrep。

就是那个最朴素的文本搜索工具。没有 Embedding ，没有向量数据库，没有语义理解。

为什么？因为 Anthropic 想清楚了什么在这个场景下最可靠。

文本搜索是确定的、快速的、可预测的。你知道你在搜什么，你知道返回的结果是什么。对于代码搜索这场景，精确匹配比语义相关重要得多。

这让我重新审视了过去几年里我们在 AI 工程上的很多决策——我们有多少次是在用”更新的技术”解决一个”更简单的工具”就能解决的问题？

技术的先进性，从来不等于工程的正确性。

最好的 AI 工程师，不是追求”用最新技术”的人，而是追求”用最合适技术”的人。这个判断力，比掌握多少新技术更稀缺。

二、 Harness Engineering ： 60% 模型 + 40% 工程

这是这次源码泄露中，被反复提及但也是最重要的概念。

什么是 Harness Engineering ？

简单说： AI Agent 好不好用，不只取决于模型多强，更取决于围绕模型搭建的那套”笼具”有多好——工具设计、安全机制、记忆系统、上下文管理、多 Agent 协作，所有让 AI 从”能力强但不可预测”变成”稳定可靠能交付”的工程系统，合起来就是 Harness 。

Claude Code 好用，60% 靠模型能力， 40% 靠 Harness 工程。

市面上大量 AI 编程工具底层都在调用 Claude 或 GPT 的 API ，使用体验却天差地别。差异不在模型，在 harness 。

这次泄露最有学习价值的部分，就是这”40% 的 Harness 工程”到底长什么样。

三、源码里值得学的 6 个设计

1. 安全是四层流水线，不是一个开关

Claude Code 的 Auto 模式下，每一个操作请求都要经过四道关卡：

1.历史规则匹配——查用户之前说过什么偏好，命中直接放行

2.低风险跳过——只读操作无需确认

3.工具白名单直通——被信任的工具直接执行

4.独立分类器判断——调用一个独立的 Claude Sonnet （温度设为 0 ，最保守模式）做分类，分三档： Allow 、 Soft Deny 、 Hard Deny

更精妙的是熔断机制：连续 3 次被拒，或累计 20 次被拒，系统自动降级为手动确认模式。

源码注释里写着一个真实数据：3,272 次连续失败的单会话，每天在全球浪费约 25 万次 API 调用。

这是基于 BigQuery 真实数据设计出来的阈值，不是拍脑袋。

安全不是功能，安全是地基。绝大多数团队做安全时想的是”怎么把漏洞补上”，而不是”怎么让系统在失控边缘依然可预测”。

2. 不记代码，只记人

Claude Code 有一套完整的记忆系统，但它做了一个非常反直觉的核心决策：

记忆只存人的偏好和判断，代码相关的事实永远去源码里实时读取。

记忆只存：你的项目习惯、操作偏好、上次讨论到了哪里、你不用分号、你喜欢用全角引号。

不存：哪段代码改了什么、哪个函数有什么 bug 。因为这些， Claude Code 认为应该直接去源码里读，存在记忆里可能过时。

「不记代码，只记人」——这六个字背后，是对 AI 认知局限的清醒认识。记忆系统的价值不在于存了多少，而在于存对了什么。这个判断，比任何向量数据库的优化都更重要。

3. 上下文压缩是 9 段式结构化提取

模型接近上下文窗口极限时，会倾向于草草收尾——Anthropic 管这叫 “context anxiety”。就像一个人知道自己快没时间了，会开始跳步骤、走捷径。

Claude Code 的解法不是简单的”总结一下”，而是一套结构化的 9 段式提取：

核心请求 → 关键概念 → 文件和代码 → 错误和修复 → 解决过程 → 所有用户消息 → 待办任务 → 当前工作 → 下一步行动

九个维度，缺一不可。接近极限时生成这份结构化交接材料，下一个窗口从交接材料开始，不是从一个快撑满的上下文开始。

同时，长输出结果不塞进上下文，直接写到磁盘上，给模型一个文件路径引用。几千行日志换成一行文件引用，节省 90%+ 的上下文空间。

4. 工具延迟加载——50 个工具，只加载你需要的

Claude Code 有 50 多个工具。但默认只加载核心工具，其余按需延迟加载。

因为工具选择本身会消耗模型的推理能力。选项越多越容易选错。

每个工具还带着一套属性：能不能并行执行、会不会修改文件系统、结果超过多大写磁盘、用户打断时是停掉还是继续跑完。

这跟日常使用 MCP 的经验是一个道理——不要给智能体一个海洋馆，给它一个太平洋。多接几个工具让它更”万能”，但实际上每多一个工具，它可用于理解实际问题的上下文空间就缩小一点。

克制，比贪多更重要。

5. Sub-Agent 用完即弃

子 Agent 的价值是：花几万 token 去做一个子任务，做完只把结论交给主 Agent ，中间过程全扔掉。

有四种执行模式，按风险等级逐级隔离：

模式	场景
同步	主 Agent 等子 Agent 跑完
异步后台	后台跑，完成通知用户
Worktree 隔离	在独立 git 副本里改代码，不影响主目录
跨机器隔离	完全在另一台机器上跑

风险越高，隔离越彻底。同时有防递归机制，防止无限套娃。

6. 判式权限验证——让用户感觉不到等待

工具执行前的分类器判断和弹窗准备是并行执行的：

分类器判断这个命令大概率没问题 → 弹窗直接跳过。用户感知不到等待，因为判断在弹窗准备期间已经做完了。

这种细节决定了用户体验。用户不需要知道背后发生了什么，只会觉得”这个工具响应很快”。

四、隐藏功能：下一代 AI Agent 长什么样

源码中还暴露了一些尚未发布的功能标志，指向 Claude Code 的未来方向：

•DAEMON——后台守护进程，关掉终端窗口后依然持续运行。”你去睡觉，它帮你执行任务”

•AGENT_TRIGGERS——自动触发机制，设定条件后自动唤醒执行任务

•MONITOR_TOOL——持续监控工具，每隔几分钟汇报状态

•BRIDGE_MODE——打通不同 IDE 和工具之间的桥接模式

•Kairos 模式——具备”持久生命”的自主守护进程，永不离线

这些功能说明 Claude Code 不满足于做一个”你问它答”的编程助手，而是走向一个能主动思考、持续运行的 AI 伙伴。

五、源码泄露之后，护城河还在吗

这是所有 AI 创业者和产品决策者最需要想清楚的问题。

很多人以为 Claude Code 的核心壁垒是工程设计，所以源码泄露意味着壁垒消失。

但事实是，这套精密的 Harness 工程，它的真正价值不是”别人抄不走的秘密”，而是”它证明了这个团队有能力把复杂系统做对“。秘密可以被复制，能力不能。

更重要的是——Claude Code 占 Anthropic 年化总收入的 18%， 2026 年初六周内实现了收入翻倍，年化规模是 OpenAI Codex 的 2.5 倍。这些数字背后是数十万付费用户的使用习惯、企业客户的采购合同、以及沉淀在每个团队工作流中的偏好。

这些才是真正的护城河。

六、我们能从中学到什么

看完 Claude Code 的源码，我总结了几个可以立刻用到自己项目里的原则：

1.用 grep 就用 grep——别为了追赶技术潮流把简单问题复杂化

2.安全从第一天开始设计——那套四层流水线和熔断机制不是后来补的

3.记忆只存对的，不存多的——”不记代码，只记人”的思路值得借鉴

4.上下文是稀缺资源——长结果写磁盘，接近极限时主动清空重来

5.工具越少越好——每多一个工具，上下文就少一分

6.子任务用完即弃——不要保留中间过程

7.让用户感觉不到等待——并行执行判断，体验上的差异

这次泄露之后，一个韩国开发者 Sigrid Jin （曾被华尔街日报报道为 Claude Code 最活跃的超级用户，去年单人消耗了 250 亿 Token ）主导了一个叫 claw-code 的项目，基于泄露架构用 Python/Rust 重写。几个小时内， GitHub Star 突破 3 万，成为 GitHub 历史上增长最快的仓库之一。

源码可以被克隆。但理解为什么这样设计——这种工程判断力，才是真正的价值所在。

从长远来看，这或许是这个行业发生过的最有价值的一次”意外开源”。它让所有人第一次有机会如此清晰地看见：在 AI 浪潮的深处，那些真正重要的工程决策，是什么样子的。

你觉得 Claude Code 这波泄露最大的价值在哪？最让你意外的设计是哪一点？欢迎留言聊聊。