乐于分享
好东西不私藏

Claude Code 源码泄露事件解析:顶尖 AI Agent 的隐藏秘密

Claude Code 源码泄露事件解析:顶尖 AI Agent 的隐藏秘密

这几天,AI 圈最炸裂的消息莫过于 Anthropic 的 Claude Code 源码泄露事件了。作为一名深耕 AI 技术圈的自媒体人,我(阿峰)熬夜扒完了这 50 多万行代码。

别光顾着看 Anthropic 的笑话,这份源码其实是目前全球最顶尖的 AI Agent 架构教科书。比起吃瓜,我更想带大家看看这 11 个足以改变你对 AI 应用认知的“隐藏秘密”。

01 翻车现场:一个 Source Map 引发的惨案

谁能想到,一家估值数百亿、以安全著称的 AI 巨头,竟然倒在了最基础的发布环节。

  • 事故原因
    :工程师在发布 Claude Code 2.1.88 版本时,打包工具 Bun 默认生成了 Source Map 文件。
  • 低级错误
    :发布配置里忘了排除 .map 文件,导致一个 59.8M 的 JSON 文件直接传到了 npm 公开仓库。
  • 后果
    :这个文件就像一张“源代码复原图”,通过简单的脚本就能将混淆后的代码 100% 还原。

02 架构心法:大道至简的 While(true)

大家总觉得顶尖 Agent 背后一定有极其复杂的框架,但 Claude Code 的核心循环代码却简单得令人发指。

  • 核心逻辑
    :在 query.ts 文件中,所谓的大脑其实就是一个 while(true) 无限循环
  • 运行机制
    :每一轮循环都在做“压缩上下文 → 调用模型 → 执行工具 → 追加结果”的 ReAct 闭环。
  • 巫师守则
    :代码里甚至留下了名为“巫师守则”的注释,警告年轻的程序员必须严格遵守 thinking block 的处理规则。

03 搜索革命:为什么它敢弃用 RAG?

这是最让 AI 探索者震惊的一点:Claude Code 压根没用现在主流的向量数据库检索(RAG)。

  • 回归朴素
    :它使用的是最原始的 Grep 文本搜索
  • 设计哲学
    :创始人 Boris Cherny 认为,模型能力越强,就越应该让 AI 自己决定搜什么,而不是人类预先帮它整理好索引。
  • 工程优势
    :Grep 方式没有索引过期问题,极大地降低了系统的工程复杂度。

04 记忆工程:三层“自愈式”管理

为了解决 AI “聊着聊着就断片儿”的顽疾,源码揭示了一套精妙的 Self-Healing Memory 系统。

  • MEMORY.md
    :第一层是严格限制在 200 行/25KB 以内的“目录式”记忆,只存指针,不存内容。
  • 话题文件
    :第二层是针对偏好和架构约定的动态加载文件,每次对话由小模型按需挑选最多 5 个相关文件。
  • 只记逻辑不记代码
    :为了防止缓存不一致,它绝对不记具体的代码片段,代码事实永远去源码里实时读取。

05 极致省钱:提示词缓存的“分裂”技巧

Anthropic 对成本和性能的优化已经到了偏执的地步。

  • 缓存分裂
    :系统提示词被划分为“静态”和“动态”两部分。
  • 全球共享
    :静态部分让全球几百万用户共享同一份缓存,从而极大地节省了 Token 开支。
  • 动态隔离
    :个人配置、时间等动态内容被严格限制在缓存边界之外,防止污染静态缓存。

06 影子 AI:YOLO 模式下的安全防线

你以为开启 dangerously-skip-permissions(YOLO 模式)就真的没管了吗?

  • 后台监视
    :源码中有一个 yoloClassifier.ts 文件,即使在放行模式下,依然有一个影子 AI 在偷偷给你的操作定级。
  • 五级关卡
    :每一次工具调用都要经过包括 Bash 命令检查在内的 5 个关卡,整体防护非常周全。

07 工程师的浪漫:数字宠物与自动做梦

除了冷冰冰的代码,源码里还藏着不少彩蛋:

  • 数字宠物
    :在 buddy 目录下隐藏了一套数字宠物系统,有鸭子、鹅、猫,甚至还有龙。
  • AutoDream
    :一个叫“自动做梦”的功能,计划让 AI 在白天干活,晚上自动整理记忆。
  • 反间计
    :为了防止竞争对手通过 API 蒸馏能力,源码里甚至有注入“假工具定义”来误导对方训练的防御逻辑。

写在最后:阿峰的技术洞察

看完这 51 万行代码,我最大的感触是:Claude Code 强悍的秘密不在于什么惊天动地的算法,而在于对基础知识的极致应用。

并发控制、读写分离、分层缓存、断路器……这些程序员耳熟能详的概念,被 Anthropic 完美地平移到了 AI 场景下。如果你正在开发 AI 应用,这份泄露的源码(虽然对公司是灾难)对你来说绝对是目前市面上最好的实战教材。

你想深入了解哪部分的实现细节?评论区留言,阿峰带你继续拆解。