乐于分享
好东西不私藏

Claude Code 源码意外泄露,Anthropic 秘密项目 KAIROS 浮出水面

Claude Code 源码意外泄露,Anthropic 秘密项目 KAIROS 浮出水面

3月31日,距愚人节整整一天,Anthropic 往 npm 上发布了 Claude Code 2.1.88 版本。有人发现安装包里附带了一个 57MB 的 source map 文件,里面原原本本存着 4756 个 TypeScript 源文件的完整代码——超过 51 万行。三行 Node.js 命令就能把所有源码还原出来。安全研究员 Chaofan Shou 公开了还原后的文件链接,截至发稿浏览量超过 3000 万次。 Anthropic 在当天通过科技媒体 Decrypt 发表声明,称这是”人为错误导致的发布打包问题”,不涉及任何用户数据或凭证泄露。Claude Code 之父 Boris Cherny 在 X 上确认:”就是开发者的失误。”

但为时已晚——6 小时内代码在 GitHub 上被 fork 超过 4 万次,也被上传到了去中心化存储平台。Anthropic 尝试通过 DMCA 要求 GitHub 下架,但代码已经扩散到无法收回。 真正让这件事从”翻车事故”变成”行业地震”的,是开发者在源码深处挖出了一个代号为 KAIROS 的内部项目。X 用户 Ole Lehmann 最先发现并撰写了详细分析,Andrej Karpathy 随即转发并评论,称这印证了他 2 月份的预言——Claw(自主代理)是 AI 的下一个进化方向。 KAIROS 的定位是一个 24 小时后台运行的自主 AI 代理。它采用与 OpenClaw 类似的”心跳”机制:每隔几秒接收一次 prompt 触发,自行判断是否需要行动。它可以主动推送通知到用户手机或电脑、直接投递生成的文件、订阅 GitHub PR 变动并自动响应。换句话说,用户不需要开口,KAIROS 就能修 bug、回消息、更新文件。 个性化方面,KAIROS 每天会生成一份详细日报,记录它看到了什么、如何判断、做了什么,形成跨会话的持续记忆。为解决上下文无限膨胀的问题,源码中有一个叫 autoDream 的流程——在夜间将白天积累的记忆进行整合压缩,生成结构化的 MEMORY.md 文件,控制在约 12000 tokens 以内。 除了 KAIROS,源码还暴露了大量工程细节:两套反蒸馏机制(通过注入虚假工具调用污染训练数据、将工具调用简化为模糊摘要)、一个”卧底模式”(Anthropic 员工在公共仓库贡献代码时自动隐藏身份)、一只由用户 ID 哈希生成的电子宠物 Buddy、187 个随机加载动词,以及一条让人哭笑不得的工程注释——有 1279 个会话曾在单次会话中连续失败超过 50 次,每天全球浪费约 25 万次 API 调用。 一位韩国开发者 Sigrid Jin 在凌晨 4 点看到消息后,用 AI 辅助改写了一版去除法律风险的开源版本 OpenClaude,24 小时内在 GitHub 拿到了 45000+ star,刷新了 GitHub 历史上星数增长最快的记录。