Claude Code 51万行源码泄露:AI 产品经理必须读懂的6个设计范式
社交媒体上的分析大多聚焦猎奇——”卧底模式””反蒸馏假工具””会做梦的 AI”。但这些花边之下,藏着更值得产品经理关注的东西:一个估值 3800 亿美元公司,如何从系统架构层面定义 AI Agent 产品的设计范式。
一、Harness Engineering:被忽视的 AI 产品核心学科
Claude Code 的 Harness 七层架构:从感知到度量的完整驾驭系统

这次泄露最深层的启示,不是某个具体功能,而是揭示了一个正在成形的工程学科——Harness Engineering(驾驭工程)。
模型是马,Harness 是缰绳、马鞍和马车的总和。 原始大语言模型像一匹野马,能力强但不可控。Harness 就是围绕它构建的整套驾驭系统——让它按方向跑、在该停的地方停。
Claude Code 的 51 万行代码就是一个教科书级的 Harness:
|
|
|
|
|---|---|---|
| 感知层 |
|
|
| 记忆层 |
|
|
| 决策层 |
|
|
| 执行层 |
|
|
| 协作层 |
|
|
| 防御层 |
|
|
| 度量层 |
|
|
⚡ 核心发现
直接调用模型 API 的代码只占约 5%。剩下 95%,全是 Harness。
这意味着:行业过去三年把太多注意力放在模型能力上——跑分多高、context window 多长。但 Claude Code 的源码告诉我们:决定用户体验的不是模型,而是围绕模型构建的 Harness。
就像汽车——引擎重要,但决定驾驶体验的是底盘、悬挂、变速箱的整体调校。消费者买的不是引擎,是整辆车。
产品经理行动项:1. 审计 Harness 厚度。 你的 AI 产品中,模型调用之外的部分占比多少?如果 80% 的逻辑都是”发给模型、返回结果”,你卖的是裸奔的引擎。2. Harness 是真正护城河。 模型会被追平,但好的 Harness 需要大量产品经验积累,竞争对手无法通过换模型抹平差距。
二、情绪感知:产品留存的隐藏基建
用户挫败时,AI 的回复策略决定了留存还是流失

泄露代码中有一个”脏话正则”:系统监测用户输入中的情绪词汇,判定用户进入”挫败状态”,动态调整回复策略。
这不是笑话,而是一个严肃的产品决策——用户的情绪状态是影响体验的一等变量。
产品经理行动项: 用户的情绪信号(措辞变化、连续重试、快速删除输入)应该是和点击行为同等重要的数据。在交互过程中实时响应,不要等到流失后才分析。
三、三层记忆:AI 产品的”人格”来自记忆设计
记忆深度决定产品定位:工具、同事、还是私人助手?

代码揭示了一套三层记忆系统:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
MEMORY.md 将记忆分为四类——user(身份)、feedback(偏好)、project(上下文)、reference(外部资源),每种有明确的存储和使用规则。KAIROS 系统更进一步:夜间执行”做梦”流程(Orient → Gather → Consolidate → Prune),自动整理压缩记忆。
💡 产品定位公式
你选择建多深的记忆系统,就决定了用户与产品建立多深的关系。这不是技术选择,是产品定位选择。
产品经理行动项: 问自己三个问题:1. 用户第 10 次使用时,产品比第 1 次多了解了什么?2. 这些了解是显式获取还是隐式推断?3. 用户能否查看和删除这些记忆?
四、权限即产品:YOLO 分类器的启示
信任不是开关,而是可调旋钮

自动权限系统叫 classifyYoloAction()——把操作分为 LOW / MEDIUM / HIGH 三个风险等级。更有趣的是:它用 Claude 自己来判断某个操作是否安全。
这暴露了 AI Agent 产品的核心矛盾:
自主性越高→用户越省事→但越不放心。确认越多→用户越放心→但越烦。
Claude Code 的解法:– 读文件 → 自动放行(LOW)– 写文件 → 可审查(MEDIUM)– 执行命令 → 必须确认(HIGH)– YOLO 模式 → 全部自动
把”信任”变成可调旋钮,而不是开关。 传统软件权限是二元的,AI Agent 权限必须是光谱式的。用户应能在不同操作类型上设置不同的自主程度。
产品经理行动项: 核心原则——可逆操作默认自主,不可逆操作默认确认。 权限体验直接决定用户觉得产品”好用”还是”烦人”。
五、多 Agent 协作:从”一个 AI”到”AI 团队”
Claude Code 的多 Agent 协作拓扑:Coordinator 调度、Worker 执行、ULTRAPLAN 云端规划

泄露代码中最被低估的发现:
这不是一个 AI 助手在工作,是一个 AI 团队 在工作。
单 Agent 天花板很快会到。 一个 AI 又要理解需求、又要写代码、又要测试、又要审查,必然在某些环节妥协。分工——把不同职责给不同 Agent,每个有自己的上下文和专长——才能突破上限。
产品经理行动项: 如果用户的请求经常需要 AI 做多个截然不同的事,且这些事对上下文窗口的需求互相冲突,你可能需要从单 Agent 升级到多 Agent。这不只是技术重构,是产品形态升级。
六、防御性设计:反蒸馏背后的竞争哲学
Anthropic 的竞争防线:不怕你知道用什么模型,怕你复制整套 Harness

antiDistillation.ts 会在 API 调用中注入假工具定义,”污染”竞争对手通过嗅探获取的训练数据。undercover.ts 在员工使用 Claude Code 贡献公开仓库时,自动抹除 AI 参与痕迹。
争议之外,这揭示了一个趋势:AI 产品的壁垒正在从”模型能力”转向”Harness Engineering”。
回到第一节的框架——他们不怕你知道用了什么模型,怕的是你复制了整套 Harness。
产品经理行动项: 如果明天竞争对手用了同样的基础模型,你的产品还有什么独特价值?你是把精力花在追逐最新模型,还是花在构建模型之上的 Harness?
后记
Anthropic——以 AI 安全为核心品牌的公司——第二次犯同一个基础错误:.npmignore 没排除 source map。再精妙的产品设计,也扛不住发布流程的疏忽。
但这次泄露也许是件好事。它让行业看到了一个关键比例:模型调用 5%,Harness 95%。 当你还在纠结选 GPT 还是 Claude 时,Anthropic 已经把 95% 的精力花在了模型之外。
⚡ 带走这一课
模型是引擎,Harness 是整辆车。用户买的不是引擎,是车。
*本文作者在写作过程中使用了 Claude Code(对,就是那个被泄露了源码的产品)进行辅助研究和内容组织)*
夜雨聆风