拆解 Claude Code 源码,15 万字 26 章,讲透 Agent Harness 架构
拆解 Claude Code 源码,15 万字 26 章,讲透 Agent Harness 架构

这是 OpenBook 系列的第一篇。后续会逐章拆解 Agent Loop、工具系统、多智能体编排等核心架构。如果你也关注 Agent Harness 工程,而不只是写 Demo – 关注「大卫AI」,这里只聊生产级的。
Cursor、Claude Code、Devin – 这些 Agent 产品的代码里,模型调用大概占多少?
50%?30%?
不到 1%。
剩下 99% 在做什么?构建围绕模型的运行时框架。它有个专门的名字:Harness。
Karpathy 把 LLM 比作新的操作系统内核。但你不会只用内核写程序。你需要系统调用、内存管理、进程调度、访问控制 – 对 Agent 来说,这些就是工具系统、上下文管理、多 Agent 编排和权限模型。
Anthropic 叫它 orchestration framework,LangChain 叫它 agent runtime,AWS Bedrock 叫它 orchestration layer。叫法不同,本质一样:套在 LLM 外面的缰绳与工具。
模型决定 Agent 的上限,Harness 决定它能不能活到生产环境。
我深入拆解了 Claude Code 源码,结合 Anthropic、OpenAI、AWS 等一线大厂的工程实践,写成了一本书 – OpenBook:构建 AI Agent 的 Harness 工程学。
1. Demo 很好,上线就崩
2025 到 2026 年,AI Agent 经历了从概念到产品的爆发。Sam Altman 说 Agent 将成为 AI 的杀手级应用,Andrew Ng 反复强调 Agentic Workflow 是释放 LLM 真正潜力的关键。
但我见过太多团队在这波浪潮里栽跟头。
模式几乎一样:模型选型花两周,Harness 架构花两天。Demo 阶段一切正常,一上线就出问题。
一个外部 API 挂了,整个 Agent 卡死 – 工具调用没有超时机制。
Agent 产生幻觉,直接删了数据库 – 权限没有分层,它能读写一切。
对话到第三轮开始说车轱辘话 – 记忆系统只有一个列表,上下文一长就丢信息。
多 Agent 任务跑到一半断了,无法恢复 – 没有状态管理,只能从头再来。
这些问题的共同点:换模型解决不了,改 Prompt 也解决不了。只有 Harness 层的工程设计能解决。
2. 全书 26 章,9 个 Part
OpenBook:构建 AI Agent 的 Harness 工程学。15 万字,中英双语,完全免费开源。基于对大规模 TypeScript 代码库的深度架构分析,引用了 Anthropic、OpenAI、AWS、LangChain 等 50 多个权威来源。
不是在教你用框架的 API,而是在回答三个问题:这部分要解决什么问题?设计者是怎么想的?代码是怎么做的?

打基础(Part I – III)
Part I – 什么是 Harness(Chapter 1-2) 建立心智模型。Agent 运行时不是一个 API 调用,是一整套操作系统级的工程体系。
Part II – Agent Loop(Chapter 3-5) 核心循环的完整旅程。从用户输入到工具调用再到最终输出,每一步的设计决策和工程权衡。整本书的骨架。
Part III – 工具系统(Chapter 6-9) 40 个工具的设计与编排。注册、发现、并发执行、失败处理。Agent 与外部世界交互的唯一通道。
解决硬问题(Part IV – VI)
Part IV – 安全与权限(Chapter 10-12) 四级权限、三层防线、Hooks 机制。ML 分类器判断操作安全性,双 Pod 沙箱做最小权限隔离。没有权限控制的 Agent 就是定时炸弹。
Part V – 多智能体(Chapter 13-15) 子 Agent、协调者、Swarm 三种编排模式。fork/隔离/通信怎么不死锁,Mailbox 模式怎么解耦消息传递。
Part VI – Prompt 与记忆(Chapter 16-17) 五层记忆系统:短期、长期、工作、情景、语义。从文件发现到梦境整合,记忆不是把历史消息存起来那么简单。
看远一点(Part VII – IX)
Part VII – 扩展机制(Chapter 18-20) MCP 协议的 5 种传输方式和认证机制。Skills 和 Plugin 架构,让 Agent 能力像乐高一样拼接。
Part VIII – 前沿与哲学(Chapter 21-22) Dream 系统和 10 条设计原则。技术选型背后的思考方式,比具体方案更有长期价值。
Part IX – 从理论到实践(Chapter 23-26) 四支柱框架 CONSTRAIN/INFORM/VERIFY/CORRECT,K8s 最小权限部署,自修复循环。附录 D 有 100 行代码的 Mini Agent Harness 实战教程。

3. 建议的阅读路径
不用从头读到尾。根据你的角色选起点:
Agent 产品开发者 – 从 Part I 和 Part II 开始,理解 Harness 心智模型和 Agent Loop 完整流程,后面按需跳读。
架构师 / 技术负责人 – 直接看 Part IV 和 Part V。安全与权限、多智能体的设计决策,直接决定系统能不能上生产。
独立开发者 – Part VII(MCP 扩展)和 Part IX(从零部署)最实用。搭一个能长期演进的系统,而不是只能跑 Demo 的玩具。
对 Agent 好奇的技术人 – 想超越 Demo 和 Prompt Engineering,看看 Cursor、Claude Code 到底怎么运转的。从 Chapter 1 开始跟着走。
4. 为什么现在
Agent 的时代不是即将到来 – 它已经到来了。
模型会越来越强,但 Harness 的工程复杂度不会因此降低。模型越强,能力边界越大,Harness 要管的事情就越多。
大多数人还在用写脚本的思维做 Agent。
现在开始认真对待 Harness 工程,是最好的时机。
OpenBook:构建 AI Agent 的 Harness 工程学 26 章,15 万字,中英双语,完全免费开源。
GitHub:github.com/dawei008/openbook 在线阅读:dawei008.github.io/openbook

如果觉得有用,欢迎 Star、转发、留言交流。后续会持续分享 Agent 架构、MCP 协议、云上部署等深度内容,关注不迷路。
夜雨聆风