乐于分享
好东西不私藏

拆解 Claude Code 源码,15 万字 26 章,讲透 Agent Harness 架构

拆解 Claude Code 源码,15 万字 26 章,讲透 Agent Harness 架构

拆解 Claude Code 源码,15 万字 26 章,讲透 Agent Harness 架构

封面

这是 OpenBook 系列的第一篇。后续会逐章拆解 Agent Loop、工具系统、多智能体编排等核心架构。如果你也关注 Agent Harness 工程,而不只是写 Demo – 关注「大卫AI」,这里只聊生产级的。

Cursor、Claude Code、Devin – 这些 Agent 产品的代码里,模型调用大概占多少?

50%?30%?

不到 1%。

剩下 99% 在做什么?构建围绕模型的运行时框架。它有个专门的名字:Harness

Karpathy 把 LLM 比作新的操作系统内核。但你不会只用内核写程序。你需要系统调用、内存管理、进程调度、访问控制 – 对 Agent 来说,这些就是工具系统、上下文管理、多 Agent 编排和权限模型。

Anthropic 叫它 orchestration framework,LangChain 叫它 agent runtime,AWS Bedrock 叫它 orchestration layer。叫法不同,本质一样:套在 LLM 外面的缰绳与工具。

模型决定 Agent 的上限,Harness 决定它能不能活到生产环境。

我深入拆解了 Claude Code 源码,结合 Anthropic、OpenAI、AWS 等一线大厂的工程实践,写成了一本书 – OpenBook:构建 AI Agent 的 Harness 工程学

1. Demo 很好,上线就崩

2025 到 2026 年,AI Agent 经历了从概念到产品的爆发。Sam Altman 说 Agent 将成为 AI 的杀手级应用,Andrew Ng 反复强调 Agentic Workflow 是释放 LLM 真正潜力的关键。

但我见过太多团队在这波浪潮里栽跟头。

模式几乎一样:模型选型花两周,Harness 架构花两天。Demo 阶段一切正常,一上线就出问题。

一个外部 API 挂了,整个 Agent 卡死 – 工具调用没有超时机制。

Agent 产生幻觉,直接删了数据库 – 权限没有分层,它能读写一切。

对话到第三轮开始说车轱辘话 – 记忆系统只有一个列表,上下文一长就丢信息。

多 Agent 任务跑到一半断了,无法恢复 – 没有状态管理,只能从头再来。

这些问题的共同点:换模型解决不了,改 Prompt 也解决不了。只有 Harness 层的工程设计能解决。

2. 全书 26 章,9 个 Part

OpenBook:构建 AI Agent 的 Harness 工程学。15 万字,中英双语,完全免费开源。基于对大规模 TypeScript 代码库的深度架构分析,引用了 Anthropic、OpenAI、AWS、LangChain 等 50 多个权威来源。

不是在教你用框架的 API,而是在回答三个问题:这部分要解决什么问题?设计者是怎么想的?代码是怎么做的?

目录

打基础(Part I – III)

Part I – 什么是 Harness(Chapter 1-2) 建立心智模型。Agent 运行时不是一个 API 调用,是一整套操作系统级的工程体系。

Part II – Agent Loop(Chapter 3-5) 核心循环的完整旅程。从用户输入到工具调用再到最终输出,每一步的设计决策和工程权衡。整本书的骨架。

Part III – 工具系统(Chapter 6-9) 40 个工具的设计与编排。注册、发现、并发执行、失败处理。Agent 与外部世界交互的唯一通道。

解决硬问题(Part IV – VI)

Part IV – 安全与权限(Chapter 10-12) 四级权限、三层防线、Hooks 机制。ML 分类器判断操作安全性,双 Pod 沙箱做最小权限隔离。没有权限控制的 Agent 就是定时炸弹。

Part V – 多智能体(Chapter 13-15) 子 Agent、协调者、Swarm 三种编排模式。fork/隔离/通信怎么不死锁,Mailbox 模式怎么解耦消息传递。

Part VI – Prompt 与记忆(Chapter 16-17) 五层记忆系统:短期、长期、工作、情景、语义。从文件发现到梦境整合,记忆不是把历史消息存起来那么简单。

看远一点(Part VII – IX)

Part VII – 扩展机制(Chapter 18-20) MCP 协议的 5 种传输方式和认证机制。Skills 和 Plugin 架构,让 Agent 能力像乐高一样拼接。

Part VIII – 前沿与哲学(Chapter 21-22) Dream 系统和 10 条设计原则。技术选型背后的思考方式,比具体方案更有长期价值。

Part IX – 从理论到实践(Chapter 23-26) 四支柱框架 CONSTRAIN/INFORM/VERIFY/CORRECT,K8s 最小权限部署,自修复循环。附录 D 有 100 行代码的 Mini Agent Harness 实战教程。

核心架构

3. 建议的阅读路径

不用从头读到尾。根据你的角色选起点:

Agent 产品开发者 – 从 Part I 和 Part II 开始,理解 Harness 心智模型和 Agent Loop 完整流程,后面按需跳读。

架构师 / 技术负责人 – 直接看 Part IV 和 Part V。安全与权限、多智能体的设计决策,直接决定系统能不能上生产。

独立开发者 – Part VII(MCP 扩展)和 Part IX(从零部署)最实用。搭一个能长期演进的系统,而不是只能跑 Demo 的玩具。

对 Agent 好奇的技术人 – 想超越 Demo 和 Prompt Engineering,看看 Cursor、Claude Code 到底怎么运转的。从 Chapter 1 开始跟着走。

4. 为什么现在

Agent 的时代不是即将到来 – 它已经到来了。

模型会越来越强,但 Harness 的工程复杂度不会因此降低。模型越强,能力边界越大,Harness 要管的事情就越多。

大多数人还在用写脚本的思维做 Agent。

现在开始认真对待 Harness 工程,是最好的时机。

OpenBook:构建 AI Agent 的 Harness 工程学 26 章,15 万字,中英双语,完全免费开源。

GitHub:github.com/dawei008/openbook 在线阅读:dawei008.github.io/openbook

开源

如果觉得有用,欢迎 Star、转发、留言交流。后续会持续分享 Agent 架构、MCP 协议、云上部署等深度内容,关注不迷路。