拆解 Claude Code 源码,15 万字 26 章,讲透 Agent Harness 架构

拆解 Claude Code 源码，15 万字 26 章，讲透 Agent Harness 架构

这是 OpenBook 系列的第一篇。后续会逐章拆解 Agent Loop、工具系统、多智能体编排等核心架构。如果你也关注 Agent Harness 工程，而不只是写 Demo – 关注「大卫AI」，这里只聊生产级的。

Cursor、Claude Code、Devin – 这些 Agent 产品的代码里，模型调用大概占多少？

50%？30%？

不到 1%。

剩下 99% 在做什么？构建围绕模型的运行时框架。它有个专门的名字：Harness。

Karpathy 把 LLM 比作新的操作系统内核。但你不会只用内核写程序。你需要系统调用、内存管理、进程调度、访问控制 – 对 Agent 来说，这些就是工具系统、上下文管理、多 Agent 编排和权限模型。

Anthropic 叫它 orchestration framework，LangChain 叫它 agent runtime，AWS Bedrock 叫它 orchestration layer。叫法不同，本质一样：套在 LLM 外面的缰绳与工具。

模型决定 Agent 的上限，Harness 决定它能不能活到生产环境。

我深入拆解了 Claude Code 源码，结合 Anthropic、OpenAI、AWS 等一线大厂的工程实践，写成了一本书 – OpenBook：构建 AI Agent 的 Harness 工程学。

1. Demo 很好，上线就崩

2025 到 2026 年，AI Agent 经历了从概念到产品的爆发。Sam Altman 说 Agent 将成为 AI 的杀手级应用，Andrew Ng 反复强调 Agentic Workflow 是释放 LLM 真正潜力的关键。

但我见过太多团队在这波浪潮里栽跟头。

模式几乎一样：模型选型花两周，Harness 架构花两天。Demo 阶段一切正常，一上线就出问题。

一个外部 API 挂了，整个 Agent 卡死 – 工具调用没有超时机制。

Agent 产生幻觉，直接删了数据库 – 权限没有分层，它能读写一切。

对话到第三轮开始说车轱辘话 – 记忆系统只有一个列表，上下文一长就丢信息。

多 Agent 任务跑到一半断了，无法恢复 – 没有状态管理，只能从头再来。

这些问题的共同点：换模型解决不了，改 Prompt 也解决不了。只有 Harness 层的工程设计能解决。

OpenBook：构建 AI Agent 的 Harness 工程学。15 万字，中英双语，完全免费开源。基于对大规模 TypeScript 代码库的深度架构分析，引用了 Anthropic、OpenAI、AWS、LangChain 等 50 多个权威来源。

不是在教你用框架的 API，而是在回答三个问题：这部分要解决什么问题？设计者是怎么想的？代码是怎么做的？

打基础（Part I – III）

Part I – 什么是 Harness（Chapter 1-2） 建立心智模型。Agent 运行时不是一个 API 调用，是一整套操作系统级的工程体系。

Part II – Agent Loop（Chapter 3-5） 核心循环的完整旅程。从用户输入到工具调用再到最终输出，每一步的设计决策和工程权衡。整本书的骨架。

Part III – 工具系统（Chapter 6-9） 40 个工具的设计与编排。注册、发现、并发执行、失败处理。Agent 与外部世界交互的唯一通道。

解决硬问题（Part IV – VI）

Part IV – 安全与权限（Chapter 10-12） 四级权限、三层防线、Hooks 机制。ML 分类器判断操作安全性，双 Pod 沙箱做最小权限隔离。没有权限控制的 Agent 就是定时炸弹。

Part V – 多智能体（Chapter 13-15） 子 Agent、协调者、Swarm 三种编排模式。fork/隔离/通信怎么不死锁，Mailbox 模式怎么解耦消息传递。

Part VI – Prompt 与记忆（Chapter 16-17） 五层记忆系统：短期、长期、工作、情景、语义。从文件发现到梦境整合，记忆不是把历史消息存起来那么简单。

看远一点（Part VII – IX）

Part VII – 扩展机制（Chapter 18-20） MCP 协议的 5 种传输方式和认证机制。Skills 和 Plugin 架构，让 Agent 能力像乐高一样拼接。

Part VIII – 前沿与哲学（Chapter 21-22） Dream 系统和 10 条设计原则。技术选型背后的思考方式，比具体方案更有长期价值。

Part IX – 从理论到实践（Chapter 23-26） 四支柱框架 CONSTRAIN/INFORM/VERIFY/CORRECT，K8s 最小权限部署，自修复循环。附录 D 有 100 行代码的 Mini Agent Harness 实战教程。

不用从头读到尾。根据你的角色选起点：

Agent 产品开发者 – 从 Part I 和 Part II 开始，理解 Harness 心智模型和 Agent Loop 完整流程，后面按需跳读。

架构师 / 技术负责人 – 直接看 Part IV 和 Part V。安全与权限、多智能体的设计决策，直接决定系统能不能上生产。

独立开发者 – Part VII（MCP 扩展）和 Part IX（从零部署）最实用。搭一个能长期演进的系统，而不是只能跑 Demo 的玩具。

对 Agent 好奇的技术人 – 想超越 Demo 和 Prompt Engineering，看看 Cursor、Claude Code 到底怎么运转的。从 Chapter 1 开始跟着走。

Agent 的时代不是即将到来 – 它已经到来了。

模型会越来越强，但 Harness 的工程复杂度不会因此降低。模型越强，能力边界越大，Harness 要管的事情就越多。

大多数人还在用写脚本的思维做 Agent。

现在开始认真对待 Harness 工程，是最好的时机。

OpenBook：构建 AI Agent 的 Harness 工程学 26 章，15 万字，中英双语，完全免费开源。

GitHub：github.com/dawei008/openbook 在线阅读：dawei008.github.io/openbook

如果觉得有用，欢迎 Star、转发、留言交流。后续会持续分享 Agent 架构、MCP 协议、云上部署等深度内容，关注不迷路。