Claude Code 源码深度剖析:Agent 设计美学源自于人类文明答案-夜雨聆风

Claude Code 源码深度剖析:Agent 设计美学源自于人类文明答案

3000 年人类文明史答案被浓缩到 Anthropic 设计哲学中并沉淀成Claude Code

Claude Code 的源码意外泄露，本着好奇这个目前最佳的Agent 到底内核细节，我硬着头皮把仓库全扒下来看了一遍。51 万行 TypeScript，1900 个文件。到底有多少是 AI 在”动脑子”，有多少是在”管规矩”？几天后 MBZUAI 挂出了一篇[系统性的拆解论文](https://arxiv.org/abs/2604.14228)，我又对照着过了一遍。

源码地址：https://api3.cls.cn/share/article/2332277

统计结果让我愣了半天：真正负责”让 AI 做决策”的逻辑——”我应该先改哪个文件””这个方案通不通”——只占 1.6%。八千行。

剩下 98.4% 是权限门：上下文压缩、恢复逻辑、任务认领、提交队列、并发锁、隔离墙、审查管道、分层约束。

翻译人话：全是制度。

这群工程师写了三年 AI。实际在干的事是——给一个全新的智能体社会写宪法。1095 天。

这让我想到，人类从汉谟拉比把法律刻上玄武岩，到第一部民法典，走了 3780 年。AI 从 Hello World 到独立重建一套社会治理架构，用了 1095 天。同一个终点。

汉谟拉比法典石碑与Claude终端

拆开Claude Code 51 万行代码，第一哲学是任务分配

Claude Code 里没有中央调度器。系统只维护一个 Task Graph——任务有依赖关系，前置做完就进 Ready Pool。然后呢？空闲的 Agent 自己去扫那个池子。能做的认领，做不了放弃，换别的来。

去中心化、自主认领、弹性伸缩。我越看越觉得熟悉。后来想起来了——1776 年 Adam Smith。“看不见的手”。市场不需要中央指挥就能高效配置资源。经济学家发现的东西，TypeScript 的 while true 循环用了三年独立推导了一遍。

然后我看到了 Sprint Contract。Agent 开工前必须先签——输入、产出、验收标准、时间约束、范围边界。10 分钟内完成，超时回退。为什么是 10 分钟？我在论文里查到答案：Agent 的推理每多跑一轮，方向偏移就非线性累积。第一轮靠谱，第五轮可能忘了自己要干什么。10 分钟是一道强制校准——偏了就拉回来。

人类从口头承诺走到契约法，花了几千年。AI 因为算力压迫，三年。

然后我在源码里翻到了整件事最好笑的设计：Agent 团队里，Member 之间禁止直接聊天。不是忘了。是故意的。查源码注释——N 节点全连接通信，链路数是指数级增长。更要命的是：一个 Agent 判断错了，全连接拓扑里一轮扩散给所有人，谣言传播效应。所以用了星型拓扑——只跟 Lead 通信，Lead 就是防火墙。

我意识到这就是公司组织架构的底层逻辑。不是老板控制欲。是信息理论。

还有独立审查——Planner 规划、Generator 执行、Evaluator 验证。三套独立的认知预设。为什么 Evaluator 必须独立？因为 LLM 有个硬伤：同一个模型生成内容再评估自己，会偏心地觉得自己很棒。把这句话翻译成人话——“没有反对派的议会一定会犯错”。

我把以上观点梳理在同一张表，和人类文明做映射，答案很清晰

Agent行为与人类文明关系

你看到这可能也在怀疑——这不就是工程师无意识把人类社会结构投射到代码里吗？我带着完全一样的怀疑继续往下查。然后发现了一件比六种对应更令人头皮发麻的事。

不是 Claude Code 独有。是跨物种、跨时代、跨学科都在发生。

蚂蚁没有大脑。没有领导。但蚁群靠碰触角传递信息，演化出了劳动分工和路径优化，生物学家叫”液体大脑”。斯坦福的 Deborah Gordon 研究了三十年蚂蚁觅食，发现算法结构和 TCP/IP 拥塞控制——数学上完全相同。蚁群碰撞回避和以太网数据包重传，同一个解。一个在林子里跑了一亿年，一个在实验室跑了三十年。

经济学家科斯 1937 年问了一个看似白痴的问题：市场这么高效，企业为什么还存在？他的答案——交易成本。找供应商、谈合同太贵了，就放公司内部。

我在 Claude Code 里看到了完全一样的逻辑。Agent 通信耗消耗Token。10 个 Agent 全连接，一轮通信烧几万 Token。这个 Token 成本就是 Agent 世界的交易成本，天然决定团队边界。科斯花了半个世纪想通的事，Token 计费系统几个季度就逼出来了。

到这一步，我已经不是在读代码了。我在看同一个规律：人类不是”发明”了制度。是在漫长时间里”发现”了它。

就像没人发明引力，它一直在。Claude Code 那 51 万行泄露的源码，是这个假说的第一份实验证据。这四个底层约束——多个自主个体、共享有限资源、信息不对称、每个人行动影响别人——和你是什么材料做的毫无关系。碳基、硅基、蚂蚁、数据包。协作的最优解只有一个。

不止历史发现，眼下最耀眼三家AI明星公司在验证各自假说

今年初，Anthropic、Cursor、OpenAI 先后发表了对 Agent 工程体系的深度复盘。我看完之后发现它们不是在分享技术经验——它们是在分别验证同一套假说，只是各自撞上了不同的问题。

Anthropic 的问题是”一个 Agent 怎么连续跑三小时不出错“。

方向漂移问题——上下文越满注意力越散。他们翻来覆去试了几轮，最后上了一套三角色制衡：Planner 定方向、Generator 执行、Evaluator 验证。Generator 和 Evaluator 之间没有任何共享状态——这个隔离是纠偏能生效的前提。哲学一句话：不信任任何单一角色，信任来自制衡。

Cursor 的问题更头疼——”几百个 Agent 同时写同一个代码库，怎么不让它们打架“。

读了他们发在论坛上的复盘帖(https://forum.cursor.com/t/long-running-autonomous-harness-architecture/159149)，前三次架构全翻。第一次锁竞争直接把系统压瘫。第二次被最慢的 Worker 卡死了所有人。第三次 Agent 开始随机休眠、停止生成任务——对，随机休眠，我没编。第四次终于找到答案：每个 Worker 在完全隔离的仓库副本上干活，彼此不知道对方存在。信息严格向上流动，最后一个人合并审核。

架构哲学在：信任个体执行力，但完全不相信协调能力。

信任来自隔离。这套架构最后让 AI Agent 在一周内完整地从零写了一个网页浏览器(https://simonwillison.net/2026/Jan/19/scaling-long-running-autonomous-coding/)

OpenAI 的提问角度最不一样——”一个人怎么同时管住一百个 Agent”。他们的回答也最省事：别管。3 月份他们把 Symphony 开源(https://github.com/openai/symphony)了，一个 Agent 编排框架，用 Elixir 写的——Agent 自己带着 Proof of Work 回来：测试结果、CI 日志、操作录屏。人只看异常。内部实验数据(https://www.zenml.io/llmops-database/extreme-harness-engineering-building-production-systems-with-zero-human-written-code)：三个人，五个月，零行手写代码，1500 个 PR。

产品哲学：不使用信任这个概念。只依赖证据。

把这三篇东西放在一起看，它们比的是同一件事——”谁先设计出最好的 Agent 社会治理制度

最近咖啡厅和办公室里讨论火热的Harness Engineering 统一框架(https://waytoagi.feishu.cn/wiki/D0x2wz52MiSu2fkdrmRcZNginJh)把这三件事拆清楚了一个洞见：制衡、隔离、证据不是互斥的。真正理解这件事的人会在同一套系统里混着来——长任务靠制衡，并行靠隔离，交付靠证据。

制度顶层设计考验已经到来

翻claude code源码的时候我顺手对比了不同版本的代码占比。每发一个新版本，AI 决策逻辑的比例就往下降一点点。非 AI 的那些工程基础设施——权限门、隔离机制、审查管道——在以一种不回头的方式膨胀。

“写出代码”这个能力——过去二十年定义我们这个职业地位和收入的那个东西——正在从核心竞争力变成水和电。和 AI 写邮件一样理所当然。跟质量没关系。是”写出来”的门槛降到零了。

你现在可能想关掉文章回去接着写。别！

这 51 万行代码里真正不可替代的，不是那 1.6%。是那 98.4%——决定”谁能做什么””边界在哪””怎么判断对错””什么规则约束什么行为”的制度设计。

写代码在贬值，设计代码的治理体系在升值，爆炸式上升

工业革命没淘汰最熟练的手工匠。手艺是顶尖的，但工厂不需要了。工业革命创造了一种新稀缺：会设计流水线的人。

AI 是完全一样的东西。流水线叫 Harness。产品是一个能自主决策、自主协作、自主纠错的 Agent 团队。

明天我不是程序员。我是立法者。打开 Cursor 的那一刻我不是在写代码——我在给一群能自主行动的 AI 立行为准则。`.cursorrules` 不是配置。是第一部宪法。

Benny’s 头脑风暴：设计宪法就是设计未来

公元前 1754 年。汉谟拉比让匠人把 282 条法律刻上玄武岩。他做的事只有一个目的：让”什么可以做、什么不可以做”脱离个体记忆，成为一个所有人都能读的、不会随死亡消失的东西。人类用了三千年才掌握那种能力。

公元 2025 年。一个程序员打开终端，建了一个 CLAUDE.md。每次启动 Session，那几行 Markdown 就被重新注入上下文开头。和石碑前诵读楔形文字一个道理——保证这群 Agent 每次醒来，朝同一个方向前进。

三千年前的答案，被 AI 用三年重新推导了一遍。到达终点之后的动作，一模一样。

翻翻你正在写的规则。你给 Claude Code 设的 CLI 权限，`.cursorrules` 里面划的边界，CI 管道里那三道自动验证。你没注意的时候，那双手已经沾上了新的泥土。另一个文明的地基。

本文重要引用

https://github.com/shareAI-lab/learn-claude-code/tree/main/docs/zh

https://yage.ai/share/harness-engineering-scalability-20260330.html

欢迎关注我的公众号

欢迎加入实名制、真诚交流AI社群