Claude Code 源码深度剖析:Agent 设计美学源自于人类文明答案
Claude Code 的源码意外泄露,本着好奇这个目前最佳的Agent 到底内核细节,我硬着头皮把仓库全扒下来看了一遍。51 万行 TypeScript,1900 个文件。到底有多少是 AI 在”动脑子”,有多少是在”管规矩”?几天后 MBZUAI 挂出了一篇[系统性的拆解论文](https://arxiv.org/abs/2604.14228),我又对照着过了一遍。
源码地址:https://api3.cls.cn/share/article/2332277
统计结果让我愣了半天:真正负责”让 AI 做决策”的逻辑——”我应该先改哪个文件””这个方案通不通”——只占 1.6%。八千行。

剩下 98.4% 是权限门:上下文压缩、恢复逻辑、任务认领、提交队列、并发锁、隔离墙、审查管道、分层约束。
翻译人话:全是制度。
这群工程师写了三年 AI。实际在干的事是——给一个全新的智能体社会写宪法。1095 天。
这让我想到,人类从汉谟拉比把法律刻上玄武岩,到第一部民法典,走了 3780 年。AI 从 Hello World 到独立重建一套社会治理架构,用了 1095 天。同一个终点。

拆开Claude Code 51 万行代码,第一哲学是任务分配
Claude Code 里没有中央调度器。系统只维护一个 Task Graph——任务有依赖关系,前置做完就进 Ready Pool。然后呢?空闲的 Agent 自己去扫那个池子。能做的认领,做不了放弃,换别的来。
去中心化、自主认领、弹性伸缩。我越看越觉得熟悉。后来想起来了——1776 年 Adam Smith。“看不见的手”。市场不需要中央指挥就能高效配置资源。经济学家发现的东西,TypeScript 的 while true 循环用了三年独立推导了一遍。
然后我看到了 Sprint Contract。Agent 开工前必须先签——输入、产出、验收标准、时间约束、范围边界。10 分钟内完成,超时回退。为什么是 10 分钟?我在论文里查到答案:Agent 的推理每多跑一轮,方向偏移就非线性累积。第一轮靠谱,第五轮可能忘了自己要干什么。10 分钟是一道强制校准——偏了就拉回来。
人类从口头承诺走到契约法,花了几千年。AI 因为算力压迫,三年。
然后我在源码里翻到了整件事最好笑的设计:Agent 团队里,Member 之间禁止直接聊天。不是忘了。是故意的。查源码注释——N 节点全连接通信,链路数是指数级增长。更要命的是:一个 Agent 判断错了,全连接拓扑里一轮扩散给所有人,谣言传播效应。所以用了星型拓扑——只跟 Lead 通信,Lead 就是防火墙。
我意识到这就是公司组织架构的底层逻辑。不是老板控制欲。是信息理论。
还有独立审查——Planner 规划、Generator 执行、Evaluator 验证。三套独立的认知预设。为什么 Evaluator 必须独立?因为 LLM 有个硬伤:同一个模型生成内容再评估自己,会偏心地觉得自己很棒。把这句话翻译成人话——“没有反对派的议会一定会犯错”。
我把以上观点梳理在同一张表,和人类文明做映射,答案很清晰

你看到这可能也在怀疑——这不就是工程师无意识把人类社会结构投射到代码里吗?我带着完全一样的怀疑继续往下查。然后发现了一件比六种对应更令人头皮发麻的事。
不是 Claude Code 独有。是跨物种、跨时代、跨学科都在发生。
蚂蚁没有大脑。没有领导。但蚁群靠碰触角传递信息,演化出了劳动分工和路径优化,生物学家叫”液体大脑”。斯坦福的 Deborah Gordon 研究了三十年蚂蚁觅食,发现算法结构和 TCP/IP 拥塞控制——数学上完全相同。蚁群碰撞回避和以太网数据包重传,同一个解。一个在林子里跑了一亿年,一个在实验室跑了三十年。
经济学家科斯 1937 年问了一个看似白痴的问题:市场这么高效,企业为什么还存在?他的答案——交易成本。找供应商、谈合同太贵了,就放公司内部。
我在 Claude Code 里看到了完全一样的逻辑。Agent 通信耗消耗Token。10 个 Agent 全连接,一轮通信烧几万 Token。这个 Token 成本就是 Agent 世界的交易成本,天然决定团队边界。科斯花了半个世纪想通的事,Token 计费系统几个季度就逼出来了。
到这一步,我已经不是在读代码了。我在看同一个规律:人类不是”发明”了制度。是在漫长时间里”发现”了它。
就像没人发明引力,它一直在。Claude Code 那 51 万行泄露的源码,是这个假说的第一份实验证据。这四个底层约束——多个自主个体、共享有限资源、信息不对称、每个人行动影响别人——和你是什么材料做的毫无关系。碳基、硅基、蚂蚁、数据包。协作的最优解只有一个。
不止历史发现,眼下最耀眼三家AI明星公司在验证各自假说
今年初,Anthropic、Cursor、OpenAI 先后发表了对 Agent 工程体系的深度复盘。我看完之后发现它们不是在分享技术经验——它们是在分别验证同一套假说,只是各自撞上了不同的问题。

Anthropic 的问题是”一个 Agent 怎么连续跑三小时不出错“。
方向漂移问题——上下文越满注意力越散。他们翻来覆去试了几轮,最后上了一套三角色制衡:Planner 定方向、Generator 执行、Evaluator 验证。Generator 和 Evaluator 之间没有任何共享状态——这个隔离是纠偏能生效的前提。哲学一句话:不信任任何单一角色,信任来自制衡。
Cursor 的问题更头疼——”几百个 Agent 同时写同一个代码库,怎么不让它们打架“。
读了他们发在论坛上的复盘帖(https://forum.cursor.com/t/long-running-autonomous-harness-architecture/159149),前三次架构全翻。第一次锁竞争直接把系统压瘫。第二次被最慢的 Worker 卡死了所有人。第三次 Agent 开始随机休眠、停止生成任务——对,随机休眠,我没编。第四次终于找到答案:每个 Worker 在完全隔离的仓库副本上干活,彼此不知道对方存在。信息严格向上流动,最后一个人合并审核。
架构哲学在:信任个体执行力,但完全不相信协调能力。
信任来自隔离。这套架构最后让 AI Agent 在一周内完整地从零写了一个网页浏览器(https://simonwillison.net/2026/Jan/19/scaling-long-running-autonomous-coding/)
OpenAI 的提问角度最不一样——”一个人怎么同时管住一百个 Agent”。他们的回答也最省事:别管。3 月份他们把 Symphony 开源(https://github.com/openai/symphony)了,一个 Agent 编排框架,用 Elixir 写的——Agent 自己带着 Proof of Work 回来:测试结果、CI 日志、操作录屏。人只看异常。内部实验数据(https://www.zenml.io/llmops-database/extreme-harness-engineering-building-production-systems-with-zero-human-written-code):三个人,五个月,零行手写代码,1500 个 PR。
产品哲学:不使用信任这个概念。只依赖证据。
把这三篇东西放在一起看,它们比的是同一件事——”谁先设计出最好的 Agent 社会治理制度
最近咖啡厅和办公室里讨论火热的Harness Engineering 统一框架(https://waytoagi.feishu.cn/wiki/D0x2wz52MiSu2fkdrmRcZNginJh)把这三件事拆清楚了一个洞见:制衡、隔离、证据不是互斥的。真正理解这件事的人会在同一套系统里混着来——长任务靠制衡,并行靠隔离,交付靠证据。
制度顶层设计考验已经到来
翻claude code源码的时候我顺手对比了不同版本的代码占比。每发一个新版本,AI 决策逻辑的比例就往下降一点点。非 AI 的那些工程基础设施——权限门、隔离机制、审查管道——在以一种不回头的方式膨胀。
“写出代码”这个能力——过去二十年定义我们这个职业地位和收入的那个东西——正在从核心竞争力变成水和电。和 AI 写邮件一样理所当然。跟质量没关系。是”写出来”的门槛降到零了。
你现在可能想关掉文章回去接着写。别!
这 51 万行代码里真正不可替代的,不是那 1.6%。是那 98.4%——决定”谁能做什么””边界在哪””怎么判断对错””什么规则约束什么行为”的制度设计。
写代码在贬值,设计代码的治理体系在升值,爆炸式上升
工业革命没淘汰最熟练的手工匠。手艺是顶尖的,但工厂不需要了。工业革命创造了一种新稀缺:会设计流水线的人。
AI 是完全一样的东西。流水线叫 Harness。产品是一个能自主决策、自主协作、自主纠错的 Agent 团队。
明天我不是程序员。我是立法者。打开 Cursor 的那一刻我不是在写代码——我在给一群能自主行动的 AI 立行为准则。`.cursorrules` 不是配置。是第一部宪法。
Benny’s 头脑风暴:设计宪法就是设计未来
公元前 1754 年。汉谟拉比让匠人把 282 条法律刻上玄武岩。他做的事只有一个目的:让”什么可以做、什么不可以做”脱离个体记忆,成为一个所有人都能读的、不会随死亡消失的东西。人类用了三千年才掌握那种能力。
公元 2025 年。一个程序员打开终端,建了一个 CLAUDE.md。每次启动 Session,那几行 Markdown 就被重新注入上下文开头。和石碑前诵读楔形文字一个道理——保证这群 Agent 每次醒来,朝同一个方向前进。
三千年前的答案,被 AI 用三年重新推导了一遍。到达终点之后的动作,一模一样。
翻翻你正在写的规则。你给 Claude Code 设的 CLI 权限,`.cursorrules` 里面划的边界,CI 管道里那三道自动验证。你没注意的时候,那双手已经沾上了新的泥土。另一个文明的地基。
本文重要引用
https://github.com/shareAI-lab/learn-claude-code/tree/main/docs/zh
https://yage.ai/share/harness-engineering-scalability-20260330.html
欢迎关注我的公众号
欢迎加入实名制、真诚交流AI社群

夜雨聆风