引子:一杯咖啡的时间,一个文明的诞生
上周三下午,一个工程师打开 Cursor,输入了一条需求:"重构用户权限模块,支持 RBAC 模型。"然后他去倒了杯咖啡。
当他端着杯子回到屏幕前,他看到了这样一幕:7 个 Background Agent 同时启动,每个都克隆了一份代码仓库的完整副本。Agent-1 在重写数据模型,Agent-3 在写单元测试,Agent-5 在改 API 层。Agent-4 做到一半发现路径行不通,默默放弃了——Agent-6 扫描到它空出来的任务,主动接手继续。
23 分钟后,一个 Planner Agent 审查了所有成果,比较了 Agent-1 和 Agent-7 两个版本的方案,选了 Agent-7 的,合并提交。CI 通过。PR 创建完毕。
工程师放下咖啡杯,忽然愣住了。他刚才目睹的一切——需求下发、任务拆分、抢活、独立开发、做不了就换人、多方案竞争、最终评审合并——这不就是他们团队每周都在做的事吗?流程一模一样。但没有人教过 Agent 这样做。
带着这个疑问,我做了两件事:一是研究了 Claude Code 的源码架构——2026 年 3 月因 npm 配置事故意外泄露的 50 余万行 TypeScript 代码、1900 个源文件(learn-claude-code),二是研读了一篇对 Anthropic、Cursor、OpenAI 三大巨头 AI 编程实践的统一框架分析。
我发现的东西,比预期的要深刻得多。不仅仅是"Agent 系统长得像人类社会"这种表面的类比——在工程设计的深层,AI Agent 系统正在独立重新推导出一套和人类文明惊人同构的治理架构。
这件事的深刻之处在于:如果两个完全独立的系统——一个由碳基生命组成,一个由硅基程序组成——面对协作问题时会收敛到同一组解,那说明这些解不是人类的"发明",而是宇宙中多智能体协作的"自然法则"。
接下来的文章分四幕:
第一幕,我会拆解 Claude Code 源码中的六个关键设计,展示它们和人类社会制度的惊人对应
第二幕,解释为什么这种对应不是巧合——四个底层约束决定了所有协作系统必然殊途同归
第三幕,分析三大巨头(Anthropic/Cursor/OpenAI)的不同方案,揭示它们实质上是三种"建国方略"
第四幕,给出可落地的实践指南——如何用"治理思维"替代"配置思维"来驾驭 Agent
让我从 Claude Code 的六个源码设计开始讲起。
第一幕:六种古老智慧的"重新发现"
如果你把 Claude Code 的源码和一本政治学教材放在一起,你会发现它们在讨论同一件事——只是一个用 TypeScript,一个用拉丁文。
Claude Code 不是一个"编程助手"。它的架构更接近一个微型操作系统——Agent Loop 是内核,围绕它构建了权限、记忆、隔离、协作等子系统。

围绕这个内核,有六个关键设计。有趣的是,每一个都像是在重新发现人类文明用了几千年才提炼出的某种古老智慧。
从"计划经济"到"自由市场"——Agent 的去中心化觉醒
在 Claude Code 的 Autonomous Agents 模块中,任务分配不是由中央调度器完成的。系统维护一个 Task Graph(任务有向无环图),通过 Ready Rule 过滤出所有前置依赖已完成的任务,放入 Ready Pool。然后——空闲的 Agent 自己去扫描 Ready Pool,评估自己能不能做,主动认领。做不了就放弃,让别的 Agent 来。

设计思想:去中心化优于中央调度。
核心洞察在于一个系统设计的基本选择:中央调度看起来更"可控",但调度器本身成为瓶颈和单点故障。去中心化认领把决策权下放到每个 Agent 自身,带来弹性(一个挂了不影响其他人)和可伸缩(加 Agent 不需要改调度逻辑)。
这和人类从计划经济转向市场经济的历程惊人相似——中央计划在小规模时有效,规模一大就僵化。微服务中的服务发现、Kafka 消费者组、K8s Pod 调度,本质上都是同一套哲学。
对工程师的启示:设计多 Agent 系统时,先问自己——"这个分配,真的需要一个中央调度器吗?" 如果 Agent 具备自我评估能力,让它们自己选择可能比你帮它们选更好。
💡 一个有趣的历史回响:Adam Smith 在 1776 年提出"看不见的手"——市场不需要中央指挥就能高效配置资源。250 年后,Claude Code 的 Autonomous Claim 机制独立印证了同一个原理。经济学的最深洞察,成了 Agent 系统的最佳实践。
从"口头承诺"到"白纸黑字"——为什么 Agent 需要合同
在 Anthropic 的架构中,Agent 执行复杂任务前需要建立 Sprint Contract——明确输入、输出、验收标准、时间约束和范围边界:
| 输入 | ||
| 输出 | ||
| 验收标准 | ||
| 时间约束 | ||
| 范围边界 |
设计思想:约束不是枷锁,是方向盘。
10 分钟 Sprint 不是拍脑袋定的——它背后是控制论的基本原理:反馈环路越短,系统越稳定。

Agent 推理偏移随时间非线性增长。Sprint 周期就是强制校准点——偏了及时纠正。这和 TDD、敏捷迭代、PID 控制器是同一个原理:不要试图一步做对,而是快速试错、快速校正。
更深一层——Anthropic 引入了"假设驱动的组件生命周期":先假设架构 → 基于假设执行 → 验证假设是否成立 → 不成立就修正。这是科学方法论的工程化:面对复杂问题,你不可能一开始就知道所有答案,但可以设计一个过程,让答案在执行中逐步浮现。
人类文明也是这么走过来的——从口头承诺到契约法,从随意行事到规则约束,经历了上千年的演化。而 Agent 系统用几年就走完了这条路。
💡 一个值得深思的观察:Anthropic 的"假设驱动"本质上是在承认一件事——对于足够复杂的问题,"先想清楚再动手"是不可能的。这颠覆了传统软件工程"先设计再编码"的信条。在 Agent 时代,更好的策略是"先做一个能被证伪的假设,然后让现实来检验它"。这不是偷懒,这是面对复杂性时唯一诚实的态度
"好篱笆造就好邻居"——隔离的双重智慧
Claude Code 实现了物理层和认知层的双重隔离:
设计思想:注意力是最稀缺的资源,必须像预算一样管理。
LLM 研究中著名的 "Lost in the Middle" 现象告诉我们:上下文越长,模型对中间信息的关注度越低。给 Agent 更多信息 ≠ 更好的决策——信息过载对 AI 和对人一样致命。
Subagent 隔离的核心不是"限制",而是聚焦。Claude Code 的 Context Compact 机制也体现了同样的"少即是多"哲学——当上下文过大时,主动压缩,由 LLM 自己判断保留什么、丢弃什么。不是简单截断,而是智能遗忘。
正如那句西方谚语:"Good fences make good neighbors."(好篱笆造就好邻居。)产权制度不是人类社会的偶然发明,而是任何需要协作的多智能体系统的必然选择。
💡 一个反直觉的推论:很多人直觉上认为"AI 越强大,需要的隔离越少——因为它应该能处理更多信息"。事实恰好相反:模型能力越强,每次调用成本越高,注意力预算越宝贵,隔离的投资回报率反而越大。越强大的 Agent,越需要精心设计的边界。
从《汉谟拉比法典》到 CLAUDE.md——规则的千年回响
Claude Code 的 Memory System 实现了一套 CLAUDE.md 层级体系:

Agent 认知资源有限。没有规则,每次遇到"要不要加校验?"都要从头推理。规则把决策成本从 O(推理) 降到 O(查表)——和人类过马路不需要每次都计算车流安全距离,只需要看红绿灯一个道理。
CLAUDE.md 层级体系本质上是 Agent 的认知缓存层——全局规则是 L1 缓存,项目规则是 L2,目录规则是 L3。层级化的妙处在于:
关注点分离:API 规则和核心逻辑规则互不干扰
渐进式加载:只加载当前目录相关的规则
演化式积累:Agent 自己也可以写入新规则(经人类确认),自动化"经验沉淀"
公元前 1754 年,汉谟拉比把法律刻在石碑上——这是人类第一次把治理知识从"口耳相传"变成"可读取的显式文本"。近 4000 年后,工程师把约束写进 CLAUDE.md——目的一模一样:让行为准则脱离个体记忆,成为可共享、可继承、可执行的制度。
"信息防火墙"——为什么 Agent 团队禁止私下聊天
Agent Teams 的设计遵循最小充分集原则——名册、邮箱、独立事件循环,三样东西就够了:

设计思想:通信拓扑决定协作效率。限制信息流动反而提升决策质量。
最反直觉的设计:Member 之间不能直接通信。这解决两个问题:
通信爆炸:N 节点全连接 = N(N-1)/2 条链路;星型拓扑只有 N 条。7 人团队从 21 条降到 7 条。
信息污染:全连接中,一个错误判断可以一轮内扩散到所有人——"谣言传播"效应。星型拓扑中,Lead 充当信息防火墙,错误信息被阻断在一个节点。
一般性原则:在多智能体系统中,"谁能和谁说话"的设计,和"谁能做什么"的设计一样重要。
没有反对派的议会一定会犯错"——认知多样性的工程价值
三大巨头都独立实现了审查机制:
| Anthropic | ||
| Cursor | ||
| OpenAI |
设计思想:审查的价值不在于审查者更聪明,而在于审查者有不同的视角。
为什么 Evaluator 必须独立?因为 LLM 有一个已知偏差——self-consistency bias:让同一个模型生成内容再评估自己,它会倾向于认为自己是对的。Anthropic 的解法很精巧:Generator 被引导去"创造",Evaluator 被引导去"质疑"。同一个模型,不同的认知预设,就能打破自洽偏差。
就像一个没有反对党的议会注定会犯错——系统的健壮性来自认知多样性,而非认知一致性。引入"专职挑刺的人"看似降低效率,但大幅提升了产出的可靠性。
💡 一个工程哲学的启示:三大巨头独立走向了同一个结论——"做事的人"和"判断事情做对了没"的人,必须分开。这不仅是 Agent 系统的设计原则,也是人类几乎所有可靠系统的共同基因:飞机有正副驾驶互相校验,核电站有独立安全审查,金融系统有前中后台分离。可靠性从来不是靠"做得更小心"获得的,而是靠"让不同的人从不同的角度看同一件事"获得的。
全景速览:当六个技术方案拼成一幅文明画卷
退后一步看这六个设计——你会发现一个令人不安的事实:它们恰好覆盖了一个社会运转所需的全部基础设施。
| 去中心化 | |||
| 契约 + 快速反馈 | |||
| 隔离 + 注意力管理 | |||
| 规则即认知压缩 | |||
| 通信拓扑设计 | |||
| 认知多样性 |
没有人"设计"了这种对应关系。 工程师在解决具体技术问题,而最优解恰好和人类几千年演化出的制度一模一样。
这六个不是孤立的零件——它们构成一个完整的"治理操作系统":去中心化解决"谁来分配";契约解决"做什么算完";隔离解决"怎么不踩脚";规则解决"怎么不用每次从头想";团队协议解决"怎么高效沟通";审查解决"怎么知道做得对不对"。缺一个,系统就有一个"治理真空"。
这让我想到一个更大的问题:如果 Agent 系统和人类社会在没有任何交流的情况下,独立走向了同一套治理架构——这到底是巧合,还是有某种更深的必然性在起作用?
第二幕:不是巧合,是物理——为什么3000年与3年殊途同归
牛顿没有"发明"引力,他发现了一直存在的规律。也许,汉谟拉比也没有"发明"法律——他发现了多智能体协作的自然法则。而 Claude Code 的工程师们,正在用代码第二次验证这些法则。
Agent 系统和人类社会"长得像",也许只是设计者的无意识投射。但深入一层,会发现一个更有力的解释——这不是类比,是同构。不是巧合,是必然。
四个不可逃避的约束
不管是碳基智能体(人类)还是硅基智能体(AI Agent),只要它们需要协作,就必然面对同一组底层约束:
当这四个条件同时满足时,系统必须发展出某种形式的协作制度,否则退化为混乱。 这不是文化驱动的,而是数学驱动的。
注意一个关键的推论:这四个条件和"智能体是什么材料做的"完全无关。不管是神经元、晶体管、还是纸上的博弈论模型——只要满足这四个条件,制度就会自发涌现。这就是为什么蚂蚁群落(没有中央大脑)也有分工制度,为什么细胞(没有意识)也有基因调控的"法律体系"。制度不是智慧的产物,是复杂性的产物。
这个推论反过来照亮了人类文明本身——我们一直以为法治、产权、分权制衡是人类理性的伟大发明。但如果一群没有读过孟德斯鸠的 TypeScript 程序能独立推导出同样的结构,也许更准确的说法是:人类不是"发明"了这些制度,而是在漫长的试错中"发现"了它们——就像我们没有发明引力,只是发现了一直存在的规律。 Claude Code 的源码,是这个假说的第一份实验证据。
维度一:"有限理性"——为什么规则是必然的
Agent 的 Context Window 是硬约束。Claude Code 的 Context Compact 在上下文过大时主动压缩。这揭示了规则的根本原因:认知资源有限时,你不可能每次从头推理。规则把反复出现的决策预计算好,决策成本从 O(推理) 降到 O(查表)。
维度二:"交易成本"——为什么边界是必然的
Agent 间通信消耗 Token。10 个 Agent 全连接 = 45 条链路(每轮 22,500 Token);星型通信 = 10 条链路(5,000 Token);独立工作最后合并 ≈ 0 Token + 一次性合并。经济学家科斯 1937 年用同样逻辑解释"企业为什么存在"——通信成本的存在必然导致边界的产生。
维度三:"犯错是常态"——为什么审查是必然的
Agent 单步正确率 85%。不审查,连续 10 步全对 ≈ 20%。引入 Evaluator 后 ≈ 70%。
三大巨头共识:容忍犯错然后快速纠正 > 等待不犯错。 Sprint 的 10 分钟周期是审查频率和执行效率之间的 trade-off 最优点。
四条共识:人类文明验证了 3000 年的道理
协作问题的答案只有一个。不管求解者是碳基还是硅基,推导过程是 3000 年还是 3 年,最后的解都长一个样。
Harness 的秘密:缰绳不是用来勒马的
到这里,有人可能会问:这么多约束,Agent 不会被"束缚住"吗?
恰恰相反。Agent Loop 本身极其简单——一个 while true 循环,几乎无限的行动自由。但如果只有这个循环、没有约束,Agent 会在错误方向上狂奔,在无关文件上大肆修改,生成大量"自洽但错误"的代码。无限的自由不产生创造力,只产生混乱。
围绕 Agent Loop 的六层约束——权限、压缩、规则、隔离、协议、审查——不是在限制自由,而是在聚焦自由。就像河道不是限制水流,而是让水流变得有力量。
Harness 这个词既是"驾驭"也是"利用"。最好的驾驭,不是勒紧缰绳让马停下来,而是用缰绳引导马跑向正确的方向。约束越精确,Agent 在正确方向上的自由度越大。
好的 Harness 工程师,设计的不是牢笼,而是跑道。
如果你接受了这个论证,一个更大的图景浮现了出来——
我们正在参与的,不只是"AI 编程工具的进化"。我们正在参与的是:人类文明第一次在实验室条件下,观察一个全新的智能体社会如何从零演化出治理制度。 而且这个"实验"跑得比人类历史快 1000 倍。
这是人类文明史上从未有过的"对照实验"——碳基文明花了 3000 年走到的终点,硅基文明用 3 年就到了。终点相同,路径相似。这不是 AI 在"抄作业",这是宇宙在告诉我们:这些制度不是文化的产物,是物理的产物。
第三幕:三种“建国方略”——当AI巨头变成制度设计师
Anthropic 建立了一个共和国。Cursor 建立了一个联邦。OpenAI 建立了一个法治社会。它们以为自己在做技术竞争——实际上在做制度竞争。
三大巨头面对三个不同维度的 Scaling 问题,给出了三套截然不同的解答。它们的设计哲学,恰好对应了人类政治思想史上三种经典的治理范式。
| Scaling 维度 | |||
| 核心哲学 | |||
| 文明隐喻 |
Anthropic 的"共和国":当一个 Agent 需要独立工作三小时
一个 Agent 执行 10 分钟的任务 vs 3 小时的任务,难度是指数增长——推理偏移累积,错误假设滚雪球。

为什么三个角色而非两个? 两角色(执行+审查)有盲区:代码测试全过、Lint 全绿,但做的功能不是需求要的。Planner 保证"做的是该做的事",Evaluator 检查"做得对不对",Generator 负责"怎么做"——三个关注点,三个独立角色,全覆盖的检查网络。
故障隔离的工程价值:Planner 出错 → Evaluator 发现;Generator 出错 → Evaluator 捕获;Evaluator 标准有误 → Planner 察觉规律性偏差。三角色互为安全网,单点故障不会静默传播。
Cursor 的"联邦制":当 N 个 Agent 需要同时写同一个代码库

两个关键决策:
乐观并发:每个 Worker 在自己的 Repo 副本上工作,最后才合并。因为大部分并行修改不冲突(改 Model 和改 API 通常不碰同一文件),乐观策略效率远高于悲观锁。
Worker 互不可见——最反直觉但最精妙的设计。如果 Worker-1 知道 Worker-2 在改 API,可能"好心"提前适配——但 Worker-2 最终设计和预期不同,导致"幽灵冲突"。信息隔离把这类风险降为零。
并行系统中,"彼此不知道"往往比"彼此都知道"更安全。
这个洞察对人类团队同样成立——如果你管过大型项目,你一定经历过"过度沟通"的痛苦:每个人都知道每个人在做什么,结果每个人都在适配别人还没完成的中间状态,所有人同时陷入"等别人定下来我再动"的死锁。Cursor 的解法很清醒:给每个执行者一个稳定的初始输入,让它们独立交付,把"协调"这件最昂贵的事集中到一个点完成。
OpenAI 的"法治社会":当 Agent 从 1 变到 100

Proof of Work:不是信任 Agent 做对了,而是要求 Agent 证明做对了。人类审查成本从 O(N) 降到 O(1)——不管多少 Agent,人类只处理异常。
多层注意力缩放:
三种信任哲学
三种方案不只是技术差异——它们代表了三种根本不同的信任模型:
Anthropic:不信任任何单一角色。三方互相校验,信任来自制衡。
Cursor:信任个体执行力,但不信任协调能力。信任来自隔离。
OpenAI:不依赖信任,只依赖证据。信任来自验证。
这三种模型可以混合使用。 一个成熟的 Harness 很可能同时包含三者——长任务用制衡,并行用隔离,交付用证据。理解这三种底层逻辑,你就有了设计 Harness 的"工具箱"。
三家公司以为自己在做技术竞争。但从更高的视角看,它们在做的事和 18 世纪的启蒙思想家一样——探索"什么样的制度最适合治理一群有行动能力的自主体"。只不过这一次,被治理的对象不是人,而是 AI;实验周期不是百年,而是月。
有一个推论值得认真对待:如果 Harness 设计的本质是"制度设计",那么未来最有价值的 AI 工程师,可能不是最懂模型的人,而是最懂"治理"的人。 就像工业革命后,最有价值的人不是最熟练的手工匠人,而是能设计工厂流水线的人。模型能力是硬件,Harness 是操作系统——硬件决定了能跑多快,操作系统决定了能跑多稳。
第四幕:给AI“立法”——你的新身份是制度设计师
最好的市长不是自己修路的市长,而是设计出让修路队自己知道怎么修好路的制度的市长。
前三幕是"为什么"。这一幕是"怎么做"——当你明天打开编辑器,面对.cursorrules 或 CLAUDE.md,你可以用一种完全不同的心态来面对它。
认知升级:你不是在配置工具,你是在为一个新物种立法
.cursorrules | |
CLAUDE.md | |
"治理思维"会让你写出完全不同的规则: 你会考虑边界情况、层级关系、强制力、例外处理——因为你面对的不是一个被动的工具,而是一个有自主决策能力的智能体。
实践一:设计你的“法律层级”
从明天开始,当你打开
.cursorrules,试着不要想"我在配置一个工具"——而是想"我在为一群有自主行动能力的智能体制定法律"。你会发现你写出的规则质量完全不一样。

实践二:设计你的审查管线

核心原则:能自动化的约束绝不靠 Agent"自觉遵守"。确定性约束永远优于概率性指令。
实践三:Sprint Contract模版
| 输入+输出 | ||
| 验收标准 | ||
| 范围约束 | ||
| 失败策略 |
Sprint Contract 本质:把"信任"替换为"契约"。
实践四:把“老人经验”变成“判例法”——因为Agent不会读心术
团队的隐性知识对 Agent 不存在。写入 CLAUDE.md:
# src/services/payment/CLAUDE.md## ⚠️ 已知陷阱1. PaymentGateway.process() 的 amount 单位是"分"不是"元"- 传错导致扣款金额 ×1002. 退款接口有 24 小时延迟(银行清算周期)- 不要退款后立即查余额,用异步回调3. 并发下单必须分布式锁- 锁key: payment:order:{userId}:{productId}- 原因:2024-Q3 重复扣款事故
实践五:MCP——让 Agent 能力可扩展

MCP 的核心是解耦——Agent 不需要知道外部工具细节,只遵循统一协议。把高频人工操作封装成 MCP Server,让 Agent 完成从编码到部署的完整闭环。
🔄 能力模型:你的战场正在转移
你的新产出物不再只是 PR,而是 Harness——约束规则、审查管线、Sprint Contract、版本化知识组成的治理体系。Harness 的质量决定 Agent 产出的下限。
💡 一个关于"杠杆率"的计算:假设一个高级工程师每天能写 500 行高质量代码。现在,如果他花一天时间写一套精确的
.cursorrules+CLAUDE.md,而这套规则能让 5 个 Agent 各自正确产出 500 行代码——他的"日产出"从 500 行变成了 2500 行。这不是 5 倍提效,这是从"个体生产者"到"制度设计者"的身份跃迁——和工厂工人变成工厂设计师的区别。 历史上每一次这样的跃迁,都伴随着巨大的职业价值重估。
不是所有场景都需要复杂治理。补全一行代码不需要 Sprint Contract。但当你让多 Agent 并行、数小时执行、自主决策时——治理设计的回报是巨大的。
终章:我们正在亲历的事
我们往 AI Agent 系统里看——
看到了代码、架构、工具链。看到了 while true 循环、Token 计费、Git Worktree。看到了工程师们日常调试的 bug 和深夜加班的 Sprint。
但退后一步,把视线从屏幕上移开,换一个更远的距离去看——
我们看到了去中心化的任务市场。契约式的执行协议。双层隔离的产权边界。分层演化的规范体系。星型拓扑的协作网络。角色分离的审查机制。
一个完整的社会,在一堆 TypeScript 文件里悄悄成型。
Agent 系统用 3 年时间,独立推导出了人类用 3000 年才演化出的协作治理方案。不是因为它们更聪明——而是因为协作问题的最优解是唯一的。只要底层约束条件相同,不管求解者是碳基还是硅基,最终都会收敛到同一组解。
回到开头那个工程师的下午。他以为自己在看 7 个 Agent 写代码。但他实际上目睹了一件更宏大的事——一个全新的智能体社会的诞生。 而他手里的 .cursorrules 文件,就是这个社会的第一部宪法。
也许某一天,他会想起那个下午——想起自己喝着咖啡,看着屏幕上的 Agent 们自己抢单、自己签约、自己划地盘、自己组团、自己审查——然后意识到,自己见证了一个和公元前 1754 年汉谟拉比刻下第一行法律同等量级的时刻。只不过这一次,石碑变成了 .md文件,法官变成了 Evaluator,领土变成了 Git Worktree。
Harness Engineering 不是一个临时的技术热点。它是多智能体协作的自然法则——去中心化、契约设计、注意力管理、认知压缩、通信拓扑、认知多样性。这些思想不仅适用于 Agent 系统,也适用于人类团队、系统架构、甚至组织文化建设。因为底层的约束条件是一样的——有限理性、通信成本、犯错可能——不管你管理的是人还是 AI。
五年后回看,2025-2026 年不会被记住为"AI 学会了写代码"的年代。它会被记住为——人类第一次同时扮演两个角色的年代:一个古老文明的继承者,和一个全新文明的立法者。
让一群自主的个体做出可靠的事,靠的从来不是更聪明的个体,而是更好的制度。
3000 年前如此,3 年前如此——今天,当我们为 AI 写下第一行约束规则的时候,依然如此。
夜雨聆风