斯坦福大学现代软件开发课程Week 4(下)——Claude Code 创造者的设计哲学

上篇聊了 Agent Manager、自治光谱和五大最佳实践。这篇进入 Boris Cherney（Claude Code 创造者）的 49 页 Slides——管道化思维、四种编排模式、Hooks 确定性保障、三条 Lessons。

上篇的核心结论：你不是在"用工具"，你是 Agent Manager。具体见:斯坦福大学现代软件开发课程Week 4（上）：从写代码到管 Agent

这篇往更深处走。上篇说的是"怎么管 Agent"，这篇说的是——Agent 的终极形态到底长什么样。

01丨Claude Code 在历史上排第几

Boris 在 Slides 里做了一件很有仪式感的事——画了两条指数曲线，把 Claude Code 放进编程工具的整个演化史。

编程语言曲线：Fortran → C → Python → JS → Rust → AI 辅助

IDE 曲线：ed → emacs → vi → Eclipse → Sublime → Copilot → Cursor → Claude Code

结论：Claude Code 不是 IDE 的"又一次小升级"。它是 IDE 演化史上的第六次范式转移——跟从 ed 到 Smalltalk-80、从 VB 到 Eclipse 同级别的不连续跳跃。

不是"更聪明的代码补全"，是一个能做软件工程师做的一切事情的 Agent。

然后他做了一个刻意的产品选择——让 Claude Code 跑在终端，而不是嵌进 IDE。

02丨Terminal-First 不是怀旧，是刻意选择

2026 年了，为什么不嵌进 IDE，偏要跑在命令行？

Boris 给了三个理由：

• 终端是最通用的开发环境——不绑定任何编辑器

• 终端天然支持自动化——可以被脚本调用、并行运行、嵌入 CI/CD

• 终端给 Agent 完整的系统访问权——不只读写代码，还能跑测试、看日志、操作 Git

看起来像技术细节，但背后是一个根本性的产品判断：Agent 不应该被困在图形界面里。

图形界面的本质是"你坐在这里操作"。终端的本质是"它可以自己跑"。

这直接引出 Boris 最核心的洞察。

03丨Agent 的五种形态——从聊天窗口到管道组件

Boris 把 Claude Code 的使用形态分成五种：

形态	说明	定位
Terminal	命令行原生	最灵活，自动化基础
IDE	嵌入编辑器（Cursor 等）	当前大多数人的方式
Web & iOS	claude.ai/code	低门槛入口
GitHub App	/install-github-app	CI/CD 集成
SDK	-p 参数 + JSON 输出	嵌入 Unix 管道

前四种大多数人都能理解。第五种才是真正的炸药。

SDK 模式意味着：Agent 不是交互界面，是可组合的管道组件。

举两个 Boris Slides 里的例子：

# 一行命令查本周产出

claude -p "what did i do this week?" --allowedTools 'Bash(git log:*)' --output-format stream-json

# GCP 日志 → Claude 关联分析 → jq 提取结果

get-gcp-logs 1uhd832d | claude -p "correlate errors + commits" --output-format=json | jq '.result'

第一条：不需要打开任何界面，终端里问一句话，Claude 自己去翻 git log，以 JSON 格式吐结果。

第二条更狠：把 GCP 日志通过管道喂给 Claude 做关联分析，结果再通过管道传给 jq 提取——整条链路里没有任何一个步骤需要你"坐在那里操作"。

学这段内容的时候，我追问了三轮才真正消化这个概念。

第一轮："这具体怎么理解？"——用菜谱打比方就通了：对话模式 = 你站在厨房里实时指挥厨师每一步，管道模式 = 你写好菜谱放在厨房里，厨师按菜谱做，你不需要在场。

第二轮："我还是要告诉它做什么的吧？"——差别不在"要不要告诉"，在"什么时候告诉"。对话模式在 run time 告诉（干活的时候边走边说），管道模式在 design time 告诉（提前写好，之后自动跑）。

第三轮："怎么让菜谱自己跑起来？"——需要两层：执行引擎（Claude Code CLI 的 -p 参数）+ 触发器（定时任务 / 文件监听 / 脚本调用）。

三轮下来理解了：这就是 Karpathy 说他并行跑 10-20 个 Agent 的底层逻辑。

核心认知转变：人从"每步都在"退到"只在两头"——设计输入 + 检查输出。

对大多数人来说，现阶段最有价值的不是急着搞自动化管道。而是把你现在用 AI 的每一个工作流都写成精确的"菜谱"。菜谱写得越精确，未来接入管道就越丝滑。

04丨四种编排模式——不同任务用不同派活方式

上篇强调了 Plan First。但 Boris 指出——Plan First 不是万能的。不同任务类型需要不同的编排模式。

模式	流程	适用场景
探索→规划→执行	先诊断 → 列方案 → 人选方案 → 执行	不确定原因的 bug、架构决策
TDD 模式	写测试 → 提交 → 写实现 → 迭代	有明确预期行为的功能
视觉驱动	实现 → 截图 → 对比 mock → 迭代	前端 / UI 开发
快速原型	一句话 → 看效果 → 推翻 → 再来	探索性设计、新方向试水

我总结了一个选择口诀：

• 知道要什么、知道怎么做 → 规划→执行（大部分任务的默认模式）

• 知道要什么、不确定怎么判断好坏 → 先定验收标准（TDD 思路）

• 大概知道、要看到才知道对不对 → 先做再看（视觉驱动）

• 不知道要什么 → 快速试错，允许推翻

重点是有意识地选择，而不是每次都用同一个模式。

我之前的默认模式是第一种——想清楚再让 AI 做。但有些任务天然适合"先做再看"。Boris 在演示环节连续迭代了 8 次快速原型——每次一句话，看效果，不满意直接推翻。8 轮下来，比花 30 分钟写详细 spec 再执行更快到达满意的结果。

强行规划一个你自己都说不清"想要什么样"的任务，反而是浪费时间。

05丨从"建议"到"保障"——Hooks 和四种管理技术

课程 Slides 给了一张 Agent 管理技术的全景图：

技术	做什么	类比
Behavior Files	CLAUDE.md / .cursorrules	员工手册
Hooks	事件触发的确定性脚本	IT 系统自动检查
Commands	斜杠命令，标准化重复工作流	SOP 手册
SubAgents	角色化子 Agent + 独立上下文	专业分工团队

Behavior Files 和 Commands 上篇聊过了。Hooks 是这篇的新概念，值得展开。

Behavior Files（CLAUDE.md / .cursorrules）是"建议性"的——告诉 AI"你应该这样做"。但 AI 可能忘、可能走神、可能在长对话中丢掉规则。

Hooks 不一样。它是确定性保障——在特定事件发生时自动触发的脚本。不管 AI 记不记得规则，系统帮你兜底。

举个例子：你可以设一个 Hook——每次 AI 要修改文件之前（PreToolUse），自动检查文件路径是否在"禁止修改"的清单里。AI 再怎么"走神"，这个检查都不会漏。

类比：员工手册说"出差报销前先找领导审批"。但忙起来有人会忘。Hooks 等于在系统里做了审批流——你提交报销单时自动弹出审批，想跳过都不行。

"建议"不够，需要"保障"。这是上篇 CLAUDE.md / 规则体系的一个重要补充维度。

再说 SubAgents。上篇提到 Claude Code 的子 Agent 有一个精巧设计——默认不带 TodoWrite 提醒。子 Agent 应该专注执行具体任务，不需要任务管理的干扰。但如果任务确实变复杂了，系统会条件性地注入提醒。

还是上篇那句话的延伸：不是无差别轰炸，是在正确的时间给正确的提醒。

课程有个互动问题很有启发：你的角色模式（比如审查者、执行者）应该共享全部上下文，还是有所隔离？

答案是选择性隔离——真正需要独立判断的场景（比如深度 review），应该用新对话执行，只给方案文件 + 角色 prompt，在干净上下文中独立思考。在同一个对话里切换角色，容易"串味"。

06丨验证也在被 AI 接管

Boris 展示了一条不太引人注目但意义深远的演化线：

手动调试 → 静态类型 → 自动化测试 → CI → Property-based testing → E2E testing → ……→ AI-powered unit testing → AI-powered fuzz testing → Self play

最后几个台阶全是 AI 驱动的。

这意味着：Agent 不仅能写代码，还能自己验证自己写的代码。反馈循环正在从"人看结果"变成"Agent 自己看结果自己修"。

上篇提到的 Pattern 3（反馈循环）在未来会越来越自动化——Agent 写完代码、自己跑测试、看到报错、自己修、再跑测试——直到全部通过才提交给你。

你的角色从"逐行检查代码"退到"审查最终产出"。

课程 Slides 也给了一张人机分工表，能看出趋势：

软件开发步骤	谁做
提供高层需求	人
需求转设计文档	人 + Agent 协作
实现代码	Agent
加测试 / 确保 CI 通过	Agent
Code Review	Agent（人兜底）
更新文档	Agent

人类的不可替代区域在最前端——定义"做什么"和"为什么做"。

回到上篇的 Agent Manager 三能力——技术判断力、任务分解力、沟通精确度——哪一个是在定义"做什么"和"为什么做"？全部都是。

07丨Boris 的三条 Lessons

Boris 在 Slides 最后给了几条经验。每一条都值得单独说。

Lesson 1："Build for the model six months from now"

不要基于今天模型的局限做架构决策。

翻译成实操：你的规则体系应该锁死"什么标准必须达到"，但不要锁死"用几步达到"。

比如我之前写过一条规则："三遍审校不可跳步"。但如果半年后的模型一遍就能达到三遍的质量呢？更好的写法是："审校标准不可跳——事实准确、逻辑自洽、节奏打磨。遍数可根据产出质量调整。"

锁标准不锁步骤——为模型进化留口子。

Lesson 2："Be ready to evolve"

工作流、规则系统、协作模式必须能快速迭代。今天有效的最佳实践，三个月后可能就过时了。不要把任何一个 Pattern 当成永恒真理。

这条对我有特别的提醒意义。我的规则体系已经积累了 16 个 Skill 文件、三层规则架构——"沉淀"是好事，但"固化"是风险。保持轻量，保持灵活。

Lesson 3："Ask not what the model can do for you— ask what you can do for the model."

反问自己：你给了模型成功所需的条件吗？

这句话在上篇结尾出现过。放在这里再说一次，是因为学完 Boris 的所有内容后，这句话的份量变重了。

Claude Code 之所以比"裸聊 AI"强得多，不是因为模型更强，是因为围绕模型搭建了完整的脚手架——上下文管理、安全护栏、小纸条系统、Sub-Agent 隔离、权限检查……

你也可以为自己搭脚手架。规则文件、SOP、检查点——这些不是"锦上添花"，是让同一个模型发挥出完全不同水平的基础设施。

08丨两个没有标准答案的问题

课程最后留了两个开放问题：

1. 如何自动化任务的前 10-20% 研究阶段？

目前大部分自动化集中在执行阶段。但执行之前的调研、方案探索、信息收集——这部分还高度依赖人。如果这个阶段也能自动化，Agent 的自治度会再上一个台阶。

2. 如何维护跨会话的待执行任务队列？

现在的 AI 协作基本是单会话的——这个对话结束，下一个对话从零开始。怎么让 Agent 记住"还有三件事没做完"，并在合适的时机自动捡起来？

目前没有标准答案。但方向已经很清楚——Agent 正在从"你推一下动一下"的被动工具，向"自己知道该干嘛"的主动协作者演进。

09丨Week 4 总收尾

Week 4 两篇文章的核心认知链条：

• 上篇：你不是在用工具，你是 Agent Manager → 自治光谱决定管理方式 → 五大最佳实践 → 小纸条 / 脚手架

• 下篇：Agent 的终极形态不是聊天窗口，是管道组件 → 不同任务用不同编排 → 从"建议"到"保障" → 锁标准不锁步骤

如果只记一句话：

差距不在 AI 能力有多强。在你给它搭了什么条件。

Week 5 继续更新，下篇见。

附：本文涉及的阅读材料

1. Boris Cherney Slides（49 页）Claude Code 创造者的完整 Slides，本文主要素材来源。https://docs.google.com/presentation/d/1bv7Zozn6z45CAh-IyX99dMPMyXCHC7zj95UfwErBYQ8/

2. Agent Manager 课程 Slides（14 页）Mihail Eric 课程 Slides，含四种管理技术和人机分工表。https://docs.google.com/presentation/d/19mgkwAnJDc7JuJy0zhhoY0ZC15DiNpxL8kchPDnRkRQ/

3. Claude Code Best Practices — Anthropic 工程博客https://www.anthropic.com/engineering/claude-code-best-practices

4. Peeking Under the Hood of Claude Code — OutSight AI / Mediumhttps://medium.com/@outsightai/peeking-under-the-hood-of-claude-code-70f5a94a9a62

点击关注下方账号，学习AI的路上，带你一起进步~

能看到这里的都是凤毛麟角的存在。

如果觉得不错，随手点个赞、在看、转发三连哦，送上我的感谢小心心