上篇聊了 Agent Manager、自治光谱和五大最佳实践。这篇进入 Boris Cherney(Claude Code 创造者)的 49 页 Slides——管道化思维、四种编排模式、Hooks 确定性保障、三条 Lessons。
上篇的核心结论:你不是在"用工具",你是 Agent Manager。具体见:斯坦福大学现代软件开发课程Week 4(上):从写代码到管 Agent
这篇往更深处走。上篇说的是"怎么管 Agent",这篇说的是——Agent 的终极形态到底长什么样。
01丨Claude Code 在历史上排第几
Boris 在 Slides 里做了一件很有仪式感的事——画了两条指数曲线,把 Claude Code 放进编程工具的整个演化史。
编程语言曲线:Fortran → C → Python → JS → Rust → AI 辅助
IDE 曲线:ed → emacs → vi → Eclipse → Sublime → Copilot → Cursor → Claude Code
结论:Claude Code 不是 IDE 的"又一次小升级"。它是 IDE 演化史上的第六次范式转移——跟从 ed 到 Smalltalk-80、从 VB 到 Eclipse 同级别的不连续跳跃。
不是"更聪明的代码补全",是一个能做软件工程师做的一切事情的 Agent。
然后他做了一个刻意的产品选择——让 Claude Code 跑在终端,而不是嵌进 IDE。
02丨Terminal-First 不是怀旧,是刻意选择
2026 年了,为什么不嵌进 IDE,偏要跑在命令行?
Boris 给了三个理由:
• 终端是最通用的开发环境——不绑定任何编辑器
• 终端天然支持自动化——可以被脚本调用、并行运行、嵌入 CI/CD
• 终端给 Agent 完整的系统访问权——不只读写代码,还能跑测试、看日志、操作 Git
看起来像技术细节,但背后是一个根本性的产品判断:Agent 不应该被困在图形界面里。
图形界面的本质是"你坐在这里操作"。终端的本质是"它可以自己跑"。
这直接引出 Boris 最核心的洞察。
03丨Agent 的五种形态——从聊天窗口到管道组件
Boris 把 Claude Code 的使用形态分成五种:
前四种大多数人都能理解。第五种才是真正的炸药。
SDK 模式意味着:Agent 不是交互界面,是可组合的管道组件。
举两个 Boris Slides 里的例子:
# 一行命令查本周产出
claude -p "what did i do this week?" --allowedTools 'Bash(git log:*)' --output-format stream-json
# GCP 日志 → Claude 关联分析 → jq 提取结果
get-gcp-logs 1uhd832d | claude -p "correlate errors + commits" --output-format=json | jq '.result'
第一条:不需要打开任何界面,终端里问一句话,Claude 自己去翻 git log,以 JSON 格式吐结果。
第二条更狠:把 GCP 日志通过管道喂给 Claude 做关联分析,结果再通过管道传给 jq 提取——整条链路里没有任何一个步骤需要你"坐在那里操作"。
学这段内容的时候,我追问了三轮才真正消化这个概念。
第一轮:"这具体怎么理解?"——用菜谱打比方就通了:对话模式 = 你站在厨房里实时指挥厨师每一步,管道模式 = 你写好菜谱放在厨房里,厨师按菜谱做,你不需要在场。
第二轮:"我还是要告诉它做什么的吧?"——差别不在"要不要告诉",在"什么时候告诉"。对话模式在 run time 告诉(干活的时候边走边说),管道模式在 design time 告诉(提前写好,之后自动跑)。
第三轮:"怎么让菜谱自己跑起来?"——需要两层:执行引擎(Claude Code CLI 的 -p 参数)+ 触发器(定时任务 / 文件监听 / 脚本调用)。
三轮下来理解了:这就是 Karpathy 说他并行跑 10-20 个 Agent 的底层逻辑。
核心认知转变:人从"每步都在"退到"只在两头"——设计输入 + 检查输出。
对大多数人来说,现阶段最有价值的不是急着搞自动化管道。而是把你现在用 AI 的每一个工作流都写成精确的"菜谱"。菜谱写得越精确,未来接入管道就越丝滑。
04丨四种编排模式——不同任务用不同派活方式
上篇强调了 Plan First。但 Boris 指出——Plan First 不是万能的。不同任务类型需要不同的编排模式。
我总结了一个选择口诀:
• 知道要什么、知道怎么做 → 规划→执行(大部分任务的默认模式)
• 知道要什么、不确定怎么判断好坏 → 先定验收标准(TDD 思路)
• 大概知道、要看到才知道对不对 → 先做再看(视觉驱动)
• 不知道要什么 → 快速试错,允许推翻
重点是有意识地选择,而不是每次都用同一个模式。
我之前的默认模式是第一种——想清楚再让 AI 做。但有些任务天然适合"先做再看"。Boris 在演示环节连续迭代了 8 次快速原型——每次一句话,看效果,不满意直接推翻。8 轮下来,比花 30 分钟写详细 spec 再执行更快到达满意的结果。
强行规划一个你自己都说不清"想要什么样"的任务,反而是浪费时间。
05丨从"建议"到"保障"——Hooks 和四种管理技术
课程 Slides 给了一张 Agent 管理技术的全景图:
Behavior Files 和 Commands 上篇聊过了。Hooks 是这篇的新概念,值得展开。
Behavior Files(CLAUDE.md / .cursorrules)是"建议性"的——告诉 AI"你应该这样做"。但 AI 可能忘、可能走神、可能在长对话中丢掉规则。
Hooks 不一样。它是确定性保障——在特定事件发生时自动触发的脚本。不管 AI 记不记得规则,系统帮你兜底。
举个例子:你可以设一个 Hook——每次 AI 要修改文件之前(PreToolUse),自动检查文件路径是否在"禁止修改"的清单里。AI 再怎么"走神",这个检查都不会漏。
类比:员工手册说"出差报销前先找领导审批"。但忙起来有人会忘。Hooks 等于在系统里做了审批流——你提交报销单时自动弹出审批,想跳过都不行。
"建议"不够,需要"保障"。这是上篇 CLAUDE.md / 规则体系的一个重要补充维度。
再说 SubAgents。上篇提到 Claude Code 的子 Agent 有一个精巧设计——默认不带 TodoWrite 提醒。子 Agent 应该专注执行具体任务,不需要任务管理的干扰。但如果任务确实变复杂了,系统会条件性地注入提醒。
还是上篇那句话的延伸:不是无差别轰炸,是在正确的时间给正确的提醒。
课程有个互动问题很有启发:你的角色模式(比如审查者、执行者)应该共享全部上下文,还是有所隔离?
答案是选择性隔离——真正需要独立判断的场景(比如深度 review),应该用新对话执行,只给方案文件 + 角色 prompt,在干净上下文中独立思考。在同一个对话里切换角色,容易"串味"。
06丨验证也在被 AI 接管
Boris 展示了一条不太引人注目但意义深远的演化线:
手动调试 → 静态类型 → 自动化测试 → CI → Property-based testing → E2E testing → ……→ AI-powered unit testing → AI-powered fuzz testing → Self play
最后几个台阶全是 AI 驱动的。
这意味着:Agent 不仅能写代码,还能自己验证自己写的代码。反馈循环正在从"人看结果"变成"Agent 自己看结果自己修"。
上篇提到的 Pattern 3(反馈循环)在未来会越来越自动化——Agent 写完代码、自己跑测试、看到报错、自己修、再跑测试——直到全部通过才提交给你。
你的角色从"逐行检查代码"退到"审查最终产出"。
课程 Slides 也给了一张人机分工表,能看出趋势:
人类的不可替代区域在最前端——定义"做什么"和"为什么做"。
回到上篇的 Agent Manager 三能力——技术判断力、任务分解力、沟通精确度——哪一个是在定义"做什么"和"为什么做"?全部都是。
07丨Boris 的三条 Lessons
Boris 在 Slides 最后给了几条经验。每一条都值得单独说。
Lesson 1:"Build for the model six months from now"
不要基于今天模型的局限做架构决策。
翻译成实操:你的规则体系应该锁死"什么标准必须达到",但不要锁死"用几步达到"。
比如我之前写过一条规则:"三遍审校不可跳步"。但如果半年后的模型一遍就能达到三遍的质量呢?更好的写法是:"审校标准不可跳——事实准确、逻辑自洽、节奏打磨。遍数可根据产出质量调整。"
锁标准不锁步骤——为模型进化留口子。
Lesson 2:"Be ready to evolve"
工作流、规则系统、协作模式必须能快速迭代。今天有效的最佳实践,三个月后可能就过时了。不要把任何一个 Pattern 当成永恒真理。
这条对我有特别的提醒意义。我的规则体系已经积累了 16 个 Skill 文件、三层规则架构——"沉淀"是好事,但"固化"是风险。保持轻量,保持灵活。
Lesson 3:"Ask not what the model can do for you— ask what you can do for the model."
反问自己:你给了模型成功所需的条件吗?
这句话在上篇结尾出现过。放在这里再说一次,是因为学完 Boris 的所有内容后,这句话的份量变重了。
Claude Code 之所以比"裸聊 AI"强得多,不是因为模型更强,是因为围绕模型搭建了完整的脚手架——上下文管理、安全护栏、小纸条系统、Sub-Agent 隔离、权限检查……
你也可以为自己搭脚手架。规则文件、SOP、检查点——这些不是"锦上添花",是让同一个模型发挥出完全不同水平的基础设施。
08丨两个没有标准答案的问题
课程最后留了两个开放问题:
1. 如何自动化任务的前 10-20% 研究阶段?
目前大部分自动化集中在执行阶段。但执行之前的调研、方案探索、信息收集——这部分还高度依赖人。如果这个阶段也能自动化,Agent 的自治度会再上一个台阶。
2. 如何维护跨会话的待执行任务队列?
现在的 AI 协作基本是单会话的——这个对话结束,下一个对话从零开始。怎么让 Agent 记住"还有三件事没做完",并在合适的时机自动捡起来?
目前没有标准答案。但方向已经很清楚——Agent 正在从"你推一下动一下"的被动工具,向"自己知道该干嘛"的主动协作者演进。
09丨Week 4 总收尾
Week 4 两篇文章的核心认知链条:
• 上篇:你不是在用工具,你是 Agent Manager → 自治光谱决定管理方式 → 五大最佳实践 → 小纸条 / 脚手架
• 下篇:Agent 的终极形态不是聊天窗口,是管道组件 → 不同任务用不同编排 → 从"建议"到"保障" → 锁标准不锁步骤
如果只记一句话:
差距不在 AI 能力有多强。在你给它搭了什么条件。
Week 5 继续更新,下篇见。
附:本文涉及的阅读材料
1. Boris Cherney Slides(49 页)Claude Code 创造者的完整 Slides,本文主要素材来源。https://docs.google.com/presentation/d/1bv7Zozn6z45CAh-IyX99dMPMyXCHC7zj95UfwErBYQ8/
2. Agent Manager 课程 Slides(14 页)Mihail Eric 课程 Slides,含四种管理技术和人机分工表。https://docs.google.com/presentation/d/19mgkwAnJDc7JuJy0zhhoY0ZC15DiNpxL8kchPDnRkRQ/
3. Claude Code Best Practices — Anthropic 工程博客https://www.anthropic.com/engineering/claude-code-best-practices
4. Peeking Under the Hood of Claude Code — OutSight AI / Mediumhttps://medium.com/@outsightai/peeking-under-the-hood-of-claude-code-70f5a94a9a62
点击关注下方账号,学习AI的路上,带你一起进步~

往期文章分享
斯坦福大学现代软件开发课程Week 1:6 种 Prompt Engineering 核心技术学习分享
斯坦福大学现代软件开发课程Week 2:拆开一个 AI Agent,看看里面到底有什么
斯坦福大学现代软件开发课程Week 3:AI 编程时代的需求文档升级指南:从 PRD 到 Spec
斯坦福大学现代软件开发课程Week 4(上):从写代码到管 Agent
4个MCP、9个技能、20多条规则:一个PM是怎么把AI搭档"驯服"的
OpenClaw能帮你干什么?8个真实场景,看完你就知道该不该装
夜雨聆风