跟着斯坦福 CS146S 学 AI Agent 开发,Week 5 的主题是「现代终端」——客座嘉宾 Warp CEO Zach Lloyd 不讲产品功能,讲了一件更有意思的事:他在自己公司推 AI 编程,推不动。资深工程师不愿意用。他的解法是发布一套"编码制度",强制每个任务从 Prompt 开始。三个月后效果怎样?
上周 Week 4 学的是「Agent Manager」——怎么从写代码的人变成管 Agent 的人,Boris Cherney 讲了 Agent 的设计哲学,具体见:斯坦福大学现代软件开发课程Week 4(下)——Claude Code 创造者的设计哲学
Week 5 换了个角度:不是一个人怎么用好 AI,而是一个团队怎么用好 AI。
这周的客座嘉宾 Zach Lloyd,是 Warp 的 CEO,之前是 Google Docs 的工程负责人。Warp 做的是一个现代终端——但讲实话,Week 5 最有价值的内容不是终端产品本身,而是他在自己公司推 AI 编程的那套管理方法。
Week 4 结尾是:
Agent Manager 的核心技能不是写代码,是"把正确的事情定义清楚到机器可以执行"。
Week 5 把这句话从个人层面推到了团队层面:你自己会用 AI 不够,你得让你整个团队都会用。而最不愿意用的,恰恰是你觉得最应该用的那群人。
01丨为什么终端是 Agent 的天然栖息地
Lloyd 有一个观察:终端这个 50 年历史的老工具,反而是最适合 AI Agent 的界面形态。
原因很简单——Agent 的工作模式就是"接收文本指令 → 执行任务 → 返回文本结果"。终端天生就是这个模式。
IDE 是为人"手写代码"设计的——你需要看文件树、需要跳转、需要语法高亮。但如果代码越来越多由 Agent 写,你还需要一个以"编辑器"为中心的界面吗?
Lloyd 的判断是:终端和 IDE 正在融合。Warp 在加代码编辑器,Cursor 在加终端功能。最终会变成一个统一的 Agent 工作台。
但对大多数人来说,你在 Cursor 的聊天框里打字让 AI 干活,本质上就是在用终端模式——只是套在 IDE 的壳里。形态不重要,交互逻辑才重要。
02丨7 条产品原则:好的 AI 工具长什么样
课程 Slides 提炼了 7 条现代 AI 开发工具的产品原则。不管你做什么产品,背后的思路都通用:
第 1 条:从用户已知的界面出发。 Cursor 选了 VS Code,Warp 选了终端,Bolt 选了聊天。没有一个成功产品让用户从零学新界面。
第 2 条:零配置有价值,深度配置有空间。 Slides 里有一个短语叫 "5 minutes to WOW"——用户从打开到发出"哇"的时间不能超过 5 分钟。但同时,高级用户能把 Rules、MCP、Prompts 配得很深。
第 3 条:自然语言是一等公民。 原话:Code is inherently a contrived representation of human intent.(代码本质上是人类意图的有损压缩。)以前你得把想法翻译成代码语法,现在你直接说人话,Agent 帮你翻译。
第 4 条:快速反馈闭环。 改一个 prompt,立刻看到效果。反馈环越短,迭代越快。
第 5 条:MCP 成为通用连接语言。 Week 3 学过了,不展开。
第 6 条:一个按键都值得优化。 "If you can shave off a single keystroke, do it." 这条看起来小,但体现了一个产品哲学——高频交互的微小摩擦,乘以使用次数后就是巨大的体验差距。Warp 为什么把 Tab 键的自动补全做到极致?因为开发者一天按几百次 Tab。
第 7 条:Agent 自主权是一个光谱。 全自动到每步确认,好的工具让用户自己选位置。这跟 Week 4 的自治光谱完全一致。
7 条串起来就一句话:好的 AI 工具不是让用户学新东西,而是让用户用最自然的方式表达意图,然后以最低摩擦、最快反馈看到结果。
03丨推不动:资深工程师为什么抵抗 AI
Lloyd 在 LinkedIn 上发了一条帖子:
"We are literally building an AI devtool at Warp and I still find it hard to get folks to change their habits."
我们自己就是做 AI 工具的,我都很难让团队改变习惯。几百条评论涌进来,很多人说自己公司也一样。
有意思的是——最先拥抱 AI 的不是工程师,是设计师和 PM。
Lloyd 说了一个例子:Warp 的一个设计师独自用 AI 完成了新版终端输入界面的开发,没有手写一行代码。
为什么?因为对非技术人员来说,AI 不是"加速",是从"不可能"变成"可能"。设计师以前做不了开发,现在可以了。这是质变。
而对资深工程师来说,AI 只是"做得更快"——但初次使用时大概率更慢。再加上对代码质量的不信任,很多高级工程师试了一次就放弃了。
Lloyd 的反驳很犀利:
大家都在说 AI 要替代工程师。但实际上,资深工程师的经验恰恰是最好的 AI 杠杆——你知道什么是好代码,你比任何人都能更好地指导 Agent。
04丨编码制度:5 步 + 10 分钟规则
Lloyd 的解法不是劝,是定制度。他发布了一套内部文件叫 "Coding Mandate"(编码制度),每周团队会议上都会过一遍。
Step 1:每个编码任务必须从 Prompt 开始。 不是"建议",是"必须"。你可以最终手写代码,但你的第一个动作必须是输入一段 prompt。
Step 2:如果成功了,把 prompt 分享到内部 Slack 频道。 让成功案例流动起来。
Step 3:如果 10 分钟后觉得在浪费时间,分享你的反馈。 这条是精华。Lloyd 给了一个压力释放阀——他知道不是所有任务都适合用 AI,也知道强制太死会引发抵触。
"I'm trying to balance the imperative of 'Try this new thing!' with 'I trust you as a smart person who knows what's best.'"
Step 4:试试其他工具(Cursor、Claude Code),对比报告。 这一条不多见——一个 CEO 鼓励团队用竞品。Lloyd 的逻辑是:如果你在 Warp 上做不了的事在 Cursor 上做成了,那就是我的产品问题,我要知道。
Step 5:以上都不行,手写代码。 兜底。不牺牲交付效率。
三个月后的结果:每个编程任务都从 prompt 开始了。不是每个任务都由 AI 完成,但完成率每周都在上升,目前大概在 40-50%。
05丨3 条血泪教训:用起来之后才踩的坑
团队开始用 AI 之后,Lloyd 发现了 3 个新问题。这 3 条教训比制度本身更值钱。
教训 1:不要只说"要什么",要说"怎么做"。
"A lot of the frustration that engineers have from using these tools stems from underspecifying the problem and overspecifying an outcome."
问题描述不够具体,结果期望却很高。对比一下:
❌ "我要一个功能,用户点击按钮后能重命名标签页"
✅ "在 TabManager 模块里,给 rename 方法加一个参数,监听 Command+R 快捷键,触发时弹出 inline input,用现有的 InlineEditor 组件"
前者只说了结果——Agent 可能做出来了,但代码质量差、不符合团队规范。后者说了怎么做——Agent 有了明确的执行路线。你给 Agent 的指令越具体,它返回的结果质量越高。
教训 2:AI 写的代码不能降低质量标准。
"It is never an excuse for a bug or poor code quality to say 'AI wrote this' — AI is a tool, not a responsible party on our software team."
Lloyd 讨厌"vibe coding"这个词。他认为这个概念暗示"用 AI 写代码就不用理解代码了"——对做个人项目可以,对专业开发绝对不行。AI 生成的代码必须跟手写代码质量完全一样。
实际 code review 中最常发现的问题:Agent 写的代码跟代码库里已有的实现重复了——功能一样,写法不同。这是技术债的源头。
教训 3:盯着做比甩手做效果好得多。
Lloyd 自己踩的坑:
"I would just prompt, not really look closely at the code, let it run, see if the feature worked, and go round and round. And then I made the mistake of looking at the code and was, 'Oh my god, this is being done in a very hacky way.'"
代码跑起来了,但写得一塌糊涂。他的总结:
❌ One-shotting:给 Agent 一个大任务,跑完回来看结果
✅ Babysitting:每一步都看 Agent 在干什么,随时纠偏
"Think of it like managing a junior developer. You don't just give them free rein. You check in incrementally."
像管新员工一样管 Agent——不是甩手不管,而是频繁检查、及时纠偏。
06丨"Coding will be solved"——代码在贬值,意图在升值
Lloyd 在 Sequoia 的访谈里说了一句很大的话:Coding will be solved. 编码会被解决。未来几年,"能不能写出能跑的代码"将不再是稀缺能力。
那什么是稀缺的?人类清晰表达意图的能力。
把 Week 3 到 Week 5 串起来看:
• Week 3:Specs are the new source code(需求文档是新的源代码)
• Week 4:Agent Manager 的核心是沟通精确度
• Week 5:Coding will be solved,意图表达是瓶颈
三周的课在说同一件事:代码在贬值,意图在升值。能把事情定义清楚的人,比能把代码写出来的人更重要。
07丨这周学完我记住了什么
关于工具:终端和 IDE 正在融合。你在 Cursor 里跟 AI 对话,本质上就是终端模式。形态不重要,交互逻辑才重要。
关于产品:好的 AI 工具 = 最自然的意图表达 + 最低摩擦 + 最快反馈。"5 minutes to WOW"。
关于管理:推新方法最有效的策略是"强制起点 + 给逃生通道"。Lloyd 的 10 分钟规则是一个可以直接抄的管理框架。
关于趋势:代码在贬值,意图在升值。对 Agent 说"怎么做"比说"要什么"效果好一个量级。
下周 Week 6 的主题是 AI Testing and Security——安全编码和 AI 测试。客座嘉宾是 Semgrep CEO Isaac Evans。下周见。
本文基于 Stanford CS146S Week 5 课程材料学习整理,所有引用标注了原始来源。
课程材料来源:
- CS146S 课程主页
— https://themodernsoftware.dev - The Coding Mandate: How Warp uses Warp to build Warp
— https://warp.dev/blog/warp-ai-coding-mandate - Start With a Prompt(First Round 深度访谈)
— https://www.firstround.com/ai/warp - Introducing Warp 2.0
— https://warp.dev/blog/reimagining-coding-agentic-development-environment - 课程 Slides(Mihail Eric, 7 Product Principles)— https://docs.google.com/presentation/d/1Djd4eBLBbRkma8rFnJAWMT0ptct_UGB8hipmoqFVkxQ/
点击关注下方账号,学习AI的路上,带你一起进步~

往期文章分享
斯坦福大学现代软件开发课程Week 1:6 种 Prompt Engineering 核心技术学习分享
斯坦福大学现代软件开发课程Week 2:拆开一个 AI Agent,看看里面到底有什么
斯坦福大学现代软件开发课程Week 3:AI 编程时代的需求文档升级指南:从 PRD 到 Spec
斯坦福大学现代软件开发课程Week 4(上):从写代码到管 Agent
斯坦福大学现代软件开发课程Week 4(下)——Claude Code 创造者的设计哲学
4个MCP、9个技能、20多条规则:一个PM是怎么把AI搭档"驯服"的
OpenClaw能帮你干什么?8个真实场景,看完你就知道该不该装
夜雨聆风