斯坦福大学现代软件开发课程Week 5:Warp CEO 的编码制度—

斯坦福大学现代软件开发课程Week 5:Warp CEO 的编码制度——每个任务必须从 Prompt 开始

跟着斯坦福 CS146S 学 AI Agent 开发，Week 5 的主题是「现代终端」——客座嘉宾 Warp CEO Zach Lloyd 不讲产品功能，讲了一件更有意思的事：他在自己公司推 AI 编程，推不动。资深工程师不愿意用。他的解法是发布一套"编码制度"，强制每个任务从 Prompt 开始。三个月后效果怎样？

上周 Week 4 学的是「Agent Manager」——怎么从写代码的人变成管 Agent 的人，Boris Cherney 讲了 Agent 的设计哲学，具体见：斯坦福大学现代软件开发课程Week 4（下）——Claude Code 创造者的设计哲学

Week 5 换了个角度：不是一个人怎么用好 AI，而是一个团队怎么用好 AI。

这周的客座嘉宾 Zach Lloyd，是 Warp 的 CEO，之前是 Google Docs 的工程负责人。Warp 做的是一个现代终端——但讲实话，Week 5 最有价值的内容不是终端产品本身，而是他在自己公司推 AI 编程的那套管理方法。

Week 4 结尾是：

Agent Manager 的核心技能不是写代码，是"把正确的事情定义清楚到机器可以执行"。

Week 5 把这句话从个人层面推到了团队层面：你自己会用 AI 不够，你得让你整个团队都会用。而最不愿意用的，恰恰是你觉得最应该用的那群人。

01丨为什么终端是 Agent 的天然栖息地

Lloyd 有一个观察：终端这个 50 年历史的老工具，反而是最适合 AI Agent 的界面形态。

原因很简单——Agent 的工作模式就是"接收文本指令 → 执行任务 → 返回文本结果"。终端天生就是这个模式。

特征	终端	IDE（如 Cursor）
信息流	时间线式，一问一答	空间式，多面板
交互	纯文本进，纯文本出	鼠标+键盘+可视化
记录	天然是日志	分散在不同文件

IDE 是为人"手写代码"设计的——你需要看文件树、需要跳转、需要语法高亮。但如果代码越来越多由 Agent 写，你还需要一个以"编辑器"为中心的界面吗？

Lloyd 的判断是：终端和 IDE 正在融合。Warp 在加代码编辑器，Cursor 在加终端功能。最终会变成一个统一的 Agent 工作台。

但对大多数人来说，你在 Cursor 的聊天框里打字让 AI 干活，本质上就是在用终端模式——只是套在 IDE 的壳里。形态不重要，交互逻辑才重要。

02丨7 条产品原则：好的 AI 工具长什么样

课程 Slides 提炼了 7 条现代 AI 开发工具的产品原则。不管你做什么产品，背后的思路都通用：

第 1 条：从用户已知的界面出发。 Cursor 选了 VS Code，Warp 选了终端，Bolt 选了聊天。没有一个成功产品让用户从零学新界面。

第 2 条：零配置有价值，深度配置有空间。 Slides 里有一个短语叫 "5 minutes to WOW"——用户从打开到发出"哇"的时间不能超过 5 分钟。但同时，高级用户能把 Rules、MCP、Prompts 配得很深。

第 3 条：自然语言是一等公民。 原话：Code is inherently a contrived representation of human intent.（代码本质上是人类意图的有损压缩。）以前你得把想法翻译成代码语法，现在你直接说人话，Agent 帮你翻译。

第 4 条：快速反馈闭环。 改一个 prompt，立刻看到效果。反馈环越短，迭代越快。

第 5 条：MCP 成为通用连接语言。 Week 3 学过了，不展开。

第 6 条：一个按键都值得优化。 "If you can shave off a single keystroke, do it." 这条看起来小，但体现了一个产品哲学——高频交互的微小摩擦，乘以使用次数后就是巨大的体验差距。Warp 为什么把 Tab 键的自动补全做到极致？因为开发者一天按几百次 Tab。

第 7 条：Agent 自主权是一个光谱。 全自动到每步确认，好的工具让用户自己选位置。这跟 Week 4 的自治光谱完全一致。

7 条串起来就一句话：好的 AI 工具不是让用户学新东西，而是让用户用最自然的方式表达意图，然后以最低摩擦、最快反馈看到结果。

03丨推不动：资深工程师为什么抵抗 AI

Lloyd 在 LinkedIn 上发了一条帖子：

"We are literally building an AI devtool at Warp and I still find it hard to get folks to change their habits."

我们自己就是做 AI 工具的，我都很难让团队改变习惯。几百条评论涌进来，很多人说自己公司也一样。

有意思的是——最先拥抱 AI 的不是工程师，是设计师和 PM。

Lloyd 说了一个例子：Warp 的一个设计师独自用 AI 完成了新版终端输入界面的开发，没有手写一行代码。

为什么？因为对非技术人员来说，AI 不是"加速"，是从"不可能"变成"可能"。设计师以前做不了开发，现在可以了。这是质变。

而对资深工程师来说，AI 只是"做得更快"——但初次使用时大概率更慢。再加上对代码质量的不信任，很多高级工程师试了一次就放弃了。

Lloyd 的反驳很犀利：

大家都在说 AI 要替代工程师。但实际上，资深工程师的经验恰恰是最好的 AI 杠杆——你知道什么是好代码，你比任何人都能更好地指导 Agent。

04丨编码制度：5 步 + 10 分钟规则

Lloyd 的解法不是劝，是定制度。他发布了一套内部文件叫 "Coding Mandate"（编码制度），每周团队会议上都会过一遍。

Step 1：每个编码任务必须从 Prompt 开始。 不是"建议"，是"必须"。你可以最终手写代码，但你的第一个动作必须是输入一段 prompt。

Step 2：如果成功了，把 prompt 分享到内部 Slack 频道。 让成功案例流动起来。

Step 3：如果 10 分钟后觉得在浪费时间，分享你的反馈。 这条是精华。Lloyd 给了一个压力释放阀——他知道不是所有任务都适合用 AI，也知道强制太死会引发抵触。

"I'm trying to balance the imperative of 'Try this new thing!' with 'I trust you as a smart person who knows what's best.'"

Step 4：试试其他工具（Cursor、Claude Code），对比报告。 这一条不多见——一个 CEO 鼓励团队用竞品。Lloyd 的逻辑是：如果你在 Warp 上做不了的事在 Cursor 上做成了，那就是我的产品问题，我要知道。

Step 5：以上都不行，手写代码。 兜底。不牺牲交付效率。

三个月后的结果：每个编程任务都从 prompt 开始了。不是每个任务都由 AI 完成，但完成率每周都在上升，目前大概在 40-50%。

05丨3 条血泪教训：用起来之后才踩的坑

团队开始用 AI 之后，Lloyd 发现了 3 个新问题。这 3 条教训比制度本身更值钱。

教训 1：不要只说"要什么"，要说"怎么做"。

"A lot of the frustration that engineers have from using these tools stems from underspecifying the problem and overspecifying an outcome."

问题描述不够具体，结果期望却很高。对比一下：

❌ "我要一个功能，用户点击按钮后能重命名标签页"

✅ "在 TabManager 模块里，给 rename 方法加一个参数，监听 Command+R 快捷键，触发时弹出 inline input，用现有的 InlineEditor 组件"

前者只说了结果——Agent 可能做出来了，但代码质量差、不符合团队规范。后者说了怎么做——Agent 有了明确的执行路线。你给 Agent 的指令越具体，它返回的结果质量越高。

教训 2：AI 写的代码不能降低质量标准。

"It is never an excuse for a bug or poor code quality to say 'AI wrote this' — AI is a tool, not a responsible party on our software team."

Lloyd 讨厌"vibe coding"这个词。他认为这个概念暗示"用 AI 写代码就不用理解代码了"——对做个人项目可以，对专业开发绝对不行。AI 生成的代码必须跟手写代码质量完全一样。

实际 code review 中最常发现的问题：Agent 写的代码跟代码库里已有的实现重复了——功能一样，写法不同。这是技术债的源头。

教训 3：盯着做比甩手做效果好得多。

Lloyd 自己踩的坑：

"I would just prompt, not really look closely at the code, let it run, see if the feature worked, and go round and round. And then I made the mistake of looking at the code and was, 'Oh my god, this is being done in a very hacky way.'"

代码跑起来了，但写得一塌糊涂。他的总结：

❌ One-shotting：给 Agent 一个大任务，跑完回来看结果

✅ Babysitting：每一步都看 Agent 在干什么，随时纠偏

"Think of it like managing a junior developer. You don't just give them free rein. You check in incrementally."

像管新员工一样管 Agent——不是甩手不管，而是频繁检查、及时纠偏。

06丨"Coding will be solved"——代码在贬值，意图在升值

Lloyd 在 Sequoia 的访谈里说了一句很大的话：Coding will be solved. 编码会被解决。未来几年，"能不能写出能跑的代码"将不再是稀缺能力。

那什么是稀缺的？人类清晰表达意图的能力。

把 Week 3 到 Week 5 串起来看：

• Week 3：Specs are the new source code（需求文档是新的源代码）

• Week 4：Agent Manager 的核心是沟通精确度

• Week 5：Coding will be solved，意图表达是瓶颈

三周的课在说同一件事：代码在贬值，意图在升值。能把事情定义清楚的人，比能把代码写出来的人更重要。

07丨这周学完我记住了什么

关于工具：终端和 IDE 正在融合。你在 Cursor 里跟 AI 对话，本质上就是终端模式。形态不重要，交互逻辑才重要。

关于产品：好的 AI 工具 = 最自然的意图表达 + 最低摩擦 + 最快反馈。"5 minutes to WOW"。

关于管理：推新方法最有效的策略是"强制起点 + 给逃生通道"。Lloyd 的 10 分钟规则是一个可以直接抄的管理框架。

关于趋势：代码在贬值，意图在升值。对 Agent 说"怎么做"比说"要什么"效果好一个量级。

下周 Week 6 的主题是 AI Testing and Security——安全编码和 AI 测试。客座嘉宾是 Semgrep CEO Isaac Evans。下周见。

本文基于 Stanford CS146S Week 5 课程材料学习整理，所有引用标注了原始来源。

课程材料来源：

CS146S 课程主页
— https://themodernsoftware.dev
The Coding Mandate: How Warp uses Warp to build Warp
— https://warp.dev/blog/warp-ai-coding-mandate
Start With a Prompt（First Round 深度访谈）
— https://www.firstround.com/ai/warp
Introducing Warp 2.0
— https://warp.dev/blog/reimagining-coding-agentic-development-environment
课程 Slides（Mihail Eric, 7 Product Principles）— https://docs.google.com/presentation/d/1Djd4eBLBbRkma8rFnJAWMT0ptct_UGB8hipmoqFVkxQ/