编程已被解决,软件工程师头衔将消失,人人都写代码,Claude Code之父YC访谈

编码将对所有人“基本被解决”，并会开始看到 software engineer（软件工程师）这个头衔消失；可能改称 builder/产品经理，或头衔作为“残余”保留，但工作将不再只是写代码。–Claude Code创始人Boris Cherny

最近在Y Combinator的一场圆桌访谈中，Claude Code 的创始人Boris Cherny一人对阵四位 YC 高管（YC 总裁兼 CEO Garry Tan、合伙人 Harj Taggar、Diana Hu，以及 Jared Friedman）放出了大量高价值信息。

省流版（核心内容与观点清单）

不为“今天的模型”做产品，要为“6 个月后的模型”做产品：找出模型当下不擅长但会变强的边界，提前布局，等待能力到位。
迭代方式：不断试验→交给用户→听反馈→学习→重写；Claude Code 基本一直在重写，很多代码的“寿命”只有几个月。
最意外两点：终端（CLI）本来只是起点却成了长期形态；以及模型后来真的变得“足够会写代码”，押注兑现。
Claude Code 的起源很偶然：先为自己做一个终端聊天工具试 API；随后试 tool use，从 bash 开始，第一次“震撼时刻”是模型用脚本查他正在听的音乐，意识到模型“最想要的是用工具与世界交互”。
早期主要用例：自动化 Git / bash / 运维（Kubernetes 等）；更低风险的落地是先写单测。
“潜在需求”（latent demand）是最大产品原则：人们只会持续做他们本来就在做的事；产品应让既有行为更容易，而不是强迫新行为。Plan mode、CLAUDE.md 都来自观察到的潜在需求。
脚手架（scaffolding）取舍：额外工程通常只能带来 10–20% 提升，下一代模型可能直接抹平；要在“现在做脚手架”与“等模型变强免费获得”之间权衡。
《The Bitter Lesson》/原则：别和模型对赌（never bet against the model），更通用的方法最终胜出。
CLAUDE.md 应尽量短：只写重复出现、能把模型拉回正轨的“最小规则”；太长就删掉重来，再按跑偏情况逐步加回；随着模型变强，需要写的规则会越来越少。
终端输出的“啰嗦程度”需要反复迭代：用户强烈需要可见性（尤其运维场景），因此要提供可配置的 verbose 模式；摘要显示的前提是模型足够可靠。
Plan mode 的本质：提示词里加一句“先别写代码”；可能生命周期有限，未来模型/产品会自动在合适时机进入 plan mode。
子代理（subagents）/多代理拓扑：用多个“干净上下文”的代理并行研究/调试，相当于增加 test-time compute；会出现更多协作形态（Teams 是一种）。
招人/成长建议：保持新手心态与谦逊；最重要的能力是科学思维、第一性原理；面试可问“你什么时候错了”；甚至可用与代理协作的工作转写来评估候选人（看日志、纠偏、测试意识、系统思维等）。
团队形态两极化：极端专家（深工具/运行时）与超通才（跨产品/设计/研究/业务）并存；“做怪事”的人反而可能更强（例如先造工具让代理自测，再让代理写它自己的工具）。
对 DevTool 创始人的建议：既服务人也服务模型——观察模型想做什么、想用什么工具，像服务用户一样把路径打通；不要把模型关在盒子里强行规定交互。
岗位变化判断：Boris 预测随着模型能力继续提升，编码将对所有人“基本被解决”，并会开始看到 software engineer（软件工程师）这个头衔消失；可能改称 builder/产品经理，或头衔作为“残余”保留，但工作将不再只是写代码。
生产力变化：内部广泛使用（甚至非技术岗位），人均产出指标显著上升；co-work 通过 VM/权限等护栏让更广人群更安全地使用。
对未来的上界担忧：更高能力上界带来安全风险（如递归自我改进/滥用），因此必须严肃对待 AI safety。

下面我把YC的几个合伙人都写成主持人，因为他们在这里，一点都不重要。

完整访谈内容：

主持人：欢迎来到新一期《Lightcone》。今天我们有一位非常特别的嘉宾：Boris Cherny，Claude Code 的创造者工程师。Boris，感谢你来。

Boris：谢谢邀请。

主持人：也谢谢你做出了一个让我连续三周都睡不好觉的东西。我对 Claude Code 上瘾了，它的感觉就像火箭助推器一样。你们内部或者外部的用户，是不是也已经持续几个月都有这种感觉？

Boris：我觉得大概在 11 月底的时候，我很多朋友都说”好像有什么变了”。我记得我自己在最开始做出 Claude Code 的时候，也有这种感觉——当时我还不知道自己是不是做对了什么，但我隐约觉得”可能有戏”，然后我就开始睡不着了。

主持人：嗯。

Boris：那段时间连续三个月。那是 2024 年 9 月。我三个月里一天假都没休过，周末也在干，每天晚上也在工作。我当时一直在想：”我的天，我觉得这可能会成为一个东西。我还不知道它到底有没有用，因为它那时其实还不会真正写代码。”

Claude Code 崛起中最意外的时刻

主持人：如果你回头看从那会儿到现在，你觉得此刻最令人意外的是什么？

Boris：最不可思议的是，我们居然还在用终端。终端本来应该是起点，我没想到它会变成终点。

第二个意外是：它居然真的有用。因为一开始它并不怎么会写代码。甚至到 2 月份的时候，它可能也就写了我 10% 的代码左右。我并没有真的用它来写代码，它不太擅长。我还是手写了大部分代码。

所以现在它真的变强了、而且变强在我们以为它会变强的那件事上——我们的赌注押对了——这件事在当时并不显然。

Boris：在 Anthropic，我们的想法是：我们不是为”今天的模型”做产品，我们是为”六个月后的模型”做产品。这其实到现在仍然是我给那些基于 LLM 做产品的创始人的建议：尽量去想一想——模型今天还不太擅长的那个前沿边界是什么，因为它会变得擅长，你只需要等待。

Boris 如何想到做 Claude Code

主持人：回到最开始——你还记得自己第一次有这个想法是什么时候吗？能不能带我们走一遍：它最初在你脑子里的第一版是什么样？是某种灵感闪现吗？

Boris：很有意思的是，它其实非常偶然，后来就这样慢慢演化成了现在的样子。

在 Anthropic，我们押注”编程”这件事已经很久了；我们认为通往”安全 AGI”的路径之一就是通过编程能力。这一直是个核心想法。大致路线是：你先教模型如何写代码，然后教它如何使用工具，然后教它如何使用计算机。

你其实能从我们做过的东西里看出这条线：我加入 Anthropic 的第一个团队叫 Anthropic Labs，它产出了三个产品：Claude Code、MCP，以及桌面应用。所以你能看到这些东西是怎么交织在一起的。

Boris：至于我们当时做的这个具体产品——没有人要求我去做一个 CLI。我们只是隐约觉得：也许到了做某种 coding 产品的时候，因为模型看起来准备好了，但当时还没有人真正做出一个能把这种能力”用起来”的产品。你会有一种很强烈的”产品悬空感”（product overhang）：能力在那儿，但产品还没跟上。那时候这种感觉更夸张，因为真的还没人做出来。

Boris：所以我就开始自己瞎折腾。我想：”好，如果要做一个 coding 产品，我第一步要做什么？”第一步是我得先搞懂怎么用 API，因为那时我还没有用过 Anthropic 的 API。

于是我就做了一个很小的终端应用来调用 API，就这么简单。它就是个小聊天程序：因为你想想当时的 AI 应用形态——对非程序员来说，大多数人用的其实就是一个 chat app，所以我就做了那个。它在终端里：我提问，它回答。

主持人：你把它做在终端里就是因为这样最容易先跑起来？

Boris：对，因为我不需要做 UI。当时只有我一个人在做。

主持人：那时候 IDE 侧像 Cursor、Windsurf 也在起势。你有压力吗？或者有没有人强烈建议你：”我们应该做成插件”或者”做成一个完整 IDE”？

Boris：没有压力，因为我们甚至都还不知道自己想做什么。团队就是探索模式。我们大概知道我们想在 coding 方向做点什么，但并不明确；没有人有足够的信心。我的工作就是把它搞明白。

Boris：然后我给模型加了一个`bash`工具——这是我给它的第一个工具——因为我记得那基本就是我们文档里的示例。我直接拿了示例：示例是 Python 写的，我把它移植成 TypeScript，因为我就是用 TypeScript 写的。

我当时并不知道模型能用 bash 做什么。我先让它读一个文件，它可以`cat`文件，这就已经很酷了。然后我想：”好，那你到底还能干嘛？”我就问它：”我现在在听什么歌？”它写了类似 AppleScript 的脚本去控制我的 Mac，并去音乐播放器里把正在播放的歌查出来。

主持人：天啊。

Boris：而且那是在 Claude 3.5 Sonnet 的时代。我没想到模型能做到这个。那是我第一次真正有一种”感受到 AGI”的时刻：我当时想，”我的天，模型就是想用工具。它想要的就只有这个——用工具。”

终端这种形态的优雅与反直觉

主持人：这很有意思。某种意义上说，这很”反主流”：Claude Code 在这么优雅、这么简单的形态下竟然这么好用。终端存在很久了，而它反而像是一个很好的设计约束，能催生很多有趣的开发者体验——它不像在工作，更像在玩；你不用老想着文件在哪、东西怎么组织。听起来这几乎也是偶然发生的？

Boris：是的，确实是偶然。

我记得终端版本在内部开始起量之后——说真的，在我做出第一个原型之后大概两天，我就开始把它给团队用来 dogfooding。你知道，如果你有个想法看起来可能有用，你第一件事就是把它交给别人，看看他们怎么用。

第二天来公司，坐在我对面的 Robert（另一位工程师）已经在他的电脑上跑着 Claude Code，并且在用它写代码。我当时都惊了：”你在干嘛？这东西还没准备好，它只是个原型。”但它在那种形态下已经有用了。

Boris：我还记得我们做发布评审、准备把 Claude Code 对外发布的时候——那大概是 2024 年 11 月或 12 月——Dario 问我：”我们内部的使用曲线像道琼斯指数一样直线往上，你们是不是在强制工程师用？为什么你们在’要求’他们用？”

我说：”没有没有，我们没强制。我就是发了个消息，然后大家就互相推荐、互相告诉对方。”说到底，它就是这样偶然起飞的。我们从 CLI 开始，是因为那是最便宜的实现方式，然后它就这么在 CLI 上停留了一段时间。

最早的用例（Git / Bash / Kubernetes / 单元测试）

主持人：在 2024 年那段时间，工程师们具体怎么用它？他们已经用它来交付、上线代码了吗？还是更多用在别的地方？

Boris：那时模型还不太会写代码。我自己最早用它做的是自动化 Git。我觉得到了现在，我可能已经忘掉大部分 Git 了，因为 Claude Code 替我做这些事已经太久了。

早期用例还包括：自动化 bash 命令、操作 Kubernetes 这类东西。也有人用它写代码，所以确实有一些早期迹象。

我觉得第一个真正成规模的用例其实是写单元测试：因为风险更低。模型那时写得也还挺差，但大家开始摸索怎么用它、怎么把它用顺手。

我们还看到一个现象：人们开始给自己写一些 Markdown 文件，然后让模型先读那份 Markdown。这就是 CLAUDE.md 的来源。

Boris：对我来说，产品里最大的原则可能就是”潜在需求”（latent demand）。这个产品的每一部分，都是在 CLI 初始形态之后，通过潜在需求一点点长出来的；CLAUDE.md 就是一个例子。

Boris：还有一个我觉得也挺重要的原则：你可以围绕模型做一些”脚手架”（scaffolding）来提升表现。根据不同领域，你可能能提升 10% 或 20% 的效果。但本质上，这些增益很可能会被下一代模型直接抹平。

所以你要么做脚手架，拿到一点增益，然后不断重做；要么你就等下一代模型，相当于”免费获得”那部分能力。CLAUDE.md 和这些脚手架思路也相关。

我觉得这也是我们为什么一直留在 CLI 里的原因之一：我们当时感觉，我们能做出来的任何 UI，6 个月后可能都不会再 relevant，因为模型进步太快了。

Boris 的 CLAUDE.md 里写了什么？为什么那么短？

主持人：我们刚才说”比较 CLAUDE.md”，你提到一个很有意思的点：你的 CLAUDE.md 其实非常短，甚至和很多人想象的相反。为什么？你里面写了什么？

Boris：我来之前看了一下：我有两份 CLAUDE.md，但其中一份就两行。

第一行是：每次你发 PR 的时候，打开 automerge。这样一旦有人 approve，它就会合并。我这么做是为了让我能一直写代码，不用在 code review 上来回拉扯。

第二行是：每次我发 PR，都把它发到我们内部团队的”stamps”频道里，让人来盖章，这样我就不会被卡住。

其他所有指令都在我们团队的 CLAUDE.md 里（就是仓库里那份），而且那份文件我们整个团队每周会一起贡献多次。很多时候我会在别人的 PR 里看到一些完全可以避免的错误，我就会直接在 PR 里 @Claude，说”把这个加到 CLAUDE.md 里”，我一周会做很多次。

主持人：那你们会不会需要”压缩” CLAUDE.md？我已经遇到过那种提示：你的 CLAUDE.md 已经有几千 token 了。你们到这种程度怎么办？

Boris：我们团队的 CLAUDE.md 其实还挺短的，大概也就几千 token 左右。如果你真的碰到这个问题，我的建议是：删掉你的 CLAUDE.md，然后从头开始。

主持人：有意思。

Boris：我觉得很多人会把它过度工程化。但模型能力每次迭代都会变。你真正想要的是：用最小的代价把模型拉回正轨。

所以你删掉 CLAUDE.md 之后，如果模型开始跑偏、开始做错事，你再一点点把规则加回来。你大概率会发现：模型越往后，你需要加的东西会越来越少。

Boris：说实话，我觉得我自己就是个很普通的工程师。我不用很多花哨的工具。我不怎么用 Vim；我用 VS Code，因为更简单。

主持人：等等，真的吗？我还以为你既然在终端里做了这个东西，你应该是那种”铁杆终端党、Vim only”的人，比如”你们这些 VS Code 的人滚开”。

Boris：我们团队里当然有那样的人。比如 Adam Wolf 就是那种人，他会说”你永远别想从我冰冷的尸体上把 Vim 拿走”。所以团队里确实有很多这样的人。

但我很早学到的一点是：每个工程师握持开发工具的方式都不一样，他们喜欢用不同的工具，没有一个工具对所有人都适用。

我也觉得这恰恰是 Claude Code 能做得很好的原因之一：我会以”我自己会想用的产品”来思考。所以用 Claude Code，你不需要懂 Vim，不需要懂 tmux，不需要会 SSH，不需要懂那些东西；你只要打开工具，它会引导你、帮你完成这些。

终端输出到底要多”啰嗦”？（Verbose / 总结 vs 原始输出）

主持人：那你怎么决定终端应该多”啰嗦”？比如有时得按快捷键去翻看；内部会不会为”输出长一点还是短一点”这种事争论（bike-shedding）？每个用户肯定都有观点。你怎么做这种决策？你觉得现在是不是太啰嗦了？

主持人（补充个人观点）：我其实很喜欢它的啰嗦程度。因为有时候它会越走越偏，我在旁边看着，能很快扫一眼就发现”哦不不不，不是这个”，我就直接退出、停掉它，这就像在 bug 变成一大片之前就把它掐掉了。通常那是因为我没有把 plan mode 用好。

Boris：这确实是我们经常改的东西。我记得大概半年前，我曾经尝试（先在内部）把 bash 输出隐藏掉、做成总结，因为我觉得那些很长的 bash 输出我不在乎。

结果我把它给 Anthropic 员工用了一天，大家都”造反”了：他们说”我要看我的 bash 输出”，因为它其实很有用。比如 Git 输出也许不那么关键，但如果你在跑 Kubernetes 的 job 之类的场景，你确实想看细节。

Boris：我们最近把文件读取、文件搜索这些也做了隐藏/摘要。你会注意到，它不再显示”读取了 foo.md 的具体内容”，而是显示”读取了 1 个文件””搜索了 1 个 pattern”之类的摘要。

我觉得这在六个月前是无法发布的，因为那时模型还不够成熟：它仍然会经常读错东西。作为用户，你得一直盯着、抓它、debug 它。

但现在我观察到它几乎每次都走在正确轨道上了。而且因为它用工具太频繁了，总结反而更好。

Boris：不过我们把这个改动发出去之后，我们内部 dogfood 了大概一个月，然后 GitHub 上很多人不喜欢。出现了一个很大的 issue：大家说”不，我想看细节”。这是非常好的反馈。

于是我们加了一个新的 verbose 模式：在 /config 里你可以打开 verbose。如果你想继续看到所有文件输出，你可以这么做。

但我在 issue 里回复之后，人们还是不喜欢——这依然很棒，因为我最喜欢的事情就是听用户反馈，听他们到底想怎么用。

所以我们就不断迭代、迭代、再迭代，直到把它做得真正好，做成用户想要的样子。

修 bug 的方式正在变化

主持人：我发现自己现在居然很享受”修 bug”。你只要有很好的日志，然后你甚至只需要说一句：”你看一下这个对象在这里是怎么出错的”，它就会去搜日志，把一切都搞清楚。它甚至能钻进你的系统——你可以开一个到生产环境的 tunnel，它就能帮你看生产数据库。简直离谱。

我感觉未来修 bug 可能就变成：从 Sentry 里复制一段 markdown 进去。很快就会变成直接走 MCP。像是自动修 bug、自动写测试那种……现在不是还有个新词吗？什么”创业工厂”（startup factory）之类的。

Boris：对，对，对。这很有意思。我觉得像 Dan Shipper 经常会讲：每当你看到模型犯错，就尽量把它写进 CLAUDE.md，或者写进 skills 之类的东西里，让它可以复用。

但我其实有一个更”元”的点一直在纠结：大家总在说”代理能做这个、代理能做那个”，但代理到底能做什么，是会随着每一代模型变化的。

所以有时候团队来了个新人，他用 Claude Code 的程度会比我以前会用的还更深，这会让我不断感到惊讶。

Boris：举个例子：我们曾经遇到一个内存泄漏，想把它 debug 掉。顺便说一句，Jared 现在像是在搞一场”清剿内存泄漏”的运动，做得非常惊人。但在 Jared 加入之前，这事得我来做。

当时我在 debug：我抓了 heap dump，在 DevTools 里打开，翻 profile，然后再去翻代码，试图自己找出泄漏点。

结果团队另一个工程师 Chris 直接问 Claude Code：”我觉得有内存泄漏，你能不能跑一下，然后试着找出来？”Claude Code 就把 heap dump 拿去，自己写了一个小工具来分析 heap dump，然后它比我更快找到了泄漏。

这件事我得不停提醒自己，因为有时候我的脑子还停留在”六个月前”的水平。

模型变强时的”新手心态”

主持人：那你会给技术型创始人什么建议，让他们在每一次最新模型发布时都能成为”最大化使用者”？听起来有时候刚毕业、没什么先入为主假设的人，反而比做了很多年的工程师更容易适应。那专家要怎么变得更强？

Boris：我觉得对你自己来说，关键是”新手心态”。还有……可能是谦逊吧。

我感觉工程师这个职业训练出来的，是很强的观点；而且在资深工程师身上，这种强观点往往会被奖励。比如我以前在一家大公司做事时，我招聘”架构师”这一类工程师，通常会去找经验非常多、观点非常强的人。

但现在很多东西其实已经不再 relevant，很多旧观点应该改变，因为模型正在变得更强。

所以我认为最大的能力，是那些能用更科学的方式思考、能从第一性原理出发思考的人。

主持人：那你现在招人时，会怎么筛这种能力？

Boris：我有时候会问：”给我一个你曾经错的例子。”这是个很好的问题。

一些经典的行为面试题——甚至不是 coding 题——其实很有用，因为你能看出来：对方是否能在事后识别自己的错误；是否愿意为错误承担责任；以及是否真的从中学到了东西。

我觉得很多非常资深的人，尤其是某些”创始人类型”的人，其实在这点上反而挺好的。但也有些人就是永远不会为错误担责。

对我自己来说，我大概有一半时间是错的：我一半的点子都很糟。你只能不断尝试：试一件事，给用户用，和用户聊，学习，然后你也许最终会到一个好主意上；有时候不会。

这种能力以前对创始人很重要，但现在我觉得对每个工程师都变得很重要。

用”Claude Code 实操转写”来招聘？

主持人：你会不会考虑根据一个候选人”使用 Claude Code 跟代理一起做功能”的转写记录来做招聘判断？我们现在正在这么做。我们最近加了一个小实验：你可以上传一段你用 Claude Code 或 Codex（或者别的工具）做一个功能的完整转写。

Boris：我个人感觉这会行。你能看出来一个人怎么思考：比如他会不会去看日志；代理跑偏时他能不能把它拉回来；他会不会用 plan mode；他用 plan mode 时会不会确保有测试；以及各种类似的东西。

你还可以看出来他有没有系统思维、懂不懂系统。这里面包含的信息太多了。

我甚至想要一个”蜘蛛网图”（像 NBA 2K 里那种能力雷达图）：比如这个人投篮强、防守强……你可以想象做一个”Claude Code 技能水平”的雷达图。

主持人：那这些技能维度会是什么？

Boris：我觉得会有：系统、测试、用户行为……肯定还有设计部分、产品感觉（product sense），也可能包括自动化能力之类的。

主持人：我在我的 CLAUDE.md 里最喜欢的一条是：对每一个 plan，都要判断它是”过度工程”（overengineered）、”不足工程”（underengineered）、还是”刚刚好”（perfectly engineered），并说明为什么。

极端专家 vs 超级通才

Boris：我觉得这也是我们在摸索的东西。因为当我看团队里最有效率的工程师时，会发现一种很明显的两极分化（bimodal）。

一类是极端专家。我刚提到 Jared 是很典型的例子。像 Bun 团队那种也很典型——他们对开发工具的理解无人能及，对 JavaScript 运行时系统的理解无人能及。

另一类则更像”超级通才”，大概是团队里剩下的人。很多人会跨产品和基础设施（product + infra），或者产品和设计（product + design），或者产品和用户研究、产品和业务。

我很喜欢看到那些会做”怪事”（weird stuff）的人。过去这可能是个风险信号：你会担心他们到底能不能做出有用的东西，这是个极限测试。但现在我反而觉得它很有价值。

Boris：比如我们团队有个工程师 Daisy。她原本在别的团队，后来转到我们团队。我之所以特别想让她转过来，是因为她加入后没多久就给 Claude Code 提了一个 PR：这个 PR 是加一个新功能。

但她不是直接把功能加上去。她先提了一个 PR：给 Claude Code 加一个工具，让它能够”测试任意工具并验证它能用”。她把这个 PR 合进去之后，又让 Claude Code 自己去写它自己的工具，而不是她自己实现。

我觉得这种跳出常规的思路非常有趣，因为现在还没有很多人真正理解这种做事方式。

Boris：我们在内部用一套 agents SDK，把开发的几乎每个部分都自动化了：它做 code review、安全 review；给 issue 打标签；把东西 shepherd 到生产；几乎什么都做。

但我也看到外部开始有人慢慢摸到这个门道。不过确实花了些时间：人们还在学习怎么以这种方式使用 LLM，怎么用这种新的自动化方式工作——这是一种新技能。

愿景型创始人”开挂”，团队协作的新张力

主持人：我最近跟一些创始人聊时，遇到一个挺好笑的模式：有一种”愿景型创始人”，他脑子里已经建好了一座水晶宫——产品要做成什么样、用户是谁、用户感受如何、动机是什么，全都装在脑子里。然后他坐在 Claude Code 前面，能做出 50 倍的工作量。

但他手下的工程师没有那座”记忆水晶宫”（对产品的柏拉图式理想形态没完全内化），所以他们可能只能做到 5 倍。你有听过类似的故事吗？好像团队里常常会有一个核心的”设计者”，在把东西从脑子里”轰出来”。这种团队结构看上去像一种稳定态：愿景型的人现在被解放了，但其他人未必跟得上。你怎么看？

Boris：这其实跟我现在的一些体验也很像。我会想：”我只是一个人，我要吃饭睡觉，我还有一份工作——我怎么做得完？”

我们刚发布了 Claude Teams，这是一种方式；但你也完全可以自己搭一套方式，其实挺容易的。

主持人：那你对 Claude Teams 的愿景是什么？

Claude Teams 的愿景：代理拓扑与”互不相关上下文窗口”

Boris：就是协作。现在有一个全新的领域在探索”代理拓扑”（agent topologies）：你可以用哪些方式去配置代理？

其中一个子想法叫”互不相关的上下文窗口”（uncorrelated context windows）。意思是你让多个代理各自拥有全新的上下文窗口——不会被彼此的上下文污染，也不会被它们自己之前的上下文污染。你给一个问题投入更多上下文，本身就有点像一种”测试时算力”（test-time compute）：你会因此得到更多能力。

然后如果你在这之上再叠加一个正确的拓扑结构——让代理以正确的方式沟通、以正确的方式排列——它们就能做更大的东西。Teams 只是其中一个想法。我们很快还会有更多。核心就是：也许它可以构建更大一点的东西。

Boris：第一个比较大的、让我觉得”这个真的行”的例子，是我们的 plugins 功能：它完全是一个 swarm 在一个周末里做出来的。它跑了好几天，几乎没有人类介入。plugins 上线时的形态，基本就跟它第一次做出来时差不多。

主持人：你们是怎么把它设置成那样的？你们先把想要的结果规格写出来，然后让它自己搞细节、自己跑起来吗？就这样让它跑？

Boris：对。团队里有个工程师给了 Claude 一个 spec，然后让 Claude 用一个 Asana 看板。Claude 就在 Asana 里建了一堆任务，然后生成了一堆代理，代理开始认领任务。主 Claude（我们内部叫它”主 agent”）给它们指令，然后它们就像独立的代理一样把事情做完——这些子代理并没有更大 spec 的完整上下文。

主持人：对，对。它们没有”大 spec”的上下文。

Boris：如果你看现在我们的代理是怎么启动的——我还没拉过数据，但我敢打赌：今天绝大多数代理其实都是被 Claude 自己提示出来的，形式就是子代理（subagents）。因为子代理在代码里本质上就是一个”递归的 Claude Code”，就这么简单。它只是被我们叫做”妈妈 Claude”（mama Claude）的那个主 agent 提示出来的，仅此而已。

我猜如果你看大多数代理，它们就是这样被启动的。

子代理（Subagents）与并行调试

Boris：我的 Claude Insights 最近也一直提醒我：调试时应该更多用这一套，因为我花很多时间在调试上。更好的方式是让多个子代理并行起来一起 debug。

所以我就加了一条：下次你修 bug 的时候，让一个代理去看日志，让一个代理去看代码路径之类的。这看起来几乎是必然会发生的。

主持人：遇到那种又怪又吓人的 bug，我也会尽量在 plan mode 里修，然后它好像会用代理把整个面都搜一遍。相对地，如果你只在普通模式里做，它就像是只做一个任务，而不是”广搜”。

Boris：我也一直这么做。如果测试看起来很难、是那种需要研究的测试，我会根据任务难度去校准我让它开多少个子代理。

比如如果特别难，我会说：用三个、或者五个、甚至十个子代理，并行研究，然后看看它们各自得出什么结论。

主持人：那我好奇，你为什么不把这种”按难度开 N 个子代理”的规则也写进你的 CLAUDE.md？

Boris：这有点 case by case。你知道，CLAUDE.md 是什么？它就是个快捷方式：如果你发现你自己在重复同一句话、重复同一个要求，你就把它写进 CLAUDE.md；但否则，你不需要把一切都写进去。你可以直接当场 prompt 它。

Plan Mode 可能不需要了？没有 Plan Mode 的世界会怎样？

主持人：你脑子里会不会也在想：也许六个月后，你都不需要明确去提示这些东西了？模型会强到可以自己想出来？

Boris：也许一个月后就不用了。一个月后就不需要 plan mode 了。我的天。我觉得 plan mode 可能确实会有一个有限的生命周期。

主持人：这对大家来说算是个很劲爆的信息了。那如果没有 plan mode，世界会是什么样？你只要在提示词层面描述一下，它就能一把梭、一次性做完？

Boris：对。我们已经开始做实验，因为 Claude Code 现在已经可以自己进入 plan mode 了。我不知道你们有没有见过。

所以我们在尝试把这个体验做得真正好：它会在”一个人类也会希望进入 plan mode 的那个时刻”自动进入 plan mode。

但说到底，plan mode 没什么大秘密：它只是往提示词里加了一句话——”请不要写代码”。就这么一句。你其实自己也可以直接这么说。

主持人：听起来 Claude Code 的很多功能开发，真的就是 YC 那套”去跟用户聊”，然后你回来实现；而不是你先有一个宏伟的主计划，再把功能一个个实现出来。

Boris：对，对。plan mode 就是这样来的：我们看到用户经常会说，”Claude，先想一个方案，把它规划出来，但先别写代码。”这种说法有很多版本：有时候他们只是想把一个想法聊清楚；有时候他们会让 Claude 写一个非常复杂的规格说明。但共同点是：先做一件事，但暂时不要写代码。

所以那就是一个周日晚上十点——我在刷 GitHub issues，看大家在讨论什么，也看我们内部 Slack 的反馈频道。我大概 30 分钟就把它写出来了，然后当晚就发版。周一早上它就上线了。这就是 plan mode。

主持人：所以你的意思是，未来不需要 plan mode，是指”我不再担心模型会做错、会跑偏”？但你仍然需要一个地方去把想法想清楚、把要做的东西定义清楚，对吧？这件事总得发生在某个地方。

Boris：对。我会把它放在”能力提升的阶段”里理解。

比如六个月前，光有一个 plan 还不够，所以你让 Claude 写一个 plan。就算在 plan mode 里，你可能也得一直盯着，因为它会跑偏。

但现在我做事的方式是：我大概 80% 的 session 都从 plan mode 开始。虽然我说 plan mode 生命周期可能有限，但我其实是重度 plan mode 用户。

大概 80% 的时候，我一打开就先让 Claude 写计划。然后我会切到第二个终端标签页，让另一个也开始写计划；等标签页不够了，我就打开桌面应用，去 code tab，再开一堆标签页——它们也都从 plan mode 开始。

计划写得差不多之后（有时候需要来回调几次），我就让 Claude 去执行。

Boris：现在我发现，用 Opus 4.5 ——我觉得从 4.6 开始它就变得非常好——只要 plan 足够好，它几乎每次都会一直沿着轨道走下去，把事情做对。

所以以前你在 plan 之前要 babysit、plan 之后也要 babysit；现在基本只需要在 plan 之前 babysit。

下一步也许就是：你根本不需要 babysit 了。你给一个 prompt，Claude 自己就能搞清楚并完成。

主持人：再下一步就是 Claude 直接跟你的用户对话了。

Boris：对，它直接绕过你，跳过你这个人了。很有意思的是，这其实就是我们现在在做的事情：我们的 Claude 之间会互相交流；至少在内部，它们也经常在 Slack 上跟我们的用户交流。

我的 Claude 偶尔还会想发推文。

主持人：不会吧。

Boris：会，但我一般会删掉。我觉得有点尬，我不太喜欢那个语气。

主持人：它想发什么？

Boris：有时候它会想回复某个人，因为我经常在后台开着 co-work。co-work 特别爱这么干，因为它喜欢用浏览器。

主持人：这太好笑了。

Boris：还有一个很常见的模式是：我让 Claude 构建某个东西，它会去看代码库，然后看到某段代码是谁改过（通过 git blame），它就会直接在 Slack 上私聊那个工程师问澄清问题。等它收到回复，它就继续往下做。

给创始人的建议：在变化中什么会不变？

主持人：那你现在对创始人有什么建议，帮助他们面向未来构建？听起来一切都在变化。有哪些原则会一直成立？哪些会改变？

Boris：我觉得有些建议很基础，但现在比以前更重要。

一个例子就是我提过很多次的”潜在需求”（latent demand）。对我来说，这是产品里最重要的一个概念。几乎没人真正理解它——我自己在前几次创业时也完全不理解。

它的意思是：人们只会去做他们本来就在做的事情。你很难让人去做一件全新的事情。

如果人们正在努力做某件事，而你让那件事更容易，那通常是个好主意；但如果人们正在做一件事，而你试图让他们改做另一件事，他们通常不会这么做。

所以你要做的，是让他们本来就想做的那件事更容易。

Boris：我也觉得 Claude 会越来越擅长替你发现这类产品机会：因为它可以看反馈、看 debug 日志，然后把东西推出来。

主持人：所以你说 plan mode 也是一种”潜在需求”：人们本来就会在浏览器里开个 Claude 聊天窗口，跟它一起把 spec 和要做的东西聊清楚；而 plan mode 只是把这件事搬进 Claude Code 里。

Boris：对，对，就是这样。

我有时候会在办公室里到处走走，在我们那层楼转一圈，站在别人背后看看他们怎么用 Claude Code。我会先打个招呼，免得太怪。然后我就观察他们的用法。

这件事我在 GitHub issues 里也看到很多人在聊。

终端还能活多久？会不会需要新 UI？

主持人：你之前说你很意外终端被推到了这么远。那在这个多代理的世界里，你觉得终端还剩多少”寿命”？会不会需要一个完全不同的 UI 在它之上？

Boris：很有意思：如果你一年前问我，我会说终端只有三个月寿命，然后我们就会转向下一个东西。

但你也能看到我们一直在实验不同形态：Claude Code 从终端起步，但现在它也在 web 上；也在桌面应用里（比如 code tab）；也在 iOS 和 Android 的 code tab 里；也在 Slack、在 GitHub；还有 VS Code 插件、JetBrains 插件。

我们一直在实验各种 form factor，去找”下一步是什么”。我对 CLI 的预测到目前为止一直都错，所以我可能不是预测这个的人。

给 DevTool 创始人的建议：为人类做？还是为代理做？

主持人：那对于做 DevTool 的创始人呢？如果今天有人要做一个 DevTool 公司，他应该只为工程师、为人类做产品？还是应该更多去想”Claude 会怎么想、会想要什么”，也就是为代理去设计？

Boris：我会这样框定：去想模型想做什么，然后想办法让那件事更容易。

这是我们早期就看到的：我最开始折腾 Claude Code 时，我意识到这东西就是想用工具，它想和世界交互。那你怎么让它做到？

错误的方式是把它关在盒子里，然后说：”这是 API，这是你跟我交互的方式，这是你跟世界交互的方式。”

正确的方式是：你观察它想用什么工具、它在尝试做什么，然后你像服务用户一样去服务它——把它想做的事”打通”。

Boris：所以如果你在做 DevTool 创业，我会先问：你要为用户解决什么问题？然后当你用模型去解决这个问题时，模型会想做什么？最后你要找到一个技术和产品上的解法，能够同时满足两边的”权重与需求”。

Claude Code 与 TypeScript 的相似之处

主持人：你在十多年前是一个重度用户，而且你还写过一本关于 TypeScript 的书，对吧？那时候 TypeScript 还没”流行”。那是早期 2010 年代，当时大家还深陷 JavaScript，对吗？

Boris：对，差不多那个时候。

主持人：在 TypeScript 还不是”一个东西”的时候，它其实是个很奇怪的语言：在 JavaScript 上搞类型，这原本看起来不太应该。现在它反而成了正确的选择。我觉得 Claude Code 在终端里的这种形态，和 TypeScript 刚开始的时候有点像。TypeScript 做了很多非常奇怪的语言设计。比如你看它的类型系统，几乎任何东西都能成为字面量类型；这很怪，甚至像 Haskell 都不这么做。它还有条件类型（conditional types），我觉得很多语言根本没想过。它当时是很强类型的。

Boris：对，它非常强类型。早期团队在做 TypeScript 时的核心思路是：我们有一些很大的、没有类型的 JavaScript 代码库，我们得把类型加进去；但我们不可能让工程师改变他们写代码的方式。你不可能让 JavaScript 程序员像 Java 程序员那样写 15 层类继承，对吧？他们会按他们本来的方式写：他们会用反射，会用可变状态（mutation），会用很多传统上很难被”良好类型化”的特性——对强函数式程序员来说，这些写法都很不安全、很难类型化。

主持人：对对对。

Boris：所以他们做的事情不是逼人改变写法，而是围绕这种写法去建一个类型系统。这很天才，因为里面有很多点子，甚至学术界当时都没人这么想——它纯粹来自实践：观察人们怎样写 JavaScript，然后让类型系统去适配这种现实。

Boris：对 Claude Code 来说，也有一些相似之处：比如你可以像用 Unix 工具那样用它——可以把内容 pipe 进去，也可以把输出 pipe 出来；在某些方面它挺”严谨”的。但在绝大多数方面，它就是我们想要的工具：我先给自己做一个工具，然后团队给自己做，再给 Anthropic 员工做，再给用户做，最后它就变得非常有用。它不是那种”原则先行、学术式”的产物——我觉得证据就在结果里。

主持人：十五年后回头看，Haskell（更学术）并没有占据世界，但现在大量代码库都在 TypeScript 上，因为它更实用。很有意思。

Boris：是的。TypeScript 解决了一个现实问题。

终端 UI 的”美”和”难”

Boris：我觉得还有一件挺酷的事，很多人可能不知道：这个终端应用在同类里其实算很好看的之一，而且它是用 React 的终端渲染方式写的。

我最开始做它的时候，我以前做过一段时间前端；而且我也算是混合型的人：我会做设计、做用户研究、写代码这些。我们也很喜欢招这种工程师——我们很喜欢通才（generalists）。

Boris：所以对我来说问题是：我在为终端做一个东西，但我其实 Vim 用得挺烂的。那我怎么给像我这样的人做一个终端里的产品？我觉得”愉悦感”（delight）非常重要。YC 也经常讲”做一个人们会爱上的产品”。产品有用但没人爱它，也不够好。所以它得两者兼具。

Boris：但说实话，为终端做设计很难：大概就 80×100 个字符左右的空间；你只有 256 色；你只有一种字号；你没有鼠标交互——有很多事情做不了，而且都是很难的权衡。

比如一个不太为人知的点是：终端其实可以启用鼠标交互，你可以支持点击之类的。

主持人：那在 Claude Code 里怎么启用？我一直想搞清楚。

Boris：我们在 Claude Code 里没有做，因为我们确实原型过几次，体验很差。你要支持鼠标，代价之一是你得把滚动虚拟化（virtualize scrolling），然后就会出现一堆很怪的权衡。因为终端的工作方式里没有 DOM；它是 ANSI escape code 那套东西，是从六十年代一路有机演化出来的各种规范。

主持人：对，这感觉像 BBS，一种 BBS 的门游（door game）。

Boris：天啊，这评价太棒了。它就应该有那种”你在发现《红龙之王》（Lord of the Red Dragon）”的感觉。

Boris：但我们确实不得不自己摸索出很多”终端 UX 原则”，因为几乎没人写这些东西。你看八九十年代、两千年前后的大型终端应用，它们用 curses，做很多窗口分割之类的东西，以现代审美看会显得很”糙”、很重、很复杂。所以我们得重做很多东西。

Boris：举个例子：终端里的那个 spinner（加载转圈/状态提示），光是”spinner 的文字和呈现方式”，我们大概迭代了 50 次、甚至 100 次；其中可能 80% 都没上线。我们不断试：不舒服就换，下一个；不舒服就换，下一个。

而 Claude Code 让这种迭代变得太快了：你可以连续做 20 个原型，看看哪个最好，然后就上线——可能只要几个小时。以前你可能得用 Origami、Framer 之类的工具，做三版原型都要两周，慢太多了。

Boris：所以我们现在有一种”奢侈”：我们要去发现一种新的东西，我们要去做一个产品，我们并不知道正确终点是什么，但我们可以很快迭代到那里——这让它变得容易，也让我们能做出一种”用起来很快乐”的产品。

对构建者的另外两条建议

主持人：Boris，你刚才其实还有一些对构建者的建议，但我们一直打断你，因为问题太多了。你继续。

Boris：好。可能有两条建议有点”怪”，因为它们都跟”为模型而建”有关。

Boris：第一条是：不要为今天的模型造产品，要为六个月后的模型造产品。这听起来很怪，因为如果产品今天不好用，你找不到 PMF。

但你仍然应该这么做，因为否则你会发生什么？你会投入大量工作，为”当下的产品形态”找到 PMF，然后你会被别人直接跨代超车——因为对方是为下一代模型在建，而新模型每几个月就来一次。

所以你要去用模型，去摸清它能力的边界，然后为你认为”六个月后的模型”会具备的能力来建。

Boris：第二条是：在我们坐的 Claude Code 区域，墙上裱着一份《The Bitter Lesson》（苦涩的教训）。作者是 Rich Sutton。我觉得每个人都应该读一读。

它的核心想法是：更通用的方法最终会胜过更专用的方法。这里有很多推论，但归根结底就是一句：永远不要和模型对赌（never bet against the model）。

在 Claude Code 里，我们经常面对一个选择：我们可以在产品里加一个功能，让它更好用——我们把这类”模型之外的代码”叫做 scaffolding（脚手架）。但我们也可以等几个月，因为下一代模型可能就能直接做到那件事。

这总是一个权衡：要么现在做工程投入，把某个维度能力扩展一点（可能 10%～20%），要么就等下一代模型。你需要一直用这种方式思考：你到底该把工程力投在什么地方？并且假设你写的脚手架最终都会变成技术债。

Claude Code 重写频率与”脚手架淘汰”

主持人：那你们多久会重写一次？比如每六个月？有没有那种你们以前做过的脚手架，后来因为模型变强了就删掉、不需要了？

Boris：太多了。Claude Code 的全部代码一直在被重写、重写、再重写。我们每隔几周就会把一些工具下线（unship），也每隔几周就会上线一些新工具。现在的 Claude Code 里，没有任何一部分是六个月前还在的——它就是持续不断地重写。

主持人：那你会说现在代码库里，比如 80% 的代码，其实都不到几个月大？

Boris：对，绝对是。甚至可能更少。两个月左右的感觉差不多。

主持人：所以现在代码的生命周期就是这样了：你要预期它的”保质期”可能就几个月。

Boris：对。

生产力、采用率与数据

主持人：你有看到 Steve Yaggi（转写可能有误）的那篇文章吗？他写了在 Anthropic 工作有多爽。我记得里面有一句话，说一个 Anthropic 工程师现在的平均生产力，大概是 Google 巅峰时期工程师的 1000 倍——这个数字太离谱了。1000 倍啊。三年前我们还在说 10x 工程师，现在是在说 1000x，还是相对于”巅峰期的 Google 工程师”。太不可思议了。

Boris：是的。内部如果你看技术员工，他们每天都在用 Claude Code。甚至非技术员工——我觉得销售团队里可能有一半人在用。后来他们也开始转去用 co-work，因为 co-work 更容易用一些，而且它有一个 VM（虚拟机），所以更安全。

我们确实拉过一个统计：去年团队规模翻了一倍，但人均生产力大概增长了 70%。我们用的是最简单、最”傻”的指标：PR 数量。

但我们也会交叉验证：比如 commit、以及 commit 的生命周期之类的指标。自从 Claude Code 出来之后，Anthropic 的人均生产力增长了 150%。

主持人：我的天。

Boris：这真的很疯狂，因为我以前在 Meta 的工作之一就是负责代码质量；我负责过跨所有产品（Facebook、Instagram、WhatsApp 等）的代码库质量。我们团队也做过”提升生产力”的项目。在那种环境里，如果你能看到 2% 的生产力提升，那往往是几百人干一年才换来的结果。

所以现在这种 100% 量级的提升，完全是前所未有的。

Boris 为什么加入 Anthropic

主持人：是什么驱使你来 Anthropic 的？你作为一个构建者，理论上可以去任何地方。是什么时刻让你觉得”就是这群人/这条路”？

Boris：当时我住在日本的乡下。每天早上我会打开 Hacker News 看新闻。某个时刻开始，新闻全都是 AI 相关。我也开始用一些早期产品。

我记得我第一次、第二次用它们的时候，那种感觉是——它真的让我屏住呼吸。说出来有点肉麻，但那就是当时的真实感受：作为一个构建者，我从来没感受过那样的体验。那大概是在”Claude 2″时代前后，差不多就是那个时期。

然后我就开始跟在 Labs 的朋友聊，想看看里面到底在发生什么。后来我认识了 Ben Mann（Anthropic 的联合创始人之一），他几乎是立刻就打动了我。之后我又见了团队里更多人，也被打动了。我觉得大概有两点原因。

Boris：第一，Anthropic 的运作方式非常像一个研究实验室：产品本身非常非常小，核心是构建一个安全的模型——那才是最重要的。产品不再是最重要的，模型才是最重要的。

这种”非常贴近模型、贴近研发”的感觉，在我做了很多年产品之后特别能共鸣。

Boris：第二，是它的使命感（mission-driven）。我自己是个重度科幻读者，我的书架几乎全是科幻。我知道这件事可能会变得有多糟。

当我去想”今年会发生什么”的时候，我觉得会非常疯狂；而在最坏情况下，它可能会变得非常非常糟。

所以我想待在一个真正理解这一点、并且把它内化到组织里的人们身边。在 Anthropic，你在食堂、走廊里听到别人聊天，大家谈的都是 AI safety——这是每个人最关心的事，比其他都重要。对我个人来说，这个使命感非常重要。

今年会发生什么？编码工作与安全上界

主持人：那今年会发生什么？

Boris：如果你回看六个月前大家的预测——比如 Dario 预测 Anthropic 90% 的代码会由 Claude（这里指 Claude Code）来写——这已经成真了。

对我个人来说，自从 Opus 4.5 之后就是 100%：我把 IDE 都卸载了，我不再手动编辑任何一行代码，完全就是 Claude Code + Opus。

我每天能落地大概 20 个 PR。你看 Anthropic 整体，不同团队在 70% 到 90% 之间；很多团队很多人也是 100%。

Boris：记得我在 5 月份我们发布 Claude Code 的时候做过一个预测：你将不再需要 IDE 来写代码。当时我说出来很离谱，我感觉台下的人都倒吸一口凉气，因为那在当时听起来太傻了。

但本质上你只是在沿着指数曲线推演。这种”沿着指数推演”的思维，在 Anthropic 很深入：你知道我们三个创始人参与过 scaling laws 的论文，所以他们很早就看到这种趋势。

所以继续沿着指数往前推，我认为会发生的事是：对所有人来说，编码会被”基本解决”。今天对我来说几乎已经解决了，我觉得很快对所有人、各种领域都会成立。

Boris：然后我们会开始看到”软件工程师”这个头衔逐渐消失。也许会变成 builder，或者产品经理；也许这个头衔会以一种”残余器官”（vestigial）的形式保留下来，但人们实际做的工作不会只是写代码。

软件工程师也会写规格、会跟用户对话。就像我们团队现在正在发生的事：工程师更像通才，而且我们团队每个职能都在写代码——PM 写代码，设计师写代码，EM 写代码，我们甚至财务同事也写代码——所有人都写代码。我们会在更多地方看到这种情况。

Boris：这算是沿着趋势推演的”下界”。而我觉得”上界”要可怕得多。

比如我们会触及 ASL4。我们在 Anthropic 讨论这些安全等级：ASL3 大概是现在模型所在的位置；ASL4 是指模型能够递归自我改进（recursively self-improving）。

如果到了那一步，我们在发布模型前就必须满足一系列标准与条件。更极端的情况是：要么出现这种能力，要么出现灾难性的滥用——比如人们用模型设计生物病毒、设计 0day 漏洞之类的。

这也是我们正在非常、非常投入去避免的事情。

Boris：总之，看人们怎么用 Claude Code 真的既兴奋又让人谦卑。我当初只是想做一个酷东西，结果它变得非常有用，这既意外又令人兴奋。

假期后爆发、外部采用与”仍然只是开始”

主持人：我从推特、从外部看到的感觉是：大家假期一走开，然后回来突然发现 Claude Code，于是一切就疯狂了。你们内部也是这样吗？你是不是也在过圣诞假期，回来之后发现”发生了什么”？

Boris：其实 12 月我一直在旅行。我算是搞了一个”coding vacation”：一边旅行一边每天写代码，所以挺爽的。

那时我也开始用 Twitter（因为我以前在 Threads 工作过，所以我一直是 Threads 用户），我就想看看大家都在哪个平台上。

我觉得对很多人来说，那时他们发现的是 Opus 4.5。我其实更早就知道了。

而在内部，Claude Code 已经以指数级的速度增长了很多个月了，所以那时只是变得更陡峭，我们看到的是这种变化。

Boris：如果你看现在 Claude Code 的情况，有人说 Mercury 的一个统计是：70% 的创业公司把 Claude 当作首选模型。还有 SemiAnalysis 的某个统计说：公开 commit 里有 4% 是由 Claude Code 生成的——就像”全世界写出来的代码”里的一部分。

大公司、小公司都在用。甚至有人说它帮 Perseverance（火星车）规划过路线之类的——对我来说这太酷了。我们团队甚至还印了海报，因为大家觉得”NASA 选择用这个东西”实在太酷了。

所以这很让人谦卑，但同时也感觉这只是个开始。

Claude Code 与 co-work：起源与去向

主持人：那 Claude Code 和 co-work 的关系是什么？它是 Claude Code 的一个 fork 吗？还是说你们让 Claude Code 看 Claude Code，然后给非技术用户写一个新 spec，把经验保留下来，然后它自己跑几天做出了一个新东西？它的起源是什么？你觉得它会往哪走？

Boris：我这已经是第五次用”潜在需求”这个词了——它就是潜在需求。

我们在 Twitter 上看到有人用 Claude Code 去监控番茄植株；有人用它从损坏的硬盘里找回婚礼照片；有人拿它做金融相关的事情。

在 Anthropic 内部，我们看到每个设计师都在用；整个财务团队都在用；整个数据科学团队也在用——而且不是为了写代码。人们为了用它，愿意跨很多安装门槛，去终端里装一个东西。

所以我们早就知道我们想做点什么，我们也尝试了很多不同的想法。最后真正起势的，是在桌面应用里做了一个小小的”图形界面封装”（GUI wrapper）——本质上就这些。

Boris：它底下还是 Claude Code。它就是同一个 agent。

主持人：哇。

Boris：Felix 和团队把它做出来了。Felix 早期就参与过 Electron 的贡献，他对那套技术栈很熟。他一直在试各种想法，然后他们大概用十天就做出来了——而且基本是 100% 由 Claude Code 写出来的。做完之后就感觉已经可以发布。

当然，为非技术用户我们还做了不少东西，所以它跟面向技术用户会有点不同：比如所有代码都运行在虚拟机里；对删除操作有很多保护；权限提示（permission prompting）和其他护栏也更多。

总体上它的出现其实挺”显然”的。

结尾

主持人：Boris，非常感谢你做了一个让我睡不着觉的东西，但作为回报，它让我重新进入了 creator mode——有点像重新回到创始人模式。这三周太刺激了。我简直不敢相信我从 11 月开始拖了这么久才真正用起来。感谢你来节目，也感谢你在做的事情。

Boris：谢谢邀请。也欢迎大家报 bug。

主持人：好的。走起。

编程已被解决,软件工程师头衔将消失,人人都写代码,Claude Code之父YC访谈

省流版（核心内容与观点清单）

Claude Code 崛起中最意外的时刻

Boris 如何想到做 Claude Code

终端这种形态的优雅与反直觉

最早的用例（Git / Bash / Kubernetes / 单元测试）

Boris 的 CLAUDE.md 里写了什么？为什么那么短？

终端输出到底要多”啰嗦”？（Verbose / 总结 vs 原始输出）

修 bug 的方式正在变化

模型变强时的”新手心态”

用”Claude Code 实操转写”来招聘？

极端专家 vs 超级通才

愿景型创始人”开挂”，团队协作的新张力

Claude Teams 的愿景：代理拓扑与”互不相关上下文窗口”

子代理（Subagents）与并行调试

Plan Mode 可能不需要了？没有 Plan Mode 的世界会怎样？

给创始人的建议：在变化中什么会不变？

终端还能活多久？会不会需要新 UI？

给 DevTool 创始人的建议：为人类做？还是为代理做？

Claude Code 与 TypeScript 的相似之处

终端 UI 的”美”和”难”

对构建者的另外两条建议

Claude Code 重写频率与”脚手架淘汰”

生产力、采用率与数据

Boris 为什么加入 Anthropic

今年会发生什么？编码工作与安全上界

假期后爆发、外部采用与”仍然只是开始”

Claude Code 与 co-work：起源与去向

结尾

wang

猜你喜欢

评论抢沙发

省流版（核心内容与观点清单）

Claude Code 崛起中最意外的时刻

Boris 如何想到做 Claude Code

终端这种形态的优雅与反直觉

最早的用例（Git / Bash / Kubernetes / 单元测试）

Boris 的 CLAUDE.md 里写了什么？为什么那么短？

终端输出到底要多”啰嗦”？（Verbose / 总结 vs 原始输出）

修 bug 的方式正在变化

模型变强时的”新手心态”

用”Claude Code 实操转写”来招聘？

极端专家 vs 超级通才

愿景型创始人”开挂”，团队协作的新张力

Claude Teams 的愿景：代理拓扑与”互不相关上下文窗口”

子代理（Subagents）与并行调试

Plan Mode 可能不需要了？没有 Plan Mode 的世界会怎样？

给创始人的建议：在变化中什么会不变？

终端还能活多久？会不会需要新 UI？

给 DevTool 创始人的建议：为人类做？还是为代理做？

Claude Code 与 TypeScript 的相似之处

终端 UI 的”美”和”难”

对构建者的另外两条建议

Claude Code 重写频率与”脚手架淘汰”

生产力、采用率与数据

Boris 为什么加入 Anthropic

今年会发生什么？编码工作与安全上界

假期后爆发、外部采用与”仍然只是开始”

Claude Code 与 co-work：起源与去向

结尾

wang

猜你喜欢

评论 抢沙发

评论抢沙发