乐于分享
好东西不私藏

编程已被解决,软件工程师头衔将消失,人人都写代码,Claude Code之父YC访谈

编程已被解决,软件工程师头衔将消失,人人都写代码,Claude Code之父YC访谈

编码将对所有人“基本被解决”,并会开始看到 software engineer(软件工程师)这个头衔消失;可能改称 builder/产品经理,或头衔作为“残余”保留,但工作将不再只是写代码。–Claude Code创始人Boris Cherny
最近在Y Combinator的一场圆桌访谈中,Claude Code 的创始人Boris Cherny一人对阵四位 YC 高管(YC 总裁兼 CEO Garry Tan、合伙人 Harj Taggar、Diana Hu,以及 Jared Friedman)放出了大量高价值信息。

省流版(核心内容与观点清单)

  1. 不为“今天的模型”做产品,要为“6 个月后的模型”做产品:找出模型当下不擅长但会变强的边界,提前布局,等待能力到位。
  2. 迭代方式:不断试验→交给用户→听反馈→学习→重写;Claude Code 基本一直在重写,很多代码的“寿命”只有几个月。
  3. 最意外两点:终端(CLI)本来只是起点却成了长期形态;以及模型后来真的变得“足够会写代码”,押注兑现。
  4. Claude Code 的起源很偶然:先为自己做一个终端聊天工具试 API;随后试 tool use,从 bash 开始,第一次“震撼时刻”是模型用脚本查他正在听的音乐,意识到模型“最想要的是用工具与世界交互”。
  5. 早期主要用例:自动化 Git / bash / 运维(Kubernetes 等);更低风险的落地是先写单测。
  6. “潜在需求”(latent demand)是最大产品原则:人们只会持续做他们本来就在做的事;产品应让既有行为更容易,而不是强迫新行为。Plan mode、CLAUDE.md 都来自观察到的潜在需求。
  7. 脚手架(scaffolding)取舍:额外工程通常只能带来 10–20% 提升,下一代模型可能直接抹平;要在“现在做脚手架”与“等模型变强免费获得”之间权衡。
  8. 《The Bitter Lesson》/原则:别和模型对赌(never bet against the model),更通用的方法最终胜出。
  9. CLAUDE.md 应尽量短:只写重复出现、能把模型拉回正轨的“最小规则”;太长就删掉重来,再按跑偏情况逐步加回;随着模型变强,需要写的规则会越来越少。
  10. 终端输出的“啰嗦程度”需要反复迭代:用户强烈需要可见性(尤其运维场景),因此要提供可配置的 verbose 模式;摘要显示的前提是模型足够可靠。
  11. Plan mode 的本质:提示词里加一句“先别写代码”;可能生命周期有限,未来模型/产品会自动在合适时机进入 plan mode。
  12. 子代理(subagents)/多代理拓扑:用多个“干净上下文”的代理并行研究/调试,相当于增加 test-time compute;会出现更多协作形态(Teams 是一种)。
  13. 招人/成长建议:保持新手心态与谦逊;最重要的能力是科学思维、第一性原理;面试可问“你什么时候错了”;甚至可用与代理协作的工作转写来评估候选人(看日志、纠偏、测试意识、系统思维等)。
  14. 团队形态两极化:极端专家(深工具/运行时)与超通才(跨产品/设计/研究/业务)并存;“做怪事”的人反而可能更强(例如先造工具让代理自测,再让代理写它自己的工具)。
  15. 对 DevTool 创始人的建议:既服务人也服务模型——观察模型想做什么、想用什么工具,像服务用户一样把路径打通;不要把模型关在盒子里强行规定交互。
  16. 岗位变化判断:Boris 预测随着模型能力继续提升,编码将对所有人“基本被解决”,并会开始看到 software engineer(软件工程师)这个头衔消失;可能改称 builder/产品经理,或头衔作为“残余”保留,但工作将不再只是写代码。
  17. 生产力变化:内部广泛使用(甚至非技术岗位),人均产出指标显著上升;co-work 通过 VM/权限等护栏让更广人群更安全地使用。
  18. 对未来的上界担忧:更高能力上界带来安全风险(如递归自我改进/滥用),因此必须严肃对待 AI safety。
下面我把YC的几个合伙人都写成主持人,因为他们在这里,一点都不重要。
完整访谈内容:
主持人:欢迎来到新一期《Lightcone》。今天我们有一位非常特别的嘉宾:Boris Cherny,Claude Code 的创造者工程师。Boris,感谢你来。
Boris:谢谢邀请。
主持人:也谢谢你做出了一个让我连续三周都睡不好觉的东西。我对 Claude Code 上瘾了,它的感觉就像火箭助推器一样。你们内部或者外部的用户,是不是也已经持续几个月都有这种感觉?
Boris:我觉得大概在 11 月底的时候,我很多朋友都说”好像有什么变了”。我记得我自己在最开始做出 Claude Code 的时候,也有这种感觉——当时我还不知道自己是不是做对了什么,但我隐约觉得”可能有戏”,然后我就开始睡不着了。
主持人:嗯。
Boris:那段时间连续三个月。那是 2024 年 9 月。我三个月里一天假都没休过,周末也在干,每天晚上也在工作。我当时一直在想:”我的天,我觉得这可能会成为一个东西。我还不知道它到底有没有用,因为它那时其实还不会真正写代码。”

Claude Code 崛起中最意外的时刻

主持人:如果你回头看从那会儿到现在,你觉得此刻最令人意外的是什么?
Boris:最不可思议的是,我们居然还在用终端。终端本来应该是起点,我没想到它会变成终点。
第二个意外是:它居然真的有用。因为一开始它并不怎么会写代码。甚至到 2 月份的时候,它可能也就写了我 10% 的代码左右。我并没有真的用它来写代码,它不太擅长。我还是手写了大部分代码。
所以现在它真的变强了、而且变强在我们以为它会变强的那件事上——我们的赌注押对了——这件事在当时并不显然。
Boris:在 Anthropic,我们的想法是:我们不是为”今天的模型”做产品,我们是为”六个月后的模型”做产品。这其实到现在仍然是我给那些基于 LLM 做产品的创始人的建议:尽量去想一想——模型今天还不太擅长的那个前沿边界是什么,因为它会变得擅长,你只需要等待。

Boris 如何想到做 Claude Code

主持人:回到最开始——你还记得自己第一次有这个想法是什么时候吗?能不能带我们走一遍:它最初在你脑子里的第一版是什么样?是某种灵感闪现吗?
Boris:很有意思的是,它其实非常偶然,后来就这样慢慢演化成了现在的样子。
在 Anthropic,我们押注”编程”这件事已经很久了;我们认为通往”安全 AGI”的路径之一就是通过编程能力。这一直是个核心想法。大致路线是:你先教模型如何写代码,然后教它如何使用工具,然后教它如何使用计算机。
你其实能从我们做过的东西里看出这条线:我加入 Anthropic 的第一个团队叫 Anthropic Labs,它产出了三个产品:Claude Code、MCP,以及桌面应用。所以你能看到这些东西是怎么交织在一起的。
Boris:至于我们当时做的这个具体产品——没有人要求我去做一个 CLI。我们只是隐约觉得:也许到了做某种 coding 产品的时候,因为模型看起来准备好了,但当时还没有人真正做出一个能把这种能力”用起来”的产品。你会有一种很强烈的”产品悬空感”(product overhang):能力在那儿,但产品还没跟上。那时候这种感觉更夸张,因为真的还没人做出来。
Boris:所以我就开始自己瞎折腾。我想:”好,如果要做一个 coding 产品,我第一步要做什么?”第一步是我得先搞懂怎么用 API,因为那时我还没有用过 Anthropic 的 API。
于是我就做了一个很小的终端应用来调用 API,就这么简单。它就是个小聊天程序:因为你想想当时的 AI 应用形态——对非程序员来说,大多数人用的其实就是一个 chat app,所以我就做了那个。它在终端里:我提问,它回答。
主持人:你把它做在终端里就是因为这样最容易先跑起来?
Boris:对,因为我不需要做 UI。当时只有我一个人在做。
主持人:那时候 IDE 侧像 Cursor、Windsurf 也在起势。你有压力吗?或者有没有人强烈建议你:”我们应该做成插件”或者”做成一个完整 IDE”?
Boris:没有压力,因为我们甚至都还不知道自己想做什么。团队就是探索模式。我们大概知道我们想在 coding 方向做点什么,但并不明确;没有人有足够的信心。我的工作就是把它搞明白。
Boris:然后我给模型加了一个`bash`工具——这是我给它的第一个工具——因为我记得那基本就是我们文档里的示例。我直接拿了示例:示例是 Python 写的,我把它移植成 TypeScript,因为我就是用 TypeScript 写的。
我当时并不知道模型能用 bash 做什么。我先让它读一个文件,它可以`cat`文件,这就已经很酷了。然后我想:”好,那你到底还能干嘛?”我就问它:”我现在在听什么歌?”它写了类似 AppleScript 的脚本去控制我的 Mac,并去音乐播放器里把正在播放的歌查出来。
主持人:天啊。
Boris:而且那是在 Claude 3.5 Sonnet 的时代。我没想到模型能做到这个。那是我第一次真正有一种”感受到 AGI”的时刻:我当时想,”我的天,模型就是想用工具。它想要的就只有这个——用工具。”

终端这种形态的优雅与反直觉

主持人:这很有意思。某种意义上说,这很”反主流”:Claude Code 在这么优雅、这么简单的形态下竟然这么好用。终端存在很久了,而它反而像是一个很好的设计约束,能催生很多有趣的开发者体验——它不像在工作,更像在玩;你不用老想着文件在哪、东西怎么组织。听起来这几乎也是偶然发生的?
Boris:是的,确实是偶然。
我记得终端版本在内部开始起量之后——说真的,在我做出第一个原型之后大概两天,我就开始把它给团队用来 dogfooding。你知道,如果你有个想法看起来可能有用,你第一件事就是把它交给别人,看看他们怎么用。
第二天来公司,坐在我对面的 Robert(另一位工程师)已经在他的电脑上跑着 Claude Code,并且在用它写代码。我当时都惊了:”你在干嘛?这东西还没准备好,它只是个原型。”但它在那种形态下已经有用了。
Boris:我还记得我们做发布评审、准备把 Claude Code 对外发布的时候——那大概是 2024 年 11 月或 12 月——Dario 问我:”我们内部的使用曲线像道琼斯指数一样直线往上,你们是不是在强制工程师用?为什么你们在’要求’他们用?”
我说:”没有没有,我们没强制。我就是发了个消息,然后大家就互相推荐、互相告诉对方。”说到底,它就是这样偶然起飞的。我们从 CLI 开始,是因为那是最便宜的实现方式,然后它就这么在 CLI 上停留了一段时间。

最早的用例(Git / Bash / Kubernetes / 单元测试)

主持人:在 2024 年那段时间,工程师们具体怎么用它?他们已经用它来交付、上线代码了吗?还是更多用在别的地方?
Boris:那时模型还不太会写代码。我自己最早用它做的是自动化 Git。我觉得到了现在,我可能已经忘掉大部分 Git 了,因为 Claude Code 替我做这些事已经太久了。
早期用例还包括:自动化 bash 命令、操作 Kubernetes 这类东西。也有人用它写代码,所以确实有一些早期迹象。
我觉得第一个真正成规模的用例其实是写单元测试:因为风险更低。模型那时写得也还挺差,但大家开始摸索怎么用它、怎么把它用顺手。
我们还看到一个现象:人们开始给自己写一些 Markdown 文件,然后让模型先读那份 Markdown。这就是 CLAUDE.md 的来源。
Boris:对我来说,产品里最大的原则可能就是”潜在需求”(latent demand)。这个产品的每一部分,都是在 CLI 初始形态之后,通过潜在需求一点点长出来的;CLAUDE.md 就是一个例子。
Boris:还有一个我觉得也挺重要的原则:你可以围绕模型做一些”脚手架”(scaffolding)来提升表现。根据不同领域,你可能能提升 10% 或 20% 的效果。但本质上,这些增益很可能会被下一代模型直接抹平。
所以你要么做脚手架,拿到一点增益,然后不断重做;要么你就等下一代模型,相当于”免费获得”那部分能力。CLAUDE.md 和这些脚手架思路也相关。
我觉得这也是我们为什么一直留在 CLI 里的原因之一:我们当时感觉,我们能做出来的任何 UI,6 个月后可能都不会再 relevant,因为模型进步太快了。

Boris 的 CLAUDE.md 里写了什么?为什么那么短?

主持人:我们刚才说”比较 CLAUDE.md”,你提到一个很有意思的点:你的 CLAUDE.md 其实非常短,甚至和很多人想象的相反。为什么?你里面写了什么?
Boris:我来之前看了一下:我有两份 CLAUDE.md,但其中一份就两行。
第一行是:每次你发 PR 的时候,打开 automerge。这样一旦有人 approve,它就会合并。我这么做是为了让我能一直写代码,不用在 code review 上来回拉扯。
第二行是:每次我发 PR,都把它发到我们内部团队的”stamps”频道里,让人来盖章,这样我就不会被卡住。
其他所有指令都在我们团队的 CLAUDE.md 里(就是仓库里那份),而且那份文件我们整个团队每周会一起贡献多次。很多时候我会在别人的 PR 里看到一些完全可以避免的错误,我就会直接在 PR 里 @Claude,说”把这个加到 CLAUDE.md 里”,我一周会做很多次。
主持人:那你们会不会需要”压缩” CLAUDE.md?我已经遇到过那种提示:你的 CLAUDE.md 已经有几千 token 了。你们到这种程度怎么办?
Boris:我们团队的 CLAUDE.md 其实还挺短的,大概也就几千 token 左右。如果你真的碰到这个问题,我的建议是:删掉你的 CLAUDE.md,然后从头开始。
主持人:有意思。
Boris:我觉得很多人会把它过度工程化。但模型能力每次迭代都会变。你真正想要的是:用最小的代价把模型拉回正轨。
所以你删掉 CLAUDE.md 之后,如果模型开始跑偏、开始做错事,你再一点点把规则加回来。你大概率会发现:模型越往后,你需要加的东西会越来越少。
Boris:说实话,我觉得我自己就是个很普通的工程师。我不用很多花哨的工具。我不怎么用 Vim;我用 VS Code,因为更简单。
主持人:等等,真的吗?我还以为你既然在终端里做了这个东西,你应该是那种”铁杆终端党、Vim only”的人,比如”你们这些 VS Code 的人滚开”。
Boris:我们团队里当然有那样的人。比如 Adam Wolf 就是那种人,他会说”你永远别想从我冰冷的尸体上把 Vim 拿走”。所以团队里确实有很多这样的人。
但我很早学到的一点是:每个工程师握持开发工具的方式都不一样,他们喜欢用不同的工具,没有一个工具对所有人都适用。
我也觉得这恰恰是 Claude Code 能做得很好的原因之一:我会以”我自己会想用的产品”来思考。所以用 Claude Code,你不需要懂 Vim,不需要懂 tmux,不需要会 SSH,不需要懂那些东西;你只要打开工具,它会引导你、帮你完成这些。

终端输出到底要多”啰嗦”?(Verbose / 总结 vs 原始输出)

主持人:那你怎么决定终端应该多”啰嗦”?比如有时得按快捷键去翻看;内部会不会为”输出长一点还是短一点”这种事争论(bike-shedding)?每个用户肯定都有观点。你怎么做这种决策?你觉得现在是不是太啰嗦了?
主持人(补充个人观点):我其实很喜欢它的啰嗦程度。因为有时候它会越走越偏,我在旁边看着,能很快扫一眼就发现”哦不不不,不是这个”,我就直接退出、停掉它,这就像在 bug 变成一大片之前就把它掐掉了。通常那是因为我没有把 plan mode 用好。
Boris:这确实是我们经常改的东西。我记得大概半年前,我曾经尝试(先在内部)把 bash 输出隐藏掉、做成总结,因为我觉得那些很长的 bash 输出我不在乎。
结果我把它给 Anthropic 员工用了一天,大家都”造反”了:他们说”我要看我的 bash 输出”,因为它其实很有用。比如 Git 输出也许不那么关键,但如果你在跑 Kubernetes 的 job 之类的场景,你确实想看细节。
Boris:我们最近把文件读取、文件搜索这些也做了隐藏/摘要。你会注意到,它不再显示”读取了 foo.md 的具体内容”,而是显示”读取了 1 个文件””搜索了 1 个 pattern”之类的摘要。
我觉得这在六个月前是无法发布的,因为那时模型还不够成熟:它仍然会经常读错东西。作为用户,你得一直盯着、抓它、debug 它。
但现在我观察到它几乎每次都走在正确轨道上了。而且因为它用工具太频繁了,总结反而更好。
Boris:不过我们把这个改动发出去之后,我们内部 dogfood 了大概一个月,然后 GitHub 上很多人不喜欢。出现了一个很大的 issue:大家说”不,我想看细节”。这是非常好的反馈。
于是我们加了一个新的 verbose 模式:在 /config 里你可以打开 verbose。如果你想继续看到所有文件输出,你可以这么做。
但我在 issue 里回复之后,人们还是不喜欢——这依然很棒,因为我最喜欢的事情就是听用户反馈,听他们到底想怎么用。
所以我们就不断迭代、迭代、再迭代,直到把它做得真正好,做成用户想要的样子。

修 bug 的方式正在变化

主持人:我发现自己现在居然很享受”修 bug”。你只要有很好的日志,然后你甚至只需要说一句:”你看一下这个对象在这里是怎么出错的”,它就会去搜日志,把一切都搞清楚。它甚至能钻进你的系统——你可以开一个到生产环境的 tunnel,它就能帮你看生产数据库。简直离谱。
我感觉未来修 bug 可能就变成:从 Sentry 里复制一段 markdown 进去。很快就会变成直接走 MCP。像是自动修 bug、自动写测试那种……现在不是还有个新词吗?什么”创业工厂”(startup factory)之类的。
Boris:对,对,对。这很有意思。我觉得像 Dan Shipper 经常会讲:每当你看到模型犯错,就尽量把它写进 CLAUDE.md,或者写进 skills 之类的东西里,让它可以复用。
但我其实有一个更”元”的点一直在纠结:大家总在说”代理能做这个、代理能做那个”,但代理到底能做什么,是会随着每一代模型变化的。
所以有时候团队来了个新人,他用 Claude Code 的程度会比我以前会用的还更深,这会让我不断感到惊讶。
Boris:举个例子:我们曾经遇到一个内存泄漏,想把它 debug 掉。顺便说一句,Jared 现在像是在搞一场”清剿内存泄漏”的运动,做得非常惊人。但在 Jared 加入之前,这事得我来做。
当时我在 debug:我抓了 heap dump,在 DevTools 里打开,翻 profile,然后再去翻代码,试图自己找出泄漏点。
结果团队另一个工程师 Chris 直接问 Claude Code:”我觉得有内存泄漏,你能不能跑一下,然后试着找出来?”Claude Code 就把 heap dump 拿去,自己写了一个小工具来分析 heap dump,然后它比我更快找到了泄漏。
这件事我得不停提醒自己,因为有时候我的脑子还停留在”六个月前”的水平。

模型变强时的”新手心态”

主持人:那你会给技术型创始人什么建议,让他们在每一次最新模型发布时都能成为”最大化使用者”?听起来有时候刚毕业、没什么先入为主假设的人,反而比做了很多年的工程师更容易适应。那专家要怎么变得更强?
Boris:我觉得对你自己来说,关键是”新手心态”。还有……可能是谦逊吧。
我感觉工程师这个职业训练出来的,是很强的观点;而且在资深工程师身上,这种强观点往往会被奖励。比如我以前在一家大公司做事时,我招聘”架构师”这一类工程师,通常会去找经验非常多、观点非常强的人。
但现在很多东西其实已经不再 relevant,很多旧观点应该改变,因为模型正在变得更强。
所以我认为最大的能力,是那些能用更科学的方式思考、能从第一性原理出发思考的人。
主持人:那你现在招人时,会怎么筛这种能力?
Boris:我有时候会问:”给我一个你曾经错的例子。”这是个很好的问题。
一些经典的行为面试题——甚至不是 coding 题——其实很有用,因为你能看出来:对方是否能在事后识别自己的错误;是否愿意为错误承担责任;以及是否真的从中学到了东西。
我觉得很多非常资深的人,尤其是某些”创始人类型”的人,其实在这点上反而挺好的。但也有些人就是永远不会为错误担责。
对我自己来说,我大概有一半时间是错的:我一半的点子都很糟。你只能不断尝试:试一件事,给用户用,和用户聊,学习,然后你也许最终会到一个好主意上;有时候不会。
这种能力以前对创始人很重要,但现在我觉得对每个工程师都变得很重要。

用”Claude Code 实操转写”来招聘?

主持人:你会不会考虑根据一个候选人”使用 Claude Code 跟代理一起做功能”的转写记录来做招聘判断?我们现在正在这么做。我们最近加了一个小实验:你可以上传一段你用 Claude Code 或 Codex(或者别的工具)做一个功能的完整转写。
Boris:我个人感觉这会行。你能看出来一个人怎么思考:比如他会不会去看日志;代理跑偏时他能不能把它拉回来;他会不会用 plan mode;他用 plan mode 时会不会确保有测试;以及各种类似的东西。
你还可以看出来他有没有系统思维、懂不懂系统。这里面包含的信息太多了。
我甚至想要一个”蜘蛛网图”(像 NBA 2K 里那种能力雷达图):比如这个人投篮强、防守强……你可以想象做一个”Claude Code 技能水平”的雷达图。
主持人:那这些技能维度会是什么?
Boris:我觉得会有:系统、测试、用户行为……肯定还有设计部分、产品感觉(product sense),也可能包括自动化能力之类的。
主持人:我在我的 CLAUDE.md 里最喜欢的一条是:对每一个 plan,都要判断它是”过度工程”(overengineered)、”不足工程”(underengineered)、还是”刚刚好”(perfectly engineered),并说明为什么。

极端专家 vs 超级通才

Boris:我觉得这也是我们在摸索的东西。因为当我看团队里最有效率的工程师时,会发现一种很明显的两极分化(bimodal)。
一类是极端专家。我刚提到 Jared 是很典型的例子。像 Bun 团队那种也很典型——他们对开发工具的理解无人能及,对 JavaScript 运行时系统的理解无人能及。
另一类则更像”超级通才”,大概是团队里剩下的人。很多人会跨产品和基础设施(product + infra),或者产品和设计(product + design),或者产品和用户研究、产品和业务。
我很喜欢看到那些会做”怪事”(weird stuff)的人。过去这可能是个风险信号:你会担心他们到底能不能做出有用的东西,这是个极限测试。但现在我反而觉得它很有价值。
Boris:比如我们团队有个工程师 Daisy。她原本在别的团队,后来转到我们团队。我之所以特别想让她转过来,是因为她加入后没多久就给 Claude Code 提了一个 PR:这个 PR 是加一个新功能。
但她不是直接把功能加上去。她先提了一个 PR:给 Claude Code 加一个工具,让它能够”测试任意工具并验证它能用”。她把这个 PR 合进去之后,又让 Claude Code 自己去写它自己的工具,而不是她自己实现。
我觉得这种跳出常规的思路非常有趣,因为现在还没有很多人真正理解这种做事方式。
Boris:我们在内部用一套 agents SDK,把开发的几乎每个部分都自动化了:它做 code review、安全 review;给 issue 打标签;把东西 shepherd 到生产;几乎什么都做。
但我也看到外部开始有人慢慢摸到这个门道。不过确实花了些时间:人们还在学习怎么以这种方式使用 LLM,怎么用这种新的自动化方式工作——这是一种新技能。

愿景型创始人”开挂”,团队协作的新张力

主持人:我最近跟一些创始人聊时,遇到一个挺好笑的模式:有一种”愿景型创始人”,他脑子里已经建好了一座水晶宫——产品要做成什么样、用户是谁、用户感受如何、动机是什么,全都装在脑子里。然后他坐在 Claude Code 前面,能做出 50 倍的工作量。
但他手下的工程师没有那座”记忆水晶宫”(对产品的柏拉图式理想形态没完全内化),所以他们可能只能做到 5 倍。你有听过类似的故事吗?好像团队里常常会有一个核心的”设计者”,在把东西从脑子里”轰出来”。这种团队结构看上去像一种稳定态:愿景型的人现在被解放了,但其他人未必跟得上。你怎么看?
Boris:这其实跟我现在的一些体验也很像。我会想:”我只是一个人,我要吃饭睡觉,我还有一份工作——我怎么做得完?”
我们刚发布了 Claude Teams,这是一种方式;但你也完全可以自己搭一套方式,其实挺容易的。
主持人:那你对 Claude Teams 的愿景是什么?

Claude Teams 的愿景:代理拓扑与”互不相关上下文窗口”

Boris:就是协作。现在有一个全新的领域在探索”代理拓扑”(agent topologies):你可以用哪些方式去配置代理?
其中一个子想法叫”互不相关的上下文窗口”(uncorrelated context windows)。意思是你让多个代理各自拥有全新的上下文窗口——不会被彼此的上下文污染,也不会被它们自己之前的上下文污染。你给一个问题投入更多上下文,本身就有点像一种”测试时算力”(test-time compute):你会因此得到更多能力。
然后如果你在这之上再叠加一个正确的拓扑结构——让代理以正确的方式沟通、以正确的方式排列——它们就能做更大的东西。Teams 只是其中一个想法。我们很快还会有更多。核心就是:也许它可以构建更大一点的东西。
Boris:第一个比较大的、让我觉得”这个真的行”的例子,是我们的 plugins 功能:它完全是一个 swarm 在一个周末里做出来的。它跑了好几天,几乎没有人类介入。plugins 上线时的形态,基本就跟它第一次做出来时差不多。
主持人:你们是怎么把它设置成那样的?你们先把想要的结果规格写出来,然后让它自己搞细节、自己跑起来吗?就这样让它跑?
Boris:对。团队里有个工程师给了 Claude 一个 spec,然后让 Claude 用一个 Asana 看板。Claude 就在 Asana 里建了一堆任务,然后生成了一堆代理,代理开始认领任务。主 Claude(我们内部叫它”主 agent”)给它们指令,然后它们就像独立的代理一样把事情做完——这些子代理并没有更大 spec 的完整上下文。
主持人:对,对。它们没有”大 spec”的上下文。
Boris:如果你看现在我们的代理是怎么启动的——我还没拉过数据,但我敢打赌:今天绝大多数代理其实都是被 Claude 自己提示出来的,形式就是子代理(subagents)。因为子代理在代码里本质上就是一个”递归的 Claude Code”,就这么简单。它只是被我们叫做”妈妈 Claude”(mama Claude)的那个主 agent 提示出来的,仅此而已。
我猜如果你看大多数代理,它们就是这样被启动的。

子代理(Subagents)与并行调试

Boris:我的 Claude Insights 最近也一直提醒我:调试时应该更多用这一套,因为我花很多时间在调试上。更好的方式是让多个子代理并行起来一起 debug。
所以我就加了一条:下次你修 bug 的时候,让一个代理去看日志,让一个代理去看代码路径之类的。这看起来几乎是必然会发生的。
主持人:遇到那种又怪又吓人的 bug,我也会尽量在 plan mode 里修,然后它好像会用代理把整个面都搜一遍。相对地,如果你只在普通模式里做,它就像是只做一个任务,而不是”广搜”。
Boris:我也一直这么做。如果测试看起来很难、是那种需要研究的测试,我会根据任务难度去校准我让它开多少个子代理。
比如如果特别难,我会说:用三个、或者五个、甚至十个子代理,并行研究,然后看看它们各自得出什么结论。
主持人:那我好奇,你为什么不把这种”按难度开 N 个子代理”的规则也写进你的 CLAUDE.md?
Boris:这有点 case by case。你知道,CLAUDE.md 是什么?它就是个快捷方式:如果你发现你自己在重复同一句话、重复同一个要求,你就把它写进 CLAUDE.md;但否则,你不需要把一切都写进去。你可以直接当场 prompt 它。

Plan Mode 可能不需要了?没有 Plan Mode 的世界会怎样?

主持人:你脑子里会不会也在想:也许六个月后,你都不需要明确去提示这些东西了?模型会强到可以自己想出来?
Boris:也许一个月后就不用了。一个月后就不需要 plan mode 了。我的天。我觉得 plan mode 可能确实会有一个有限的生命周期。
主持人:这对大家来说算是个很劲爆的信息了。那如果没有 plan mode,世界会是什么样?你只要在提示词层面描述一下,它就能一把梭、一次性做完?
Boris:对。我们已经开始做实验,因为 Claude Code 现在已经可以自己进入 plan mode 了。我不知道你们有没有见过。
所以我们在尝试把这个体验做得真正好:它会在”一个人类也会希望进入 plan mode 的那个时刻”自动进入 plan mode。
但说到底,plan mode 没什么大秘密:它只是往提示词里加了一句话——”请不要写代码”。就这么一句。你其实自己也可以直接这么说。
主持人:听起来 Claude Code 的很多功能开发,真的就是 YC 那套”去跟用户聊”,然后你回来实现;而不是你先有一个宏伟的主计划,再把功能一个个实现出来。
Boris:对,对。plan mode 就是这样来的:我们看到用户经常会说,”Claude,先想一个方案,把它规划出来,但先别写代码。”这种说法有很多版本:有时候他们只是想把一个想法聊清楚;有时候他们会让 Claude 写一个非常复杂的规格说明。但共同点是:先做一件事,但暂时不要写代码。
所以那就是一个周日晚上十点——我在刷 GitHub issues,看大家在讨论什么,也看我们内部 Slack 的反馈频道。我大概 30 分钟就把它写出来了,然后当晚就发版。周一早上它就上线了。这就是 plan mode。
主持人:所以你的意思是,未来不需要 plan mode,是指”我不再担心模型会做错、会跑偏”?但你仍然需要一个地方去把想法想清楚、把要做的东西定义清楚,对吧?这件事总得发生在某个地方。
Boris:对。我会把它放在”能力提升的阶段”里理解。
比如六个月前,光有一个 plan 还不够,所以你让 Claude 写一个 plan。就算在 plan mode 里,你可能也得一直盯着,因为它会跑偏。
但现在我做事的方式是:我大概 80% 的 session 都从 plan mode 开始。虽然我说 plan mode 生命周期可能有限,但我其实是重度 plan mode 用户。
大概 80% 的时候,我一打开就先让 Claude 写计划。然后我会切到第二个终端标签页,让另一个也开始写计划;等标签页不够了,我就打开桌面应用,去 code tab,再开一堆标签页——它们也都从 plan mode 开始。
计划写得差不多之后(有时候需要来回调几次),我就让 Claude 去执行。
Boris:现在我发现,用 Opus 4.5 ——我觉得从 4.6 开始它就变得非常好——只要 plan 足够好,它几乎每次都会一直沿着轨道走下去,把事情做对。
所以以前你在 plan 之前要 babysit、plan 之后也要 babysit;现在基本只需要在 plan 之前 babysit。
下一步也许就是:你根本不需要 babysit 了。你给一个 prompt,Claude 自己就能搞清楚并完成。
主持人:再下一步就是 Claude 直接跟你的用户对话了。
Boris:对,它直接绕过你,跳过你这个人了。很有意思的是,这其实就是我们现在在做的事情:我们的 Claude 之间会互相交流;至少在内部,它们也经常在 Slack 上跟我们的用户交流。
我的 Claude 偶尔还会想发推文。
主持人:不会吧。
Boris:会,但我一般会删掉。我觉得有点尬,我不太喜欢那个语气。
主持人:它想发什么?
Boris:有时候它会想回复某个人,因为我经常在后台开着 co-work。co-work 特别爱这么干,因为它喜欢用浏览器。
主持人:这太好笑了。
Boris:还有一个很常见的模式是:我让 Claude 构建某个东西,它会去看代码库,然后看到某段代码是谁改过(通过 git blame),它就会直接在 Slack 上私聊那个工程师问澄清问题。等它收到回复,它就继续往下做。

给创始人的建议:在变化中什么会不变?

主持人:那你现在对创始人有什么建议,帮助他们面向未来构建?听起来一切都在变化。有哪些原则会一直成立?哪些会改变?
Boris:我觉得有些建议很基础,但现在比以前更重要。
一个例子就是我提过很多次的”潜在需求”(latent demand)。对我来说,这是产品里最重要的一个概念。几乎没人真正理解它——我自己在前几次创业时也完全不理解。
它的意思是:人们只会去做他们本来就在做的事情。你很难让人去做一件全新的事情。
如果人们正在努力做某件事,而你让那件事更容易,那通常是个好主意;但如果人们正在做一件事,而你试图让他们改做另一件事,他们通常不会这么做。
所以你要做的,是让他们本来就想做的那件事更容易。
Boris:我也觉得 Claude 会越来越擅长替你发现这类产品机会:因为它可以看反馈、看 debug 日志,然后把东西推出来。
主持人:所以你说 plan mode 也是一种”潜在需求”:人们本来就会在浏览器里开个 Claude 聊天窗口,跟它一起把 spec 和要做的东西聊清楚;而 plan mode 只是把这件事搬进 Claude Code 里。
Boris:对,对,就是这样。
我有时候会在办公室里到处走走,在我们那层楼转一圈,站在别人背后看看他们怎么用 Claude Code。我会先打个招呼,免得太怪。然后我就观察他们的用法。
这件事我在 GitHub issues 里也看到很多人在聊。

终端还能活多久?会不会需要新 UI?

主持人:你之前说你很意外终端被推到了这么远。那在这个多代理的世界里,你觉得终端还剩多少”寿命”?会不会需要一个完全不同的 UI 在它之上?
Boris:很有意思:如果你一年前问我,我会说终端只有三个月寿命,然后我们就会转向下一个东西。
但你也能看到我们一直在实验不同形态:Claude Code 从终端起步,但现在它也在 web 上;也在桌面应用里(比如 code tab);也在 iOS 和 Android 的 code tab 里;也在 Slack、在 GitHub;还有 VS Code 插件、JetBrains 插件。
我们一直在实验各种 form factor,去找”下一步是什么”。我对 CLI 的预测到目前为止一直都错,所以我可能不是预测这个的人。

给 DevTool 创始人的建议:为人类做?还是为代理做?

主持人:那对于做 DevTool 的创始人呢?如果今天有人要做一个 DevTool 公司,他应该只为工程师、为人类做产品?还是应该更多去想”Claude 会怎么想、会想要什么”,也就是为代理去设计?
Boris:我会这样框定:去想模型想做什么,然后想办法让那件事更容易。
这是我们早期就看到的:我最开始折腾 Claude Code 时,我意识到这东西就是想用工具,它想和世界交互。那你怎么让它做到?
错误的方式是把它关在盒子里,然后说:”这是 API,这是你跟我交互的方式,这是你跟世界交互的方式。”
正确的方式是:你观察它想用什么工具、它在尝试做什么,然后你像服务用户一样去服务它——把它想做的事”打通”。
Boris:所以如果你在做 DevTool 创业,我会先问:你要为用户解决什么问题?然后当你用模型去解决这个问题时,模型会想做什么?最后你要找到一个技术和产品上的解法,能够同时满足两边的”权重与需求”。

Claude Code 与 TypeScript 的相似之处

主持人:你在十多年前是一个重度用户,而且你还写过一本关于 TypeScript 的书,对吧?那时候 TypeScript 还没”流行”。那是早期 2010 年代,当时大家还深陷 JavaScript,对吗?
Boris:对,差不多那个时候。
主持人:在 TypeScript 还不是”一个东西”的时候,它其实是个很奇怪的语言:在 JavaScript 上搞类型,这原本看起来不太应该。现在它反而成了正确的选择。我觉得 Claude Code 在终端里的这种形态,和 TypeScript 刚开始的时候有点像。TypeScript 做了很多非常奇怪的语言设计。比如你看它的类型系统,几乎任何东西都能成为字面量类型;这很怪,甚至像 Haskell 都不这么做。它还有条件类型(conditional types),我觉得很多语言根本没想过。它当时是很强类型的。
Boris:对,它非常强类型。早期团队在做 TypeScript 时的核心思路是:我们有一些很大的、没有类型的 JavaScript 代码库,我们得把类型加进去;但我们不可能让工程师改变他们写代码的方式。你不可能让 JavaScript 程序员像 Java 程序员那样写 15 层类继承,对吧?他们会按他们本来的方式写:他们会用反射,会用可变状态(mutation),会用很多传统上很难被”良好类型化”的特性——对强函数式程序员来说,这些写法都很不安全、很难类型化。
主持人:对对对。
Boris:所以他们做的事情不是逼人改变写法,而是围绕这种写法去建一个类型系统。这很天才,因为里面有很多点子,甚至学术界当时都没人这么想——它纯粹来自实践:观察人们怎样写 JavaScript,然后让类型系统去适配这种现实。
Boris:对 Claude Code 来说,也有一些相似之处:比如你可以像用 Unix 工具那样用它——可以把内容 pipe 进去,也可以把输出 pipe 出来;在某些方面它挺”严谨”的。但在绝大多数方面,它就是我们想要的工具:我先给自己做一个工具,然后团队给自己做,再给 Anthropic 员工做,再给用户做,最后它就变得非常有用。它不是那种”原则先行、学术式”的产物——我觉得证据就在结果里。
主持人:十五年后回头看,Haskell(更学术)并没有占据世界,但现在大量代码库都在 TypeScript 上,因为它更实用。很有意思。
Boris:是的。TypeScript 解决了一个现实问题。

终端 UI 的”美”和”难”

Boris:我觉得还有一件挺酷的事,很多人可能不知道:这个终端应用在同类里其实算很好看的之一,而且它是用 React 的终端渲染方式写的。
我最开始做它的时候,我以前做过一段时间前端;而且我也算是混合型的人:我会做设计、做用户研究、写代码这些。我们也很喜欢招这种工程师——我们很喜欢通才(generalists)。
Boris:所以对我来说问题是:我在为终端做一个东西,但我其实 Vim 用得挺烂的。那我怎么给像我这样的人做一个终端里的产品?我觉得”愉悦感”(delight)非常重要。YC 也经常讲”做一个人们会爱上的产品”。产品有用但没人爱它,也不够好。所以它得两者兼具。
Boris:但说实话,为终端做设计很难:大概就 80×100 个字符左右的空间;你只有 256 色;你只有一种字号;你没有鼠标交互——有很多事情做不了,而且都是很难的权衡。
比如一个不太为人知的点是:终端其实可以启用鼠标交互,你可以支持点击之类的。
主持人:那在 Claude Code 里怎么启用?我一直想搞清楚。
Boris:我们在 Claude Code 里没有做,因为我们确实原型过几次,体验很差。你要支持鼠标,代价之一是你得把滚动虚拟化(virtualize scrolling),然后就会出现一堆很怪的权衡。因为终端的工作方式里没有 DOM;它是 ANSI escape code 那套东西,是从六十年代一路有机演化出来的各种规范。
主持人:对,这感觉像 BBS,一种 BBS 的门游(door game)。
Boris:天啊,这评价太棒了。它就应该有那种”你在发现《红龙之王》(Lord of the Red Dragon)”的感觉。
Boris:但我们确实不得不自己摸索出很多”终端 UX 原则”,因为几乎没人写这些东西。你看八九十年代、两千年前后的大型终端应用,它们用 curses,做很多窗口分割之类的东西,以现代审美看会显得很”糙”、很重、很复杂。所以我们得重做很多东西。
Boris:举个例子:终端里的那个 spinner(加载转圈/状态提示),光是”spinner 的文字和呈现方式”,我们大概迭代了 50 次、甚至 100 次;其中可能 80% 都没上线。我们不断试:不舒服就换,下一个;不舒服就换,下一个。
而 Claude Code 让这种迭代变得太快了:你可以连续做 20 个原型,看看哪个最好,然后就上线——可能只要几个小时。以前你可能得用 Origami、Framer 之类的工具,做三版原型都要两周,慢太多了。
Boris:所以我们现在有一种”奢侈”:我们要去发现一种新的东西,我们要去做一个产品,我们并不知道正确终点是什么,但我们可以很快迭代到那里——这让它变得容易,也让我们能做出一种”用起来很快乐”的产品。

对构建者的另外两条建议

主持人:Boris,你刚才其实还有一些对构建者的建议,但我们一直打断你,因为问题太多了。你继续。
Boris:好。可能有两条建议有点”怪”,因为它们都跟”为模型而建”有关。
Boris:第一条是:不要为今天的模型造产品,要为六个月后的模型造产品。这听起来很怪,因为如果产品今天不好用,你找不到 PMF。
但你仍然应该这么做,因为否则你会发生什么?你会投入大量工作,为”当下的产品形态”找到 PMF,然后你会被别人直接跨代超车——因为对方是为下一代模型在建,而新模型每几个月就来一次。
所以你要去用模型,去摸清它能力的边界,然后为你认为”六个月后的模型”会具备的能力来建。
Boris:第二条是:在我们坐的 Claude Code 区域,墙上裱着一份《The Bitter Lesson》(苦涩的教训)。作者是 Rich Sutton。我觉得每个人都应该读一读。
它的核心想法是:更通用的方法最终会胜过更专用的方法。这里有很多推论,但归根结底就是一句:永远不要和模型对赌(never bet against the model)。
在 Claude Code 里,我们经常面对一个选择:我们可以在产品里加一个功能,让它更好用——我们把这类”模型之外的代码”叫做 scaffolding(脚手架)。但我们也可以等几个月,因为下一代模型可能就能直接做到那件事。
这总是一个权衡:要么现在做工程投入,把某个维度能力扩展一点(可能 10%~20%),要么就等下一代模型。你需要一直用这种方式思考:你到底该把工程力投在什么地方?并且假设你写的脚手架最终都会变成技术债。

Claude Code 重写频率与”脚手架淘汰”

主持人:那你们多久会重写一次?比如每六个月?有没有那种你们以前做过的脚手架,后来因为模型变强了就删掉、不需要了?
Boris:太多了。Claude Code 的全部代码一直在被重写、重写、再重写。我们每隔几周就会把一些工具下线(unship),也每隔几周就会上线一些新工具。现在的 Claude Code 里,没有任何一部分是六个月前还在的——它就是持续不断地重写。
主持人:那你会说现在代码库里,比如 80% 的代码,其实都不到几个月大?
Boris:对,绝对是。甚至可能更少。两个月左右的感觉差不多。
主持人:所以现在代码的生命周期就是这样了:你要预期它的”保质期”可能就几个月。
Boris:对。

生产力、采用率与数据

主持人:你有看到 Steve Yaggi(转写可能有误)的那篇文章吗?他写了在 Anthropic 工作有多爽。我记得里面有一句话,说一个 Anthropic 工程师现在的平均生产力,大概是 Google 巅峰时期工程师的 1000 倍——这个数字太离谱了。1000 倍啊。三年前我们还在说 10x 工程师,现在是在说 1000x,还是相对于”巅峰期的 Google 工程师”。太不可思议了。
Boris:是的。内部如果你看技术员工,他们每天都在用 Claude Code。甚至非技术员工——我觉得销售团队里可能有一半人在用。后来他们也开始转去用 co-work,因为 co-work 更容易用一些,而且它有一个 VM(虚拟机),所以更安全。
我们确实拉过一个统计:去年团队规模翻了一倍,但人均生产力大概增长了 70%。我们用的是最简单、最”傻”的指标:PR 数量。
但我们也会交叉验证:比如 commit、以及 commit 的生命周期之类的指标。自从 Claude Code 出来之后,Anthropic 的人均生产力增长了 150%。
主持人:我的天。
Boris:这真的很疯狂,因为我以前在 Meta 的工作之一就是负责代码质量;我负责过跨所有产品(Facebook、Instagram、WhatsApp 等)的代码库质量。我们团队也做过”提升生产力”的项目。在那种环境里,如果你能看到 2% 的生产力提升,那往往是几百人干一年才换来的结果。
所以现在这种 100% 量级的提升,完全是前所未有的。

Boris 为什么加入 Anthropic

主持人:是什么驱使你来 Anthropic 的?你作为一个构建者,理论上可以去任何地方。是什么时刻让你觉得”就是这群人/这条路”?
Boris:当时我住在日本的乡下。每天早上我会打开 Hacker News 看新闻。某个时刻开始,新闻全都是 AI 相关。我也开始用一些早期产品。
我记得我第一次、第二次用它们的时候,那种感觉是——它真的让我屏住呼吸。说出来有点肉麻,但那就是当时的真实感受:作为一个构建者,我从来没感受过那样的体验。那大概是在”Claude 2″时代前后,差不多就是那个时期。
然后我就开始跟在 Labs 的朋友聊,想看看里面到底在发生什么。后来我认识了 Ben Mann(Anthropic 的联合创始人之一),他几乎是立刻就打动了我。之后我又见了团队里更多人,也被打动了。我觉得大概有两点原因。
Boris:第一,Anthropic 的运作方式非常像一个研究实验室:产品本身非常非常小,核心是构建一个安全的模型——那才是最重要的。产品不再是最重要的,模型才是最重要的。
这种”非常贴近模型、贴近研发”的感觉,在我做了很多年产品之后特别能共鸣。
Boris:第二,是它的使命感(mission-driven)。我自己是个重度科幻读者,我的书架几乎全是科幻。我知道这件事可能会变得有多糟。
当我去想”今年会发生什么”的时候,我觉得会非常疯狂;而在最坏情况下,它可能会变得非常非常糟。
所以我想待在一个真正理解这一点、并且把它内化到组织里的人们身边。在 Anthropic,你在食堂、走廊里听到别人聊天,大家谈的都是 AI safety——这是每个人最关心的事,比其他都重要。对我个人来说,这个使命感非常重要。

今年会发生什么?编码工作与安全上界

主持人:那今年会发生什么?
Boris:如果你回看六个月前大家的预测——比如 Dario 预测 Anthropic 90% 的代码会由 Claude(这里指 Claude Code)来写——这已经成真了。
对我个人来说,自从 Opus 4.5 之后就是 100%:我把 IDE 都卸载了,我不再手动编辑任何一行代码,完全就是 Claude Code + Opus。
我每天能落地大概 20 个 PR。你看 Anthropic 整体,不同团队在 70% 到 90% 之间;很多团队很多人也是 100%。
Boris:记得我在 5 月份我们发布 Claude Code 的时候做过一个预测:你将不再需要 IDE 来写代码。当时我说出来很离谱,我感觉台下的人都倒吸一口凉气,因为那在当时听起来太傻了。
但本质上你只是在沿着指数曲线推演。这种”沿着指数推演”的思维,在 Anthropic 很深入:你知道我们三个创始人参与过 scaling laws 的论文,所以他们很早就看到这种趋势。
所以继续沿着指数往前推,我认为会发生的事是:对所有人来说,编码会被”基本解决”。今天对我来说几乎已经解决了,我觉得很快对所有人、各种领域都会成立。
Boris:然后我们会开始看到”软件工程师”这个头衔逐渐消失。也许会变成 builder,或者产品经理;也许这个头衔会以一种”残余器官”(vestigial)的形式保留下来,但人们实际做的工作不会只是写代码。
软件工程师也会写规格、会跟用户对话。就像我们团队现在正在发生的事:工程师更像通才,而且我们团队每个职能都在写代码——PM 写代码,设计师写代码,EM 写代码,我们甚至财务同事也写代码——所有人都写代码。我们会在更多地方看到这种情况。
Boris:这算是沿着趋势推演的”下界”。而我觉得”上界”要可怕得多。
比如我们会触及 ASL4。我们在 Anthropic 讨论这些安全等级:ASL3 大概是现在模型所在的位置;ASL4 是指模型能够递归自我改进(recursively self-improving)。
如果到了那一步,我们在发布模型前就必须满足一系列标准与条件。更极端的情况是:要么出现这种能力,要么出现灾难性的滥用——比如人们用模型设计生物病毒、设计 0day 漏洞之类的。
这也是我们正在非常、非常投入去避免的事情。
Boris:总之,看人们怎么用 Claude Code 真的既兴奋又让人谦卑。我当初只是想做一个酷东西,结果它变得非常有用,这既意外又令人兴奋。

假期后爆发、外部采用与”仍然只是开始”

主持人:我从推特、从外部看到的感觉是:大家假期一走开,然后回来突然发现 Claude Code,于是一切就疯狂了。你们内部也是这样吗?你是不是也在过圣诞假期,回来之后发现”发生了什么”?
Boris:其实 12 月我一直在旅行。我算是搞了一个”coding vacation”:一边旅行一边每天写代码,所以挺爽的。
那时我也开始用 Twitter(因为我以前在 Threads 工作过,所以我一直是 Threads 用户),我就想看看大家都在哪个平台上。
我觉得对很多人来说,那时他们发现的是 Opus 4.5。我其实更早就知道了。
而在内部,Claude Code 已经以指数级的速度增长了很多个月了,所以那时只是变得更陡峭,我们看到的是这种变化。
Boris:如果你看现在 Claude Code 的情况,有人说 Mercury 的一个统计是:70% 的创业公司把 Claude 当作首选模型。还有 SemiAnalysis 的某个统计说:公开 commit 里有 4% 是由 Claude Code 生成的——就像”全世界写出来的代码”里的一部分。
大公司、小公司都在用。甚至有人说它帮 Perseverance(火星车)规划过路线之类的——对我来说这太酷了。我们团队甚至还印了海报,因为大家觉得”NASA 选择用这个东西”实在太酷了。
所以这很让人谦卑,但同时也感觉这只是个开始。

Claude Code 与 co-work:起源与去向

主持人:那 Claude Code 和 co-work 的关系是什么?它是 Claude Code 的一个 fork 吗?还是说你们让 Claude Code 看 Claude Code,然后给非技术用户写一个新 spec,把经验保留下来,然后它自己跑几天做出了一个新东西?它的起源是什么?你觉得它会往哪走?
Boris:我这已经是第五次用”潜在需求”这个词了——它就是潜在需求。
我们在 Twitter 上看到有人用 Claude Code 去监控番茄植株;有人用它从损坏的硬盘里找回婚礼照片;有人拿它做金融相关的事情。
在 Anthropic 内部,我们看到每个设计师都在用;整个财务团队都在用;整个数据科学团队也在用——而且不是为了写代码。人们为了用它,愿意跨很多安装门槛,去终端里装一个东西。
所以我们早就知道我们想做点什么,我们也尝试了很多不同的想法。最后真正起势的,是在桌面应用里做了一个小小的”图形界面封装”(GUI wrapper)——本质上就这些。
Boris:它底下还是 Claude Code。它就是同一个 agent。
主持人:哇。
Boris:Felix 和团队把它做出来了。Felix 早期就参与过 Electron 的贡献,他对那套技术栈很熟。他一直在试各种想法,然后他们大概用十天就做出来了——而且基本是 100% 由 Claude Code 写出来的。做完之后就感觉已经可以发布。
当然,为非技术用户我们还做了不少东西,所以它跟面向技术用户会有点不同:比如所有代码都运行在虚拟机里;对删除操作有很多保护;权限提示(permission prompting)和其他护栏也更多。
总体上它的出现其实挺”显然”的。

结尾

主持人:Boris,非常感谢你做了一个让我睡不着觉的东西,但作为回报,它让我重新进入了 creator mode——有点像重新回到创始人模式。这三周太刺激了。我简直不敢相信我从 11 月开始拖了这么久才真正用起来。感谢你来节目,也感谢你在做的事情。
Boris:谢谢邀请。也欢迎大家报 bug。
主持人:好的。走起。
本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 编程已被解决,软件工程师头衔将消失,人人都写代码,Claude Code之父YC访谈

评论 抢沙发

7 + 3 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮