卡帕西在红杉说了什么:软件工程师的工作,正在被重新定义

有什么东西悄悄变了——卡帕西的那场红杉对谈

📈 趋势 · 2026-05-02

TL;DR2026年4月底，Andrej Karpathy在红杉资本AI Ascent大会上说了一件事：2025年11月，他还在自己写80%的代码；到了12月，这个比例翻转了——他把80%的代码交给了AI Agent。他把这个时刻叫做”拐点”。这不是一个程序员的个人习惯变化，而是一个信号：软件工程这件事，正在被重新定义。他给这个新时代起了个名字——”agentic engineering”（智能体工程）。我的判断是：这个词会在接下来12个月里，成为行业里最重要的概念之一。如果我错了，错在哪里——文章最后说。

[ 卡帕西在红杉AI Ascent 2026现场 ]

一个让我停下来的数字

2025年11月，Karpathy写了80%的代码，AI写了20%。

如今，这个比例倒过来了。

“Coding agents basically didn’t work before December and basically work since.”— Andrej Karpathy，红杉AI Ascent 2026

我第一次看到这句话的时候，愣了一下。不是因为这个数字有多惊人——80/20这个比例，Greg Brockman在OpenAI也说过类似的话。让我停下来的是”basically”这个词用了两次。一个在AI领域工作了十几年的人，用”基本上不能用”和”基本上能用了”来描述一个月内发生的变化——这不是在夸大，这是在说一件真实发生的事情。

Karpathy把这种状态叫做”AI psychosis”（AI精神错乱）——他说自己从12月开始就一直处于这种状态，试图搞清楚这个新的工作方式到底意味着什么。

这就是他在红杉那场对谈的起点。

软件的三次进化，以及我们现在在哪里

要理解Karpathy在说什么，需要先接受他的一个框架。他把软件的历史分成三个时代：

📦 三个时代（可跳过）Software 1.0：人类写代码。每一个逻辑分支都要明确写出来，每一个边界情况都要预先考虑。特斯拉Autopilot早期的C++代码库就是这个时代的典型。Software 2.0：人类不再直接写逻辑，而是整理数据、训练神经网络。编程变成了数据工程。模型的”权重”取代了手写的规则。Software 3.0：现在。编程语言变成了英语（或者中文）。你不写代码，你写提示词。LLM读取你的意图，在数字世界里执行操作。上下文窗口成了新的编程界面。

↑ 简单说：软件从”人写规则”→”人整理数据”→”人说意图”，每一步都在把更多的执行权交给机器。

这个框架本身不新鲜——Karpathy几年前就提出过Software 2.0的概念。但他在红杉这次说的是：Software 3.0正在吃掉1.0和2.0。

不是取代，是吃掉。

[ Software 1.0 / 2.0 / 3.0 三个时代的对比图 ]

“vibe coding”已经过时了

2025年2月，Karpathy造了一个词：vibe coding。

意思是：你不需要懂代码，你只需要描述你想要什么，让AI去实现。”完全沉浸在氛围里，拥抱指数级增长，假装代码根本不存在。”

这个词火了。它描述了一种真实存在的现象——大量非技术背景的人开始用AI工具搭应用，速度快得惊人。

但在红杉的对谈里，Karpathy说：vibe coding已经过时了。

不是说它不好用，而是说它只解决了一半的问题。

Vibe coding提高了地板——让不懂技术的人也能快速搭出一个原型。

但它没有提高天花板——用vibe coding搭出来的东西，往往有安全漏洞、架构脆弱、代码臃肿易碎。Karpathy自己说，AI写的代码”awkward and gross”（别扭又难看）。

他给下一个阶段起了个新名字：agentic engineering（智能体工程）。

Agentic engineering是什么

如果vibe coding是”我说你做”，那agentic engineering是”我指挥，你执行，我验证”。

Karpathy提出了一个关键洞见：

AI自动化的是你能验证的东西，而不是你能描述的东西。

这句话值得停下来想一想。

代码可以验证——跑一下，看有没有报错，看测试有没有通过。数学证明可以验证——对就是对，错就是错。但”这个设计方案好不好”、”这个产品方向对不对”——这些很难验证，所以AI在这些地方表现得很差。

这就是他说的”jagged intelligence”（锯齿状智能）——AI在某些领域超过人类，在另一些领域连基本常识都搞不定。不是均匀的强，是凹凸不平的强。

所以agentic engineering的核心技能，不再是写代码，而是：

① 任务分解：把一个大任务拆成Agent能处理的小块② 规格定义：在委托给Agent之前，把验收标准写清楚③ 输出评估：用合适的严格程度审查Agent的输出④ 失败分类：判断一个错误是可以修复的，还是根本性的⑤ 接管时机：知道什么时候该把控制权拿回来

Karpathy说：”People still need to define the spec and the plan in detail.”（人们仍然需要详细定义规格和计划。）这句话听起来像废话，但它其实是在说：清晰度成了稀缺资源。当执行变得廉价，能把事情想清楚的人，价值反而更高了。

[ vibe coding vs agentic engineering 对比示意图 ]

两个例子，一个关于安装，一个关于产品

Karpathy在对谈里举了两个具体例子。

例子一：OpenClaw安装器

传统的软件安装是这样的：写一个bash脚本，预先考虑所有可能的情况，然后发给用户。问题是，用户的环境千变万化，脚本总会在某些情况下失败。

OpenClaw的做法是：不写固定的安装脚本，而是给用户一段自然语言指令，让用户把这段指令交给一个Agent。Agent读取指令，检查用户的实际环境，发现缺少什么就补什么，遇到问题就自己调试。

这是Software 3.0的一个具体体现：软件不再是固定的逻辑，而是给Agent的指令。

例子二：MenuGen

Karpathy提到了一个叫MenuGen的应用——一个用AI识别菜单的工具。他用这个例子说明了一个让很多AI创业者不舒服的观点：

随着模型能力提升，很多AI应用会消失。不是因为它们做得不好，而是因为它们本质上是在包装模型的局限性。当模型本身变强了，这层包装就没有存在的必要了。

他的判断是：真正有价值的AI应用，是那些建立在高价值、可验证的工作流上的——不是通用的SaaS包装，而是在特定领域建立了自己的强化学习环境的产品。

反方信号：这个转变没有那么快

我需要说一个和Karpathy判断方向一致、但速度上有分歧的声音——来自Karpathy自己。

他在Dwarkesh播客上说过：他不认为基于编程Agent的AI加速会像某些人预测的那样快速到来。

为什么？因为”可验证性”这个门槛，在很多领域还没有解决。代码可以验证，但大多数知识工作——法律分析、医疗判断、商业决策——很难建立清晰的验证机制。没有验证机制，就没有可靠的强化学习，就没有真正可信赖的Agent。

还有一个更现实的问题：AI写的代码确实在增加，但代码质量的问题也在增加。Karpathy自己说AI代码”awkward and gross”——这不是在夸奖。一个数据库被vibe coding删掉的事故（PocketOS事件）已经发生了。当80%的代码由AI写，谁来负责这80%的质量？

我的修正是：这个转变是真实的，但它会比最乐观的预测慢，比最悲观的预测快。

如果Karpathy是对的，意味着什么

假设他的判断方向是对的，接下来6-12个月，我们可能会看到：

对工程师：写代码的时间减少，审查代码的时间增加。最有价值的技能不再是”能写什么”，而是”能判断什么”。那些能把模糊需求转化成清晰规格的人，会比那些只会写代码的人更值钱。

对初级开发者：这是最难的部分。Karpathy的80/20翻转，直接压缩了初级开发者的成长路径——以前你通过写大量代码来积累经验，现在这些代码被Agent写了。怎么在一个Agent写80%代码的环境里成长，目前没有人有好答案。

对产品和创业：Karpathy的”可验证性”框架给了一个筛选标准——你的产品是在解决一个可以被清晰验证的问题吗？如果是，AI可以帮你做得更好；如果不是，你可能只是在包装模型的局限性，等着被下一个更强的模型消灭。

对基础设施：Karpathy提到了一些具体的基础设施需求——llm.txt文件（类似robots.txt，告诉LLM怎么读你的网站）、LLM友好的文档格式、让代码库变成可消化文本的工具。这些听起来很小，但它们是Software 3.0时代的基础设施，目前还没有标准化。

我的判断

我个人判断是”agentic engineering”这个概念会在2026年下半年成为行业标准词汇——就像”vibe coding”在2025年上半年那样。但是如果接下来6个月，AI Agent的可靠性没有显著提升，”agentic engineering”可能会停留在概念层面，而不是真正改变工程师的日常工作方式。

Karpathy在红杉说的那些话，我反复想了好几遍。

让我印象最深的不是那些框架和概念，而是他描述自己”AI psychosis”状态的那段话——一个在这个领域工作了十几年的人，说自己从12月开始就一直在试图搞清楚这个新的工作方式到底意味着什么。

这种困惑是真实的。不是表演出来的谦虚，是真的在摸索。

我觉得这才是这场对谈最有价值的部分：不是他给出了答案，而是他诚实地说，他也还在找答案。

💬 你在自己的工作里，有没有感受到这个”拐点”？代码、文案、分析——有没有某个时刻，你突然发现AI能做的事情比上个月多了很多？

以上，既然看到这里了，如果觉得不错随手点个赞、在看、转发三连吧如果想第一时间收到推送，也可以给我个星标⭐

谢谢你看我的文章，我们，下次再见。

作者：罗先森2049投稿或爆料，请联系邮箱：dmss@vesselecho.cn

🌏联系方式：Redeem321