Andrej Karpathy:软件 3.0 时代来了.
软件的第三次范式转移:Karpathy 说,你写的大部分代码都不该存在。
Andrej Karpathy 在 Sequoia AI Ascent 2026 上提出 Software 3.0 框架。
从手写代码到训练网络,再到用 prompt 指挥 Agent——软件开发正在经历第三次范式转移。
这一次,被重写的不仅是代码,还有程序员这个身份本身。
一、一个 OpenAI 联合创始人的”落伍”宣言
2026 年 4 月底,Sequoia Capital 的 AI Ascent 大会上,合伙人 Stephanie Zhan 请出了她的老朋友——Andrej Karpathy。
去年的这个舞台,Karpathy 创造了一个后来被写进维基百科的词:Vibe Coding(氛围编程)。
“我从未像现在这样,觉得自己作为一名程序员已经落伍了。”
Karpathy 坦言,转折点发生在去年 12 月。
他休假时开始用最新的 AI Agent 工具写代码,发现生成的代码块越来越完美,他已经记不清上一次手动修改是什么时候了。
“我越来越信任这个系统,然后就进入了 Vibe Coding 的状态。”
二 Software 1.0 → 2.0 → 3.0
每一条规则都由程序员显式定义,每一行逻辑都可以追溯到一个工程师的键盘。这是过去 50 年的主流范式。
Software 2.0:人类提供数据,机器学习权重。
2017 年,Karpathy 在 Tesla 观察到这个趋势,写下了著名的《Software 2.0》一文。
他发现,自动驾驶的代码库里,越来越多的功能不再由工程师手写,而是由神经网络从数据中”学”出来。
编程的本质从写指令变成了整理数据集、设计目标函数。
Software 3.0:人类写 prompt,LLM 执行计算。
当大语言模型在足够多的任务上训练后,它变成了一台可编程的计算机。
你的代码是自然语言,你的编译器是 LLM,上下文窗口就是你操控这台机器的杠杆。
Software 3.0 在吃掉 1.0 和 2.0,大量的软件将被重写,甚至——根本不该存在。
二、一个让 Karpathy 大受震撼的例子
Karpathy 曾用 Vibe Coding 做了一个叫 MenuGen 的应用:你去餐厅,拍一张没有图片的菜单照片,MenuGen 会做 OCR 识别菜品名称,调用图像生成模型给每道菜生成一张图,然后把带图片的菜单重新渲染出来。
整个项目涉及前后端、部署、图像处理,是一个完整的 Web 应用。
后来他看到了 Software 3.0 版本:把照片直接丢给 Gemini,说一句”用 Nana Banana 把菜品图片叠加到菜单上”。
Gemini 直接返回了一张图——就是他拍的那张菜单,但每个菜名的位置已经被精确地填上了对应的菜品照片。
“我的整个 MenuGen 其实是多余的。那个应用根本不该存在。”
Software 3.0 的范式要原始得多:输入一张图,输出一张图。
神经网络承担了所有中间环节,你精心构建的应用在它面前就像一个过度工程化的笑话。
三、Vibe Coding 已经过时了
Karpathy 亲手创造了一个爆款概念,又亲手宣布了它的升级。
Vibe Coding 那条推文,用他自己的话说,就是一个浴中哲思,随手发的。
但它在一个正确的时刻为很多人的共同感受找到了名字——于是被写进了维基百科,词条比他本人的还长。
但一年后的今天,Karpathy 指出了核心的变化:
一年前的 Vibe Coding,是大家用当时还比较弱的 LLM 做些好玩的一次性项目;而今天,利用 LLM Agent 编程已成为专业人士的默认设置。只不过,监督和审查要更多了。
他提出了一个新概念:Agentic Engineering(智能体工程)。
智能体:是因为你 99% 的时间不再直接写代码,而是在指挥 Agent 干活,充当监工。
工程:是为了强调这其中包含着艺术、科学和专业技能——不是”氛围”,而是一项有着深度的、可精进的技能。
Vibe Coding 抬高了所有人写代码的下限。Agentic Engineering 则要维持专业软件的质量上限。
四、可以外包你的思考,但无法外包你的理解
“所有的东西都必须被重写。”
目前的互联网基础设施——框架文档、API 设计、部署流程——全部是为人类编写的。
Karpathy 抱怨道:”为什么还要告诉我怎么做?我应该复制粘贴什么文本给我的 AI Agent?”
未来的大机会在于构建 Agent 原生的基础设施。
系统被拆解为感知世界的传感器和改造世界的执行器,数据结构要让 LLM 高度可读,Agent 代表个人和机构在云端交互。
而在这一切之上,人类的核心稀缺性回归到三个词:审美、判断力、商业理解。
“你可以外包你的思考,但你无法外包你的理解。”
这不是一句鸡汤。它是对这个时代分工的精准描述:AI 可以替你执行,但不能替你判断什么值得做。
五、硬件层的权力反转
目前,神经网络以虚拟化的形式运行在传统计算机上——CPU/GPU 是主人,神经网络是客人。但他认为未来这种主客关系会反转:
“神经网络将成为主进程,CPU 变成某种协处理器。神经网络承担绝大部分繁重工作。”
这意味着主导资本开支的智能算力——芯片、数据中心、能源——其战略核心地位将进一步固化。
Software 3.0 不只是软件层的变革,它会一直渗透到硬件架构。
六、可验证性:AI 商业落地的罗盘
对于正在寻找 AI 落地场景的创业者和投资者,Karpathy 提供了一个极具实操性的判断框架:可验证性。
他指出了当前 AI 能力的一种怪异特征——锯齿状智能(Jagged Intelligence):
“最先进的模型能同时重构 10 万行代码或寻找零日漏洞,然而却告诉我应该步行去 50 米外的洗车店洗车。”
产生这种割裂的原因在于:前沿实验室把海量强化学习资源投在了”数学”和”代码”这些结果易于验证的领域。在这些领域,AI 早已超越人类。
所以 Karpathy 的商业建议极其明确:置身于结果可验证的场景中,AI 就能发挥巨大威力。而那些尚未被头部实验室重点关注的可验证场景,正是创业公司的蓝海。
七、10 倍工程师?远远不够
“人们以前常谈论’10 倍工程师’。在我看来,那些在 Agentic Engineering 领域表现出色的人,其产出峰值远超 10 倍。”
Karpathy 建议,企业应该抛弃传统的算法面试题。面试不应该考你能不能手写快排,而应该考察你能不能利用多个 AI Agent 协同构建大型项目,甚至能不能抵御其他 AI Agent 的攻击。
2026 年,他将看到模型层(Model Layer)和智能体层(Agent Layer)的双重进化。注意——是乘积效应,不是加和。
当模型能力指数级增长,遇上 Agent 框架的指数级成熟,一人公司不再是神话。前提是,你必须完成那场痛苦的脑回路升级:
从如何写出这个循环,转变为这个循环在整个系统中扮演什么角色。
从修复这个报错,转变为评估这个架构是否还需要这个模块。
八、写在最后
Karpathy 在 AI Ascent 2026 上讲的最重要的一件事,不是某一个技术细节,而是一个思维框架的切换。
Software 3.0 不是 Software 1.0 的加速版。它是一种全新的计算范式——LLM 是新型计算机,prompt 是新型代码,上下文窗口是新型内存。
在这个范式里,你精心构建的中间层可能会被一个 prompt 直接消灭。你写的很多代码,可能本来就不该存在。
但理解这一点的人,正在用自然语言编织未来的数字世界。
Karpathy AI Ascent 2026 炉边对话视频:YouTube
Karpathy Software 2.0 原文:Medium
Sequoia Inference:Software 3.0 分析:Substack
Latent Space Software 3.0 深度解读:laten.space
Anthropic Harness 工程实践:Anthropic Blog