乐于分享
好东西不私藏

Karpathy 谈 AI 编程未来:从 Vibe Coding 到 Agentic Engineering

Karpathy 谈 AI 编程未来:从 Vibe Coding 到 Agentic Engineering

大家好,我是玄姐。

PS:

Harness 工程干货直播,欢迎点击预约,直播见

Andrej Karpathy 曾参与创建 OpenAI,并在 Tesla 领导 Autopilot 视觉团队。去年,他在推特上提出了“Vibe Coding”(氛围编程),随后这一概念被 Collins 词典选为 2025 年年度词汇。2026 年 4 月,他在 Sequoia Capital 的 AI Ascent 活动上,接受合伙人 Stephanie Zhan 的访谈,讨论了 AI 如何彻底改变编程范式,以及下一阶段的“Agentic Engineering”理念。

一、2025 年 12 月:程序员的投降

Karpathy 回忆,2025 年 12 月是他个人的转折点。之前,AI 生成的代码常常需要修补,但那段时间他发现模型输出“直接可用”。从最初只让模型写一点代码,到后来完全信任模型,他进入了所谓的 Vibe Coding 状态:用自然语言持续传达意图,模型生成、修改、调试代码,人不再逐行编写或 diff。
他强调,Vibe Coding 并不是“氛围编程”,而是一种依靠直觉、放手让 AI 推进开发的方式。但这只是第一步:随着模型能力提升,真正值得关注的是 Agentic coherent workflow,即智能体连续规划、执行、调试,并根据环境反馈自主修正。

“过去程序员速度取决于写多少代码,现在速度取决于能否正确指挥强大但会犯错的 Agent。”

二、Software 3.0:大语言模型即新计算机

Karpathy 将软件发展分为三个阶段:
  • Software 1.0:传统软件,显式代码驱动规则执行。
  • Software 2.0:神经网络时代,通过训练获得模型权重,而非手写所有规则。
  • Software 3.0:大语言模型时代,LLM 本身成为可编程计算机。程序不再仅限代码文件,而是一段包含 prompt、context、工具调用和外部环境的“上下文程序”。
他用安装 OpenCL 的例子说明:过去需写复杂 shell 脚本,现在只需给 Agent 一段文字说明,它能根据环境执行、调试,甚至优化流程。新的编程重点,是哪一段文字应复制给 Agent,而不是写多少代码。

三、MenuGen 案例:AI 原生能力超越旧 App

Karpathy 自己开发的 MenuGen App:拍照识别菜单、生成菜品图。Vibe Coding 版本需要多层步骤,但 Software 3.0 下,只需将菜单照片交给 Gemini,指示 Agent 完成任务,最终得到直接渲染的菜单图片。

“整个 MenuGen 在旧范式下都是多余的。AI 本身可以直接覆盖任务。”

这个案例说明,AI 不只是让已有任务更快完成,更重要的是可以实现以前不可能的功能。

四、神经计算机设想:CPU 成为协处理器

Karpathy 设想未来的神经计算机:神经网络成为主流程,CPU 和传统程序成为协处理器,处理确定性任务。场景示例:设备接收视频,神经网络理解场景,实时生成独特 UI。

这种设想不是短期产物,而是一个方向性的心智模型,显示未来软件范式的潜力。

五、LLM 的“锯齿状智能”

Karpathy 强调,LLM 能力高度不均:可以重构 10 万行代码、发现零日漏洞,却可能在常识问题上犯错(如去 50 米外洗车是开车还是走路)。
这种能力不是自然进化,而是实验室训练和 RL 决策的结果。模型在训练覆盖的任务上表现卓越,在分布外任务上可能极弱。

六、Agentic Engineering:保住上限

Vibe Coding 抬高软件创造的下限,让更多人用 AI 做小工具或 side project。Agentic Engineering(智能体工程)则保护专业软件的质量、安全和责任
工程师需设计、协调、监督多个 Agent,让它们生成代码、跑测试、互相校验,同时保证系统边界、可验证性和回滚机制。熟练运用可带来远超 10 倍的效率提升。

“Agent 是尖刺实体(spiky entities)。强大但会犯错。关键是工程设计,而非盲目信任。”

七、AI-native 工程师的新标准

区别于普通工程师,AI-native 工程师:
  • 会优化自己的 Agent 工作流,配置工具以匹配开发方式。
  • 在招聘中,应通过大项目测试能力,而非算法题。例:构建安全的 Twitter clone,并用 Agent 模拟攻击测试系统。
  • 关注规格(spec)、系统边界和验证机制,而非逐行写代码。

八、“幽灵”与理解的重要性

Karpathy 将 LLM 比作幽灵,不是动物式智能,而是人类文档、统计模式、工具调用和奖励机制塑造的实体。

“你可以外包思考,但不能外包理解。”

细节(API 名称、语法)可交给 Agent,核心概念和系统理解必须掌握。品味、判断和系统设计仍然依赖人类。

九、Agent-first 基础设施

未来工具、文档和服务需要重写:让 Agent 直接理解状态、调用动作、收到反馈,而不是模拟人操作。Karpathy 设想,最终部署 App 只需一句话:“Build MenuGen”,Agent 可全程完成开发、配置和上线。

十、核心洞察

  • AI 提升下限:Vibe Coding 让更多人能做软件。
  • AI 保持上限:Agentic Engineering 确保专业软件质量、安全和可维护性。
  • 能力锯齿状:LLM 强项和弱项极端分化,训练覆盖决定优势领域。
  • 理解不可外包:系统结构、底层机制和设计判断仍需人类掌握。
  • 未来范式:Agent-first、Software 3.0 与神经计算机将重塑开发流程和软件架构。
Karpathy 的访谈展示了 AI 编程从“凭感觉”到“智能体工程”的演进路径:不再是单纯加速人类写代码,而是重新定义软件开发的方式、质量边界和人机协作模式。

PS:

Harness 工程干货直播,欢迎点击预约,直播见

好了,这就是我今天想分享的内容。如果你对构建企业级 AI 原生应用新架构设计和落地实践感兴趣,别忘了点赞、关注噢~

—1—

加我微信

扫码加我👇有很多不方便公开发公众号的我会直接分享在朋友圈,欢迎你扫码加我个人微信来看👇

加星标★,不错过每一次更新!

⬇戳”阅读原文“,立即预约!