我最近看了一场演讲,差点把我的 AI 学习清单全删掉。
演讲者是 Andrej Karpathy——特斯拉前 AI 总监,OpenAI 联创,亲手训练过无数个「你今天在用的模型」的底层技术。
他在 YC AI Startup School 上说了一句话,我反复想了好几天:
"90% AI圈教你的工具将在半年内消失."

他没有说这是坏事。他在说的,是另一件更重要的事。
Software 1.0 → 2.0 → 3.0,你站在哪里?
Karpathy 用了一个框架,我觉得是目前我听过最清楚的 AI 历史坐标系。
Software 1.0,就是我们写的代码。C++、Python,程序员用逻辑告诉计算机该怎么做。
Software 2.0,是神经网络权重。你不写规则,你「训练」出来一组权重,让它帮你写规则。他举的例子是特斯拉 Autopilot——以前有几十万行 C++ 在处理车道识别,后来这些代码被一个个「删掉」,替换成了神经网络。
Software 3.0,就是现在。编程语言变成了英语,LLM 是可编程的神经网络,而 prompt 就是程序。
"现在每个人都是程序员。这在软件历史上是前所未有的。" ——Andrej Karpathy,YC AI Startup School,2025年
这不是在说「AI 会取代程序员」那种老生常谈。
他在说的是:软件的底层基础设施发生了范式迁移——而我们大多数人还在用对待 1.0 的眼光,去追 3.0 时代的工具。
我们活在 AI 的 1960 年代
这是整场演讲里最让我停下来的一个类比。
Karpathy 说,现在的 LLM 时代,大概相当于计算机历史上的 1950 到 1970 年代——大型机时代,分时系统时代。
计算极其昂贵,集中在云端,所有人共享同一台「机器」。OpenAI 的服务器就是那台大型机。ChatGPT 界面就是那个终端(terminal)。
他用了一个让全场笑出来的对比图——左边是 1970 年代的命令行终端,右边是 ChatGPT 的对话框。标注是:"They're the same picture."
——个人计算革命还没有发生。
PC 时代还没到。每个人桌面上有一台「自己的 AI」,本地跑、实时响应、不依赖云端,这个时代目前在经济上还不可行。
这意味着什么?
你今天学的大量「工具操作技能」,是在适应一个过渡态的基础设施——不是终态。就像 1965 年你花三个月学会了 IBM 大型机的操作规范,1975 年个人电脑出来,这些知识很多就不再是核心竞争力了。
LLM 是操作系统,不是搜索引擎
Karpathy 给 LLM 用了三个类比:操作系统、电力公用事业、芯片代工厂(fab)。
最有意思的是第一个——操作系统。
他说,LLM 不是一个简单的「电」的类比(均质、可替换、按量计费就行了)。LLM 更像操作系统——
复杂的生态,不同平台之间有切换摩擦,性能、风格、能力各有差异,针对不同场景有专用选择。就像你不会因为 Windows 便宜五块钱就随便换掉,你选择的 OS 会影响你的整套工作流。
System prompt 空间,大概对应操作系统的内核层。用户的输入,对应用户层。这个比喻直接影响你怎么设计产品架构。
这个类比最大的意义在于:LLM 不是商品,是平台。 你不是在「用 AI」,你是在某个 AI 平台上开发。
LLM 有心理学,而且有病
演讲的第二部分,Karpathy 聊的是 LLM 的「心理学」。
他的说法是:LLM 是「人类的随机性模拟」。autoregressive Transformer 是一个模拟器,在模拟人类写出的文字背后那个人。所以它们有涌现出来的「心理」特征——有的模型自信,有的保守,有的话多,有的话少。
但这些「人类模拟」同时也带来了人类式的缺陷。
他用了一个词:顺行性失忆症(Anterograde Amnesia)。
上下文窗口是工作记忆,不是长期记忆。每次对话结束,它就「忘了」。没有持续学习,没有「睡觉」来把今天的经验写进权重。你跟它合作了三个月,第一百零一次打开新对话,它对你的了解是零。
它还容易被骗。Prompt Injection 是真实的安全威胁——恶意内容混进上下文,模型可能被诱导做它不该做的事。
理解你工具的局限性,和理解它的能力同样重要。大多数人只学了一半。
"Agent之年"还是"Agent之十年"?
这一段是我觉得整场演讲里最有价值、也最不受欢迎的部分。
Karpathy 讲了一个故事。2013年,他坐进了一辆 Waymo 的无人驾驶车。从上车那一刻开始,他就觉得「好了,自动驾驶这件事基本上解决了」。Demo 太完美了。
——然后他停顿了一下。
他说:那是 12 年前。
12年后,自动驾驶仍然是一个全行业在攻克的问题。
他的判断是:AI 代理人(Agents)同样「非常棘手」。今天满 AI Twitter 在喊的「Agent之年」,大概率是[Agent之十年」。
他没有说这是坏消息。他只是让你把时间尺度校准正确。
「Vibe Coding」写出来的代码很快——但要把它变成一个真正可用的产品,还要处理支付、身份验证、部署、域名……这些 DevOps 工作,目前仍然需要人类坐在那里点浏览器。
这个瓶颈没有被 AI 解决。至少现在还没有。
那什么是不会过期的?
这是我看完这场演讲最大的收获——不是某个工具,不是某个 prompt 技巧。
是理解框架。
Software 1.0/2.0/3.0 的演进逻辑,不会在半年后过期。LLM 作为操作系统的类比,不会因为 GPT-5 发布就失效。LLM 有「顺行性失忆症」这个特征,在未来很长一段时间里都是产品设计要绕过去的真实约束。
工具会换,框架是底层。
Karpathy 整场演讲花大篇幅讲类比、讲历史、讲系统性认知——而不是告诉你今天该用哪个框架、哪个 API。这不是因为他不关心实操。是因为他太清楚:实操的半衰期是六个月,认知框架的半衰期是十年。
最后说句劝人的话
我知道现在 AI 工具每周都在更新,不学就有罪恶感。
但我劝你停一下,问自己一个问题:我现在在学的东西,是在追工具,还是在建框架?
如果是前者,你在做一件没有复利的事。
这不是让你不学。是让你分清楚,什么是需要跟得上的节奏,什么是可以等一等、让子弹飞一会儿的噪音。
Karpathy 本人花了多少时间?他在 YC 台上讲的,是他花了二十年在战场上打出来的认知——不是上周他看了三篇 Twitter thread 总结出来的。
你不用等二十年。但你至少得把 AI Twitter 静音一个小时,好好把这场演讲看完。
工具在变,但你对「工具在变」这件事的理解,才是你最核心的竞争力。
如果你觉得这篇文章对你有帮助,请花 1 秒时间:
❤️ 点赞支持🔄 转发分享⭐ 关注我
你的每一个点赞、转发、关注,都是对我最大的鼓励!
夜雨聆风