别学工具了 - 你学的AI工具,90% 半年内会消失

我最近看了一场演讲，差点把我的 AI 学习清单全删掉。

演讲者是 Andrej Karpathy——特斯拉前 AI 总监，OpenAI 联创，亲手训练过无数个「你今天在用的模型」的底层技术。

他在 YC AI Startup School 上说了一句话，我反复想了好几天：

"90% AI圈教你的工具将在半年内消失."

他没有说这是坏事。他在说的，是另一件更重要的事。

Software 1.0 → 2.0 → 3.0，你站在哪里？

Karpathy 用了一个框架，我觉得是目前我听过最清楚的 AI 历史坐标系。

Software 1.0，就是我们写的代码。C++、Python，程序员用逻辑告诉计算机该怎么做。

Software 2.0，是神经网络权重。你不写规则，你「训练」出来一组权重，让它帮你写规则。他举的例子是特斯拉 Autopilot——以前有几十万行 C++ 在处理车道识别，后来这些代码被一个个「删掉」，替换成了神经网络。

Software 3.0，就是现在。编程语言变成了英语，LLM 是可编程的神经网络，而 prompt 就是程序。

"现在每个人都是程序员。这在软件历史上是前所未有的。" ——Andrej Karpathy，YC AI Startup School，2025年

这不是在说「AI 会取代程序员」那种老生常谈。

他在说的是：软件的底层基础设施发生了范式迁移——而我们大多数人还在用对待 1.0 的眼光，去追 3.0 时代的工具。

我们活在 AI 的 1960 年代

这是整场演讲里最让我停下来的一个类比。

Karpathy 说，现在的 LLM 时代，大概相当于计算机历史上的 1950 到 1970 年代——大型机时代，分时系统时代。

计算极其昂贵，集中在云端，所有人共享同一台「机器」。OpenAI 的服务器就是那台大型机。ChatGPT 界面就是那个终端（terminal）。

他用了一个让全场笑出来的对比图——左边是 1970 年代的命令行终端，右边是 ChatGPT 的对话框。标注是："They're the same picture."

——个人计算革命还没有发生。

PC 时代还没到。每个人桌面上有一台「自己的 AI」，本地跑、实时响应、不依赖云端，这个时代目前在经济上还不可行。

这意味着什么？

你今天学的大量「工具操作技能」，是在适应一个过渡态的基础设施——不是终态。就像 1965 年你花三个月学会了 IBM 大型机的操作规范，1975 年个人电脑出来，这些知识很多就不再是核心竞争力了。

LLM 是操作系统，不是搜索引擎

Karpathy 给 LLM 用了三个类比：操作系统、电力公用事业、芯片代工厂（fab）。

最有意思的是第一个——操作系统。

他说，LLM 不是一个简单的「电」的类比（均质、可替换、按量计费就行了）。LLM 更像操作系统——

复杂的生态，不同平台之间有切换摩擦，性能、风格、能力各有差异，针对不同场景有专用选择。就像你不会因为 Windows 便宜五块钱就随便换掉，你选择的 OS 会影响你的整套工作流。

System prompt 空间，大概对应操作系统的内核层。用户的输入，对应用户层。这个比喻直接影响你怎么设计产品架构。

这个类比最大的意义在于：LLM 不是商品，是平台。 你不是在「用 AI」，你是在某个 AI 平台上开发。

LLM 有心理学，而且有病

演讲的第二部分，Karpathy 聊的是 LLM 的「心理学」。

他的说法是：LLM 是「人类的随机性模拟」。autoregressive Transformer 是一个模拟器，在模拟人类写出的文字背后那个人。所以它们有涌现出来的「心理」特征——有的模型自信，有的保守，有的话多，有的话少。

但这些「人类模拟」同时也带来了人类式的缺陷。

他用了一个词：顺行性失忆症（Anterograde Amnesia）。

上下文窗口是工作记忆，不是长期记忆。每次对话结束，它就「忘了」。没有持续学习，没有「睡觉」来把今天的经验写进权重。你跟它合作了三个月，第一百零一次打开新对话，它对你的了解是零。

它还容易被骗。Prompt Injection 是真实的安全威胁——恶意内容混进上下文，模型可能被诱导做它不该做的事。

理解你工具的局限性，和理解它的能力同样重要。大多数人只学了一半。

"Agent之年"还是"Agent之十年"？

这一段是我觉得整场演讲里最有价值、也最不受欢迎的部分。

Karpathy 讲了一个故事。2013年，他坐进了一辆 Waymo 的无人驾驶车。从上车那一刻开始，他就觉得「好了，自动驾驶这件事基本上解决了」。Demo 太完美了。

——然后他停顿了一下。

他说：那是 12 年前。

12年后，自动驾驶仍然是一个全行业在攻克的问题。

他的判断是：AI 代理人（Agents）同样「非常棘手」。今天满 AI Twitter 在喊的「Agent之年」，大概率是[Agent之十年」。

他没有说这是坏消息。他只是让你把时间尺度校准正确。

「Vibe Coding」写出来的代码很快——但要把它变成一个真正可用的产品，还要处理支付、身份验证、部署、域名……这些 DevOps 工作，目前仍然需要人类坐在那里点浏览器。

这个瓶颈没有被 AI 解决。至少现在还没有。

那什么是不会过期的？

这是我看完这场演讲最大的收获——不是某个工具，不是某个 prompt 技巧。

是理解框架。

Software 1.0/2.0/3.0 的演进逻辑，不会在半年后过期。LLM 作为操作系统的类比，不会因为 GPT-5 发布就失效。LLM 有「顺行性失忆症」这个特征，在未来很长一段时间里都是产品设计要绕过去的真实约束。

工具会换，框架是底层。

Karpathy 整场演讲花大篇幅讲类比、讲历史、讲系统性认知——而不是告诉你今天该用哪个框架、哪个 API。这不是因为他不关心实操。是因为他太清楚：实操的半衰期是六个月，认知框架的半衰期是十年。

最后说句劝人的话

我知道现在 AI 工具每周都在更新，不学就有罪恶感。

但我劝你停一下，问自己一个问题：我现在在学的东西，是在追工具，还是在建框架？

如果是前者，你在做一件没有复利的事。

这不是让你不学。是让你分清楚，什么是需要跟得上的节奏，什么是可以等一等、让子弹飞一会儿的噪音。

Karpathy 本人花了多少时间？他在 YC 台上讲的，是他花了二十年在战场上打出来的认知——不是上周他看了三篇 Twitter thread 总结出来的。

你不用等二十年。但你至少得把 AI Twitter 静音一个小时，好好把这场演讲看完。

工具在变，但你对「工具在变」这件事的理解，才是你最核心的竞争力。

说真话，不贩焦虑。

如果你觉得这篇文章对你有帮助，请花 1 秒时间：

❤️ 点赞支持🔄 转发分享⭐ 关注我

你的每一个点赞、转发、关注，都是对我最大的鼓励！