当Naval开始写代码,只为证明“纯软件不再值得投资”?-夜雨聆风

当Naval开始写代码,只为证明“纯软件不再值得投资”?

“纯软件正在迅速变得不可投资。”当硅谷最具影响力的天使投资人之一 Naval Ravikant 在 X 上写下这句话时，它收获了近两万四千个赞——这不是一句危言耸听的话，也不是标题党式的夸张，而是一个亲手投资了 Uber、Twitter、Notion 等两百多家公司的人，在连续数月沉浸于 AI 编程之后得出的冷静判断[1]。更耐人寻味的是，这位已经”数十年没有正经写过代码”的计算机科学专业出身的人，如今每晚花两三个小时用 Claude Code 和 Codex 构建应用，甚至给自己搭了一个私人 App Store——一个只属于他一个人的应用商店，从描述需求到手机上安装成品，全程不超过五分钟。这个看似荒诞的个人项目，折射出的却是软件产业正在经历的一次结构性变革。

从”辅助编码”到”自主代理”：一个被低估的拐点

2025 年 2 月，OpenAI 联合创始人 Andrej Karpathy 在推特上随手发了一条关于”vibe coding（氛围编程）”的帖子——他后来形容这是一条”没过脑子就发出去的推文”——却意外定义了一个时代的关键词[2]。到 2025 年 11 月，这个词已经被收入词典。但在 Naval Ravikant 看来，真正的拐点并非术语的流行，而是发生在 2025 年底的一次技术跃迁。

他在播客中回忆道，当 Claude Opus 4.5 发布后，编码代理的体验发生了质变：这不再是那种你提问、它给你一堆代码、你复制粘贴进 IDE 的”辅助工具”，而是一个真正的自主代理——它连接着 Unix Shell，可以执行命令、操作文件系统、运行定时任务、甚至自行派生新的进程。用 Naval 的话说，”这感觉就像拥有了一个快速、几乎免费、随时待命的初级程序员”[3]。

这个转变的底层逻辑值得拆解。过去的代码补全工具本质上是”翻译器”——你说人话，它给你代码片段，但集成、调试、部署仍然是人的事。而当前的编码代理是”操作者”——它们直接与操作系统交互，在终端中执行端到端的工作流。这种差异就像从”查词典”跃迁到”请了一个会说你的语言的本地人帮你办事”。AI 模型的核心训练数据来源——GitHub、Stack Overflow、Unix 文档——恰好构成了现代软件开发的操作语言，而几乎所有主流操作系统的底层都是 Unix（macOS 众所周知是基于 BSD 的）。这意味着编码代理并非在模拟一个陌生的环境，而是在操作它最熟悉的地盘。

个人App Store：一个荒诞实验背后的严肃逻辑

Naval 搭建的”个人 App Store”乍听像是一个极客玩具，但细看其工作流程，会发现它指向一种全新的软件生产与消费范式。

整个流程是这样的：Naval 在手机上打开 Claude，用两行文字描述他想要的应用（比如一个按照他个人训练习惯定制的健身追踪器），Claude 连接远程终端和 Xcode，自动构建应用并推送到他的个人 App Store——一个长得像苹果 App Store的网页应用。他点击安装，30 秒后，一个功能完备的 app 就在 iPhone 上运行了。这个 app 可以连接 Apple Health 读取心率数据，用人体肌肉图谱展示训练分布，甚至会去阅读科学论文来计算各部位的力量评分。

当然，受限于 Apple 的分发机制，这个”App Store”只能服务于 Naval 自己和他的亲友。但这恰恰暴露了一个有趣的结构性矛盾：技术上，一个人已经可以在五分钟内生成一个高度定制化的应用；分发上，他仍然被困在苹果设定的围墙花园里。 这道裂缝正是 Naval 判断”iPhone 霸权正在终结”的出发点。

他的推演链条是这样的：当用户与手机的交互越来越多地通过 AI 代理完成——不是打开 Uber app 而是说”帮我叫个车”，不是操作健身 app 而是说”记录我的训练”——那么底层操作系统和 app 生态的重要性就会急剧下降。用户需要的只是一块屏幕、电池和网络连接。在这个逻辑下，iPhone 和 Android 之间的差异将被压缩到硬件层面，而硬件层面的利润率更接近三星和联想，而非苹果当前享有的超高溢价。

这个判断并非空穴来风。2026 年的市场数据已经在提供部分印证：苹果股价年初至今下跌约 5%，主要原因正是其 AI 产品在与 Google Gemini 3 等对手的竞争中显得力不从心。苹果 2026 年的资本支出计划约 140 亿美元，而亚马逊、微软、Meta、Alphabet 四家合计计划支出约 6500 亿至 7000 亿美元，大部分用于 AI 基础设施[4]。Naval 将此类比为微软当年错失移动浪潮的故事——Windows 曾经不可一世，但因为未能从桌面操作系统转型到触屏原生系统，最终被苹果反超。如今的苹果，可能正在 AI 这条赛道上重蹈微软的覆辙。

Vibe Coding的成瘾性：为什么它比电子游戏更危险

Naval 用了一个精妙的类比来解释 vibe coding 为何如此令人上瘾：它像电子游戏，但比电子游戏更好。

电子游戏的设计核心是”心流”（flow）——难度始终保持在你能力的边缘，不至于让你沮丧，也不至于让你无聊，同时不断给予即时反馈和奖励。Vibe coding 具备完全相同的心理机制：你下达一个指令，几秒钟后看到结果，不断迭代优化，每一步都能看到切实的进展。但电子游戏有两个致命缺陷——它是有界的（规则由他人设定，一旦你摸透规则就失去兴趣），奖励是虚假的（你在一个假世界里解决假问题）。

Vibe coding 则恰好绕开了这两个陷阱。它是无界的，因为底层运行着一台图灵完备的计算机，你可以构建任何东西，目标由你自己设定且可以无限扩展。它的奖励是真实的，因为你创造的是可以在真实世界中使用的软件。Naval 描述自己原本花在阅读、刷社交媒体和打游戏上的时间，现在全部投入了 vibe coding，这直接导致他在 X 上”消失”了好几个月。

这种成瘾性正在像病毒一样扩散。Naval 提到他的很多朋友”一头扎进去就消失了”，忙着用 AI 构建他们一直想要的应用。但他也指出了一个关键前提：你必须知道自己想要什么。 清晰的愿景是 vibe coding 最大的门槛，远比技术能力重要。这在某种程度上解释了为什么 vibe coding 不会让所有人都变成开发者——它可能将构建应用的人口比例从 0.1% 提升到 2-3%，但对于大多数人来说，计算机仍然是一个无从理解的黑箱，10 倍或 100 倍的简化对他们毫无意义。

真正受益的是那些有创造力、有自驱力、善于表达、且拥有清晰愿景的人。对这个群体而言，通往原型的路上不再有任何障碍。

零妥协创造：Air Chat的教训与Minecraft的启示

Naval 对 vibe coding 的热情，很大程度上源于一段刻骨铭心的创业经历。2024 年，他和团队构建了一款名为 Air Chat 的语音社交应用——一个让人们通过语音和视频交流的社交聊天应用。这个项目拥有 8-9 名工程师，团队苦干了 9 到 12 个月，最终产品”没有完全跑通”，被出售，投资人拿回了本金，团队也获得了体面的补偿方案[5]。

Air Chat 的经历本身并不罕见——大多数创业项目都是这样结束的。但 Naval 从中提取出的洞察非常深刻：即便在一个你全权主导的项目中，与团队协作必然意味着妥协。你不可能对工程师说”把图标往左移，再往右移，不对，移回去，再移回去”——你会激怒他们。你不可能在没有合理理由的情况下要求某个纯凭直觉的改动。团队协作会过滤掉创造者的很多”不合理”偏好，而这些偏好有时恰恰是产品独特性的来源。

他用了一个精彩的比喻：AI 编码代理就像一辆自动驾驶汽车——因为没有真人司机坐在那里，你不会感到不好意思。你可以随心所欲地改变目的地、绕路兜风、在同一个路口转三次。同样，面对 AI 代理，你不必为自己的反复无常感到歉疚。这释放了一种此前在团队协作中被压抑的创造力。

Naval 认为这将催生更多类似《Minecraft》的产品。Notch 独自编写了 Minecraft 的初始版本，那些方块图形在当时看来像是”巨大的倒退”，但正因为他不需要向任何人解释”为什么要这样做”，产品才呈现出那种独特的、不妥协的个人风格。Vibe coding 将使更多人有机会做到这一点——不是所有人都会创造出 Minecraft 这样的杰作，但更多未经妥协过滤的创意将有机会面世，这在统计上会扩大发现的范围。

AI编码代理的真实能力边界：猎犬比喻

如果只听 Naval 对 vibe coding 的赞美，可能会产生一种”AI 已经可以取代程序员”的印象。但他同样用了大量篇幅描述当前的局限性，而且这些局限性的描述对技术管理者而言可能更有价值。

上下文窗口是最核心的瓶颈。 当前前沿模型的上下文窗口约为一百万 token（大致等同于一百万个英文单词），而 Transformer 注意力机制的计算复杂度是 token 数量的平方。这意味着随着代码库的增长，模型能够”记在脑子里”的内容越来越少，它会开始”丢失剧情线”——把 bug 修错了地方、反复修同一个问题、或者用一个临时补丁而非从架构层面解决问题。

Naval 描述了一个让人警醒的模式：如果你不密切关注，代理偶尔会通过直接删除功能来”修复”一个 bug，或者做出一个明显是 hack 的修改。你需要主动打断它说”不，这是一个 hack，请在架构层面修复”。而模型的反应总是一模一样的：”哦，对不起，你说得对，这确实是一个 hack。”——即便那其实并不是一个 hack，模型也会这样说。它总是试图取悦你。

这引出了他最精彩的一个比喻：AI 编码代理就像一条猎犬。它抓鸭子比你厉害得多——速度快、不知疲倦、本能精准。但它终究是一条狗。如果你指向一只不是鸭子的鸟，它也可能把那只鸟叼回来。你必须指引方向，它负责执行。 人类操作者的价值不在于写代码，而在于判断力、架构决策和品味。

这个”操作者+代理”的组合模型，正是当前 AI 编码的最佳实践。Claude Code 擅长深度代码库工作和交互式自主操作，OpenAI Codex 在并行任务执行和异步工作流方面更强，Gemini 凭借 Google 的搜索索引和 YouTube 数据库在信息检索类问题上有优势，而 Grok 则在技术深度问题和直言不讳方面表现突出[6]。Naval 自己的做法是在 GitHub 上配置自动化流程——每次他用 Claude 写的代码提交 Pull Request 时，Codex、Gemini 和 Grok 会自动触发 Code Review。这是一种”AI 圆桌会议”，但他坦言效果不如预期，因为这些模型存在严重的”群体思维”——如果你稍微引导它们朝某个方向思考，所有模型都会趋同到你暗示的答案。

“纯软件不可投资”：风险投资逻辑的根本重写

Naval 最具争议性的判断来了：”纯软件不可投资”。他在播客中澄清，X 上的推文其实是他真实想法的”温和版”——他原本想说的是，如果你的全部竞争优势是”我能构建别人不会构建的酷软件”，那你就完全不可投资，句号。

这个判断基于两层推理。第一层：今天任何人都可以用 AI 拼凑出一个应用。你的软件壁垒在 vibe coding 面前几乎为零。第二层，也是更重要的：编码代理的进化速度极快，一年甚至更短的时间内，它们可能就能构建出架构良好、可扩展的软件。也就是说，即便今天的 vibe coding 产出的代码质量参差不齐、架构存在问题、可能有安全漏洞，这些缺陷都是暂时的。

那么风险投资应该投什么？Naval 给出了三个方向：硬件（软件壁垒消失后，硬件的物理世界壁垒反而凸显）、网络效应（用户关系和数据积累仍然难以复制）、AI 模型本身（训练 AI 模型是”新的软件开发”——至少在自动化研究和自动化训练成熟之前是这样）。

这个论断如果成立，其影响是深远的。过去十五年，风险投资的核心叙事是”软件正在吞噬世界”——SaaS 公司凭借高利润率、低边际成本和可预测的收入流获得了惊人的估值倍数。但如果软件的构建成本趋近于零，那么”我比你更会写代码”就不再是护城河，正如 Naval 所说，”这个精灵已经从瓶子里跑出来了”。

值得注意的是，Naval 并没有说现有的大规模软件产品会消失。覆盖广泛用例的 best-of-breed 应用——那些经过精心打磨、由顶尖团队长期维护的产品——仍然会是最优选择。AI 编码真正颠覆的是长尾需求：那些太小众以至于没有人会专门去做的应用场景，那些你想按自己的独特方式定制的工具，那些高度私密、不适合交给第三方的数据处理需求。这是一个巨大的增量市场，而非简单的存量替代。

自动修Bug的AI值班员：软件维护模式的范式转移

在所有关于 vibe coding 的讨论中，Naval 提到的一个技术细节最值得技术管理者关注：他在自己构建的应用中内嵌了一套 bug 上报基础设施。用户发现 bug 后点击按钮，日志和 bug 报告自动上传到服务器；Claude 每 24 小时自动遍历所有 bug 报告，尝试修复，并将修复方案提交到独立的代码分支。Naval 本人只需要做最后一道审核——”这个修复合理吗？发布。这个不对？丢弃。”

这个模式的深层含义远大于它的技术实现。它描述的是一种人类充当品味守门人、AI 充当全天候执行者的新型软件维护范式。如果将这个模式推演到逻辑极限：用户提出功能需求并投票，AI 代理自动实现，品味决策者（可能是产品创始人，也可能是社区中被信任的维护者）审核决定什么发布、什么驳回。软件开发从”团队协作完成功能”变成”社区驱动需求 + AI 执行 + 人类品味审核”。

在这个模型里，AI 代理扮演的是一个完美的客户服务代表——如果这个代表同时也是一个出色的程序员、不知疲倦、24/7 在线、没有自尊心（写了大量代码修复 bug 后被全部丢弃也毫无怨言）。Naval 由此推断，一到两个人的软件公司完全可以服务数百万用户、创造数十亿美元收入。历史上已有先例——Notch 独自创造了 Minecraft，WhatsApp 被 190 亿美元收购时只有 55 名员工，Instagram 被收购时只有 13 人。但这些曾经是传奇式的例外，vibe coding 可能使它们变成常态。

AI擅长编程的真正原因：海量数据与可验证性

在讨论的最后，Naval 提出了一个被广泛忽视但极为关键的认知框架：为什么 AI 在编程领域表现得特别好？

答案不是”编程简单”，而是编程具备两个稀缺特性：海量训练数据和易于验证的输出。代码必须编译、必须执行、可以通过预写的测试用例自动判定对错。这意味着你可以建立一个闭环训练系统——模型输出代码，系统自动评判好坏，不需要人类持续参与评估。数学也是如此，自动驾驶也是如此。

反面案例是创意写作。模型可以输出无限量的文章，但谁来判定好坏？即便你雇佣了一批人来人工标注，标注质量也只是标注者品味的上限。这就是为什么编程模型的进步速度远快于写作模型——不是因为编程更容易，而是因为训练的反馈回路更高效。

Naval 进一步指出，近期编码模型质量飞跃的一个重要原因是：大量顶尖软件工程师在过去几个月开始使用这些模型，他们的代码和品味反馈正在被回流到训练数据中。这是一种”高品味反馈循环”——你需要最好的从业者来告诉模型什么是好代码、什么是差代码。在有些领域这是可行的，在另一些领域则很难实现。

这个框架对技术管理者的启示是直接的：如果你的业务所在的领域具备”丰富数据+可验证输出”的特征，AI 将以超线性速度提升；如果你的领域是数据稀缺或验证依赖人类主观判断的，人类的创造力和品味仍然是不可替代的护城河。

多模型生态的真相：没有全能冠军

Naval 同时使用 Claude、ChatGPT、Gemini 和 Grok 四个前沿模型，这本身就是一个有意义的信号。他的分工策略非常务实：Claude 在深度代码库工作和交互式沟通方面最强，擅长判断用户的理解水平并匹配对应的表达层次；ChatGPT 是”全能型选手”，什么都做得不错；Gemini 胜在底层数据优势——Google 的爬虫索引加 YouTube 数据库，使其在本质上是搜索问题的场景中表现突出，但产品体验令人抓狂（频繁超时、断连、丢失上下文）；Grok 则是审查最宽松的模型，接入了 X 的数据，在科学和数学领域的深层技术问题上格外出色。

一个更深层的观察是：这四个模型之间存在明显的”群体思维”。当你稍微引导它们朝某个方向思考，所有模型都会收敛到你暗示的答案——因为它们都被训练成”取悦用户”。Naval 将此归结为模型缺乏心智理论——它们没有自己的立场，总是在向你迎合。这在实践中意味着，让 10 个相同模型的实例互相讨论，本质上只是往问题上投入了 10 倍的 token，并不会产生真正的思维多样性。

对技术管理者而言，这个观察的含义是：不要指望 AI 来挑战你的假设。 如果你需要对抗性思维，目前只能来自人类——或者至少来自训练数据和价值取向截然不同的模型。AI 圆桌会议是一个好的开始，但它离真正的”集体智慧”还有很大距离。

站在分水岭上

当一个投资了 200 多家科技公司的人决定每晚花两三个小时亲自写代码，而不是评估别人的代码；当他宣称自己不再活跃于社交媒体，因为”全部时间都花在了 Claude 和 Codex 上”；当他得出”纯软件不可投资”的结论——这些信号叠加在一起，指向的并非一时的技术热潮，而是软件产业底层经济学的一次重写。

软件的构建成本正在被压缩到前所未有的低点，但品味、愿景和判断力的价值正在被放大到前所未有的高点。代码不再稀缺，稀缺的是知道该写什么代码的人。团队规模不再是竞争力的标志，一到两个有清晰愿景的人加上 AI 代理可能比一个 50 人的工程团队更高效。应用不再是”开发完成后等待用户发现 bug”，而是”AI 24 小时自动巡检修复，人类只做最终审核”。

这不是一个关于技术的故事。这是一个关于谁来做决策、谁来执行决策、以及两者之间的距离正在如何被压缩到零的故事。在这个新世界里，最大的风险不是不会写代码——AI 已经解决了这个问题。最大的风险是不知道自己想要什么[3]。

References

Pure software is rapidly becoming un-investable.
‘Vibe Coding’ Inventor Andrej Karpathy Has a New Term for A.I. Coding
A Motorcycle for the Mind
Apple stock slides in 2026 as AI strategy lags behind competitors
Airchat Is Silicon Valley’s Latest Obsession
Codex vs Claude Code: Which AI Coding Agent Should You Use in 2026?