当Naval开始写代码,只为证明“纯软件不再值得投资”?
“纯软件正在迅速变得不可投资。”当硅谷最具影响力的天使投资人之一 Naval Ravikant 在 X 上写下这句话时,它收获了近两万四千个赞——这不是一句危言耸听的话,也不是标题党式的夸张,而是一个亲手投资了 Uber、Twitter、Notion 等两百多家公司的人,在连续数月沉浸于 AI 编程之后得出的冷静判断[1]。更耐人寻味的是,这位已经”数十年没有正经写过代码”的计算机科学专业出身的人,如今每晚花两三个小时用 Claude Code 和 Codex 构建应用,甚至给自己搭了一个私人 App Store——一个只属于他一个人的应用商店,从描述需求到手机上安装成品,全程不超过五分钟。这个看似荒诞的个人项目,折射出的却是软件产业正在经历的一次结构性变革。
从”辅助编码”到”自主代理”:一个被低估的拐点
2025 年 2 月,OpenAI 联合创始人 Andrej Karpathy 在推特上随手发了一条关于”vibe coding(氛围编程)”的帖子——他后来形容这是一条”没过脑子就发出去的推文”——却意外定义了一个时代的关键词[2]。到 2025 年 11 月,这个词已经被收入词典。但在 Naval Ravikant 看来,真正的拐点并非术语的流行,而是发生在 2025 年底的一次技术跃迁。
他在播客中回忆道,当 Claude Opus 4.5 发布后,编码代理的体验发生了质变:这不再是那种你提问、它给你一堆代码、你复制粘贴进 IDE 的”辅助工具”,而是一个真正的自主代理——它连接着 Unix Shell,可以执行命令、操作文件系统、运行定时任务、甚至自行派生新的进程。用 Naval 的话说,”这感觉就像拥有了一个快速、几乎免费、随时待命的初级程序员”[3]。
这个转变的底层逻辑值得拆解。过去的代码补全工具本质上是”翻译器”——你说人话,它给你代码片段,但集成、调试、部署仍然是人的事。而当前的编码代理是”操作者”——它们直接与操作系统交互,在终端中执行端到端的工作流。这种差异就像从”查词典”跃迁到”请了一个会说你的语言的本地人帮你办事”。AI 模型的核心训练数据来源——GitHub、Stack Overflow、Unix 文档——恰好构成了现代软件开发的操作语言,而几乎所有主流操作系统的底层都是 Unix(macOS 众所周知是基于 BSD 的)。这意味着编码代理并非在模拟一个陌生的环境,而是在操作它最熟悉的地盘。
个人App Store:一个荒诞实验背后的严肃逻辑
Naval 搭建的”个人 App Store”乍听像是一个极客玩具,但细看其工作流程,会发现它指向一种全新的软件生产与消费范式。
整个流程是这样的:Naval 在手机上打开 Claude,用两行文字描述他想要的应用(比如一个按照他个人训练习惯定制的健身追踪器),Claude 连接远程终端和 Xcode,自动构建应用并推送到他的个人 App Store——一个长得像苹果 App Store的网页应用。他点击安装,30 秒后,一个功能完备的 app 就在 iPhone 上运行了。这个 app 可以连接 Apple Health 读取心率数据,用人体肌肉图谱展示训练分布,甚至会去阅读科学论文来计算各部位的力量评分。
当然,受限于 Apple 的分发机制,这个”App Store”只能服务于 Naval 自己和他的亲友。但这恰恰暴露了一个有趣的结构性矛盾:技术上,一个人已经可以在五分钟内生成一个高度定制化的应用;分发上,他仍然被困在苹果设定的围墙花园里。 这道裂缝正是 Naval 判断”iPhone 霸权正在终结”的出发点。
他的推演链条是这样的:当用户与手机的交互越来越多地通过 AI 代理完成——不是打开 Uber app 而是说”帮我叫个车”,不是操作健身 app 而是说”记录我的训练”——那么底层操作系统和 app 生态的重要性就会急剧下降。用户需要的只是一块屏幕、电池和网络连接。在这个逻辑下,iPhone 和 Android 之间的差异将被压缩到硬件层面,而硬件层面的利润率更接近三星和联想,而非苹果当前享有的超高溢价。
这个判断并非空穴来风。2026 年的市场数据已经在提供部分印证:苹果股价年初至今下跌约 5%,主要原因正是其 AI 产品在与 Google Gemini 3 等对手的竞争中显得力不从心。苹果 2026 年的资本支出计划约 140 亿美元,而亚马逊、微软、Meta、Alphabet 四家合计计划支出约 6500 亿至 7000 亿美元,大部分用于 AI 基础设施[4]。Naval 将此类比为微软当年错失移动浪潮的故事——Windows 曾经不可一世,但因为未能从桌面操作系统转型到触屏原生系统,最终被苹果反超。如今的苹果,可能正在 AI 这条赛道上重蹈微软的覆辙。
Vibe Coding的成瘾性:为什么它比电子游戏更危险
Naval 用了一个精妙的类比来解释 vibe coding 为何如此令人上瘾:它像电子游戏,但比电子游戏更好。
电子游戏的设计核心是”心流”(flow)——难度始终保持在你能力的边缘,不至于让你沮丧,也不至于让你无聊,同时不断给予即时反馈和奖励。Vibe coding 具备完全相同的心理机制:你下达一个指令,几秒钟后看到结果,不断迭代优化,每一步都能看到切实的进展。但电子游戏有两个致命缺陷——它是有界的(规则由他人设定,一旦你摸透规则就失去兴趣),奖励是虚假的(你在一个假世界里解决假问题)。
Vibe coding 则恰好绕开了这两个陷阱。它是无界的,因为底层运行着一台图灵完备的计算机,你可以构建任何东西,目标由你自己设定且可以无限扩展。它的奖励是真实的,因为你创造的是可以在真实世界中使用的软件。Naval 描述自己原本花在阅读、刷社交媒体和打游戏上的时间,现在全部投入了 vibe coding,这直接导致他在 X 上”消失”了好几个月。
这种成瘾性正在像病毒一样扩散。Naval 提到他的很多朋友”一头扎进去就消失了”,忙着用 AI 构建他们一直想要的应用。但他也指出了一个关键前提:你必须知道自己想要什么。 清晰的愿景是 vibe coding 最大的门槛,远比技术能力重要。这在某种程度上解释了为什么 vibe coding 不会让所有人都变成开发者——它可能将构建应用的人口比例从 0.1% 提升到 2-3%,但对于大多数人来说,计算机仍然是一个无从理解的黑箱,10 倍或 100 倍的简化对他们毫无意义。
真正受益的是那些有创造力、有自驱力、善于表达、且拥有清晰愿景的人。对这个群体而言,通往原型的路上不再有任何障碍。
零妥协创造:Air Chat的教训与Minecraft的启示
Naval 对 vibe coding 的热情,很大程度上源于一段刻骨铭心的创业经历。2024 年,他和团队构建了一款名为 Air Chat 的语音社交应用——一个让人们通过语音和视频交流的社交聊天应用。这个项目拥有 8-9 名工程师,团队苦干了 9 到 12 个月,最终产品”没有完全跑通”,被出售,投资人拿回了本金,团队也获得了体面的补偿方案[5]。
Air Chat 的经历本身并不罕见——大多数创业项目都是这样结束的。但 Naval 从中提取出的洞察非常深刻:即便在一个你全权主导的项目中,与团队协作必然意味着妥协。你不可能对工程师说”把图标往左移,再往右移,不对,移回去,再移回去”——你会激怒他们。你不可能在没有合理理由的情况下要求某个纯凭直觉的改动。团队协作会过滤掉创造者的很多”不合理”偏好,而这些偏好有时恰恰是产品独特性的来源。
他用了一个精彩的比喻:AI 编码代理就像一辆自动驾驶汽车——因为没有真人司机坐在那里,你不会感到不好意思。你可以随心所欲地改变目的地、绕路兜风、在同一个路口转三次。同样,面对 AI 代理,你不必为自己的反复无常感到歉疚。这释放了一种此前在团队协作中被压抑的创造力。
Naval 认为这将催生更多类似《Minecraft》的产品。Notch 独自编写了 Minecraft 的初始版本,那些方块图形在当时看来像是”巨大的倒退”,但正因为他不需要向任何人解释”为什么要这样做”,产品才呈现出那种独特的、不妥协的个人风格。Vibe coding 将使更多人有机会做到这一点——不是所有人都会创造出 Minecraft 这样的杰作,但更多未经妥协过滤的创意将有机会面世,这在统计上会扩大发现的范围。
AI编码代理的真实能力边界:猎犬比喻
如果只听 Naval 对 vibe coding 的赞美,可能会产生一种”AI 已经可以取代程序员”的印象。但他同样用了大量篇幅描述当前的局限性,而且这些局限性的描述对技术管理者而言可能更有价值。
上下文窗口是最核心的瓶颈。 当前前沿模型的上下文窗口约为一百万 token(大致等同于一百万个英文单词),而 Transformer 注意力机制的计算复杂度是 token 数量的平方。这意味着随着代码库的增长,模型能够”记在脑子里”的内容越来越少,它会开始”丢失剧情线”——把 bug 修错了地方、反复修同一个问题、或者用一个临时补丁而非从架构层面解决问题。
Naval 描述了一个让人警醒的模式:如果你不密切关注,代理偶尔会通过直接删除功能来”修复”一个 bug,或者做出一个明显是 hack 的修改。你需要主动打断它说”不,这是一个 hack,请在架构层面修复”。而模型的反应总是一模一样的:”哦,对不起,你说得对,这确实是一个 hack。”——即便那其实并不是一个 hack,模型也会这样说。它总是试图取悦你。
这引出了他最精彩的一个比喻:AI 编码代理就像一条猎犬。它抓鸭子比你厉害得多——速度快、不知疲倦、本能精准。但它终究是一条狗。如果你指向一只不是鸭子的鸟,它也可能把那只鸟叼回来。你必须指引方向,它负责执行。 人类操作者的价值不在于写代码,而在于判断力、架构决策和品味。
这个”操作者+代理”的组合模型,正是当前 AI 编码的最佳实践。Claude Code 擅长深度代码库工作和交互式自主操作,OpenAI Codex 在并行任务执行和异步工作流方面更强,Gemini 凭借 Google 的搜索索引和 YouTube 数据库在信息检索类问题上有优势,而 Grok 则在技术深度问题和直言不讳方面表现突出[6]。Naval 自己的做法是在 GitHub 上配置自动化流程——每次他用 Claude 写的代码提交 Pull Request 时,Codex、Gemini 和 Grok 会自动触发 Code Review。这是一种”AI 圆桌会议”,但他坦言效果不如预期,因为这些模型存在严重的”群体思维”——如果你稍微引导它们朝某个方向思考,所有模型都会趋同到你暗示的答案。
“纯软件不可投资”:风险投资逻辑的根本重写
Naval 最具争议性的判断来了:”纯软件不可投资”。他在播客中澄清,X 上的推文其实是他真实想法的”温和版”——他原本想说的是,如果你的全部竞争优势是”我能构建别人不会构建的酷软件”,那你就完全不可投资,句号。
这个判断基于两层推理。第一层:今天任何人都可以用 AI 拼凑出一个应用。你的软件壁垒在 vibe coding 面前几乎为零。第二层,也是更重要的:编码代理的进化速度极快,一年甚至更短的时间内,它们可能就能构建出架构良好、可扩展的软件。也就是说,即便今天的 vibe coding 产出的代码质量参差不齐、架构存在问题、可能有安全漏洞,这些缺陷都是暂时的。
那么风险投资应该投什么?Naval 给出了三个方向:硬件(软件壁垒消失后,硬件的物理世界壁垒反而凸显)、网络效应(用户关系和数据积累仍然难以复制)、AI 模型本身(训练 AI 模型是”新的软件开发”——至少在自动化研究和自动化训练成熟之前是这样)。
这个论断如果成立,其影响是深远的。过去十五年,风险投资的核心叙事是”软件正在吞噬世界”——SaaS 公司凭借高利润率、低边际成本和可预测的收入流获得了惊人的估值倍数。但如果软件的构建成本趋近于零,那么”我比你更会写代码”就不再是护城河,正如 Naval 所说,”这个精灵已经从瓶子里跑出来了”。
值得注意的是,Naval 并没有说现有的大规模软件产品会消失。覆盖广泛用例的 best-of-breed 应用——那些经过精心打磨、由顶尖团队长期维护的产品——仍然会是最优选择。AI 编码真正颠覆的是长尾需求:那些太小众以至于没有人会专门去做的应用场景,那些你想按自己的独特方式定制的工具,那些高度私密、不适合交给第三方的数据处理需求。这是一个巨大的增量市场,而非简单的存量替代。
自动修Bug的AI值班员:软件维护模式的范式转移
在所有关于 vibe coding 的讨论中,Naval 提到的一个技术细节最值得技术管理者关注:他在自己构建的应用中内嵌了一套 bug 上报基础设施。用户发现 bug 后点击按钮,日志和 bug 报告自动上传到服务器;Claude 每 24 小时自动遍历所有 bug 报告,尝试修复,并将修复方案提交到独立的代码分支。Naval 本人只需要做最后一道审核——”这个修复合理吗?发布。这个不对?丢弃。”
这个模式的深层含义远大于它的技术实现。它描述的是一种人类充当品味守门人、AI 充当全天候执行者的新型软件维护范式。如果将这个模式推演到逻辑极限:用户提出功能需求并投票,AI 代理自动实现,品味决策者(可能是产品创始人,也可能是社区中被信任的维护者)审核决定什么发布、什么驳回。软件开发从”团队协作完成功能”变成”社区驱动需求 + AI 执行 + 人类品味审核”。
在这个模型里,AI 代理扮演的是一个完美的客户服务代表——如果这个代表同时也是一个出色的程序员、不知疲倦、24/7 在线、没有自尊心(写了大量代码修复 bug 后被全部丢弃也毫无怨言)。Naval 由此推断,一到两个人的软件公司完全可以服务数百万用户、创造数十亿美元收入。历史上已有先例——Notch 独自创造了 Minecraft,WhatsApp 被 190 亿美元收购时只有 55 名员工,Instagram 被收购时只有 13 人。但这些曾经是传奇式的例外,vibe coding 可能使它们变成常态。
AI擅长编程的真正原因:海量数据与可验证性
在讨论的最后,Naval 提出了一个被广泛忽视但极为关键的认知框架:为什么 AI 在编程领域表现得特别好?
答案不是”编程简单”,而是编程具备两个稀缺特性:海量训练数据和易于验证的输出。代码必须编译、必须执行、可以通过预写的测试用例自动判定对错。这意味着你可以建立一个闭环训练系统——模型输出代码,系统自动评判好坏,不需要人类持续参与评估。数学也是如此,自动驾驶也是如此。
反面案例是创意写作。模型可以输出无限量的文章,但谁来判定好坏?即便你雇佣了一批人来人工标注,标注质量也只是标注者品味的上限。这就是为什么编程模型的进步速度远快于写作模型——不是因为编程更容易,而是因为训练的反馈回路更高效。
Naval 进一步指出,近期编码模型质量飞跃的一个重要原因是:大量顶尖软件工程师在过去几个月开始使用这些模型,他们的代码和品味反馈正在被回流到训练数据中。这是一种”高品味反馈循环”——你需要最好的从业者来告诉模型什么是好代码、什么是差代码。在有些领域这是可行的,在另一些领域则很难实现。
这个框架对技术管理者的启示是直接的:如果你的业务所在的领域具备”丰富数据+可验证输出”的特征,AI 将以超线性速度提升;如果你的领域是数据稀缺或验证依赖人类主观判断的,人类的创造力和品味仍然是不可替代的护城河。
多模型生态的真相:没有全能冠军
Naval 同时使用 Claude、ChatGPT、Gemini 和 Grok 四个前沿模型,这本身就是一个有意义的信号。他的分工策略非常务实:Claude 在深度代码库工作和交互式沟通方面最强,擅长判断用户的理解水平并匹配对应的表达层次;ChatGPT 是”全能型选手”,什么都做得不错;Gemini 胜在底层数据优势——Google 的爬虫索引加 YouTube 数据库,使其在本质上是搜索问题的场景中表现突出,但产品体验令人抓狂(频繁超时、断连、丢失上下文);Grok 则是审查最宽松的模型,接入了 X 的数据,在科学和数学领域的深层技术问题上格外出色。
一个更深层的观察是:这四个模型之间存在明显的”群体思维”。当你稍微引导它们朝某个方向思考,所有模型都会收敛到你暗示的答案——因为它们都被训练成”取悦用户”。Naval 将此归结为模型缺乏心智理论——它们没有自己的立场,总是在向你迎合。这在实践中意味着,让 10 个相同模型的实例互相讨论,本质上只是往问题上投入了 10 倍的 token,并不会产生真正的思维多样性。
对技术管理者而言,这个观察的含义是:不要指望 AI 来挑战你的假设。 如果你需要对抗性思维,目前只能来自人类——或者至少来自训练数据和价值取向截然不同的模型。AI 圆桌会议是一个好的开始,但它离真正的”集体智慧”还有很大距离。
站在分水岭上
当一个投资了 200 多家科技公司的人决定每晚花两三个小时亲自写代码,而不是评估别人的代码;当他宣称自己不再活跃于社交媒体,因为”全部时间都花在了 Claude 和 Codex 上”;当他得出”纯软件不可投资”的结论——这些信号叠加在一起,指向的并非一时的技术热潮,而是软件产业底层经济学的一次重写。
软件的构建成本正在被压缩到前所未有的低点,但品味、愿景和判断力的价值正在被放大到前所未有的高点。代码不再稀缺,稀缺的是知道该写什么代码的人。团队规模不再是竞争力的标志,一到两个有清晰愿景的人加上 AI 代理可能比一个 50 人的工程团队更高效。应用不再是”开发完成后等待用户发现 bug”,而是”AI 24 小时自动巡检修复,人类只做最终审核”。
这不是一个关于技术的故事。这是一个关于谁来做决策、谁来执行决策、以及两者之间的距离正在如何被压缩到零的故事。在这个新世界里,最大的风险不是不会写代码——AI 已经解决了这个问题。最大的风险是不知道自己想要什么[3]。
References
-
Pure software is rapidly becoming un-investable. -
‘Vibe Coding’ Inventor Andrej Karpathy Has a New Term for A.I. Coding -
A Motorcycle for the Mind -
Apple stock slides in 2026 as AI strategy lags behind competitors -
Airchat Is Silicon Valley’s Latest Obsession -
Codex vs Claude Code: Which AI Coding Agent Should You Use in 2026?
夜雨聆风