来源类型:Twitter/X(Karpathy 推文)+ 研究(a16z Top 100 第 6 版)
昨天,Karpathy 发了一条推文。
前 OpenAI 联合创始人、特斯拉 AI 总监,"vibe coding"这个词的发明者,说了一件事:
你们在聊的 AI,和我在聊的 AI,不是同一个东西。
01
他把用 AI 的人分成了两群。
第一群:去年试过免费 ChatGPT,看过 Advanced Voice Mode 的搞笑视频——"要走路还是开车去洗车?"AI 答错了。
群人笑笑,觉得 AI 就这样。
第二群:花 $200/月,用 Claude Code 或 OpenAI Codex,每天看 AI 把一个本来要花几周的编程任务,在一小时内跑完。
这群人不笑。这群人在谈 AI 带来的"存在性冲击"。
Karpathy 的原话:第二群人正在经历 AI Psychosis——AI 精神失常症,因为他们看到的进步幅度,不是正常的年度产品迭代,是数量级的跃升。
02
两群人为什么看到的东西完全不同?
技术原因只有一句话:强化学习需要可验证的奖励函数。
代码对不对?单元测试过没过?有标准答案,可以自动打分,可以大规模训练。
文章写得好不好?建议给得对不对?没有标准答案,训练效率差一个数量级。
所以 AI 在编程、数学、技术研究这些领域的进步速度,和在写作、搜索、日常问答这些领域的进步速度,不是线性差距,是结构性分叉。
03
然后我去看了 a16z 刚发布的数据。
3 月份,他们发布了「全球 Top 100 AI 消费产品」第 6 版——这是迄今最权威的 AI 使用量排名。
关键数字:
ChatGPT:9 亿周活用户,超过全球人口的 10% [1] Claude:付费用户同比增长 200%+ [1] Gemini:增长 258% [1] Notion AI 已占 Notion 总营收的约 50% [1]
这张榜单里有 ChatGPT、Claude、Gemini、Perplexity、Cursor、Character.AI、Midjourney、CapCut(7.36 亿月活)……
但 Claude Code 不在上面。Codex 不在上面。
因为 a16z 的榜单统计的是消费者流量和 APP 月活。
Claude Code 是开发者工具,按席位收企业费,不走消费者 APP Store。
04
这才是今天最重要的一句话:
a16z Top 100 是第一群人世界的地图。Karpathy 谈的「精神失常」,发生在这张地图之外。
9 亿人用的 AI,和让工程师开始重新思考职业意义的 AI,不共享同一个排行榜,不共享同一个价格层,不共享同一条能力进化曲线。
它们碰巧都叫"AI",但它们是不同的产品。
05
西蒙·威利森在 Karpathy 帖子下面回复了一句话,很精准:
「很多人不知道 OpenAI 的语音模式跑的是旧得多、弱得多的模型。」[2]
OpenAI 的 Advanced Voice Mode,知识截止日期是 2024 年 4 月——还是 GPT-4o 时代的模型。
Karpathy 自己回复说:有朋友告诉他,OpenClaw(今年 1 月爆火的 AI Agent 开源项目,68,000 个 GitHub stars,后被 OpenAI 收购)之所以让这么多普通人震惊,是因为这是他们第一次接触到最新的 Agent 模型。
而不是那个在 Instagram Reels 里答错"要走路还是开车"的那个。
06
对中国老板来说,这件事意味着什么?
不是"要去买更贵的 AI 工具"。
是:你现在让团队用的是哪一层 AI,会决定你形成的是哪一层判断。
如果你的团队在用免费工具或消费级产品,他们形成的对 AI 能力边界的直觉,可能低估了企业级 Agent 工具整整一个数量级。
这不是见识问题。这是系统性的信息不对称。
用第一群人的工具,你永远不会形成第二群人的判断。
07
那谁看到了这件事,提前押注了?
Karpathy 说的三个维度——编程、数学/研究、语音——都已经有人下重注了。
编程:Thrive Capital 最早认清方向。
Cursor 是目前最直接的受益者。从 2022 年 MIT 学生创业,到 2025 年 11 月完成
Thrive 押的逻辑很简单:代码有单元测试,对错一目了然。这是 AI 最容易训练、最容易放大的场景。
Agent 编程:Founders Fund 下了最重的赌注。
Cognition(Devin)由 Peter Thiel 的 Founders Fund 主导,2025 年 9 月完成
Founders Fund 押的不是"更好的代码补全",是完全自主的软件工程师——这是 Karpathy 说的"精神失常"最直接的来源。
语音:Sequoia 在 $110 亿押了 ElevenLabs。
这是 Karpathy 明确说"大实验室不会继续做,留给创业公司的机会"的那个方向。ElevenLabs 2026 年 2 月完成
现在回头看 a16z 的 Top 100 榜单。
Cursor 在上面。ElevenLabs 在上面。
但它们出现的方式是:Cursor 作为开发者工具,ElevenLabs 作为语音 API——不是第一群人每天打开的 APP,而是第二群人用来构建产品的基础设施。
a16z 投了,a16z 的榜单也收录了。
但榜单和投资组合之间的那条缝隙,正是 Karpathy 说的两群人之间的那条裂缝。
给中国老板的三个追问:
你的团队现在用的 AI 产品,月均消费是多少?这个数字,在 Karpathy 的框架里,你们属于哪一群?
你最近一次用 AI 辅助的决策,AI 给的答案是"信息性的",还是真的影响了你的判断方向?
如果明天你的核心工程师开始用企业级 Agent 工具跑了一个月,他们的工作产出会变化多少?你有没有见过这个实验?
进群「AI 商机和商业坑」,我们把这些问题拆得更细。

数据来源:
[1] a16z《Top 100 Gen AI Consumer Apps — 第 6 版》,2026 年 3 月,数据截至 2026 年 1 月。a16z.com/100-gen-ai-apps-6/ ⭐⭐⭐⭐⭐
[2] Andrej Karpathy @karpathy,X 推文,2026 年 4 月 10 日;Simon Willison @simonw 回复 ⭐⭐⭐⭐
[3] Cursor(Anysphere)Series D 融资公告,BusinessWire,2025 年 11 月 13 日,
[4] Cognition AI $4 亿融资,TechCrunch,2025 年 9 月 8 日;ARR 数据来自 Cognition 官方博客 ⭐⭐⭐⭐⭐
[5] ElevenLabs
本文由 ivan-article skill 生产。
来源:Twitter/X 推文 + a16z 研究报告 · Phase 1 核查完成 · Phase 2 写作
夜雨聆风