OpenAI 端出了那颗叫辣椒的芯片:英伟达的客户,开始造自己的心脏

6 月 24 日晚，旧金山时间下午。

我盯着 Twitter 上的那段 47 秒视频看了三遍。博通 CEO Hock Tan 双手捧着一个银色小盒子，递给 Sam Altman 和 Greg Brockman 。

盒子里装的不是别的——是 OpenAI 历史上第一颗自研 AI 芯片，代号 Jalapeño（墨西哥辣椒）。

我愣了一会儿。然后我去刷英伟达的盘后股价，几乎没动。

不应该没动。

我心里咯噔一下。

这种感觉很难描述——不是兴奋，是有点慌。盘后没动，意味着市场还没看懂这件事。但对任何一个在芯片圈混了几年的人， 9 个月这个数字已经够炸裂了。

为什么慌？我自己说不太清楚。先往后看吧。

一、一颗叫"辣椒"的芯片，到底是什么

先把事实摆出来。

当地时间 6 月 24 日， OpenAI 联合博通正式发布 Jalapeño 。官方英文名字是 "Intelligence Processor"——它自己发明了一个新词。专为大语言模型（ LLM ）推理设计，不是训练，是推理。

三方分工极其清楚：

•OpenAI 负责底层架构设计

•博通（ Broadcom ） 负责硅片实现 + 网络互联

•Celestica（加拿大）负责板卡与机架系统集成

•台积电（ TSMC ） 3 纳米先进制程代工

发布现场有四个名字被反复念到——Hock Tan 、 Charlie Kawwas 、 Sam Altman 、 Greg Brockman。

几个关键数字需要记住：

9 个月。从白纸一张到工程样片跑通 GPT-5.3-Codex-Spark ，只用了 9 个月。行业惯例是 18 到 24 个月。 Google TPU 两年一代， Amazon Trainium 大致也是这个节奏。AI 替 AI 砍掉了那 18 个月里最磨人的"设计—验证—改—再验证"循环。

50%。官方说推理成本可以省 50%。每瓦性能将大幅优于当前业界最先进水平——这是 Broadcom 投资者关系页面上原话，没给具体数字，但"大幅"两个字在英文公告里只出现一次。

千兆瓦（ GW ）级。 2026 年底开始首批部署。规模是吉瓦级数据中心——这意味着单单一颗推理芯片要撬动的电力，相当于两到三个核电站的稳态输出。

2%。博通股价当天盘中一度涨 2%。市场反应不算剧烈——可能因为英伟达跌得也不多，整个故事还在"传言变事实"阶段。

扯。

这哪儿是不剧烈。这分明就是 6 月 24 日当天最大的一件事，只是没几个人敢在收盘前下注。黄仁勋在第二天财报电话会上大概率要直面这个问题。我等不及想看他怎么回。

微软合作。首批 GW 级数据中心跟 Microsoft 一起搞。 Celestica 负责把芯片变成机柜。

Greg Brockman 发的原话是："世界正在向算力驱动的经济转变。 Jalapeño 是我们长期全栈基础设施战略的一部分。"

Brockman 还说了句挺刺耳的话——"通过自行设计更多技术栈，我们可以以更高效率提供更多智能。"

更高效率提供更多智能。翻译成大白话就是：我自己造心脏，别让中间商赚差价。

二、 9 个月是怎么挤出来的——AI 给 AI 动手术

我做了八年科技记者，看过无数芯片发布。能 9 个月从零流片到跑通大模型，这在以前是科幻。

核心提速点在三块——

第一块是 Richard Ho 这个名字。 OpenAI 硬件项目负责人，Google TPU 待了将近九年。是 TPU 高级工程总监级别的老人。后来去光子计算公司 Lightmatter 当高级副总裁，又联合创办了 EDA 公司 0-In Design Automation 。这个人的简历，就是 ASIC 工程经验的浓缩包。

第二块是 OpenAI 自家模型直接参与了芯片设计。读历史设计数据、生成 RTL 代码、辅助验证和 debug 、优化布局布线。不是辅助，是干了一半的活儿。这是 AI 替 AI 砍周期的根本。

恐怖吧？细想。

第三块是 OpenAI 的工作负载极度清晰。它知道自己要跑什么——ChatGPT 、 Codex 、未来的 agent 。不是造一颗通用芯片，是造一颗专门给 LLM 推理用的窄门芯片。这意味着架构选择可以很激进，不用照顾通用场景。

Greg Brockman 讲得很坦白："我们对工作负载有深入理解。我们一直在寻找那些服务不足的特定工作负载。"

说白了——OpenAI 比任何一家芯片公司都更懂 LLM 跑起来是什么样子。这才是它敢下场的真正底气。

Richard Ho 的原话更值得琢磨："为模型要去的方向设计硬件，而不是为它现在的样子。"

一个卖硬件的负责人，先承认自己设计的是为"未来模型"准备的硬件。这话说得漂亮，但也很冒险——如果 GPT-6 走的是另一条路呢？

但反过来想，不冒这个险，永远都是给英伟达打工。

我盯着 OpenAI 的招聘页面看了半天。硬件团队还在招人，从 9 个月前的 20 人小分队，今天已经接近 200 人。这速度，跟 Google TPU 团队的扩张曲线几乎一模一样。

嗯。

这才是真问题。OpenAI 不只是造一颗芯片。它在复制 Google TPU 团队的全部打法。

三、英伟达的客户名单，正在变成对手名单

更让我心里一紧的是另一张图。

我把过去 5 年主要 AI 客户的"自研芯片"动作摆在一起看：

公司	自研芯片	用途	跟英伟达关系
Google	TPU v4/v5/v6	训练 + 推理	跟英伟达并存
Amazon	Trainium / Inferentia	推理为主	跟英伟达并存
Microsoft	Maia 100 / 200	推理为主	跟英伟达并存
Meta	MTIA v1/v2	推理 + 推荐	跟英伟达并存
Apple	神经网络引擎 + M-series	端侧 + 云侧	跟英伟达无直接关系
OpenAI	Jalapeño	推理	OpenAI 既是英伟达最大客户之一，又是新对手

这不是巧合。这是英伟达的最大客户在集体自建心脏。

反面假设一下——如果 OpenAI 把推理负载 50% 切到 Jalapeño 上， 2027 年会怎样？

按 OpenAI 现在年算力支出"百亿美元级别"算，50% 切走意味着 50 亿美元规模的订单从英伟达账上消失。一年。

50 亿什么概念？差不多是英伟达 2025 年单季净利润的三分之一。

这事儿如果真发生，英伟达那一年的故事会很难讲。

但这还不是最可怕的。

最可怕的是，英伟达的客户每走一个，就多一个会对外卖芯片的对手。

Google TPU 现在已经通过 GCP 对外服务。 Amazon Trainium 也开始接外部客户。未来 Broadcom + OpenAI 这条路跑通， OpenAI 会不会也对外卖 Jalapeño 推理服务？

别说不可能。

Meta 5 月刚裁了 8000 人、亚马逊裁了 3 万、 Microsoft 也在调整。如果这些被裁出来的硬件人才自己组队，用 Broadcom 的网络 + OpenAI 验证过的架构 + Celestica 的机柜，做出一颗 inference-as-a-service 的芯片，对英伟达才是真正的一刀。

扎心。

我说得有点远，但方向不绕。

英伟达的护城河不是 GPU ，是 CUDA 软件生态 + NVLink 网络 + 系统级优化。这些东西，理论上也能被复制，只是需要时间。

Jalapeño 不直接挑战 CUDA——但它证明了"客户自研"这条路 9 个月就能跑通。

这个信号，比芯片本身更危险。

9 个月。我反复念这个数字。

四、 6 月 24 日那 12 小时， OpenAI 之外还发生了什么

真正让我失眠的，是 Jalapeño 只是 6 月 24 日那 12 小时里的第一条新闻。

我把当天主要动作捋一遍——

0:30 早——WSJ 曝光奥特曼的"私人提款机"。 OpenAI 机密 IPO 文件中暴露约 6650 亿美元的潜在债务与或有支出。奥特曼本人对 OpenAI 持股接近 0 ，但通过关联交易形成上百亿美元的造富闭环。

上午——OpenAI 联合博通发布 Jalapeño 。

下午——Anthropic 拿下斯坦福经济学讲席教授 Chad Jones，长期经济增长、技术进步方向。 Anthropic 在 IPO 敲钟前夜密集延揽诺奖级、泰斗级经济学家，它在为"国家 AI 大账本"提前组队。

下午——Google Gemini 3.5 Flash 上线 Computer use 能力。模型可直接读取屏幕内容、驱动浏览器与桌面应用完成任务。Flash 层级——这意味着走的是高频日常任务自动化，跟 OpenAI / Anthropic 的"重型 agent"形成差异化。

下午——Anthropic Claude Code 大升级。Karpathy 直接出来站台——"这是 LLM 用户界面的第三次变革——前两次分别是网页版聊天和桌面应用，这次 Claude Code 直接以系统级 Agent 的形态存在。"

晚间——豆包 2.1 Pro 上线 Agent 办公任务。 36 氪实测对标 Claude Opus 4.6 。豆包日活已破 2 亿——国内第一款把 Agent 办公任务直接放进国民级 AI 应用的尝试。

晚间——纽约时报曝光 NSA 在与 Anthropic 的合同争执中失去对其顶级 AI 模型访问权限。白宫被迫推出"政府专用 / 内网化"的 AI 模型部署方案。

晚间——Baseten 拿下 15 亿美元（约 101 亿人民币）新一轮融资，估值 130 亿美元，英伟达参与。这家做企业级 AI 推理基础设施的公司，过去 18 个月收入暴增 2000%。

8 件事。OpenAI 造自己的芯片、 Anthropic 抢经济学家、 Google 让 Flash 能动鼠标、 Karpathy 站台 Claude Code 、豆包 Pro 抢 Agent 办公、 NSA 被 Anthropic 拒之门外、英伟达一边被客户背刺一边继续投推理基础设施、奥特曼的暗债 6650 亿浮出水面。

你说巧不巧？

不巧。这是必然。

我看到的是一张图： AI 行业正在从"模型能力比拼"切换到"全栈基础设施 + 系统级 Agent + 推理成本 + 国家 AI 大账本"四线并进。 Jalapeño 只是其中最响的一声枪。

但如果只盯 Jalapeño ，你会漏掉一个更狠的信号——Baseten 那一轮，英伟达自己投了。英伟达最清楚推理侧要变天了。它押注的不只是 GPU ，是"GPU + 自研 ASIC 混合架构"会成为新常态。

这跟甲骨文 6 月 22 日 10-K 披露的"21,000 人 AI 替代"逻辑是通的——算力不是越来越贵，是单位算力的成本要塌方式下降。 Jalapeño 是这场塌方的第一块多米诺。

整条链上的每一家，都在重新算账。

五、真正的剧本： AI 开始给自己写硬件语言

Jalapeño 真正的剧本，不在博通的硅片上。

在 OpenAI 自己的模型里。

AI 设计芯片 → 芯片跑 AI → 更强 AI 设计下一代更强芯片。

这是自指循环（ self-referential loop ）。一旦跑起来，没有外部力量能再卡住它的脖子。

Richard Ho 讲："为模型要去的方向设计硬件。" 这话的潜台词是——AI 自己知道未来的硬件该长什么样。这不是人类工程师的判断，是 AI 自己的判断。

等等。那英伟达的设计师呢？他们的判断还作数吗？

细想，这问题其实有点冒犯。但我必须问出来。

Greg Brockman 讲得更哲学："世界正在向算力驱动的经济转变。"

翻译过来——未来 10 年最重要的生产资料是算力，最重要的公司是掌握算力的公司。 OpenAI 不再满足于做最聪明的模型，它要做最便宜、最高效的算力本身。

反面假设再走一步——

如果 2027 年英伟达不降价 30%， Anthropic 和 Google 会不会也下场自研推理芯片？

如果 Anthropic 学 OpenAI 找博通做一颗自己的 Jalapeño ， AWS 会不会把它放进 Trainium 3 的机柜？

如果三大云都这么做， 2028 年的推理市场会变成什么样？

我不知道答案。但 Jalapeño 给了我一个观察框架——

9 个月。

9 个月前， OpenAI 还在买 GPU 。

9 个月后，它把自己最大的供应商变成了一个"还在卖 GPU 、但被客户背刺"的尴尬角色。

这个速度，所有人——包括英伟达自己——都低估了。

糟心。

剩下的问题不是"英伟达会不会被替代"。英伟达在 pre-training 高性能计算上还是垄断地位， CUDA 生态短期不可撼动。

问题更像是——"推理侧"正在变成 ASIC + 自研芯片的天下，而"训练侧"可能 2-3 年后也会被分走一块。

留给英伟达的时间窗口，比所有人以为的都要短。

说回那颗叫"辣椒"的芯片。

为什么叫 Jalapeño ？因为这是辣度较温和的品种。 Sam Altman 给第一颗芯片起这种名字，潜台词很可能是——这只是入门级，后面可能还有更辣的。

这话在硅谷的语境里，等于"我们的芯片路线图至少三代"。

Jalapeño 是 starter 。

主菜还在后头。

剩下的事，我们继续看。