OpenAI 首款自研芯片 Jalapeño 发布:一次迟到的＂基础设施觉醒＂

· 阅读 11 分钟 ·

OpenAI 首款自研芯片 Jalapeño 发布：一次迟到的"基础设施觉醒"

模型茶馆 · 用工程师视角拆解AI趋势 阅读时间：6-8分钟

你做的每一步推理，都在给别人交租金

2026年6月24日，OpenAI终于发布了它的第一款自研AI芯片。名字叫Jalapeño——墨西哥辣椒，够辣。

这个消息在科技圈刷了一天的屏，但我猜大部分人看完的反应是："OpenAI终于做芯片了，牛逼，然后呢？"

然后你打开ChatGPT继续用，该慢还是慢，该贵还是贵。

如果你期待的是"OpenAI自研芯片=ChatGPT立刻降价=AI随便用"，你大概率会失望。这份失望本身就值得拆一拆。

核心论点：Jalapeño不是ChatGPT明天的降价通知，而是OpenAI从"租地种菜"到"自己买地"的战略转身——对普通用户的影响，至少要12-18个月才能感受到。

一、Jalapeño到底是什么？

一张图看懂

先给非芯片行业的读者一个最简单的理解。

Jalapeño不是GPU（图形处理器），它是一颗AI推理加速器。训练ChatGPT用的是NVIDIA的GPU，但每次你问ChatGPT一个问题、它给你生成答案的那一瞬间，是"推理"——这是AI服务最烧钱的部分。Jalapeño就是专门为了把这个推理过程的成本降下来而设计的。

OpenAI自己设计芯片架构，Broadcom负责芯片实现和制造，Celestica做板卡和系统集成。Broadcom CEO Hock Tan亲自把第一批晶圆交到了Sam Altman手上。

从设计到tape-out（流片），只用了9个月。OpenAI自己说，这速度快得离谱，因为他们用了自己的AI模型来加速芯片设计过程。AI设计AI芯片——这个闭环本身就是个科幻故事。

关键数据

指标	数据	来源
合作方	Broadcom（设计制造）+ Celestica（集成）	OpenAI官方
研发周期	9个月（设计到流片）	OpenAI官方
当前状态	工程样品已运行GPT-5.3-Codex-Spark	OpenAI官方
能效表现	"显著优于"当前最先进方案（早期测试）	OpenAI官方
部署时间	2026年底开始大规模部署	TechCrunch

真实案例

Google TPU：先例与镜鉴

Google在2015年首次披露TPU时，整个行业轰动。如今2026年，TPU已经是Google AI基础设施的核心，但这条路走了11年。Jalapeño要走通同样的路，不会更快。

"我们的定制芯片不是为了取代NVIDIA，我们短期内仍会大量使用他们的GPU。" —— OpenAI技术团队内部沟通

我的判断

⚠️ 判断：Jalapeño目前定位是推理芯片，不是训练芯片。在模型训练侧，OpenAI仍将长期依赖NVIDIA的GPU。

🔄 可能的变化：如果Jalapeño系列走通多代迭代，3-5年后可能开始涉及训练场景。

二、OpenAI为什么要做芯片？

拆解：背后的真实成本

做芯片这件事，OpenAI不是第一批。看看这张表：

公司	自研芯片	发布年份	定位
Google	TPU	2015（首次披露）	训练+推理
Amazon	Trainium/Inferentia	2018/2019	训练+推理
Meta	MTIA	2023	推理
Microsoft	Maia	2023	训练+推理
OpenAI	Jalapeño	2026	推理

OpenAI是最后一个入局的超大规模AI公司。

为什么现在才做？原因很简单：做芯片太贵、太难。一颗先进制程芯片从设计到量产，动辄数亿美元起，迭代周期2-3年。对于一家还在亏损的AI公司来说，这不是一个容易做的决定。

促使OpenAI下决心的三个因素：

1. NVIDIA太贵了。 NVIDIA GPU的利润率高达70%以上，且供不应求。OpenAI作为NVIDIA最大的客户之一，每年花在GPU上的钱是以百亿美元计的。自己做芯片，长期来看能把这笔钱省下一大半。

2. NVIDIA太慢了。 不是NVIDIA技术慢，而是NVIDIA的产品路线图是为所有客户服务的，不是为OpenAI量身定做的。自己做芯片，可以在架构上与模型深度协同优化。

3. "全栈"才是护城河。 OpenAI的核心论点很简单：控制模型层+控制推理层+控制用户体验层=不可替代。如果只控制模型层，本质上只是一个"卖模型的公司"，随时可能被更低价的替代品冲击。

反直觉发现

🔥 反直觉：大多数人以为OpenAI自研芯片是为了摆脱对NVIDIA的依赖。实际上OpenAI短期内仍严重依赖NVIDIA做模型训练。Jalapeño瞄准的是推理——那个占了ChatGPT运营成本大头的环节。训练和推理是两回事。

🔥 反直觉2：OpenAI不是Broadcom的唯一大客户。Broadcom现在为Google、Meta、Anthropic和OpenAI等6家大客户做定制AI芯片。Broadcom的AI积压订单已达730亿美元，目标2027年AI芯片年收入超1000亿美元。OpenAI只是它定制芯片生意的一部分。

三、Jalapeño对普通人的真实影响

短期（0-12个月）：什么都感觉不到

芯片从流片到大规模部署，正常周期是12-18个月。报道称微软预计将购买40%的Jalapeño芯片——这意味着初期的大部分产能会被微软锁定，用于Azure云服务。ChatGPT用户短期内不会感受到任何变化。

中期（12-36个月）：推理成本开始下降

如果Jalapeño按计划走通多代迭代，推理成本有望下降。但要注意：OpenAI说"能效比显著优于当前最先进方案"，这里的"当前最先进"是2026年的技术，等大规模部署时，NVIDIA也有新品发布了。

长期（36个月+）：真正有趣的开始

芯片层+模型层的深度协同设计，理论上可以让OpenAI在模型架构上走更大胆的路——不需要考虑兼容NVIDIA的CUDA生态。这可能带来模型能力或效率的突破性提升。

普通人/小团队的机会

1. 等待：推理成本下降最终会通过API价格传导到开发者手中。如果你在做AI应用，1-2年后运营成本可能会显著降低。
2. 观察：如果Jalapeño成功，会加速"模型公司自研芯片"的趋势，进一步拉大头部公司和追赶者的差距。
3. 不要急：不要在Jalapeño刚发布时就根据这个信息调整你的技术选型。2028年之前，对普通开发者来说该怎么用还是怎么用。

趋势预测：未来12个月

时间	可能的进展	概率
2026年底	Jalapeño开始在数据中心小规模部署	高
2027年中	微软Azure开始提供Jalapeño驱动的推理服务	中
2028年	Jalapeño在OpenAI推理负载中占比超过20%	低-中

总结

三个关键结论

1. Jalapeño是OpenAI战略转型的标志性事件，从"模型公司"到"全栈AI基础设施公司"，这个转型对行业格局的影响比任何模型升级都深远。
2. 对普通用户没有短期影响。2027年之前，ChatGPT该多少钱还是多少钱，该多慢还是多慢。
3. 真正的博弈在基础设施层。Google有TPU、Amazon有Trainium、Microsoft有Maia、现在OpenAI也有了Jalapeño——AI战争的战场正在从"谁的模型更强"转移到"谁的整个堆栈更便宜、更高效"。

开放问题

❓ 留一个问题给大家：当所有大厂都有了自己的芯片，芯片制造商的竞争格局会发生什么变化？NVIDIA的统治地位会因为客户的"叛逃"而被动摇吗？欢迎在评论区聊聊你的看法。

参考资料

1. OpenAI and Broadcom unveil LLM-optimized inference chip - OpenAI官方，2026年6月24日
2. OpenAI unveils its first custom chip, built by Broadcom - TechCrunch, 2026年6月24日
3. Jalapeño is the first AI chip from OpenAI and Broadcom - Engadget, 2026年6月24日
4. The custom AI ASIC state of play (May 2026) - Tom's Hardware, 2026年5月21日
5. This AI Chip Giant Quietly Became Worth More Than Tesla - AOL/Motley Fool, 2026年5月31日

本文由「模型茶馆」原创出品

用工程师视角，拆解AI趋势背后的真实成本、真实机会和真实幻觉

欢迎关注、转发、评论

模型茶馆