OpenAI 首款自研芯片 Jalapeño 发布:一次迟到的"基础设施觉醒"

模型茶馆 · 用工程师视角拆解AI趋势 阅读时间:6-8分钟
你做的每一步推理,都在给别人交租金
2026年6月24日,OpenAI终于发布了它的第一款自研AI芯片。名字叫Jalapeño——墨西哥辣椒,够辣。
这个消息在科技圈刷了一天的屏,但我猜大部分人看完的反应是:"OpenAI终于做芯片了,牛逼,然后呢?"
然后你打开ChatGPT继续用,该慢还是慢,该贵还是贵。
如果你期待的是"OpenAI自研芯片=ChatGPT立刻降价=AI随便用",你大概率会失望。这份失望本身就值得拆一拆。

核心论点:Jalapeño不是ChatGPT明天的降价通知,而是OpenAI从"租地种菜"到"自己买地"的战略转身——对普通用户的影响,至少要12-18个月才能感受到。
一、Jalapeño到底是什么?
一张图看懂
先给非芯片行业的读者一个最简单的理解。
Jalapeño不是GPU(图形处理器),它是一颗AI推理加速器。训练ChatGPT用的是NVIDIA的GPU,但每次你问ChatGPT一个问题、它给你生成答案的那一瞬间,是"推理"——这是AI服务最烧钱的部分。Jalapeño就是专门为了把这个推理过程的成本降下来而设计的。
OpenAI自己设计芯片架构,Broadcom负责芯片实现和制造,Celestica做板卡和系统集成。Broadcom CEO Hock Tan亲自把第一批晶圆交到了Sam Altman手上。
从设计到tape-out(流片),只用了9个月。OpenAI自己说,这速度快得离谱,因为他们用了自己的AI模型来加速芯片设计过程。AI设计AI芯片——这个闭环本身就是个科幻故事。

关键数据
| 指标 | 数据 | 来源 |
|---|---|---|
| 合作方 | Broadcom(设计制造)+ Celestica(集成) | OpenAI官方 |
| 研发周期 | 9个月(设计到流片) | OpenAI官方 |
| 当前状态 | 工程样品已运行GPT-5.3-Codex-Spark | OpenAI官方 |
| 能效表现 | "显著优于"当前最先进方案(早期测试) | OpenAI官方 |
| 部署时间 | 2026年底开始大规模部署 | TechCrunch |
真实案例
Google TPU:先例与镜鉴
Google在2015年首次披露TPU时,整个行业轰动。如今2026年,TPU已经是Google AI基础设施的核心,但这条路走了11年。Jalapeño要走通同样的路,不会更快。
"我们的定制芯片不是为了取代NVIDIA,我们短期内仍会大量使用他们的GPU。" —— OpenAI技术团队内部沟通
我的判断
⚠️ 判断:Jalapeño目前定位是推理芯片,不是训练芯片。在模型训练侧,OpenAI仍将长期依赖NVIDIA的GPU。
🔄 可能的变化:如果Jalapeño系列走通多代迭代,3-5年后可能开始涉及训练场景。
二、OpenAI为什么要做芯片?
拆解:背后的真实成本
做芯片这件事,OpenAI不是第一批。看看这张表:
| 公司 | 自研芯片 | 发布年份 | 定位 |
|---|---|---|---|
| TPU | 2015(首次披露) | 训练+推理 | |
| Amazon | Trainium/Inferentia | 2018/2019 | 训练+推理 |
| Meta | MTIA | 2023 | 推理 |
| Microsoft | Maia | 2023 | 训练+推理 |
| OpenAI | Jalapeño | 2026 | 推理 |
OpenAI是最后一个入局的超大规模AI公司。
为什么现在才做?原因很简单:做芯片太贵、太难。一颗先进制程芯片从设计到量产,动辄数亿美元起,迭代周期2-3年。对于一家还在亏损的AI公司来说,这不是一个容易做的决定。
促使OpenAI下决心的三个因素:
1. NVIDIA太贵了。 NVIDIA GPU的利润率高达70%以上,且供不应求。OpenAI作为NVIDIA最大的客户之一,每年花在GPU上的钱是以百亿美元计的。自己做芯片,长期来看能把这笔钱省下一大半。
2. NVIDIA太慢了。 不是NVIDIA技术慢,而是NVIDIA的产品路线图是为所有客户服务的,不是为OpenAI量身定做的。自己做芯片,可以在架构上与模型深度协同优化。
3. "全栈"才是护城河。 OpenAI的核心论点很简单:控制模型层+控制推理层+控制用户体验层=不可替代。如果只控制模型层,本质上只是一个"卖模型的公司",随时可能被更低价的替代品冲击。

反直觉发现
🔥 反直觉:大多数人以为OpenAI自研芯片是为了摆脱对NVIDIA的依赖。实际上OpenAI短期内仍严重依赖NVIDIA做模型训练。Jalapeño瞄准的是推理——那个占了ChatGPT运营成本大头的环节。训练和推理是两回事。
🔥 反直觉2:OpenAI不是Broadcom的唯一大客户。Broadcom现在为Google、Meta、Anthropic和OpenAI等6家大客户做定制AI芯片。Broadcom的AI积压订单已达730亿美元,目标2027年AI芯片年收入超1000亿美元。OpenAI只是它定制芯片生意的一部分。
三、Jalapeño对普通人的真实影响
短期(0-12个月):什么都感觉不到
芯片从流片到大规模部署,正常周期是12-18个月。报道称微软预计将购买40%的Jalapeño芯片——这意味着初期的大部分产能会被微软锁定,用于Azure云服务。ChatGPT用户短期内不会感受到任何变化。
中期(12-36个月):推理成本开始下降
如果Jalapeño按计划走通多代迭代,推理成本有望下降。但要注意:OpenAI说"能效比显著优于当前最先进方案",这里的"当前最先进"是2026年的技术,等大规模部署时,NVIDIA也有新品发布了。
长期(36个月+):真正有趣的开始
芯片层+模型层的深度协同设计,理论上可以让OpenAI在模型架构上走更大胆的路——不需要考虑兼容NVIDIA的CUDA生态。这可能带来模型能力或效率的突破性提升。
普通人/小团队的机会
- 1. 等待:推理成本下降最终会通过API价格传导到开发者手中。如果你在做AI应用,1-2年后运营成本可能会显著降低。
- 2. 观察:如果Jalapeño成功,会加速"模型公司自研芯片"的趋势,进一步拉大头部公司和追赶者的差距。
- 3. 不要急:不要在Jalapeño刚发布时就根据这个信息调整你的技术选型。2028年之前,对普通开发者来说该怎么用还是怎么用。
趋势预测:未来12个月
| 时间 | 可能的进展 | 概率 |
|---|---|---|
| 2026年底 | Jalapeño开始在数据中心小规模部署 | 高 |
| 2027年中 | 微软Azure开始提供Jalapeño驱动的推理服务 | 中 |
| 2028年 | Jalapeño在OpenAI推理负载中占比超过20% | 低-中 |
总结
三个关键结论
- 1. Jalapeño是OpenAI战略转型的标志性事件,从"模型公司"到"全栈AI基础设施公司",这个转型对行业格局的影响比任何模型升级都深远。
- 2. 对普通用户没有短期影响。2027年之前,ChatGPT该多少钱还是多少钱,该多慢还是多慢。
- 3. 真正的博弈在基础设施层。Google有TPU、Amazon有Trainium、Microsoft有Maia、现在OpenAI也有了Jalapeño——AI战争的战场正在从"谁的模型更强"转移到"谁的整个堆栈更便宜、更高效"。
开放问题
❓ 留一个问题给大家:当所有大厂都有了自己的芯片,芯片制造商的竞争格局会发生什么变化?NVIDIA的统治地位会因为客户的"叛逃"而被动摇吗?欢迎在评论区聊聊你的看法。
参考资料
- 1. OpenAI and Broadcom unveil LLM-optimized inference chip - OpenAI官方,2026年6月24日
- 2. OpenAI unveils its first custom chip, built by Broadcom - TechCrunch, 2026年6月24日
- 3. Jalapeño is the first AI chip from OpenAI and Broadcom - Engadget, 2026年6月24日
- 4. The custom AI ASIC state of play (May 2026) - Tom's Hardware, 2026年5月21日
- 5. This AI Chip Giant Quietly Became Worth More Than Tesla - AOL/Motley Fool, 2026年5月31日
本文由「模型茶馆」原创出品
用工程师视角,拆解AI趋势背后的真实成本、真实机会和真实幻觉
欢迎关注、转发、评论
模型茶馆
夜雨聆风