2026 年 6 月 24 日,OpenAI 正式宣布其首款定制人工智能芯片 Jalapeño(墨西哥辣椒),由 OpenAI 主导架构设计、博通(Broadcom)负责硅片实现与网络硬件,台积电代工制造。这是 OpenAI 迄今为止最直接的一次"下场做硬件",也标志着这家 AI 实验室向全栈基础设施公司迈出了关键一步。
专为推理而生,不是用来训练
Jalapeño 是一款面向大语言模型推理(Inference)场景的专用 ASIC 芯片——即用户向 ChatGPT 或 Codex 发请求、模型生成回答时背后的计算过程,而非用于预训练大模型。
为什么选推理?因为训练是阶段性大工程,而推理是每天每分每秒都在发生的消耗。ChatGPT 每天服务数亿次请求,哪怕单次推理成本微降,在 OpenAI 的规模下也能转化为惊人的运营节省。
关键亮点
♣9 个月流片:从架构设计到制造流片(Tape-out)仅耗时约 9 个月,OpenAI 称其为高性能 ASIC 领域迄今最快开发周期之一,部分设计优化甚至调用了 OpenAI 自己的 AI 模型辅助完成。
♣能效突出:早期测试显示 Jalapeño 的每瓦性能明显优于当前最先进水平,博通 CEO 透露推理综合成本有望降低约 50%。
♣ 全栈调优:芯片架构围绕 OpenAI 对内核、内存搬运、网络与服务模式的深度理解从零设计,减少数据搬移、均衡算力/内存/网络,使硬件利用率逼近理论峰值。
♣不对外销售:Jalapeño 仅供 OpenAI 内部使用,计划 2026 年底起在微软等合作伙伴的数据中心以吉瓦级规模部署,支撑 ChatGPT、Codex 及 API 服务。
为什么要自研芯片?
OpenAI 长期重度依赖英伟达 GPU,采购成本高企且供应链受制于人。谷歌有 TPU、亚马逊有 Trainium/Inferentia,OpenAI 走的是同一条路——通过垂直整合(模型 + 软件 + 芯片)获得更精细的成本控制和迭代自主权,类似苹果以自研 Silicon 打通软硬体验。
总裁格雷格·布罗克曼(Greg Brockman)表示:
"Jalapeño 是我们长期全栈基础设施战略的一部分。通过自主设计更多底层技术栈——芯片架构、内核、内存系统、网络与调度——我们可以让各层相互优化,以更高效率提供更强的智能。"
下一步
Jalapeño 是 OpenAI 多代定制芯片路线图的起点,官方透露下一代产品预计 2028 年推出,后续将按年度节奏迭代。重算力训练任务短期内仍将继续依赖英伟达集群,但推理侧 OpenAI 正悄然掌握自己的命运。
Jalapeño 目前仍处于工程样片测试阶段,最终量产性能与成本节省幅度有待大规模部署验证。但其战略信号已十分明确——顶级 AI 公司正在集体收回算力定义权。
申明: 本文整理自公开信息,仅供行业交流与参考。

夜雨聆风