OpenAI 首款自研芯片亮相,AI巨头正式迈入“全栈造芯”时代

2026 年 6 月 24 日，OpenAI 正式宣布其首款定制人工智能芯片 Jalapeño（墨西哥辣椒），由 OpenAI 主导架构设计、博通（Broadcom）负责硅片实现与网络硬件，台积电代工制造。这是 OpenAI 迄今为止最直接的一次"下场做硬件"，也标志着这家 AI 实验室向全栈基础设施公司迈出了关键一步。

专为推理而生，不是用来训练

Jalapeño 是一款面向大语言模型推理（Inference）场景的专用 ASIC 芯片——即用户向 ChatGPT 或 Codex 发请求、模型生成回答时背后的计算过程，而非用于预训练大模型。

为什么选推理？因为训练是阶段性大工程，而推理是每天每分每秒都在发生的消耗。ChatGPT 每天服务数亿次请求，哪怕单次推理成本微降，在 OpenAI 的规模下也能转化为惊人的运营节省。

关键亮点

♣9 个月流片：从架构设计到制造流片（Tape-out）仅耗时约 9 个月，OpenAI 称其为高性能 ASIC 领域迄今最快开发周期之一，部分设计优化甚至调用了 OpenAI 自己的 AI 模型辅助完成。

♣能效突出：早期测试显示 Jalapeño 的每瓦性能明显优于当前最先进水平，博通 CEO 透露推理综合成本有望降低约 50%。

♣ 全栈调优：芯片架构围绕 OpenAI 对内核、内存搬运、网络与服务模式的深度理解从零设计，减少数据搬移、均衡算力/内存/网络，使硬件利用率逼近理论峰值。

♣不对外销售：Jalapeño 仅供 OpenAI 内部使用，计划 2026 年底起在微软等合作伙伴的数据中心以吉瓦级规模部署，支撑 ChatGPT、Codex 及 API 服务。

为什么要自研芯片？

OpenAI 长期重度依赖英伟达 GPU，采购成本高企且供应链受制于人。谷歌有 TPU、亚马逊有 Trainium/Inferentia，OpenAI 走的是同一条路——通过垂直整合（模型 + 软件 + 芯片）获得更精细的成本控制和迭代自主权，类似苹果以自研 Silicon 打通软硬体验。

总裁格雷格·布罗克曼（Greg Brockman）表示：

"Jalapeño 是我们长期全栈基础设施战略的一部分。通过自主设计更多底层技术栈——芯片架构、内核、内存系统、网络与调度——我们可以让各层相互优化，以更高效率提供更强的智能。"

下一步

Jalapeño 是 OpenAI 多代定制芯片路线图的起点，官方透露下一代产品预计 2028 年推出，后续将按年度节奏迭代。重算力训练任务短期内仍将继续依赖英伟达集群，但推理侧 OpenAI 正悄然掌握自己的命运。

Jalapeño 目前仍处于工程样片测试阶段，最终量产性能与成本节省幅度有待大规模部署验证。但其战略信号已十分明确——顶级 AI 公司正在集体收回算力定义权。

申明：本文整理自公开信息，仅供行业交流与参考。