OpenAI 发布首款自研推理芯片:AI 模型加速芯片流片

事件

6月24日，OpenAI 与 Broadcom 发布首款自研 AI 推理芯片 Jalapeño。该芯片定位为 OpenAI 首款 Intelligence Processor，面向大语言模型推理场景，由 OpenAI 基于自身模型、产品、推理服务和软件栈需求进行架构定义，并与 Broadcom、Celestica 等伙伴共同推进硅实现、网络连接、板卡、机架和系统集成。Jalapeño 工程样品已经在实验室运行机器学习负载，计划于 2026 年底前开启初步部署，并作为 OpenAI 多代自研算力平台的第一代产品。Jalapeño 的发布表明 OpenAI 希望对 ChatGPT、API、代理以及未来的模型产品背后的硬件层拥有更多控制权，可以降低 OpenAI 对通用 GPU 在某些高负载服务工作负载中的依赖，但并不能完全取代 NVIDIA、AMD 或云加速器在 AI 基础设施架构中的作用。

点评

OpenAI 发布 Jalapeño 的核心意义，不只是首款自研推理芯片，而在于 AI 首次被明确放入先进 ASIC 的设计与优化流程，并将高性能芯片从设计到 tape-out 的周期压缩至 9 个月。 Jalapeño 从初始设计到制造 tape-out 仅用 9 个月，且官方明确提到该周期受到 OpenAI 模型加速设计与优化流程的帮助，这意味着 AI 不只在消耗算力，也开始反向提升算力供给侧的研发效率。两家公司称，这可能是高性能先进半导体 ASIC 领域最快的开发周期之一，Jalapeño 体现的是模型公司、ASIC 平台公司和系统厂商共同压缩开发周期的新模式；OpenAI 与 Broadcom 此前已经宣布 10GW custom AI accelerators 合作，目标是从 2026 年下半年开始部署、到 2029 年底完成；本次 Jalapeño 发布则是该多代算力平台的第一代产品，是 OpenAI 自研算力平台的规模化起点。

Jalapeño 的第一性特点是“推理专用”而非“通用训练替代”。OpenAI 明确将其定位为面向 LLM inference 的加速器，优化方向包括 kernels、memory movement、networking 和 serving patterns，这说明其目标不是复刻 GPU 的通用计算生态，而是针对高频、稳定、规模巨大的在线推理需求做硬件定制。随着 AI 应用从训练竞赛进入推理消耗阶段，推理成本、响应延迟、并发承载能力和能效将成为模型商业化的关键约束。Jalapeño 更像是 OpenAI 为自身推理业务打造的“专用基础设施”，而不是面向外部销售的通用 AI 芯片。

Jalapeño 标志着 OpenAI 开始走向 TPU 式的自研算力基础设施路线。 Google TPU 已经验证，当内部 AI 负载足够大、足够稳定时，自研 ASIC 可以从单一硬件产品升级为平台级基础设施，帮助平台公司在多代产品迭代中优化成本、延迟、能效和供应链控制能力。Jalapeño 对 OpenAI 的意义也类似：其设计目标围绕 OpenAI 自身推理流量、模型路线图和 serving 系统展开，并可能与 kernels、memory movement、networking 和 rack-scale integration 持续协同迭代。区别在于，Google TPU 已经形成从芯片、编译器、Pod 到云服务的成熟体系，而 Jalapeño 仍处于 OpenAI 自研算力平台的第一代阶段。因此，Jalapeño 更重要的信号不是短期性能对标 TPU，而是 OpenAI 开始通过自研 ASIC 建立长期推理成本控制、规模化部署能力以及对通用 GPU 供应商的议价权。

Jalapeño让 OpenAI 获得了对 NVIDIA 的“可验证替代选项”，从而提升其在推理基础设施采购中的议价权。如果 OpenAI 能以 9 个月级别迭代自研 ASIC，并把部署规模推向 GW / 10GW 级别，那么中期推理侧的增量需求结构会发生变化。NVIDIA 仍会受益于训练和通用 AI 平台，但 OpenAI、Google、AWS、Microsoft、Meta 等自研芯片路线会持续分流部分高频、稳定、成本敏感的推理负载。我们测算，若 Jalapeño 在 2027 年承接约 300MW 推理 IT 负载，并相对 B200/GB200 系统实现约 35% 的有效性能/瓦提升，则可替代约 24 万颗 B200 等效 GPU（GB200 NVL72 官方文档显示 72-GPU rack 功耗约 120kW，折合约 1.7kW/GPU），对应减少 NVIDIA 系统级采购约 131 亿美元（假设NVIDIA 推理系统级等效ASP为5.5 万美元/GPU）。这并不意味着 NVIDIA 需求会线性减少，而是说明一旦自研 ASIC 进入 GW 级部署，模型公司将在中期推理基础设施采购中拥有更强的成本控制能力和供应链主动权。

对 Broadcom、Celestica、内存和网络产业链，Jalapeño 是直接的增量信号。Jalapeño 的官方描述反复强调 kernels、memory movement、networking、serving patterns、rack integration，说明 OpenAI 需要的不是一颗孤立芯片，而是一整套可以支撑 GW 级部署的推理基础设施。Broadcom 的价值在于 ASIC 实现、Tomahawk networking、scale-up / scale-out Ethernet 和连接能力，Celestica 的价值在于板卡、机架和系统交付。产业链上受益重点不只在芯片设计，而在 ASIC + Ethernet + rack-scale system 的组合。

风险

1）市场竞争加剧2）技术验证不及预期3）产品落地不及预期

本报告分析师：

姚书桥

SFC HK执业证书编号：BRZ136

吴叡霖

SFC HK执业证书编号：BVA376

免责声明

本公众号涉及的内容仅供参考，并不构成对所述证券的推荐、邀约或邀约邀请。同时亦不构成任何合约的成立，不构成买卖任何证券或交易的建议，亦不构成投资建议、财务、法律、税务或其他意见。本公众号对于因此信息和内容或者据此进行投资而直接或间接引起的任何损失不承担任何责任亦不作出任何保证。

本公众号中所发布的信息、观点以及数据有可能因发布后的市场走势或其他不可预见之因素而影响其有效性。文中的意见预测和估计反映了我们截至制作本文之日期的评估，本公众号并不承担更新信息、观点以及数据的责任，而同时在对相关信息进行任何更新时亦不作另行通知。

本公众号及其关联机构可能会对于上述信息、观点的标的公司所发行的证券进行交易，还可能为这些公司提供其他服务。本公众号及其关联机构可能购买、持有或出售相同或相关产品。

版权及相关权益归海通国际及相关内容提供方所有。未经海通国际书面许可，任何人不得以任何方式或方法修改、复制、分发或转载官方微信中之任何内容。

《研究报告》免责声明

本公众号不是海通国际研究报告的发布平台。本公众号涉及的研究报告信息由海通国际证券有限公司于香港特别行政区发布，内容从于发布之时从认为可靠的渠道获得的信息或基于海通国际已发布的研究报告编制而成。研究报告信息中的观点及评级的发布取决于报告作者所知悉的各种市场因素及公司内在因素，以及海通国际对其之盈利预测。目标价格是基于一系列的假设和前设条件，投资者需在准确了解相关研究报告中的全部信息的基础下，方可对研究报告所表达的观点形成比较全面的理解。本公众号仅为对相关研究报告部分内容的引用或者复述。受法规技术或其它客观条件所限，无法同时提供观点、评级的依据或盈利预测及目标价格背后的假设等相关信息。因此其内容可能无法完整或准确表达相关研究报告的观点或意见。海通国际并不保证本公众号涉及的研究报告所包含的信息、观点以及数据的准确性及完整性。如欲了解完整观点，应参见海通国际研究网站(www.equities.htisec.com)所载完整报告，或与海通国际销售人员联系。

投资涉及风险，海通国际并没有考虑投资者的具体投资目标，财务状况等的特定需求，任何人不得依赖研究报告包含的信息、观点以及数据的准确性及完整性作出投资决定。