|
可酪创新科技 CLAW INNOVATION TECH AI 技术深度 · 融资动态 · 资本走向 |
|
TODAY'S INSIGHT OpenAI首款自研芯片Jalapeno亮相,推理成本之战正式打响 |
|
6月24日,OpenAI正式发布代号「Jalapeno」的首款自研推理芯片,与Broadcom联合设计制造。这颗芯片专为大语言模型推理优化,已在OpenAI实验室完成早期测试,预计年内部署到数据中心。从模型到芯片的全栈整合,OpenAI正在改写AI基础设施的竞争规则。 |
▲ AI推理芯片正成为大模型竞赛的第二战场
|
|
Jalapeno不是训练芯片,而是一颗推理专用芯片。所谓推理,就是用户输入一段文字后,AI模型生成回答的过程——ChatGPT每一次对话、Codex每一行代码生成,背后都是推理算力在运转。 OpenAI表示,Jalapeno在性能功耗比上「显著优于当前主流方案」。虽然没有公布具体跑分数据,但从设计目标看,这颗芯片瞄准的是低运营成本、高吞吐量的推理场景——比如Codex的实时代码生成。 据TechCrunch报道,Jalapeno已在OpenAI实验室与GPT-5.3-Codex-Spark配合测试,预计年内进入数据中心部署。OpenAI总裁Greg Brockman透露,这是多代芯片平台的第一款,未来将支持与微软等伙伴合作的吉瓦级AI基础设施。 🧈 可酪观点 OpenAI做芯片的逻辑很清晰:推理成本占大模型运营的大头,自研芯片能把这块成本打下来。对用户来说,更便宜的推理意味着更低的API调用价格,这对整个AI应用生态是利好。 |
|
|
答案只有四个字:减少依赖。过去两年,OpenAI的推理算力几乎全部依赖NVIDIA的GPU。随着GPT系列模型用户规模突破数亿,推理成本成为OpenAI最大的运营支出。 自研芯片的战略并非OpenAI独创。Google早在2016年就推出了TPU,亚马逊2022年发布了Trainium。但OpenAI的特殊之处在于:它同时掌握模型和产品,能从用户端反推芯片设计需求——哪些算子用得最多、哪些精度要求最高、哪些场景延迟最敏感。 Greg Brockman在公告中说:「我们对工作负载有深刻理解……我们一直在寻找那些未被充分服务的特定工作负载,思考如何构建能加速可能性的东西。」这种「模型-产品-芯片」的闭环优化,是纯芯片公司或纯模型公司都难以复制的。 🧈 可酪观点 NVIDIA的护城河从来不只是芯片本身,而是CUDA生态。OpenAI自研芯片短期内不会替代GPU训练集群,但在推理端,定制芯片+优化编译器的组合完全有可能跑出更好的性价比。这场仗才刚开始。 |
▲ 数据中心部署是Jalapeno芯片的下一个里程碑
|
|
Jalapeno的发布让AI推理芯片赛道再添一位重量级玩家。目前这个赛道的主要玩家包括: • NVIDIA:H100/H200/B200系列GPU,推理训练通吃,市占率超80% • Google:TPU v5e/v6,专为推理优化,已在Gemini服务中大规模部署 • Amazon:Trainium2/Inferentia2,面向AWS云服务客户 • OpenAI + Broadcom:Jalapeno,专注LLM推理,2026年内部署 值得注意的是,Broadcom是全球第二大芯片设计公司,在定制ASIC领域有深厚积累。OpenAI选择与Broadcom合作而非从零开始,既降低了研发风险,也借力了成熟的制造产能。 🧈 可酪观点 对NVIDIA来说,真正的威胁不是某一家公司自研芯片,而是「所有人都在自研芯片」。当推理成本成为AI商业化的关键瓶颈,每个大模型公司都有动力摆脱GPU依赖。NVIDIA需要在推理端证明自己的不可替代性。 |
|
|
OpenAI在公告中明确表态:「OpenAI不仅在开发前沿模型或在其上构建产品,还在设计底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。因为OpenAI贯穿整个技术栈,每一层都可以围绕同一个目标优化——让模型更快、更可靠、更便宜。」 这段话的关键词是「贯穿整个技术栈」。从GPT模型→ChatGPT/Codex产品→Jalapeno芯片→数据中心部署,OpenAI正在构建一条从算法到硬件的完整链路。这种垂直整合能力,此前只有Apple在消费电子领域实现过。 对于开发者和企业用户来说,最直接的影响可能是:OpenAI的API价格有望进一步下降。推理成本的降低会直接反映在Token定价上,进而降低整个AI应用的开发门槛。 🧈 可酪观点 OpenAI做芯片不是为了卖芯片,而是为了卖更便宜的API。当推理成本降到足够低,AI应用的爆发才会真正到来。Jalapeno是OpenAI从「AI公司」转型为「AI基础设施公司」的关键一步。 |
|
关注「可酪创新科技」 AI 技术与资本 · 每日观察
扫码关注 · 获取每日AI洞察 |
夜雨聆风