国产AI霸榜世界前4:OpenAI被逼自研芯片

今天去 OpenRouter 看了一圈模型排名。

前十名里，国产模型占了六个座。

排第一的是 DeepSeek V4 Flash，将近 5T 的 token 使用量。小米的 MiMo-V2.5 排第二，MiniMax M3 排第三，腾讯的 Hunyuan3 预览版排第四。国产模型直接包揽前四。OpenAI 的 GPT-5.5 ？没进前十。

📊 OpenRouter 排名 Top 10（2026-06-25）

1. DeepSeek V4 Flash — 4.97T tokens

2. MiMo-V2.5（小米） — 4.36T tokens

3. MiniMax M3 — 3.75T tokens

4. Hy3 preview（腾讯） — 3.44T tokens

5. Owl Alpha（OpenRouter） — 2.92T tokens

6. Claude Opus 4.7 — 2.54T tokens

7. DeepSeek V4 Pro — 2.19T tokens

8. Claude Opus 4.8 — 1.87T tokens

9. GLM 5.2（智谱） — 1.80T tokens

10. Claude Sonnet 4.6 — 1.49T tokens

国产模型占 7 席，前 4 全包；GPT-5.5 未进前十

同一周，OpenAI 宣布跟 Broadcom 合作造出了第一颗自研芯片。HN 上炸了锅。

两件事放在一起，你就能嗅到 OpenAI 在慌什么。

但多数人把这事看反了——不是「OpenAI 雄心勃勃要挑战英伟达」，而是被国产低价逼到墙角的自救。

问题不在排名本身，在排名的含义

有人可能会说：OpenRouter 排名不说明一切，毕竟 GPT-5 的用户未必通过 API 调用。

但问题是——API 调用才是真金白银的收入来源。ChatGPT 网页版的二十美元月费不愁没人付，但企业和开发者通过 API 接入模型做产品，那是实打实的按量计费。而恰恰是这个市场，正在被国产大模型吃掉。

不止 OpenRouter。国产大模型从去年开始就铺开了很清晰的策略：开源、低价、甚至免费。DeepSeek 的 API 价格比 GPT 低了不止一个数量级，效果却在追。对中小企业、个人开发者来说，这选择基本不需要犹豫。

结果就是：ChatGPT 的付费用户增速肉眼可见地慢下来了。

收入端的压力已经落下来了。

两条夹击，一条死路

OpenAI 靠什么赚钱？说穿了就是个套利生意——从英伟达租来 GPU，训练后的模型转手卖给你。

训练模型要租 GPU，跑推理也要租 GPU，每输出一个 token 都是在给英伟达交钱。它的本质就是个算力中间商：买进 GPU 集群，卖出 API 调用，吃中间的差价。

但当国产 AI 把价格打到接近免费的时候，这个差价游戏就没法玩了。

跟不跟？跟着降，自己的毛利被压缩。不降？用户持续流失。一年前 ChatGPT 的二十美元月费没什么人觉得贵，现在 DeepSeek 免费开着、效果没差太多，这二十美元就变得越来越难收了。

更致命的在成本端——英伟达的 GPU 定价并没有因为 AI 模型降价而下调。H100 依然抢手，B200 定价比上一代更高。

收入被国产 AI 压着，成本被英伟达锁着。

OpenAI 造芯的根本动因就在这里，不是什么「挑战英伟达」。

那这颗芯片到底是什么？

先说清楚一点：芯片不是 OpenAI 自己设计的。

设计方是 Broadcom——全球最大的定制芯片公司。OpenAI 的角色是提需求、出钱，Broadcom 出团队落地。没有 Broadcom，OpenAI 自己从头造一颗，时间还得再加两年。

这颗芯片已经 tape-out（流片），离量产还有 12 到 18 个月。

它是一颗推理芯片（inference），不是训练芯片。

训练芯片 vs 推理芯片
训练芯片	用来「教」模型——跑几个月、烧几万张卡
推理芯片	用来「跑」模型——每次回答都是推理计算

OpenAI 先做推理不做训练，原因不复杂：日常最大的成本不是训练（几个月才跑一次），而是推理（每天几亿次调用）。推理成本降一点，就是真金白银的利润。

但很多人把「造了颗推理芯片」等同于「OpenAI 要挑战英伟达了」——这步子跨太大了。

英伟达的护城河不是芯片，是 CUDA

这是整件事里最容易忽略的事实：OpenAI 至今还在持续买 H100 和 B200。

为什么？

因为英伟达真正的护城河不是硬件，是 CUDA 生态。

所有主流模型的训练 pipeline——数据加载、分布式通信、模型并行、梯度计算——全都是基于 CUDA 写的。想把训练从英伟达的卡上挪到别的芯片，不是「换张卡跑一遍」那么简单，是把整套训练基础设施重写一遍。

这个迁移成本大到可以拖垮一家公司。

Google 有 TPU，照样继续买英伟达的卡。微软有 Maia，英伟达依然是它最大的 GPU 供应商。AWS 有 Trainium，也还在采购英伟达。

自研芯片是「补充」不是「替代」，这个逻辑在所有大厂身上都一样。

OpenAI 的推理芯片先在自己推理场景里跑通验证，再逐步替代一部分推理成本——这就是它的目标。想取代英伟达的训练盘，三年内不可能。

最后说两句实际的

短期半年到一年，这事跟你没关系。芯片量产至少还要一年，一年内推理成本不会有实质性变化。

但拉长到三年——

推理芯片成本如果能降到现在的二分之一甚至三分之一，后果会比多数人想的更直接。AI 产品的价格会跟着降。现在用 GPT-4 做一次深度分析要几毛钱，未来可能就是几分钱。更多小公司和独立开发者用得起高性能推理——这对应用层是好事。

另一面是：算力越便宜，AI 开发者的不可替代性就越低。

过去你有护城河——你得懂模型、会调参、能驾驭大算力集群。当推理成本降到零头，一个十人团队就能做以前百人团队的事。

芯片人才在这个周期里越来越值钱——全行业在抢，薪资还在涨。

但普通 AI 应用开发者，门槛在降低。这好不好，取决于你现在站在哪一边。

「OpenAI 造芯」这四个字，听起来像是一个大厂的扩张故事。但扯开来看，它更像一个被逼到墙角的防御故事。

国产 AI 从价格战打到使用量碾压，用几个季度把算力的竞争逻辑彻底改写。OpenAI 的这颗芯片，就是在回答一个问题：当年租来的铲子，现在得自己打了。