今天去 OpenRouter 看了一圈模型排名。
前十名里,国产模型占了六个座。
排第一的是 DeepSeek V4 Flash,将近 5T 的 token 使用量。小米的 MiMo-V2.5 排第二,MiniMax M3 排第三,腾讯的 Hunyuan3 预览版排第四。国产模型直接包揽前四。OpenAI 的 GPT-5.5 ?没进前十。
1. DeepSeek V4 Flash — 4.97T tokens 2. MiMo-V2.5(小米) — 4.36T tokens 3. MiniMax M3 — 3.75T tokens 4. Hy3 preview(腾讯) — 3.44T tokens 5. Owl Alpha(OpenRouter) — 2.92T tokens 6. Claude Opus 4.7 — 2.54T tokens 7. DeepSeek V4 Pro — 2.19T tokens 8. Claude Opus 4.8 — 1.87T tokens 9. GLM 5.2(智谱) — 1.80T tokens 10. Claude Sonnet 4.6 — 1.49T tokens 国产模型占 7 席,前 4 全包;GPT-5.5 未进前十 |
同一周,OpenAI 宣布跟 Broadcom 合作造出了第一颗自研芯片。HN 上炸了锅。
两件事放在一起,你就能嗅到 OpenAI 在慌什么。
但多数人把这事看反了——不是「OpenAI 雄心勃勃要挑战英伟达」,而是被国产低价逼到墙角的自救。
问题不在排名本身,在排名的含义
有人可能会说:OpenRouter 排名不说明一切,毕竟 GPT-5 的用户未必通过 API 调用。
但问题是——API 调用才是真金白银的收入来源。ChatGPT 网页版的二十美元月费不愁没人付,但企业和开发者通过 API 接入模型做产品,那是实打实的按量计费。而恰恰是这个市场,正在被国产大模型吃掉。
不止 OpenRouter。国产大模型从去年开始就铺开了很清晰的策略:开源、低价、甚至免费。DeepSeek 的 API 价格比 GPT 低了不止一个数量级,效果却在追。对中小企业、个人开发者来说,这选择基本不需要犹豫。
结果就是:ChatGPT 的付费用户增速肉眼可见地慢下来了。
收入端的压力已经落下来了。
两条夹击,一条死路
OpenAI 靠什么赚钱?说穿了就是个套利生意——从英伟达租来 GPU,训练后的模型转手卖给你。
训练模型要租 GPU,跑推理也要租 GPU,每输出一个 token 都是在给英伟达交钱。它的本质就是个算力中间商:买进 GPU 集群,卖出 API 调用,吃中间的差价。
但当国产 AI 把价格打到接近免费的时候,这个差价游戏就没法玩了。
跟不跟?跟着降,自己的毛利被压缩。不降?用户持续流失。一年前 ChatGPT 的二十美元月费没什么人觉得贵,现在 DeepSeek 免费开着、效果没差太多,这二十美元就变得越来越难收了。
更致命的在成本端——英伟达的 GPU 定价并没有因为 AI 模型降价而下调。H100 依然抢手,B200 定价比上一代更高。
收入被国产 AI 压着,成本被英伟达锁着。
OpenAI 造芯的根本动因就在这里,不是什么「挑战英伟达」。
那这颗芯片到底是什么?
先说清楚一点:芯片不是 OpenAI 自己设计的。
设计方是 Broadcom——全球最大的定制芯片公司。OpenAI 的角色是提需求、出钱,Broadcom 出团队落地。没有 Broadcom,OpenAI 自己从头造一颗,时间还得再加两年。
这颗芯片已经 tape-out(流片),离量产还有 12 到 18 个月。
它是一颗推理芯片(inference),不是训练芯片。
OpenAI 先做推理不做训练,原因不复杂:日常最大的成本不是训练(几个月才跑一次),而是推理(每天几亿次调用)。推理成本降一点,就是真金白银的利润。
但很多人把「造了颗推理芯片」等同于「OpenAI 要挑战英伟达了」——这步子跨太大了。
英伟达的护城河不是芯片,是 CUDA
这是整件事里最容易忽略的事实:OpenAI 至今还在持续买 H100 和 B200。
为什么?
因为英伟达真正的护城河不是硬件,是 CUDA 生态。
所有主流模型的训练 pipeline——数据加载、分布式通信、模型并行、梯度计算——全都是基于 CUDA 写的。想把训练从英伟达的卡上挪到别的芯片,不是「换张卡跑一遍」那么简单,是把整套训练基础设施重写一遍。
这个迁移成本大到可以拖垮一家公司。
Google 有 TPU,照样继续买英伟达的卡。微软有 Maia,英伟达依然是它最大的 GPU 供应商。AWS 有 Trainium,也还在采购英伟达。
自研芯片是「补充」不是「替代」,这个逻辑在所有大厂身上都一样。
OpenAI 的推理芯片先在自己推理场景里跑通验证,再逐步替代一部分推理成本——这就是它的目标。想取代英伟达的训练盘,三年内不可能。
最后说两句实际的
短期半年到一年,这事跟你没关系。芯片量产至少还要一年,一年内推理成本不会有实质性变化。
但拉长到三年——
推理芯片成本如果能降到现在的二分之一甚至三分之一,后果会比多数人想的更直接。AI 产品的价格会跟着降。现在用 GPT-4 做一次深度分析要几毛钱,未来可能就是几分钱。更多小公司和独立开发者用得起高性能推理——这对应用层是好事。
另一面是:算力越便宜,AI 开发者的不可替代性就越低。
过去你有护城河——你得懂模型、会调参、能驾驭大算力集群。当推理成本降到零头,一个十人团队就能做以前百人团队的事。
芯片人才在这个周期里越来越值钱——全行业在抢,薪资还在涨。
但普通 AI 应用开发者,门槛在降低。这好不好,取决于你现在站在哪一边。
「OpenAI 造芯」这四个字,听起来像是一个大厂的扩张故事。但扯开来看,它更像一个被逼到墙角的防御故事。
国产 AI 从价格战打到使用量碾压,用几个季度把算力的竞争逻辑彻底改写。OpenAI 的这颗芯片,就是在回答一个问题:当年租来的铲子,现在得自己打了。
夜雨聆风