2026年5月,台积电的3nm产能分配表在业内流传。上面最引人注目的不是英伟达的订单规模——虽然它仍然是最大的单一大客户——而是排在后面的名字数量。AMD、Google、亚马逊、微软、Meta、以及几家中国公司,都在为AI芯片预留产能。
过去三年,英伟达在AI芯片市场占有率一度超过90%。但2026年的格局正在发生变化。不是英伟达变弱了,而是"别人追上来了"。
追赶者军团
AMD的MI400在2026年初上市后表现超出预期。虽然单卡算力仍不及英伟达的B200,但凭借更低的价格和更开放的ROCm生态,在价格敏感型客户中获得了相当不错的市场接受度。多家中国互联网公司已经宣布在模型推理场景大规模采用MI400。
Google的TPU v6则走了一条完全不同的路。它不为公开市场销售,完全服务于Google自己的AI需求。Gemini 2.5就是在TPU v6集群上训练的。Google的策略很清楚:用定制硬件最大化内部效率,靠Gemini和Google Cloud间接变现。
国产AI芯片:从替代到差异化
2026年,中国AI芯片领域也在发生深刻变化。受到出口管制的影响,英伟达的高端芯片 H100、B200 无法直接供应中国市场。这给了国产芯片前所未有的窗口期。
华为昇腾910B在大模型训练场景的性能已经可以接近A100的水平,在推理场景甚至在某些模型上略超。寒武纪的MLU590在视觉类AI应用中表现突出。海光信息的深算系列在特定推理场景中表现出意外的竞争力。
但真正让人意外的变量是ForgeTrain 上一期我们报道过的面壁智能的AI自写训练框架 。它让训练框架不再是英伟达CUDA的独家领地——AI生成代码天然可以与不同硬件架构适配。这意味着国产芯片第一次有了一个"原生兼容"的高效训练框架的可能,而不需要等英伟达的CUDA适配。
一个判断:AI硬件正在从"一个玩家统治"走向"多极格局"。英伟达不会失去它在高端AI训练领域的领导地位——它的综合优势 硬件+软件生态+供应链 太强。但市场正在被切分:AMD占领性价比市场,Google锁定自用需求,国产芯片占据被制裁所保护的中国市场。多样化的芯片格局对AI行业整体是好事——更多的选择意味着更少的单点风险。
生态才是真正的战场
AI芯片竞争到2026年已经明确了:硬件性能不再是唯一决定性因素。真正的护城河是软件生态。
英伟达的CUDA生态是最难以复制的优势。过去十年,几乎所有AI框架都围绕CUDA构建。开发者要迁移到其他硬件平台,意味着需要重新编译、重新优化、重新调试——这个迁移成本远高于硬件本身的价差。
但2026年的新变化是:AI自身正在降低这个迁移成本。从ForgeTrain的自动代码生成到PyTorch对多种后端的原生支持,到OpenAI的Triton语言——AI框架的硬件无关化正在加速。当"适配新硬件"的工作量从"数月"降到"数周"甚至"数天"时,英伟达的生态护城河就在变浅。
AI硬件正在从"一家独大"走向"百花齐放"。这不会发生在2026年,但趋势已经非常清晰。没有永远的王座,只有永远的技术迭代。英伟达的CUDA生态仍然是最强壁垒,但这个壁垒正在被一个意外的力量消解——AI自己。当AI可以自动生成适配不同硬件的代码时,英伟达最大的护城河就在被它自己催熟的产业力量慢慢填平。
夜雨聆风