
在上一篇文章中,我们讨论了算力服务商正面临的双重挤压——上游芯片和电力成本持续攀升,下游Token价格战此起彼伏。其中,高端GPU芯片的供给紧张,是上游成本压力中最关键也最紧绷的一环。
这引出了一个无法回避的问题:当高端GPU长期由少数厂商主导、获取成本和难度都在上升时,中国自己的AI芯片,能不能顶上?
答案正在浮出水面。但要从“能用”走到“好用”,这条路并不短。
为什么芯片如此关键?
在回答“国产芯片走到哪一步”之前,有必要先厘清一个基础问题:为什么在Token经济的成本结构中,芯片占据如此核心的地位?
据行业分析,单次推理成本中,硬件折旧占比高达58%,电力消耗占29%,网络带宽占13%。这意味着,芯片不仅自身就是最大的成本项,它还通过功耗间接影响电力成本——更先进的制程和架构,往往意味着更高的能效比,即“干同样的活,耗更少的电”。
换言之,谁掌握了高性能AI芯片的供给,谁就能在Token经济的成本竞争中占据结构性优势。过去几年,这一优势高度集中在英伟达手中。但随着出口管制收紧和供应链不确定性增加,“把鸡蛋放在一个篮子里”的风险越来越不容忽视。
国产芯片的“可用”阶段:已经跑通
2025年9月,工业和信息化部印发《首台(套)重大技术装备推广应用指导目录(2025年版)》,明确将国产AI芯片及训练平台列入重点推广方向。这标志着国产AI芯片正式进入国家级推广应用体系。
在具体部署方面,华为昇腾系列是最早实现规模化落地的国产AI芯片之一。截至2025年底,昇腾AI基础软硬件平台已支持50余个主流大模型原生训练和推理,覆盖GPT、LLaMA、DeepSeek等主流架构。在生态兼容性上,昇腾已适配PyTorch、TensorFlow、飞桨等主流深度学习框架,并通过CANN异构计算架构实现对英伟达CUDA生态的部分替代。
寒武纪则是另一个重要玩家。2025年,寒武纪思元系列智能加速卡在多家头部云厂商和算力中心完成部署,支持大模型推理和部分训练场景。据公开信息,寒武纪2025年全年营业收入预计同比增幅超过60%,主要驱动力正是AI芯片的规模化出货。
一个更具标志性意义的事件是:2025年,DeepSeek宣布其模型已成功适配华为昇腾平台,并在部分业务场景中实现了与英伟达方案可比拟的推理性能。这被视为国产芯片从“可用”迈向“好用”的关键一步——因为只有当头部模型厂商愿意将核心业务部署在国产芯片上,“可用”才算真正走通了商业闭环。
新的变量:从“堆算力”到“拼效率”
就在市场为国产芯片的生态适配进度感到乐观时,一个更深层的技术变革正在发生。
2026年5月,华为在2026国际电路与系统研讨会(ISCAS 2026)上正式发布了一套全新的半导体理论——韬(τ)定律。这是中国首次在全球半导体领域提出系统性的指导性新原则。
根据华为官方公布的信息,韬定律指出:面对摩尔定律逼近物理极限的困境,不应再单纯依靠“几何缩微”(即缩小晶体管尺寸)来提升芯片性能。华为提出以“时间缩微”替代“几何缩微”,通过构建贯穿“器件→电路→芯片→系统”四层级的协同优化体系,以系统性降低时间常数τ为目标,持续压缩信号传播时延,驱动性能、能效与晶体管密度的持续提升。
这一发现之所以引起产业界的高度关注,在于它揭示了后摩尔时代AI芯片的演进方向——不再做单纯比拼晶体管尺寸的“制程竞赛”,而是转向架构、封装、互联等全栈系统级的优化。这相当于发现,与其造一台马力更大但传动效率低的发动机,不如重新设计传动系统,让每一匹马力都充分释放,实现从“拼制程”到“拼全栈系统效率”的范式转换。
基于“韬定律”的系统实践:昇腾950系列芯片
理论突破的价值,最终要靠产品来验证。
同样在2026年5月,华为宣布基于韬定律的指导原则,昇腾950系列AI芯片已开始大规模商用。这是国产AI芯片在“后摩尔时代”探索新架构路径的一次重要实战。
根据华为官方公布的技术白皮书及实测数据,昇腾950系列首次大规模采用了3D存算一体架构。简单理解,就是将计算单元和存储单元像盖摩天大楼一样,在垂直方向上堆叠并直接互联。这彻底改变了传统芯片中“计算单元和存储单元在平面上分离、数据需要长途搬运”的经典冯·诺依曼架构。
这种架构变革带来的成效是立竿见影的。以主流的大语言模型推理任务(如Llama-3-70B模型)为测试场景,实测数据显示:
· Token生成密度大幅领先:昇腾950在推理侧的核心性能指标——Token生成密度(Tokens-per-Second per-Watt),达到了同期某国际主流旗舰AI芯片的1.3至1.5倍。这意味着在相同的功耗下,它能更快地生成更多Token,对极度看重运营成本的推理服务商来说,吸引力巨大。
· 长文本场景优势显著:在128K长上下文窗口的极限推理测试中,昇腾950的处理延迟相比国际主流旗舰芯片降低了40%以上。这恰好击中了当下智能体、长文档分析等热门应用对长上下文高吞吐的迫切需求。
华为AI理论实验室首席科学家在发布会上表示:“韬定律的提出和昇腾950的落地,证明了我们不再只是追赶者。在定义下一代AI计算范式上,中国科技企业也开始有了自己的原创性贡献。”
“好用”的关键鸿沟:生态、性能与成本
韬定律和昇腾950的出现,无疑为国产芯片注入了一剂强心针。但客观而言,单点技术的突破不等于全局领先。国产芯片要真正成为算力服务商的规模化新选项,仍然需要跨过三道坎。
第一道坎:软件生态。
这是国产芯片面临的最大挑战。英伟达之所以能牢牢占据AI芯片市场的主导地位,不仅因为硬件性能领先,更因为其CUDA生态经过十余年积累,已成为AI开发者的“默认语言”。全球绝大多数AI框架、模型库和开发工具,都是基于CUDA构建的。
国产芯片要替代英伟达,硬件性能追上是必要条件,但远非充分条件。如果开发者需要重写大量代码才能把模型跑在国产芯片上,迁移成本就会成为推广的最大阻力。
目前,华为昇腾通过CANN架构和MindSpore框架,正在构建从芯片到框架的自主生态。值得关注的是,在发布昇腾950的同时,华为也配套发布了CANN 8.0软件栈,首次引入了AI编译器自动优化技术,能实现主流模型从英伟达CUDA平台到昇腾平台的自动化迁移率超过90%。如果这一目标如期实现,将大幅降低开发者的迁移成本,加速国产芯片的实际应用。
第二道坎:性能代差。
尽管昇腾950在“能效比”上取得了领先,但在需要极致算力的超大模型训练场景中,国产芯片的综合集群效率仍需验证。不过在推理场景中,代差的影响相对较小。因为推理任务可以更灵活地拆分和调度,对单卡峰值性能的依赖度低于训练。这也是为什么国产芯片的规模化部署首先在推理侧展开——这是一个更务实、也更容易验证商业价值的切入点。
第三道坎:成本竞争力。
理论上,国产芯片应该比进口芯片更便宜。但在实际采购中,成本竞争力取决于良率、产能、出货量等多个因素。当前,部分国产AI芯片的实际出货价格并不比英伟达同级别产品便宜太多——因为先进制程的代工成本本身就很高,而国产芯片的出货规模尚不足以摊薄研发和流片费用。
不过,随着国产芯片出货规模的持续增长——据行业预测,2026年国产AI芯片出货量将较2025年有显著增长——成本竞争力将逐步改善。尤其是当国产芯片与西部算力节点的绿电优势叠加时,“国产芯片+绿电”的组合有望在推理侧形成对“进口芯片+市电”的成本优势。
值得关注的突破方向
除了韬定律所代表的存算一体路径,还有几个正在发生的突破值得关注。
· 先进封装技术带来“弯道超车”机会。 随着摩尔定律放缓,单纯依靠制程微缩提升性能的路径越来越难走。而先进封装(如2.5D/3D封装、Chiplet技术)可以将不同工艺的芯片模块集成在一起,在不需要最先进制程的情况下实现性能的大幅提升。中国在先进封装领域有一定技术积累,这为国产AI芯片提供了一条“非对称竞争”的路径。
· 光互联等新架构加速探索。 光互联用光子替代电子进行芯片间通信,带宽和能效都有数量级的提升。这些新架构一旦成熟,可能重塑AI芯片的竞争格局,为国产芯片提供换道超车的机会。
· 开源硬件生态的兴起。 RISC-V等开源指令集架构正在AI加速器领域获得越来越多的关注。开源路线可以降低对单一技术体系的依赖,为国产芯片提供更大的创新自由度。
对Token经济的影响
回到Token经济的主线。国产AI芯片从“可用”走向“好用”,对整个产业格局将产生三重影响。
第一重:供给多元化将缓解成本压力。 当算力服务商不再只有一个芯片供应商可选时,上游的议价格局将被改写。即使国产芯片在性能上暂时落后,其作为“第二货源”的存在,也能对进口芯片的价格形成有效牵制。
第二重:推理侧的“国产替代”将率先规模化。 如前所述,推理任务对单卡峰值性能的依赖度较低,是国产芯片最容易切入的场景。随着西部算力节点对推理业务的承接量持续增长,国产芯片有望在推理侧率先实现规模化替代。昇腾950在能效比上的突破,将进一步加速这一进程。
第三重:自主可控为全球化运营提供战略纵深。 在全球地缘政治不确定性上升的背景下,拥有自主可控的芯片供应链,不仅是成本问题,更是安全问题。韬定律的提出和昇腾950的落地表明,中国AI芯片产业正在从“追赶者”向“定义者”转变——这不仅是技术层面的突破,更是产业话语权的提升。
结语
国产AI芯片的故事,不是一个“一夜逆袭”的传奇,而是一场“循序渐进”的工程。从“可用”到“好用”,需要跨过生态、性能、成本三道坎,需要整个产业链从芯片设计、制造、封装到框架、算法、应用的协同努力。
但方向是明确的。当韬定律这样的原创理论开始引领架构创新,当昇腾950这样的产品在能效比上实现反超,当西部算力节点的绿电为国产芯片提供理想的规模化部署场景——国产AI芯片的“好用”时代,正在加速到来。
在下一篇文章——也是这个系列的终章——我们将站在全局视角,回顾Token经济从一度电到一个Token的完整价值链条,并展望这场变革未来十年可能的发展方向。
下期预告:《从一度电到一个Token:Token经济的未来十年》
夜雨聆风