📝 约3000字 | ⏱️ 阅读约8分钟
01 一个被制裁到快死的企业,凭什么还在做AI芯片?
2026年4月,美国参议院听证会上,商务部长卢特尼克亲口承认了一个尴尬的事实:
被美国特批出口中国的英伟达H200芯片,一片都没卖出去。

三个月前,这还被当成一份需要中国"感恩"的科技礼物。
与此同时,中国大模型公司深度求索(DeepSeek)发布了1.6万亿参数的V4-Pro模型,技术报告里,华为昇腾NPU第一次和英伟达GPU并列,写进了官方硬件验证清单。
一个卖不出去,一个被写进了名单。
魔幻吗?太魔幻了。
但这就是2026年AI芯片战场的真实面貌。
你说华为被制裁了?对。
你说华为芯片断了?也对。
但你说华为做不了AI芯片了?
不好意思,它不但做了,还越做越猛。
这事得从头说起。
02 时间线:从一个小设计中心,到中国AI芯片的半壁江山
1991-2004:种子埋下
1991年,华为成立ASIC设计中心。不是什么AI芯片,就是做专用集成电路的——说白了,给自家设备定制芯片。
那会儿连"AI"这个词都还没火,华为想的只是——核心部件不能全靠别人。
2004年10月,海思半导体正式成立。
任正非的战略逻辑很朴素:极限生存假设下,如果有一天买不到芯片了怎么办?
这种"偏执",在当时看是浪费钱,在后来被证明是救命的底牌。
2009-2017:手机芯片练兵,AI初探
2009年,海思推出首款手机芯片K3V1。性能一般,但标志着华为正式进入芯片设计领域。
2012年K3V2量产,2014年麒麟910商用,2017年麒麟970——全球首款在手机里塞进独立AI加速单元的芯片。
注意这个时间点:2017年,华为已经在手机芯片里塞进了AI加速单元。这不是跟风,这是提前卡位。
同年,华为内部启动了AI专用芯片的规划,代号"达芬奇项目"。
2018年10月10日:达芬奇亮相,昇腾诞生
这是华为AI芯片的"独立日"。
2018华为全联接大会,上海,徐直军站上台,一口气扔出三样东西:
- 达芬奇架构:华为自己从零设计的AI芯片底层架构,小到摄像头里的芯片、大到云端服务器,一套架构全包
- 昇腾310:8W超低功耗——一颗芯片的耗电量还不如一个灯泡。专门塞进摄像头、路由器这些小设备里做AI推理
- 昇腾910:台积电7nm工艺代工,算力是当时英伟达同级别的2倍。这颗专干重活——训练大模型
徐直军还同步发布了三件套:
CANN(让芯片跑起来的驱动层)
MindSpore(写AI程序的框架)
ModelArts(云端开发平台)
华为从第一天起就不是只做芯片,而是做"全栈"。
别人只造发动机,华为连方向盘、仪表盘、4S店一起给你搞定。
这叫什么?这叫有备而来。
当时市场上没有任何架构能把"终端设备—边缘网关—云端服务器"三层打通。
2019年8月:昇腾910正式商用
昇腾910商用发布,实测性能超过英伟达V100一倍。
同时,1024颗昇腾910组成集群,算力相当于当时全球最快的AI超算。
但好景不长。
2019-2020:制裁来了
2019年5月,美国将华为列入实体清单。
2020年5月,制裁升级——任何使用美国技术的半导体企业(包括台积电),给华为代工芯片都必须获得美国政府许可。
台积电断供。
昇腾910原本是台积电7nm最先进工艺代工的,产线直接停了。
海思麒麟芯片也从2020年第二季度开始,市场份额急剧萎缩至接近0。

2023年:绝地反击开始
2023年下半年,昇腾910B发布。
这不是昇腾910的简单翻版。华为把芯片重新设计中芯国际7nm产线——没有最先进的光刻机?那就换一种工艺路线绕过去。
制程受限,那就靠设计补。虽然不是碾压,但证明了国产产线也能出能打的芯片。
这是华为AI芯片的转折点——从"能用台积电"变成"离了台积电也能活"。
2024年:910C量产,910D曝光
昇腾910C采用双芯片合封设计——简单说就是把两颗910B芯片打包成一颗,算力直接翻倍。
910C的推理性能和英伟达H100还有差距,训练速度大概是H100的一半到六成。
单卡有差距,但华为的思路变了:单卡打不过你,那就打群架。
2024年2月,英伟达提交年度10-K报告,首次将华为列为AI领域主要竞争对手。
黄仁勋开始坐不住了。
2025年:全面爆发
这一年华为AI芯片全面提速:
- 4月:910C大规模量产,"两颗芯片打包成一颗"的合封技术终于成熟——这为后面把几百颗芯片连成一体铺了路
- 6月:384颗910C芯片拧在一起,组成"超节点"集群,算力是英伟达同级别顶级集群的1.7倍。单卡打不过你?那就384张卡一起上
- 8月:CANN驱动层全面开源(年底完成),昇腾开发者突破400万(鲲鹏昇腾合计超665万)——开始跟英伟达抢生态
- 9月:全联接大会上,徐直军放出路线图:950PR、950DT、960、970,一年一代,算力翻倍。不再是"下一代在哪里",而是"下一代什么时候来"
市场端更是爆发。2025年全年,华为出货81.2万张AI加速卡,占国内市场份额约20%,国产厂商中排名第一。英伟达中国份额从巅峰95%跌至55%。
字节跳动、阿里巴巴、腾讯、百度纷纷下大单。
2026年:攻守易形
2026年一季度,昇腾950PR如期上市。
FP8算力1 PFLOPS(每秒1000万亿次计算,低精度推理模式下还能翻倍),搭载自研超高速显存128GB。定价约7万元。
据行业估算,英伟达H200中国市场报价约25万元。三分之一的价格,特定场景性能接近八成。
从芯片到软件100%自主可控。从被制裁到拿下一半市场,华为用了不到7年。

03 不只是芯片:华为AI的"全栈"到底在铺什么?
华为做AI芯片,从来不是只做芯片。
硬件层:从芯片到超节点
华为的超节点战略是其核心差异化。单卡算力有差距?那就用互联技术把数千张卡拧成一股绳。
2025年推出的"灵衢"高速互联协议,就是把这些芯片连起来的"高速公路"——通信带宽提升15倍,通信延迟砍掉一半。
2026年4月的数字中国建设峰会上,华为披露:昇腾950DT超节点(8192张芯片)总算力相当于同等规模英伟达H200集群的2倍。
单兵作战打不过你,团体赛赢回来。
软件层:CANN + MindSpore + 开源生态
云服务层:ModelArts + 华为云
从开发训练到部署推理,华为云提供全流程服务。据华为公布,2026年初已有2700多家客户通过昇腾一体机完成AI应用落地。
供应链层:从设计到制造的全链条
这才是最狠的。

04 现实:华为AI芯片很强,但别盲目吹
说了这么多好消息,必须说实话——华为AI芯片远没到高枕无忧的时候。
单卡算力差距仍然存在
昇腾950PR单卡算力大概是对手H200的一半出头。
这个差距的根源是制程:华为用的是中芯国际7nm工艺,英伟达是台积电4nm。
打个比方,华为是在国道上跑车,英伟达是在高速上跑车。
训练场景仍是硬骨头
科大讯飞2026年4月底在业绩会上坦言:由于昇腾910B显存容量和带宽限制,在新模型训练中"遇到很大的困难"。
智能体强化学习采样推理效率甚至只有H200的1/5。
每当国际上出现新算法,在英伟达GPU上可以直接运行,但在昇腾上需要额外适配优化,周期3-6个月。
推理端已并驾齐驱,训练端仍在奋力爬坡。
生态壁垒依然深
英伟达CUDA生态占据全球近90%市场份额,耕耘十余年。
让数百万开发者真正从CUDA转向新平台,不是兼容就够的。
还有习惯、社区、工具链、踩坑经验,这些都是时间积累出来的。
产能瓶颈
昇腾950全年计划出货75-80万颗,核心受限中芯国际7nm工艺和显存封装产能。
简单说:订单排到下半年还交不完,供不应求是好事,但也说明产能天花板还没打开。
05 写在最后
回头看华为AI芯片这七八年,本质就是一个故事:
被逼到墙角的企业,硬生生蹚出了一条路。
华为轮值董事长徐直军在全联接大会上说了句大实话:
"由于我们受到美国的制裁,不能到台积电去投片,单颗芯片的算力相比英伟达是有差距的。
但是华为有三十多年联人、联机器的积累,所以我们在联接技术上强力投资、实现突破,使得我们能够做到万卡级的超节点。"
这就是华为AI芯片的核心策略——用系统级创新弥补单点差距。
华为AI芯片的故事还在写。
单卡算力什么时候能追上英伟达最新旗舰,没有人敢给时间表。
但有一点已经确定:中国AI产业,不会再因为买不到芯片而停转了。
关注「AI小白话」,AI干货不迷路。

夜雨聆风