中国AI正加速“换底座”
引言:从“买算力”到“造底座”,三条线同步收紧
产业侧:国产算力与自研技术栈(模型、软件、开发框架)正在从“试点可用”走向“规模好用”。头部公司一边补齐CUDA之外的第二生态(CANN、MindSpore等),一边用真实 workload 倒逼芯片与集群工程成熟,华为昇腾、百度昆仑芯等已支撑起多个万卡集群的商业化部署与训练。
监管侧:从“内容标识”到“拟人化互动”,再到对平台违规“公开点名查处”,治理工具正在从底线宣示变成可操作、可追责的“硬约束”。2026年4月底对“剪映”“即梦AI”等的查处被明确为标识办法正式实施以来的首次公开处罚,传导出清晰信号:AI内容“亮明身份”不再是建议,而是红线。
外部环境:美国在芯片、云服务与模型权重的多维度管制呈“松紧交替、总体趋严”。对华高端GPU出口(含H20/H200的许可证政策反复收紧与“设限放开”)、试图限制中国通过美国云训练大模型、甚至对“远程访问”也纳入出口管制框架,都在把不确定性制度化,并反向加速中国企业对国产算力与自主生态的投资与采购。
一、国产算力:从“应急替代”到“规模化投资”
市场格局的改写:IDC等市场研究显示,2025年中国AI加速服务器市场中,本土芯片厂商的出货占比已升至约41%;华为昇腾以81.2万张出货位居国产首位,在国内市场占有约20%份额;英伟达在华份额从约95%明显回落。这一结构性变化与美国多轮出口管制叠加,推动了“国产优先、多源备份”的采购策略常态化。
头部采购与订单信号:路透及产业链报道指出,字节跳动、腾讯、阿里等公司已向华为昇腾(910C/950系列)下单或大规模部署,用于训练与推理;部分报道更引述供应链消息,称针对新一代昇腾950PR的订单规模达到“数十万颗”。这些动作不仅是成本与供给的权衡,更体现出把关键训练任务向“可信、可用的第二算力底座”迁移的长期性战略。
运营商与云:智算基础设施的国产化风向标
三大运营商先后建成并扩容多个万卡智算集群(上海临港、呼和浩特、哈尔滨等),并在服务器集采中大幅提升国产算力占比(部分集采国产化率超90%),中国移动单笔超20亿元的算力订单被报道主要流向华为昇腾主导的CANN生态,被视为从“试点”走向“集团级战略押注”的拐点。
百度智能云点亮并计划扩容自研昆仑芯三代万卡/三万卡集群,面向多行业提供训练与推理服务,验证“国产芯片—异构平台—行业大模型”全链路的工程成熟度。
科大讯飞与华为联合打造“飞星一号”“飞星二号”国产算力平台,实现基于昇腾910B等训练的大模型在多项主流评测中进入第一梯队,并把国产算力平台训练效率提升到接近同等规模A100集群水平,成为“国产训练可用”的关键实践案例。
二、自主技术栈:在“必须”与“代价”之间加速磨合
软件生态的“第二系统”成形:华为通过CANN计算架构、MindSpore框架与ModelArts平台,构建从芯片到云服务的垂直栈,并开放与主流训练框架(PyTorch、TensorFlow)的接口兼容;百度则通过“百舸”异构平台实现国产多芯片的统一调度与多芯混训,将大集群的有效训练率、通信带宽利用率与故障恢复速度等指标推到工程可商用区间。
适配与迁移的真实“成本账”:科大讯飞等厂商公开表示,把模型从英伟达生态迁至国产算力,需要额外数月的适配与优化;从操作系统内核、算子库到通信与容错机制,经常需要联合攻关。这些时间与人力成本成为业内普遍面对的“路径切换代价”。不过,头部厂商也反馈,经过多轮迭代后,国产算力在大模型训练/推理中的效率差距在缩小,并在成本与供应链安全上形成可量化的回报。
大模型对国产算力的“背书”:DeepSeek、星火、文心等厂商持续与国产芯片适配,部分版本(如V4)公开以昇腾为优先部署环境,或以“全国产算力训练”作为产品标签,强化国产技术栈在开发者与企业客户心智中的可行性与可信度。
三、强监管:从“原则约束”到“硬边界执行”
内容标识进入“实操严管”阶段
《人工智能生成合成内容标识办法》自2025年9月施行后,2026年2月相关部门开展专项整治;4月28日,网信部门通报并依法查处“剪映”“猫箱”“即梦AI”等平台未有效落实标识规定,采取约谈、责令改正、警告、从严追责等措施。权威评论强调,AI内容必须“亮明身份”是不可变通的硬标准,这被普遍视为监管从政策引导转向实操严管的分水岭。
办法明确“显式标识+隐式标识”双重义务:一方面要求对面向用户的内容进行显著、可感知的提示(如视频需在起始画面显著位置标注且时长不少于2秒);另一方面要求在文件元数据中嵌入生成主体、唯一编号与数字签名,保障可追溯与防篡改。三类典型违规—标识缺失、标识不规范、溯源机制缺位—被集中点名,为行业提供了清晰的合规边界与执法样本。
拟人化互动服务:划定“情感边界”与“安全责任”
2025年12月,国家网信办就《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见。办法提出对拟人化互动实行包容审慎、分类分级监管,同时列出八类禁止性活动,并要求提供者做到“显著提示正在与AI交互”,在识别到过度依赖或沉迷时动态提醒与干预,对连续使用超过2小时的用户也应暂停提醒。办法还强调训练数据合规、用户状态识别与针对未成年人/老年人的特殊保护,对数据投毒、情感操控、诱导自残等风险设置制度防线。
对平台与开发者的影响
平台需建立“自动检测+人工复核+溯源记录”的治理机制,在工具层面集成标识能力与合规开关,并在上架审核、内容分发等环节嵌入风控策略。
开发者与内容生产者在使用AI工具时,需确保输出内容合规标识,避免因“不标、乱标”引发侵权、虚假信息或商业纠纷;同时关注用户协议与平台规则的更新,及时调整内容生产与分发流程。
四、外部压力:芯片、云与模型三层“不确定性”制度化
芯片侧:从H20到H200,“松紧交替”的许可证框架
2025年4月,英伟达披露美国政府将对其H20及达到相应内存带宽、互联带宽的其他芯片对华出口实行无限期许可证要求,此举被解读为对既有“合规特供版”的再收紧;随后美国在是否放行H200的问题上反复调整审核方式与数量限制,进一步放大市场不确定性。国内头部公司据此加快“双链并行”:一边视需要采购必要的海外GPU,一边系统性投资国产算力与国产化集群。
云侧:从“出口硬件”到“远程访问也视同出口”
2024—2025年间,美国商务部提出并推动相关规则,要求美国IaaS(云)提供商对外国用户身份进行强验证,并将“允许外国实体远程使用境内算力训练大模型”的行为纳入出口管制视野;美国国会众议院通过的“远程访问安全法案(RASA)”试图把“远程访问受控技术”明确为需要许可的“出口”。这意味着,即便硬件不入境,通过美国云训练大模型也可能面临合规风险,进一步压缩“算力套利”的空间,倒逼中国企业强化本土云与国产算力的绑定。
模型与数据侧:从“芯片管制”向“能力扩散管控”延伸
美国国会研究处(CRS)报告指出,出口管制的首要目标并非“完全阻断”,而是“延缓”中国在先进计算与AI领域的能力形成;政策工具从实体清单、设备与HBM管制,扩展到AI扩散规则及其替代方案,整体呈现“多工具叠加、长臂管辖”特征。与此同时,个别美国AI公司公开宣称将限制中国控股企业使用其服务,引发“模型制裁化”的新担忧;中方主管部门与业界均强调反对科技与经贸问题“武器化”,主张开放合作与自主攻关并重。
五、走向“组合题”:可行路径与仍需直面的挑战
企业侧的“组合解法”
算力:关键任务“多源备份”,一般业务加速向国产栈迁移;优先保证供应链连续性与合规安全,再追求绝对性能峰值。
技术:在自研/国产框架上建立持续的工程能力(算子、通信、容错与混合精度),避免在关键训练路径上被单一生态锁定。
治理:把“标识、留存、可控、可审计”嵌入产品流程,通过自动化工具减少人工合规成本。
监管侧的平衡艺术
保持分类分级与场景化监管,避免“一刀切”抬高社会总成本;在生成内容、拟人化服务、数据使用等细分领域持续完善“标准+罚则+技术指引”的组合工具箱。
对标注与隐私等规则,保持跨部门、跨司法辖区间的协同,减少企业在多地执法中的规则冲突与合规摩擦。
真正的长期考验
国产算力与自主栈的效能、可靠性与开发者体验仍需在更大规模、更长周期中验证;与全球顶尖GPU/生态在单卡与集群层面的差距如何收敛,取决于在先进封装、存储、互联与软件工具链上的长期投入与协同创新。
外部压力的“工具箱”仍在扩展(从实体清单到远程访问规则、从芯片到模型与数据)。中国AI要走稳“国产算力+自主栈+强监管”的组合路线,既要在硬核技术上补短板,更要在治理与开放之间保持可预期、可对话的平衡。
结语:不是“短跑”,而是“耐力赛”
综合各方公开信息可以得出:中国AI并非在单一赛道上冲刺,而是在算力、技术栈与监管三条线上同时完成“换底座”。头部公司已从“用国产试一试”转向“在国产上长跑”;监管从“底线宣示”走向“硬约束执行”;外部压力则把这种自主化从战略意愿变成了商业与合规的现实需要。
面向未来,产业竞争力的关键变量,不再只是“谁拥有最顶尖的几张卡”,而是谁能在开放合作的框架下,把国产算力与自主栈做到“规模化好用、合规可控”,在不确定的外部环境中建立稳定可预期的技术-治理共同体。
夜雨聆风