作为云计算的升级迭代形态,云智算是算网基础设施与人工智能核心技术深度融合的新型云服务模式,由中国移动在2025年云智算大会上首次提出并明确定义,是未来算网智一体化算力网络的核心载体,能提供一体化算网资源、全栈式开发环境等一站式服务,核心是从“提升IT效率”转向“加速智能创新”,架构拓展为AI IaaS、AI PaaS、MaaS、AI SaaS四层,算力核心也从CPU转向GPU/NPU等智能硬件集群。但随着其普及,安全风险持续加剧,硬件固件漏洞、软件供应链漏洞等已多次引发安全事件,而主动防护真能“堵住”所有漏洞吗?

云智算的安全风险,本质是云计算与人工智能风险的深度耦合,核心源于架构升级和模型、数据这一新型生产资料。硬件层面,GPU/NPU等智能算力硬件工艺复杂、供应链冗长,易引入固件漏洞或硬件后门,AMD芯片曾被曝出存在数十年未被发现的固件漏洞,可允许恶意软件深度感染内存,对云智算服务器构成严重威胁;软件层面,PyTorch、CUDA等开源框架的深度集成,虽提升开发效率,却也带来大量动态涌现的漏洞,扩大攻击面。

更值得警惕的是AI催生的新型攻击:GPU/NPU的高并行计算会产生独特功耗与电磁特征,让侧信道攻击更易实施,美国佐治亚理工学院等联合团队研究证实,通过分析这类物理信号,可逆向获取设备运行指令甚至敏感信息,多GPU系统更易成为攻击目标;而生成式AI能实现“侦查-武器化-投递-漏洞利用”全攻击链自动化,强化学习驱动的攻击系统可动态规划最优路径,对传统防御形成明显挑战。反观传统防御,仅聚焦软件层,无法覆盖硬件侧信道攻击,且静态响应模式难以跟上AI攻击的进化速度,防护滞后问题突出。

应对这些风险,需构建“动态内生、主动免疫”的一体化防护体系,而非传统“补丁式”防御。硬件层面,依托物理不可克隆函数(PUF)技术,可为每块硬件生成唯一“数字指纹”,这是目前解决硬件供应链信任难题的核心技术方向,搭配硬件级监测单元,可实时捕捉算力波动、功耗异常,有效防范侧信道攻击与固件篡改。

智能感知层面,通过细粒度算力资产识别、环境威胁监测与风险智能评估,可实现攻击“看得见、判得准”,目前相关技术正从方案验证走向规模化落地[1]。协同防御层面,网络快速阻断、安全隔离资源池等技术已趋成熟,能实现威胁快速隔离、业务持续运行与全局策略联动,完成从风险识别到处置的自动化闭环[1]。

值得关注的是,我国正加快完善云智算安全标准,中国通信标准化协会(CCSA)已立项推进二十余项相关标准,覆盖云安全、人工智能安全等多个领域;中国移动牵头在ITU-T、CCSA研制多项相关标准,涵盖智能计算中心、云智算服务等多个领域,为行业发展提供规范指引。但需明确,主动防护并非“万能盾牌”,无法彻底堵住所有漏洞,其核心是将风险控制在可接受范围。未来,需产业协同发力,深化防护技术研发与标准落地,才能护航云智算生态健康发展,让这一新型算力模式真正赋能智能创新。
夜雨聆风