AI Infra日报 5月28日|聚焦AI基础设施与超节点领域

作者：观天下 | 聚焦AI基础设施与超节点领域

1. 四部门算电协同行动方案落地：首批51个"AI+能源"高价值场景发布

5月26日，国家能源局召开全国"人工智能+"能源现场推进会，正式发布首批51个"AI+能源"高价值场景，覆盖电网、新能源、水电、火电、核电、油气、煤炭八大领域，25家能源企业签署场景开放倡议书。国家发改委、国家能源局、工信部、国家数据局四部门联合印发《关于促进人工智能与能源双向赋能的行动方案》，提出力争到2030年构建AI与能源双向赋能新格局。

国家能源局局长王宏志定调："人工智能的背后是算力，算力的尽头是电力，关键是要做到算电协同。"数据极为震撼：2025年全国算力中心用电1700亿度（占全社会1.6%），8大枢纽节点近三年用电增速39.5%，预计2030年算力用电量将突破8000亿度（占全社会6%）。行动方案明确部署：统筹大型新能源基地与国家算力枢纽规划、探索核电/氢能直连算力设施、百万千瓦级AI算力设施与能源系统协同建设。

值得关注：
这是"算电协同"首次被纳入多部委联合行动方案，标志着AI基础设施的能源保障从"电力供应"升级为"系统性战略工程"。对超节点架构而言，高密度算力集群的电力供给和散热需求将从选址阶段重新定义数据中心架构。绿电直连+核能直供将从根本上改变AI Infra的成本结构和布局逻辑。

2. 华为发布"韬（τ）定律"：以时间缩微替代几何缩微，麒麟2026首发逻辑折叠技术

5月25日，在上海ISCAS 2026国际电路与系统研讨会上，华为董事、半导体业务部总裁何庭波正式发表中国首个面向全球半导体产业的指导原则——"韬（τ）定律"。核心思想是：以"时间缩微"替代传统"几何缩微"——通过降低系统时间常数τ、运用逻辑折叠等技术压缩信号时延，在不依赖极致工艺缩微的前提下提升晶体管密度与芯片性能。

何庭波同时宣布，将于今秋面世的麒麟2026手机芯片将首次完整采用逻辑折叠技术，Mate 90系列有望首发搭载。虎嗅精读其论文指出，该理论将时间τ作为统一优化目标，2031年可达等效1.4nm性能，为半导体行业突破物理与成本极限提供了全新路径。

值得关注：
韬定律的意义远超手机芯片本身。它是中国首次在全球半导体领域提出原创性产业指导原则，从"跟随摩尔定律"到"定义新范式"。对AI Infra的影响更加深远：逻辑折叠技术的底层原理同样适用于AI加速芯片设计——如果国产AI芯片能在不依赖先进制程的情况下实现性能跃升，超节点生态的供应链自主性将大幅增强。

3. 面壁智能×清华发布BitCPM-CANN：首个昇腾全栈三值1.58-bit大模型，8B模型可跑手机

5月25日，面壁智能联合清华大学、OpenBMB开源社区正式发布BitCPM-CANN——这是中国首个完全基于华为昇腾国产算力平台完成端到端训练的三值（1.58-bit）大模型系列。相比传统BF16全精度模型，可节省约6倍显存，模型能力保留率高达90%-97.2%。这意味着8B参数的模型可以在仅8GB显存的旗舰手机上流畅运行，600亿参数模型装入手机成为现实。

该成果于5月23日在鲲鹏昇腾开发者大会（KADC 2026）完成首秀，从量化算子到训练算法实现了全链路昇腾原生开发。模型已在Hugging Face和GitHub全面开源，为全球开发者提供了基于国产算力平台的端侧AI开发新路径。

值得关注：
BitCPM-CANN是国产算力生态从"能用"到"好用"的关键信号。全链路昇腾原生意味着模型不再依赖CUDA生态的迁移适配，而是从训练到推理都在国产架构上"土生土长"。对超节点战略的意义在于：端侧模型的高效推理与云端超节点训练形成了"端云协同"的完整闭环——训练在昇腾950超节点，推理在手机上的BitCPM，算力生态版图正在成形。

4. DeepSeek一月内宕机三次：日活暴增66%但算力仅增8%，算力鸿沟拉警报

5月24日，DeepSeek再次发生大规模服务故障，"DeepSeek崩了"冲上微博热搜。这已是本月第三次大范围宕机，大量用户频繁遭遇"服务器繁忙"提示。雷锋网披露关键数据：DeepSeek日活用户从1.2亿激增至2亿（+66.7%），但算力储备仅增长8.3%——需求增速是供给增速的8倍。5月21日一次宕机中，深度思考等高负载功能直接瘫痪，暴露了推理算力的严重瓶颈。

这不是DeepSeek一家的困境。36氪同期报道揭示：硅谷同样深陷算力荒——H200一夜涨价30%，H100抢到缺货，就连英伟达自己的研究团队也需要排队等卡。英伟达应用深度学习研究团队负责人Bryan Catanzaro向黄仁勋申请训练卡时得到的回复是："不好意思，那些卡已经卖掉了。"

值得关注：
DeepSeek宕机和硅谷算力荒是全球AI Infra供需矛盾的缩影。推理需求正以超线性速度爆发（Agent、AI编程、多模态交互），但算力供给受限于晶圆产能、封装产能和电力供给的物理约束。对超节点架构而言，这验证了一个核心逻辑：算力效率（通过高密度互联和统一调度最大化单位功耗产出）比算力总量更为关键——在供给受限时代，谁的单位功耗产出高，谁就拥有定价权。

5. 四大会计师事务所全面部署Claude：110万专业人员将规模化接入AI

5月19日，KPMG与Anthropic宣布推出"KPMG Digital Gateway Powered by Claude"，覆盖全球138个国家的27.6万名专业人员，计划2026年9月在Azure全面实施。此前，德勤（约47万员工）和PwC（数十万专业人员）已先后宣布企业级Claude部署。三家合计覆盖约110万全球专业人员，全部将在9月前拥有Claude访问权限，安永成为唯一尚未公告的四大。

这不是简单的"员工试用AI"——Claude Cowork和Managed Agents被直接嵌入核心交付平台，专业人员可在客户互动中实时构建Agent工作流，将部署时间从数周缩短至数分钟。PwC披露的数据显示：保险承保时间从10周缩短至10天，安全审计任务时间减少70%。AI部署从"试点阶段"正式跨越至"企业级规模化"。

值得关注：
110万同时在线专业人员+Agent工作流意味着推理算力需求将呈指数级爆发。更重要的是，四大事务所不仅是用户——它们是全球500强企业的"AI采购通道"。当KPMG的审计团队用Claude为客户做安全审计时，被审计企业自然成为Claude的下一个客户。这种B2B2B的算力分销模式将彻底改变AI基础设施的需求结构：推理算力将从"开发者自购"转向"通过专业服务渠道规模化接入"。

6. 宇树科技6月1日科创板IPO上会：具身智能倒逼边缘AI算力激增

5月25日，上交所公告定于6月1日召开上市审核委员会审议会议，审核宇树科技科创板IPO。宇树科技拟募资42.02亿元，其中20亿元投入大模型研发，将打造年产7.5万台人形机器人制造基地。2025年公司营收17.08亿元（+335%），人形机器人出货量5632台、全球市占率32.4%，四足机器人全球市占率近70%。我国人形机器人整机企业超140家，年出货量1.44万台，全球占比84.7%。

宇树的IPO招股书揭示了一个关键转型：公司正从"硬件销售"转向"软硬一体平台"——20亿元大模型研发投入占总募资近半，体现了具身智能行业的核心共识：机器人真正的竞争不在机械结构，而在"大脑"——即端侧AI推理能力。

值得关注：
7.5万台年产规划意味着7.5万个移动端实时推理节点。具身智能对AI Infra提出全新维度的需求：低延迟（毫秒级运动控制）、高可靠（不能宕机）、端云协同（本地推理+云端训练）。面壁智能的BitCPM端侧模型恰好给出了技术答案。具身智能正在成为AI算力的"第三增长曲线"——从云端训练到端侧推理，从数据中心到车间工厂，算力网络正在向物理世界延伸。

7. AI部署竞赛白热化：OpenAI砸40亿美元成立DeployCo，AI产业从"造模型"转向"占部署"

5月，AI产业两条主线同时浮现：一是四大会计师事务所全面部署Claude，二是OpenAI推出DeployCo——一家由TPG领投、高盛/贝恩/麦肯锡等19家机构联合注资40亿美元的独立企业咨询子公司，并收购拥有150名前沿部署工程师的Tomoro，采用Palantir式的"嵌入式工程师"模式直接派驻客户组织内部。

BuildFastWithAI的分析指出，2026年的AI竞争主要不再是基准分数，而是谁控制部署层——AI能力通过哪些系统、工作流和组织关系到达最终用户。Anthropic Q2营收109亿美元受企业平台合同驱动，OpenAI在API市场份额已从50%降至约25%，DeployCo是对这一竞争压力的直接回应。同时，Cohere与德国Aleph Alpha合并（估值200亿美元），打造跨大西洋"主权AI"基础设施，进一步丰富了部署层的竞争格局。

值得关注：
部署层竞赛对AI Infra的影响深远。当AI不再以"API调用次数"而是以"专业服务订阅"的形式交付时，推理算力的需求结构将从"峰值弹性"转向"持续稳定"——这是超节点架构的优势场景。此外，Cohere-Aleph Alpha的"主权AI"路径意味着AI基础设施将出现"非美国云"的第二选择，国产超节点生态在这一格局中拥有明确的差异化价值定位。

编辑：观天下 | 2026年5月28日 | 聚焦AI基础设施与超节点领域

数据来源：国家能源局、新华社、华为ISCAS 2026、面壁智能/清华大学、雷锋网、36氪、BuildFastWithAI、上交所公告等