
1 芯片能耗升级,液冷需求爆发
1.1 热管理技术变革,液冷行业迎来增长空间
机柜功率提升下,液冷成为数据中心的必选热管理方式。根据 Introl,当前 NVIDIA 机架功率达 132kW,下一代将需要 240kW,风冷所能提供的能力与 AI 基础设 施所需之间的差距随着每一代 GPU 的更新而不断扩大。
此外,数据中心每年在冷却方面的支出为每兆瓦 190 万至 280 万美元。以英伟 达 GB200 NVL72 为例,部署液冷 GB200 NVL72 系统可使超大规模数据中心 实现高达 25 倍的成本节约,这意味着一个 50 兆瓦设施每年可节省超过 400 万 美元。

英伟达新一代 AI 超级计算机平台 Vera Rubin,单芯片热设计功耗(TDP)已经 超出风冷技术极限。英伟达 B200 芯片的功率约在 1000W 左右,而随后的 B300 则进一步提升至1400W 。展望2026年,R200芯片的功率预计将达到2300W, 到 2027 年量产的 R300 功率甚至可能突破 3500W。这种芯片级功率的飞跃, 液冷系统将成为散热的最佳解决方案。

Vera Rubin 架构基于采用 MGX 模块打造,共享标准化液冷散热体系。Vera Rubin 架构的五个机架均基于统一 MGX 模块化架构打造,每个 NVIDIA MGX 机架共享相同的功率、冷却和机械包围。

MGX 采用 100%液冷技术,推动液冷技术成为机架“标配架构”。在散热层面, 风冷正在失去对超高功耗算力平台的适应性。MGX 机架采用 100%液冷技术, 在液冷模块内部做板级/背板式集成互联。
1.2 全球能效政策与环境合规压力
能效利用效率(PUE,Power Usage Effectiveness )已成为数据中心准入和 运营的核心指标。PUE=数据中心总耗电量/IT 设备有效耗电量,假如 PUE=1, 意味着极致节能,无额外制冷、配电损耗;数值越大,制冷 / 配电等无效能耗越 高、能效越差。在“双碳”和能耗约束背景下,国家已将 PUE 纳入数据中心准入和 运营硬指标。

国家明确要求 2025 年新建数据中心 PUE 不高于 1.25。据中国信通院数据, 2024 年全国数据中心用电量超过 1660 亿千瓦时,占全社会用电量 1.68%,且 增速高于整体用电需求;若 AI 高景气持续,2030 年中国算力中心用电量高情景 下或超过 7000 亿千瓦时、占全社会用电量 5.3%。到 2025 年年底,新建及改扩 建大型和超大型数据中心电能利用效率降至 1.25 以内,国家枢纽节点数据中心 项目电能利用效率不得高于 1.2。
液冷技术节能显著高于风冷,是满足 PUE 要求的不二选择。根据中国储能网数 据,液冷技术相对于风冷而言约可节约 20%的空调电能,同时因取消服务器内部 风机,IT 部分电能可节省 13%~25%,总体的节能效果在 40%以上。液冷技 术可以满足 2.7-30kW/机柜的数据中心散热需求,解决超高热流密度的散热问 题。

下图是英伟达的混合液冷散热方案,优先利用自然冷却,(Chiller-free mode), 只有在环境温度较高时才启动冷水机组(Water Cooled Chiller),从而大幅降 低能耗。

1.3 液冷技术路径对比:冷板为主流
液冷技术按冷却液与发热器件的接触方式可分为直接接触式与间接接触式两类。 直接接触式指冷却液与发热器件直接接触散热,涵盖单相浸没式液冷、相变浸没 式液冷、喷淋式液冷;间接接触式指冷却液不直接接触发热器件,通过散热器间 接散热,涵盖单相冷板式、两相冷板式液冷。


各类液冷技术路线在散热上限、部署成本及成熟度方面差异明显。液体介质优异 的热物理特性使其能够高效吸收和传递热量(例如,水的比热容约为空气的 4000 倍,导热系数约为空气的 24 倍),可以应对数十乃至上百 kW 的机柜功率密度, 保障高性能芯片在适宜温度下稳定运行。液冷系统减少了对大型空调和风扇的依 赖,可节省约 30%-50%的能耗。浸没式液冷 PUE 可低于 1.2,冷板式液冷可 低于 1.3,远优于风冷的 1.6。

1.3.1 冷板式液冷:当前市场的绝对主流
各技术路线市场结构中仍以冷板式液冷为主。其核心是将带有内部流道的金属冷 板(通常为铜或铝材质)紧密贴合在 CPU、GPU 等高发热部件表面,冷却液在 冷板内部流道中循环流动,与电子元器件间接接触,吸收部件产生的热量。适用 于对现有风冷数据中心进行改造升级,或对散热要求逐步提升的场景。是目前市 场占比最高的技术路线。
⚫ 优点:对现有服务器和机房改造成本相对较低,技术成熟度较高,兼容性较 好,可针对性冷却关键高热部件,且使用成本较低的冷却液。
⚫ 局限:散热能力仍有上限,对于内存、硬盘等其他非核心部件的散热效果有 限,通常需要风冷辅助散热(形成风液混合散热模式)。

1.3.2 浸没式液冷:追求极致效能的终极路径
浸没式液冷技术稳步发展,可按冷却液相态变化分为单相与两相两类技术路线。 浸没式液冷将整个服务器或发热部件完全浸没在绝缘、低沸点或高沸点的冷却液 中,通过液体与发热部件的直接接触进行热量交换。根据冷却液在散热过程中是 否发生相变,可分为单相浸没式和两相浸没式。通常用于超高密度计算、AI 训练 集群、超算中心等对散热和能效有极致要求的场景。

单相浸没式液冷可根据浸没机柜的形态进一步划分为卧式浸没与立式浸没两类。 传统卧式浸没液冷在设备维护时,需开启 TANK 上盖,且需配备可移动机械吊臂 或专业维护车完成设备竖直插拔,不仅维护流程复杂、耗时较长,开盖过程还会 导致冷却液挥发,进而增加整体运行成本。为解决上述痛点,行业将浸没机柜优 化为立式架构,形成单相立式浸没液冷。该架构与冷板式液冷机柜形态相近,核心差异在于通信设备需实现板级密封,最终兼具冷板式液冷维护便捷的特点与浸 没式液冷节能高效的优势。

两相浸没液冷二次侧冷却液在设备内吸热由液态转化为气态。工作原理为将服务 器完全浸没于密闭箱体,冷却液在热源表面吸热沸腾汽化,蒸汽经顶部冷凝回流 完成循环,依托汽化潜热实现高效散热。但该技术高度依赖低沸点氟化液,对冷 却液的热稳定性、沸程、汽化潜热等性能要求严苛,同时对系统的密封性与承压 能力提出极高标准,因此不仅面临显著的环保压力与成本挑战,更适配高热流密 度场景下的极致散热需求。

1.3.3 喷淋式液冷:特定场景的精准降温
喷淋式液冷属于直接接触式液冷技术,核心是对电子设备器件实施精准喷淋散热。 通过特制的喷嘴,将冷却液精确地喷淋到发热部件表面,冷却液吸收热量后滴落 至收集盘,再进行循环冷却。
⚫ 优点:散热均匀性较好,冷却液用量相对浸没式少,可以针对性地对特定区 域进行强力冷却。
⚫ 局限:液体雾化和飞溅可能导致控制困难,对密封性要求高,系统复杂性较 高,维护相对不便。目前市场占比较小。

2 液冷市场处于高速发展初期
2.1 液冷市场规模
全球服务器冷却市场的增长核心动能来自液冷领域的强劲爆发。根据 Introl,全 球液冷市场将从 2025 年的 28 亿美元飙升至 2032 年的 210 亿美元以上,年复 合增长率超过 30%。

中国液冷市场规模同样呈现逐年扩张态势。据 IDC,2024 年国内液冷服务器市 场规模达 23.7 亿美元,同比增长 67%;据中国信息通信研究院,2024 年中国智算中心液冷市场规模达 184 亿元,较 2023 年同比增长 66.1%;预计未来 5 年 市场将持续增长,到 2029 年我国智算中心液冷市场规模将攀升至约 1300 亿元。

2.2 液冷产业链拆解
液冷产业链由上游零部件与 IT 设备、中游技术服务、下游应用场景三大核心环节 构成。三大核心环节深度协同,共同决定液冷智算中心的底层支撑能力、部署门 槛、运行效率与综合赋能价值。

上游:核心部件与原料供应商。包括冷却液、CDU(泵、阀门、换热器)、液冷 板、manifold、UQD 等。
中游:液冷系统解决方案与集成商。
1) 专业液冷解决方案提供商:这类企业专注于液冷技术的研发、产品制造、 系统集成及运维服务,提供从芯片级到机房级的整体液冷解决方案。代 表性国内企业如英维克、申菱环境、高澜股份等。
2) 服务器 OEM/ODM 厂商:华为、浪潮信息、曙光数创、联想、戴尔、 HPE 等主流服务器制造商,正将液冷技术深度集成到其高性能服务器 产品线中,推出液冷优化型服务器或完整的液冷机柜解决方案。
3) 大型数据中心基础设施建设商/总包商:部分具有强大总包能力的企业, 在承建大型数据中心项目时,也会整合液冷解决方案。
下游:数据中心运营商与最终用户。包括电信运营商、互联网大厂、第三方 IDC、 超算中心等。

2.3 冷板液冷主要零部件
冷板式液冷主要由冷板、CDU、UQD、Manifold 四大零部件构成。一套完整的 冷板式液冷系统可分为两大部分:一次侧系统和二次侧系统。一次侧系统主要指 室外散热循环,二次侧系统则覆盖室内设备端的液冷循环。两套循环在 CDU(冷 却液分配单元)处进行热交换,但物理上是隔离的,避免了室外水质影响室内精 密设备。
2.3.1 冷板
冷板通过与发热元件接触实现换热。冷板主要由冷板基板、流道盖板、流体通道 构成。冷板基板为冷板的底层部件,通过界面材料与发热器件直接接触。流道盖 板为冷板的顶层部件,与基板密封形成封闭的腔体。冷板整体预留有配管或连接 口,冷却液流过流体通道,并通过与流体通道的接触实现换热。冷板的设计形态、加工工艺多样,主要分为冲压冷板、CNC 加工(CNC machining,计算机数字 化控制精密机械加工)冷板以及圆管冷板。

冷板相变沸腾换热是热点技术方向。两相冷板技术通过冷板组件内的冷却液吸热 发生相变,使绝大部分热量通过汽化潜热的方式被高效带走,因此散热能力更优。 同时,冷却液在相变区域基本维持在饱和温度附近,显著减小了液体流动导致的 纵向温度梯度,冷板与芯片传热接触面的温度分布更加均匀。两相冷板可通过优 化内部流道结构或应用硅基材料、纳米复合材料等高导热系数材料,以强化内部 相变换热过程。由于需要应对冷却液汽-液相态变化带来的压力剧烈波动、防止 制冷剂蒸汽外溢,并尽可能减小局部阻力对系统整体压降的影响,两相冷板系统 对冷板组件的承压能力、密封性以及流道结构的要求更高,系统的整体成本和工 程控制难度也显著高于单相冷板。
2.3.2 CDU
冷量分配单元(Cooling Distribution Units,CDU)在液冷系统中起到环路热交 换以及冷却液流量分配两个关键作用。CDU 内部配置了用于一次侧环路(室外冷 源侧)与二次侧环路(服务器节点侧)之间热交换的板式换热器,以及为二次侧 环路提供动力的循环泵。同时,为保证系统安全平稳运行,CDU 还配备了二次侧 环路所需的调节、定压、补水、排气等装置。包括电动球阀、定压罐、补水箱/袋、 自动排气阀等,以及一次侧所需的温度、压力、流量、漏液的传感器以及相关的 电气控制器件。
CDU 根据布置方式不同,可分为分散部署的机架式 CDU 和集中部署的柜式 CDU。按一次侧冷却方式不同,可分为风—液式 CDU 和液—液式 CDU。目前, 维谛技术、浪潮信息、英维克等厂商均推出了面向冷板式液冷系统、浸没式液冷 系统、风冷改造等多个场景的 CDU 产品。


2.3.3 UQD
快速接头(UQD)是液冷系统中的重要连接组件。快速接头主要用于机柜冷却液 供回歧管与液冷服务器节点之间的连接与关断,通常由公头(插头)和母头(插 座)组成,公母头在冷却液供回歧管和服务器上各有一个,互相配对使用。快速 接头的设计强调可靠性、密封性、兼容性等能力,可根据插拔形式分为手插和盲插两种。手插快接头自带锁紧结构,运维人员无需借助其他工具仅通过手动推拉 即可实现快速接头与其他连接器件的锁紧与断开。
史陶比尔、中航光电、英维克、诺通、蓝科等国内外厂商均推出了基于 OCP 标 准的 UQD 系列接头。盲插快接头则是通过设计浮动盲插结构实现公头母头的自 动连接与断开,无需手动操作接头,因此在空间狭小的高密场景更具运维优势。

夜雨聆风