
图:AI算力驱动的数据中心功耗密度正在颠覆传统冷却架构
2026年,全球数据中心耗电量将突破1,000 TWh——约等于三峡大坝年发电量的9倍。AI专用数据中心2025年耗电同比暴增50%,占总用电的35%。芯片功耗从H100的700W跃至B200的1,000W,单机柜从7-10kW飙升至100kW乃至兆瓦级。这不是一个技术升级的选择题,而是一个生死存亡的必答题。液冷,不再是未来方案,而是当下必须。
一、GPU功耗演进:从V100到GB200的四年三倍
V100(2017年):TDP 300W,单机柜约10kW,传统风冷完全胜任。A100(2020年):TDP 400W,单机柜15-20kW,风冷开始吃力。H100(2022年):TDP 700W,单机柜30-40kW,风冷的物理极限。B200(2024年):TDP 1,000W,单机柜60-80kW,风冷完全失效。GB200 NVL72(2025年):72 GPU + 36 CPU,整机柜功耗约120-150kW,只有液冷能救。
型号 | 年份 | TDP(W) | 单柜功耗 | 冷却方案 |
V100 | 2017 | 300 | ~10 kW | 风冷OK |
A100 | 2020 | 400 | 15-20 kW | 风冷吃力 |
H100 | 2022 | 700 | 30-40 kW | 风冷极限 |
B200 | 2024 | 1,000 | 60-80 kW | 需液冷 |
GB200 NVL72 | 2025 | 1,200/GPU | 120-150 kW | 必须液冷 |
表1:NVIDIA GPU功耗演进与对应冷却需求
二、风冷之死:物理极限的断崖式崩塔
风冷散热的本质是空气强制对流。空气的热容仅为水的1/3,400(空气1.0 kJ/m³·K vs 水4,200 kJ/m³·K)。当单机柜功耗从10kW提升到100kW时,所需风量从5,000 CFM暴增至50,000 CFM——风扇功耗从机柜的2-3%飙升至15-20%,PUE从1.3-1.4恶化到1.8-2.0。
更致命的是局部热点问题。当机柜功耗超过40kW时,最热芯片与最冷芯片的温差可达15-25°C——部分芯片因过热降频,而另一些却还在吹冷风。
三、三种液冷方案:工程选型实战指南
冷板式液冷:当前最主流的落地方案
通过金属冷板贴附在芯片表面,冷却液在微通道内流动带走热量。2025年占液冷市场65-75%,技术成熟度超90%。 NVIDIA GB200 NVL72已全面采用冷板式液冷。PUE可达1.10-1.25,改造成本约2,000-4,000元/kW。
单相浸没式液冷:PUE杀手
将整个服务器浸入介电冷却液中。阿里云已实现PUE 1.09的商业化运营,冷却能耗仅为传统精密空调的10%。字节跳动投1,600亿资本开支押注AI算力,已验证全尺寸浸没式方案。但服务器维护需要捞出来,运维要求极高。
两相浸没式液冷:效率天花板
利用冷却液在芯片表面沸腾相变带热,理论散热效率最高。PUE可达1.04-1.10,比单相还低30%能耗。但系统复杂度也最高,需要冷凝回收系统、压力控制、与不同沸点冷却液的精确匹配。目前仅少数厂商有成熟产品。
方案 | PUE | 散热能力 | 成熟度 | 改造成本 |
传统风冷 | 1.55 | ~10 kW/柜 | 成熟 | - |
优化风冷 | 1.35 | ~15 kW/柜 | 成熟 | 低 |
冷板式液冷 | 1.20 | 40-80 kW/柜 | 90% | 2K-4K元/kW |
单相浸没 | 1.09 | 100-200 kW/柜 | 60% | 高 |
两相浸没 | 1.06 | 200-500 kW/柜 | 30% | 极高 |
表2:不同冷却方案PUE与性能对比(实测/商业运营数据)
四、政策高压:100%液冷硬指标
2025年工信部等四部门联合发文明确:新建大型AI数据中心100%采用液冷,2028年前存量风冷数据中心全部完成改造。具体指标包括:新建PUE≤1.3,枢纽节点PUE≤1.25。北京已先行一步——PUE>1.35的数据中心自2026年起将面临差别电价,额外电费0.3-0.5元/kWh。
这意味着,对于数据中心运营商而言,液冷改造不是可选项而是生存题。一台1MW的传统风冷数据中心,如PUE从1.55降至1.20,年节省电费约200-300万元——改造成本通常2-3年即可回收。
五、市场爆发:2026液冷元年
2025年中国液冷数据中心市场规模约500-780亿元,2026年预计突破1000亿元,CAGR 59-100%。渗透率从2024年约14%快速提升至2025年的33%,2026年预计达42%,2027年将突破55%——每两年翻一番。
曙光数创在浸没式液冷领域布局最早,2025年浸没液冷收入增长371%,市占率超50%。英维克在冷板式和CDU领域优势明显。高澜股份在液冷板和冷却液领域有深厚积累。
年份 | 渗透率(%) | 市场规模(亿元) |
2022 | 8 | 15 |
2024 | 20 | 50 |
2025E | 33 | 78 |
2026E | 42 | 105 |
2027E | 55 | 150 |
2028E | 68 | 210 |
表3:中国液冷数据中心渗透率与市场规模趋势(2022-2028E)
六、工程师行动指南
液冷不是单纯的散热技术升级,而是整个基础设施范式的重构。对于热管理工程师而言:
配电重新设计——液冷机柜功率密度是传统的5-10倍,单柜100kW需要独立配电链路。承重加固——装满冷却液的服务器和CDU比风冷设备重2-3倍。管路规划——冷液管路走向、连接方式、冗余设计、泄漏监测。运维体系重建——冷却液品质监控、管路维护、CDU定期保养。
📌 下期预告:「从风冷到液冷:技术路线的必然切换」
你的机房到底该用冷板式还是浸没式?改造成本怎么算?旧机房能不能改?下期我们将给出一张完整的液冷选型决策树,用真实案例告诉你不同场景的最优解。
数据来源:IEA 2025、工信部等四部门 2025、IDC 2025、曙光数创年报2025、TrendForce 2025、Uptime Institute
热管理·深度
专注热管理技术深度解读,每期3篇,覆盖人形机器人/新能源汽车/数据中心
👇 如果觉得有用,欢迎点赞、转发、在看,让更多工程师看到
📌 关注「热管理」公众号,第一时间获取最新深度技术解析
💬文末留言说说你的看法,或加入技术交流群一起讨论
夜雨聆风