试问,你现在有问题第一个想去问的是不是某个 AI 大模型,比如 deepseek、豆包等等?你现在是否已经把你的重复性工作交给了 AI?你是否甚至觉得自己难以离开 AI?如果是的话,想必你已经体会到了 AI 的厉害,那么,有没有制约 AI 能力的因素?人类建了这么多发电站,够 AI 用吗?
一、GPU有多耗电?
一块 NVIDIA H100 GPU 的热设计功耗(TDP)是 700 瓦。700 瓦是什么概念?一台顶配 MacBook Pro 的电源适配器是 140 瓦,一块 H100 相当于五台 MacBook Pro 同时满负荷运行。然而,H100 是 2022 年的产品,2024 年发布的 Blackwell B200,TDP 来到 1000 瓦。2026 年的下一代 Rubin,坊间传闻会突破 1500 瓦。但单颗芯片的功耗只是故事的开始。一台 AI 服务器不是只有 GPU,它还有 CPU、内存、交换芯片、散热系统。把所有这些算在一起,每颗 GPU 分摊的系统功耗大约是 1.5 千瓦。再乘以数量,才是一个真实数据中心的功耗。一般情况下,AI 训练是 7×24 的满负荷训练,GPU 永远在 100% 利用率。和你的笔记本电脑不一样,你的 CPU 大部分时间是闲置的,功耗只有几瓦。AI 数据中心里的 GPU 不是这样的,它们只要开机,就是满负荷。这就是 AI 耗电的第一个特殊性:它不是峰值高,而是基载高。它不是偶尔爆发,而是源源不断地吃。二、巨头的耗电量
让我们把数字放大,Meta 在 2024 年建成了一支 35 万块 H100 的集群。仅这一支集群,仅 GPU 本身(不算配套的 CPU、内存、散热、网络,并且还是 H100 的卡)满负荷运行时的功耗就是:算上系统周边,这个数字轻松超过 500 兆瓦。500 兆瓦相当于什么?一座标准的燃气联合循环发电机组,大约就是这个规模。也就是说,Meta 这一个集群,就需要一座专用发电厂来喂它。xAI(虽然老马解散了团队,但是这些卡还是会给 Anthropic 使用)有 10 万块 H100。算下来,系统级功耗在 150 兆瓦以上。Microsoft 和 OpenAI 正在推进的「Stargate」项目,规划的数据中心容量是5 吉瓦——5,000 兆瓦。这相当于 4-5 座大型核电机组的发电容量,专门为一个项目服务。这里可以给出一个粗略的估算方法:一块 H100 一年满负荷运行,电费大约是多少?700W × 24h × 365d = 6,132 千瓦时。按工业电价 0.6 元/度算,约 3,700 元/年。一块芯片一年电费近 4,000 元。35 万块 H100 一年的电费:13 亿元。这些数字在 2022 年以前是不可想象的。整个 IT 行业历史上,从未有过一种设备,单点功耗如此之高、部署规模如此之大、利用率如此之满。三、电网扛得住吗?
从全局看,2024 年中国全社会用电量约 9.8 万亿千瓦时,全球约 30 万亿千瓦时。AI 数据中心的绝对增量放在这个尺度里,占比仍然是个位数。但问题不在总量,在空间和时间。AI 数据中心高度集中,北弗吉尼亚、硅谷、新加坡、爱尔兰、北京周边、张家口,这些地方的电网容量是有限的。一个 500 兆瓦的数据中心落地,相当于在某个变电站下面凭空多出一座中型发电厂的负荷。时间上更棘手,AI 训练集群的负荷曲线是平的。它们不睡觉。传统数据中心的功耗有昼夜波动(白天用户多、晚上用户少),AI 训练没有。这使得电网规划中传统的峰谷差假设失效了。美国几个最大的公用事业公司(Dominion Energy、Georgia Power、Duke Energy)在过去一年里大幅上调了长期电力需求预测,主要归因于数据中心。这些公司上次上调需求预测,大概是 2000 年互联网泡沫时期。四、核电的回归
能满足 AI 数据中心的电力需求的清洁基载电源,选择非常有限。风能和太阳能是间歇性的,数据中心不可能等风来。化石燃料可以,但碳排放难以接受。只剩下一种选择,就是核电。这就是为什么 2024-2025 年,美国科技巨头集体转向核电:Microsoft 与 Constellation Energy 签约,计划重启 Three Mile Island 核电站的一个机组(你没看错,就是 1979 年发生堆芯熔毁的那个 TMI-1 旁边的 TMI-2 的姐妹机组)Amazon 收购了 Talen Energy 的数据中心园区,该园区直接连接 Susquehanna 核电站Google 正在与多家 SMR(小型模块化反应堆)开发商谈购电协议Oracle 披露已经在设计一个由 3 座小型核反应堆供电的数据中心SMR 成为这轮 AI+核电叙事中的高频词。它的核心理念是把反应堆做小,外加模块化与工厂预制,从而大幅降低单堆投资额和建设周期。一台典型的 SMR 功率在 50-300 兆瓦之间,恰好匹配一座中型数据中心的容量需求。但 SMR 目前仍处于设计和取证阶段,尚未有真正商运的机组。一座大型核电机组(AP1000 级别,~1,200 兆瓦)从 FCD(第一罐混凝土)到并网发电,乐观估计 6-8 年。一座 SMR 即使一切顺利,从立项到商运也需要 5 年以上。而 AI 数据中心的建设周期是按月计算的,Stargate 项目的规划是 2028 年部分投运。过去二十年,全球电力行业的核心叙事是脱碳和可再生能源,导致基载电源(即 7×24 不间断供电的电源)的投资严重不足。风能和太阳能的渗透率越高,电网对基载电源的需求反而越迫切,数据中心不会花了几百亿投资之后,坐等天气决定自己的算力能否运行。所以 AI 成了那个倒逼电力行业重新思考基载电源布局的催化剂,在这个意义上,AI 对电力基础设施的影响,可能比 AI 本身的算力进步更加深远。五、挑战与机遇
500 兆瓦起步的数据中心,5 年以上的核电建设周期,13 亿元的电费账单,这些数字构成了 AI 发展的挑战。当行业增速取决于你能拿到多少电,而不是你能设计出多强的芯片时,先发优势和规模效应会被放大。微软和 Amazon 之所以在核电交易上走得最快,不是因为他们最有远见,而是因为他们有最大的资产负债表去锁定 2030 年的电力供应。
注:本文写作于 2026 年 5 月。文中功耗数据基于公开技术文档和行业研报,核电建设周期基于中国和美国核管会的现行审批框架估算。