AI的爆发式发展,正让电力成为稀缺资源。这背后的核心矛盾很简单:算力需求在以指数级增长,但电力基础设施的扩张,明显跟不上这种节奏。我们不妨从三个维度,把这件事拆开讲清楚。
首先,AI的耗电量,远超传统的计算任务,这是最直接的原因。它主要体现在两个环节。
第一个是训练阶段。一个大模型要训练出来,往往需要成千上万张GPU昼夜不停地跑上好几个月。以GPT-3为例,单次训练的耗电量大约是1,287兆瓦时,相当于一个美国家庭120年的用电量。而规模更大的GPT-4,能耗又高出数十倍。考虑到训练过程中还有大量试错性的实验,实际消耗的电力还要再多一层。更要紧的是,目前整个行业仍然遵循“规模定律”,也就是模型越大、数据越多,效果就越好。这意味着,对算力,也就是对电力的饥渴,短期内看不到减缓的迹象。
第二个是推理阶段。这个阶段指的是我们每次和AI互动时,它背后实时的运算消耗。虽然一次对话看着不起眼,但它的耗电量大约是传统网络搜索的10倍。当全球几亿用户每天都在进行无数次这样的交互,再叠加AI功能不断被集成进办公、编程、驾驶等场景,这部分电力负荷就成了一个持续膨胀的巨大基数。
其次,供给端面临的,是基础设施建设固有的“慢变量”特性。
一个大型数据中心的用电量,动辄达到100到300兆瓦,几乎相当于一座小型城市。但想要新建或升级对应的变电站和输电线路,要经过复杂的规划审批,建设周期往往需要三到五年甚至更久,资金投入也极其庞大。所以,电网扩容的节奏,根本无法像AI需求那样快速起跳。
科技公司承诺使用清洁能源,这又面临另一个难题:太阳能和风能具有间歇性,而数据中心需要7×24小时不间断供电。当前高效储能技术的成本依然很高,规模也不够,远水难解近渴。与此同时,很多国家为减碳在加快关停燃煤电厂,但核电这类清洁、稳定的基荷电源,建设周期动辄十年以上。一个电力供应的“真空期”就在这种进退之间出现了,供需的时间错配愈发明显。
第三,还存在一些结构性的失衡,让局部缺电矛盾更加尖锐。
数据中心为了低延迟和运维方便,天然有“扎堆”建设的趋势,在特定地区形成高度聚集的集群。这给当地的区域电网施加了难以承受的瞬时压力,而分散布局短期内又不容易做到。
在设备层面,芯片的功耗走势也不容忽视。虽然单颗芯片的能效在提升,但为了追求极致性能,单颗GPU的总功耗反而急剧攀升。比如英伟达的GB200系统,一颗的功耗就高达1200瓦。当一个机房内部署着几万颗这样的芯片,再算上巨大的散热制冷电力开销,整个系统的功耗就变成了天文数字。此外,在很多地区,数据中心的电网接入申请大量积压,有些地方甚至要排队数年才能获批,人为加剧了瓶颈。
所以整体来看,AI发展引发的电力短缺,本质上是一场“闪电战”和“持久战”的冲突。AI算力的扩张,遵循的是互联网式的闪电速度;而电力基础设施的建设,依然要靠工业时代的漫长周期。这两种根本不同的节奏失配,正是当下电力焦虑的最深层原因。
夜雨聆风