我们先看一组让人睡不着觉的数字。
2024年,全球数据中心耗电约415太瓦时,占全球用电的1.5%左右;到2025年这个数字已经逼近460–490太瓦时。2025年全球数据中心电力消耗达到约460–490太瓦时,同比增长17%。按国际能源署的基准预测,到2030年将达到约945太瓦时,接近全球用电量的3%。如果把全球数据中心当成一个国家,它2025年已经是世界第十一大用电国。 Axis IntelligenceAIMultiple
水的账更隐蔽,也更刺眼。训练GPT-3一次,光在微软美国数据中心的冷却环节就可能消耗约70万升淡水,全链路算下来达到数百万升。联合国今年的报告给出一个更骇人的远景:到2030年,全球数据中心的用水量可能相当于13亿人一年的全部需求。
这不是环保议题。这是一道投资题。
因为当一项技术开始撞上电力、水、散热这些物理资源的硬墙时,真正决定未来十年财富分配的,不再是"谁的模型更聪明",而是"谁能绕开这堵墙"。今天我想把这堵墙拆开给你看,看清它由什么构成,然后看清——钱,应该往哪几个方向流。
一、先把单位换掉:FLOPS是个会骗人的指标
绝大多数人盯着AI看的指标是算力,是FLOPS,是"多少张H100"。这个视角在2023年是对的,在今天已经开始失效。
真正的瓶颈不在"算得快不快",而在"算一次要烧掉多少焦耳、放出多少热、蒸发多少水"。换句话说,衡量这个行业的单位,正在从"每秒多少次运算",悄悄换成"每一次有用计算消耗的能量"。 谁能把后面这个数字压下一个数量级,谁就重新定义了整个游戏。
这是我想给你的第一个、也是最值钱的判断:别再用算力的眼光看AI,要用能效的眼光看。 一个还在数FLOPS的投资人,和一个已经在数焦耳的投资人,未来十年会站在完全不同的位置上。
那么,能量到底烧在哪儿了?答案会让很多人意外。
二、撞墙的本质:芯片大部分的电,不是花在"算"上
我们直觉里以为,AI芯片的电都烧在了计算上。错。
现代芯片真正的能耗大头,是数据搬运——把数据从内存搬到计算单元,算完再搬回去。这个来回的搬运,消耗的能量远超计算本身。这就是计算机科学里那个老问题:冯·诺依曼瓶颈。在AI时代,它从一个工程细节,升级成了决定行业天花板的物理约束。
斯坦福团队说得很直白:像ChatGPT、Claude这样的大模型,持续不断地在内存与处理单元之间搬运海量数据;在传统2D芯片上,数据被迫挤过少数几条拥挤的长通道。 ScienceDaily
想清楚这一点,整个投资地图就豁然开朗了——因为所有真正的出路,本质上都在干同一件事:要么别搬数据,要么干脆用物理特性直接把数据算出来。
这条主线一旦立住,你再去看市面上那些眼花缭乱的新技术名词,就不再是一盘散沙,而是同一个故事的不同章节。
三、两条赛道:降需求 vs 增供给
应对这堵墙,宏观上只有两个方向,聪明的钱会同时盯着、并且对冲。
一条是"增供给"——给AI找到又便宜、又干净、又稳定的电。
一条是"降需求"——让每一次计算消耗更少的能量。
这两条赛道理论上可以互相替代:如果能源足够便宜,效率压力就缓解;如果效率突破十倍,能源危机也缓解。我们先看正在发生真金白银的那条——能源。
增供给:巨头已经在抢核电
这不是PPT概念,是已经落地的资金流向。截至2026年5月,几乎每一家科技巨头都签下了核电协议。13个已公布项目承诺了超过9.8吉瓦的核电容量,用于支撑下一代AI基础设施。 Smrintel
微软重启三里岛核电站(就是1979年那个出过事故的),通过一份160亿美元、为期20年的购电协议锁定835兆瓦电力;谷歌向Kairos Power承诺采购500兆瓦;亚马逊向X-energy投资7亿美元,用于最多12台Xe-100小型模块化反应堆;Meta以最高6.6吉瓦的规模领跑。亚马逊还和Talen能源签了为期17年、1.92吉瓦的购电协议,并投资200亿美元在宾州建设。 SmrintelIrecruit
逻辑很硬:AI负载7×24小时运行,数据中心无法容忍断电,而电力是超大规模计算最大的运营成本之一。在这种环境下,核电可能不再是可选项,而是结构性必需品。 sec
所以围绕能源端,有一整条产业链值得跟踪:小型模块化反应堆(SMR)的开发商、铀燃料供应、电网改造、以及更远的可控核聚变。但这里我要泼一盆冷水——而且这盆冷水,恰恰是这篇文章最该被记住的地方。
一个被忽略的物理天花板:清洁能源解决了"脏",解决不了"热"
很多人的乐观停在这样一句话上:等核聚变成了,能源又便宜又干净又无限,一切迎刃而解。
这句话错了一半。
热力学第二定律告诉我们:人类在地球上产生的所有能量,无论来源多干净,用到最后都会退化成废热。 核聚变、核裂变、烧煤——只要是地球自身产生的能量(区别于本来就照过来的太阳辐射),最终都得靠地球向太空辐射散掉。这跟温室效应是两个独立的机制:温室气体是拦住了该散出去的热,而废热是凭空多出来的热。
今天,全球人为废热摊到地表大约只有0.03瓦/平方米,比温室效应的辐射强迫小了约两个数量级,所以它今天还不是问题。但请注意这个"今天"。 一旦聚变真的让能源近乎免费,人类的能源消耗就会爆炸式增长——这是经济学里反复验证的杰文斯悖论:东西越便宜,用得越凶。当人类总能耗涨上几个数量级,废热本身就会成为新的、绕不过去的天花板。
这个推论的杀伤力在于:它给两条赛道排了座次。
增供给(能源)永远只是缓冲。它能把危机往后推、换个形式,但它有终极的物理上限。而降需求(能效)才是唯一没有上限的方向——因为你省下的每一焦耳,都不会变成废热排进大气。
对投资人来说,这是更深一层的判断:押能源,是在押周期;押能效,是在押趋势。 能源端的机会是真实的、必要的,但它是对冲、是阶段性的;而长期的、确定性的、不受能源价格波动影响的价值,全在能效这一侧。
下面,我们把这一侧拆开。
四、降需求:一张按时间地平线分层的投资地图
"降需求"不是一个技术,而是一组成熟度天差地别的技术。把它们混为一谈,是业余投资者最容易犯的错。我按落地的时间和风险,分成三层。
第一层:近期、确定、无聊但赚钱
这一层的技术已经在量产、在被验证,确定性高,想象空间有限,但现金流真实。
包括先进封装与3D堆叠(把内存和计算叠起来,缩短数据搬运的距离)、液冷与浸没式冷却、以及模型层面的量化与稀疏化(用更低的比特、更稀疏的结构,让模型本身就更省电)。其中液冷的价值很具体:闭环液冷数据中心可将直接用水量降低70–90%。 Presenc AI
斯坦福那块3D芯片是个标志性信号——研究者此前只在实验室做出过3D芯片,而这是第一次在商业代工厂里造出、并展现出明确的性能提升。这意味着"缩短数据搬运距离"这件事,正从论文走进产线。 ScienceDaily
这一层的投资逻辑是确定性,不是爆发性。它是底仓,不是彩票。
第二层:中期、有真实场景、未经规模验证
这一层是我认为当前风险收益比最值得花心思的地带:存内计算和神经形态芯片。
存内计算是直接冲着冯·诺依曼瓶颈去的——它让数据"存"和"算"在同一个物理位置完成,数据根本不需要长途搬运。原理上,它利用欧姆定律,让存储的电导值与代表输入的电压相乘,电流沿位线汇总,在单个时钟周期内完成一次完整的向量-矩阵乘法。这正是AI运算最核心、最高频的操作。 PatSnap
进展是实打实的。2026年初,清华、华为、字节的联合团队在ISSCC上发布了基于28纳米工艺的混合存内计算芯片;中国的存内计算企业已经有量产产品落地,比如一款算力256 TOPS、功耗仅35瓦的存内计算智能驾驶芯片,并且是业内首家量产可做浮点运算的存内计算芯片。在训练侧,也出现了让模拟芯片逼近数字芯片训练精度的新算法。 36Kr
神经形态芯片则更进一步,直接模仿大脑神经元"存算一体"的工作方式。剑桥团队今年用一种改进的氧化铪做出的类脑器件,通过模仿大脑同时处理和存储信息的方式,有望将能耗降低多达70%。 ScienceDaily
这一层的钱也在涌入:Innatera为基于脉冲神经网络的类脑处理器融资1500万欧元,Semron为使用忆容器的模拟存内计算融资730万欧元,Fractile为存内计算芯片拿到1500万美元种子轮。市场结构上,存内计算在2025年占模拟AI芯片市场38%的最大份额,而边缘AI与物联网设备是最大的应用场景。 Future MarketsPrecedence Research
注意这个"边缘"——这是第二层技术的关键楔子。它们暂时还撼动不了数据中心的训练市场,但在手机、汽车、传感器这些低功耗推理场景,已经有真实的立足之地。投资的入口,往往就在这种不起眼的楔子市场里。
第三层:长期、颠覆性、九死一生
这一层是"押对一个翻百倍、押错归零"的赌注:全光计算(用光子而非电子来算,几乎不发热)、超导与低温计算、以及可逆计算。
资金已经在试探:光子技术拿下了大额融资,Celestial AI的光子fabric技术获得2.5亿美元C1轮,由富达领投;Vaire Computing为绝热可逆计算融资450万美元。光子/光学AI被预测为模拟AI芯片里增速最快的细分。 Future Markets
这一层不该是你的主仓,但值得用小仓位、长期限去埋伏。它的价值不在于明天兑现,而在于一旦某条路线跑通,整个能效曲线会被重新画过。
五、一个回到原点的洞见:大脑,是宇宙给出的存在性证明
讲到这里,有必要回到一个最朴素的事实。
人脑只用大约20瓦——一只灯泡的功率——就完成了今天的AI要消耗兆瓦级电力才勉强逼近的认知任务。这中间隔着的,是好几个数量级的能效鸿沟。
这个事实常被误读成一个浪漫的方案:"既然大脑这么省电,能不能把人脑接进网络,借用它的算力?"——这条路在物理上走不通:大脑不是用来做矩阵乘法的通用计算机,脑机接口能读写的神经元数量相对860亿是九牛一毛,而"借用"更是科幻而非路线图。
但这个20瓦的事实,真正的意义不在于"借用大脑",而在于它是一份存在性证明:它向整个行业宣告——低能耗的智能,在物理上是可能的,因为它已经在你的颅骨里运行了几十万年。
我们租不到大脑,于是退而求其次,做一件更聪明的事:把大脑的工作方式,逆向工程进硅片。 这就是神经形态计算的全部底层逻辑。你会发现,前面第二层那条最值得关注的赛道,它的终极蓝图,其实就刻在我们自己的脑子里。
结语:钱该往哪儿投
把整篇文章收成几句话:
第一,换掉你的衡量单位。停止数FLOPS,开始数焦耳。这是一切判断的起点。
第二,两条赛道、分清主次。能源(增供给)是必要的、确定的,但它是对冲、是周期,且有废热这道终极天花板;能效(降需求)才是没有上限的长期主线。
第三,在能效赛道里分层下注。先进封装和液冷是确定的底仓,存内计算和神经形态是风险收益比最优的中场,光子和可逆计算是用小仓位埋伏的长期期权。
第四,记住那三条筛选纪律:这项技术有没有今天就能切入的真实负载(边缘推理和数据中心训练是完全不同的赌注)?它的楔子市场在哪?它是想替代GPU,还是补充GPU——历史上,所有声称"替代GPU"的几乎都死了,活下来的都是"异构共存"的那一类。
AI这场革命,表面上是智能的竞赛,骨子里是一场能量效率的竞赛。看懂这一层的人,会在所有人还盯着模型参数惊叹的时候,悄悄把目光投向那些决定"每一焦耳能买到多少智能"的公司。
那里,才是下一个十年真正的矿脉。
(声明:本文为技术演进方向的分析框架,不构成任何具体投资建议。作者非持牌投资顾问,文中提及的公司与技术仅作行业说明,最终配置判断请自行决策并咨询专业人士。)
夜雨聆风