这个夏天,一场无声的危机正在硅谷蔓延。
2024年,全球数据中心消耗了约460太瓦时的电力,占全球总用电量的近2%。国际能源署预测,到2026年,这个数字将攀升至650至1050太瓦时。而在美国,数据中心用电量已经占到全国总用电量的4.4%——到2030年,这个比例预计将暴增130%。
更令科技巨头们夜不能寐的是,当MIT的研究人员给出那个预测时,整个行业都沉默了:到2030年,数据中心的能耗可能占到全球能源需求的21%。
每当你向ChatGPT提问一次,它消耗的电力大约是普通谷歌搜索的10倍。而当你让AI生成一张图片时,这个数字会飙升到100倍。
这不是危言耸听。这是正在发生的现实。
就在AI行业被自己的胃口逼到墙角时,一个人的出现,或许将改变一切。
一、一个野心勃勃的“叛逃者”
帕特里克·温德尔(Patrick Wendell)的身份很特别。
他是Databricks的联合创始人兼前工程副总裁,也是Apache Spark的创始提交者和PMC成员。在Databricks,他领导着整个公司的工程团队,是这家估值超过400亿美元的数据智能巨头的技术灵魂。
但就在所有人都以为他会继续在Databricks的轨道上策马奔腾时,他却选择了离开。
他的新公司叫Un0,目标是做一件听起来近乎疯狂的事:将AI的能耗降低1000倍。
1000倍是什么概念?
如果今天训练一个GPT-4级别的模型需要耗电1亿度,那么未来只需要10万度。如果今天一次AI图像生成的能耗相当于给手机充满电,那么未来只需要一个眨眼的工夫。
这个数字夸张到让很多业内人士的第一反应都是:不可能。
但Un0显然不是来画饼的。在最近的一次公开演示中,他们展示了第一个可以用自己的技术复现传统AI系统功能的工具——一个名为Un0的图像生成系统。尽管具体的技术细节尚未完全公开,但据TechCrunch报道,该系统展示了其在极低功耗下完成复杂图像生成任务的能力。
这听起来像是一个关于技术的消息,但它的本质,是一个关于“生存”的消息。
二、AI的“电费单”,已经没人付得起了
要理解Un0的价值,首先要理解AI行业正面临的能源深渊。
2023年,一项研究显示,训练一个像GPT-3这样的大型语言模型,其碳排放量相当于125辆汽车终其一生的排放量。而到了GPT-4时代,这个数字又翻了数倍。
但这只是训练阶段。真正的噩梦,发生在模型上线之后。
MIT的研究人员指出,当前超过80%的AI计算消耗发生在推理(inference)阶段——也就是模型回答用户问题、生成图像、处理请求的每一个瞬间。每天数以亿计的ChatGPT查询、Midjourney生成的图片、Copilot辅助编码的背后,是海量的GPU在日夜不停地运转。
不久前,一则新闻在科技圈刷屏:AI芯片初创公司Groq正在融资6.5亿美元,而募资的核心目的,是从硬件研发转向AI推理服务。这背后传递的信号令人不安——即使是做芯片的公司,也开始意识到“制造更快芯片”已经无法解决“能耗爆炸”的问题了。
MIT林肯实验室的科学家维杰·加德帕利(Vijay Gadepally)曾在MIT可持续发展大会上直言:“随着我们从文本到视频到图像,AI模型变得越来越大,它们的能源影响也在同步膨胀。”
他的团队做了一个实验:在训练BERT语言模型时,将GPU功率限制在150瓦,训练时间从80小时仅增加到82小时,但节省下来的能源,相当于一个美国家庭一周的用电量。
这个实验的启示是残酷的——即使是最聪明的科学家,目前能做到的节能,也不过是小幅缓解。
而整个行业需要的,不是缓解,是革命。
三、1000倍,凭什么?
那么问题来了:温德尔凭什么认为他能实现1000倍的降幅?
虽然Un0尚未完全公开其技术架构,但从已披露的信息可以窥见一些端倪。
关键在于根本性的架构变革,而非修补性的改良。
目前的AI系统——尤其是生成式AI模型——高度依赖图形处理器(GPU)的海量并行计算。GPU是通用芯片,它被设计出来处理图形渲染,后来被发现意外适合AI计算。这种“意外之喜”本质上是一种妥协:用巨大的算力代价,换取任务的可行性。
而Un0的思路,是重新思考计算的基本方式。他们正在开发一种全新的硬件-软件协同架构,试图从根本上消除AI计算中的无效能耗。
这并非天方夜谭。事实上,学术界已经有人在探索类似的路径。明尼苏达大学的一个研究团队曾估计,基于计算随机存取存储器(CRAM)的新型AI推理加速器,其能效提升可达2500倍。塔夫茨大学的研究者也证明了,新的AI模型设计可以将能耗降低100倍的同时提高准确率。
温德尔的野心,是将这些碎片化的突破,整合成一个可商用的、完整的AI计算方案。
用他的话来说,Un0的目标不是让AI“稍微省点电”,而是让能源不再成为AI发展的瓶颈。
四、怀疑与希望之间
当然,这个故事还有B面。
1000倍的降幅,如果能够实现,将彻底改变AI产业的格局。但如果不能实现——或者只能实现几十倍的改进——那它也不过是又一个被过度吹捧的“颠覆性技术”。
质疑的声音主要集中在这几点:
第一,从实验室到产业化,中间的鸿沟巨大。几乎所有计算架构的颠覆性创新,最终都倒在了“如何大规模生产”和“如何与现有软件生态兼容”这两个问题上。
第二,1000倍的标靶过于激进。在半导体行业,能效提升10倍就已经是大新闻了。1000倍,意味着温德尔团队找到了某种“物理定律级别的突破”,而这样的突破在计算机科学历史上凤毛麟角。
第三,图像生成只是一个起点。温德尔展示的Un0工具目前只能做图像生成,而AI的能耗大头其实在文本大模型和多模态模型上。如果这套架构无法推广到更广泛的应用场景,那它的意义将大打折扣。
但温德尔显然不是一个喜欢谨慎行事的人。从Databricks的联合创始人到“叛逃”创业,他一直在做着别人认为不可能的事。
五、当算力不再昂贵,AI会发生什么?
这篇文章不应该仅仅停留在技术或商业的层面。它背后有一个更值得深思的问题:
当AI的能源成本不再是制约因素时,世界会变成什么样?
想想看,今天AI之所以还是一种“被限制”的技术,很大程度上是因为算力太贵、电费太高。这也是为什么你的手机上有应用商店,却没有一个始终在后台运行的个人AI助理。
这不仅仅是成本问题,更是关于公平的问题。能耗壁垒意味着只有科技巨头才能负担得起最强大的AI,而中小企业和开发者只能望洋兴叹。
正如MIT的研究者所指出的,当你用谷歌搜索时,AI摘要消耗的能量是普通网页链接列表的100倍。如果我们能在不增加能耗的前提下,让这种高质量的AI服务普及到每个人,那将是一场真正意义上的技术平权。
温德尔的Un0,如果当真能做到它所承诺的事,就不会只是一家成功的公司——它会成为AI发展史的一道分水岭。
在那道分水岭的一侧,AI的发展受制于摩尔定律的终结和能源的有限。在另一侧,一个全新的、能源几乎免费的计算时代将拉开序幕。
六、写在最后
在科技行业,我们见过太多“颠覆者”最终沦为空谈的故事。
但这一次,有些不一样。
温德尔不是一个疯狂的梦想家,他是一个有深厚技术根基的实干家。他在Databricks的履历,证明了他是那种能把宏伟蓝图变成可运行代码的人。
而他所挑战的,恰恰是当下整个AI行业最硬的一块骨头。
能源。不是算法,不是数据,不是人才,而是最古老也最基础的那个问题:我们到底需要烧多少煤、发多少电,才能支撑一个由AI驱动的未来?
如果温德尔是对的,那么答案可能是:“比你想的少得多。”
如果他是错的,那至少,他用最先锋的方式提醒了我们:AI的能源危机,已经迫在眉睫到需要有人站出来,喊出一个近乎疯狂的数字。
1000倍。
或许我们不需要他完全正确。\n即使只是实现100倍,甚至10倍的改良,对于这个正在被自身能耗拖垮的行业来说,也已经是一线生机。
而一线生机,有时候,就是全部。
如果觉得这篇文章有价值,欢迎转发给身边关注AI发展的朋友。在技术狂欢与技术焦虑并存的年代,我们不应该错过任何一个可能改变游戏规则的故事。
夜雨聆风