乐于分享
好东西不私藏

3 分钟 AI 学院 | 为什么AI越便宜,我们花得越多?

3 分钟 AI 学院 | 为什么AI越便宜,我们花得越多?

176年前,一位英国经济学家预测了一件反直觉的事:技术进步让资源更高效地使用时,总消耗量不会下降,反而暴涨。今天看AI行业,这句话像预言一样精准。


19世纪30年代,英国煤炭需求激增。当时主流经济学有一个朴素直觉——提升能源使用效率,就能减少浪费,最终降低总消耗。

1865年,经济学家威廉·斯坦利·杰文斯发表了一本书《煤的问题》,给出了完全相反的结论:当技术进步提高了某种资源的使用效率、使其变得更便宜时,这种资源的总消费量不降反升。

他把这个机制解释得很清楚:蒸汽机能效提升 → 煤炭相对便宜 → 更多行业改用蒸汽动力 → 煤炭总需求暴涨。

这是经济学中一个著名的悖论,后来被称为杰文斯悖论

两百年后的今天,把它套在AI行业上,竟然一个字都不需要改。


一、Token的价格曲线

先看一组数字。

2023年初,GPT-4的API价格大约在每百万tokens输入15美元、输出30美元。到了2026年春季,Gemini 2.0 Flash已经把同等精度的推理压到了每百万tokens输入0.10美元、输出0.40美元。三年不到,价格暴跌超过99%

更直观的对比是蒋涛算的一笔账:一个月薪2万元的程序员,每小时时间成本约125元。如果用AI辅助编程,Token投入1000元就能完成100到1000小时的工作——折合每小时1到10元

硅基时间的单价跌到了碳基时间的十分之一甚至百分之一。

直觉告诉我们应该省了。结果呢?Meta搞了一个内部token消耗排行榜,员工之间卷一个叫”token legend”的非官方头衔,用得多的人上排名榜——末尾还可能被裁员。Anthropic拿到了Google $100亿即刻入资加最高$30亿里程碑付款及五年五吉瓦TPU算力承诺。OpenAI的单月收入run rate已经接近300亿美元

Token越便宜,消耗越大。这不是直觉的反面,这正是杰文斯悖论的标准姿势。


二、不是省着用,是用爆

杰文斯悖论的核心机制其实很简单:当一个要素变得便宜,你不仅会用它替代更贵的东西,还会用它去做以前根本不值得做的事。

蒸汽机变高效后,人们不仅用蒸汽机替代了畜力(替代效应),还发明了蒸汽火车、蒸汽轮船、蒸汽机床——这些以前连想都不敢想的东西(扩展效应)。

AI的Token消耗曲线同样在走这条路径。

METR在2025年3月测出Claude 3.7 Sonnet能以50%成功率完成任务最长50分钟。到了2025年底,Claude Opus 4.6把这个数字推到了14.5小时。关键不在于绝对值,而在于翻倍周期从七个月压缩到了四个月——可靠性再上一个台阶,token消耗就不是一年加百分之五十,而是一夜之间上一个数量级。

这就是扩展效应在起作用。

单个Agent跑五分钟可能只花几毛钱。但当Agent能自主连续运行十四个半小时,并且有上百个这样的Agent在同时运转时,总消耗就会呈指数级膨胀。去年年底很多CTO兴奋地讲”百倍工程师””十个人一周搞定原来六十个人的活”。冷静下来问一个问题——公司营收增长了多少?事实是一百倍的效率提升落到营收上,只体现了百分之五十或一倍。差距在哪?还没有人能说清楚。

但token消耗本身的增长答案很清楚。因为AI不只是把人类原来的工作做得更快,它打开了全新的任务边界

过去一个客服团队一天处理五百个工单已经是极限——人工阅读、理解、回复,受限于人的注意力带宽。现在AI Agent可以同时处理五千个、五万个工单,而且不需要增加人手。问题不再是”怎么处理更多的工单”,而是”有了这么强的处理能力,我还能用来做什么“。

这个问题的答案正是杰文斯悖论的灵魂。


三、瓶颈转移:从算力到电力

徐昌雄用”巨石投湖”的比喻描述过AI投资的六个层级:核心是GPU芯片,向外扩散依次是训练推理、应用、内存、电力、边缘基础设施。

其中第五层——AI电力——正在成为最紧迫的瓶颈。AI数据中心是全球增长最快的用电户,据估计当前AI电耗已占全球电力消费的8%左右。

这里有一个更深层的悖论链条:

算法越来越高效 → 单位计算能耗下降 → 更大规模模型被部署 → 总能耗上升

这本质上还是杰文斯悖论在物理层面的延伸。Jeff Dean在讨论硬件协同设计时提出过一个精确的数据:在AI训练中,移动数据的能量成本大约等于执行乘法的1000倍。Batching的本质就是分摊从SRAM/HBM移动权重的巨大能量开销。换句话说,哪怕模型架构优化让单次乘法更高效,只要整体计算量扩张足够快,总能耗仍然会上升。

这也解释了为什么硅谷在Token消耗狂飙的同时,全美国约有100个数据中心项目遭遇阻力,缅因州已全面禁止数据中心建设,40个项目直接流产。算力不够不仅是钱的问题——物理世界跟不上数字世界的胃口。

有意思的是,这个模式在历史上重复出现过。Cisco在2000年光纤建设高峰期也被寄予厚望——建设速度远超Email和网页的实际需求。思科花了二十年才回到历史高点。徐昌雄的观察是:2000年的真正赢家不是基础设施商,而是亚马逊、谷歌和Facebook——它们利用廉价的带宽和服务器创造了更大的价值。

对应到2026年,第二阶段的赢家可能也是“利用廉价智能”的企业,而非造AI的公司。


四、为什么不会被”过剩”

传统经济学有一个很直接的推论:如果生产力大幅提升,供给暴增,消费能力不变——那不就是产能过剩吗?

但在AI时代,这个推论至少三个地方失效了。

第一个,消费主体变了。 过去Token是由人消耗的:你在写代码、你在读邮件、你在查资料。现在Token主要由Agent自动消耗——API调用由系统自动发起,数据分析由AI实时处理,内容生产消费可在AI之间闭环。生产可以直接被系统自身消化,而不需要经过人类。Anthropic自己就是全世界做Coding Agent最强的公司,但他们的oncall agent仍然不好用——蒸汽机发明出来了,有时候跑得还没有马车快。但这恰恰说明问题在于消费主体的迁移:机器不再等人在前面指路,它们自己找事做。

第二个,消费方式变了。 信息不再是为了被理解而存在,而是为了触发行动而存在。人类阅读一条新闻需要十几秒,AI解析同一个信息只需要几毫秒。人类的注意力带宽锁死了AI价值的上限,而这个锁被打开之后,消费规模不再以人脑的节奏计。

第三个,需求边界被重新定义。 过去的需求边界等于人类能力边界——你能调动的劳动力有限、你的组织管理幅度有限、你的知识吸收速度有限。现在需求边界变成了系统可执行边界。原本无法被执行的需求,被释放出来了。

这三重改变意味着,AI带来的不是在一个固定市场里抢夺份额,而是在制造一个不断扩大的新市场。市场规模扩张的速度远远超过了单位成本下降的速度。这就是为什么即使每个Token越来越便宜,整个行业的总支出仍在急剧增长。


五、杰文斯的幽灵还在

杰文斯写《煤的问题》的初衷不是预言繁荣,而是发出警告。他认为英国的煤炭储量终究有限,过度依赖会导致系统性危机。他的悲观后来部分应验了——二十世纪中期石油取代了煤炭,但二十世纪初的”煤炭焦虑”确实推动了英国工业竞争力的衰退。

今天的AI行业也有类似的结构性矛盾。

短期看,Token价格还在快速下降。技术进步的逻辑简单粗暴:更好的模型架构、更大的并行度、更高效的硬件。按照目前的节奏,每年价格减半并不罕见。

长期看,制约AI发展的已经不是算法或框架,而是物理约束——GPU总产量、数据中心电力容量、网络带宽、散热能力。这些约束的增长速度远慢于Token需求的增速。

当便宜的技术遇上刚性的物理天花板,会发生什么?徐昌雄给出的答案是周期性陷阱:在存储芯片这样的周期性行业,当街边分析师都在喊”短缺”的时候,往往意味着产能即将过剩。 永远不要在繁荣顶点买入,哪怕有”AI”叙事支撑。

蒋涛则从另一个角度提出了第三定律:当时间不再稀缺,稀缺的就变成了判断。 在碳基世界中,约束是”有没有时间去做”;在硅基世界中,约束是”哪些事情值得去做”。

这两条线索指向同一个方向——杰文斯悖论在AI时代不会消失,只会变形。Token不会变得免费,算力不会无限扩张,但使用量会以不可预测的方式持续膨胀。真正的竞争维度不再是”谁能更高效地使用AI”,而是“谁能在杰文斯悖论制造的混沌中找到新的确定性”。


六、站在悖论的另一侧

回到开头那个直觉问题:AI让一切变高效了,我们会不会因此省出大量的钱和时间?

答案可能是:你会省下一些具体的活儿的时间,但整个世界会用省下来的时间和钱去做更多、更大的事。

杰文斯悖论在每一个效率驱动型行业中都有影子。互联网让带宽变便宜,但流量消耗翻了几百倍。云计算让服务器变便宜,但企业IT支出总量仍在涨。智能手机让通信变便宜,但人均使用时间没有减少反而增加了。

AI正在走的是一条熟悉的路。只是这一次,被替代的不是体力劳动或信息传递,而是人类思考本身。

思考越便宜,被消耗得越多。也许这才是AI时代最深刻的经济学规律。


参考资料

[1] 蒋涛,”硅基时间第二章:时间的第一次工业革命”, 微信公众号,2026. https://mp.weixin.qq.com/s/x30pxlNp_wX5x03RWCt6Rg

[2] 徐昌雄,”AI大爆炸和它的阵阵涟漪”, 构建之法公众号,2026. https://mp.weixin.qq.com/s/KRYcDbc4zGYS3MEEY57AwA

[3] 孟醒,”全员Token-Maxxing:一场没人敢停的军备竞赛”, 晚点LatePost,2026. https://mp.weixin.qq.com/s/kwErGjX231e2efVWhERzTw