DeepSeek日调用量冲上全球前五。
豆包月活3.45亿。
GPT-5.5席卷全球。
这些数字听起来像胜利。但你仔细看财报——每一家都在亏钱,而且越亏越多。
上篇咱们说到,大模型API成本暴跌99%,是薅羊毛的好时机。单Token的推理成本确实在断崖式下降——模型蒸馏、量化压缩、缓存复用,这些技术让调用成本降到了原来的百分之一甚至更低。但这只是硬币的一面。
成本降了,为什么还在巨亏?因为用户增长的速度远远跑赢了成本下降的速度。豆包月活3.45亿,日均Token调用量120万亿——成本降到1%,调用量却涨了100倍。这不是AI行业的至暗时刻,这是它的日常。而大多数人对这场烧钱游戏的真实账本一无所知。
让我们先看几个被忽视的数字:
智谱AI:2025年全年营收7.24亿元,同比增长131.9%——听起来很美好。但同一年净亏损47亿元。
MiniMax:2025年营收7904万美元(约5.37亿人民币),亏损2.5亿美元(约17亿人民币),亏损幅度同比增长302%。
豆包:日均Token调用量突破120万亿,月活3.45亿——但据行业测算,每日算力损耗成本高达数亿元,高峰期单日成本突破1亿元。
换句话说:这些公司越成功,亏得越多。
这不是个案。这是整个大模型行业的共同困境。高盛首席经济学家早已指出:2025年AI对美国GDP增长的贡献"基本为零"。
而MIT旗下NANDA机构的调研更扎心:他们访谈了52个企业高管、153份问卷、300个公开AI部署案例,结论是——95%的企业AI试点项目,没有产生任何可衡量的商业回报。
这是整篇文章最扎心的一句话,但也是最重要的事实:
英伟达毛利率高达70%。卖HBM内存的厂商,一个季度合同价涨了90%。建数据中心的、电费涨了、地皮涨了、连冷却系统的铜管都涨了。
摩根士丹利报告指出:AI推理工厂平均利润率超过50%,英伟达GB200利润率高达78%。
利润正以不可思议的速度向底层算力收敛。整个AI产业链,形成了一个极度不均衡的"倒三角"结构:
模型和应用层吸引了最多的媒体关注和资本追逐,但实际收入占比不到10%。
基础设施层闷声发大财,毛利率碾压一切。
这像极了19世纪加州淘金热:淘金者蜂拥而至,卖铲子的稳赚不赔。而今天的大模型厂商,就是那群累死累活淘金的。

既然都在亏钱,为什么没人停下来?
答案藏在两个逻辑里:护城河逻辑和囚徒困境。
护城河逻辑:Scaling Laws表明,模型性能随算力和数据规模指数级增长。谁先跑到下一个量级,谁就拥有了对手无法短期追赶的壁垒。OpenAI签下了4420亿美元的算力合同。奥特曼说:"我们认为算力不足的风险,远比算力过剩的风险更大。"这不是炫富,是战略判断——赌的是AGI先到者通吃。
囚徒困境:国内厂商更典型。百度的文心、阿里的通义、腾讯的混元、字节的豆包——技术水平在同一代际,谁都没有绝对统治力。战略目标被迫锁定在"抢占市场份额"而非"盈利"。谁先收费,谁就瞬间失去用户,为对手做嫁衣。结果是:大家一起硬着头皮烧钱,看谁先撑不住。
段永平说得更直白:"看不懂大模型的盈利模式。除了Gemini,几乎看不到能活过十年的通用大模型。"
Gemini的特殊性在于背靠谷歌完整的生态体系——搜索、安卓、云服务,天然的变现渠道。而国内大厂的通用大模型,大多是独立于核心业务之外的新增业务,缺乏原生场景承接。
这场烧钱游戏的终局,会直接影响你:
免费时代正在关闭,薅羊毛的窗口比你以为的短。豆包5月正式上线付费会员体系,高阶套餐年费超5000元。DeepSeek宣布6月1日起促销价转为正式价。大模型的"免费午餐"正在集体下架。
你可能会问:成本不是降了99%吗,为什么还要收费?因为成本降的是单次调用,不是总支出。用户量翻100倍,单次成本降99%,总账单还是涨了10倍。更何况训练下一代模型的费用在指数级膨胀——OpenAI签下了4420亿美元的算力合同,这些钱终究要从用户身上收回。
但收费能解决问题吗?豆包付费上线后,"豆包笨还收费"词条冲上热搜。用户习惯了免费,愿意为"高级玩具"付多少钱?这是一个悬而未决的问题。
大模型的边际成本不是零——用户越多、调用越多,成本越高。不同于传统互联网"用户越多越赚钱"的逻辑,AI产品面临的是"用户越多,亏得越多"。
这是一个结构性困境,不是某家公司能单独解决的。
对于AI从业者和投资者,毕马威的判断值得参考:未来一到两年行业将迎来拐点——模型轻量化、算力成本下降、商业模式成熟。但这个拐点到来之前,会有一轮惨烈的出清。
免费是因为撑着,收费是因为撑不住。
看懂账本,才能判断自己要不要上车。
夜雨聆风