
5月4日,当很多用户还在享受五一假期的最后一天,字节跳动悄悄在App Store更新了一行小字:豆包即将推出付费订阅。
三档价格——标准版68元/月、加强版200元/月、专业版500元/月,迅速冲上微博热搜,评论区一片骂声:“吃相难看”“敢收钱就卸载”“笨还收费”。
用户的愤怒很直接:你一个聊天机器人,凭什么收我的钱?
但翻开字节跳动的账本,算一遍AI的算力成本,就会发现一个更残酷的真相——豆包这3.45亿月活,不是在替字节赚钱,而是在替它烧钱。而豆包收费,不过是这场“烧钱换用户”狂欢终于撑不住的一个缩影。
更值得思考的问题是:AI大模型到底该怎么赚钱?答案也许让所有做C端应用的公司都不愿意听。
过去二十年,中国互联网行业信仰一条铁律:用户越多越赚钱。从PC互联网到移动互联网,不管是微信还是抖音,这逻辑从没出过问题。
但大模型却不同。据QuestMobile数据,2026年第一季度,豆包月活跃用户规模达到3.45亿,远超第二名千问的1.66亿,相当于第2至第5名月活规模的总和。放在传统互联网的语境里,这个量级就是印钞机。
可大模型不是微信。用户输入的每一个字、生成的每一张图片、制作的每一页PPT,背后都是成千上万块GPU在高速运转,而这些GPU不仅价格昂贵,还是名副其实的“电老虎”。
火山引擎2026年3月公布的数据显示,豆包大模型的日均Token调用量已经突破120万亿——在过去三个月内翻了一倍,比2024年5月发布时整整增长了1000倍。
这意味着什么?算一笔账就知道了。
按照目前行业平均的推理成本计算,每千Token成本约0.01元人民币,豆包每天仅算力成本就高达1.2亿元,一年就是438亿元。这还只是推理成本,不包括模型训练、研发人员工资、数据中心建设、电力消耗等其他巨额开支。
更有意思的是成本结构。有技术拆解显示,豆包的单次推理成本中,硬件折旧占58%,电力占29%。这意味着,每增加一个用户,字节就得在H100集群上多扛一份成本,边际成本始终无法趋近于零。
最可怕的是,这个成本还在快速增长。用户规模越大,算力账单越重,两者几乎是线性正相关。
字节跳动2025年净利润同比下滑超过70%,虽经抖音集团副总裁李亮澄清说包含了非现金因素,但他也承认:“抖音电商增速放缓和新兴业务相关投入增大,下半年经营利润率有小幅下滑”。所谓“新兴业务”,最大的一块就是豆包大模型。
据浙商证券研报,2025年字节跳动资本开支有望达到1600亿元,其中约900亿元用于AI算力采购。
3.45亿月活,在流量逻辑里是一笔巨大的资产。但在算力逻辑里,它是一笔每天都在膨胀的负债。免费已经不是一个策略选择,它正在演变成一个结构性的现金流问题。
豆包这把收费,从商业逻辑上说得通——谁烧算力、谁买单。可问题是,在中国市场,用户根本不想为AI花钱。
字节跳动的定价已经够克制了——68元/月,只有ChatGPT Plus(20美元,约140元)的一半。结果呢?“豆包笨,还收费”直接上了热搜。
据了解,付费功能将主要聚焦PPT生成、数据分析、影视制作等高算力消耗的生产力场景,免费版本继续面向日常轻量使用。也就是说,豆包并不是在抢普通用户的早餐钱,而是在精准识别那些“算力杀手”——用三档价格从3亿免费用户里筛选出最烧算力的那批人。
但这套逻辑在中国能不能跑通,非常值得怀疑。
中国消费者对订阅本来就不感冒。爱奇艺2025年全年会员收入为168.1亿元,同比下降约5%,这是继2024年以来的第二次下滑。即便豆包坐拥3.45亿月活,按1%的付费转化率计算,也不过345万付费用户;按标准版年付688元算,不过23.7亿元年收入。这点收入,连豆包一年算力成本的零头都填不上。
刘强东曾有一个著名论断:to C是to B的十倍大市场。这句话在AI时代可能恰好说反了。
与大模型在C端勉力维持的局面形成鲜明对照的,是那些深耕B端的企业正在交出令人眼前一亮的成绩单。
智谱,大模型第一股。2025年全年营收7.24亿元,同比增长131.9%,高价值API平台在注册用户突破400万后,即便API调用定价提升了83%,市场依然供不应;科大讯飞则更直接——2025年营收271亿元,归母净利润8.39亿元,是国内几家头部大模型公司中唯一实现规模盈利的。
为什么B端比C端更容易赚钱?
李开复看得最透彻。他在今年初的判断直指核心:AI Agent的最大价值集中在to B场景,原因在于Agent的推理成本高、响应耗时长。对B端用户而言,这种“等待成本”是可接受的——比如等待5分钟生成一份PPT,用户还可以处理其他工作,且B端对Agent的付费意愿远强于C端。
“如果‘超级员工’真能帮公司解决实际问题,企业会愿意付费。”李开复说。
反观C端,即便是当下最典型的to C通用型Agent Manus,每月300美元的费用,不仅中国用户难以接受,对美国用户也属高价。
这背后是两种截然不同的商业逻辑。B端客户把AI当工具,算的是投入产出比;C端用户把AI当玩具,算的是自己兜里那点零花钱。
一个数字足以说明问题:据艾瑞咨询统计,2025年中国大模型市场规模突破800亿元,其中行业垂类模型已占42%,金融、医疗、教育、政务四个领域贡献了超过60%的行业大模型采购金额——这些全部是B端场景。
这正是为什么零一万物在2024年毅然决然宣布“All in to B”,放弃万亿参数超大基座模型训练,转而训练参数适中但更快、更便宜、更懂行业的产业大模型。他们在短短一年内营收实现了数倍增长。
豆包的故事,还揭示了一个更深层的问题:大模型不一定越大越好。
过去两年,行业讲了一个“参数越大越牛”的故事,动辄千亿、万亿参数,仿佛参数才是衡量AI公司价值的唯一标尺。但这场军备竞赛不仅推高了研发成本,更重要的是,它把大量算力浪费在了C端用户根本用不到的能力上。
一个普通用户每天闲聊二三十轮,与一个专业用户生成一份深度研报级别的数据分析,两者消耗的算力相差几个数量级。让前者为后者的Token成本买单,必然是不可持续的免费模型。
与其追求一个懂得一切却只被用来聊天的大模型,不如专注于花更少的算力做几件真正被付费买单的事。这正是行业正在发生的转变:从比拼谁参数多、谁功能全的“军备竞赛”,转向需求导向、价值优先的思路。
所以,问题的核心不在于“豆包为什么要收费”,而是更本质的追问:AI大模型的商业化,到底该走哪条路?答案已经越来越清晰:做B端做解决方案,远比做C端做免费产品更靠谱。
这不是什么高深的商业洞察。中国互联网二十年的历史已经反复验证了这一点——to C的狂欢属于少数几个掌握了流量垄断地位的超级平台,而to B才是大多数科技公司能够建立可持续商业模式的真正出路。
AI大模型的狂热终究会退潮。当资本不再追逐天花乱坠的故事,当用户不愿意为聊天对话花一分钱,当各家公司在算力成本的压力下被迫关闭免费入口——到那一天,真正活下来的,不会是那些拥有最多C端用户的平台,而只会是那些能够拿出“一岗一助手、一人一分身”这样具有实际商业价值的解决方案的企业。
豆包的收费,不过是这个必然结局的第一声预演。

夜雨聆风