
点击蓝字关注我,并请在文末点“在看”
商业润点
|Biz Run Review


2026年4月8日凌晨,DeepSeek悄无声息地改版了。
网页端和App一夜之间多了两个模式——快速模式和专家模式,旁边还有个灰度测试中的视觉模式。
没有公告,没有预热,但明眼人都懂:那个"全免费、强AI"的时代,正在缓缓落幕。
就在同一天,腾讯云宣布AI算力服务价格上调5%;一周前,智谱GLM提价10%;再往前,腾讯混元模型直接涨价463%……
国产AI大模型市场,正在经历一场史无前例的分裂:有人拼命降价抢用户,有人悄悄提价求生存。
这场价格战的背后,究竟藏着怎样的商业逻辑?
品牌博弈:开源与闭源的"掀桌"大战
2025年8月,OpenAI发布GPT-5时的定价策略,被行业称为"定价杀手"——性能提升、价格下降的组合拳,直接掀翻了整个行业的桌子。
开源派选择跟进降价,以更低价格应战。
DeepSeek用V3版本证明了"用更少激活参数做到接近GPT-4效果"的可行性。
通义千问Qwen3.5-Plus将价格压至0.8元/百万Token,仅为Gemini 3 Pro的1/18。豆包Lite版更是进入"厘时代"——0.8厘就能处理1500多个汉字。
闭源高端派则选择逆势提价。Claude坚守高价,靠硬核技术守住高端市场;智谱在2026年一季度将API调用定价提升83%,即便如此调用量仍增长400%。
这场品牌博弈的本质,是对"AI普惠"定义权的争夺。开源派认为普惠意味着无限趋近于免费;闭源派则认为普惠是"基础功能免费、高阶能力付费"的分层服务。

成本压力:算力燃烧下的生死抉择
价格战的背后,是整个行业无法回避的成本真相。
数据触目惊心:
2026年3月,国内大模型日均Token调用量突破140万亿,较2024年初增长超过1000倍。
DeepSeek日活用户超2000万,每天推理成本高达百万级别。
更严峻的是,2026年开年以来,DeepSeek已出现至少7次大规模服务中断,3月底一次宕机整整持续12小时。
原因很简单:
所有用户不管问简单问题还是复杂任务,都用同一套高端模型,等于"用大炮打蚊子",算力被严重浪费。
加拿大皇家科学院院士李明算过一笔账:过去谷歌一次普通搜索耗电0.3瓦时,成本靠广告足以覆盖;而现在AI一个推理query耗电18瓦时,是普通检索的60倍。
高端GPU(H100/A100)一卡难求、价格暴涨,算力成本居高不下。
全免费模式下,用户越多、用得越狠,平台亏得越惨。
消费代际:免费时代的"遗产"与"遗产税"
中国AI消费者,是被"免费"惯坏的一代。
2023年到2026年三年间,达到GPT-4等级性能的模型,Token价格从每百万60美元跌至0.45美元,暴跌133倍。
豆包、通义千问等国产模型把价格打到"厘级",按日常使用量计算,Token的单价已经比矿泉水还便宜。
2026年成为行业共识的分水岭。
"哑铃型"商业范式浮出水面——一头是轻量模型作为免费流量入口,另一头是复杂功能按Token计费或订阅收费。
对于普通用户,日常对话、查资料、写简单文案,快速模式完全够用,免费福利不会消失。
但对于重度用户——程序员、科研人员、内容创作者——"免费用顶级AI"的好日子确实在远去。
价格战的终局:谁会被淘汰?
第一轮淘汰已经发生:那些没有技术壁垒、纯粹靠低价抢市场的玩家,正在被成本压垮。
第二轮淘汰正在路上:纯粹做免费入口的中间层玩家会非常难受——既没有足够多的资源做高端技术,又无法靠低价建立护城河。
最终活下来的,一定是能创造真实价值的玩家:要么技术足够硬核,让用户愿意为"最强"付费;要么场景足够垂直,在细分领域建立不可替代性;要么成本控制足够优秀,用极致效率赢得市场。
DeepSeek的那次深夜改版,预示的不仅是一个AI产品的迭代,而是一个时代的终结:那个靠"全免费、强AI"就能吸引用户的草莽时代,正在成为过去。
AI行业的下半场,已经不是"谁更免费"的比拼,而是"谁能持续创造价值、谁能健康活下去"的较量。这场淘汰赛,才刚刚开始。

夜雨聆风