AI大白话 009:AI大白话,把“机器话”翻成“人话”。每篇拆一个核心名词,让你真正看懂AI。
你有没有发现,AI越来越贵了?豆包收费了,智谱涨价了,连阿里云、腾讯云都跟着涨了。
但最热闹的是——运营商也下场了。2026年5月17日,电信、移动、联通同时推出Token套餐。最低9.9元/月,含1000万Token。话费支付,跨平台通用。
消息一出,有人说“AI终于平民化了”。也有人算了一笔账:DeepSeek的Token才几分钱,运营商的凭什么卖这么贵?
9.9元1000万Token,到底是便宜还是坑?
要回答这个问题,得先搞清楚一件事:Token的价格,到底是怎么变化的?
Token为什么越来越贵?
原因很简单:用的人太多,算力不够了,公司开始要赚钱了。
2024年初,中国日均Token调用量约1000亿。2026年3月,这个数字变成了140万亿。两年增长超千倍。

谁在疯狂吃Token?Agent。
你以前用AI,问一句答一句,消耗不大。现在AI智能体(Agent)可以自己干活——让它订机票、写代码、做报表,它自己在那里“思考”半天,每一步都在烧Token。
一个Agent任务的Token消耗量,是普通问答的4-15倍。有人跑半天OpenClaw,就烧掉5000万Token;一个月烧上千美元的,也不在少数。
算力跟不上,硬件也在涨价。H100显卡租赁价一年涨了40%,电费也在涨。成本上去了,Token自然涨价。
2026年以来,阿里云、腾讯云、百度云相继上调AI算力价格,涨幅5%-34%。智谱AI年内三次涨价,部分套餐价格直接翻倍。腾讯云混元模型API输入价格,涨了463%。
现在的Token定价,到底是补贴还是真成本?
答案是:正在从“补贴换用户”,转向“按真实成本定价”。
2024-2025年:补贴换规模。 Token以“厘”计价,厂商亏本抢市场。豆包免费冲到3.45亿月活,日均Token调用量两年增长超千倍。但算力账单也在同步飙升——字节2025年净利润同比下滑超70%,资本开支约1600亿,其中900亿用于AI算力。
2026年:成本倒逼涨价。 日均Token调用量突破140万亿,GPU租赁价一年涨40%,存储芯片价格翻倍。智谱AI年内三次涨价,累计涨幅83%。阿里云、百度云AI算力最高涨34%。
那现在的价格能Cover成本吗?
DeepSeek能做到——用MoE架构和缓存技术把成本压到极致,CEO明确说“我们的原则是不贴钱,也不赚取暴利”。V4-Flash缓存命中后仅0.2元/百万Token,还有利润空间。
其他厂商?有的还在亏。 豆包日均Token超120万亿,三个月翻一倍,不收费现金流撑不住。但C端付费转化率能有多高,目前还是未知数。
智谱毛利率已从3.3%升到18.9%,ARR达17亿元,摩根大通定性为“关键拐点”。这说明特定厂商和场景,Token已经能赚钱了。
央广网采访的专家判断更直接:“能力水准高的Token赚钱,能力水准低的Token亏钱。未来Token会像水像电一样成为基础服务,薄利、普惠、泛在。”
Token还会继续涨价吗?
短期看,还会涨,但结构性分化。
还会涨的原因:算力成本还在上行。GPU租赁价一年涨了40%,存储芯片价格翻倍,电费也在涨。只要Agent继续爆发(现在才刚开始),算力供不应求的局面不会缓解。
但不会普涨:Token价格正在经历“分层”。像DeepSeek这类极致性价比的路线会继续把基础Token价格往下打;而智谱这类对标海外旗舰的,会继续涨价。
央广网采访的专家判断:“常规能力水准的Token趋向薄利,以量取胜;高能力水准、高价值的Token可能持续保持溢价。当基础Token薄利化以后,价值将主要产生在‘用Token做什么’。能够构建‘场景+数据+平台+模型’闭环、提供高价值智能体服务的企业将获得溢价。”
长期趋势:Token单价会持续下降(技术迭代、硬件扩产),但你的总账单会继续涨——因为Agent会用得越来越多。单位成本降,总消耗涨,你的账单两者叠加。
运营商卖Token,到底靠不靠谱?
回到运营商套餐。9.9元/月含1000万Token,听起来很便宜。

但DeepSeek的Token多少钱?0.02元/百万Token。1000万Token,只要0.2元。
同样的1000万Token,运营商卖9.9元,DeepSeek卖0.2元。运营商贵了49.5倍。
为什么差这么多?
第一,运营商是“二道贩子”。 它自己不做大模型,接入的是DeepSeek、星辰这些第三方模型。每次调用Token,先要给模型方付钱,再加价卖给你。9.9元里,大头被上游拿走了。
第二,9.9元不是“纯Token钱”。 套餐里还塞了宽带上行提速、5G优享包、安全管家一堆你用不上的东西。你要的是Token,它卖的是“Token+套餐”。
第三,运营商压根没打算卖给你。 它的目标客户是政企、国企、金融机构。这些人不差那几块钱,但必须合规、开票、走采购流程。运营商能签合同、能开发票,DeepSeek做不到。
那到底靠不靠谱?
- 你会折腾
:不靠谱。DeepSeek、MiniMax、智谱的API便宜得多,9.9元够你跑5000万Token。运营商套餐对你来说就是智商税。 - 你是企业/政企
:靠谱。合规、开票、安全、稳定,比价格重要。运营商能走采购流程,这是DeepSeek给不了的。 - 你不想折腾
:看情况。9.9元买个“省心”——不用研究API、不用绑银行卡、话费直接扣。多花9.9元,省下两小时研究时间,对有些人来说是划算的。
一句话:运营商卖的不是最便宜的Token,是最省心的Token。
普通人怎么选?——先算你属于哪类用户

结论:无论你是哪类用户,按量付费都比运营商套餐便宜。 运营商套餐不是给你买的,是给不想折腾的人、需要合规的人、愿意为“省事”买单的人。
给Agent重度用户的省钱建议
如果你跑Agent,Token消耗根本压不住,那就优化消耗:
- 用记忆型Agent
:传统Agent每次任务都要重新加载上下文,消耗量是记忆型Agent的3.2倍 - 开上下文压缩
:实测能把消耗压到原来的30%以内 - 慎用“深度思考”模式
:输出Token是普通的5-10倍
你一个月花多少钱在AI上?买Token套餐了吗?评论区聊聊。
(文中图片由 AI 生成)
夜雨聆风