乐于分享
好东西不私藏

AI世界的汇率战争:当产品经理开始算账

AI世界的汇率战争:当产品经理开始算账

最近用腾讯的QClaw和WorkBuddy的时候,我发现了一个很有意思的现象。

这两个产品里不同模型的「汇率」一直在调。今天用DeepSeek可能只要花很少的积分,明天可能就涨了。换一个模型,同样的任务消耗的积分完全不同。而且WorkBuddy的签到送积分活动,五一之后就要调整了。

这些变化很细微,细微到大部分用户根本不会注意到。但如果你把视角拉高一点,把这些细微的调整拼在一起,你会发现一个正在发生的大趋势。

AI世界的Token汇率,正在从幕后走到台前。

4月底,WorkBuddy社区里一条不起眼的公告引发了讨论。五一之后,签到送积分的活动规则将进行调整,积分获取门槛会提高,免费额度会收紧。放在两年前,这种调整大概只会被当成一次普通的运营策略微调。但放在2026年的语境下,它传递的信号完全不同。

整个AI行业的补贴周期正在收尾,Token的真实成本开始从B端传导到C端。

黄仁勋的「Token工厂」

3月16日GTC大会上,黄仁勋抛出了一个让整个行业重新审视AI基础设施的论断。Token是AI时代的新大宗商品,数据中心就是生产Token的工厂。

这句话的分量比表面看起来重得多。把Token类比为石油或者钢铁,意味着几件事。Token有明确的生产成本,主要取决于算力、电力和芯片折旧。Token有跨市场的定价差异,不同厂商的Token汇率可以相差几十倍甚至上百倍。Token的供需关系会直接影响价格走势。

黄仁勋之所以在这个时间点提出这个框架,是因为行业已经走到了一个临界点。2026年3月,中国单日Token消耗量达到140万亿。两年前这个数字只有1000亿。两年时间,增长了1400倍。

更关键的是内存。行业共识是,内存正处于一个5年的上行周期中,供给紧张的局面最早也要到2027年底才可能缓解。内存价格的上涨会直接推高推理成本,进而传导到Token定价上。这也是为什么2026年各家厂商不约而同地选择了涨价而非继续价格战。

一张表看懂汇率差异

4月26日,DeepSeek干了一件让整个行业炸锅的事。V4-Pro模型API开启2.5折限时特惠,缓存命中输入0.25元/百万Token。什么概念?处理一百万个Token,大约相当于75万个汉字,只要两毛五。

同一天,GPT-5的API定价是每百万Token输入196元。差了784倍。

你可能会说,拿DeepSeek跟GPT-5比不公平。那拿国产模型之间比呢?豆包Seed-Lite输入0.3元,文心一言输入约4元,差了13倍。DeepSeek V4-Pro限时价0.25元,文心一言4元,差了16倍。

让我们把当前主流模型的定价摆到一起。以下价格均以人民币计价,单位为每百万Token。

模型 输入价格(元) 输出价格(元)
DeepSeek V4-Pro(限时) 0.25 6
豆包 Seed-Lite 0.3 0.6
通义千问 Long 0.5 2
DeepSeek V3.2 2 0.2
Qwen3-Max 2.5 10
文心一言 4 8
GPT-5 196 525
Claude Sonnet 4.6 21 105

最便宜的DeepSeek V4-Pro限时价,每百万Token输入只要0.25元。最贵的GPT-5,输入价格达到196元,相差784倍。输出端的差距同样惊人。

即便在同一个厂商的产品线内部,汇率差异也相当惊人。腾讯混元2.0的输入价格从每千Token 0.0008元涨到了0.004505元,涨幅5.6倍。OpenAI从GPT-4o到GPT-5再到GPT-5.5,定价策略也呈现出精细化的阶梯,GPT-5反而比GPT-4o便宜了一半,而GPT-5.5又涨回到更高的价位。

还有一个反常识的细节。DeepSeek V3.2的输出只要0.2元,输入反而要2元,输出比输入便宜10倍,跟行业惯例完全相反。这大概率是DeepSeek的定价策略,通过极低的输出价格吸引开发者大量使用,用输出量来弥补单价的差距。

三层定价,每一层都在加价

理解Token经济学,需要拆解三层定价结构。

第一层是源头汇率,模型厂商直接面向开发者的API定价。上面那张表里的数字就是源头汇率。DeepSeek和豆包走的是薄利多销路线,OpenAI和Anthropic则维持着较高的品牌溢价。

第二层是工具层汇率。QClaw、WorkBuddy、CodeBuddy这些Agent平台,在源头汇率之上加了一层自己的定价。QClaw内置了20多个技能包,支持Kimi、DeepSeek等多种第三方模型,不同模型之间的积分汇率每隔一段时间就会调整。WorkBuddy也是,不同模型调用的积分消耗比例一直在变。这说明中间层在根据源头价格的变化,持续优化自己的成本结构。

第三层是用户解决问题的实际支付。用户并不直接购买Token,用户购买的是「解决某个问题的能力」。一个看似简单的需求,如果Agent需要反复调用模型、检索上下文、生成中间结果,最终消耗的Token可能是用户预期的十倍以上。

三层定价叠加在一起,形成了一个有趣的现象。源头汇率最低的DeepSeek,经过工具层加价后,到用户端的实际成本可能并不低。而源头汇率很高的Claude,如果工具层做了有效的缓存优化和调用策略,到用户端的成本可能比预期更可控。

腾讯云的Token Plan,39元买3500万Token,折合1.11元/百万Token。宣传说「比API按量计费省80%」,但前提是跟自家混元模型的API原价比。如果你直接用DeepSeek的API,Token Plan反而更贵。

WorkBuddy专业版58元/月,CodeBuddy企业版从158元涨到316元/人/月,涨幅100%。这些价格里包含了Token成本、产品体验、场景优化。但你不知道58元里有多少是Token钱、多少是产品溢价。

订阅制的好处是掩盖了Token的真实成本。用户觉得买的是「一个月的使用权」,实际上买的是「一定额度的Token配额」。用得多的用户在补贴用得少的用户。

Agent是Token黑洞

如果说传统的AI对话是一个「问答」模式,那Agent就是一个「执行」模式。这个模式转换带来的Token消耗增长是数量级的。

行业数据显示,Agent任务比传统QA多消耗4到15倍Token。一个简单的问答可能只要几千Token,但一个Agent任务,比如让WorkBuddy自动生成一份周报、让QClaw执行一个多步骤的数据分析,可能需要几十万甚至上百万Token。

举个具体的例子。假设一个Agent任务需要处理100万Token的输入并生成10万Token的输出。如果用DeepSeek V3.2,成本大约是2元加0.02元,总计2.02元。如果用GPT-5,成本是196元加52.5元,总计248.5元。同样的任务,成本相差123倍。

再来看一个更贴近日常使用的场景。假设一个产品经理每天用AI做三件事,早上总结行业新闻(约20万Token),下午辅助写产品文档(输入约50万Token、输出约5万Token),晚上做竞品分析(输入约100万Token、输出约10万Token)。如果全部用DeepSeek V3.2,一天的Token成本大约3.35元,一个月大约100元。但如果全部用GPT-5,一天就变成79.2元,一个月超过2300元。

从每月100元到每月2300元,这就是Token汇率差异在真实使用场景中的体感。

QClaw每天4000万Token的补贴,在Agent场景下能支撑多少场景?如果一个深度的场景每天消耗50万Token,那4000万Token只能覆盖80个中型任务。对于任何深度用户来说,这个数字都显得捉襟见肘。

QClaw个人版28元每月,如果按DeepSeek V3.2的源头汇率折算,28元可以购买大约930万Token的输入量,平均到每天大约31万Token。对于轻度用户来说绰绰有余,但对于每天跑Agent工作流的中度用户来说,可能半天就用完了。

补贴退坡,用户开始算账

回顾过去两年的AI行业定价史,可以清晰地看到一条从集体降价到集体涨价的轨迹。

2024年是价格战的巅峰。DeepSeek以极低的价格切入市场,倒逼整个行业跟进。Token被当成获客工具,而不是需要盈利的商品。

2025年是转折年。随着模型能力的提升和应用场景的拓展,Token消耗量开始指数级增长。算力成本、电力成本、芯片折旧成本都是硬支出,不可能靠规模效应无限摊薄。

2026年,行业集体转向真实定价。腾讯混元2.0涨价5.6倍,CodeBuddy企业版涨价100%,WorkBuddy签到活动五一后调整,DeepSeek限时特惠5月5日结束。21世纪经济报道用了一个精准的标题来概括,「从集体降价到集体涨价,Token经济学为何两年风向突变」。

从公开信息和我自己的使用观察来看,大部分C端用户还没有算Token账的意识。豆包,元宝,千问等都能免费使用,可预期的未来也将由于其入口地位解决算力成本问题。大家觉得AI就是免费的。

但三个信号正在改变这个认知。

第一,签到和赠送活动在缩减。WorkBuddy五一后调整签到规则,QClaw公测期间的赠送积分也在逐步收紧。这些看似不起眼的调整,其实就是补贴退坡的前奏。

第二,Agent产品的付费门槛在提高。WorkBuddy的高级功能要关联最低28元/月的Token套餐,CodeBuddy企业版直接涨价100%。当用户发现以前免费的功能开始收费,或者以前够用的额度不够用了,他们就会开始算账。

第三,Agent的Token消耗远超聊天。当Agent从「聊天玩具」变成「生产力工具」,Token成本就从「可以忽略」变成了「必须关注」。

算力成本对用户来说,正在从「一杯奶茶和一顿饭之间的区别」变成「一顿饭和一顿火锅之间的区别」。

算账时代

站在2026年4月底这个时间节点往回看,黄仁勋的「Token工厂」论断,不仅是对行业现状的描述,更是对未来趋势的预判。Token正在成为AI时代的基础计价单位,就像电力的度数、流量的GB数一样。

我的判断是,Token汇率战争会经历三个阶段。

第一阶段是现在,源头疯狂降价抢市场。DeepSeek 2.5折、豆包0.3元、通义0.5元,价格战已经白热化。这个阶段的赢家是用户和开发者。

第二阶段是中间层重新定价。当源头价格足够低,中间层不能再靠「信息差」吃差价。订阅制会逐步向Token计量制迁移,或者出现更透明的「Token+服务」打包定价。腾讯的Token Plan已经是一个信号。

第三阶段是用户开始算账。当Agent产品全面普及,Token消耗量暴增,用户会像比较话费套餐一样比较不同AI产品的Token性价比。到那个时候,汇率不再是幕后的事情,而是用户选择产品的第一考量。

对于产品经理而言,这对应着一套全新的能力要求。你需要理解不同模型的Token汇率,知道在什么场景下用什么模型最划算。你需要设计高效的Agent工作流,在保证任务质量的前提下最小化Token消耗。你需要建立清晰的成本模型,知道每一个用户的LTV是否能覆盖其Token消耗成本。

WorkBuddy五一后的签到调整只是一个开始。随着补贴进一步退坡、真实定价全面落地,Token汇率差异将从行业话题变成产品话题,最终变成用户话题。每一个使用AI产品的人,都将在某个时刻意识到,自己正在参与一场关于Token汇率的集体博弈。

这场博弈没有绝对的赢家。便宜的模型不一定能解决所有问题,贵的模型也不一定在所有场景下都值得。真正的竞争力在于,找到成本和效果之间的最优平衡点。

这大概就是2026年AI产品经理最重要的工作,算账。