黄仁勋押注Token经济:你用的软件,正在变成AI收费站

这些操作背后,有一件事你可能没细想——
AI每回复一次,都在烧Token。而你随手烧掉的Token,正被人一笔一笔入账,变成亮眼的财报数字。
这个逻辑不是我总结的,是黄仁勋的。
6月1日,他在英伟达GTC台北大会上,于台北流行音乐中心发表演讲,Token经济是他整场演讲的核心主题之一。他在台上展示了一张图表,解释得很直白:
“一座AI工厂这辈子能赚多少钱,看的就是它总共产出多少Token,也就是曲线下方的面积。”
据科创板日报报道,黄仁勋的原话更完整:“从产业的角度来看,Token就是资产,Token已经成为获利的营收单位。” 因为它可以制造利润。AI公司会想建更多AI工厂、生产更多Token,这正是为什么台积电的订单已经排到了天边。
更夸张的是,黄仁勋说,在硅谷,“这份工作配多少Token”正在变成挖人的筹码——有公司开始把Token配额当生产力工具发给员工。
你没看错,Token配额,变成了新型”装备”。就像当年公司”配车””配房”一样,AI能力正在变成一种可以量化的职场资源。你的AI配额,正在变成你身价的一部分。
01 “算力就是收入”——黄仁勋的原话

先看黄仁勋在GTC上说了什么。
他在台上展示了一张图表,解释得很直白:
“算力即营收,算力即利润。在AI工厂里,每一个生成的Token都是可以计量的盈利单位。”
“如果你拥有一吉瓦的电力,单位瓦特的吞吐量就是你的收入。仅仅因为芯片更便宜而选择错误的架构,是无法转化为效益的。买得越多,赚得越多。”
这两句话的核心逻辑:数据中心不再是存储数据的机房,而是生产Token的工厂。谁能更快、更省电、更稳定地生产Token,谁就赚得越多。
在AI工厂时代,真正重要的指标不再是”一个芯片多少钱”,而是“一瓦电力能产出多少个Token”。因为数据中心的电力预算是固定的——你拿到1吉瓦的电力许可,就只能用这么多电。在电力上限锁死的情况下,谁的单位瓦特吞吐量更高,谁的营收就更高。
这彻底改变了数据中心建设的底层逻辑。过去企业买服务器是一项支出,而现如今建设GPU集群更像建设一条生产线。投入的每一块GPU都对应未来可出售的Token数量。
Token已经从一个技术名词,变成了像钱一样的东西——因为它能制造利润。
02 软件公司的未来:从卖工具,到卖AI干活

黄仁勋对软件行业的判断,比”Token是资产”更值得琢磨。
今年3月,黄仁勋在摩根士丹利技术大会上,据媒体报道说了这样一段话:
“未来每一家软件公司,都会变成一个增值转售商(value-added reseller)。”
这句话翻译成人话就是——软件公司以后赚的钱,很大一部分是AI Token的差价。
怎么理解?
想象一下你现在打开Word,让Claude帮你续写一段文档;你在Excel里让AI帮你做一张表;你用Outlook让AI帮你起草一封邮件。
每一次操作背后,软件平台在做一件事:向Anthropic或OpenAI支付Token费用,然后向你收服务费。
差价,就是软件公司的利润。
说白了,软件公司变成了AI高速公路上的收费站——你每让AI写封邮件、做张表、跑个任务,好比开车过一次闸,烧掉的Token钱就是过路费。
据媒体报道,黄仁勋在那场大会上还说得更直白:
“未来不会有’不是智能体’的软件。软件公司要从卖License(许可)转向消费、转售Token。”
“每一家公司都会变成一家智能体公司,每一家公司内部,都会跑着自己的智能体。智能随手可得的年代,没有哪个软件还甘心装傻。”
这里有个细节值得琢磨:Claude已经以第三方加载项的身份,正式进入了微软Office全家桶。Word、Excel、PowerPoint已全面可用,Outlook进入公测——Claude正一步步嵌入Office的每个角落。而微软自家的Copilot也依然在,两个AI助手并存于同一个Office里。
这件事的背后不是”二选一”,而是一笔更大的账:2025年底,微软和英伟达分别向Anthropic投资最多50亿美元和100亿美元,合计150亿;作为交换,Anthropic承诺购买300亿美元的Azure算力——Claude进入Office生态,与这笔投资同步。
黄仁勋描述的Token经济里,模型公司和软件公司之间不是简单的”父子关系”,而是”供应商-分销商”关系——哪怕微软是OpenAI最大的投资方,它照样把Anthropic拉进了自己的生态,因为多一个模型供应商,就多一条Token变现的通道。
有网友给这个趋势造了一个新词:GaaS(Agent as a Service,智能体即服务)——过去卖你工具,往后卖你智能体。
软件还是那个软件。但你为它掏的钱、它跟你算账的方式、计价的单位,都在被Token重写一遍。
03 你的钱包会怎样?
这件事落到普通人身上,变化是什么?
计费模式在变。
过去,你买软件,是买断制或者包月包年。你买了几个账号,付多少钱,跟你怎么用没关系。
Token经济时代,逻辑不一样了。但目前大部分软件走的不是”纯按Token收费”——而是包月+用量限制的混合模式。
说白了就是:你每个月付一笔固定的钱,但用多少AI是有上限的。用完了,要么等下个月刷新,要么加钱升级。
这个模式比纯按Token收费更聪明——既保证了软件公司的订阅收入,又给你套上了一根”看不见的绳子”。
用得少的,觉得”够用”,继续续费;用得多的,很快撞到天花板,被迫升级更贵的套餐。
你以为你在包月,其实你的用量已经被精算过了——用量限制,就是新的付费墙。
黄仁勋说的”从卖License转向转售Token”,真正的落地形态,大概就是这条路:包月是门面,用量是里子。
开发者是最先被”教育”的一波人。 如果你用Cursor写代码,或者用GitHub Copilot辅助开发,你一定感受过这种感觉:月初绰绰有余,月中开始精打细算,月末恨不得每个问题都想清楚再问AI——因为你问一次,就是在烧钱。
以后打开软件,别只看月费多少,看看用量额度是多少——那才是真正的价格。
04 但是——有人在拆收费站的路

黄仁勋的叙事很完整,但他漏掉了一件事:Token越来越便宜了。
DeepSeek V4发布后,API价格已经被打到了一个不可思议的低点——V4-Pro永久降价至原价的1/4,每百万Token输入缓存命中仅0.025元人民币,创全球大模型价格新低。后续版本若继续迭代,市场预期价格会进一步下探。
Token越便宜,中间商的利润空间就越薄。当模型公司自己都在打价格战的时候,夹在中间的软件公司还怎么赚差价?
更值得注意的趋势是:开源模型正在让企业绕开这条中间链路。
DeepSeek等开源模型,企业可以自己部署在服务器上,不经过任何中间环节,不付任何Token差价。你买算力、跑模型、用AI能力——全程自建,省掉了每Token的API费用。
这条路正在真实发生。很多技术团队已经在用本地部署的DeepSeek替代ChatGPT,边际Token成本接近零。
黄仁勋描述的这套”中间抽成”模式,有一个前提:模型能力必须足够强,且足够贵,用户才愿意付费。 一旦开源模型追上来,这个前提就开始动摇了。
Token经济不是没有裂缝——开源,就是那条裂缝。
05 万亿规模只是起点?
最后说几个数字。
英伟达最新一季财报(2027财年Q1):营收816亿美元,同比增长85%,光数据中心就752亿,同比增长92%。
Token经济里,先富起来的,是卖铲子、搞基建的英伟达。
黄仁勋在GTC上还抛出了一个关于未来规模的预测:
“到这个十年结束前,要有100吉瓦的AI工厂上线。”
一座1吉瓦的AI工厂,造价从两三百亿美元起步,很快达到上千亿。100吉瓦,意味着数万亿美元级别的基建投资。
黄仁勋押注的,不是Anthropic一家公司——他押注的是整条Token产业链一起上涨。从卖算力的英伟达,到卖Token的OpenAI和Anthropic,再到中间赚差价的软件公司,每一个环节,都在他的牌桌上。
而你我每天打开的那些软件,就是这条链路上的收费站。
当然,前提是——这条路还没被开源堵死。
最后,想听听你的想法:你是怎么看待”软件按Token收费”这个说法的?欢迎在评论区聊聊,也许你的经验,正是别人需要的答案。如果觉得这篇文章有收获,欢迎转发给身边的朋友。
💬 你怎么看”软件按Token收费”?欢迎评论区聊聊觉得有收获,转发给身边的朋友 👇
本文由AI辅助创作
夜雨聆风