乐于分享
好东西不私藏

Token经济爆发,AI推理行至转折点

Token经济爆发,AI推理行至转折点

每一次Token的生成与处理,背后都是GPU集群的海量运算,每一次运算的本质,都是电能向计算结果的转化。英伟达CEO黄仁勋在GTC大会上表示,未来的每一座数据中心,都将成为生产Token的“工厂”。随着AI训练时代的算力饱和,AI推理时代的深耕开启,Token正从“燃料”进化为“硬通货”。

“养虾”带动“Token经济”

进入3月以来,“养龙虾(OpenClaw)”迅速引爆舆论场,显示出人们对开源智能体的好奇与接纳。与传统AI对话单次消耗少量Token不同,“龙虾”自主执行任务、持续调用工具,每一步操作都伴随着大量的Token消耗。

行业里有一个比较通行的估算方式:1个汉字或者一个英文单词≈1个Token。无论是API调用价格、模型推理成本,还是算力消耗,大多数AI产品几乎都以Token作为计量单位。2025—2026年,国内大模型市场快速完成从“模型参数竞赛”到“Token消耗竞争”的转型。从技术演进看,大模型训练与应用的Token规模已实现从百亿级向万亿级的跨越。

大模型表面上在比拼参数规模、模型能力和技术指标,但真正落到商业层面,决定收入规模的往往只有Token消耗量这个指标。原因很简单:每一次模型调用、每一次内容生成、每一次推理计算,都会消耗Token。调用次数越多,Token消耗越大,对应的算力需求和商业收入也就越高。

为什么“养龙虾”消耗的Token多呢?南京计算机学会秘书长王继锋表示,Token是算力计费的单位,是AI思考、运行、处理任务时用的通用燃料,想要智能体越智能、执行的任务越复杂,所需要的Token就越多,花费也就越高。在OpenClaw这类能“动手干活”的AI智能体中需要将一个复杂指令拆解为数十个步骤,每一步都需调用大模型进行决策和执行,导致其Token消耗量是传统聊天AI的100到1000倍,一个复杂任务可能消耗数万乃至上亿的Token。

据OpenRouter平台统计,OpenClaw是过去一个月全球Token消耗最高的APP,其Token消耗量甚至是是第二名的3.6倍

当用户安装了各大平台提供的AI智能体产品后,如何让其高频使用,产生持续大量的Token消耗,让“养龙虾”热转变为实际的商业营收,正成为各大AI平台间的新战事。对于坚持“本地养龙虾”的用户,大厂通过卖Token成为“龙虾”的“饲料供应商”赚取流量收入。随着Token价格持续上涨,其经济价值日益显现。今年2月,智谱宣布GLMCodingPlan套餐整体涨幅30%起,API价格同步上调;3月,腾讯云宣布混元系列模型Token价格上调。从业者表示,“Token或成为AI时代的‘代币’。”

为了迎合AI时代用户市场对算力的激增需求,AI巨头平台正在大力开拓Token产业链。在移动互联网时代,平台竞争的核心是流量入口。

3月16日,阿里巴巴正式成立AlibabaTokenHub事业群,建立以“创造Token、输送Token、应用Token”为核心目标的全新组织。阿里巴巴CEO吴泳铭把Token算力比喻为了AI时代的电量,把“创造Token、输送Token、应用Token”对应到“发电、输电、用电”流程。

以Token为主线,阿里巴巴不再将AI视为一个孤立的技术工具,而是将其视为一种全新的生产要素,贯穿了从底层算力到上层应用的全生命周期:具体来看,通义实验室负责“创造Token”,任务是创造领先的多模态模型;MaaS(大模型即服务)业务线则负责“输送Token”,作为大模型服务平台面向企业客户;千问事业部、悟空事业部及AI创新事业部等则负责“应用Token”,面向B端、C端用户的AI入口之争。除了阿里巴巴之外,字节、腾讯等,也会有各自版本的Token产业链建设方案。

从“流量为王”转向“Token为王”

3月17日,在英伟达GTC大会上,英伟达CEO黄仁勋表示,英伟达要做“Token之王”,并提出了“Token工厂”的概念。“AI的每一个部分,每一次都需要思考、推理、行动、生成Token。”

黄仁勋强调,“现在已经过了单纯训练的阶段,进入了推理的领域。所以推理的转折点已经到来,而此时所需的Token量、计算量,相比之前增加了大约一万倍。”

黄仁勋说,AI推理的转折点已经到来:“未来,每一家云服务提供商、计算机公司、云端企业、AI公司,乃至所有企业,都将关注其Token工厂的效率,”黄仁勋说。这就是未来的核心工厂,因为在座的每一位都由智能驱动,而未来,这种智能将由Token赋能。

不仅是英伟达,华为也押注Token。3月19日,华为公司常务董事汪涛在华为中国合作伙伴大会上表示,当前,全球日均Token消耗量已超360万亿,未来五年预计将增长3亿倍。行业智能化应用的广泛部署,带来算力需求的全面爆发,预计2026年AI算力基础设施建设规模将超过1.3万亿美元,同比增长41%。

“Token经济时代已经来临。”华为高级副总裁李鹏表示,我国人工智能等研发应用走在世界前列,日均Token消耗量已跃升至180万亿,平均每1.5天就有一个新模型诞生,连接与计算需求爆发式增长,带来巨大发展机遇。

李鹏预计,随着行业智能化升级加速,市场对确定性网络、数据中心互联和产业超算等需求爆发,预计在2026年将给ICT产业带来超过8000亿元的市场机会。到2030年,中国AI相关产业规模将突破10万亿元。

短短一年间,国内大模型市场完成从“模型参数竞赛”向“Token消耗竞争”的转型,Token消耗量从百亿级跃升至万亿级,成为驱动AI产业价值重构的关键变量。Token不再是一个技术术语,它已经成为算力单位、信息单位、货币单位。AI从“流量为王”转向“Token为王”,谁掌握了最低的Token生产成本,谁就掌握了AI时代的定价权。

让Token成为核心基础设施

黄仁勋预判,到2027年全球AI算力相关需求将突破1万亿美元,Token作为AI时代的核心大宗商品,供需缺口会持续扩大。

Token增长依赖算力支持,近年来,三大运营商都非常重视云计算和人工智能,建设了大量数据中心和智算中心。中国移动推进“算力多元化、算网一体化、全域AI化”三化方向,目前已部署超百万台算力服务器。中国电信在智算领域持续发力,依托“天翼云”构建分布式智算网络,目前已实现省域智算节点全覆盖,还针对工业、政务等场景推出定制化算力解决方案。中国联通则聚焦“智算+跨界融合”,联合产业链伙伴搭建天地一体化通信算力平台,同时推进边缘智算节点建设,进一步完善智算服务网络。

按照黄仁勋的定义,Token是AI处理信息、执行任务、创造价值的基本生产单元,无论是智能体交互、工业机器人运算,还是自动驾驶决策、大模型推理,每一项AI应用,本质都是Token的生产与消耗。AI时代的商业竞争,最终都会落脚到Token的生产效率和成本控制上。随着Token流量的增长,运营商在网络侧也同步提升算网融合能力,通过SDN(软件定义网络)、MEC(移动边缘运算)等产品,提供差异化品质保障和低时延连接。

全国政协委员、360集团创始人周鸿祎在谈到算力布局时表示:“随着智能体应用爆发,推理算力需求正呈指数级增长。然而,目前我国的算力中心面向推理任务的专用集群存在缺口,区域供需适配有待优化,专用推理芯片技术亟需提升。”对此,周鸿祎建议,一方面,要优化全国推理算力布局,建立“全国统筹+区域细化”的布局体系,在重点产业集聚区建设低时延、高密度推理算力集群,强化跨区域资源调度,提升利用效率;另一方面,应鼓励专用推理芯片的国产化发展,通过重点突破高精度、低时延、多模态芯片技术,支持智能体规模化应用。

面对持续增长的Token消耗与算力成本压力,企业亟需建立体系化Token运营机制,将技术投入转化为可量化、可追溯的商业价值,形成“投入—优化—回报”的良性闭环。人工智能能否真正为企业创造价值,关键不在于接入多少模型,而在于能否将Token消耗转化为生产效率提升、产品质量改进与经营效益增长。

来源:赛迪传媒《中国信息化周报》