
●●●
2026年 4月15日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,首次在官方文件中提出探索“词元交易”。核心思路是:以词元作为基础计量单位,构建一套可量化、可定价的数据集价值评估与交易体系,为AI时代的数据资产化提供标准化路径。
什么是“词元”?
为什么它这么重要?
“词元”是英文“Token”的官方中文译名,可以理解为AI理解和处理信息的最小计量单位,你向AI提问“你好”,和AI生成一篇千字文章,背后都是无数个“词元”在运作。
而词元之所以重要,是因为它具备三种属性:可计量,可定价,可交易。
(一)可计量:词元成为AI时代通用的基础计量单位,类似于电的“度”或水的“吨”,用于统一衡量大模型处理信息的“工作量”。不同AI模型对同一任务的消耗方式各异——有的按字符、有的按调用次数,词元的引入相当于为整个行业建立了一把标准标尺,无论用户使用哪家模型、处理什么内容,最终都可以折算成消耗了多少个词元。
(二)可交易:可计量的基础上,每个词元可以被赋予明确的价格,形成从低价通用词元到高价专业词元的梯度定价体系。价格取决于词元背后的“价值密度”——日常对话的基础词元价格低廉,而用于医疗诊断、金融风控等专业场景的词元,因为需要结合高质量数据集和专家知识,价格可以是基础词元的数十倍甚至上百倍。

(三)可定价:词元不再只是计费单位,而是可以像商品一样在市场上买卖、转让、组合,甚至衍生出期货、互换等交易模式。用户购买的不是已经消耗掉的词元,而是未来可以调用AI能力的“词元额度”,类似于手机流量包——可以在不同AI模型之间通用,用不完的额度也可以转售给其他人。国家数据局提出“探索词元交易”,意味着未来可能出现国家级数据交易所的词元专区、云服务商的内部市场以及第三方经纪平台。
为何此时提出“词元交易”?
三个核心背景
首先是AI调用量的爆发式增长。中国日均词元调用量从2024年初的约1000亿,到2026年3月已突破140万亿,两年增长超千倍。如此海量的AI服务调用,如果各厂商仍沿用各自不同的计费方式(按次、按时长、按字符),用户无法横向比较成本,企业也难以精细化运营。词元作为统一的“工作量计量单位”,正是为了解决这一混乱局面而生。

其次是AI产业生态的初步形成。市场上已出现按词元计费的云服务(如百度智能云、火山引擎)、词元交易平台(如TopenRouter.com)以及按词元调度的城市算力平台。然而,这些探索各自为政,缺少一个被官方认可、可跨平台流通的“价值锚点”。国家数据局提出词元交易,就是要在产业自发萌芽的基础上,用政策明确词元的法定地位和流通规则。
最后,AI竞争正从“模型参数”转向“商业落地”。行业共识正从“谁的模型更强”转向“谁能让AI能力变成稳定、可计费的收入”。词元交易打通了数据、算力、模型三者之间的价值传递:高质量数据集可以按词元定价并出售调用权,算力成本可以按词元分摊,AI应用可以按词元向用户收费。这为整个AI产业链提供了一条标准化的商业闭环。

词元虽小,却可能成为撬动智能经济时代的一把钥匙。从“可计量”到“可定价”再到“可交易”,国家数据局迈出的这一步,正在为AI能力的规模化流通铺平道路。未来,我们或许会像今天交水电费一样,习惯性地关注自己的“词元账户”。当AI的能力可以被精准计量、公平定价、自由流通,一个更高效、更透明的智能经济新生态,才刚刚拉开序幕.....
●●●
往 期 回 顾

知 识 星 球
诚挚邀请您加入dataweekly的知识星球,丰富的行业实时报告成果,共同探讨数据资产的前沿话题与发展趋势,携手在数据浪潮中把握机遇,开拓创新。

最新报告推荐
●●●
- END -
夜雨聆风