国家首次提出“词元交易”:AI的“结算单位”,有了交易市场

国家数据局近期就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》向社会公开征求意见,明确提出“探索词元(Token)交易等新型数据集交易模式”。
这是官方政策文件中第一次出现“词元交易”这一表述。AI的“结算单位”,终于要进入交易市场了。
在此之前,我们聊过Token如何变成AI的“硬通货”,聊过算力涨价、云厂商集体提价。现在政策给出了方向——让词元本身,成为可交易的资产。
这不仅仅是数据交易的创新,更是AI商业模式的一次底层重构:从“卖算力”转向“卖Token”。

No. 1

政策到底说了什么?

4月20日,国家数据局发了一份《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,明确提出:

“推动数据集商业化、资产化,培育为数据付费的市场共识,探索以词元(Token)为基础的价值体系。”
这是“词元交易”第一次出现在官方文件里。
有意思的是,就在不到一个月前(3月23日),国家数据局局长刘烈宏刚刚公布把“词元”即Token定位为智能时代的 “结算单位” 。
从“定名”到“开市”——只用了不到一个月。这个速度,比很多人预想的快得多。
文件里还提到:商业模式要从“卖数据包”转向“API调用、模型化解决方案、全栈服务”。
简单说就是:以前是一次性买断,以后是按需付费。而词元,就是这套新体系里的“货币”。

为什么是现在?三个原因
政策不是拍脑袋,是产业导向的。

1. 词元消耗量已经大到必须“计量”
到今年3月,中国日均Token调用量突破 140万亿。
什么概念?
比2024年初增长了1000多倍,光最近三个月就又涨了40%多。
AI从“偶尔用用”变成了“天天用”。词元不再只是技术参数,而是实打实的经济指标。不建立交易体系,账都没法算。
2. 算力涨价太猛,需要新定价方式
最近算力全线涨价:
-
英伟达Blackwell芯片单小时租金,两个月从2.75美元涨到4.08美元,涨幅48%;
-
阿里云、腾讯云、百度云集体上调大模型服务价格;
-
智谱年内已经涨了三次;
-
Anthropic也把企业订阅改成了按算力消耗计费;
涨价的原因很简单:算力不够用了。
当算力变成稀缺资源,市场就需要更精细、更灵活的定价方式。词元交易,正好补这个位。
3. 数据交易一直缺一个“统一货币”
数据要素市场启动以来,计价单位五花八门:按条、按时、按流量……各说各话,没法统一。
而词元是AI自己能理解的“最小单元”,天然适合当计价基础。
一句话总结:消耗太大、成本太高、缺统一标准。
三个问题,指向同一个答案:词元交易。


TalkingData快评
词元交易写入政策,标志着AI数据从“随便用”走向“可定价、可交易、可资产化”。
这不仅是技术上的创新,更是商业模式的底层重构:Token从技术参数变成经济货币,AI从按次收费变成按词元计价。
No. 2

两个值得关注的信号

信号一:从“卖算力”到“卖Token”
以前云厂商卖的是算力——按GPU时长、按存储容量收费。
以后可能出现新模式:按词元消耗收费。
逻辑很简单:算力只是手段,词元才是目的。用户真正关心的不是“用了多少算力”,而是“产出了多少有用的Token”。
中邮证券的研报也指出:Token需求的爆炸式增长,已经是算力紧缺的核心推手。词元交易的建立,能为整个产业链提供一个更透明的定价基准。
信号二:高质量数据集的价值,要被重新定义了
文件里还提到:要建设文本、图像、音频、视频等多模态高质量数据集。
当词元成为交易单位,数据集的“含金量”就不再是虚的——它可以被量化为 “词元产出效率”。
那些能帮模型“用更少词元、产出更高价值”的数据集,会值更多钱。


这对你意味着什么?
1. 你的数据资产,终于有了定价锚
以前企业有数据,但不知道值多少钱。以后,一份数据能帮模型节省多少词元,它就值多少钱——可量化了。
2. AI成本会更透明
当词元成为交易单位,你的AI账单就从“笼统的算力费”变成“清晰的词元明细”。
成本看得见,信任才建得起来。
3. 数据要素市场的“货币”正在诞生
数据交易一直卡在“定价难”上。词元作为统一计价单位,有望成为这个市场的 “基础货币”。
谁能率先接入这个体系,谁就能在数据资产化浪潮里抢到先机。


TalkingData快评
从3月23日“词元”定名,到4月20日“词元交易”写入政策——不到一个月,词元完成了三级跳:
技术概念 → 结算单位 → 交易标的
这不是文字游戏,是AI产业走向成熟的必经之路。
算力从“取之不尽”变成“稀缺资源”,市场需要一套新的定价逻辑。
词元交易,就是这套逻辑的开端。
它让AI的消耗有了可计量的刻度,让AI的服务有了可交易的货币,让AI的价值有了可比较的标准。
接下来几年,“词元交易”会从政策文件走进商业实践。
率先建立词元交易的标准和基础设施,才能掌握AI数据时代的定价权。
看AI数据,就找TalkingData。
关注TalkingData,获取更多数据洞察与行业分析。


END





高质量数据集是未来AI 发展的支撐。

为人工智能提供所需的一切数据
Delivering Comprehensive AI Data for All Industries.
#Data AI# #万亿数据要素市场#
推荐阅读:

国家安全部发声:140万亿次Token调用背后,你的“数字身份证”正在裸奔?

“Token”定名“词元”:AI圈的地震背后,藏着什么?

高质量数据集写入国家政策:AI时代的“战略石油”正式登场


TalkingData
用数据优化决策、加速转型
欢迎关注分享

夜雨聆风