当前”Token”概念存在两个主要维度:AI大模型领域的词元(Token)和区块链领域的资产代币化(Token/RWA)。国内A股更偏向前者和间接的支付/安全基础设施,本文重点分析大模型领域词元(Token)概念。
AI大模型词元(Token)
Token已从单纯的技术概念演变为AI时代的核心经济单元。英伟达CEO黄仁勋在2026年GTC大会上明确提出:“Token是AI时代的基石,数据中心是生产Token的新型工厂”。
一、技术原理:Token是什么
1. 基本定义
Token是大语言模型(LLM)处理信息的最小语义原子。所有文本、代码、图像在输入模型前,均需经过Tokenizer分词处理,将连续文本切分为离散单元。
2. 中英文Token映射差异
语言 | Token映射关系 | 实际影响 |
中文 | 约1个汉字 = 1.5-2个Token | 处理中文成本更高,国产模型专门优化 |
英文 | 平均1个单词 = 1.3个Token | 天然成本优势 |
数字 | 单数字拆分(如”123”→“1”,“2”,“3”) | 避免数字OOV问题,利于数值比较 |
3. 国产大模型分词优化
国产大模型(Qwen、DeepSeek、Baichuan等)专门优化中文Tokenizer,核心策略:
•词表设计:扩大中文词表比例,提升中文压缩率。例如Qwen2.5词表达151,936,中文压缩率1.5-1.8;DeepSeek-V3词表129,280,压缩率约1.5
•BBPE算法:字节级BPE(Byte-level BPE),多语言场景更有优势
•KV缓存优化:中文Token长度更短,10万Token上下文的KV缓存比英文少30%,显著降低显存占用
•二、Token经济学:从计费单位到”数字石油”
1. 计费模型重构
Token已成为AI服务明码标价的最小计量单位,将抽象的”智能”转化为可量化的商品。
计费公式:
费用 = (输入Token数 × 输入单价) + (输出Token数 × 输出单价)
关键定价特征: - 输入/输出分离:输出Token单价通常远高于输入(GPT-5.5输出15美元/百万Token vs 输入2.5美元) - 缓存命中折扣:二次请求缓存Token按原价10%计费,节省约72%费用 - 阶梯定价:用量越大单价越低;长上下文(128K以上)溢价1.5-3倍 - 批量折扣:异步Batch模式价格为实时推理的50%
2. 价格趋势:从”厘时代”到结构性下降
DeepSeek V4重新定义价格底线:
- 2026年4月,DeepSeek-V4-Pro输入缓存命中价格降至0.025元/百万Token(首发价1元的1/40),创全球大模型价格新低
- 技术支撑:自研稀疏注意力架构,Pro版单Token算力仅为V3.2的27%,KV缓存降至10%
价格下降的本质逻辑: > 不是便宜,而是让原本算不过账的场景开始成立——AI客服可全量上线、企业知识库大规模普及、自动化办公ROI提升
未来判断:Token价格会继续下降,但速度放缓。前半段降价来自模型效率提升,后半段取决于算力成本(芯片、电力、数据中心)下降。
3. 市场规模:从9万亿到380万亿
指标 | 数据 | 来源 |
2025年全球Token市场规模 | 约9万亿元 | 行业测算 |
2030年预测规模 | 380万亿元 | 年均复合增长率>300% |
2026年3月中国日均Token调用量 | 140万亿次 | 较2024年初增长超1000倍 |
2026年2月全球前十模型Token总消耗 | 27万亿次/月 | 其中国产模型贡献14万亿,占比超50% |
2026年全球Token市场规模预测 | 3.2万亿美元 | 中国占比超35% |
三、Token工厂:产业链与成本结构
1. 成本结构解析
Token工厂(数据中心)的成本结构中,电力成本占比过半且持续上升,是最大的单项支出。
成本项 | 占比 | 降本策略 |
电力成本 | >50% | 自建微电网、捆绑核电、液冷普及 |
芯片/硬件折旧 | ~20% | 提升每瓦Token产出效率 |
数据中心运维 | ~15% | 规模化、自动化 |
网络/带宽 | ~10% | 优化传输效率 |
其他 | ~5% | - |
2. 收入模式演进
Token已成为可计价的”智能货币”,收入模式从单一按量计费走向分层定价
按量计费:基础API调用
•分层定价:按模型能力(基础/高级/专业)差异化定价
•订阅+用量混合:固定月费+超额Token计费
•价值定价:按业务成果(解决工单数、招聘成功数)收费
市场格局:2026年3月头部云厂商集体涨价30%-400%,掌握定价权,市场进入卖方市场。
3. 商业模式升级
Token工厂推动商业模式从”卖资源”向”卖智能”升级: - 英伟达:从芯片商转型为”AI工厂架构师” - 阿里/字节:打通从Token生产到应用的全链条 - 未来趋势:专业化Token生产商与交易平台出现
四、国内核心概念股梳理
(一)Token生产基础设施(算力层)
公司 | 代码 | 核心逻辑 | 关联度 |
鸿博股份 | 002229.SZ | 子公司英博数科为MiniMax等头部模型提供独家算力,Token生产核心载体 | ★★★★★ |
浪潮信息 | 000977.SZ | AI服务器龙头,深度绑定英伟达/国产芯片,Token工厂硬件核心 | ★★★★★ |
中科曙光 | 603019.SH | 高性能计算+液冷服务器,降低Token生产能耗 | ★★★★☆ |
寒武纪 | 688256.SH | 国产AI芯片龙头,思元系列适配国产模型Token推理 | ★★★★☆ |
海光信息 | 688041.SH | DCU深度计算单元,兼容CUDA生态,Token算力国产替代 | ★★★★☆ |
首都在线 | 300846.SZ | 与智谱AI深度绑定,承接GLM系列模型推理算力,订单同比暴涨260% | ★★★★☆ |
优刻得 | 688158.SH | 算力租赁+Token出海+MaaS计费核心服务商 | ★★★★☆ |
青云科技 | 688316.SH | 云算力服务,Token推理弹性调度 | ★★★☆☆ |
铜牛信息 | 300895.SZ | 北京国资智算中心,支撑Token生成与调用 | ★★★☆☆ |
美利云 | 000815.SZ | 东数西算中卫枢纽核心IDC,为AI大模型提供算力底座 | ★★★☆☆ |
(二)Token计费与API服务(平台层)
公司 | 代码 | 核心逻辑 |
昆仑万维 | 300418.SZ | 天工大模型开放API并按Token计费,日均调用量突破5亿次 |
三六零 | 601360.SH | 360智脑大模型提供Token计量、调用及计费服务 |
科大讯飞 | 002230.SZ | 星火大模型拥有自主知识产权分词器,针对中文场景深度优化Token算法 |
百度集团 | 09888.HK | 文心一言API按Token计费,云厂商定价权掌握者 |
阿里巴巴 | 09988.HK | 通义千问+阿里云,Token全链条布局 |
(三)Token消耗场景(应用层)
公司 | 代码 | 核心逻辑 | Token消耗特征 |
蓝色光标 | 300058.SZ | AI营销工具大量生成消耗Token,AI驱动收入24.7亿元 | 高频文本生成 |
万兴科技 | 300624.SZ | AI创意软件,产品AI功能大量消耗Token并按Token计费 | 多模态生成 |
中文在线 | 300364.SZ | 海量中文文本语料,AI大模型Token训练核心内容供给方 | 训练语料 |
金山办公 | 688111.SH | WPS AI功能大量消耗Token,办公场景高频调用 | 长文档处理 |
同花顺 | 300033.SZ | 金融AI助手,实时数据查询+分析生成消耗Token | 实时推理 |
拓尔思 | 300229.SZ | 政务/媒体AI应用,NLP处理大量Token | 文本分析 |
(四)Token配套技术(冷却/电力)
公司 | 代码 | 核心逻辑 |
英维克 | 002837.SZ | 液冷温控,Token工厂能耗管理核心 |
高澜股份 | 300499.SZ | 液冷解决方案,Token生产散热刚需 |
科华数据 | 002335.SZ | UPS电源+数据中心,算电协同受益者 |
中国核电 | 601985.SH | 核电捆绑,Token工厂电力成本优化 |
五、投资逻辑与风险提示
核心投资逻辑
1.Token消耗量指数级增长:日均140万亿→未来400-700万亿,增量空间巨大
2.价格下降≠市场缩小:单价降但总量涨,整体算力需求反而扩大(互联网验证过的规律)
3.国产替代窗口期:昇腾/寒武纪适配国产模型进入兑现期,下半年超节点批量上市
4.算电协同政策红利:2026年3月首次写入政府工作报告,电力企业价值重估
5.中文Token效率优势:国产模型中文压缩率优化,KV缓存比英文少30%,成本结构更优
关键风险
1.电力瓶颈:Token生产成本中70%来自算力硬件折旧和电力,电力容量可能触及瓶颈
2.价格战失控:DeepSeek 0.025元/百万Token的定价可能引发恶性竞争,压缩产业链利润
3.技术迭代风险:稀疏注意力、模型压缩等技术可能进一步降低单Token算力需求
4.估值泡沫:部分概念股短期涨幅过大(如蓝色光标5个交易日涨118%),需警惕回调
5.商业化不及预期:80%企业因数据安全风险放缓AI项目,Token消耗增速可能低于预期
总结:Token经济正处于从”技术概念”向”产业基础设施”转型的关键期。投资应聚焦三条主线:Token生产端(算力芯片/服务器/液冷)、Token分发端(API平台/云厂商)、Token消耗端(已验证商业闭环的AI应用)。优先选择有真实订单、业绩可验证的标的,回避纯概念炒作。
夜雨聆风