每日AI知识点:Token(词元)-夜雨聆风

每日AI知识点:Token(词元)

上一篇文章我们介绍了 OpenClaw（“小龙虾” ）的 Skill（技能），让 AI 拥有了 “动手干活” 的能力。在使用“小龙虾”的过程中，经常听到说很烧钱、烧了多少“Token”。据国家数据局相关部门披露，2026年3月，中国日均Token调用量已突破140万亿，两年增长超千倍。

那么，Token到底是什么呢？今天我们来聊一聊。

1、Token是什么？

一句话总结：Token 就是 AI 处理文本时的”最小计量单位”——它不是字，也不是词。

人类说话、写字靠汉字和单词，组合成一句话，而AI大模型理解世界，靠的是一个个最小的语义单元——也就是Token。

一个Token可以是一个汉字、一个英文单词、一个标点符号，甚至是一个常见词组的一部分。

在很长一段时间里，Token没有一个统一的中文翻译——搞区块链的人叫它“代币”，做网络安全的人叫它“令牌”，编译器开发者叫它“标记”，同一个英文词在不同的圈子里各叫各的。

2026年3月，国家数据局局长刘烈宏在中国发展高层论坛2026年年会上正式宣布，大模型处理信息的最小可计量单元（Token）的中文标准译名确定为“词元”。

全国科学技术名词审定委员会随后发布公告，面向全社会发布试用。

2、Token 是怎么切出来的？

Token 不是随便切的，背后有一套叫 Tokenizer（分词器） 的算法。最常见的算法是 BPE（Byte Pair Encoding，字节对编码）。

用通俗语言解释BPE的原理，你有一本超级词典，编词典的过程是这样的：

第一步：初始化把文本拆成最小的单元——单个字符。比如”苹果”变成 ["苹", "果"]。

第二步：找高频组合统计所有文本中，哪两个字符经常粘在一起出现。发现”苹果”这个词出现了 100 万次，那就把”苹果”合并成一个新 Token。

第三步：不断合并反复执行：找出现频率最高的相邻组合 → 合并成新Token。

为什么这样设计？

3、Token长什么样？

很多平台现在提供了Token可视化工具，你可以直观看到一句话被切成几块。

举个例子，输入：“AI正在改变世界”，不同模型的切法可能不同：

GPT-4 的视角：["AI", "正在", "改变", "世界"]Llama 3的视角：["A", "I", "正在", "改变", "世界"]DeepSeek-V3 的视角：["AI", "正在", "改变", "世界"]

不同模型的Tokenizer不一样，所以同样的文本，在GPT-4、Llama 3、DeepSeek-V3里算出来的token数可能不同。

4、Token 是怎么算钱的？

为什么 AI 聊天有”字数限制”，为什么长对话会越用越贵？

因为 AI 的计费核心就是Token数 × 单价。

计费公式：

总费用=(输入token数 + 输出token数) × 每token单价

输入 token：你发给AI大模型的所有内容（包括你的问题 + 历史对话 + 系统提示）

输出 token：AI大模型回复你的内容

截至2026 年 4 月，国内外主流大模型的 Token 收费价格对比如下表：（单位：元 / 百万 Token，按 1 美元≈7.2 元换算，均为官方 API 公开价，不含代理 / 中转溢价）：

5、怎么省 Token？

既然Token=钱，那怎么在日常使用大模型中省Token？

技巧一：精简提示词（Prompt）

技巧二：控制上下文长度

技巧三：利用系统提示（System Prompt）

技巧四：选择合适的模型