Token 是AI的积木
图1|Token 是AI的积木。
图2|Token 是AI的积木:AI 不是按“字数”看世界,而是先把内容拆成可计算的小块。
很多人第一次听 token,会自动翻译成“字数”。
这一步就偏了。
Token 更像 AI 工作台上的积木。你输入一句话,模型不是原样把整句话吞进去,而是先把它拆成一小块一小块,再拿这些小块做预测、关联和生成。
比如你写:
今天把会议纪要整理成三条行动项。
在人眼里,这是一句话。
在模型眼里,它会变成一串 token:有的 token 像一个词,有的像半个词,有的像标点,有的甚至只是某个常见片段。
这件事为什么重要?
因为 token 决定了三件事:
1. 成本:你输入越长,模型要处理的 token 越多
2. 容量:上下文窗口装的是 token,不是“页数”
3. 理解颗粒度:不同语言、格式、符号,被切开的方式不一样
2026 年关于 tokenization 的研究继续提醒一个问题:tokenizer 不是中性的切菜刀。它会影响有效上下文、训练成本、推理成本,也会让一些语言承担更高的 token 负担。
翻成人话就是:
同样一句意思,有的语言可能要用更多 token 才能表达。
同样一份资料,有的格式会被切得更碎。
同样一个提示词,写得啰嗦,可能不是“更清楚”,而是把工作台堆满了碎积木。
所以写给 AI 的内容,要少一点“装修”,多一点结构。
比如:
任务:整理会议纪要
输出:3条行动项
每条包含:负责人、截止时间、下一步
这比一大段绕来绕去的说明更适合 AI 处理。
Token 不是玄学单位。它就是 AI 读写世界时最小的一批积木。
鲍什式总结:
Token 不是字数。它是 AI 搭答案用的积木,积木越乱,房子越容易搭歪。
所属合集
📌 本文由AI整理素材,鲍什修改定稿。
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
收录于🧠 AI知识小合集
江苏,8分钟前,
夜雨聆风