上一篇我们聊到,AI 的本质是"找规律"。
可你和豆包、千问聊天的时候,它给出的回答又长又顺,看起来好像它真的"懂"你说的话。它到底是怎么从一堆规律里,"想"出后面这句话的?
今天我们就把这层窗户纸捅破。其实它做的事情,说出来你可能不信——就是猜下一个字。
本文是《小白的 AI 扫盲课》系列第 2 篇
···
一、AI 其实是在玩词语接龙
你小时候一定玩过词语接龙。
老师起个头:"床前明月光,疑是地上——"学生马上接:"霜。"
为什么你能一下接出来?因为这句诗你听过太多次了,"地上"后面跟着"霜",这个规律已经印在你脑子里。
大语言模型干的事情,本质上就是这个。只不过它"听过"的不是几首古诗,而是几乎整个互联网——所有的书、文章、对话、网页。看得多了,它就摸清了一件事:什么样的字后面,最可能跟什么字。
所以你跟它对话,不管它的回答看起来多复杂,它内部其实一直在做同一个动作:
看一眼前面已经写过的字,猜一下下一个字最可能是什么,写出来;再看一眼,再猜下一个,再写出来。
一个字一个字地往后接,像极了你小时候玩的那个游戏。
只不过它接得太快,一秒钟能接几十个字,你看到的就是一段流畅的回答。

···
二、什么是 token?为什么 AI 有时候说一半就停了
你可能遇到过这种情况:让 AI 写个总结,它写到一半突然停了,或者越写越短。这其实跟它"读字"的方式有关。
AI 看一句话,不是像我们这样一眼扫过去整句理解的。它得先把这句话切成一小块一小块,再一块一块送进去算。
这些切出来的小块,有个专门的名字叫 token,中文一般翻译成"词元"。
你可以把 token 理解成 AI 眼里的"文字积木":
中文里,"今天"、"开心"这种常用词可能是一个积木,有时候一个字也算一个积木 英文里,常见的单词是一个积木,但很长的单词可能会被拆成两三块
所以,token 不完全等于我们说的"字"或"词",它只是 AI 处理语言的最小单位。
那为什么 AI 会说一半停下来?因为每次对话,AI 能用的 token 数量是有上限的——就像你交话费的套餐里有"每月通话分钟数"一样,AI 也有自己的"字数预算"。预算用完了,它就只能停下来。
AI 不是不想多说,是它的"字数预算"用完了。
知道了这一点,你以后让 AI 写长文就明白了:不是越长越好,而是要把最重要的东西先说清楚。
···
三、为什么聊久了 AI 突然就"忘了"前面说过的?
很多人用 AI 都碰到过同一个情景:刚开始聊得好好的,聊到第二十几个回合,AI 突然就把前面交代的事情忘了,开始答非所问。
这不是它"老糊涂了",是它的工作方式决定的。
AI 每次回答你之前,会把你们这次对话里说过的所有话(专业术语叫 上下文,英文 context)从头到尾再读一遍,然后基于这些内容来猜下一句该怎么说。
你可以把这个过程想象成:
它就像一个翻开书本读你做笔记的人,它能看到的只有摊开在桌上的那几页。桌子大,它能摊开的就多;桌子小,能摊开的就少。
每个模型的"桌子"大小是固定的,你可能在产品介绍里见过"上下文 128K"、"上下文 1M"这种说法,说的就是这张桌子有多大。
但这里有个反直觉的事情——桌子大,不代表它就能用好所有摊开的内容。
就像你面前摊了 50 页笔记,真要做总结的时候,你大概率也只会用上其中最关键的几页,其他的反而会让你分心。AI 也一样。真正能被 AI 有效利用的内容,往往远少于它名义上能容纳的上下文长度。
所以当你跟 AI 聊得很长很复杂之后,最聪明的做法不是继续往同一个对话里堆,而是:
把核心结论复制下来 新开一个对话,把这几句关键内容粘进去 重新开始
这样 AI 的"桌子"是干净的,处理你的问题反而更准。

···
四、用好 AI 的 4 条朴素原则
知道了上面这些,你以后跟 AI 打交道就能少踩很多坑。把这一篇的关键内容浓缩成 4 条:
1. 同一个话题,尽量在同一个对话里聊
因为 AI 只能看见这次对话里的内容,新开一个对话相当于换了个完全不认识你的助手,所有背景都得重讲。
2. 重要的信息,越早告诉它越好
它会读完整段对话再回答你。前面的信息分量更重,藏在中间或最后的,它可能会忽略。
3. 太长了就重新开
如果一个对话已经聊到几十轮、上千字了,别犹豫,把核心内容摘出来,新开一个干净的对话。
4. 不是越啰嗦越好,是越精准越好
给 AI 的信息,是它"摊在桌上的笔记"。笔记多了它反而抓不住重点。少说废话,把任务、背景、要求说清楚,比写一大段心情铺垫管用得多。
用 AI 不是聊得越多越好,是给的"材料"越准越好。
···
小结
把这篇的几个认知带走:
大语言模型本质上一直在做一件事——根据前面的内容,猜下一个 token(字) 它有"字数预算",所以会说一半停下来;它有"桌面大小",所以聊久了会忘事 想用得好,关键不是堆更多内容,而是给的信息更精准、更聚焦
那么下一个问题就来了——市面上的 AI 产品这么多,豆包、DeepSeek、Claude、ChatGPT……它们都在"猜下一个字",那它们之间到底有什么区别?应该选哪一个?
下一篇我们就来拆解:不比谁更聪明,只看谁更适合你具体要做的事。
···
最后一个小问题想问问你——你平时用 AI 的时候,最常踩的是哪个坑?
- A. 它一本正经地胡说八道
- B. 聊久了它就忘了前面说过的
- C. 它给的回答又长又啰嗦,抓不住重点
- D. 还没怎么用过,正在观望
欢迎在评论区扣个字母,告诉我你的答案——也可以说说当时具体是什么情况,我会挑几条在后面的文章里展开聊。
如果你觉得这篇文章帮你搞懂了点什么,欢迎点个「在看」,或者转发给身边那个总跟你抱怨"AI 说话不靠谱"的朋友。
夜雨聆风