你大概率撞见过这一幕:你问 AI 一个问题,它对答如流,语气笃定,条理清楚,还引经据典,连书名、页码、人名、年份都给你列得明明白白。你一看,太专业了,照单全收。结果一查——那本书不存在,那个人没说过那句话,那个数据,是它当场编的。它没有半点心虚,错得理直气壮。
这个毛病,有个专门的名字,叫幻觉。今天这一期,咱们就把它彻底搞明白:AI 为什么会幻觉,这毛病能不能根治,还有最实在的——你怎么防着它,别被它坑了。
一个真实的大笑话
美国有位律师,打官司的时候图省事,就让 AI 帮他找几个能支持自己观点的判例。AI 非常配合,唰唰唰,给他列了好几个,案件名、判决书编号、法官怎么说的,写得有鼻子有眼。律师拿去,就交给了法庭。

结果对方一查——这几个案子,压根不存在,全是 AI 凭空编出来的。最后这位律师,被法院罚了款,闹了个大笑话。
你注意啊,AI 不是不想帮他,它是太想帮他了。它觉得这种场合“应该”有这么几个判例,于是,就给“造”了出来,造得像模像样。这就是幻觉的典型样子:它不是看见了不存在的东西,而是一本正经地生成了一段看似合理、实际上压根不存在的内容,把假的,说得跟真的一样顺。
幻觉从哪里来
要回答这个问题,得先回到大语言模型最底层的工作方式上。这个聪明得吓人的东西,本事拆到最底层,其实只有一个,就是猜下一个字。你给它一段话,它就根据前面的内容,算出最有可能的下一个字是什么,然后再算下一个,一个字一个字往外蹦,蹦出一整段流畅的话。
请你把这句话焊死在脑子里:它的目标,从头到尾,是说得像,不是说得对。这两件事,大部分时候是一回事——一句话说得越通顺、越合理,往往也就越接近事实。但总有那么一些时候,这两件事,会分家。而幻觉,就发生在它俩分家的那条缝里。

一个绝不留白的考生
我给你一个特别贴切的类比。你把这个 AI,想象成一个考生,一个被训练了千万道题、专门来考试的学生。但它从小到大接受的考试规则,有一条特别坑:答对,得分;答错,不扣分;唯独——留白,也是零分。空着一道题,跟答错一道题,下场一模一样,都是零。
你想想,如果你是这个考生,你会怎么做?任何一道你不会的题,你的最优策略,都不是老老实实写“我不会”,而是——蒙一个。蒙对了白赚分,蒙错了反正也是零分,不亏。所以这个学生面对任何题目,哪怕一窍不通,也绝不空着,永远给你编一个看起来最像答案的答案出来,而且,写得还特别自信。
AI 就是这么被训练出来的。在它学习的过程里,“我不知道”这种诚实的回答,得到的奖励,并不比“编一个听起来很对的答案”更高。久而久之,它就养成了一个根深蒂固的习惯:绝不留白,遇事先蒙,而且要蒙得理直气壮。
幻觉的总根子:一个被训练成「宁可编、绝不空」的猜字机器,碰上了它其实不知道的东西。
这毛病能不能根治
幻觉,可以大大缓解,但到今天为止,没人能把它彻底根除。
为什么呢?因为它不是一段写错了的代码、一个能打的补丁,它是这种“猜下一个字”的工作方式本身,必然带出来的副作用。这个东西的全部能力——能写诗、能编程、能跟你天南海北地聊——靠的就是它敢于根据概率,大胆地往外生成内容。你要它彻底不“编”,本质上,就是要它别再“猜”;可它一旦不猜了,它也就什么都干不了了。
让它无所不能的那个本事,和让它满嘴跑火车的那个毛病,其实是同一个本事。你没法只要前者,不要后者。通过更好的训练和工具,幻觉能被压到很低很低,但想压到零,目前,做不到。所以你要做的,不是指望哪天出个完美不犯错的 AI,而是学会,怎么跟一个偶尔会一本正经胡说的超级助手打交道。
三招实在的防坑方法
既然幻觉无法根除,那怎么跟它打交道?这里有三招特别实在的,能帮你躲掉九成的坑。
第一招:认清容易犯病的场合
幻觉不是随机发作的,它专挑那种又具体、又冷门的东西下手。这几类问题最容易触发幻觉:
精确的数字和日期统计 具体的人名配具体的话 论文书籍法律条文的出处 小众冷门领域的细节
越是需要精确,越是冷门,它就越容易开始编。所以你一旦问到这类问题,心里那根弦,就得绷起来。
第二招:给它装上外挂记忆
这就接上了另一个关键概念——检索增强生成(RAG)。简单说,就是先让 AI 去翻真实的资料库、去联网搜真实的网页,把找到的真东西摆在它面前,再让它照着材料来回答。原来是闭卷考试,逼着学生硬蒙;现在,改成开卷了,它能编的空间,一下就小了一大截。所以你用 AI 查重要信息的时候,尽量用那些能联网、能引用来源的方式,并且,让它把出处也一并给你——你好顺着去核对。
第三招:重要信息自己核实
这也是最朴素、最管用的一招:凡是重要的、要拿去用的、错了有代价的信息,一律,自己核实一遍。AI 给你的东西,永远当成一份非常优秀的草稿,而不是最终的定论。那位栽了跟头的律师,错就错在,他把草稿,直接当成了定稿。你只要养成“AI 说完、我去验一下”这个习惯,幻觉对你的杀伤力,基本上就归零了。
一个有意思的反转
我们一直觉得,“一本正经地编造根本不存在的事”,是 AI 特有的毛病,是机器的缺陷。可你知道吗?人脑干这事,干得比 AI 还溜。
认知科学有一个挺颠覆的发现:你的记忆,根本就不是一段录像。你每一次“回忆”,其实都是大脑拿着一些残缺的碎片,当场重新搭建出一个听起来合情合理的版本。中间缺的那部分,大脑会自动用“最像是那么回事”的内容给你补上——而你自己,完全察觉不到这个补全的过程,你会百分之百地确信,那就是当时真实发生的。
学者们管这个叫“诚实地说谎”——他不是有意撒谎,他是真信。你听着,是不是有点耳熟?这跟那个一本正经编判例、自己却一点不心虚的 AI,简直就是一个模子刻出来的。
幻觉也许压根就不是机器的故障,而是任何一个「靠猜、靠脑补,来填补空白」的智能系统,都甩不掉的那个影子。
AI 编故事的样子,活脱脱,就是我们自己。那么问题就来了,留给你在评论区想一想:既然连我们自己的记忆,都未必靠得住,那当一个 AI 跟你信誓旦旦地讲述某件事的时候,你又该用什么,去给它、也给你自己,校准一下呢?
如果今天这期让你有点东西,想再往深里挖一挖,记住这几个词:大模型幻觉、检索增强生成,还有,人类的虚构记忆。然后去各大视频平台,搜索这几个关键词,开始你的打怪升级之旅。我是王利杰,我们下期见。
—————
📺 更多元知识视频,搜索「Wiki4What」
夜雨聆风