AI为什么一本正经地胡说八道?大模型幻觉是怎么回事

你大概率撞见过这一幕：你问 AI 一个问题，它对答如流，语气笃定，条理清楚，还引经据典，连书名、页码、人名、年份都给你列得明明白白。你一看，太专业了，照单全收。结果一查——那本书不存在，那个人没说过那句话，那个数据，是它当场编的。它没有半点心虚，错得理直气壮。

这个毛病，有个专门的名字，叫幻觉。今天这一期，咱们就把它彻底搞明白：AI 为什么会幻觉，这毛病能不能根治，还有最实在的——你怎么防着它，别被它坑了。

一个真实的大笑话

美国有位律师，打官司的时候图省事，就让 AI 帮他找几个能支持自己观点的判例。AI 非常配合，唰唰唰，给他列了好几个，案件名、判决书编号、法官怎么说的，写得有鼻子有眼。律师拿去，就交给了法庭。

结果对方一查——这几个案子，压根不存在，全是 AI 凭空编出来的。最后这位律师，被法院罚了款，闹了个大笑话。

你注意啊，AI 不是不想帮他，它是太想帮他了。它觉得这种场合“应该”有这么几个判例，于是，就给“造”了出来，造得像模像样。这就是幻觉的典型样子：它不是看见了不存在的东西，而是一本正经地生成了一段看似合理、实际上压根不存在的内容，把假的，说得跟真的一样顺。

幻觉从哪里来

要回答这个问题，得先回到大语言模型最底层的工作方式上。这个聪明得吓人的东西，本事拆到最底层，其实只有一个，就是猜下一个字。你给它一段话，它就根据前面的内容，算出最有可能的下一个字是什么，然后再算下一个，一个字一个字往外蹦，蹦出一整段流畅的话。

请你把这句话焊死在脑子里：它的目标，从头到尾，是说得像，不是说得对。这两件事，大部分时候是一回事——一句话说得越通顺、越合理，往往也就越接近事实。但总有那么一些时候，这两件事，会分家。而幻觉，就发生在它俩分家的那条缝里。

一个绝不留白的考生

我给你一个特别贴切的类比。你把这个 AI，想象成一个考生，一个被训练了千万道题、专门来考试的学生。但它从小到大接受的考试规则，有一条特别坑：答对，得分；答错，不扣分；唯独——留白，也是零分。空着一道题，跟答错一道题，下场一模一样，都是零。

你想想，如果你是这个考生，你会怎么做？任何一道你不会的题，你的最优策略，都不是老老实实写“我不会”，而是——蒙一个。蒙对了白赚分，蒙错了反正也是零分，不亏。所以这个学生面对任何题目，哪怕一窍不通，也绝不空着，永远给你编一个看起来最像答案的答案出来，而且，写得还特别自信。

AI 就是这么被训练出来的。在它学习的过程里，“我不知道”这种诚实的回答，得到的奖励，并不比“编一个听起来很对的答案”更高。久而久之，它就养成了一个根深蒂固的习惯：绝不留白，遇事先蒙，而且要蒙得理直气壮。

幻觉的总根子：一个被训练成「宁可编、绝不空」的猜字机器，碰上了它其实不知道的东西。

这毛病能不能根治

幻觉，可以大大缓解，但到今天为止，没人能把它彻底根除。

为什么呢？因为它不是一段写错了的代码、一个能打的补丁，它是这种“猜下一个字”的工作方式本身，必然带出来的副作用。这个东西的全部能力——能写诗、能编程、能跟你天南海北地聊——靠的就是它敢于根据概率，大胆地往外生成内容。你要它彻底不“编”，本质上，就是要它别再“猜”；可它一旦不猜了，它也就什么都干不了了。

让它无所不能的那个本事，和让它满嘴跑火车的那个毛病，其实是同一个本事。你没法只要前者，不要后者。通过更好的训练和工具，幻觉能被压到很低很低，但想压到零，目前，做不到。所以你要做的，不是指望哪天出个完美不犯错的 AI，而是学会，怎么跟一个偶尔会一本正经胡说的超级助手打交道。

三招实在的防坑方法

既然幻觉无法根除，那怎么跟它打交道？这里有三招特别实在的，能帮你躲掉九成的坑。

第一招：认清容易犯病的场合

幻觉不是随机发作的，它专挑那种又具体、又冷门的东西下手。这几类问题最容易触发幻觉：

精确的数字和日期统计
具体的人名配具体的话
论文书籍法律条文的出处
小众冷门领域的细节

越是需要精确，越是冷门，它就越容易开始编。所以你一旦问到这类问题，心里那根弦，就得绷起来。

第二招：给它装上外挂记忆

这就接上了另一个关键概念——检索增强生成（RAG）。简单说，就是先让 AI 去翻真实的资料库、去联网搜真实的网页，把找到的真东西摆在它面前，再让它照着材料来回答。原来是闭卷考试，逼着学生硬蒙；现在，改成开卷了，它能编的空间，一下就小了一大截。所以你用 AI 查重要信息的时候，尽量用那些能联网、能引用来源的方式，并且，让它把出处也一并给你——你好顺着去核对。

第三招：重要信息自己核实

这也是最朴素、最管用的一招：凡是重要的、要拿去用的、错了有代价的信息，一律，自己核实一遍。AI 给你的东西，永远当成一份非常优秀的草稿，而不是最终的定论。那位栽了跟头的律师，错就错在，他把草稿，直接当成了定稿。你只要养成“AI 说完、我去验一下”这个习惯，幻觉对你的杀伤力，基本上就归零了。

一个有意思的反转

我们一直觉得，“一本正经地编造根本不存在的事”，是 AI 特有的毛病，是机器的缺陷。可你知道吗？人脑干这事，干得比 AI 还溜。

认知科学有一个挺颠覆的发现：你的记忆，根本就不是一段录像。你每一次“回忆”，其实都是大脑拿着一些残缺的碎片，当场重新搭建出一个听起来合情合理的版本。中间缺的那部分，大脑会自动用“最像是那么回事”的内容给你补上——而你自己，完全察觉不到这个补全的过程，你会百分之百地确信，那就是当时真实发生的。

学者们管这个叫“诚实地说谎”——他不是有意撒谎，他是真信。你听着，是不是有点耳熟？这跟那个一本正经编判例、自己却一点不心虚的 AI，简直就是一个模子刻出来的。

幻觉也许压根就不是机器的故障，而是任何一个「靠猜、靠脑补，来填补空白」的智能系统，都甩不掉的那个影子。

AI 编故事的样子，活脱脱，就是我们自己。那么问题就来了，留给你在评论区想一想：既然连我们自己的记忆，都未必靠得住，那当一个 AI 跟你信誓旦旦地讲述某件事的时候，你又该用什么，去给它、也给你自己，校准一下呢？

如果今天这期让你有点东西，想再往深里挖一挖，记住这几个词：大模型幻觉、检索增强生成，还有，人类的虚构记忆。然后去各大视频平台，搜索这几个关键词，开始你的打怪升级之旅。我是王利杰，我们下期见。

—————

📺 更多元知识视频，搜索「Wiki4What」