你有没有过这种经历——问 AI 一个问题,它回答得头头是道、有理有据,甚至给你列了三个文献、一个数据、一个专家名字。你拿去一查,全是瞎编的。
这就是 AI 圈里最让人头疼的毛病:幻觉(Hallucination)。说白了就是 AI 不会"我不知道",它会一本正经地给你编一个听起来特别像那么回事的答案。

老实说,AI 不是故意骗你。它脑子里根本就没有"真"和"假"的开关,它只是预测下一个最可能出现的字。可偏偏它语气又特别自信,让你不知不觉就信了。今天这篇就带你把它扒个底朝天。
一、什么是 AI 幻觉:考试遇到不会的题

AI 幻觉的意思,就像学生考试遇到不会的题。
试卷上有一道题他根本没学过,他不会举手问老师,也不会空着不写。他会硬着头皮编一个答案——格式是答题卡的格式,字数是满分答案的字数,甚至连"综上所述"都给你写得一本正经。但你拿过去一对,发现全是错的。
AI 也是这样:你问它一个它训练数据里没见过的问题,它不会说"我不知道"(这是早期 AI 的毛病,现在很多模型会了,但还会瞎编的概率依然高达 15%-20%)。它会调动它学过的所有"看起来像答案"的碎片,组装一个语法完美、逻辑通顺、内容虚构的回答给你。
这就是幻觉的本质:形式 100 分,内容 0 分。
二、AI 为什么爱编:老城小巷的导游瞎指路

AI 爱编的底层原因,就像老城小巷里"半瓶水"的导游。
游客问:"老师傅,文庙怎么走?" 导游其实不太确定,他脑子里只记得"文庙好像在城西"。但他又不好意思说"我不知道",于是他自信地往东一指:"前面第二个路口左转,红色大门那个就是。"
其实他指的方向是对的——只是路不是去文庙的,是去城隍庙的。他自己都不知道自己说错了。
AI 也是这么运作的。它本质上是个"超级预测机"——给定上文,它预测下一个最合理的字是什么。当你问它一个它知识边界外的问题,它没有"知识库"可以查,它只能基于字与字之间的概率关系继续往下编。
说白了,AI 的脑子里没有"事实"这个文件夹,只有一个"接下来该说什么"的预测器。你问它,它就预测;预测不出来,它就编。
三、5 类最常见的幻觉:算命先生的套话

AI 幻觉的高发场景,就像算命先生的"万金油话术"。
算命先生最爱说:"你最近有小人作祟,但命里贵人相助。" 你听完觉得"哇好准",其实他说这话对任何人都成立。AI 的幻觉也有类似的"套路",我给你列 5 类最常见的:
1. 编造文献:你问"某某领域的研究进展",它给你列一堆看起来特别像论文标题的"《Nature》上某某某 2023 年的研究",实际上这篇论文根本不存在。这是学术圈被 AI 坑得最惨的一类。
2. 编造数字:你问"某公司去年营收多少",它给你一个精确到小数点的数字,比如"营收 127.3 亿元,同比增长 18.7%"。看起来特别专业,但这是它算出来的,不是查出来的。
3. 编造人物:你问"某某大学的某某教授观点",它给你一段引用,看起来像模像样。但这个教授可能压根没说过这话,甚至这个人都不存在。
4. 编造代码:让 AI 写一个调某个 API 的代码,它写得头头是道,但那个函数名是它瞎起的,真实 API 里根本没这个函数。这是程序员踩坑最频繁的一类。
5. 编造历史:你问"某某事件发生的具体日期",它给你一个日期,语气特别肯定,但其实这事根本没发生过,或者日期是错的。
老实说,这 5 类在 2026 年的主流大模型里依然普遍存在——OpenAI、Anthropic、Google 的官方论文都承认,即使是 GPT-4、Claude 3.5 这种顶级模型,幻觉率也在 3%-15% 之间。
四、3 招识破幻觉:审核员在文档上打红叉

识破幻觉的方法,就像出版社的审核员在稿子上打红叉。
审核员不会因为"这篇文章看起来写得挺顺"就放过,他必须一条一条对——这个人名真的存在吗?这个数据是不是真的?这个引用能不能查到出处?
AI 输出你也得这么审。我给你 3 招,立刻能用:
招数 1:让它"标出处" 你问完问题后,加一句:"请给你的回答标注信息来源,包括文献名/网址/数据出处。如果不确定,请明确说'我不确定'。" 这一招直接逼 AI 进入"承认无知"模式,幻觉率能降一半。
招数 2:反着问一遍 让 AI 回答完,你换个说法再问一次同样的问题。如果两个回答核心信息对不上(比如两个版本的人名/数字/日期不一样),那基本可以确定有一个是编的。
招数 3:交叉验证 AI 给你的关键信息(人名、数字、文献),自己去源头查一下——Google Scholar 搜论文,官方财报查数据,官网查人物介绍。多花 2 分钟,能避开 90% 的坑。
五、万能验证 prompt 模板:让 AI 自己审自己
最后一个绝招,就像让 AI 戴上"火眼金睛"自己审自己。
这个万能 prompt 你可以直接复制:
请按以下步骤回答我的问题:1. 先给出你的回答(尽量详细)2. 然后逐条检查你的回答,标出"可能不准确"的部分3. 对于每个关键数据/人物/文献,说明你的依据是什么4. 最后给一个"可信度评分"(0-10 分),并解释为什么说真的,这一招对付幻觉特别好使——AI 在第二步"自我审查"的时候,经常会自己把刚才编的内容标记出来。我自己在写这篇稿子的时候就用这一招审过好几次。
写在最后
AI 幻觉不是 bug,它是当前大模型的固有特性——本质上是"用预测换事实"的代价。2026 年的模型比 2023 年好很多,但离"完全不编"还差得远。
记住三句话:AI 给你的信息,默认是"看起来像真的",不是"真";关键信息必查源;让 AI 自我审查能救命。
下一篇(第 17 篇)我会讲怎么识破 AI 生成的假视频——比文字幻觉更危险,因为眼睛比脑子更容易被骗。想不被坑,关注我别错过。
夜雨聆风