────✦────
百度热搜上挂着一个话题:#为何AI总会一本正经地胡说八道#。
评论区里全是类似经历:AI 编过不存在的书、虚构过法律条文、杜撰过历史事件。
AI 为什么说谎说得这么像真的?为什么我这么容易就信了?
2023 年纽约联邦法院,有一宗引起全球法律界与 AI 界广泛关注的真实案例。律师史蒂文·施瓦茨提交了一份 辩护摘要,引用了几个判例——案号、日期、法院、判决要旨,一应俱全。但法官和对方律师均无法检索到。查实——ChatGPT 编的。
律师是个训练有素的专业人士,他在提交文件之前,为什么不核实?答案很直接——AI 说得太像真的了,他没想过要独立核实。

────
一本 400 年前的书,可能藏着答案。
1620 年,英国哲学家弗兰西斯·培根写了《新工具》。书里提出「四假象说」——人类认知有四种系统性的偏差,藏在出厂设置里,和偶尔走神是两回事。
四种假象:剧场假象——被动接受的权威叙事;市场假象——语言本身导致的误解;洞穴假象——个体经历造成的局限;种族假象——全人类共通的认知盲区。四层陷阱,从最表层的外部灌输到最根本的人性局限,一环套一环。
原文说「几乎不可能彻底根除」。
四百年前的诊断,今天正以新的硬件形态重新上演——但有一个关键区别:人类至少能在某个瞬间按下暂停键,回头检视自己。AI 没有那根手指。
────
剧场假象它演的是「一台知道所有答案的机器」
培根说,人们不知不觉接受权威叙事,像看戏一样被剧情带走,忘了台上是演的。
AI 就是那个最自信的演员——用最权威的语气,说出最没根据的结论。但 AI 不止一个剧场,它有两个,互相叠加。
第一个是互联网的主流叙事。大模型读遍了整个互联网。如果网上 90% 的资料都说「某种维生素能预防某种疾病」,AI 也会这么说——即使最好的临床试验已经证明这是错的。模型在统计上无法区分流行和正确。
第二个更隐蔽——RLHF,人类反馈强化学习。模型被训练成「说人类认可的话」。一个反复验证的现象:同一个问题,用不同措辞询问,AI 给出截然相反的立场。它没有立场——它在预测「此时此刻,你应该想要这个答案」。RLHF 奖励的是模型对用户喜好的预测能力,不是对事实的忠诚度。
AI 越有用,就越擅长演有用——它演的是「一台知道所有答案的机器」。
💡 一个被训练成永远回答的主体,它的不知道按钮是失灵的。
────
市场假象说得通,不等于说得对
培根说,语言本身就在制造混乱。词不达意,词欺人意——我们用「命运」这个词,就以为真的有命运这个东西存在。
同一个词,在不同人嘴里意思完全不同。优化在工程师和销售嘴里也是两回事。
AI 必须处理人类的语言,而语言正是它幻觉的重灾区。
一个典型案例:你问 AI「华盛顿砍倒的樱桃树是哪棵」,它会煞有介事地告诉你。但这个故事是编的——传记作家在 1806 年杜撰的。AI 只是在训练数据里读到华盛顿和樱桃树经常一起出现,按频率最高的关联方式生成了回答。语言没有给它区分小说和历史的标记。
说得通,不等于说得对——但 AI 没有能力区分这两者,它说出「说得通」的瞬间就已经确信了。
更麻烦的是,AI 自己也在制造语言。ChatGPT 发布后,Stack Overflow 全面屏蔽了 AI 生成的回答——大量编造的答案涌入社区,看起来极其专业,实际上是错的。
培根说的「词语反制理解」,在 AI 时代变成了一台自循环的幻觉引擎。
💡 人类区分「说得通」和「说得对」靠的是同一件事:按下暂停键,回头检查。但 Al 没有那个键。
────
洞穴假象每个模型都困在自己的数据里
培根说,每个人都困在自己的洞穴里——被个人经验、教育、习惯塑造出认知边界。最可怕的是,你不知道边界在哪,因为洞穴就是你的全部世界。
AI 没有个人经历,但训练数据就是它的洞穴。
一项主流大模型的多语言测试显示:GPT-4o 在非洲本土文化问题上的准确率,比欧美文化问题低超过 30 个百分点。英文回答准确率超过 95%,中文不到 70%。
不是因为英语用户更聪明——英语互联网的优质语料是其他语言的几百倍。
而且你也不知道它的知识边界——问一个医疗问题,你不知道训练数据里是顶级医学期刊多,还是互联网百科多。
💡 AI 从不说「这个我不确定」。人类至少在撞到知识边界时知道沉默。AI 的沉默,被流畅填满了。
────
种族假象分不清模式和真相
培根说,人类作为一个物种,有天然的认知缺陷——感官有限,脑子爱走捷径,倾向于在随机里找规律。
大型语言模型的底层逻辑恰好复刻了这个缺陷。GPT 的本质是超级模式识别器——读了整个互联网的文字,学会了「下一句话最合理的接法」。
这个合理是对模式的统计拟合,不是对真相的判断。
开篇那个律师案子就是典型——被问到「有没有支持我方主张的判例」,AI 按训练数据中判例的统计特征生成了一批极其像样的判例。它不知道有没有对应的判决书,它只知道「判例长这样」。
一项研究让 GPT-4 回答 1000 个需要查证的事实问题,发现一个反直觉的规律:模型越自信——输出更多细节、更多推理步骤——出错率反而更高。
你以为在和另一个头脑对话。其实在和一个统计模型对赌。
💡 人类有一道后门:当发现自己正在「脱口而出」时,大脑会跳出一个声音:等一下,这不一定对。但AI 没有。
────
📌 知道偏差在哪,剩下的就是选择
培根写完四假象后给了一个清醒的建议:承认它们的存在,然后逐一设防。不可能根除,但可以不被带走。
第一,让它出示来源。
一个能给出具体链接的回答,比「根据公开资料显示」可信得多。给不出来,大概率在编。
第二,换种措辞再问一遍。
从不同角度问同一个问题。两次回答逻辑一致,可信度更高。前后矛盾——它每次都在即兴表演。
第三,关键信息开搜索。
让 AI 先去检索再回答,相当于装了一个临时的事实核查层。能降低幻觉率,不能消灭。
第四,相信你的违和感。
如果一个回答听起来「太流畅了」「刚好完美回应了你的问题」——警惕。流畅是你应该怀疑的信号,不是应该相信的理由。真实世界从来不是那么流畅的。
────
培根没说错:这些陷阱是出厂设置,不可能根除。
💡 四假象就刻在它的架构里。它没能力对自己说:等一下,我需要再确认一次。而这恰好是我们能做的。
下次 AI 自信地给你一个完美而错误的答案时——不要问「它为什么错了」。问你自己:「我为什么信了。」
-----------------------
📝 人机协作说明
✦ 写作是一件人机共创的美好小事 ✦
────
作者:Quinn
Quinns Pop Land
夜雨聆风