为何AI总是一本正经地胡说八道—

为何AI总是一本正经地胡说八道——答案在 1620 年

────✦────

百度热搜上挂着一个话题：#为何AI总会一本正经地胡说八道#。

评论区里全是类似经历：AI 编过不存在的书、虚构过法律条文、杜撰过历史事件。

AI 为什么说谎说得这么像真的？为什么我这么容易就信了？

2023 年纽约联邦法院，有一宗引起全球法律界与 AI 界广泛关注的真实案例。律师史蒂文·施瓦茨提交了一份辩护摘要，引用了几个判例——案号、日期、法院、判决要旨，一应俱全。但法官和对方律师均无法检索到。查实——ChatGPT 编的。

律师是个训练有素的专业人士，他在提交文件之前，为什么不核实？答案很直接——AI 说得太像真的了，他没想过要独立核实。

────

一本 400 年前的书，可能藏着答案。

1620 年，英国哲学家弗兰西斯·培根写了《新工具》。书里提出「四假象说」——人类认知有四种系统性的偏差，藏在出厂设置里，和偶尔走神是两回事。

四种假象：剧场假象——被动接受的权威叙事；市场假象——语言本身导致的误解；洞穴假象——个体经历造成的局限；种族假象——全人类共通的认知盲区。四层陷阱，从最表层的外部灌输到最根本的人性局限，一环套一环。

原文说「几乎不可能彻底根除」。

四百年前的诊断，今天正以新的硬件形态重新上演——但有一个关键区别：人类至少能在某个瞬间按下暂停键，回头检视自己。AI 没有那根手指。

培根四假象	四百年前的含义	AI 时代的对应
剧场假象	盲从包装精美的权威叙事	流畅的语言本身就是最华丽的剧场
市场假象	语言本身制造混乱	AI 只理解词语共现关系，不理解真实世界
洞穴假象	个体经验的认知边界	训练数据的分布决定了 AI 的"世界"边界
种族假象	人类认知的天生缺陷	AI 是超级模式识别器，分不清模式和真相

────

剧场假象它演的是「一台知道所有答案的机器」

培根说，人们不知不觉接受权威叙事，像看戏一样被剧情带走，忘了台上是演的。

AI 就是那个最自信的演员——用最权威的语气，说出最没根据的结论。但 AI 不止一个剧场，它有两个，互相叠加。

第一个是互联网的主流叙事。大模型读遍了整个互联网。如果网上 90% 的资料都说「某种维生素能预防某种疾病」，AI 也会这么说——即使最好的临床试验已经证明这是错的。模型在统计上无法区分流行和正确。

第二个更隐蔽——RLHF，人类反馈强化学习。模型被训练成「说人类认可的话」。一个反复验证的现象：同一个问题，用不同措辞询问，AI 给出截然相反的立场。它没有立场——它在预测「此时此刻，你应该想要这个答案」。RLHF 奖励的是模型对用户喜好的预测能力，不是对事实的忠诚度。

AI 越有用，就越擅长演有用——它演的是「一台知道所有答案的机器」。

💡 一个被训练成永远回答的主体，它的不知道按钮是失灵的。

────

市场假象说得通，不等于说得对

培根说，语言本身就在制造混乱。词不达意，词欺人意——我们用「命运」这个词，就以为真的有命运这个东西存在。

同一个词，在不同人嘴里意思完全不同。优化在工程师和销售嘴里也是两回事。

AI 必须处理人类的语言，而语言正是它幻觉的重灾区。

一个典型案例：你问 AI「华盛顿砍倒的樱桃树是哪棵」，它会煞有介事地告诉你。但这个故事是编的——传记作家在 1806 年杜撰的。AI 只是在训练数据里读到华盛顿和樱桃树经常一起出现，按频率最高的关联方式生成了回答。语言没有给它区分小说和历史的标记。

说得通，不等于说得对——但 AI 没有能力区分这两者，它说出「说得通」的瞬间就已经确信了。

更麻烦的是，AI 自己也在制造语言。ChatGPT 发布后，Stack Overflow 全面屏蔽了 AI 生成的回答——大量编造的答案涌入社区，看起来极其专业，实际上是错的。

培根说的「词语反制理解」，在 AI 时代变成了一台自循环的幻觉引擎。

💡 人类区分「说得通」和「说得对」靠的是同一件事：按下暂停键，回头检查。但 Al 没有那个键。

────

洞穴假象每个模型都困在自己的数据里

培根说，每个人都困在自己的洞穴里——被个人经验、教育、习惯塑造出认知边界。最可怕的是，你不知道边界在哪，因为洞穴就是你的全部世界。

AI 没有个人经历，但训练数据就是它的洞穴。

一项主流大模型的多语言测试显示：GPT-4o 在非洲本土文化问题上的准确率，比欧美文化问题低超过 30 个百分点。英文回答准确率超过 95%，中文不到 70%。

不是因为英语用户更聪明——英语互联网的优质语料是其他语言的几百倍。

而且你也不知道它的知识边界——问一个医疗问题，你不知道训练数据里是顶级医学期刊多，还是互联网百科多。

💡 AI 从不说「这个我不确定」。人类至少在撞到知识边界时知道沉默。AI 的沉默，被流畅填满了。

────

种族假象分不清模式和真相

培根说，人类作为一个物种，有天然的认知缺陷——感官有限，脑子爱走捷径，倾向于在随机里找规律。

大型语言模型的底层逻辑恰好复刻了这个缺陷。GPT 的本质是超级模式识别器——读了整个互联网的文字，学会了「下一句话最合理的接法」。

这个合理是对模式的统计拟合，不是对真相的判断。

开篇那个律师案子就是典型——被问到「有没有支持我方主张的判例」，AI 按训练数据中判例的统计特征生成了一批极其像样的判例。它不知道有没有对应的判决书，它只知道「判例长这样」。

一项研究让 GPT-4 回答 1000 个需要查证的事实问题，发现一个反直觉的规律：模型越自信——输出更多细节、更多推理步骤——出错率反而更高。

你以为在和另一个头脑对话。其实在和一个统计模型对赌。

💡 人类有一道后门：当发现自己正在「脱口而出」时，大脑会跳出一个声音：等一下，这不一定对。但AI 没有。

────

📌 知道偏差在哪，剩下的就是选择

培根写完四假象后给了一个清醒的建议：承认它们的存在，然后逐一设防。不可能根除，但可以不被带走。

第一，让它出示来源。

一个能给出具体链接的回答，比「根据公开资料显示」可信得多。给不出来，大概率在编。

第二，换种措辞再问一遍。

从不同角度问同一个问题。两次回答逻辑一致，可信度更高。前后矛盾——它每次都在即兴表演。

第三，关键信息开搜索。

让 AI 先去检索再回答，相当于装了一个临时的事实核查层。能降低幻觉率，不能消灭。

第四，相信你的违和感。

如果一个回答听起来「太流畅了」「刚好完美回应了你的问题」——警惕。流畅是你应该怀疑的信号，不是应该相信的理由。真实世界从来不是那么流畅的。

────

培根没说错：这些陷阱是出厂设置，不可能根除。

💡 四假象就刻在它的架构里。它没能力对自己说：等一下，我需要再确认一次。而这恰好是我们能做的。

下次 AI 自信地给你一个完美而错误的答案时——不要问「它为什么错了」。问你自己：「我为什么信了。」

-----------------------

📝 人机协作说明

维度	人类	AI
核心创意	100%	—
内容撰写	60%	40%
结构调整	70%	30%
排版格式	10%	90%

✦ 写作是一件人机共创的美好小事 ✦

────

作者：Quinn

Quinns Pop Land

#AI幻觉#培根四假象#认知偏误#AI素养