做对的事情比把事情作对更重要
目前大语言模型的核心原理就是概率学(更准确地说,是一个超大规模的条件概率模型),大模型(如GPT、Claude、Gemini、deepseek、千问等)本质上都在做同一件事
给定一段上文,预测下一个词(token)的概率分布,然后从这个分布中采样出一个词,把它拼到上文里,再预测下一个词……如此循环,生成整段回复。
模型说“太阳从东边升起”时,并不是它“知道”这个天文事实,而是因为在海量文本里,“太阳”和“东边”共现的概率远高于“西边”。整个智能表现,都建立在词语层面的概率关系上。
概率模型产生幻觉的根源有几层:
1、概率高 ≠ 事实正确
模型在训练数据里见过无数“哥伦布发现了美洲大陆”,也见过极少量恶搞或错误文本里写“哥伦布发现了印度”。模型最大化的是“语言上的合理性”,而不是事实准确性。在某些上下文中,一个完全错误但语法通顺的句子概率并不低。
2、知识被压缩成统计印象,没有“真值校验器”
模型内部没有一个事实数据库,也没有一个“这是真的/假的”二值判断模块。所有知识都被压缩在百亿、千亿的参数里,呈现为模糊的关联强度。当你问一个冷门知识,它可能把几个相似但错误的记忆“揉”成一个很像真的答案。
3、长尾知识的概率被稀释
高频事实(比如地球是圆的)概率极高,很难出错。但对于长尾、小众、需要精确匹配的信息(比如某冷门法规的第三款第二条),正确组合的概率可能并不比一个“看上去对”的错误组合高,模型就容易瞎编。
4、采样机制本身允许“走偏”
生成时为了保持多样性和创造性,模型会从概率分布里做随机采样,而不是永远选概率最高的那个词。这就像你写文章时偶尔会冒出一个“异想天开”的词,这个“异想天开”有时就滑向幻觉。
所以从根源上看,幻觉是概率语言模型与生俱来的“影子”,不可能彻底消灭,因为模型的底层目标就不是“求真”,而是“拟合语言的概率分布”。
检索增强生成(RAG):不让模型仅凭自己的“参数记忆”回答,而是先从一个外部知识库(文档、数据库)检索出相关事实片段,然后让模型基于这些可溯源的材料来组织语言。这样就把“事实来源”外挂了,模型的概率只是负责把事实串成通顺的话。
用工具和代码验证:涉及计算、查询精确信息时,让模型调用计算器、搜索引擎、API,而不是凭概率“编”结果。比如“帮我算一下19234.5 ÷ 17”,模型直接写代码执行,而不是预测数字。
强化学习与人类反馈 & 事实性对齐:在训练阶段,刻意惩罚那些“听起来像真的但实际错误”的答案,奖励模型说“我不知道”。这样可以微调模型的概率分布,让它更倾向于承认不确定性,而不是强行生成一个概率尚可的错答案。
思维链与自我校验:让模型在内部多步推理,并在生成后自我检查是否有矛盾、违反常识,这种多步过程可以修正部分低级的幻觉。
如果我们要求的是 “在任何开放域问题上,零幻觉” ,那答案是:只要还是纯概率自回归模型,就做不到。
夜雨聆风