最近几个月的AI大模型独立应用实践-3-大模型解决不了一切

做对的事情比把事情作对更重要

今天我们来简单聊一个话题——那就是，大模型不能解决一切问题。

这篇文章，我们分三个方面来论证一下，为什么大模型不能解决一切问题。

首先我们将从目前阶段大模型的底层原理来讨论一下。

然后我们从信息的衰减来讨论一下。

最后从人这个角度来讨论一下。

一、目前阶段大模型的底层原理

目前大语言模型的核心原理就是概率学（更准确地说，是一个超大规模的条件概率模型），大模型（如GPT、Claude、Gemini、deepseek、千问等）本质上都在做同一件事

给定一段上文，预测下一个词（token）的概率分布，然后从这个分布中采样出一个词，把它拼到上文里，再预测下一个词……如此循环，生成整段回复。

模型说“太阳从东边升起”时，并不是它“知道”这个天文事实，而是因为在海量文本里，“太阳”和“东边”共现的概率远高于“西边”。整个智能表现，都建立在词语层面的概率关系上。

概率模型产生幻觉的根源有几层：

1、概率高 ≠ 事实正确

模型在训练数据里见过无数“哥伦布发现了美洲大陆”，也见过极少量恶搞或错误文本里写“哥伦布发现了印度”。模型最大化的是“语言上的合理性”，而不是事实准确性。在某些上下文中，一个完全错误但语法通顺的句子概率并不低。

2、知识被压缩成统计印象，没有“真值校验器”

模型内部没有一个事实数据库，也没有一个“这是真的/假的”二值判断模块。所有知识都被压缩在百亿、千亿的参数里，呈现为模糊的关联强度。当你问一个冷门知识，它可能把几个相似但错误的记忆“揉”成一个很像真的答案。

3、长尾知识的概率被稀释

高频事实（比如地球是圆的）概率极高，很难出错。但对于长尾、小众、需要精确匹配的信息（比如某冷门法规的第三款第二条），正确组合的概率可能并不比一个“看上去对”的错误组合高，模型就容易瞎编。

4、采样机制本身允许“走偏”

生成时为了保持多样性和创造性，模型会从概率分布里做随机采样，而不是永远选概率最高的那个词。这就像你写文章时偶尔会冒出一个“异想天开”的词，这个“异想天开”有时就滑向幻觉。

所以从根源上看，幻觉是概率语言模型与生俱来的“影子”，不可能彻底消灭，因为模型的底层目标就不是“求真”，而是“拟合语言的概率分布”。

当然，我们可以通过一些工程手段来吧幻觉概率降低：

检索增强生成（RAG）：不让模型仅凭自己的“参数记忆”回答，而是先从一个外部知识库（文档、数据库）检索出相关事实片段，然后让模型基于这些可溯源的材料来组织语言。这样就把“事实来源”外挂了，模型的概率只是负责把事实串成通顺的话。

用工具和代码验证：涉及计算、查询精确信息时，让模型调用计算器、搜索引擎、API，而不是凭概率“编”结果。比如“帮我算一下19234.5 ÷ 17”，模型直接写代码执行，而不是预测数字。

强化学习与人类反馈 & 事实性对齐：在训练阶段，刻意惩罚那些“听起来像真的但实际错误”的答案，奖励模型说“我不知道”。这样可以微调模型的概率分布，让它更倾向于承认不确定性，而不是强行生成一个概率尚可的错答案。

思维链与自我校验：让模型在内部多步推理，并在生成后自我检查是否有矛盾、违反常识，这种多步过程可以修正部分低级的幻觉。

如果我们要求的是 “在任何开放域问题上，零幻觉” ，那答案是：只要还是纯概率自回归模型，就做不到。

二、信息始终存在衰减

我之前在一篇文章中有讨论过一个点，那就是真实世界的所有信息量如果是100的话，那么我们人类目前所有从真实世界中获取的信息是60左右（甚至更少），然后我们提供给大模型进行训练的知识可能只有30-40左右。

也就是我们人类都不能完全完整的认识这个世界，而且万事万物在不断变化，我们人类收集、整理获取的信息始终有限。以这个有限的信息去训练模型，那么这个模型必然也会受到限制。

更不要说，人类的信息中会存在很多垃圾信息，错误信息，非一手信息。比如说我们常说的商业信息，如果不是亲临一线，获取一手资料，只是从网络上扒信息，那么这些信息的价值又有几何呢？

我们策划各种商业项目的时候，整个方案从逻辑上是完全闭环的，为什么项目一旦进入实际商业社会运行的时候，就显得牛头不对马嘴呢。这就是因为我们拿的信息没有真实的反应实际情况，或者拿到的信息不全面。

三、人

即便我们拿到了最全面的信息，我们人也会从过往形成的价值观、主观偏好上来解读拿到的信息。

模型本身也是被训练出了价值观或者其他的偏向性，那么如何保证模型不会对信息进行曲解呢？

这些大模型公司背后团队的价值观和偏向性就一定客观公正吗？

使用大模型的人，他的价值观和主观偏好又该怎么规避呢？

我们也知道，信息在传统企业中是非常重要的，有很多人在传递信息到其他团队和下级的时候，可以隐瞒部分信息，来形成权力垄断。这种情况充斥着大大小小，传统或者现代的行业和公司，那这种情况我们凭什么会认为在有了大模型之后就不会存在呢？

各种之前就存在的灰色部分，难道就不会存在了吗？

我不会这样认为，只要有人存在，人与人之间存在博弈和竞争，那么就必然会有对信息的控制，必然有很多灰色部分存在。这些部分，大模型是无力解决的。

所以，综上所属，我不认为大模型能够解决一切问题。

下一篇文章，我们会聊聊，从我自己的实践和与其他人沟通，在目前阶段，大模型适合解决哪些问题和不能解决哪些问题。