RAG 和知识库:让 AI 先查资料再回答

“阅读本文大概需要 4.8 分钟。

很多人第一次把文件上传给 AI，会有一个期待：

资料都给你了，这下总该准确了吧？

结果用着用着，还是会发现问题。

它有时候能引用材料里的内容。

有时候又像没看见。

还有时候，它把材料里没有的东西说得很像真的。

这时候很多人会困惑：

我不是已经上传资料了吗？为什么 AI 还会乱答？

要理解这件事，就要先区分两种用法。

一种是让 AI 直接根据自己的已有能力回答。

另一种是让 AI 先查你给它的资料，再基于资料回答。

后面这种，就是我们常听到的 RAG。

RAG 是英文 Retrieval-Augmented Generation 的缩写。

不用被这个词吓住。

你可以先把它理解成：

让 AI 回答前，先去资料库里找相关内容。

这件事听起来很普通，但很关键。

因为大模型本身不是一本实时更新的资料库。

它训练时看过很多内容，所以能回答很多问题。

但它不会天然知道你公司上周刚发的制度。

也不会天然知道你自己写在 Obsidian 里的笔记。

更不会自动知道你电脑里那一堆 PDF、Word、表格和会议纪要。

除非你把这些材料放到它当前能看到的地方。

或者给它接上一个可以检索资料的知识库。

知识库是什么？

可以先简单理解成：一批被整理好、可以被 AI 查询的资料。

它可以是公司的制度文件。

可以是一个产品说明文档。

可以是客服常见问题。

可以是你自己的读书笔记、公众号选题库、项目复盘。

也可以是一个很小的文件夹。

不是说一提知识库，就一定是一个很复杂的系统。

对普通人来说，知识库最朴素的价值是：

让 AI 回答时，不只靠它自己猜，而是先看你指定的资料。

举个例子。

你问 AI：

“我们公司请假制度是什么？”

如果你没有给它制度文件，它只能按一般经验回答。

它可能会说年假、病假、事假怎么申请。

听起来挺像那么回事。

但这不一定是你们公司的规定。

如果你把公司制度文档放进知识库，再问同样的问题，理想情况下，AI 会先检索到相关条款，再根据条款整理回答。

这就比凭空回答可靠得多。

这也是 RAG 的基本流程。

先检索。

再生成。

检索，是从资料里找出和问题最相关的内容。

生成，是大模型把找到的内容组织成一段人能读懂的回答。

这两个动作连起来，AI 就不再只是“凭印象说话”。

它有了一个先翻资料的步骤。

但这里也要压住一个误解。

RAG 不是万能防错器。

用了知识库，不等于 AI 就一定不会胡说。

原因很简单。

如果资料本身是错的，它会基于错误资料回答。

如果资料没有被检索出来，它可能还是会靠模型自己补。

如果你的问题太含糊，它可能找错材料。

如果知识库里有一堆重复、过期、互相冲突的文件，它也会被干扰。

所以知识库真正难的地方，不只是“把文件上传进去”。

而是资料要整理。

文件名要清楚。

版本要控制。

过期内容要删除。

重要材料要放在容易被找到的位置。

这些听起来不像 AI 技术，更像日常整理。

但很多 RAG 项目效果不好，问题恰恰出在这里。

大家把一堆材料丢进去，以为 AI 自己会懂。

结果它确实查了。

但查到的是旧版本、附件、会议纪要里的一句话，或者一段没有上下文的说明。

最后回答自然就不稳。

这就像让一个新人帮你查资料。

你把十个文件夹扔给他，不告诉他哪个是最新版本，也不告诉他哪些已经作废。

他查错，不一定是态度问题。

是资料现场本来就乱。

RAG 里还有一个词，叫 Embedding。

这个词也很容易让人退缩。

可以先不用记英文。

你只要知道，它大概是在做一件事：

把文字变成一组数字，让电脑判断“意思接近不接近”。

人找资料，可能会看关键词。

比如你搜“请假”，就希望找到“年假”“病假”“事假”相关内容。

但现实里，很多表达不是同一个词。

你问“员工休假怎么审批”，文件里可能写的是“假期申请流程”。

字面上不完全一样，但意思接近。

Embedding 的作用，就是帮助系统做这种语义上的匹配。

它不是只看有没有同一个关键词。

而是尽量判断两段话在意思上是不是相关。

所以你问一个问题，知识库系统会先把问题变成向量，再去找资料里向量接近的片段。

找到之后，再把这些片段交给大模型。

大模型再根据这些片段回答你。

对新手来说，不需要一开始就学会搭建完整 RAG 系统。

先理解它解决的是什么问题就够了。

它解决的不是“让 AI 变成神”。

而是让 AI 在回答某些问题时，有机会先看一眼你指定的资料。

比如：

你要让 AI 回答公司制度。

你要让 AI 整理项目历史。

你要让 AI 基于自己的笔记写文章。

你要让 AI 做客服知识问答。

你要让 AI 分析一批合同或产品文档。

这些场景，都比单纯聊天更适合用知识库。

但你也要给它明确要求。

不要只说：

“基于知识库回答。”

可以说：

“请只基于我提供的资料回答。如果资料里没有依据，请直接说资料中没有看到，不要自行推测。”

这句话很重要。

因为它给 AI 设了一个边界。

边界越清楚，幻觉越容易被压住。

所谓 AI 幻觉，就是它把不确定的东西说得很确定。

它可能编一个来源。

编一个条款。

编一个不存在的结论。

听起来很顺，但经不起核对。

RAG 能减少这种情况，但不能完全消灭它。

你仍然要看它有没有引用依据。

你仍然要检查关键事实。

你仍然要判断材料是不是最新、完整、可靠。

尤其是涉及制度、法律、合同、财务、医疗、投资这些场景，更不能只看 AI 的最终答案。

要回到原文。

看证据在哪。

看它引用的是哪一段。

看有没有断章取义。

所以，知识库不是让人不用判断。

它只是把判断的入口从“AI 自己说了什么”，往前推到“它依据了哪些资料”。

这个变化很重要。

没有资料时，AI 更像是在凭已有能力回答。

有了 RAG，它至少可以先查资料，再组织回答。

但最后决定能不能用的，还是资料质量、检索质量，以及你有没有要求它基于证据说话。

对普通人来说，可以先记住一个很实用的用法：

当你希望 AI 回答一个和你自己的资料有关的问题时，不要只问它。

先把资料给它。

再告诉它：

只基于资料回答。

找不到就说找不到。

重要结论要指出依据。

这三句话，比很多复杂概念都管用。

记住一句话：

RAG 不是让 AI 什么都知道，而是让 AI 回答前先查资料。资料越清楚，边界越明确，回答才越可靠。