为什么你的AI总在“一本正经地胡说八道”?来认识一下RAG-夜雨聆风

为什么你的AI总在“一本正经地胡说八道”?来认识一下RAG

上周，一个做餐饮创业的朋友跟我疯狂吐槽。他让ChatGPT帮忙写一份“适合二线城市、人均80元的日料店营销方案”，结果AI写得头头是道，连具体的折扣力度和小红书文案都编出来了。看着挺美，但他拿去落地时才发现，AI里引用的“最新行业数据”全是瞎编的。

这就是大模型圈子里大名鼎鼎的“幻觉”（Hallucination）。

你问它一本冷门小说里的配角叫什么，它大概率会给你极其自信地编一个名字。为什么？因为大模型本质上是一个“接话把子”，它靠海量语料训练出来的概率去猜下一个字应该是什么，而不是真的在翻阅一本字典。

那怎么治这个毛病呢？

最笨的办法是“重新训练”。把你们公司的内部资料全喂给它，重新教一遍。但这成本太高了，耗时耗力，而且你资料一更新，又得重头来过。

稍微聪明点的办法是“长文本”。现在很多大模型支持几十万字的上下文窗口，你直接把几十份PDF扔进去，让它“带着资料答题”。这办法能用，但一方面很费钱（输入的字数越多，API调用越贵），另一方面，当资料多到一定程度，大模型会“分心”，容易漏看关键信息。

直到RAG技术出来，事情才有了根本性的转机。

RAG，全称叫Retrieval-Augmented Generation，翻译过来是“检索增强生成”。名字听着挺唬人，其实说白了，就是允许大模型“开卷考试”。

你回想一下上学的时候。闭卷考试，你只能凭记忆答题，遇到记不清的地方，要么空着，要么瞎编——这就是现在纯大模型的处境。

那开卷考试呢？老师允许你带一整座图书馆进去，但你肯定没时间把所有书都翻一遍。所以你的策略一定是：先看题目，然后去图书馆里“检索”出最相关的几页书，把这几页书摊在桌上，最后根据这几页书的内容来组织答案。

RAG干的就是这件事。

具体是怎么操作的呢？我们可以把它拆解成四个动作：

第一步：把书拆成便利贴（切块 Chunking）

你不能指望AI去读一本1000页的书然后精准定位。你得先把公司的规章制度、产品手册切分成一小段一小段的。比如，把一本员工手册拆成几百个“便利贴”，每张上面只有一两百个字。

第二步：给便利贴贴上“气味标签”（向量化 Embedding）

这一步稍微有点技术门槛，但可以这么理解：文字本身是没法直接被搜索的，你得把文字变成一种“数字密码”。这个过程叫向量化。你可以把它想象成给每张便利贴喷上一种独特的气味。两段文字意思越接近，它们的“气味”就越像。AI就是靠闻气味来找东西的，而不是靠死记硬背关键词。

第三步：去图书馆找书（检索 Retrieval）

现在用户问了一个问题：“今年国庆节放假安排是什么？”

系统会把这个问题也变成一种“气味”，然后去仓库里闻。很快，它闻到了三张气味最匹配的便利贴。拿出来一看，一张写着国庆放假天数，一张写着调休安排，一张写着加班费标准。完美，不需要翻别的书了。

第四步：带着小抄写答案（生成 Generation）

系统把用户的原始问题，加上刚才找到的那三张“便利贴”，打包成一个 prompts（提示词），一股脑塞给大模型。

这时候大模型接到的指令就变成了：“请根据以下提供的资料，回答用户的问题。如果资料里没写，你就说不知道，绝对不许瞎编。”

你看，经过这么一轮折腾，大模型就从一个“爱吹牛的江湖术士”，变成了一个“严谨的图书管理员”。

你可能要问，费这么大劲搞个RAG，到底图啥？

最直接的好处是精准且省钱。你不需要花几百万去微调一个专属大模型，随便拿一个市面上开源的便宜模型，配上RAG，就能处理极其专业的领域问题。比如你们医院的内部问诊系统、律所的案例库检索，用RAG都是现成的解法。

其次是可溯源。以前AI给你个答案，你不知道它从哪学来的。现在有了RAG，AI可以明确告诉你：“根据《员工手册》第三章第二页的内容……”，甚至直接给你甩个原文链接。在企业级应用里，这种“知根知底”的安全感是无价的。

最后是好更新。公司出了新规定？很简单，把旧文档删掉，把新文档切一切、变成“气味”存进去就行了。大模型本身什么都不用改，立马就能掌握最新政策。

当然，RAG也不是万能药。它现在最大的痛点在于“找得准不准”。有时候用户问得比较含糊，或者文档切得乱七八糟，系统就会找错“便利贴”，导致大模型基于错误的资料给出了一个看似合理但其实跑偏的答案。这也就是现在很多搞RAG的工程师每天都在掉头发优化的地方—怎么切文档更合理，怎么检索更聪明。

但不管怎么说，RAG已经是目前把大模型拉下神坛、真正在千行百业里干脏活累活的最靠谱路径。

它让我们认清了一个现实：我们不需要一个全知全能的超级大脑，我们只需要一个会说话的搜索引擎，加上一个懂人情世故的总结员。RAG，正是把这俩拼在了一起。

– 往期回顾 –

国外主流AI编程助手哪家强

有了Claude Code还用国产？断网、合规这俩硬伤，逼我扒了几款国产平替