乐于分享
好东西不私藏

不懂这6点RAG优化逻辑,只能做“文档搬运工”

不懂这6点RAG优化逻辑,只能做“文档搬运工”

你有没有遇到过这种情况:问公司的AI助手“怎么报销差旅费”,它却给你回了一段“公司成立于2010年”的废话?或者问最新的促销政策,它还在引用去年的旧闻?
这就是大模型的“幻觉”和“知识截止”。
怎么治?答案就是今天的主角——RAG(检索增强生成)。如果说大模型是“大脑”,RAG就是给它配了一本随时可查的“百科全书”。
作为AI产品经理,我们要做的,就是把这个“开卷考试”的辅助系统做到极致。
把RAG系统想象成一个拥有“超级外脑”的智能问答工厂。它的核心目标就是让大模型(LLM)的答案更准、更新、更可信。
开卷考试 & 智能问答工厂
大模型是一个知识渊博但记忆有时模糊、知识可能过时的“学霸”。RAG就是让这个学霸在每次答题前,可以快速查阅你为他准备的、最新的、可靠的“参考资料”(即知识库)。
整个流程就像一座工厂:用户问题(原材料)→ 检索系统(从仓库精准抓取原料)→ 大模型(大厨加工)→ 精准答案(成品)
为什么RAG重要?
  • 减少胡说八道(幻觉):AI不再编造信息,而是有据可依。
  • 使用最新/内部资料:你的AI能回答关于你公司产品、最新政策等专有信息的问题。
  • 提高准确性和可信度:答案更可靠,用户更信任。
如何优化RAG?
我们把RAG当做“一个正在参加开卷考试的超级学霸”,我们作为教练预先为它做一些预防工作。
1.查询优化:把“模糊提问”变成“精准指令”
用户的提问往往是口语化的、模糊或者有歧义的。他们可能说“那个怎么弄?”(指代不明),或者“我想报故障”(意图太泛)。
这一步就像是“考前审题”,在去书架翻书前,先帮学霸把问题理清楚。
  • 代词指代与意图识别:比如用户问“它多少钱?”,要联系上下文明白它指代的是具体哪款型号产品。
  • 增加共识词/问题升维降温:用户问“手机卡怎么办?”需要系统判断:是想办理新卡?(升维,加动作)还是手机卡顿?(降温,具体环节)。手机型号是否能确定(共识词)。
  • 工具改写查询:给用户问题换一个更专业的说法,或者拆解成几个小问题。
2.知识库:打造高质量的“参考资料库”
企业文档通常既有word、PPT、也有图片、表格,如果直接把这些丢给AI,那么对AI而言就是“垃圾进,垃圾出”,不能准确识别资料信息,也就给不出好答案。
  • 文档精细化:把复杂的PDF、word、PPT统一转化成Markdown格式。
  • 图片/表格专项处理:产品经理需要关注是否引入了专门解析表格和图片的工具,让AI能够“看懂”图片/表格。
  • 分段精细化:不要把资料一次性喂给AI,更应该按照语义切分。切的太碎AI看不懂上下文,切的太大AI抓不住重点,并且建议保留一部分的重叠内容,防止信息断裂。
  • 补充关键词和问答:主动为段落打上用户可能问到的“关键词/标签”,预先设想一些Q&A。相当于为知识库建立更丰富的“索引”,极大提升检索命中率。
3.检索:双管齐下的“找书策略”
  • 关键词检索:必须字面完全匹配,适用于像“iPhone、SKU1212”一些专有名词,对应的地方。
  • 语义检索:利用向量数据库,把用户问题中没有的关键词,找到很相近的词。比如“电脑开机没反应”,找到“黑屏、无法启动”等。
  • 关键词+语义:分别先用两种方式找,再把结果合并,既保证不会漏掉专有名词,也能理解口语表达。
4.资料:从“大海捞针”到“优中选优”
上一步检索回来的资料有可能只有10%有用,剩下的90%都是无用的,如果全都喂给AI,可能会造成混淆。而这一步是在对资料进行筛选。
  • 重排序:引入更精细的模型,把初次检索的资料重新打分排序,最相关的3条挑出来再喂给AI。
  • 阀值调整:高阈值,只有非常确定的资料才录用,适合严谨的场景(如法律、医疗)。低阈值,沾点边的都录用,适合创意写作或闲聊,保障内容丰富。
5.拼接词提示:给AI的答题规范
资料提供给AI了,怎么能让AI照着说?或者资料没找到,怎么让AI别瞎编?这一步就是限制学霸答题能力了。
  • 兜底优化:
    • 未召回答案时,设计好拒绝话术。告诉AI资料里没有,就说不知道,千万不要自己编。
    • 答案冗余时,告诉AI:“请总结核心观点,不要长篇大论”
    • 包含图片时,确认是否接入图片模型,并引导AI“参考图片中的数据进行回答。”
设计AI系统指令的时候,要确保AI的风格符合公司定位,是严肃的、幽默的、可爱的?
6.调用大模型:“微调”不是万能的
大模型是“加工者”,不是“记忆者”:RAG的核心思想就是不让大模型去死记硬背所有知识(成本高、难更新),而是让它专注于自己最擅长的理解、推理和语言组织。
绝大多数企业应用,靠优质的知识库+好的提示词就能解决问题。只有当模型连“怎么说话”、“怎么按特定格式输出”都学不会时,才考虑微调。而不是为了几个细节、几处文档就去微调模型,费时费钱。
作为AI产品经理,你不需要深究向量数据库的算法,但必须深刻理解RAG这个完整链条。你的核心价值在于:
  1. 定义场景与需求:用户会怎么问?需要多准?多快?
  2. 设计知识库构建标准:文档怎么处理?按什么规则切分?
  3. 权衡检索策略与阈值:如何平衡速度与精度?
  4. 设计提示词与交互:如何让答案更友好、更可信?(如注明来源)
  5. 关注成本与效果:知识库更新维护成本、大模型调用成本,以及最终的答案准确率。

感谢你看到这里,点个关注,人生自由路上我们一起努力!
the end