不懂这6点RAG优化逻辑,只能做“文档搬运工”

-
减少胡说八道(幻觉):AI不再编造信息,而是有据可依。 -
使用最新/内部资料:你的AI能回答关于你公司产品、最新政策等专有信息的问题。 -
提高准确性和可信度:答案更可靠,用户更信任。
-
代词指代与意图识别:比如用户问“它多少钱?”,要联系上下文明白它指代的是具体哪款型号产品。 -
增加共识词/问题升维降温:用户问“手机卡怎么办?”需要系统判断:是想办理新卡?(升维,加动作)还是手机卡顿?(降温,具体环节)。手机型号是否能确定(共识词)。 -
工具改写查询:给用户问题换一个更专业的说法,或者拆解成几个小问题。
-
文档精细化:把复杂的PDF、word、PPT统一转化成Markdown格式。 -
图片/表格专项处理:产品经理需要关注是否引入了专门解析表格和图片的工具,让AI能够“看懂”图片/表格。 -
分段精细化:不要把资料一次性喂给AI,更应该按照语义切分。切的太碎AI看不懂上下文,切的太大AI抓不住重点,并且建议保留一部分的重叠内容,防止信息断裂。 -
补充关键词和问答:主动为段落打上用户可能问到的“关键词/标签”,预先设想一些Q&A。相当于为知识库建立更丰富的“索引”,极大提升检索命中率。
-
关键词检索:必须字面完全匹配,适用于像“iPhone、SKU1212”一些专有名词,对应的地方。 -
语义检索:利用向量数据库,把用户问题中没有的关键词,找到很相近的词。比如“电脑开机没反应”,找到“黑屏、无法启动”等。 -
关键词+语义:分别先用两种方式找,再把结果合并,既保证不会漏掉专有名词,也能理解口语表达。
-
重排序:引入更精细的模型,把初次检索的资料重新打分排序,最相关的3条挑出来再喂给AI。 -
阀值调整:高阈值,只有非常确定的资料才录用,适合严谨的场景(如法律、医疗)。低阈值,沾点边的都录用,适合创意写作或闲聊,保障内容丰富。
-
兜底优化: -
未召回答案时,设计好拒绝话术。告诉AI资料里没有,就说不知道,千万不要自己编。 -
答案冗余时,告诉AI:“请总结核心观点,不要长篇大论” -
包含图片时,确认是否接入图片模型,并引导AI“参考图片中的数据进行回答。”

-
定义场景与需求:用户会怎么问?需要多准?多快? -
设计知识库构建标准:文档怎么处理?按什么规则切分? -
权衡检索策略与阈值:如何平衡速度与精度? -
设计提示词与交互:如何让答案更友好、更可信?(如注明来源) -
关注成本与效果:知识库更新维护成本、大模型调用成本,以及最终的答案准确率。

夜雨聆风