灵智问答助手2.0: 从"搜文档"到"懂思考"的实践优化

01
企业级应用的挑战
在RAG(检索增强生成)技术逐步普及的今天,企业级应用的需求已经从简单的”搜文档, 给答案”,转向更高的要求:系统能否理解复杂逻辑?能否在海量信息中提取关键内容?能否像专家一样思考与规划?
来看一个实际场景
灵犀实验室
“请对比分析一下A产品和B产品的保修政策,并说明它们在延长保修方面的差异。”
传统 RAG 系统处理这类问题时的典型流程:
-
拿着整句去向量库搜索 → 结果关键词稀疏,召回的都是A产品介绍或B产品广告
-
把50篇文档一股脑扔给 LLM → 上下文过长,模型”Lost in the Middle”
-
LLM 开始”幻觉式”回答 → 引用的文档里根本没有这些内容
为了应对这些问题,灵智问答助手2.0的优化版本中,在保留多路召回和知识图谱能力的基础上,引入了更灵活的问题处理机制和智能去噪能力。
02
数据处理:
从文档到可检索的知识
检索系统的效果,很大程度上取决于数据处理的质量。灵智对话助手2.0在数据源头构建了较为完整的处理流程。
#1

全模态智能解析
企业中的知识存在于各种格式中,让它们”可见”是第一步。

#2

深度结构化处理

#3

多维索引体系
单一索引难以应对所有查询场景。
灵智问答助手2.0构建了多路索引体系:

03
问题规划:
智能拆解与执行策略
这是灵智问答助手2.0另一个优化点——引入问题规划机制,让系统能够更好地理解用户的真实意图。
#1

复杂问题的智能拆解
企业中的知识存在于各种格式中,让它们”可见”是第一步。

#2

智能路由与执行策略

#3

按需分支策略


04
多路召回:
立体化的信息感知
灵智问答助手2.0保留了多路并行召回能力,能够从不同角度感知信息。

知识图谱检索
传统检索:只能找到”加缪”相关的文档,但不知道”加缪”和”阿尔及利亚”的关系
知识图谱:能理解实体间的关系,回答”A公司的子公司有哪些”、”B项目的负责人是谁”这类复杂问题
05
智能去噪:
提升信息质量
召回大量文档后,如何提取真正有价值的内容?灵智问答助手2.0引入了智能去噪机制。

结构化的理解能力
场景:用户问”查一下最近的人事任免”
传统系统:搜索关键词”人事任免” → 匹配到所有包含这4个字的文档
灵智问答助手2.0:提取结构化字段{主题:人事任免, 时间范围:最近} → 直接锁定公文主题,提升检索精准度
06
精准引用:
避免“幻觉引用”
RAG系统的一个常见问题是:系统展示了很多参考文献,但回答里的内容在这些文档中找不到。

07
技术栈概览

结语
灵智问答助手2.0是在原有1.0版基础上的迭代优化与增强,通过引入更灵活的问题规划能力和深度语义理解,我们构建了一个包含”感知→规划→行动→反思“的处理闭环。
这些改进让系统能够:更好地理解复杂问题、更精准地召回相关信息、更智能地过滤噪音内容、更可靠地呈现引用来源。
当然,RAG优化无止尽,本文介绍的内容只是这个持续优化过程中的一环,我们相信通过不断的迭代与改进,能够为用户的知识管理提供更好的支持。
光典灵犀实验室
始终坚持求真、务实、专注,我们相信,技术进步会推动整个行业的共同进步。
关于光典
光典,信息发展旗下企业,是一家以“数字中国”发展战略为指引,运用北斗、区块链、大数据、人工智能等技术,聚焦智慧档案、智慧政务等行业,面向政府和企业提供行业综合解决方案的服务运营商。

客服电话
400-720-0100
邮箱
aes@cesgroup.com.c
400-720-0100
智慧档案 智慧政务
往期·推荐

光典灵犀实验室:用简单微调与预算强制激活大语言模型的“推理能力”

光典“灵犀实验室”:灵智领航 犀启新篇

新片区首家!光典助力临港集团获评“上海市示范数字档案室”
夜雨聆风
