长文档问答的检索难题,SmartChunk给出了一个优雅的解法-夜雨聆风

长文档问答的检索难题,SmartChunk给出了一个优雅的解法

嗨，我是PaperAGI，主要关注LLM、RAG、Agent等AI前沿技术，每天分享业界最新成果和实战案例。

当前检索增强生成（RAG）系统普遍采用静态分块策略：文档被预先切割成固定长度的片段，检索时”一视同仁”地召回。这种设计存在三大硬伤：

简言之，传统RAG把”分块”当作预处理步骤，却忽视了不同查询需要不同粒度信息这一本质需求。

查询感知的动态检索框架

SmartChunk提出 “规划器+压缩器” 的双模块架构，实现检索粒度的实时自适应：

核心创新是STITCH训练方案（Solve with RL, Then Imitate To Close Holes）：

图1示意：传统RAG vs SmartChunk流程对比

关键机制：规划器根据查询复杂度实时判断抽象层级——简单查询粗粒度检索，复杂查询细粒度深挖，实现”该粗则粗，该细则细”。

在5个QA基准测试+1个跨域数据集上的验证显示：

特别值得注意的是，STITCH方案在小模型后训练场景下展现出超越GRPO等传统方法的稳定性，证明”推理信息获取”本身是一个可学习的规划问题。

SmartChunk的价值不仅在于技术改进，更在于范式转变：

一句话总结：SmartChunk让RAG系统拥有了”按需阅读”的智能，通过强化学习驱动的规划器动态调整检索策略，在准确性与效率之间找到最优平衡。

SmartChunk Retrieval: Query-Aware Chunk Compression with Planning for Efficient Document RAGhttps://arxiv.org/pdf/2602.22225

每天一篇大模型Paper来锻炼我们的思维~已经读到这了，别忘了点赞、关注噢