一句话定位:基于深度文档理解的开源 RAG 引擎,兼具 Agent 编排能力,为企业构建高可信度的 AI 知识系统提供从数据接入到推理落地的全栈工具链。
一、它是什么?解决什么问题?
RAGFlow 是由 InfiniFlow 团队主导开发的开源 RAG(检索增强生成)引擎,GitHub 79.6k Stars,Apache 2.0 协议。它的核心出发点是:现有 RAG 系统的最大瓶颈不在 LLM,而在"文档理解"——企业知识库里充斥着带复杂排版的 PDF、扫描件、Excel 表格、PPT,传统方案先转纯文本再切片,大量结构信息丢失,直接导致"答非所问"和幻觉泛滥。
RAGFlow 的解法是把"深度文档理解(DeepDoc)"作为第一性原理,先还原文档的视觉结构和语义层次,再做可解释的分块(Chunking),最后以可视化方式呈现每个 chunk 的来源,让人工可以干预和校验。面向的用户主要是:有私有化知识库需求的企业 IT 团队、需要构建文档问答系统的集成商、以及希望在内部知识资产上构建 Agent 的开发者。
二、它能做什么?
| 深度文档理解(DeepDoc) | |
| 可视化模板化分块 | |
| 混合检索 + 重排序 | |
| 可追溯引用(Citation) | |
| Agent 编排平台 | |
| 多数据源接入 | |
| Agent 发布与版本控制 | |
| 多语言 + 私有化部署 |
三、它是如何做到的?
RAGFlow 的架构分三层,文档理解层是最核心的差异化:
第一层:文档理解(DeepDoc)不只是 OCR,而是结合视觉模型(VLM)对文档做"结构还原"——识别表格边界、标题层级、图文相对位置,把一份复杂 PDF 变成带结构语义的中间表示,再据此分块。分块策略可按文档类型选择模板(如"论文模板"、"合同模板"),避免固定 token 切片破坏语义完整性。
第二层:检索与生成向量库默认用 Elasticsearch(可选 Infinity),embedding 和 rerank 模型可插拔。召回阶段做向量 + BM25 双路混合,再由 rerank 模型精排。生成阶段把命中 chunk 作为上下文拼入 Prompt,同时返回引用溯源信息。
第三层:Agent 编排基于工作流引擎,支持条件分支、循环、HTTP 调用、代码沙箱执行。v0.25 引入 MCP 支持,可接入外部工具服务器;Agent 支持用户级记忆(Memory),实现多轮对话的上下文连续性。
[文档/数据源] → [DeepDoc 结构还原] → [模板化分块] → [向量+全文索引]↓[用户提问] → [混合召回+重排序] → [Top-K Chunks + 引用] → [LLM 生成答案]↓[Agent 工作流] ← [工具调用/MCP] ← [多轮对话+记忆] ← [答案+引用返回]
四、它能用到什么场景?
| 企业知识库问答 | ||
| 合同/法律文书分析 | ||
| 技术文档/运维手册检索 | ||
| 研报/财报数据分析 | ||
| 客服知识库 |
真实案例参考:RAGFlow 官方展示了制造业(设备维护手册检索)、法律服务(案例库检索)、金融(研报数据分析)三大行业解决方案,均强调"可追溯引用"以满足合规要求。对于技术负责人,最关键的落地价值是:可以把"答案有出处"作为产品卖点,而不只是"AI 说了算"。
五、为什么值得关注?
① 文档理解是企业 RAG 的最大短板,RAGFlow 把它做透了大多数 RAG 框架只管"检索+生成",文档解析交给外部工具。RAGFlow 把 DeepDoc 作为核心模块,直接决定了它在中文复杂排版、扫描件、表格密集文档上的表现显著优于竞品。对于你的企业 RAG 项目(10k+ 文档场景),这是选型时的重要加分项。
② 可视化分块 + 人工可干预,满足企业合规审计需求生成式 AI 在企业落地的最大障碍之一是"不可解释"。RAGFlow 的引用溯源和分块可视化,让 IT 负责人可以向业务方展示"答案来自哪里",这是 Dify、FastGPT 等平台目前做得不够细的地方。
③ v0.25 的 Agent 编排 + MCP 支持,正在从"RAG 工具"升级为"知识型 Agent 平台"原来的 RAGFlow 只是一个检索增强工具,现在加上工作流、代码沙箱、MCP 接入,能力边界已扩展到 Coze/Dify 的赛道。对于已经用 RAGFlow 做知识库的用户,升级到 Agent 平台的成本很低。
④ 私有化部署友好,Apache 2.0 协议无商用风险Docker 一键部署,支持完全离线运行,适合对数据主权有严格要求的企业。相比之下,Coze 只有云服务,Dify 的商业化版本在高级功能上有限制。
六、基本信息卡
| 产品名称 | |
| 开发团队 | |
| 开源协议 | |
| GitHub Stars | |
| 主要语言 | |
| 最新版本 | |
| 官网 | |
| GitHub | |
| 部署方式 |
七、竞品分析
RAGFlow 的核心赛道是"带深度文档理解的 RAG 平台",主要竞品集中在三个方向:
| 核心定位 | ||||
| 文档解析能力 | ||||
| 可视化分块 | ||||
| Agent 编排 | ||||
| 私有化部署 | ||||
| 学习曲线 | ||||
| 社区活跃度 |
差异化判断:RAGFlow 的核心优势是把"文档理解"这件事做到了 RAG 系统应有的深度,而不是把它当作一个"上传文件"的附属功能。对于文档类型复杂、合规要求高、需要答案可追溯的企业场景,RAGFlow 比 Dify/FastGPT 更合适。主要短板是:工作流生态和模板丰富度不如 Dify,品牌认知度在国际市场不如 LangChain。选型建议:如果核心需求是"文档问答的可信度",RAGFlow 优先;如果核心需求是"快速搭建 Agent 工作流",Dify 优先。
夜雨聆风