乐于分享
好东西不私藏

让AI真正读懂你的文档

让AI真正读懂你的文档

【RAG-Anything:让AI真正读懂你的文档】
你有没有遇到过这种情况——
扔给AI一份PDF年报,里面全是图表、表格、数学公式。
AI却只字不提那些图片说了什么。
这就是传统RAG的死角:它只会”读文字”。
而今天这个项目,把这个死角彻底填上了。
RAG-Anything做了什么
它是一个全能多模态RAG框架。
不只是文本,连图片、表格、公式、图表,全部都能理解、检索、回答。
不管你丢进来的是PDF、Word、PPT还是Excel。
它自动识别内容类型,调用专门的处理器分别解析,最后统一到一个接口里查询。
这就是它最亮眼的地方——真正做到了”All in One”。
不需要你写一堆工作流,不需要拼装多个工具。
一个框架,搞定所有格式。
它靠什么做到的
三层核心架构。
第一层:文档解析
接入了MinerU,能高精度提取复杂版面的文档结构。
文字、图片、表格、公式,全部保留上下文关系。
第二层:内容分析
视觉内容用视觉模型生成描述 caption,提取空间关系。
表格数据走统计分析管道,识别趋势和依赖关系。
数学公式直接输出LaTeX,无缝对接学术场景。
第三层:知识图谱 + 混合检索
把多模态内容统一建模成知识图谱。
检索时同时搜文本和多模态内容,语义理解更完整。
适合谁用
做研究的人。论文、专利、报告,一键问答。
做金融分析的人。年报、招股书、表格数据,精准提取。
做企业知识管理的人。多格式文档库,统一查询入口。
一句话评价
RAG-Anything把”文档理解”这件事,做成了一站式服务。
传统RAG做不到的,它做到了。
开源地址
https://github.com/HKUDS/RAG-Anything