PDF 解析这件事,很多人第一反应还是“把文字抽出来”。但如果你真的做过 RAG、知识库、合同问答、报告分析,就会知道:只拿到一串全文,往往还不够。页码、坐标、截图、表格边界、段落结构、OCR 结果,这些东西才决定了后面的模型到底是在“理解文档”,还是只是在一团文本里猜。今天看到的 LiteParse,释放的信号不是“又一个 PDF 工具”,而是:文档解析正在出现一个更轻、更本地、更工程化的输入层。LiteParse 在 README 里的定位很直接:一个 standalone OSS PDF parsing tool,强调 fast and light parsing。换成人话说,它不是要把 PDF 还原成漂亮页面给人看,而是把 PDF 处理成后续程序更容易消费的结构。这对 Agent 和 RAG 很关键。因为模型真正需要的经常不是“全文”,而是:输入层能力对 Agent 的意义 spatial text parsing知道文字在页面上的位置bounding boxes能把答案和原文位置对齐screenshots能给多模态或人工复核留证据JSON/Text 输出能进入检索、索引和工作流OCR 支持能处理图片化页面或扫描内容这类能力看起来很底层,但它决定了上层问答系统的可信度。如果解析层把页眉、页脚、表格、脚注、正文都搅在一起,再强的模型也会被喂进一锅粥。