很多人要问了:现在哪个大模型不能读PDF?为什么它能火成这样?确实,现在几乎所有的通用大模型都能读取PDF,但读PDF的功能只是这些大模型“顺带的附加能力”,面对通识类的普通文档,基本也够用了。而如果遇到复杂排版、复杂表格、高阶公式、高专业度内容,则很容易出现错误,尤其是需要将PDF转成Markdown这类知识库可以读取的格式时,通用大模型很容易出现排版崩坏、字符错乱的问题。因此,很多制造业、医药企业、科研单位、学校、技术工作者在搭建专业知识库、批量解读技术期刊、技术论文的时候,都存在复杂PDF精准读取和转化的需求。
MinerU刚好切中了这个需求,它就是专门为高精度、高专业度文档读取而生的可本地部署的轻量化开源工具。它能还原复杂数学公式、嵌套分式、高阶符号、复杂表格、复杂排版、页面批注等信息,把PDF拆成干净、结构化的Markdow文件,在权威评测中,精度直接超越GPT等一众大模型,可以说是建立知识库的必备辅助神器。
说白了,大模型是全能选手,但MinerU是文档解析的专业好手。这就是它能短时间冲到62k星的原因:精准解决刚需,性能卓越,开源还免费,而且MinerU是国产工具,下载和部署都很方便,如果你也有相关需求,推荐赶紧去试试吧。

夜雨聆风