官网:https://mineru.net/[1]

简介
MinerU 是上海人工智能实验室(OpenDataLab)开发的一站式文档解析工具,专门用于把 PDF(尤其是学术论文)、Word、PPT、Excel、图片等文档转换为高质量的 Markdown / JSON 等结构化格式。
核心优势
•转换质量高:能精准提取文字、表格、公式、图片,并保留原始排版结构(标题、段落层级、阅读顺序)•公式支持好:自动识别并转换为 LaTeX 格式,对论文中常见的行内/行间公式、复杂嵌套结构支持较强•表格处理:能搞定旋转、跨页、合并单元格等复杂表格,输出为 HTML/Markdown 格式•多语言 OCR:支持扫描版 PDF 的 OCR 识别•多种使用方式:在线网页版、开放 API、本地离线部署、桌面客户端(Windows/macOS/Linux)都支持
使用方式
1.在线直接用(最简单):打开 https://mineru.net/OpenSourceTools/Extractor[2] 上传 PDF 或粘贴 URL,等待解析即可下载 Markdown2.桌面客户端:https://mineru.net/client[3] 下载安装,免登录可用,操作和网页版一致3.API 调用:需要在 https://mineru.net/apiManage/docs[4] 申请 API key,适合批量处理或接入自己的工作流(支持 MCP 协议,可接入 Dify、Notion 等)4.本地开源部署:GitHub 仓库 https://github.com/opendatalab/MinerU,可本地跑(支持[5] GPU 加速),适合大批量、隐私敏感场景
实测体验(来自网友反馈)
•一篇 20 页英文论文(15 张图、43 个公式、8 个表格),转换速度约 30 秒以内,整体识别效果不错•个别复杂公式或特殊排版(如开头大写字母占两行)偶尔会有识别错误,需要人工校对•本地部署对显卡有一定要求(无 GPU 也能跑但速度慢很多)
适用场景
•把学术论文 PDF 转成 Markdown,方便后续编辑、检索、喂给 AI 模型•构建个人知识库 / RAG 系统的数据预处理•批量整理扫描版文档(尤其是 OCR 质量差的旧 PDF)
References
[1]: https://mineru.net/[2]: https://mineru.net/OpenSourceTools/Extractor[3]: https://mineru.net/client[4]: https://mineru.net/apiManage/docs[5]: https://github.com/opendatalab/MinerU,可本地跑(支持
夜雨聆风