图片文档公式表格解析工具Dolphin免安装一键启动整合包下载,PDF转JSON/Markdown软件
本次再分享一个由字节跳动团队开发的一款图片文档解析工具Dolphin,支持解析表格、公式、文本、代码块等元素,支持图片和PDF文档转为Markdown和JSON格式文件,当前为最新发布的V2版本,各项功能效果都得到较大提升。
Dolphin V2介绍
Dolphin是由字节跳动(ByteDance)开发并开源的一款高性能、多模态的通用文档图像解析模型。该研究成果已被自然语言处理领域的顶级会议 ACL 2025 接收。
简单来说,Dolphin 是一个强大的“文档提取神器”,它可以将包含复杂排版(如文本、公式、表格、图片、代码块等)的 PDF 或文档图片,精准且高效地转化为结构化的 Markdown 或 JSON 格式数据。当前发布的整合包版本为最新的V2版本。
|
|
|
|
|
|
|
|
|
|---|---|---|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
89.78 | 0.054 | 87.63 | 87.02 | 90.48 | 0.054 |
Dolphin V2整合包使用说明
首先将网盘内的软件压缩包下载到本地电脑上解压,然后双击启动软件.bat,等自动打开webui操作界面。
软件操作界面主要分为三个模块,全文解析,元素解析,布局分析
软件操作区域内首先点击上传图片、pdf文档或输入文件夹路径
全文解析就是处理整个PDF文档或图片转为Markdown和JSON文件
支持批量操作,输入文件夹路径到输入框即可
元素解析就是处理单张图片,格式为jpg,jpeg,png,支持解析元素类型有表格、公式、文本、代码块,支持批量操作
布局分析就是分析文档元素布局,具体效果可进行实测查看
生成结果默认保存到gradio_results文件夹内
注意事项
本软件对显卡配置要求略高,未测试电脑最低配置,建议英伟达显卡显存6G以上用户使用
软件只支持windows10或11系统,不支持手机和mac
使用前建议先更新英伟达显卡到最新版
软件运行路径及待处理文档路径中不能有非英文字符及空格
图片PDF文档解析工具Dolphin V2整合包下载链接
https://articles.zsxq.com/id_dorlazzflfb3.html

夜雨聆风