还在为PDF里的公式复制出来全是乱码而头疼?看到英文论文想翻译又担心格式崩坏?相信不少搞科研或者经常处理文档的朋友都遇到过这种糟心事。今天给大家安利一个最近在GitHub上发现的神器——Doc2X,这玩意儿处理复杂文档真的有一手,关键是用起来还特别顺手。

先说说这玩意儿到底能干啥。简单来说,Doc2X是一个专门搞文档解析的AI工具,由NoEdgeAI团队开发的。它最牛的地方在于,能把那些满是复杂数学公式、表格的PDF,精准地转换成Markdown、LaTeX、Word甚至HTML格式。你以前手动打半天的公式,现在它直接给你转成LaTeX代码,复制到Overleaf或者Typora里就能用,这可太省事了。

功能这块儿,我觉得有几个点特别值得一提。首先是公式识别,无论是印刷体还是手写体,它都能转成LaTeX格式,而且效果跟MathPix不相上下,但性价比高多了。然后是表格识别,跨页表格也能合并处理,生成HTML格式的表格代码,直接贴到网页或者文档里就能用。还有就是多语言翻译,内置了GPT、DeepSeek、GLM、Qwen这些主流大模型,翻译完还能保持原文的排版,生成双语对照文档,这对于看英文论文的朋友简直是福音。

对了,它现在还接入了FastGPT、CherryStudio、字节扣子这些AI平台,可以直接在知识库 workflow 里调用,自动化处理文档。
说重点了,怎么安装和使用呢?Doc2X本身是在线服务,但如果你想要通过代码调用,或者集成到自己的项目里,他们团队在GitHub上开源了Python SDK——doc2x-doc,这个必须给大家讲讲怎么玩。
第一步:安装
安装特别简单,跟装其他Python包一样,打开终端直接pip就行:
pip install doc2x-doc装完之后,你需要去官网申请一个API Key。到 open.noedgeai.com 注册个账号,新用户有免费额度送,每天签到还能领一些,对于个人轻度使用基本够用了。
第二步:基础使用
拿到API Key之后,就可以开始解析文档了。最简单的用法是这样的:
from doc2x import Doc2X# 初始化客户端client = Doc2X(api_key="你的API_KEY")# 解析PDF文件result = client.pdf2file( pdf_path="你的论文.pdf", output_format="markdown", # 可选 markdown、latex、docx等 ocr=True# 如果PDF是扫描版,这个要开)print(result)就这么几行代码,你的PDF就变成结构化的Markdown了。如果是图片格式的PDF,记得把ocr参数打开,它会自动识别图片里的文字和公式。
第三步:高级玩法——批量翻译
如果你想要批量翻译文献,可以结合他们的另一个开源项目Doc2XAPITranslate,或者直接自己写个脚本调用翻译接口。比如:
# 解析并翻译result = client.translate( pdf_path="paper.pdf", target_language="zh", translation_mode="bilingual"# bilingual是双语对照模式)它会返回一个保留原排版的双语文档,公式和表格位置都不会乱。
桌面端体验
如果你不想写代码,直接用网页版也很方便。访问 doc2x.noedgeai.com,把PDF拖进去,选择想要的输出格式,等个几秒钟就能下载。网页版支持最大300MB的文件,1000页以内的文档都能处理。

现在他们已经处理了上亿页的文档,每天处理量上千万页,稳定性还是靠谱的。而且价格真的挺良心,比起某些国外工具动辄几刀一页,Doc2X的API价格是0.02元/页左右,量大还有优惠,对于学生党和个人开发者都很友好。

总之,如果你经常要跟PDF打交道,特别是那种满是公式和表格的学术论文,Doc2X绝对值得试试。无论是直接用网页版应急,还是通过GitHub上的SDK集成到自己的自动化流程里,都能省不少事儿。
GitHub地址:https://github.com/NoEdgeAI/doc2x-doc
专注分享 GitHub知识,分享AI 资讯和AI搞米经验,分享AI Agent使用经验。

想领取完整版OpenClaw资料,围观朋友圈,一起交流AI的,可加我VX,备注“github"。

夜雨聆风