阅读外文和技术文档翻译PDF后版面全乱?这个开源工具解决了十年难题
你有没有过这种经历——
阅读外文论文或技术文档时复制原文到翻译工具,出来的译文排版稀碎——公式崩坏、表格错位、图片乱跑。
重新手动调整的时间,比翻译本身还长。
RetainPDF 解决的就是这个痛点。
SCI 论文的效果

它是一个开源 PDF 保留排版翻译工具,翻译后页面布局、列结构、公式、表格、图片、页眉页脚几乎与原文一致,特别适合 SCI 论文、理工科教材、技术文档这类”版面复杂到让传统工具崩溃”的场景。
-
• 强排版保留:多栏布局、段落位置、图文混排,翻译后基本不走样 -
• 扫描版 PDF 支持:集成 OCR,图片型 PDF 也能识别翻译 -
• 公式不崩坏:行内 LaTeX、复杂数学公式有专门优化,适合 SCI 论文 -
• 代码保护:代码块不会被误翻译,原样保留 -
• 表格可控:可按规则配置表格处理方式 -
• PDF 压缩优化:翻译后文件体积通常更小,字体控制精准
工作流程
整个处理链路全栈打通:
上传 PDF → 结构分析与 OCR → 文本提取与元素识别 → 调用 LLM 翻译(支持 DeepSeek 等) → 排版重建(Typst 渲染) → 输出优化后的 PDF
用户提到多集成性价比高的 DeepSeek API,也可替换其他模型。
API 支持批量自动化处理。
如何使用
|
|
|
|---|---|
| 桌面版
|
|
| Docker 部署 |
docker compose up -d 即可 |
注意:翻译依赖外部 LLM API,需自行准备 Key。
macOS 提示
由于当前没有 Apple 开发者账号,macOS 版本第一次打开时可能会提示应用“已损坏”。这不是文件真的损坏,而是系统的签名校验导致的。把应用拖到 /Applications 后,执行:
sudo xattr -r -d com.apple.quarantine /Applications/RetainPDF.app
对比同类工具
RetainPDF 对图片型文档和公式的适配更强,排版保留效果能与部分闭源商用工具竞争甚至超越。

如果你经常阅读外文文献、受够了翻译后全乱的排版,RetainPDF 值得一试。
项目地址:https://github.com/wxyhgk/retain-pdf
你在翻译 PDF 时最大的痛点是什么? 在看 + 回复告诉我 👇
夜雨聆风