乐于分享
好东西不私藏

阅读外文和技术文档翻译PDF后版面全乱?这个开源工具解决了十年难题

阅读外文和技术文档翻译PDF后版面全乱?这个开源工具解决了十年难题

你有没有过这种经历——

阅读外文论文或技术文档时复制原文到翻译工具,出来的译文排版稀碎——公式崩坏、表格错位、图片乱跑。

重新手动调整的时间,比翻译本身还长。

RetainPDF 解决的就是这个痛点。

SCI 论文的效果

它是一个开源 PDF 保留排版翻译工具,翻译后页面布局、列结构、公式、表格、图片、页眉页脚几乎与原文一致,特别适合 SCI 论文、理工科教材、技术文档这类”版面复杂到让传统工具崩溃”的场景。


  • • 强排版保留:多栏布局、段落位置、图文混排,翻译后基本不走样
  • • 扫描版 PDF 支持:集成 OCR,图片型 PDF 也能识别翻译
  • • 公式不崩坏:行内 LaTeX、复杂数学公式有专门优化,适合 SCI 论文
  • • 代码保护:代码块不会被误翻译,原样保留
  • • 表格可控:可按规则配置表格处理方式
  • • PDF 压缩优化:翻译后文件体积通常更小,字体控制精准

工作流程

整个处理链路全栈打通:

上传 PDF → 结构分析与 OCR → 文本提取与元素识别 → 调用 LLM 翻译(支持 DeepSeek 等) → 排版重建(Typst 渲染) → 输出优化后的 PDF

用户提到多集成性价比高的 DeepSeek API,也可替换其他模型。

API 支持批量自动化处理。


如何使用

方式
适合人群
桌面版

(Windows/macOS/Linux)
新手首选,去 GitHub Releases 下载 v4.1.0
Docker 部署
自托管或团队使用,docker compose up -d 即可

注意:翻译依赖外部 LLM API,需自行准备 Key。

macOS 提示

由于当前没有 Apple 开发者账号,macOS 版本第一次打开时可能会提示应用“已损坏”。这不是文件真的损坏,而是系统的签名校验导致的。把应用拖到 /Applications 后,执行:

sudo xattr -r -d com.apple.quarantine /Applications/RetainPDF.app

对比同类工具

RetainPDF 对图片型文档和公式的适配更强,排版保留效果能与部分闭源商用工具竞争甚至超越。

如果你经常阅读外文文献、受够了翻译后全乱的排版,RetainPDF 值得一试。

项目地址:https://github.com/wxyhgk/retain-pdf


你在翻译 PDF 时最大的痛点是什么? 在看 + 回复告诉我 👇