乐于分享
好东西不私藏

PDF翻译工具重磅更新!Markdown输出功能解锁,翻译更智能、格式丰富

PDF翻译工具重磅更新!Markdown输出功能解锁,翻译更智能、格式丰富

大家好!近期PDF翻译工具迎来了一波密集更新,聚焦翻译智能性、文档格式兼容性、使用体验三大核心维度。2月4日至今的多项优化,解决了格式错乱、翻译不连贯、特殊内容被误改等痛点,让PDF翻译更贴合日常使用场景。快来一起看看这些实用的新功能吧~

一、翻译更智能✨ 精准度&连贯性双提升

1. 语义合并可开关,按需选择翻译模式

新增「启用语义块合并」复选框,支持语义合并/非合并两种翻译模式:

  • 开启合并:文本按语义连贯翻译,阅读体验更佳;
  • 关闭合并:按原始文本块逐段翻译,精准匹配原文布局;

同时支持使用大语言模模型进行语义判断的功能,大幅提升翻译连贯性。

2. 页眉页脚识别更精准

针对页眉页脚误判问题,我们做了双重优化:

  • 识别阈值从50%提升至70%,减少无效识别;
  • 仅分析PDF页面顶部/底部区域的文本,彻底避免正文被误判为页眉页脚。

3. 特殊内容保护,URL/代码段原样保留

新增核心规则:URL地址、代码段不翻译,完全保留原始格式! 无论是技术文档里的代码片段,还是论文中的链接,翻译后再也不会出现链接失效、代码错乱的问题。

二、格式更完美📄 Markdown/Word体验大升级

1. 全新支持Markdown输出

这是本次更新的重磅功能!

  • 基于PDF原始布局生成规范Markdown文档,表格、图表位置1:1还原;
  • 支持Markdown文件+图片打包下载,生成的文本无冗余代码块标记,直接可用;

2. Word文档生成优化

之前Word生成后图表错位、样式混乱,这次进行了修复:

  • 按垂直位置排序页面元素,图表/表格位置不会乱跑;
  • 100%保留原文字体、大小、颜色,解决样式继承、空白页问题;
  • 简化生成流程,仅用合并后的翻译结果生成,效率更高、质量更稳。

3. 标题识别更精准

优化语义分析提示词,明确标题的识别规则:

  • 标题不与正文/其他标题错误合并;
  • 新增多组测试用例,覆盖各类标题场景。

三、💡 老朋友如何体验新版本?

  1. 拉取最新代码:git pull origin main(或develop分支);
  2. 重新安装依赖:pip install -r requirements.txt
  3. 正常启动服务:python app.py,即可体验优化后的功能。

四、新朋友从头安装

1. 克隆仓库

git clone https://gitee.com/chunju/pdfTrans.gitcd pdfTrans

2. 配置环境变量

  • 复制.env.example文件为.env
  • .env文件中配置各翻译模型调用API的密钥
cp .env.example .env# 编辑.env文件,添加API密钥

可以使用下面两个推荐链接注册 Aiping或者 硅基流动,你我应该都有赠费,注册完成后申请API Key:

https://www.aiping.cn/#?invitation_code=PUHXPA

https://cloud.siliconflow.cn/i/OFUfQfNj

3. 安装依赖

pip install -r requirements.txt

五、使用方法

启动Web服务

python app.py

访问Web界面

  • 打开浏览器,访问 http://localhost:5000
  • 上传PDF文件
  • 系统自动检测并显示PDF总页数
  • 选择翻译页码范围(可选,默认全选所有页)
    • 支持单个页码(如:1,3,5)
    • 支持页码范围(如:1-5,7-10)
    • 可以混合使用(如:1-3,5,7-9)
  • 选择翻译服务和目标语言
  • 选择输出格式
  • 点击”翻译”按钮
  • 等待翻译完成,下载翻译后的文件

六、结语&反馈💬

本次更新聚焦「更智能、更精准、更易用」,解决了大家反馈的核心痛点。如果在使用过程中有任何问题、建议,欢迎在本文或后台留言。

我会持续打磨功能,让PDF翻译工具更贴合你的使用需求~

✨ 关注【智践行】,获取工具最新更新、使用技巧,还有更多实用内容分享~

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » PDF翻译工具重磅更新!Markdown输出功能解锁,翻译更智能、格式丰富

评论 抢沙发

6 + 4 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮