藏语 PDF 全是扫描图,怎么翻译?
pdfTrans 是我做的一个开源 PDF 翻译工具。前阵子发了两个版本,更新日志写了快 200 行。
先说百度千帆。pdfTrans 最早只接了硅基流动,后来加了 Aiping,把百度千帆也接进去了。不同模型翻不同语种效果差别挺大,文心对中文翻译更自然。命令行里用 -T qianfan 就能切换。
还修了个 Bug。GLM-5.1 思考模式之前关不掉,翻译藏语时会先吐上万 token 推理过程,把配额耗光,结果啥都没有。现在修好了。
很多人问我藏语 PDF 怎么翻。学术或历史文献里经常遇到,大部分工具不支持。pdfTrans 这次把翻译器、语义分析器和术语提取器都加了藏语。
藏语翻译我推荐用 GLM-5.1。很多藏语 PDF 是扫描件,可以用 LLM-OCR 模式配合 Deepseek-OCR 识别。
输出格式改了。以前命令行一次只能出一种格式,三种全要得跑三遍。现在 -f all,PDF、Word、Markdown 一次全出。
底层代码也做了精简。TranslationService 从 1400 行拆成 5 个子模块,PdfGenerator 从 1641 行精简到 300 行。
有翻译 PDF 需求可以去 Gitee 和 GitHub 看看,也欢迎聊聊你遇到的翻译坑。
代码库:
https://gitee.com/chunju/pdfTrans
https://github.com/chunju-zhong/pdfTrans
#pdf翻译 #藏语翻译 #开源工具 #百度千帆 #大模型翻译 #效率工具
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
北京,1小时前,
夜雨聆风