📌 这是 Hermes 系列的第二十篇。上篇我们学会了用 Hermes 自动写周报。但跨国团队还有一个刚需——文档翻译。

一、核心功能概览
Hermes 的文档翻译引擎有五个能力:
格式保留: 翻译后 Markdown 的标题层级、列表、表格、代码块、链接格式完整保留。不会出现标题错乱、代码块被翻译之类的问题。
术语管理: 建立团队的术语表(Glossary),指定特定术语的固定译法。比如「deployment」统一翻成「部署」而不是「部属」或「布署」。
上下文感知: 不只是逐句翻译,而是理解段落和全文语境。同一个单词在不同语境下选不同的译法。
批量处理: 一次指定多个文件或整个目录,自动识别语言并翻译到目标语言。
增量更新: 源文档更新后,只翻译变更的部分,不用全文重翻。
# 单文件翻译hermes skill run "翻译文档" --args '{ "文件": "~/docs/product-spec.md", "从": "en", "到": "zh-CN", "术语表": "product-glossary"}'# 批量翻译目录hermes skill run "批量翻译" --args '{ "目录": "~/docs/en/", "输出目录": "~/docs/zh/", "从": "en", "到": ["zh-CN", "ja", "ko"], "术语表": "product-glossary"}'💡 第一次用,建议先翻译一个简短的 Markdown 文件(几百字),检查格式保留和术语翻译是否符合预期,再搞批量翻译。
二、安装翻译技能与管理术语表
# 搜索翻译相关技能hermes skills search 翻译# 安装核心技能hermes skills install 文档翻译hermes skills install 术语管理# 加载/reload-skills翻译第一步是建术语表,术语表决定了翻译质量的上限。
# 创建项目术语表hermes skill run "创建术语表" --args '{ "名称": "product-glossary", "项目": "MyApp 产品文档", "术语": [ {"en": "deployment", "zh-CN": "部署", "ja": "デプロイ", "ko": "배포"}, {"en": "pipeline", "zh-CN": "流水线", "ja": "パイプライン", "ko": "파이프라인"}, {"en": "rollback", "zh-CN": "回滚", "ja": "ロールバック", "ko": "롤백"}, {"en": "namespace", "zh-CN": "命名空间", "ja": "名前空間", "ko": "네임스페이스"}, {"en": "load balancer", "zh-CN": "负载均衡器", "ja": "ロードバランサー", "ko": "로드밸런서"} ]}'Hermes 支持从现有文档自动提取术语候选:
# 自动提取术语hermes skill run "提取术语" --args '{ "源文件": "~/docs/en/product-spec.md", "语言": "en", "最小频率": 3, "输出格式": "候选列表"}'# Hermes 会输出高频技术词汇列表,你可以逐一确认是否加入术语表
💡 术语表是翻译质量的基石。花点时间整理好核心术语,50-100 个术语就能覆盖 80% 的技术文档场景。术语表可以在多个项目间共享。
✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦
三、格式保留与多语言对照
翻译中最头疼的问题之一就是格式被破坏。Hermes 对主流文档格式的保留支持:
Markdown: 完美保留标题(#)、列表(- / 1.)、表格、代码块(```)、行内代码(`)、链接、图片引用。
HTML: 保留标签结构,只翻译文本节点内容。不破坏 CSS class、id、data 属性。
JSON/YAML: 保留键名,只翻译字符串值。不影响配置文件结构。
CSV/TSV: 保留列分隔,只翻译特定列。
生成多语言对照文档是 Hermes 的特色功能:
# 生成中英对照版本hermes skill run "翻译文档" --args '{ "文件": "~/docs/en/api-guide.md", "从": "en", "到": "zh-CN", "对照模式": "true", "对照格式": "左右分栏"}'对照版输出效果:
# API 认证指南 (API Authentication Guide)## 概述 (Overview)API 使用 JWT 令牌进行认证 (The API uses JWT tokens for authentication)。每个请求必须在 Authorization 头中携带有效的令牌 (Each request must include a valid token in the Authorization header)。## 获取令牌 (Obtaining a Token)发送 POST 请求到 `/auth/token` (Send a POST request to `/auth/token`):💡 开发团队推荐用「对照模式」,让不熟悉英文的同事也能看原文。QA 团队也能通过对照模式核对翻译准确性。
✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦
四、批量翻译与增量更新
项目文档通常是几十个文件的集合。一次性翻译所有文件:
# 批量翻译整个文档目录hermes skill run "批量翻译" --args '{ "目录": "~/docs/en/", "输出目录": "~/docs/zh/", "从": "en", "到": "zh-CN", "递归": "true", "文件模式": "*.md", "跳过已翻译": "true"}'更高级的——源文档更新后,只翻译变更部分:
# 增量翻译hermes skill run "增量翻译" --args '{ "源目录": "~/docs/en/", "已翻译目录": "~/docs/zh/", "从": "en", "到": "zh-CN", "差异模式": "git-diff", "术语表": "product-glossary"}'增量更新基于 Git diff 检测变更段落,只重新翻译有改动的部分。已翻译且未变更的部分保持不变。大幅节省时间和 API 费用。
⚠️ 增量翻译有个局限:如果改了术语表(比如「deployment」从「部属」改为「部署」),增量翻译不会自动修正之前已翻译的部分。这种情况需要执行一次全文重新翻译。
✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦
五、质量检查与人工审核
自动翻译后,Hermes 提供质量检查功能:
一致性检查: 检查同一术语在全文中的翻译是否一致。
漏译检查: 检查是否有段落或句子没被翻译。
术语匹配率: 报告术语表中的词汇被正确翻译的比例。
长度比对: 中英文长度差异过大可能暗示漏译或过度意译。
# 翻译质量检查hermes skill run "翻译质量检查" --args '{ "源文件": "~/docs/en/api-guide.md", "翻译文件": "~/docs/zh/api-guide.md", "术语表": "product-glossary"}'# 输出示例📋 质量检查报告 一致性: 98.3% (2 处不一致 → 已标记) 漏译: 0 处 术语匹配率: 47/50 = 94% 建议: 2 个术语未在译文中找到匹配,请检查术语表是否完整💡 自动翻译 + 人工审核是最佳实践。Hermes 做初翻,人工做润色。对于技术文档,人工审核的工作量可以减少 70-80%,从「全文翻译」降级为「抽查审阅」。
✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦
六、绑定 Cron 实现自动翻译流水线
每次发新版本时,自动翻译文档:
# 监控 Git 仓库,检测到 docs/ 目录变更后自动翻译hermes cron create --watch ~/projects/myapp/docs/en/# 提示词:检测到英文文档变更,执行增量翻译,源目录 docs/en/,输出 docs/zh/,术语表 product-glossary,翻译完成后发送通知# 每周一凌晨 3 点执行全文质量检查hermes cron create "0 3 * * 1"# 提示词:执行翻译质量检查,检查 docs/zh/ 目录下所有翻译文件,术语表 product-glossary,输出质量报告发我邮件这样就有了一个自动化的文档翻译流水线——开发人员更新英文文档 → Git push → Hermes 检测变更 → 自动增量翻译 → 质量检查 → 通知完成。全程不用人工干预。
✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦
本期小结
Hermes 文档翻译支持格式保留、术语管理、上下文感知、批量处理、增量更新 术语表是翻译质量的关键,每个项目建议配置专属术语表 支持多语言版本同时翻译,适合国际化项目 增量翻译只在源文档变更时重翻改动部分,大幅节省成本 内置质量检查——一致性、漏译、术语匹配率 推荐「自动初翻 + 人工抽查」模式 结合 Cron 实现 Git push 触发的全自动翻译流水线
下期预告 → 第 21 篇:用 Hermes 监控行业资讯:绝不漏掉任何行业关键信息,每天推送简报
✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦
文章完
夜雨聆风