乐于分享
好东西不私藏

花一天翻完了 PG 生态三大组件的文档

花一天翻完了 PG 生态三大组件的文档

最近 Pigsty v4 刚发布完,手头突然空了下来。正好一看,这周的 Claude Token 额度快到期了,不用也是白扔。一时心痒,想着得找个活儿把它挥霍掉。

想了想,去翻译文档吧。

于是我花了一天时间,把 PgBouncer 连接池、pgBackRest 备份工具、Patroni 高可用模板 这三个 PostgreSQL 生态中最重要的开源组件文档,全部翻译成了中文。顺手还把 PostgreSQL 18 的官方文档也过了一遍——虽然还在校对中,但主体已经出来了。

说实话,干完之后我自己都有点恍惚:这事儿要搁几年前,怕是得组织一群志愿者忙活好几个月。文档放在这里:https://pigsty.cc/docs/


中文文档,到底重不重要?

有一种说法,搞技术的程序员英文应该都过关,所以直接看英文文档就行了。这话对也不对。

实际上,中国开发者群体里,英文阅读能力参差不齐的情况非常普遍。即便是一线大厂的工程师,也有不少人面对大段英文文档时读得很吃力。你不能假设每个需要用 PostgreSQL 的人,都能流畅阅读英文技术文档。

退一步说,就算英语水平不错——比如像我这样,平时英文看着也算顺畅 —— 但阅读中文的速度还是比英文快两到三倍。这是认知效率问题 —— 母语阅读时大脑的负荷更低,理解更直觉,查阅更爽利。特别是参考性质的文档,需要反复跳转查阅,中文的效率优势就更加明显了。

所以,中文文档不是”有也行没也行”的事,它是 PG 生态在中国落地的基础设施。


现状有多糟?

PostgreSQL 的官方文档曾经由中文社区组织翻译,志愿者加上大学生,前前后后做了不少版本。但这种靠人力堆的模式天然有个问题:跟不上。每次大版本发布后,翻译要滞后半年甚至更久。到现在,社区维护的中文文档进度似乎已经停留在了 15.7 版本——落后了三年多,已经无人组织跟进了。(不过我好像看到一个 18.0 的)

至于 PgBouncer、Patroni、pgBackRest 这些核心组件的中文文档?更是几乎空白。零星能找到的一些翻译,Patroni 的中文文档版本还停留在 2.1.1, pgbouncer 的停留在 1.7.2 ,基本上已经不具备参考价值,pgbackrest 的根本没有,只能搜出老冯七八年前翻译的第一版。

这不是中文社区不努力。翻译文档是一件吃力不讨好的苦差事:工作量大、技术门槛高、没有直接回报、而且版本一更新就白干。靠爱发电这种事,终究难以为继。


AI 改变了什么?

说到底,过去翻译文档为什么难?因为这是一个需要同时具备 “技术理解力“ 和 ”语言表达力“ 的任务,能做好这事的人本来就不多,愿意无偿投入的就更少了。这件事需要一整个翻译组来推动,而翻译组需要持续的组织和协调。成本太高了。

但现在不一样了。

有了 AI,翻译文档这件事的本质变成了什么?——烧 Token

只要你有一套成熟稳定的工作流,剩下的就是把文档丢进去跑。我的 Token 订阅额度放那儿不用也会过期,不如干点有意义的事。一天的时间,三大组件的完整文档翻译就搞定了。

翻译质量如果让我自己打分,大概能到 85-90 分——在几乎零边际成本的情况下,做到阅读理解无偏差、读起来很流畅,我觉得这已经是一个非常好的性价比了。

当然,我也不是全部无脑丢给 AI。我基本上会把翻译后的内容整体过一遍,确保没有硬伤,顺便也当复习一下,总的工作量跟以前完全不是一个量级。

这再一次证明了在 AI 时代,过去需要一整个公司、一大群人才能干成的事,现在一个人就能搞定。翻译文档只是其中一个缩影。社区建设,开源维护的门槛,被彻底改变了。


后面要做什么?

翻译完这三大组件文档只是个开头。

我后面的计划是,把 PG 生态里所有重要的组件文档、官方博客、技术资讯,全部翻一遍,并且构建一套自动维护的更新工作流。这意味着——全世界所有英文 PG 社区产出的内容,都可以近乎实时地同步到中文环境中。

比如,460+ 个扩展的文档,也可以自动的抓取并翻译为中文,甚至是 N 国语言。这件事对我来说真的没什么额外成本。我订阅的 Token 如果用不完也是浪费,正好用这种”无限量”的活儿来作为兜底填充任务。往大了说呢?我准备用这套东西来 “复兴” PostgreSQL 中文社区。

一个真正有生命力的技术社区,需要什么?我想过这个问题:你得有完善的中文文档和技术资讯,这是基座;你得有供大家交流讨论的论坛,这是活力;你得有厂商发布信息、发布岗位的地方,这是连接产业的桥梁;你最好还有下载仓库等基础设施,降低大家使用的门槛。

最核心的是,你需要有自己的核心价值主张,有一个研发的东西作为凝聚核。那么现在想想看,这些其实都不难搞定了。这些事情,以前想做心有余而力不足。现在有了 AI 加持,我坐在这里一边冲浪一边”出嘴”派活,Token 有的是,很多过去想都不敢想的事情,变得可以一个人轻松支棱起来了。

有人可能会问:在 AI Agent 的时代,以后都是 Agent 去读文档了,还需要中文翻译吗?甚至连文档站都不需要了,项目里写个 llm.txt 就完了。也许吧。但至少现在,我自己天天还得翻 PG 文档。在 Agent 真正替代人类阅读之前,这件事依然大有裨益。


来看看?

目前翻译好的文档已经上线,放在了 Pigsty 的中文文档站上:

PgBouncer 中文文档:连接池配置、管理与使用的完整翻译Patroni 中文文档:高可用集群管理的完整翻译pgBackRest 中文文档:备份与恢复工具的完整翻译PostgreSQL 18 文档:主体翻译完成,校对进行中,翻译的是最新的 18.3 这个会专门弄个子域名挂上去。

文档站地址:https://pigsty.cc/docs/

后面还会把 PostGIS,TimescaleDB,Citus,PGVECTOR,pg_repack 这些扩展的文档也集中规整翻译一下。

本来想专门搞个域名来放这些 PG 生态的中文文档,但国内备案太折腾了,暂时先放在 Pigsty 站点下面。后续我会整合更多内容,专门搞个域名,构建一个完整的 PG 中文社区门户——文档、资讯、新闻、下载,一站搞定。

网站源码是完全开源的,翻译质量虽然我觉得还不错,但总归难免有疏漏。非常欢迎大家来抓虫——发现任何翻译问题,可以直接反馈给我,或者在 GitHub 上直接提 PR。

翻译从来不是目的。目的是让每一个中文开发者,都能用最低的认知成本,获取最好的 PostgreSQL 知识。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 花一天翻完了 PG 生态三大组件的文档

评论 抢沙发

8 + 5 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮