AI翻译越来越强,但它始终翻不好的那类句子,暴露了一个更深的问题

AI翻译越来越强,但它始终翻不好的那类句子,暴露了一个更深的问题
DeepL、GPT-4、谷歌翻译——随便哪个工具,现在都能秒出一篇流畅的译文。很多人已经在问:人工翻译是不是要失业了?但这个问题本身可能就问错了。真正值得问的是:当机器翻译「看起来很好」的时候,我们是否还有能力判断它到底好不好。
有一个实验我觉得很能说明问题。把海明威的《老人与海》第一段丢给GPT-4翻译,再丢给一个普通英语专业学生翻译,然后请十个非专业读者评分。结果几乎每次都是机器翻译得分更高。原因很简单:机器的译文更流畅,读起来没有障碍。但专业译者看了之后会告诉你,机器版本把海明威那种「冰山下面的重量」翻没了。问题是,大多数读者根本感知不到那个重量的存在。
流畅,是AI翻译最厉害的地方,也是最危险的地方
过去的机器翻译,错误是显性的。「我吃了一个苹果」被翻成「I have eaten an apple of one」,你一眼就看出来不对。但现在的神经网络翻译,错误变成了隐性的。句子通顺,逻辑连贯,读起来像人写的——但意思可能已经悄悄偏了。这种偏移很难被非专业人士察觉,因为流畅度会欺骗判断力。你以为自己在读原文的意思,其实在读一个经过平滑处理的近似版本。
●语言学家有个说法:翻译的最高境界不是「无缝」,而是「有迹可循的忠实」。好的译文应该让读者感受到原文的呼吸节奏,哪怕这个节奏有点陌生。机器翻译的训练目标恰好相反——它被优化成让目标语言读者读起来最舒服,而不是最接近原文。
机器真正翻不好的,是「语境里的意图」
举个具体的例子。日语里有一个词「空気を読む」,字面意思是「读空气」,实际意思是「察言观色、感知场合氛围」。这个词丢给机器翻译,大部分工具会给你「read the atmosphere」或者「read the room」。后者其实是个英语俚语,意思是对的,但它携带的文化质感完全不同——「read the room」是英美职场语境里的说法,带着一点讽刺意味,而「空気を読む」在日语里是中性甚至褒义的社交能力描述。这一个词,机器翻译就已经在文化层面产生了漂移。
更难处理的是文学作品里的「故意为之的不完美」。福克纳的长句、塞林格的语气词、王小波的反讽腔调——这些都是作者精心构建的风格标记。机器翻译的本能是把它们「修正」成更标准的表达。因为从统计学角度看,那些用法确实是「异常值」。但伟大的文学往往藏在异常值里。
那人工翻译的护城河,还剩多少
3
类翻译场景,AI目前仍无法替代人工
1文学与诗歌翻译:需要在两种语言的美学体系之间做出主观判断,而不只是转换信息
2法律与合同翻译:一个词的选择可能影响法律责任边界,需要译者承担判断责任
3高度语境化的口译现场:谈判桌上的停顿、语气、措辞选择,本身就是信息的一部分
但我想说的不只是「这三类场景AI搞不定」。更重要的是,这三类场景有一个共同点:翻译本身就是一种决策,而不只是转换。法律译者在选择「shall」还是「must」的时候,是在做法律判断。文学译者在选择「孤独」还是「寂寞」的时候,是在做美学判断。这类判断需要承担后果,需要有人负责——而机器没有责任主体。
被忽视的真正问题:谁来验证机器翻译的质量
我们花了很多时间讨论「AI能不能取代人工翻译」,却很少讨论一个更紧迫的问题:当AI翻译大量渗透进我们的信息摄取之后,谁有能力去验证它的质量?外语能力的退化是一个缓慢但真实的风险。如果一代人从小依赖机器翻译,他们将无法判断机器翻译的好坏——因为判断需要双语能力作为基础。这是一个自我削弱的循环:越依赖,越难判断;越难判断,越依赖。
「
翻译不是在两种语言之间架桥,而是在两个世界之间做选择。
」
所以当我们说「AI翻译的天花板在哪里」,这个问题本身可能就是一个陷阱。它预设了一个线性的进步叙事:AI现在在这里,天花板在那里,迟早会突破。但翻译从来不是一个纯粹的技术问题。它是一个关于「谁在说话、对谁说、为什么这么说」的问题。只要这个问题存在,人的判断就有不可替代的位置。不是因为人比机器聪明,而是因为人能为判断承担意义。
✦ 小结
AI翻译的真正天花板,不是技术参数,而是「意图理解」和「责任归属」这两道墙。流畅度的提升让机器翻译越来越难被质疑,但这恰恰是我们最需要保持警惕的时刻。人工翻译的价值,正在从「更准确」转向「可追责、可解释、能承担后果」——这是机器在相当长时间内无法模拟的东西。
夜雨聆风