摘 要:自2016年机器翻译工具在大数据和神经网络深度学习基础上取得巨大进展以来,随着过去两年ChatGPT、DeepSeek-R1等人工智能模型的推出,翻译专业经历了三轮质疑浪潮。2025年2月25日,某厂商借深圳两会之机大肆宣传其AI产品,引发了第三轮负面舆论。本文对该事件做了详尽的事实核查,发现其中存在大量夸大其词与不实信息,并进一步梳理了AI科技公司常见的炒作模式。本文认为,我国AI科技公司在其产品命名中使用“同传”这一人类译员专用术语,极具认知误导性和商业欺骗性。面对负面舆论,学生需要培养基本数字素养和思辨能力,学会识别过度简单化和非黑即白的劣质观点。值得指出的是,本文并不否认AI翻译的巨大进展和自身优势。本文倡导人类负责任地、有道德地使用AI,实现“AI向善”(AI for good)和“AI为民”(AI for all)的目标。
关键词:AI翻译;翻译专业;同传;质疑
一、技术迭代下的三波舆论冲击
自2016年机器翻译工具在大数据和神经网络深度学习技术的推动下取得巨大进展以来,质疑翻译专业价值、唱衰学科前景的悲观论调,便开始出现在各大新闻、会议、自媒体平台上,从而形成了第一波负面舆论浪潮。2022年11月30日,OpenAI公司发布了GPT-3.5模型驱动的人工智能模型ChatGPT。仅仅 5天时间,ChatGPT注册用户数量达到100万,创互联网历史纪录。ChatGPT的翻译功能进一步进化,引发了第二波有关外语和翻译专业前途的讨论。与上一波负面舆论相比,“外语和翻译无用论”和“AI替代论”在互联网平台和社交媒体上更加泛滥,如“同声传译被AI替代是迟早的事”“AIGC时代学外语和翻译没有用”“外语是天坑专业”“劝退翻译专业”“AI进步比我快”“翻译硕士,翻译没用,硕士有用”等。
2025年1月20日,我国深度求索公司推出了开源DeepSeek-R1模型,其推理能力显著提升,性能媲美顶尖闭源产品,迅速引发全球关注。2025年2月25日,深圳市在2025年两会期间率先启用了某厂商的AI翻译大模型,媒体声称:这是全国首个政务级AI大模型同声传译软件。随后各大媒体发布了相关视频和文字新闻。在相关视频新闻报道a中,厂商人士向记者展示了一张照片,画面中一位外国人正看着屏幕记笔记。该人士表示,这位外国总领事馆的官员本来是戴着(翻译)耳机的,但看到AI同声传译的屏幕之后,把耳机放下了,开始对着屏幕记笔记,以此说明AI同声传译的准确率很高,并声称该产品采用DeepSeek-R1大模型,政策术语翻译准确率达到98.3%。据介绍,该软件可以通过AI声纹识别系统自动捕获发言人语音,结合系统级音源直采技术,消除传统设备传输延迟,实现0.5秒内自动触发翻译,翻译响应提速40%。此外,该软件还实现了PC端专业会议平台与移动端的对接,支持大屏高清直播、多语种频道一键切换,可满足外宾团队协同办公需求。该厂商希望,该技术能够帮助深圳成为全世界第一个摆脱语言障碍的城市。
此前,人们得出的一致结论是:AI翻译工具凭借其成本、速度和效率优势,可以在部分垂直领域替代人类从事笔译工作。在口译方面,尽管当前有一些相关移动便携式AI语音翻译技术方案应用于手机、车辆、会议终端,但人们普遍认为,AI语音翻译系统可以适用于诸如旅游、私下交谈等容错率较高(low-stake)的日常生活或简单商务场景,但是在重大、严肃、容错率低(high-stake)、责任主体明确、代表国家形象的重大国际会议和交往场合,AI语音翻译系统尚不能胜任。高规格国际会议口译,特别是同声传译,仍然是AI翻译目前尚未攻克的阵地。
两会是我国每年最重大的政治活动之一。2025年,地方两会已开始采用“AI同传”,这一行为很容易被解读为AI同传已得到官方认可。同时,厂商也声称,因其产品提供的英文译文质量较高,国外嘉宾不再收听人工同传,暗指AI同传在当时场景中已经能够替代人工译员。相关短视频新闻和文字报道出来后,很多人认为,人类同传这座“最后的堡垒”已被AI攻克,随后在社交媒体中引发了新一轮山呼海啸般的负面舆论。“技术决定论”“AI神话”“替代论”“外语和翻译无用论”铺天盖地。互联网和社交媒体中,AI翻译崇拜者和“跪拜者”、AI翻译技术“跟风者”、技术“二道贩子”、短视和功利主义者、焦虑煽动者,以及担心自己被边缘化、成为局外人的错失恐惧症患者(fear of missing out,FOMO)层出不穷。翻译专业在校学生普遍惊恐迷茫,忧心忡忡。
二、现场AI英文翻译果真如此神奇?
首先要说明的是,深圳两会为当地一年中最重要的政治活动之一,会上地方行政首长代表政府向人民报告,阐明政府工作的理念、政策、实绩和未来工作计划,是一项严肃的重大政治活动。同时,两会现场有外国使节列席聆听,是一个向外国友人讲明我国重大政治方针的重要国际交流活动,属于差错容忍度极低、政治敏感度极高的场合。因此,政府工作报告的英文翻译必须做到严谨准确,绝不能出现任何政治方向性问题。
我们以相关报道中的新闻图片为例,来看看AI的翻译水平究竟如何。下面显示的是深圳市两会现场覃伟中市长的《政府工作报告》英文原文与译文。让我们以分句为单位,对英文译文逐行展开分析:
原文①:
中国式现代化,民生为大。群众身边的“关键小事”就是政府要办好的“头等大事”,我们要言必信、行必果,让民生实事落地有声,幸福生活可感可及。
(十)毫不动摇坚持和加强党的全面领导,持续提升政府治理效能和服务水平
译文②:
and people’s livelihood are the greatest.
The key trivial things around the masses are the top
priorities that the government should do well. We must do
what we say and what we do, so that people’s
livelihood can be heard and a happy life can be felt.
10. Unswervingly uphold and strengthen the party’s
overall leadership and continue
①本文引用的 2025年深圳市《政府工作报告》原文来自深圳市人民政府门户网站,参见:https://www.sz.gov.cn/cn/xxgk/zfxxgj/sldzc/szfld/qwz/jqhd/content/post_12064482.html.
②译文来自广东省委、省政府权威移动发布平台“南方 Plus”客户端 2025年 2月 25日发布的现场照片。推文标题为:“无声翻译官”登场!深圳两会首次启用 AI同传,实现“眼神秒译”。参见:https://sztqb.sznews.com/PC/layout/202502/26/node_A05.html?link=content_3311770.html.
第一行:“people’s livelihood are the greatest”语法和逻辑不通。
第二、三行:对于“群众身边的‘关键小事’就是政府要办好的‘头等大事’”,英文译文是“The key trivial things around the masses are the top priorities that the government should do well.”“trivial”一词的含义是“of little value or importance”,确指不重要的事,包含价值判断。只看译文,如何体现人民政府“人民至上”的执政理念?译文读者会误以为中国政府就是“用大力气来做小事”。此外,“群众”的译文是“the masses”。“mass”一词在英文中指抽象的一群人,特定语境下暗指乌合之众。在此用“the masses”会让译文读者感受到政府与人民的疏离感,严重背离《政府工作报告》原文的政治意涵。笔者查阅了 2024年国务院《政府工作报告》英文译文,“群众”的官方译文是“the people”。
第三、四行:“言必信”的译文“we must do what we say”尚可,但是“行必果”译为“do... what we do”让人费解。难道想说,我做我的,别人别提意见?
第四、五行:“so that people’s livelihood can be heard”搭配有问题。
第六行:“党”的英文规范表达是“the Party”。“Party”首字母大写,如果不大写,容易有歧义。
只要具备翻译专业基本知识、稍微熟悉我国政治话语、具有基本合格的英语语言水平的读者,就不难得出结论:上面屏幕中的英文译文,句句有问题,质量根本不合格。尽管笔者无法得到现场AI译文全文,但事实恐怕绝不是厂商人士所称的“政策术语翻译准确率达到 98.3%”。
三、现场真实场景果真如厂商人士所说?
下面我们再根据相关新闻报道中的插图③,来做一下基本的事实核查。(③参见:https://sztqb.sznews.com/PC/layout/202502/26/node_A05.html?link=content_3311770.html.)
仔细分析现场图片,我们可以得出如下信息:1)经确认,现场有同声传译员。给外宾配备的耳机用途是聆听同声传译(关于强调这一点的原因,下文还会讨论)。2)可以看到,现场第一排绝大多数外宾仍然佩戴着耳机。这一点很容易理解,人类听觉输入和视觉输入在信息处理效率上有所差异,听觉输入更轻松,看文字输入更累。现场已经提供《政府工作报告》的文字版,覃伟中市长作报告时通过声音传输方式发布,以彰显会议礼仪。3)厂商人士在视频新闻中还说,该软件可以模仿用户声音产生译文,容易让人误以为AI可以生成同传声音。然而图片说明,现场听众耳机里听到的并不是AI生成的声音,而是现场同声传译员的声音。事实是,厂商在现场给外宾提供的,仅为屏幕上显示的英文译文。这一点也可以从广东省委、省政府权威移动发布平台“南方Plus”客户端推文标题中的“无声翻译官”得以佐证。4)笔者对真实观看效果持怀疑态度,现场屏幕并不大,目测屏幕与外宾的眼睛距离至少有 1—2米,看起来恐怕吃力。屏幕上字幕显示并不稳定连贯,随时在动态调整,人眼阅读速度很难跟上,长时间持续跟随屏幕容易产生视觉疲劳。
四、AI翻译类产品能叫“同声传译”吗?
维也纳大学权威口译研究学者弗朗茨·波奇哈克(Franz Pöchhacker)在一篇名为《机器口译是口译吗?》(“Is Machine Interpreting Interpreting? ”)的论文中指出:“只要自动语音翻译无法可靠地应对具身性(包括对话和多模态)以及共在性(即时间和空间上即时)交互场景中情境性的影响,‘口译’这一术语最好用来专指完全人工(或人工控制)和基于源语节奏(实时使用)的翻译活动。”(Pöchhacker, 2024: 16)
换言之,波奇哈克认为,“口译”“同传”目前仍是人类译员的专属术语。如果现有机器多语言系统不能可靠输出与人工口译同样的声音译文,相关厂商就不得将自己的产品称为“AI同传”“AI同声传译”或“AI口译”,否则会造成术语的极大混淆,给公众带来极大误解。如果不把基本术语厘清,AI科技公司会有意无意地误用或滥用这一术语,通过“蹭”人工口译热度,以此为噱头开展营销宣传,从中谋取经济利益。
笔者作为职业同传译员,目前为止在国际会议场合中见到的所谓“AI同传”,均为对源语讲话内容进行语音识别,随后用AI翻译引擎将文字译成目标语,最后在屏幕上进行双语或单语文字实时显示。对其的准确称呼应该是“多语言字幕实时显示”,绝不是发出声音的“AI同传”。
有意思的是,十多年前,谷歌、微软等翻译软件已经可以实现多语言字幕显示,对于相同的功能,它们的产品呈现形式为多语言下拉菜单,顶多叫“翻译”,而不叫“口译”“同传”。只有国内厂商动辄把自己产品称为“某某同传”“某某口译”。
本文第二节分析显示,目前的真实情况是,尽管有AI加持,做到高质量、可靠的“多语言字幕实时显示”,尚且困难。要做到下一步,即将译文文字高质量、可靠地同步处理成人声,通过耳机提供给听众,在技术实现上还相当遥远。厂商人士所称的“希望能够帮助深圳成为全世界第一个摆脱语言障碍的城市”,目前看来,仅仅是一个美好愿景而已。
在此,笔者呼吁,由于AI翻译类产品目前尚不能提供与人类译员同样的有声同传服务,仅仅为“多语种字幕动态显示”,所以其产品名称亟须规范,相关厂商应及时停止使用“某某同传”“某某口译”等名称,真正做到实事求是,名实相符,这样既呵护了AI翻译技术的有序进步,也有利于现有行业生态和翻译教育的健康发展。
五、个别科技公司的营销套路
在这次具有轰动效应的宣传中,厂商赚足了眼球,无疑是最大的赢家。一夜间,似乎所有人都在谈论该厂商的产品,其热度蹿升,使其收割了大批流量。从这次事件中,据笔者观察,“AI口译”相关科技公司的常见营销套路可以梳理如下。1)找权威机构和人士为其背书。这次事件中,借助在重大场合中的亮相,该厂商暗示其AI产品已得到深圳市政府官方背书,已在重大政治场合中得到采用。据公开信息,2024年 11月,该厂商曾经找到国内某知名语言类高校某教授,在国际交往场合进行宣传,给人一种产品得到权威专家背书的印象。2)只说自己产品能做什么,而不严谨、认真、透彻地向公众说明在实际使用的复杂场景中产品质量究竟如何。公众如果不进行事实核查,往往并不知晓真实场景中产品的使用效果。3)在复杂、多主体、动态的国际交往情景中,只截取对自己有利的部分场景来说事,选择性呈现部分信息,不告诉受众全貌。4)耍“数据、术语障眼法”,大谈大众相对陌生的相关技术指标和专业术语,给人一种“高大上”的感觉。比如本次事件中,如果知晓大模型的基本概念,就不难发现,政策术语翻译准确率达到很高的水平其实并不难做到,只需拿到高质量的往届《政府工作报告》多语数据,根据具体任务对模型进行预训练就可以实现。
六、写给正在学习翻译的同学们:
专业教育的坚守与革新
面对新一轮对翻译专业的负面舆论,广大翻译学子的处境愈加不易。不过,也许在今后一二十年,这一批年轻人恰恰是国家不可多得的财富。在技术日新月异、行业“爆点”层出不穷、社交媒体如此发达的今天,同学们如何具备基本的数字素养和信息鉴别能力?在此,笔者向同学们提出如下建议。1)在自媒体时代,对具有炒作性质,煽动焦虑、恐惧和特定情绪的新闻和观点、虚假消息要提高警惕,提防信息茧房。在互联网和社交媒体时代,观点越是极端,越是情绪化,往往传播越广,流量越大。要小心千篇一律和众口一词。2)多读书,多思考,培养独立思考习惯与批判性思维,增强思辨能力。思辨能力恰好是学好翻译的必备素质。3)一个新闻事件出来后,自问如下问题,做一个简单的思想实验:讲话人是谁?听众是谁?说了什么?表述的方式如何?需要达到的目的是什么?找到以上问题的答案,自然会豁然开朗。4)形成个人的事实核查标准操作程序和习惯,建立事实核查五步法(溯源→比对→求证→思辨→验证)。利用自己的多语优势,找到多个信息来源,相互印证,兼听则明。5)实事求是,基于事实得出结论。有条件的话,不妨寻访专家和行业内部人士,多听多学,慢慢发现真相。忌听从道听途说,匆忙做出判断。
正如外交部长王毅在第61届慕尼黑安全会议上所说:“任尔东西南北风,我自泰然处之、岿然不动。”百年未有之大变局中,国家尚且如此,作为个体,更要有定力。不可否认,AI会给人类社会带来深远的影响,翻译人在积极拥抱技术,翻译教育也在积极调整。但是有些规律,不论是否有AI,都不会变:1)能力较差的人总是更难找到更好的工作;2)适应能力较差的人更容易错失机会;3)没有多少人像优秀口译员那样真正精通一门或多门外语;4)水平不好的口译员,就算不被AI替代,也会被市场淘汰;5)人如果停止学习,必将被淘汰;6)顶尖人才总是刚需;7)忙碌的人没有时间焦虑或沮丧;8)只有大量练习,才能成为翻译高手。
七、写给未来:
AI向善(AI for good),AI为民(AI for all)
AI作为一项革命性技术,必将颠覆人类的生产和生活,进而引发复杂的观念革命。过去几十年来,互联网、电子商务、物联网、大数据、云计算、新能源车、无人机等新兴技术已经悄无声息地重塑了人类社会,深刻改变了经济活动和思想生态。AI的不断进步与成熟将极大地提升人类生产效率,也会更广泛、更深远地改造人类社会本身,与原有的社会形态、生活习惯、伦理规则等人类社会的组织形式产生碰撞和交融。AI会帮助人类解决部分问题,同时因为硅基智能的先天不足,在融入人类社会生活的过程中不可避免会带来新的问题。
笔者需要申明的是,本文并不意在否定AI翻译技术和掩盖人工翻译的缺陷。AI作为底层架构的新兴翻译工具和解决方案正在迅速迭代,具有速度快、成本低的先天优势,但同时在语境理解、专业知识储备、情感交际、文化差异识别、创造性等方面存在不足。AI翻译技术目前可以做到“多、快”,但不够“好”。全新的翻译工作形态是人和AI一起,共同做到“又多又快又好”。就同传而言,据笔者观察,当前,AI在国际会议同传译员工作场景中的实际辅助作用仍然有限,仅限于通过动态双语字幕提示部分信息密集讲话中的专业术语与数字,这些信息人类译员处理起来相对困难。而AI生成的完整译文,在同传场景下基本都不可用。完全依赖AI工具的人类同传译员,在市场上不会被同行和客户尊重。
世界正处于变乱交织的转型过程之中。当前舆论场是观念的自由市场。尽管在这个市场中,有政府监管和底线约束,但是关于AI翻译,特别是AI参与的口译方面,劣质观点却比比皆是。所谓劣质观点,指片面、情绪化、有明显逻辑缺陷、经不起推敲的思潮和观念。比如技术决定论,其缺陷是忽略了人类在塑造人工智能伦理方面的主观能动性。媒体上的“AI神话”“AI崇拜”“AI跪拜”,会让公众对AI产生不切实际的期待,造成不必要的过度焦虑和恐慌。替代论鼓吹AI会替代乃至控制人类,其缺陷是过度简化人机互动和共生的复杂动态关系。甚嚣尘上的外语和翻译无用论,只表达就业焦虑,导致人心浮动,忽略了外语和翻译学习赋予人可贵的跨文化、跨思维的能力,动摇了在校翻译专业师生的教学士气,严重干扰了教学活动的正常开展。倘若不了解专业实际情况的教育决策者听信上述观念或受到上述说法的影响而采取行动,反过来会印证上述言论和加速其传播,形成恶性循环。
事实是,AI将冲击百行千业,所有行业都在努力适应。AI会写代码,让很多程序员失业,为什么没有人呼吁关停计算机专业? AI会做疾病诊断、会看医学影像,为什么没有人呼吁关停医学院? AI会判案,为什么没有人呼吁关停法学院?而AI会做翻译,为什么就众口一词地说外语和翻译无用、人工翻译会被取代,甚至有人断言,文科将会消亡,难道不让人费解?也许持这种观点的人在谈论翻译教育中的问题,比如规模上需要挤出泡沫,教学内容要紧跟时代需求,培养的学生需要满足市场要求,等等,但请不要为了倒掉洗澡水,把澡盆里的婴儿也一起丢弃。长此以往,如果学习翻译的人越来越少,在不远的未来就会出现AI翻译质量失控、国家无人才可用的风险。
笔者坚信,未来翻译不会消亡,但会与时俱进,呈现出全新形态。今后的翻译不能全由AI承担,而翻译工作者也不会失业(飞白,2024)。AI会赋能笔译者和口译员,各取所长,实现人机共生。教育场景下,AI会不等于学生会。对于广大学子而言,如果只学会应用AI投机取巧,就会导致思想钝化,千篇一律,不能实现自我成长和自我提升,这绝不是使用AI的正确方式。换言之,在教育场景中,AI要服务于人的成长(AI for abetter person)。AI本身有数据偏见、伦理、幻觉等问题,其本质是人类制造的另一个工具。工具本身没有道德伦理,但人类有道德伦理。人类使用AI,应使民生和福祉最终得到改善。AI的未来,取决于人类是否负责任地、有道德地使用它。

作者简介
雷中华,博士,北京语言大学高级翻译学院副教授。研究方向:口译理论、实践与教学。
文献来源:原文载于《中华译学》2025年第2辑(总第4辑),第209-216页。原文参考文献已省略,引用请以期刊版为准。推送已获编辑部授权,转发请注明文献来源及“浙大译学馆”。
相关链接:

夜雨聆风