《AI 3.0》解读之五:自然语言处理的神话与现实-夜雨聆风

《AI 3.0》解读之五:自然语言处理的神话与现实

当我们与Siri对话、向谷歌翻译求助、让ChatGPT撰写文章时，一个令人着迷的问题始终萦绕在心头：这些机器真的理解我们说的话吗？还是仅仅在玩一场精妙的文字游戏？

在《AI 3.0》第五讲中，复杂系统科学家梅拉妮·米歇尔以其一贯的冷静与洞察，深入剖析了人工智能在自然语言处理领域的成就与局限。她的核心论断掷地有声：机器可以学会使用语言，但它们并不真正理解意义。这一论断不仅揭示了当前AI技术的本质，更触及了人工智能领域最深刻的哲学困境。

一、机器翻译：一场华丽的文字拼图

让我们从机器翻译这个最具代表性的应用说起。当你在国外旅行时掏出手机，将一段中文输入谷歌翻译，几秒钟后便得到了看似流畅的英文译文。这一过程看起来如此自然，以至于我们很容易产生一种错觉：机器真的懂得两国语言。

然而，米歇尔在书中揭示了一个令人震惊的事实：机器翻译的本质是词语概率匹配，而非语义理解。

让我们拆解这个过程。现代神经机器翻译系统的工作原理大致如下：系统首先将源语言句子编码成一组数字向量——这些向量捕捉了词语之间的统计关联；随后，解码器根据这些统计模式，生成目标语言中最可能出现的词语序列。整个过程中，系统并不“理解”任何词语的含义，它只是在执行一场复杂的概率游戏。

举一个经典的例子。在中英文翻译中，“一石二鸟”可能被直译为”one stone, two birds”，机器会忠实地完成这个转换。但如果你问机器：“这句话是什么意思？它体现了什么智慧？”机器可以给出一个标准答案，因为这个解释在训练数据中出现过很多次。然而，机器并不真正理解“石头”“鸟”是什么，也不理解为什么要用这种方式表达“以最小的代价获得最大收益”的智慧。

米歇尔引用了大量翻译失误的案例来说明这一点。2018年的一次新闻报道中，某翻译系统将“一带一路”错误地翻译为”one belt one road”（直译的直译），暴露出系统对文化语境理解的缺失。更耐人寻味的是，即使在简单句子的翻译中，机器也常常在细微歧义面前折戟沉沙——人类读者能够根据上下文瞬间理解的含义，机器却可能给出截然相反的译文。

这里的核心问题在于：翻译不仅仅是词语的替换，更是意义的传递。意义的传递需要理解——理解词语背后的概念、情感、文化内涵以及说话者的意图。而当前的机器翻译系统，恰恰缺失了这些关键要素。

二、大模型的本质：超级预测机器

如果说《AI 3.0》出版时的GPT-3已经令人惊叹，那么回顾米歇尔当时的分析更显得意味深长。她以极为敏锐的眼光指出：大语言模型的本质是“预测下一个词”的统计机器。

这句话看似简单，却蕴含着对AI本质的深刻洞察。让我们来理解这个过程：

当你向GPT-3输入一句话时，它的工作只有一个：预测下一个最可能出现的词。为了完成这个任务，系统在训练阶段“阅读”了互联网上的海量文本——这包括新闻、小说、论文、代码、论坛对话等各种形式的文字。通过这种无监督学习，系统逐渐掌握了词语之间的统计关联：哪些词经常一起出现、哪些句式结构最为常见、什么样的表达在什么语境下更为恰当。

米歇尔强调了一个关键点：大模型没有“知道”，只有“输出”。当GPT-3回答关于量子物理的问题时，它并不是在“回忆”所学的知识，而是在根据训练数据中的统计规律生成最可能的文本序列。当它写出一首看似有创意的诗歌时，也只是在“模仿”它见过的诗歌风格。这种“模仿”可以做到以假乱真，但本质上与真正的创作或理解无关。

为了说明这一点，米歇尔引用了著名的”Eliza效应”——人们倾向于将计算机程序拟人化，赋予它实际上并不存在的心智状态。当我们与一个对话机器人交谈时，如果它的回应足够流畅，我们就会不由自主地认为它真的理解了我们在说什么。但这种理解只是表面现象。机器用语言，但不懂意义。

一个发人深省的对比是：人类婴儿学习语言的过程，是将词语与真实世界的体验相联系的过程。孩子听到“狗”这个词，会看到真实的狗、触摸狗的毛发、感受狗的体温。而大语言模型学习“狗”这个词，只是通过数十亿次在文本中观察它与哪些词一起出现。没有具身经验、没有真实感知，词语对机器而言只是抽象的符号。

三、语言理解的最大障碍：常识的缺失

如果说机器翻译的局限还可以通过更大的模型和更多的数据来部分弥补，那么常识缺失则是横亘在AI理解语言之路上的根本性障碍。

什么是常识？米歇尔在书中给出了清晰的定义：常识是人类与生俱来的关于世界运作方式的基本理解，它包括直觉物理学（物体在无支撑时会下落）、直觉生物学（生物会生长、繁殖、死亡）、直觉心理学（人类有意愿、情感和行为动机）等多个层面。这些知识对人类而言如此基础，以至于我们几乎意识不到它们的存在。

然而，正是这些“显而易见”的知识，构成了人类理解语言的根基。考虑这样一个句子：“小明把冰箱里的牛奶拿出来喝掉了。”理解这句话需要多少常识？

首先，你需要理解“冰箱”是用来保存食物的低温容器，“牛奶”是可以饮用的白色液体，“喝掉”意味着将液体送入口中并吞咽。进一步，你还需要理解“小明”是一个有自主行为能力的人，他可能有口渴的需求，或者只是单纯地想品尝牛奶。这些推断瞬间完成，几乎不需要意识参与。

但对于缺乏常识的AI系统，这个句子可能引发一系列问题：如果训练数据中“冰箱里的牛奶”与“倒入杯中”高度关联，系统可能会困惑于“直接喝”是否符合常规；如果出现“喝掉”与“牛奶”这类新奇的搭配，系统的预测就可能偏离预期。更重要的是，系统根本无法理解这句话所蕴含的因果链条和心理状态。

米歇尔在书中详细描述了一个实验：研究人员让AI系统阅读包含物理常识的小故事，然后回答关于物理世界运作方式的问题。结果显示，即使是简单的物理直觉，AI也频频出错。原因很简单：这些系统从未真正“体验”过物理世界。它们不知道水会打湿东西、不知道物体有重量、不知道碰撞会导致物体运动或停止。

常识的缺失还带来了另一个严重问题：AI无法进行可靠的推理。当人类说“如果明天下雨，我就不出门”时，我们理解这是一种条件假设，并能够根据实际情况判断说话者的意图。但AI可能会将其字面化处理，无法理解这是说话者在表达一种偏好或计划。

米歇尔指出，赋予AI常识的尝试早在20世纪80年代就开始了——最著名的例子是Cyc项目，该项目试图通过人工编码数百万条事实和规则来构建一个“常识知识库”。然而，四十年过去了，这个项目依然未能成功。原因正如米歇尔所言：常识太庞大、太隐性、太依赖于身体体验，无法通过枚举规则来穷尽。

四、意义的屏障：机器能跨越吗？

在第五讲的最后，米歇尔回到了本书的核心问题：机器是否能够真正理解意义？

她的答案既审慎又深刻。米歇尔认为，意义不仅仅是语言符号之间的关系，更是符号与人类经验、情感、文化之间的深层连接。当我们读到一首诗时感到心弦被触动，这种体验需要我们将诗中的意象与自己的生命经验相联系——这种联系是AI无法复制的。

然而，米歇尔也承认，“理解”这个词本身就充满歧义。如果我们采用一个宽松的定义——能够根据上下文恰当使用语言、能够完成各种语言任务——那么当前的大语言模型已经展现出惊人的能力。但如果我们采用更严格的标准——真正理解词语背后的概念、能够进行抽象思维、能够进行类比和隐喻——那么AI与人类之间仍然横亘着巨大的鸿沟。

米歇尔引用了她与导师侯世达（Douglas Hofstadter）共同关注的“类比”这一认知能力。类比是人类思维的核心：我们通过将新事物与已知事物进行比较来理解世界。但类比不仅仅是表面特征的匹配，更需要对深层结构的把握。一个孩子看到水从杯子倒入碗，能够理解这是“转移”，并可能类比到将糖果从盒子转移到口袋。这种从具体到抽象的跳跃，是当前AI难以企及的能力。

有趣的是，米歇尔指出，即使是最先进的大语言模型，其成功也部分依赖于“记忆检索”而非“真正理解”。当ChatGPT回答一个关于历史事件的问题时，它很可能是在“回忆”训练数据中类似问题的答案，而不是真正理解了这段历史。这种区分至关重要：检索可以伪装为理解，但它们本质上是不同的过程。

五、写在最后：神话与现实的边界

《AI 3.0》第5讲的核心价值，在于帮助我们划定人工智能能力的边界。机器翻译令人惊叹，但它不理解语言；大模型流畅自如，但它只是在玩概率游戏；虚拟助手对答如流，但它缺乏真正的常识支撑。

这些局限性并不意味着AI技术毫无价值。相反，正是这些局限性提醒我们：当前AI的“智能”是一种非常特殊的智能——它在特定任务上表现出色，但缺乏人类智能的通用性和灵活性。

对于普通读者而言，理解这些局限性有助于我们更理性地看待AI新闻中的各种“突破”和“震撼”。当某家公司宣布其AI系统通过了某项语言理解测试时，我们不妨追问：它是真的理解了，还是只是在测试数据上表现良好？它能够将学到的知识迁移到新的情境中吗？它能够处理长尾的、罕见的、需要常识推理的情况吗？

对于AI从业者和研究者而言，米歇尔的分析指向了更有意义的方向：如果我们要建造真正理解语言的机器，就必须解决常识问题、意义问题和具身认知问题。这些问题不能仅仅通过scale up（扩大规模）来解决——尽管这在短期内可能带来性能提升。

《AI 3.0》第5讲给我们的终极启示或许是：语言的边界就是思维的边界，而思维的边界远不止于语言。人类用语言表达思想，但思想本身远超出语言的范畴。机器可以学会流利地使用语言，但如果它从未体验过世界的温度、未曾在雨中奔跑、未曾为爱人流泪，它真的能理解“孤独”“温暖”“人生”这些词语的深意吗？

答案或许藏在米歇尔转述的一句话中，那是OpenAI联合创始人Ilya Sutskever对大模型的期许：“当我们训练一个大型神经网络来准确预测大量不同文本中的下一个单词时……它正在学习一个世界模型。”

这个观点至今仍有争议。但无论如何，有一点是确定的：无论机器是否真正理解语言，它们已经成为人类社会中不可或缺的语言工具。而理解它们的本质与边界，将帮助我们更好地使用它们——以及更好地理解我们自己。

____________________________________

🌟 欢迎关注「人工智能与博物馆」！免费领取【AI + 文博专属精选电子书礼包】✅ 领取步骤：

1. 点赞

2. 关注公众号

3. 公众号对话框回复：AI大礼包

立即弹出下载链接

————————————–

💡「智博悦读・关注即送」

现在只需关注本公众号 + 点赞，即可免费领取《AI 3.0》精华本电子书。

✅ 领取步骤：

1. 点赞
2. 关注公众号
3. 公众号对话框回复：AI3.0，立即弹出下载链接