《AI 3.0》解读之一:AI到底是什么?

AI到底是什么？——从起源到"侯世达的恐惧"

深度解读：AI的本质、历史与人类最深的焦虑

一本书的使命：写给"会思考的普通人"

《AI 3.0》的作者梅拉妮·米歇尔是计算机科学领域的知名学者，师从侯世达（Douglas Hofstadter）——那位因《哥德尔、艾舍尔、巴赫》（简称"GEB"）而享誉全球的跨界思想家。本书并非又一本技术著作或简单的AI发展史，而是一位深谙AI内核的科学家写给普通读者的理性之作。

段永朝在序言中精准地点出了本书的价值："讲述技术视角的思想基础，弥合'理科生'与'文科生'之间看待人工智能的思想鸿沟。"这正是米歇尔的写作初心：她无意于技术精英的自说自话，也无意于舆论场的情绪宣泄，而是试图用通俗的语言揭示AI背后的"硬核知识"，帮助读者真正理解我们正在面对的是怎样一场变革。

正如书名英文副标题所示——"A Guide for Thinking Humans"——这是一本为思考的人类而写的著作。它的核心关怀并非AI能做什么，而是我们应当如何思考AI。

AI三波浪潮：从符号逻辑到深度学习

要理解今天的AI，必须回溯其近七十年的发展历程。米歇尔将这段历史梳理为三次主要浪潮：

第一波：符号AI的黄金时代（1956-1980s）

1956年夏天，约翰·麦卡锡在达特茅斯学院召集了一个为期两个月的研讨会，参与者仅有十人，却宣告了"人工智能"这一术语的诞生。麦卡锡本人后来回忆，这个名字并非他最满意的选择——"我们追求的是'真正的'智能，而非'人工的'智能"。

这一时期的AI研究以符号人工智能（Symbolic AI）为主导，其核心假设是：智能问题可以归结为符号推理过程。代表性成果包括"通用问题求解器"（GPS）、专家系统等。这类程序依赖人类专家预先编写的规则和逻辑，将知识以人类可理解的语言编码，再用推理引擎执行。

第二波：联结主义的复兴（1980s-2010s）

与符号AI相对的是亚符号人工智能（Subsymbolic AI），它从神经科学中汲取灵感，试图捕捉那些隐藏在"快速感知"背后的无意识思考过程。这一思路最终演变为联结主义——认为智能的关键在于构建合适的计算结构，并从数据或现实世界中学习。

20世纪80年代，神经网络研究迎来复苏。1989年，杰弗里·辛顿的学生杨立昆提出了卷积神经网络（ConvNets），这一架构后来成为计算机视觉的基石。但彼时，联结主义尚未获得主导地位，符号AI仍然占据学术主流。

第三波：深度学习的春天（2010s至今）

2010年代，深度学习彻底改变了AI的格局。从IBM深蓝击败卡斯帕罗夫，到沃森在《危险边缘》中夺冠，再到AlphaGo横扫围棋界，一系列里程碑事件让深度学习成为公众视野中"人工智能"的代名词。

然而，米歇尔提醒我们保持清醒：深度学习只是AI的一种方法，它是机器学习的一个子领域，而机器学习又是AI的一个分支。媒体将深度学习等同于AI，虽可理解，却是一种令人遗憾的简化。

两大流派：规则之学与数据之学

理解符号AI与亚符号AI的本质差异，是把握AI发展脉络的关键。

符号AI：人类知识的"显性编码"

符号AI的哲学根基可以追溯到计算机鼻祖帕斯卡和莱布尼茨——他们认为思维本质上是一种符号操纵的机械过程。在这种范式下，程序设计者需要将知识显式地编码为规则和逻辑。例如，一个诊断疾病的专家系统，会由医学专家逐条输入"如果发烧且咳嗽，那么可能是肺炎"的规则。

这种方法的优点在于可解释性强——程序的推理过程可以被追踪和理解。但它的局限同样明显：知识难以获取和维护，且无法处理模糊、不确定或未曾预设的情况。

亚符号AI：数据驱动的"黑箱学习"

亚符号AI则走了一条完全不同的路。以神经网络为代表的技术，不需要人类预先编写规则，而是通过大量数据自动学习模式和特征。输入层接收原始数据，隐藏层进行层层抽象，输出层给出最终判断——整个过程类似于人脑神经元的协作机制。

米歇尔以"Copycat"程序为例，展示了亚符号AI的工作方式。这个由她自己参与设计的系统，能够在字母序列中发现类比关系（如"abc类比于abd，那么xyz类比于什么？"），但它的"思维"过程是一个无法用语言描述的数值计算过程——一个典型的"黑箱"。

两种范式的启示

米歇尔指出，这两种方法代表了理解智能的不同哲学立场。符号AI假设智能可以自上而下地通过逻辑构建；亚符号AI则相信智能可以自下而上地从数据中涌现。它们各自擅长不同的任务：符号AI适合需要推理和明确规则的场景，亚符号AI则在感知、识别等任务上表现优异。

有趣的是，这场持续数十年的"范式之争"至今没有定论。正如2014年一份AI调研报告所言："因为我们并未深入了解智能，也不知道如何创造通用人工智能，因此，想要真正取得进展，我们应当拥抱AI'方法论的无政府状态'，而不应切断任何一种探索途径。"

侯世达的恐惧：不是AI太聪明，而是太容易"模仿人性"

本书最引人深思的章节，或许是开篇关于侯世达的那段描述。2014年，在谷歌的一次内部研讨会上，这位AI领域的传奇人物对满座的研究人员说出了令众人困惑的话："我被吓坏了，完全吓坏了。"

让侯世达感到恐惧的，不是AI可能超越人类、取代人类的工作，甚至不是AI可能失控——而是AI太容易模仿人性中最珍贵的东西，以至于我们最珍视的品质可能只是"一套把戏"。

触发侯世达恐惧的，是一个名为EMI（音乐智能实验）的程序。这个由作曲家大卫·科普编写的AI，能够按照巴赫、肖邦等大师的风格创作音乐。侯世达亲耳听到EMI"创作"的肖邦风格马祖卡舞曲后，写下了这段令人动容的话：

"从孩童时期开始，音乐就令我心潮澎湃，并能将我带入它最核心的地方。对于我所钟爱的每一件作品，我都能感受到它是来自作曲之人情感深处的一封'私信'……然而，对最浅显的音节排序进行模式操纵，却能够产生听起来仿佛来自人类内心的音乐，一想到这里，我就非常非常不安。"

侯世达进一步阐述了他的担忧："如果人类这种无限微妙、复杂且具有情感深度的心灵，能被一块小小的芯片所简化，这将会摧毁我对人性的理解。"

这才是"侯世达的恐惧"的核心所在。它不是对技术能力的恐惧，而是对意义可能被消解的恐惧。当AI能够创作令人动容的音乐、写出优美流畅的文章、画出意境深远的画作时，我们不得不追问：那些曾经被视为人类独有的创造力、情感与意识，是否终究只是一套可被复制的算法？

核心结论：狭义AI与真正的理解之间，隔着怎样的鸿沟？

尽管深度学习取得了令人瞩目的成就，但米歇尔在书中反复强调一个关键区分：狭义AI与通用AI之间，隔着难以逾越的鸿沟。

今天的AI系统，无论多么强大，本质上都是"狭义"或"弱"人工智能。AlphaGo能击败世界冠军，却不会玩跳棋；谷歌翻译能把英文章节译成中文，却无法判断评论者是否喜欢这部电影。这些系统在特定任务上表现出色，却缺乏人类智能的通用性和灵活性。

更根本的问题在于理解。米歇尔引用神经科学家杰弗里·杰斐逊的观点指出，一台真正的"思考机器"应当能够感受事物并知道自己在感受——换言之，它需要拥有意识和自我认知。而今天的AI系统，无论其行为多么像人，都无法被证实真正"理解"自己在做什么。

米歇尔在本书结语中提出了6个关于AI的基本问题，她没有给出简单答案，而是邀请读者一同思考：关于意识、关于意义、关于人类智能的独特性……这些问题的答案，或许比AI本身更难寻找。

写在最后

《AI 3.0》解读之一的核心贡献，在于为读者提供了一幅清晰的认知地图：AI从何而来、经历了怎样的范式变迁、当前主流方法的优势与局限、人类对AI的忧虑究竟指向何方。

理解这些，不是为了对AI盲目乐观或悲观，而是为了在技术狂飙突进的时代保持清醒的判断力。正如米歇尔所言，她写这本书的目的，是帮助读者"清楚地认识这个领域已经取得了什么成就，以及机器距离'能够为自身之人性进行辩护'还有多长的路要走"。

侯世达的恐惧至今仍然有效：不是因为AI太强大，而是因为我们尚未真正理解自己。理解AI，或许首先要从理解人类智能的独特性开始。

本讲完。下一讲将深入探讨视觉识别的革命——从神经认知机到卷积神经网络，AI是如何学会"看"世界的。

-----------------------------------------

💡 「智博悦读・关注即送」

现在只需关注本公众号 + 点赞，即可免费领取《AI 3.0》精华本电子书。

《AI 3.0》深度解读：AI的本质、历史与人类最深的焦虑