AI到底是什么?——从起源到"侯世达的恐惧"
深度解读:AI的本质、历史与人类最深的焦虑
一本书的使命:写给"会思考的普通人"
《AI 3.0》的作者梅拉妮·米歇尔是计算机科学领域的知名学者,师从侯世达(Douglas Hofstadter)——那位因《哥德尔、艾舍尔、巴赫》(简称"GEB")而享誉全球的跨界思想家。本书并非又一本技术著作或简单的AI发展史,而是一位深谙AI内核的科学家写给普通读者的理性之作。
段永朝在序言中精准地点出了本书的价值:"讲述技术视角的思想基础,弥合'理科生'与'文科生'之间看待人工智能的思想鸿沟。"这正是米歇尔的写作初心:她无意于技术精英的自说自话,也无意于舆论场的情绪宣泄,而是试图用通俗的语言揭示AI背后的"硬核知识",帮助读者真正理解我们正在面对的是怎样一场变革。
正如书名英文副标题所示——"A Guide for Thinking Humans"——这是一本为思考的人类而写的著作。它的核心关怀并非AI能做什么,而是我们应当如何思考AI。
AI三波浪潮:从符号逻辑到深度学习
要理解今天的AI,必须回溯其近七十年的发展历程。米歇尔将这段历史梳理为三次主要浪潮:
第一波:符号AI的黄金时代(1956-1980s)
1956年夏天,约翰·麦卡锡在达特茅斯学院召集了一个为期两个月的研讨会,参与者仅有十人,却宣告了"人工智能"这一术语的诞生。麦卡锡本人后来回忆,这个名字并非他最满意的选择——"我们追求的是'真正的'智能,而非'人工的'智能"。
这一时期的AI研究以符号人工智能(Symbolic AI)为主导,其核心假设是:智能问题可以归结为符号推理过程。代表性成果包括"通用问题求解器"(GPS)、专家系统等。这类程序依赖人类专家预先编写的规则和逻辑,将知识以人类可理解的语言编码,再用推理引擎执行。
第二波:联结主义的复兴(1980s-2010s)
与符号AI相对的是亚符号人工智能(Subsymbolic AI),它从神经科学中汲取灵感,试图捕捉那些隐藏在"快速感知"背后的无意识思考过程。这一思路最终演变为联结主义——认为智能的关键在于构建合适的计算结构,并从数据或现实世界中学习。
20世纪80年代,神经网络研究迎来复苏。1989年,杰弗里·辛顿的学生杨立昆提出了卷积神经网络(ConvNets),这一架构后来成为计算机视觉的基石。但彼时,联结主义尚未获得主导地位,符号AI仍然占据学术主流。
第三波:深度学习的春天(2010s至今)
2010年代,深度学习彻底改变了AI的格局。从IBM深蓝击败卡斯帕罗夫,到沃森在《危险边缘》中夺冠,再到AlphaGo横扫围棋界,一系列里程碑事件让深度学习成为公众视野中"人工智能"的代名词。
然而,米歇尔提醒我们保持清醒:深度学习只是AI的一种方法,它是机器学习的一个子领域,而机器学习又是AI的一个分支。媒体将深度学习等同于AI,虽可理解,却是一种令人遗憾的简化。
两大流派:规则之学与数据之学
理解符号AI与亚符号AI的本质差异,是把握AI发展脉络的关键。
符号AI:人类知识的"显性编码"
符号AI的哲学根基可以追溯到计算机鼻祖帕斯卡和莱布尼茨——他们认为思维本质上是一种符号操纵的机械过程。在这种范式下,程序设计者需要将知识显式地编码为规则和逻辑。例如,一个诊断疾病的专家系统,会由医学专家逐条输入"如果发烧且咳嗽,那么可能是肺炎"的规则。
这种方法的优点在于可解释性强——程序的推理过程可以被追踪和理解。但它的局限同样明显:知识难以获取和维护,且无法处理模糊、不确定或未曾预设的情况。
亚符号AI:数据驱动的"黑箱学习"
亚符号AI则走了一条完全不同的路。以神经网络为代表的技术,不需要人类预先编写规则,而是通过大量数据自动学习模式和特征。输入层接收原始数据,隐藏层进行层层抽象,输出层给出最终判断——整个过程类似于人脑神经元的协作机制。
米歇尔以"Copycat"程序为例,展示了亚符号AI的工作方式。这个由她自己参与设计的系统,能够在字母序列中发现类比关系(如"abc类比于abd,那么xyz类比于什么?"),但它的"思维"过程是一个无法用语言描述的数值计算过程——一个典型的"黑箱"。
两种范式的启示
米歇尔指出,这两种方法代表了理解智能的不同哲学立场。符号AI假设智能可以自上而下地通过逻辑构建;亚符号AI则相信智能可以自下而上地从数据中涌现。它们各自擅长不同的任务:符号AI适合需要推理和明确规则的场景,亚符号AI则在感知、识别等任务上表现优异。
有趣的是,这场持续数十年的"范式之争"至今没有定论。正如2014年一份AI调研报告所言:"因为我们并未深入了解智能,也不知道如何创造通用人工智能,因此,想要真正取得进展,我们应当拥抱AI'方法论的无政府状态',而不应切断任何一种探索途径。"
侯世达的恐惧:不是AI太聪明,而是太容易"模仿人性"
本书最引人深思的章节,或许是开篇关于侯世达的那段描述。2014年,在谷歌的一次内部研讨会上,这位AI领域的传奇人物对满座的研究人员说出了令众人困惑的话:"我被吓坏了,完全吓坏了。"
让侯世达感到恐惧的,不是AI可能超越人类、取代人类的工作,甚至不是AI可能失控——而是AI太容易模仿人性中最珍贵的东西,以至于我们最珍视的品质可能只是"一套把戏"。
触发侯世达恐惧的,是一个名为EMI(音乐智能实验)的程序。这个由作曲家大卫·科普编写的AI,能够按照巴赫、肖邦等大师的风格创作音乐。侯世达亲耳听到EMI"创作"的肖邦风格马祖卡舞曲后,写下了这段令人动容的话:
"从孩童时期开始,音乐就令我心潮澎湃,并能将我带入它最核心的地方。对于我所钟爱的每一件作品,我都能感受到它是来自作曲之人情感深处的一封'私信'……然而,对最浅显的音节排序进行模式操纵,却能够产生听起来仿佛来自人类内心的音乐,一想到这里,我就非常非常不安。"
侯世达进一步阐述了他的担忧:"如果人类这种无限微妙、复杂且具有情感深度的心灵,能被一块小小的芯片所简化,这将会摧毁我对人性的理解。"
这才是"侯世达的恐惧"的核心所在。它不是对技术能力的恐惧,而是对意义可能被消解的恐惧。当AI能够创作令人动容的音乐、写出优美流畅的文章、画出意境深远的画作时,我们不得不追问:那些曾经被视为人类独有的创造力、情感与意识,是否终究只是一套可被复制的算法?
核心结论:狭义AI与真正的理解之间,隔着怎样的鸿沟?
尽管深度学习取得了令人瞩目的成就,但米歇尔在书中反复强调一个关键区分:狭义AI与通用AI之间,隔着难以逾越的鸿沟。
今天的AI系统,无论多么强大,本质上都是"狭义"或"弱"人工智能。AlphaGo能击败世界冠军,却不会玩跳棋;谷歌翻译能把英文章节译成中文,却无法判断评论者是否喜欢这部电影。这些系统在特定任务上表现出色,却缺乏人类智能的通用性和灵活性。
更根本的问题在于理解。米歇尔引用神经科学家杰弗里·杰斐逊的观点指出,一台真正的"思考机器"应当能够感受事物并知道自己在感受——换言之,它需要拥有意识和自我认知。而今天的AI系统,无论其行为多么像人,都无法被证实真正"理解"自己在做什么。
米歇尔在本书结语中提出了6个关于AI的基本问题,她没有给出简单答案,而是邀请读者一同思考:关于意识、关于意义、关于人类智能的独特性……这些问题的答案,或许比AI本身更难寻找。
写在最后
《AI 3.0》解读之一的核心贡献,在于为读者提供了一幅清晰的认知地图:AI从何而来、经历了怎样的范式变迁、当前主流方法的优势与局限、人类对AI的忧虑究竟指向何方。
理解这些,不是为了对AI盲目乐观或悲观,而是为了在技术狂飙突进的时代保持清醒的判断力。正如米歇尔所言,她写这本书的目的,是帮助读者"清楚地认识这个领域已经取得了什么成就,以及机器距离'能够为自身之人性进行辩护'还有多长的路要走"。
侯世达的恐惧至今仍然有效:不是因为AI太强大,而是因为我们尚未真正理解自己。理解AI,或许首先要从理解人类智能的独特性开始。
本讲完。下一讲将深入探讨视觉识别的革命——从神经认知机到卷积神经网络,AI是如何学会"看"世界的。
-----------------------------------------
💡 「智博悦读・关注即送」
现在只需 关注本公众号 + 点赞,即可免费领取《AI 3.0》精华本电子书。
《AI 3.0》深度解读:AI的本质、历史与人类最深的焦虑
《AI 3.0》的作者梅拉妮·米歇尔是计算机科学领域的知名学者,师从侯世达(Douglas Hofstadter)——那位因《哥德尔、艾舍尔、巴赫》(简称"GEB")而享誉全球的跨界思想家。本书并非又一本技术著作或简单的AI发展史,而是一位深谙AI内核的科学家写给普通读者的理性之作。
《AI 3.0》的使命:写给"会思考的普通人"
段永朝在序言中精准地点出了本书的价值:"讲述技术视角的思想基础,弥合'理科生'与'文科生'之间看待人工智能的思想鸿沟。"这正是米歇尔的写作初心:她无意于技术精英的自说自话,也无意于舆论场的情绪宣泄,而是试图用通俗的语言揭示AI背后的"硬核知识",帮助读者真正理解我们正在面对的是怎样一场变革。
✅ 领取步骤:
1. 点赞 2. 关注公众号 3. 公众号对话框回复:AI3.0,立即弹出下载链接
夜雨聆风