追寻AI,那颗最明亮的北极星——李飞飞自传《我看见的世界》导读

最近，我读了“AI教母”李飞飞的自传《我看见的世界——人工智能领域的好奇、探索与发现》一书。李飞飞是美国斯坦福大学教授，是美国国家工程院、医学院、艺术与科学院三院院士，曾任谷歌副总裁、谷歌云人工智能及机器学习首席科学家。她也是一位华裔移民，1992年15岁时随父母从四川成都举家搬迁到美国。这本书是李飞飞从一名热爱科学的少女成长为顶尖科学家的个人奋斗史，是李飞飞一家从底层移民逐步融入美国社会的家庭生活史，也是人工智能从科学家遥不可及的想象变成大众触手可得的产品，进而深刻影响人类命运的科技发展史。李飞飞教授用满腔的热情、生动的语言为我们讲述了AI从哪里来，又用她切肤的感受、深入的思考向我们指明AI应该向何处去，而这些也正是她用毕生所追寻的“北极星”。

一、AI从哪里来？

本书第一章，李飞飞就写到，算法、大规模数据和原始算力等在科学发展史上具有里程碑意义的技术，在21世纪初汇聚在一起，形成合力。虽然这些人工智能发展的必要条件用了半个多世纪才得以融合，但它们释放的能力在不到五年的时间里就将整个世界改头换面。（p4)这段话简明扼要地指出人工智能技术取得成功的三个关键要素：算法、大规模数据和算力。

早在20世纪中叶计算机出现时，阿兰·图灵等科学家就提出，人类是否有能力制造可以体现智能的机器？1956年，美国计算机科学家在《达特茅斯人工智能夏季研究项目提案》中首次提出“人工智能”这一概念。(p44)然而人工智能的发展并非一帆风顺。上世纪后半叶，人工智能研究虽然出现一些进展，但由于相关基础研究和技术条件尚不具备，人工智能几经寒冬，科学家和投资者们一度认为它只是不切实际的幻想。直到高度模拟人脑运行方式的神经网络算法，超大规模数据和超级算力快速发展，并在21世纪初最终聚合在一起，人工智能才迸发出令人惊叹的能量。

先来说算法。在人工智能探索旅程中，科学家们设计出各种算法加以尝试，虽然有的算法一度领先，但最终取得成功的是神经网络算法。这种算法高度模拟人脑运行方式，它的出现得益于神经科学的发展。其中最为关键的是1959年哈佛大学对哺乳动物大脑特别是猫的视觉皮质的研究。这项研究发现，感知不是发生在单个神经元层次上，而是在多层神经元组成的层级结构中进行。每一层神经元都聚焦在整体场景中的一个狭窄区域，单独来看并没有太大意义，但当它们传递到下一层时，就会整合成为更复杂的形状和特征，展现出更大的图像片段，最终使大脑感知到面孔、物体、地点等有意义的事物。(p65)当神经元以千亿级的数量复制，它们之间的连接达到10的11次方时，量变就发生了质变，物质变成了思维，产生了各种情感和能力。(p118)

80年代，日本和美国的研究人员将这一发现运用到计算机中，开发出类似神经网络的算法，将其搭建成层次分明的相互连接的决策单元阵列。随着这一算法稳步发展，网络层数越来越多，决策单元连接越来越复杂，训练技术也越来越完善。法国科学家杨立昆把这一成果应用到识别手写邮编的场景中并取得成功，引起广泛关注。(p66-67)“机器学习”的概念应运而生，人工智能似乎出现一丝微光。

然而，除了在识别手写邮编方面取得成功，神经网络算法在其他应用场景很快陷入困境。原因是多方面的。首先，算法所需的计算量惊人，远远超出当时大多数企业和政府的能力范围。其次，图像、视频、音频等感知数据十分稀缺，大部分储存于私人服务器中，都是碎片化的独家数据。不久，人工智能进入一个漫长的低迷期。(p114)神经网络算法被逐渐边缘化，不断迭代的各种算法一度成为人工智能研究的中心议题，但没有一种算法能够取得划时代的飞跃。

这时，李飞飞教授在数据方面艰苦卓绝的研究工作成为推动AI视觉识别跨越式发展的关键力量，这也是她不懈追寻的北极星。李飞飞认为，让算法能够识别出任何东西的秘诀，也许就在于打造一个无所不包的数据集。(p199)2004年在加州理工学院读研期间，她与导师联合创建了Caltech101图像数据集，涵盖了分布在100个类别中经过人工标注的9000个图像，这在当时已是一项浩大工程。运用这一数据集，相关模型虽有准确度提升，但并没有发生质变。(p182)李飞飞没有止步，受到视觉分类相关研究及单词数据库WordNet的启发，她计算出大致需要2.2万个类别的图像才能让机器充分学习，这是一个无比艰巨的任务。(p207)

这一命名为ImageNet的项目最初进展十分缓慢，以当时依靠在校学生手动标注的速度，大概需要19年才能完成。(p211)海量数据和经费限制一度让ImageNet接近崩溃边缘。而网络众包的适时出现，让这一项目起死回生。亚马逊的“土耳其机器人”众包服务，使得ImageNet可以在互联网上招募全球爱好者共同标注，大大缩短了项目完工时间。(p224-225)2009年，ImageNet初始版本完成，收集了1500万张图片，涵盖2.2万个不同类别。这些图片筛选自近10亿张图片，由来自167个国家的4.8万多名全球贡献者进行标注。(p231)这相当于为AI算法建造了一座巨型的数字博物馆。

然而当时，人工智能研究的焦点都集中在算法上，ImageNet的出现并没有激起多少水花，许多研究者甚至对它不屑一顾。李飞飞坚信ImageNet有其独特价值，它不仅是一个数据集，更是一个算法的测试平台，可以拓宽算法的感知能力，同时用比以往更严格的方式对算法进行测试。(p238)2010年，她开始组织“ImageNet大型视觉识别挑战赛”，对全球的算法开放。第一届挑战赛的结果令人失望，冠军被当时流行的一种算法取得，但并没有实质性突破，第二届冠军也仅仅将准确率提高2个百分点。随着参赛人数和算法数量急剧下降，李飞飞感到羞愧和挫败。(p246-247)

转机发生在2012年，一个名为AlexNet的算法脱颖而出，图像识别准确率高达85%，比上一年冠军高出10个百分点，创造了计算机视觉领域的世界纪录。虽然这个算法还没有达到人类水平，但差距已经不多。(p256)AlexNet 是一种卷积神经网络，灵感就来自哈佛大学对哺乳动物视觉系统的研究，它忠实于生物视觉的进化本质。视觉处理在多个层次上进行，每一层都会逐渐整合更多的细节信息，从而形成越来越高层次的感知，最终将真实世界的物体完整地呈现在视野中。这种算法没有预先决定神经网络应该寻找哪些特征，而是让数十万个神经元完全依靠训练数据自我学习。(p258)卷积神经网络算法并非新鲜事物，20多年前就被应用于手写邮编识别，它能够重新焕发生机，正是得益于ImageNet提供的大规模数据。可以说，如果不是当时李飞飞另辟蹊径，敢于打破AI研究中的“唯算法论”，AI的范式革命就不会这么快到来。

在大规模数据之外，还有一个至关重要的因素，那就是算法运行所需要的硬件。在很长一段时间里，神经网络训练难度很大，硬件的限制是致命的。而此时，硬件已取得长足进步，价格低廉但性能出色，让大规模数据训练成为可能。有意思的是，这要归功于电子游戏的流行。上世纪90年代以来，价值数十亿美元的电子游戏产业一直推动着定制硬件的进步，助推了英伟达等品牌的崛起。到2012年，图形处理器（GPU）已经以优惠的价格成为消费品，可以在电子产品卖场里轻松买到。(p261)AlexNet正是搭载在两台英伟达GPU上不停地训练。几十年来，神经网络算法一直等待着大规模数据和强大算力的出现，才充分展现出它的能力。

2012年的ImageNet挑战赛成为一个分水岭，全世界开始认识到，比赛结果不仅仅是计算机对图片理解的转折点，更是对一切事物理解的转折点。AlexNet展示了大规模数据集、高速图形处理器和深度分层神经网络三者近乎神奇的组合，深度学习的时代已经到来。(p309)

在本书的前四分之三，李飞飞向我们生动介绍了人工智能从想象变成现实的过程。对于我这样的外行来说，是再好不过的人工智能科普读物。在我看来，科技的发展之路大多是曲折的，人工智能也不例外，它之所以在近十年掀起巨浪，的确是诸多条件因缘际会的结果。生物学、神经科学、算法、芯片、电子游戏、互联网、大数据等的飞速发展，缺一不可。而其核心，就是从人类认识世界的方式中汲取灵感。要实现人工智能，关键的第一步是更好地了解人类。（p152）

二、AI向何处去？

在短短十年左右时间里，算法已经从难以识别照片内容，发展到以超人类水平进行识别，甚至可以创造全新的图片，并且达到惊人的逼真度。大语言模型生成的文本、图像、语音和视频越来越复杂，真假之间的界限愈加模糊。深度学习的时代已经让位于生成式人工智能的时代。(p410-411)李飞飞认为，人工智能已不再是智力上的好奇探索，而是即将改变全人类生活的转折点。(p386)如果人工智能与其他领域相结合，并借助其他形式的专业知识进行推动，可行性就是无限的。(p344)通用人工智能（AGI）很有可能在不远的将来成为现实。(p356)然而与之相伴的，是人们对人工智能与日俱增的疑虑和恐慌。这项技术将如何发展，供谁使用？如何评估人工智能的未来？目前还没有明确答案。本书后四分之一，李飞飞结合亲身经历，着重探讨了人工智能可能的未来，特别是人工智能面临的伦理问题。她提到的问题主要有以下几点。

监控问题。这种例子不胜枚举。例如，为了帮助减少医生护士手部卫生疏忽导致的医疗事故，李飞飞与其他研究人员合作设计了利用人工智能追踪手部卫生的项目。然而项目最初推进时，却被医生护士理解为“老板监视器”。(p340-341)又如，亚马逊使用一系列监控工具实时追踪工人的工作效率，这种管理方式受到媒体抨击。再如，微软在试图推广人工智能面部识别技术时，遭到隐私权倡导者和公民自由组织的批评。(p377-378)

算法偏见问题。一方面，当互联网呈现的主要是以白人、西方人和男性为主的生活画面时，人工智能便很难正确理解其他人群。另一方面，科技行业的从业者代表性不足，人工智能存在“男性之海”问题，导致算法无意中带有偏见。(p362-363)

数字特权问题。大模型训练成本高昂，动辄需要成百上千个GPU，只有资金最雄厚的实验室和公司才负担得起。对于研究人员来说，企业的研究不仅是更有利可图的选择，而且正在成为唯一选择。(p371)近十年，美国越来越多研究人员离开高校，加入硅谷。李飞飞也曾短暂担任谷歌云人工智能首席科学家。在谷歌，她的团队比在斯坦福大几个数量级，运营着规模更大的实验室，可以使用任何规模的高性能算力，获得无法想象的海量数据，并同时推动着成千上万个人工智能应用案例。(p369)她清醒认识到，市值接近万亿美元的公司已经掌握了主导权，潜在风险的发展步伐也急剧加快。显著的特点是监督减少、不平等加剧，如果处理不当，甚至可能导致迫在眉睫的数字独裁主义问题。(p374-375)人工智能正在成为一种特权，一种排他性极强的特权。(p372)

此外，本书还简要点出了AI替代就业、算法无法问责、业界缺乏自省等问题，这些问题似乎正在变得无人可控。

如何应对这些问题？李飞飞给出的答案是“以人为本的人工智能”（Human-Centered AI），这也是她追寻的下一颗北极星。她认为，我们要从根本上重新构想人工智能，使其成为以人为本的实践。人工智能一直以来都追求科学性，而现在，它也必须追求人性。(p393)在李飞飞看来，人工智能最伟大的胜利不仅是科学上的，也是人文上的。(p347)人工智能是一种责任，是我们所有人共同承担的责任。(p392)为此，她发起成立了斯坦福大学以人为本人工智能研究院，旨在使其成为跨学科合作中心，推动人工智能真正具有包容性，确保人工智能不会被科技巨头或大学垄断。(p400-402)

虽然人工智能在过去十年取得巨大成功，但它仍处于早期发展阶段，并没有明确的伦理准则。围绕人工智能的争论还在持续，人类对这一领域的认识才刚刚起步。(p385)尽管李飞飞教授是资深的人工智能学者，但在目前阶段，她也只能简单点明人工智能可能存在的风险，并给出未来的大致方向。李飞飞认为，人工智能的未来取决于比单纯的技术更深层次，更有影响的问题：在我们创造的过程中，是什么激励着我们的心灵和思想？(p417)

在我看来，李飞飞教授之所以选择投身以人为本的人工智能，与她善良的底色和对科学的热爱分不开，同时也与她作为女性和移民曾经遭受的不公正待遇紧密相关。但是，人工智能真的会向以人为本的方向发展么？当AI被资本和权力垄断，它是否还能服务于最广泛的人群？道高一尺魔高一丈，这必将是一条坎坷崎岖的道路。其间的斗争与妥协，伤痛与反思，或许将在人类历史上留下浓墨重彩的一页。

三、李飞飞的成长之路

在本书中，作为与AI发展史并行的另一条主线，李飞飞向我们讲述了她个人的成长之路，以及她的家庭逐步融入美国社会的故事。从中我们不难看出李飞飞为什么能在AI领域取得巨大成功，也能感受到移民身份带来的同理心、女性科研视角、底层生活体验，是她区别于硅谷纯技术派，提出以人为本人工智能的根本原因。

先来说李飞飞本人。她在本书中多次提到北极星的意象。她说，北极星象征着科学家最独特的品质：充满永不停歇、永无止境的好奇心，这份好奇心跟满足感永远同极相斥。(p311)在思想的世界里，存在无数个类似北极星的导航指引。每一种新的追求，每一个新的痴迷，都悬挂在黑暗的地平线上，闪烁着耀眼的光芒，向不懈追寻的人们招手致意。(p418)正是这种对科学强烈的热爱，对未知永不满足的好奇心，指引着李飞飞不断突破障碍、超越自我。在初中以前的应试教育和学校重男轻女的环境中，李飞飞没有丧失对物理的热爱。在移民初期半工半学的压力和暴力威胁的境遇下，她愈挫愈勇。在ImageNet多次陷入困境时，她也曾自我怀疑，但最终坚持下来。如今李飞飞达到的成就，不仅是她个人的成功，也是科学家精神的胜利。

再来说说家庭对她的支持。李飞飞父母的教育方式不走寻常路。在他们看来，努力学习不是为了取悦任何人，迎合某种规则，或者得到任何东西，努力只是为了自己。(p24)在李飞飞年少时，父亲给了她纯粹的好奇心，母亲则教她广泛阅读。据说，80年代李飞飞在成都时，父亲给她定了条规矩：放学回家后只能在40分钟内做作业，40分钟后可以看课外书、可以玩，干什么都可以，但就是不能做作业。（引自豆瓣书评《李飞飞的征程》）移民到美国后，尽管母亲身患重病，全家生活窘迫，但父母始终坚信，李飞飞对科学的热情不能忽视。(p92)高盛、美林、麦肯锡都曾在李飞飞毕业时伸出橄榄枝，她本人也有所动摇，却都被母亲坚定拒绝。因为母亲知道，她的女儿想成为一名科学家。(p137,179)

李飞飞在美国的高中数学老师——萨贝拉先生和他的家人，在李飞飞的成长道路上同样不可或缺。李飞飞初到美国时，萨贝拉先生的耐心辅导，帮助她克服了语言、学业上的障碍，给了她真正的安全感。本科和读研期间，他们每周保持联系，对大小事情，萨贝拉先生都像慈父一样给出建议。在李飞飞一家想开干洗店却囊中羞涩时，萨贝拉和妻子慷慨解囊。萨贝拉已经把李飞飞看成了女儿，而李飞飞也把萨贝拉一家当作了亲人。李飞飞写到，美国的爱国主义教育从她上高中时就开始了，但移民群体真实生活的凄凉状况，使这些课程从未真正触及她内心深处。萨贝拉一家却是她在这片土地上最珍视的人道主义典范，他们闪耀着人性的光辉。(p415)

家庭教育给予了李飞飞勇敢追梦的精神内核，而美国优越的教育和科研环境则让她有机会梦想成真。这种环境的优越不只因为这里有前沿的科技、雄厚的资本、众多的诺奖得主，更重要的是这里有一大批像李飞飞一样热爱科学、醉心科学的研究人员。无论是她的导师，还是她同为科学家的丈夫，抑或她那些杰出的学生，用李飞飞的话说，他们都有一种只能用“陶然自得”来形容的好奇心。(p143)虽然多少有些书呆子，但这些书呆子呆到一起，就会激发出惊人的创造力。硅谷的科技公司也是如此，李飞飞认为，这些公司之所以强大，正是因为成千上万个才华横溢的人在同一个屋檐下共同努力。(p392)

以上，便是我对本书主要内容的介绍。受个人学识所限，在此仅对本书脉络作了一点浅显梳理，并未对AI面临的争议和治理方案作深入探讨，不到之处还请包涵。通过这本自传，李飞飞教授不仅向我这只AI小白完整科普了AI的缘起与前路，也带给我一些思考：如何推动AI向前发展，最重要的是更好了解人类和世界本身。AI如何以人为本、智能向善，根本的推动力是深植于大众心中的人本主义精神。如何在AI竞争中赢得一席之地，关键是要给各类人才提供良好的发展环境。最后，感谢李飞飞教授带给我们的精彩故事，感谢译者赵灿女士的杰出工作。致敬李飞飞教授一路走来的艰辛旅程，感谢你和无数个热爱科学的你们心中闪耀的北极星！