
本文来源于湛庐文化。为防止不可抗力因素导致的失联,欢迎添加本号主编的微信号:puoker。
历史学家塞巴斯蒂安·马拉比的《哈萨比斯:谷歌AI之脑》是一部关于智能的故事。它叙述了谷歌DeepMind创始人德米斯·哈萨比斯的传奇。哈萨比斯于1976年出生,他4岁就会下象棋,很快成为神童;13岁时,以Elo 2300分的成绩获得大师级别;16岁时,进入剑桥大学计算机科学专业。2005年,进入伦敦大学学院攻读认知神经科学博士学位,开创性地发现大脑中海马体与情景记忆间的关系。17岁时,他负责经典模拟游戏《主题公园》的开发,是最早包含人工智能元素的游戏之一,并在1994年发布。1998年,成立电脑游戏公司“仙丹工作室”,加入商业界。2010年,创立DeepMind。2018年,入选英国皇家学会院士。

01
内部胜过外部:揭开表象背后真相
哈萨比斯毕生追求的终极目标是,探索机器超级智能。他曾认定有两个领域最值得探索:物理学和神经科学。物理学解释从粒子行为到宇宙运行的外部世界,神经科学则探索内部世界——由神经元、突触和电脉冲构成的智能。20多岁时,他就得出结论:内部胜过外部。两者之间神经科学更加重要:智能是本,是万物之根,是人类感知现实的机制。
伟大的物理学家理查德·费曼曾说:“我无法创造的东西,我就无法理解。”遵循费曼的格言,科学家若要理解人类智能,就必须构建出一个人工模型:一台能模仿人类思维的机器。AI的实际应用或商业价值只是次要考量。哈萨比斯真正想要的是“更深入地理解我们自己的心智”——能让我们能更深入地了解自身的机器,能让我们破解物理学无穷奥秘的机器,在宇宙中所占据的位置相当于宗教信徒曾赋予全能神明的宇宙核心地位的机器。
到了2016年,DeepMind这家已被谷歌收购的英国小型研究团队解决了计算机科学领域的一大挑战,其开发的系统能力超越了古老的围棋世界顶尖选手的直觉天赋。2020年,DeedMind又解决了生物化学领域的第二个重大挑战,通过整合32种算法,成功破解了自然界中几乎所有蛋白质的结构。哈萨比斯也因此与他人共同获得诺贝尔化学奖。
对于哈萨比斯来说,AI的发展有点像工业革命,“它以某种方式发展起来,其实带有一定的偶然性”。然而,研发AI的真正原因早已超越了康德和费曼的理论,其目的是更接近某种可以成为“神”的存在——那个可能设计到我们周遭一切的智能。一台未来的电脑,一台强大的AI,或许会是无限的、无所不能的。哈萨比斯的志向之一就是,超越牛顿和爱因斯坦这些科学偶像,“理解现实的本质”。为此,他几乎是竭尽所能。“我唯一知道真的尽了最大努力的方法,就是把自己逼到濒临崩溃的边缘,因为只有到那一刻,你才算真正尽了全力。”他深信,大脑能做的事情,计算机总有一天也能做到。
成功总是来自多种因素。同样的,多种因素共同推动着哈萨比斯走向AI领域。但最强大的驱动力或许是探索的乐趣,是对揭开表象背后真相的期待。哈萨比斯对知识来者不拒。他曾认真考虑从事理论物理的工作。这个领域吸引他的地方在于,它试图解答最宏大的问题——宇宙本质和现实的构成。但物理学对他来说成功的概率太低。在他看来,爱因斯坦之后的所有物理学家最终都未能如愿,他们始终没有找到一个能解释所有现实的理论。于是,他决定借助AI来探索物理学中那些无穷无尽的奥秘。
像数学这样的演绎系统可能是描述物理学的完美语言。牛顿就用一系列方程成功捕捉了运动的本质,但AI可能是描述生物学的正确语言,因为生物学是如此混乱、具有涌现性、动态且复杂。很难想象能用牛顿的各定律那样简洁优美的公式来描述一个细胞。但如果将海量的细胞数据输入一台归纳型计算机,这台机器或许能找到描述运作的方式,发现解释细胞行为的隐藏模式和规律。因此,哈萨比斯需要构建这种信息系统,也就是AI,很可能这就是解决这个问题的正确工具。AI不仅能拓展科学的前沿,还能做更多的事情:研发药物、延长人类寿命、解决核聚变面临的障碍、实现清洁能源的充足供应。一台能够处理海量数据的无限机器,其影响力也将是无限的。
02
成功的策略:通过反复的试错
哈萨比斯很喜欢伊曼努尔·康德的观点,即外部世界本质上是一种精神建构。他认为,物理学家所研究的物质、能量和时间,最终都不如神经元之间传递的信息真实。他一直对“缸中之脑”这个思想实验很着迷。这个哲学实验旨在探索现实与意识之间的关系。实验假设,一个大脑被从身体中取出,放在一个装有营养液的罐子里维持生命。它与一台电脑相连,这台电脑模拟各种感官输入,比如大海的景色、海浪的声音、盐和海藻的气味。这台电脑创造的虚拟现实如此逼真,以至于大脑相信自己仍然过着正常的生活,通过眼睛、耳朵和鼻子感知外部世界。
为此,哈萨比斯认为,世界的结构本质上是由心智创造的。他想用他的神经科学研究来证明这一点:现实可能是一种模拟,而这就是康德想要表达的意思。哈萨比斯阅读了许多与人类记忆运作方式有关的书籍。对此,他曾经历过一个顿悟的时刻:如果记忆是被重建的,那么或许它的大脑机制与想象力相同,“或许从研究想象力入手,会是解决记忆争议问题的一个创造性方法”。
哈萨比斯对物理学的好奇心促使他投身AI研究,将其视为解锁科学奥秘的终极工具;他对AI的好奇心又引导他去研究人类大脑——这个智能存在的证明。他在电子游戏中对模拟的研究,与他在心智中对模拟的研究相呼应。从康德、哥德尔、艾舍尔、巴赫、约翰·多格曼的辅导课,到神经科学,各种不同的影响都将哈萨比斯引向了一个核心结论:信息是现实的基本单位。
2009年,哈萨比斯为他设想中的AI初创公司——DeepMind——撰写了一份商业计划书,并将其命名为“猎户座计划”。该计划旨在打造一个类人脑计算机,能够处理记忆和想象力。内容涵盖了未来主义这样的高端概念。计划书指出,人类大脑的存储容量有限,人类的寿命有限,而将人类组织在一起往往导致效益递减,因为大型组织通常反应迟缓,而AGI(通用智能)是解决这个问题的关键。
DeepMind旨在打造智能体,而不仅仅是系统。智能体将更具通用性和主动性。它们不会由人类针对单一有些任务进行编程,而是会广泛且自主地学习,在与环境交互的过程中掌握各种问题的解决方法。要实现这一愿景,必须教会智能体复杂的技能,例如掌握概念。为了赋予智能体这种能力,DeepMind将发挥其在神经科学方面的专长,特别是融入关于海马和前额皮叶质中的一系列复杂的相互作用的研究结果。
DeepMind(深度思考)这个名字既致敬了杰弗里·辛顿开创的AI学派——深度学习,也致敬了击败国际象棋世界冠军的计算机“深蓝”(Deep Blue),还致敬了《银河系漫游指南》中的超级计算机“深思”(Deep Thought)。哈萨比斯以此构想了一种将对世界产生巨大影响的技术。
在哈萨比斯看来,真正的AI,即能够理解图像、语音等复杂无序现象的计算机,必须通过大量实例的归纳总结来学习,也就是进行归纳推理。DeepMind成立的核心前提,就是基于对深度学习即将取得突破性进展的判断。而实现AGI不仅仅要复制人类大脑的各个组成部分,更要将这些部分整合起来。因此,图像识别领域的进步只是拼图中的一块。
更大的挑战是能解决计算机视觉等问题的深度学习与能实现包括制定计划和战略思考能力等智能维度的强化学习的结合。这样的一种“深度学习智能体”,它无需被告知规则就能精通游戏。这种模型会通过数百万种尝试,观察每种尝试的结果并找出有效方法:通过反复试错归纳出成功的策略。DeepMind坚持跨学科的愿景。它强调智能体和通用智能,追求的是更高级的目标:一个能够在多种环境中制定计划并实现目标的智能体。真正的智能体能让几乎一切成为可能,其重要性将超过互联网、印刷术,甚至工业革命。它将引领人类进入一个资源极大丰富的后稀缺时代。
2014年1月底,谷歌以6.5亿美元的价格收购了DeepMind。对哈萨比斯来说,他拥有了美国母公司谷歌的资金和算力资源,但仍然经营着一家几乎自主决策的初创公司,而且是在伦敦运营。
03
进化:确保最优秀的智能形式胜出
《哥德尔、艾舍尔、巴赫》所揭示的核心思想是,人类大脑能做到的事情,计算机也应该能做到。哈萨比斯相信,智能的所有表现形式归根结底都是在海量杂乱的信息中识别模式。直觉本质上是某种巧妙的算法——一种科学能够揭示的算法。
围棋规则的组合复杂度极高。在19×19的棋盘上落子,仅走一步就进入360种可能的位置。第二步后,可能的走法序列数量达到361×360种;第三步后,数字变为361×360×359——接近4,700万种。一场围棋比赛中可能出现的棋盘状态估计至少有10¹⁷º种,远远超过可观察宇宙中的原子数量。围棋令人惊叹的复杂度给智能系统设计者带来的难题。要攻克围棋,机器必须像人类一样观察棋子的布局、棋子构成的定式,并凭直觉找出正确的走法。而深度学习围棋系统也能观察棋盘上的态势,并映射出人类专家会选择的走法。然而,如果只是模仿人类的走法定式,就永远无法击败顶尖人类棋手。系统必须能发现非人类风格的新走法。
DeepMind拥有两个直觉模型:“策略网络”——观察行棋局面并提出走法,以及“价值网络”——观察行棋局面并评估获胜概率。两者皆可被描述为类似丹尼尔·卡尼曼的“系统一”网络,模仿人类智能中快速思考的部分,但真正强大的是让直觉型深度学习模型与内省型强化学习(树搜索——智能中更深层次、更缓慢的系统二部分)协同工作。
多亏了策略网络,搜索算法不再需要从无数可能的走法开始,去判断哪些做法可能会富有成效,而是先可以分析专家可能会选择的走法,大幅修剪搜索树。同样,多亏了价值网络,模型不再需要计算直至游戏结束时的走法序列,而是可以在计算资源允许的范围内跟踪序列,然后让价值网络对最终的行棋局面进行评分。掌握了哪个局面最佳的信息后,系统就能找出通往该局面的做法。围棋庞大的组合复杂度难题就此被攻克。
2015年10月,DeepMind迎来了一个里程碑,先击败了一个初级智能体,又击败了以围棋研究获得博士学位的中国台湾科学家黄士杰,再击败了三届欧洲围棋冠军、中法混血职业选手樊麾。而此时DeepMind智能体也命名为“AlphaGo”。
运行在AlphaGo上的是一种取代英伟达GPU的谷歌自研专用芯片。这种名为“张量处理单元”的TPU的芯片比GPU运算速度更快,通过将数字四舍五入到最近的整数并牺牲少量精度,它可以额外执行数万亿次乘法运算。它在2016年3月三次击败韩国选手李世石。尤其是第二天第二场比赛,AlphaGo走出了第37步棋:一颗黑子落在一片几乎空旷的区域,突袭李世石的右侧。而李世石从未见过这样的走法。事实证明,这是一步绝妙好棋。第37步棋被证明是决定性的。为此,李世石认为AlphaGo是“有创造力的”。AlphaGo的出现,终结了AI领域默默无闻、谦逊低调的纯真时代。这意味着,在围棋领域,我们已经实现了超级智能,我们可以体验与它互动的感受。
谷歌创始人拉里·佩奇早在半个世纪前就表示过,他期待有一天人类能与智能机器融合,或者机器干脆取代人。进化将确保最优秀的智能形式胜出,如果这种最优形式是高速硅电路而非慢速生物组织也无妨,因为这就是大自然的生存法则。佩奇认为,机器在很多方面都比人类更优秀,如果我们能摆脱人类的阻碍,让机器放手去做,就能释放各种进步的可能。
例如,在医院的AI革命中,DeepMind一直致力于破解智能的最高优先级。2019年,DeepMind 宣布了其在AI帮助下更早诊断肾损伤项目的结果,借助AI在严格完成患者数据匿名化处理后训练的模型,实现比常规血液检查早一到两天预测出急性肾损伤的发作。眼部疾病和乳腺癌诊疗相关工作也显示出良好前景。2018年,DeepMind在《自然医学》上发表一篇论文,公布了一个致盲性黄斑变性图像识别模型,该模型在检查视网膜扫描结果以发现早期病变迹象方面,表现出与顶级医生的水平相当。与此同时,DeepMind开发的另一个系统在解读乳腺癌X线片检查结果方面,表现出优于人类放射科医生的水平。
04
天才的作用:体现在特定使命上
2017年10月,DeepMind发布了一款全新的、性能惊人、堪称惊艳的智能系统——AlphaGo Zero。该系统仅通过自我对弈学习,其水平就超过它的前辈。摆脱了人类智慧的束缚后,该模型发现了人类棋手从未知晓的策略,对围棋的奥秘达到了新的理解。
AlphaGo Zero的意义不仅关乎人类及其认知局限,更关乎通往AGI的道路。这是强化学习突破标志的一场革命。AlphaGo Zero从零开始,在没有人类指导或人类数据的情况下,精通了3种不同的复杂游戏,这意味着它有望攻克各种复杂的现实世界的挑战:设计出一个演绎系统来分类和解释世界或在海量数据中寻找规律。一旦我们拥有一个能自主学习的系统,就再也没有上限了。这些系统可以自主学习、积累知识,掌握所有需要知道的东西。
蛋白质是生命的基石:它们构成器官和肌肉、激素和毛发、血液和脑细胞等的结构,同时也承担相关功能。解决蛋白质折叠问题,预测蛋白质呈现的复杂形状,极具吸引力。华盛顿大学的诺贝尔奖得主大卫·贝克领导的团队发明了一款名为《折叠它》的游戏。该游戏的规则是,没有任何科学专业背景的人类玩家在网上竞争,将氨基酸链的虚拟复制品折叠成三维形状,寻找能优化特定物理和化学条件的构型。
哈萨比斯被《折叠它》深深吸引。《折叠它》融合了他两大爱好:竞技游戏和科学发现。他惊叹于这样一个事实:人类玩家仅凭空间自觉就能将虚拟氨基酸链折叠成得分极高的形状,接近真实蛋白质的结构。蛋白质折叠的游戏化似乎将一个通用计算挑战转化为DeepMind擅长的强化学习问题。它有明确的目标,还有一个允许无限试错的虚拟环境。1972年,克里斯蒂安·安芬森在诺贝尔奖演讲中推测,构成蛋白质的氨基酸链包含一组密码。哈萨比斯证明了安芬森大体上是正确的,因此获得了诺贝尔奖。
揭密蛋白质折叠最多是为了推动医学发展、拯救生命,而不仅仅是解开一个智力谜题。从物理方程转向更高层次、更模糊的抽象形式,或许正是生命科学研究所需要做的:生物学可能过于复杂,且具有涌现性,无法用简洁的数学语言来描述。这正是哈萨比斯的观点。他很早就相信,借助AI才能洞察支配生命的隐藏模式,试图通过物理学公理来理解生物学问题是一条死胡同。
DeepMind引入了一种专用的搜索算法,类似于AlphaGo使用的树搜索。于是,DeepMind完成了第一个重要的蛋白质预测模型的设计,并将其命名为AlphaFold。Alpha这个名字带有一定的策略,暗示DeepMind正从一个模型稳步推进到下一个模型——从AlphaGo到AlphaZero ,再到
AlphaStar,然后是AlphaFold 。AlphaFold的突破标志着3种变革:实际发现的变革、科学机构的变革以及AI地位的变革。
在应用领域,变化迅速呈现。DeepMind对人类蛋白质组中全部的2万种蛋白质形状进行了分类,其中83%的蛋白质形状此前未被晶体学家绘制出来。到2020年夏天,AlphaFold已经绘制了35万个蛋白质结构,涉及从酵母到果蝇的各种生物。到2022年7月,它已经绘制了大约2亿个蛋白质折叠结构。截至2025年底,全球已有超过300万名研究人员免费查阅AlphaFold的预测结果,由此加速了从基础生物学到疫苗开发,再到环境科学等各个领域的发展。以前,科学家们花费数年时间才能解析赋予超级细菌抗生素抗性的酶蛋白结构,而AlphaFold出现后,几分钟内就完成了结构绘制。2024年5月,DeepMind推出AlphaFold 3。这个版本不仅能解析蛋白质形状,还能预测蛋白质与其他类型的分子之间的相互作用。
确实,世界似乎正在见证发明本身的革新,人类可能在10年内实现一个世纪的科学进步。正如彼得·蒂尔对哈萨比斯的评价:“天才的作用往往体现在特定使命上,他们往往非常适合完成某项特定任务。”对哈萨比斯来说,它的使命是创建一家追求AGI的公司。
【特别声明】本文来源湛庐文化。文章的观点和立场并不代表本公众号的观点和立场。此文版权归原作者所有,其他第三方若要转载此文章请事先联系沟通,未经授权的转载都视为侵权。
当前,全球大宗商品市场正处于新旧秩序转换的关键节点。地缘政治、科技革命与绿色转型正以前所未有的力量重塑行业格局。面对供应链韧性、货权安全、AI冲击与风险管理等严峻挑战,行业亟需凝聚智慧、共谋破局。
在此背景下,我们诚挚邀请您出席于2026年5月21日在上海举办的「TGW 2026扑克财经大宗商品行业创新大会」。本次大会以“向新而生”为主题,旨在汇聚全产业链核心决策者,共同探讨在复杂新格局下的生存、进化与发展之道!
你应该来!
大宗商品生产、贸易企业决策者与管理者 仓储物流、数商、CTRM解决方案提供商 行业协会、研究机构专家与学者
那么,你应该来!
参与本次大会,即是选择在一个高度聚焦、价值导向、模式创新的平台上,进行一场精准、深度且能产生长效回报的战略投资。最重要的是,你将置身于一个由300至500位决策者构成的生态圈中,通过定向晚宴与专属展区的深度互动,获得精准的资源链接与长效的行业协同价值。旧秩序瓦解,新动能崛起,让我们在国际局势和技术创新风云变幻的当下,共同摸索大宗商品行业创新之路。
报名方式
报名方式:扫描下方二维码,即可报名

大会主论坛报名扫描上方二维码
如果您有其他问题,请添加扑克财经-大福的微信咨询:13022101580。
报名时间: 即日起至 2026 年 5 月 15 日。
2026年5月21日,让我们共同奔赴这场思想与实践的盛宴,于风云变幻中,勾勒大宗商品行业的未来蓝图!

添加微信:puoker
(注明姓名、公司职务、事由)
夜雨聆风