AI 人物志(四):Demis Hassabis——从棋手到诺贝尔奖,他用 AI 解决科学-夜雨聆风

AI 人物志(四):Demis Hassabis——从棋手到诺贝尔奖,他用 AI 解决科学

在 AI 行业里，很多人的出场方式是辍学创业、写博客、或者在一次意外爆红的产品发布后突然站到聚光灯下。Demis Hassabis 不一样。他的出场方式更像一个古典学者——国际象棋大师、游戏设计师、认知神经科学博士，然后在 38 岁卖掉自己的公司给 Google，再在 48 岁拿诺贝尔化学奖。

这条路径不像是硅谷的剧本，更像是某个维多利亚时代博物学家的传记。但正是这个人，造出了 AlphaGo、AlphaFold 和 Gemini——三个分别征服了棋类游戏、蛋白质折叠和大语言模型的 AI 系统。

北伦敦的混血神童

1976 年 7 月 27 日，Demis Hassabis 出生在伦敦北部。父亲是希腊裔塞浦路斯人，母亲是新加坡华人。这种跨文化家庭背景后来经常被他提起——也许正因如此，他从小学会了在多个世界之间自如切换。

四岁开始下国际象棋。这个年龄，大多数孩子还在学认字母。到 13 岁，他已经拿到了国际象棋大师（chess master）的头衔，在同年龄段排名世界第二。

但棋只是他众多兴趣中的一个。他对计算机和游戏同样着迷。用他自己的话说，小时候攒零花钱买编程书，照着书里的例子在早期家用电脑上敲代码。他写的第一个完整程序是一个黑白棋（Othello）游戏——那年他大概十一二岁。

17 岁做游戏，比同龄人早了十年

游戏在 Hassabis 的人生中占据了非常特殊的位置，不只是玩，而是把它当作研究智能的试验场。

15 岁时，他在一家叫 Bullfrog Productions 的游戏公司做兼职写代码。这公司在 90 年代的英国游戏圈很传奇，创始人是 Peter Molyneux（后来做了《神鬼寓言》）。Hassabis 的才华很快被注意到——到 17 岁，他已经是游戏《Theme Park》（主题公园）的首席开发者。

《Theme Park》是一款模拟经营游戏，玩家要建造和管理一个主题公园。1994 年发售时卖了数百万份，被移植到了几乎所有当时的平台。游戏里的游客行为由 AI 驱动，他们会根据心情、饥饿度、钱包余额做出不同决策——这种”用 AI 模拟复杂行为”的思路，和后来 DeepMind 做的事其实一脉相承。

Hassabis 在伦敦的 Christ’s College Finchley 完成了中学课程，16 岁就考完了所有考试，比正常进度早两年。然后他去了剑桥大学读计算机科学。

剑桥之后：两条分岔的路

1997 年从剑桥毕业。之后的十年，Hassabis 走了一条在外人看来有点弯弯绕绕的路。

先去了 Lionhead Studios——又是 Peter Molyneux 的公司——担任首席 AI 程序员，参与了游戏《Black & White》的开发。这款游戏里玩家扮演神，通过手势和行动影响信徒，里面的生物会根据玩家的行为”学习”和”成长”。这大概是 Hassabis 第一次把强化学习的思想用到商业产品里，虽然那时候他未必用了这个术语。

1998 年，22 岁的他离开 Lionhead，自己创办了 Elixir Studios。公司做了两款游戏：《Republic: The Revolution》（2003）和《Evil Genius》（2004）。前者是一个关于政治革命的模拟策略游戏，后者让玩家扮演一个卡通反派建造秘密基地。两款都得了不少奖，尤其是《Evil Genius》，后来成了邪典经典。

但 Hassabis 显然不满足于只做游戏。2005 年，他卖掉了 Elixir 的资产，做了一个让很多人意外的决定：去读博。

为什么要研究大脑？

他去了伦敦大学学院（UCL），读认知神经科学的 PhD。

这个选择在当时看有点突然——一个成功的游戏开发者，跑去研究海马体？但如果你理解 Hassabis 的核心驱动力，就完全说得通。

他后来说过很多次，自己做游戏的终极目的从来不是娱乐，而是理解智能。游戏是简化版的现实世界，好的游戏 AI 需要规划、记忆、决策——这些都是智能的核心能力。但他发现，光靠工程手段遇到了瓶颈，需要从”源头”汲取灵感。

那个”源头”就是人脑。他在 UCL 的研究集中在记忆和想象力——大脑怎么把过去的经验重新组合，想象出还没发生的事情。他的研究发表在《Nature》《Science》这些顶刊上，还被《Guardian》选为当年的”Science Blog of the Year”。

2009 年博士毕业后，他在哈佛和 MIT 做了博士后，同时拿到了 UCL 的 Henry Wellcome 奖学金。到这个时候，他的简历已经覆盖了计算机科学、游戏 AI 和认知神经科学三个领域。

正是这种跨学科的背景，让他在后面做 DeepMind 时有了和其他 AI 创业者完全不同的视角。

2010 年：DeepMind 诞生

2011 年，Hassabis 和 Shane Legg（新西兰计算机科学家，也是 UCL 的博士）以及 Mustafa Suleyman（英国企业家，Hassabis 的发小）一起在伦敦创办了 DeepMind。

注意这个时间点。2011 年，深度学习还没有爆红——AlexNet 引爆 CNN 是 2012 年的事。那时候做 AI 创业，在硅谷投资人眼里跟做太空电梯差不多离谱。但 Hassabis 不是跟风，他很清楚自己要做什么：用深度强化学习（deep reinforcement learning）作为突破口，向通用人工智能（AGI）推进。

他把深度学习和强化学习结合起来——前者负责从数据中提取模式，后者负责通过试错学会策略。这个方向在当时并不主流，但 Hassabis 的神经科学背景告诉他：多巴胺系统的工作原理就是强化学习，大脑天生就是这么运作的。

从 Atari 到围棋：一场精心策划的表演

DeepMind 的早期成名作，是让 AI 玩 Atari 游戏。

2013 年，他们发表了关于 DQN（Deep Q-Network）的论文。这个程序不需要任何人教它游戏规则——只需要看屏幕上的像素，然后被告知”得分越高越好”。它自己摸索出了 49 款经典 Atari 游戏的玩法，在很多游戏上达到了人类甚至超人类的水平。

这件事在 AI 圈引起了巨大轰动。但它真正的意义不仅是”AI 能打游戏”，而是证明了深度强化学习可以端到端地从原始输入学到复杂策略。这是一个通用方法的雏形。

然后是围棋。

围棋一直被当作 AI 的”圣杯”之一——可能的棋盘状态比宇宙中的原子还多，传统的暴力搜索完全行不通。2016 年 3 月，AlphaGo 在首尔以 4:1 击败了世界冠军李世石。这场比赛全球超过 2 亿人观看。

李世石在第四局下出了一步被称为”神之一手”的妙招，赢下了唯一一局。但这反而更说明了 AlphaGo 的强大——它在三局比赛里都没给人类冠军任何机会。

之后的故事大家比较熟悉了：AlphaGo Zero 从零开始（只知道规则，不看任何人类棋谱），100:0 击败了 AlphaGo。AlphaZero 用同样的方法又征服了国际象棋和日本将棋。MuZero 更进一步——连规则都不用告诉它，它会自己摸索出规则再精通游戏。

但很多人忽略了一点：Hassabis 从来不只是想造一个下棋的 AI。游戏只是他的试验场。

AlphaFold：用 AI 解决 50 年的生物学难题

蛋白质折叠问题在生物学里的地位，大致相当于黎曼猜想之于数学——大家都知道它很重要，但几十年来进展缓慢。

简单说：蛋白质是由氨基酸链折叠成的三维结构，结构决定了功能。如果你知道了一条氨基酸序列，理论上可以推算出它的三维结构。但实际上，即使一个只有 100 个氨基酸的小蛋白质，可能的三维结构数量也有 10 的 47 次方种——比宇宙中原子总数还多。这就是所谓的”蛋白质折叠问题”。

从 1994 年开始，学术界每两年举办一次 CASP 竞赛（Critical Assessment of protein Structure Prediction），专门测试各种蛋白质结构预测方法。到 2010 年代中期，最顶尖的方法准确率大约 40%。

2018 年，DeepMind 派 AlphaFold 参加了 CASP13，准确率直接拉到了约 60%。这个成绩已经让生物学圈震惊了——一夜之间跳了十几年的进度。但 Hassabis 不满意。

转折点是 John Jumper 的加入。Jumper 是个有蛋白质模拟背景的物理学家，他和 Hassabis 的团队合作重新设计了架构，推出了 AlphaFold2。2020 年的 CASP14 上，AlphaFold2 达到了约 90% 的准确率——和实验方法（X 射线晶体学）的结果基本持平。

蛋白质折叠问题，被一个 AI 团队解决了。

2021 年，他们用 AlphaFold2 预测了人类全部 5 万多种蛋白质的结构。然后更进一步——预测了已知的约 2 亿种蛋白质的结构，涵盖了大约 100 万个物种。Hassabis 称之为”整个蛋白质宇宙”。

2024 年 10 月，诺贝尔化学奖授予了 Demis Hassabis 和 John Jumper（各得四分之一），另一半给了 David Baker。颁奖理由是”蛋白质结构预测”。

一个计算机科学家拿诺贝尔化学奖，这在诺贝尔奖历史上极为罕见。但仔细想想又完全合理——AlphaFold2 不是简单的工程突破，它改变了整个生物学研究的方式。

2014：Google 买下了什么

回到 2014 年。那年 Google 以约 4 亿英镑（当时约 6.5 亿美元）收购了 DeepMind。Hassabis 留任 CEO，公司继续在伦敦独立运营。

这笔收购当时争议不小。有人觉得 Google 花了太多钱买了一个只有几十人的小团队。但现在回头看，这可能是 Google 近十年最划算的一笔投资。

DeepMind 给 Google 带来了什么？WaveNet（Google Assistant 的语音合成技术）、数据中心的冷却优化（节省了大量电费）、YouTube 视频压缩、Android 的电池管理……这些看起来不相关的技术，底层都有 DeepMind 的 AI 在运作。

但更大的变化发生在 2023 年。

Google DeepMind：两条河流汇在一起

2023 年 4 月，Google 做了一个重大组织调整：把 Google Brain（Google 内部的 AI 研究团队）和 DeepMind 合并，成立 Google DeepMind，由 Hassabis 担任 CEO。

Google Brain 不是小角色。Transformer 架构就是他们在 2017 年发明的——没错，就是现在所有大语言模型（包括 GPT、Claude、Gemini）的基础架构。BERT、PaLM、LaMDA 都出自这个团队。

两条顶级的 AI 研究力量合流，Hassabis 成了整个 Google AI 的掌舵人。

Gemini：Hassabis 的第三幕

2023 年 12 月，Gemini 1.0 发布。这是合并后的 Google DeepMind 交出的第一份答卷。

和 OpenAI 的 GPT 系列不同，Gemini 从一开始就是原生多模态设计——不是把文本、图像、音频分别处理再拼起来，而是在训练时就同时处理所有模态。Hassabis 在发布时写了一篇很长的文章，核心观点是：AI 不应该只是”一个聪明的软件”，而应该像”一个有用的专家助手”。

到 2026 年 4 月，Gemini 已经迭代到了 3.1 版本。从公开 benchmark 来看，Gemini 3.1 Pro 在 MMLU-Pro（91.0%）和 GPQA Diamond（94.3%）上是所有模型里最高分。在 DeepSeek V4 的对照数据里，它的 GPQA Diamond 成绩超过了 GPT-5.4、Claude Opus 4.6 和 DeepSeek V4-Pro 本身。

不过 Gemini 在 agentic 能力上（Terminal-Bench 2.0 只有 68.5%）和 GPT-5.5（82.7%）还有明显差距。这是一个有意思的格局：Google/DeepMind 在”知识”和”推理”维度很强，但在”帮你在电脑上干活”这件事上，暂时落后于 OpenAI。

一个与众不同的 AI 领袖

和 Sam Altman 的”快速迭代、产品先行”不同，也和 Anthropic 的”安全优先、克制发布”不同，Hassabis 的风格可以总结为：科学驱动，长期主义，从游戏到现实。

他极少在社交媒体上搞事情，不做播客常客，也很少公开互怼竞争对手。他更像一个住在伦敦的研究型 CEO——每周还要花时间跟进具体的研究项目。

几个细节能看出他的风格：

• AlphaGo 击败李世石之后，他没有急着商业化，而是转头去做了 AlphaFold。从”让 AI 玩游戏”到”让 AI 解决科学问题”，这个转向本身就是一种态度。

• DeepMind 是最早设立独立 AI 伦理委员会的 AI 公司之一，甚至在被 Google 收购之前就有了。这件事当时在技术圈有争议，但从现在的角度看，算是相当有远见。

• 他在诺贝尔奖颁奖典礼上的发言里特别提到，AlphaFold 的预测结果全部免费开放给了全球研究者。商业化不是他的首要目标——至少在科学应用上不是。

荣誉墙

Hassabis 拿过的奖项和荣誉多到需要单独列一段：

年份	奖项
2014	英国皇家学会 Mullard 奖章
2020	教皇科学院 Pius XI 奖章
2022	Wiley 生物医学奖
2023	突破奖（生命科学）、加拿大 Gairdner 国际奖、拉斯克基础医学研究奖
2024	诺贝尔化学奖

他还被《时代》杂志多次列入全球 100 位最具影响力人物，是英国皇家学会院士、英国皇家工程院院士。2024 年因为诺贝尔奖被封为爵士。

Hassabis 对 AI 的核心信念

梳理一下他多年来在各种场合表达过的观点，能看出一些贯穿始终的信念：

第一，AI 应该用来解决科学问题。这是他和其他 AI 公司 CEO 最大的不同。Altman 想用 AI 改变工作方式，Hassabis 想用 AI 改变科学发现的方式。AlphaFold 不是产品，是科学工具。Gemini 虽然是商业产品，但 DeepMind 的研究重心始终在科学应用上——核聚变等离子体控制、天气预报、新材料发现。

第二，通用智能需要跨学科。从游戏到神经科学再到 AI，Hassabis 始终相信，真正的智能不能靠单一学科突破。DeepMind 从第一天起就刻意招募神经科学家、数学家、物理学家，而不只是计算机工程师。

第三，安全和发展不矛盾。他既不是”先做了再说”派，也不是”停下来先谈安全”派。他的观点是，理解 AI 的最好方式是去构建它，但在构建的同时要建立护栏。DeepMind 的很多安全研究（比如对 AI 系统的可解释性研究）是在 2015-2018 年就开始做的，远早于行业主流。

未来：Isomorphic Labs 和 AGI

2021 年，Hassabis 在 DeepMind 内部孵化了 Isomorphic Labs，目标是用 AI 方法变革药物发现。AlphaFold 解决了”蛋白质长什么样”的问题，Isomorphic Labs 要回答的是”怎么设计药物和这些蛋白质相互作用”。

2026 年的现在，DeepMind/Google DeepMind 的版图已经很清晰了：

• Gemini 系列：面向消费者和开发者的通用 AI 模型

• AlphaFold 系列：蛋白质结构预测，已经进入 AlphaFold 3 代

• Isomorphic Labs：AI 驱动的药物发现

• AlphaDev / AlphaProof 等：用 AI 发现新算法和数学证明

Hassabis 多次公开表示，他相信 AGI 可能在”未来十年内”实现。和很多同行的模糊表态不同，他给出了比较具体的时间线。当然，这种预测已经被证明容易打脸（他 2016 年也说过类似的话），但至少说明他的目标没有动摇。

尾声

回顾 Hassabis 的人生轨迹，有一个一以贯之的线索：对”智能”本质的执着。

四岁下棋，是在研究策略智能。十七岁做游戏 AI，是在模拟行为智能。读博研究海马体，是在逆向工程人类的记忆和想象。创办 DeepMind，是在用工程手段复现这些能力。做 AlphaFold，是证明这套方法能解决真实世界的科学问题。

每一步看似跳跃，其实都在同一条路上。

在一个满是辍学创业者和融资新闻的 AI 行业里，Hassabis 像一个异类。他读完了所有的书——从剑桥到 UCL 到哈佛到 MIT。他不追风口，不搞流量。他做的每一件事——下棋、做游戏、研究大脑、训练 AI——都是同一个终极目标的不同切面。

2024 年诺贝尔化学奖颁发的那一刻，也许是对这种长期主义最好的注脚。当全世界都在为 ChatGPT 的产品体验激动时，一个在伦敦默默用 AI 解决科学问题的人，拿走了科学界的最高荣誉。

Demis Hassabis 不像 Sam Altman 那样站在舆论的风暴中心，也不像 Ilya Sutskever 那样带着理想主义的光环。他更安静，也更学术。但他造出来的东西——AlphaGo、AlphaFold、Gemini——每一个都实打实地改变了各自领域。

某种意义上，他是这个时代最接近达芬奇的人：棋手、程序员、神经科学家、企业家、诺贝尔奖得主。而且他今年才 49 岁。