姚顺宇:世界在推着 AI 前进,而不是我们在推着世界前进

姚顺宇：AI 没有英雄，只有把简单事做干净的人

“

今天的前沿模型已经不是个人英雄故事，而是集体工程、系统工程、组织工程。

Coding 之所以重要，不只是因为程序员市场大，而是因为它提供了清晰反馈和充足数据。

真正的 AI 研究能力，不是知道几个技术 tips，而是理解一个复杂训练系统为什么能稳定工作。

AI 时代最重要的特质，可能不是聪明，而是靠谱。

”

在硅谷 AI 圈，“Yao Shunyu”这个名字容易让人混淆。

一个是姚顺雨，计算机背景，长期做 Agent 研究；另一个是姚顺宇，物理出身，从清华物理系到斯坦福理论高能物理，再从物理转向 AI，先后在 Anthropic 和 Google DeepMind 工作，参与过 Claude 3.7、Claude 4.5、Gemini 3 等关键模型相关工作。这次张小珺对姚顺宇的长访谈，不是典型的天才科学家叙事。

姚顺宇说话很直接，但他对自己的贡献又异常克制。他一边会说，AI 个人英雄主义时代已经过去；另一边又反复强调，自己只是幸运地在一个关键时间进入了关键项目。

一、从物理到 AI：不是逃离学术，而是逃离没有反馈的世界

姚顺宇本科在清华学物理，后来去斯坦福做理论高能物理。按照传统意义上的履历，这是一条非常漂亮的学术路线。

但他对这段经历的评价并不浪漫。

他认为自己在博士阶段确实学到了很多，也成长很多，但如果问那些研究对世界产生了多大影响，他的答案很简洁：几乎没有。

这不是说理论物理不重要，而是他意识到，高能理论发展到某个阶段后，实验追不上理论，很多问题缺少足够客观的验证标准。一个领域如果缺少明确反馈，判断“谁做得好”就可能越来越依赖小圈子的主观评价。

这件事让他不舒服。

他后来给自己的方向重新设了一个标准：要做有客观评价标准的事；要做能对世界产生真实影响的事。

AI 对他的吸引力正在这里。

在他看来，AI 很像早期物理：理论和实验并没有完全分家。你有一个想法，可以马上做实验；实验失败了，可以继续改；一个训练结果、一个 benchmark、一个产品反馈，都会让研究者更快接近问题本身。

这也是他后来反复强调的一点：AI 不一定已经被真正理解，但它可以被不断试出来。

二、他怎么看“黑盒”：世界本来就是黑盒

很多人谈大模型，第一反应是“黑盒”。

姚顺宇的观点是：黑盒不是 AI 独有的问题。物理学在很多层面也是对黑盒行为的描述。我们未必知道最底层的微观动力学是什么，但这并不妨碍我们总结规律、做预测、推动工程。

他把 Scaling Law 看成一种经验规律。它未必已经是成熟科学定律，但经验规律和科学规律之间并不是截然分开的。历史上的热力学定律，在早期也是经验性的；后来人们逐渐理解微观机制，它们才变成更坚实的科学框架。

所以对他来说，大模型暂时不可完全解释，并不等于不可研究、不可推进。

相反，真正重要的是：能不能找到足够稳定的反馈；能不能设计可验证的实验；能不能把系统里的细节处理干净。

这也解释了他为什么后来会进入大规模强化学习和 coding 训练方向。

三、加入 Anthropic：在 underdog 之地赌一把

姚顺宇加入 Anthropic 时，公司还没有今天这样的声量。

他进入的是 Horizon 团队，一个围绕大规模强化学习展开工作的团队。按照他的说法，团队当时的核心目标，是用大规模强化学习提升 coding 能力。

这段经历有几个关键词：

第一，coding。

在姚顺宇看来，coding 重要不只是因为程序员市场大，而是因为它是模型“使用工具并与环境交互”的一个好抽象。

代码任务有两个非常适合训练的特点：反馈清晰；数据充足。

代码能不能跑，bug 在哪里，结果是否正确，通常比很多开放式语言任务更容易被判断。这使得 coding 成为训练模型长期任务能力、工具使用能力和环境交互能力的理想场景。

第二，强化学习。

他加入 Anthropic 时，工业级语言模型训练对他来说并不是完全熟悉的领域。他知道 pre-train、post-train 的大致流程，但并不真正了解大模型公司内部如何训练前沿模型。于是他重新补课、做作业、自己手搓项目，最后进入了这个方向。

第三，组织速度。

姚顺宇对 Anthropic 的一个重要评价是：执行力非常强。

在他的观察里，Anthropic 是一个偏 top-down 的组织。一旦公司捕捉到某个信号，并判断这件事值得做，就会非常快地集中资源扑上去。Coding 就是这样的 bet。

他认为，这种机制成立有一个关键前提：技术决策人必须真的能服众，同时也要能在公司层面承担责任。换句话说，前沿 AI 公司不是简单地靠“聪明人很多”取胜，而是要靠技术判断、组织决策和执行力形成闭环。

四、Claude 3.7：不是个人英雄故事，而是集体工程

访谈中，主持人多次追问姚顺宇在 Claude 3.7 中做了什么。

他的回答很克制。

他说自己很幸运，在那个时间点加入了一个重要项目，做了一些事情。

这其实是他整场访谈里最重要的底层判断之一：今天的前沿 AI 模型，不再是单个天才的作品，而是巨大的集体工程。

他认为，在 Transformer 这种关键范式出现之前，确实可能存在个人英雄或小团队英雄。因为那时真正关键的是“找到那个技术”。但当范式进入 scale up 阶段后，事情就变了。

模型训练变成了一套复杂系统：数据要处理；环境要搭建；基础设施要稳定；算法要调；训练过程要监控；评估体系要设计；产品反馈要吸收。

任何一个环节出问题，模型都可能无法达到预期。

所以在这个阶段，重要的不是某个人有没有一个漂亮 idea，而是整个团队能不能围绕同一个目标长期、稳定、细致地工作。

这也是姚顺宇为什么会反复说：AI 个人英雄主义时代已经过去了。

五、“技术 tips”没有想象中重要，系统理解才重要

很多人听这种访谈，最想听的是“内幕”：Anthropic 到底怎么训练 Claude？Gemini 到底用了什么技巧？有没有一个别人不知道的秘密方法？

姚顺宇对这类问题很警惕。

他的意思是，很多所谓技术 tips，看上去很诱人，但脱离具体基础设施和系统环境，其实没什么可迁移性。

同一个算法，在不同公司的训练架构下可能完全不是一回事。采样机器和训练机器是否同步，基础设施能否稳定支撑，数据如何流动，训练过程如何监控，这些都会改变算法选择。

所以他认为，现代 AI 训练是一个大系统。你不能只问“某个技巧有没有用”。你要问：这个技巧在什么系统条件下有用？为什么有用？它解决的是哪个瓶颈？它带来的副作用是什么？

这也是他所谓“把简单的事做干净”的含义。

不是追求炫技，而是把每个环节都理解清楚、处理稳定，让整个系统可靠地跑起来。

六、离开 Anthropic：不是否定，而是想学更多东西

姚顺宇后来从 Anthropic 离开，加入 Google DeepMind。

他在访谈里提到，离开的原因有几个层面。

一方面，他对 Anthropic CEO Dario Amodei 的一些涉华表态并不认同；另一方面，公司快速扩张后，文化也发生了变化。更重要的是，他自己想学更多不同的东西。

Anthropic 很专注，尤其适合学习语言模型、Agentic coding、工具使用等方向。但它也有很多不做的事情，比如多模态生成、更底层的大规模工程基础设施等。

而 Gemini 对他的吸引力，在于它有更大的研究自由、更广的技术版图，以及大量非常强的工程师和研究员。

他对这件事的判断是：如果一个人想要的是明确 scope，想把自己的某个想法快速塞进模型，Google 未必是最好的地方；但如果一个人想要的是探索自由、研究自由，以及向更广泛的人学习，Gemini 是非常强的地方。

这其实也是一个职业选择问题：不要只看公司名气；要先想清楚自己想要什么。

七、在 Gemini：ML coding 与 long horizon

加入 Google DeepMind 后，姚顺宇主要关注两个方向：ML coding 和 long horizon。

ML coding，可以理解为让 AI 更完整地参与 AI 研究流程。

不是只让模型写一段代码，而是让它能完成更长的闭环：提出方案；写代码；跑实验；看结果；分析失败；提出新假设；再改代码；继续实验。

姚顺宇认为，这条链条目前还没有完全闭合，但正在变得越来越完整。

Long horizon，则是长程任务能力。

他提出一个很有意思的说法：模型要能够“用有限上下文训练，但使用时像无限上下文”。

人类其实就是这样。人的即时记忆并不长，但人会选择性遗忘，也会在需要时检索重要信息。真正的长任务能力，不一定是把上下文窗口无限拉长，而是让模型学会管理信息：什么该忘，什么该保留，什么时候该检索，什么时候该调用工具。

这件事和 Agent、coding、AI research 都有关。

因为越是复杂任务，越不可能靠一次回答完成。模型必须能跨越更长时间、更复杂环境、更长链条，持续推进同一件事。

八、他怎么看 Google：OpenAI 某种意义上救了 Google

访谈中，姚顺宇对 Google 和 OpenAI 的关系也有很直接的判断。

他认为，OpenAI 某种意义上救了 Google。

原因是，OpenAI 先把聊天机器人做出来，让 Google 真正意识到搜索可能被威胁。但 OpenAI 又没有一口气把搜索彻底吃掉，这给了 Google 时间追赶。

在他看来，chatbot 当前形态不会完全替代搜索。因为很多搜索需求非常简单，用户只是想快速找到一个结果，不需要长对话，也不需要模型慢慢生成答案。

这并不意味着聊天机器人不重要。它在复杂信息浓缩、追问、交互式任务上非常强。但它未必就是 AI 产品的终局形态。

所以他对“超级 App 争夺战”也持怀疑态度。现在大家争夺的，可能只是 chatbot 这个阶段性形态。如果未来出现新的交互方式，今天所谓超级 App 的很多功能，也许会变成新形态里的一个子集。

不要太早把阶段性形态当终局。

九、他怎么看 AI 安全：不要指望一家公司制定秩序

Anthropic 的创立与 AI 安全关系密切，但姚顺宇对“由一家前沿模型公司推动安全秩序”这件事并不乐观。

他认为，如果一家公司的逻辑是：我先做出世界上最强的模型，然后大家不得不听我的安全主张——这个想法过于天真。

因为现实更可能是：不止一家机构会拥有强模型；任何一家停下来，别人也会继续前进；模型能力发展不是单个组织能阻止的。

他更倾向于认为，AI 安全最终可能需要多方制衡机制，而不是寄希望于某一家公司单方面制定规则。

这也是他整场访谈里很现实主义的一面： AI 发展不是某家公司推动世界前进，而是世界本身在推动所有人前进。

十、真正重要的特质：不是聪明，是靠谱

整场访谈最适合拿来做标题的观点，可能就是这一句：在今天的 AI 行业，真正重要的特质不是天才式聪明，而是靠谱。

姚顺宇认为，很多 AI 工作并不是高不可攀的智力题。真正难的是，你能不能把事情做细，能不能对自己的实验负责，能不能理解 AI 帮你做了什么，而不是把任务一股脑扔给 AI。

他设计过一道面试题：让候选人在 24 小时内从零到一完成一个强化学习项目。

在 AI 时代，这件事本身不再不可完成。AI 可以帮你写代码、搭框架、查资料、补实现。但真正的考点不是代码能不能跑，而是候选人有没有理解 AI 帮他做了什么。

如果一个人只是把任务交给 AI，最后自己讲不清楚系统如何运行、为什么这样设计、问题在哪里，那就说明他并没有真正和 AI 协作。

这其实是一个很重要的判断：未来的工作能力，不是“会不会自己写所有代码”；而是“能不能有效使用 AI，同时保持自己的判断力”。

结尾：AI 时代，也许更需要反神话

这场访谈最有价值的地方，不只是姚顺宇讲了 Anthropic、Gemini、Claude、coding 或 long horizon。

更重要的是，他提供了一种反神话的 AI 叙事：前沿 AI 是集体工程，是系统工程，是组织工程。

这可能是今天理解 AI 最重要的视角之一。

过去几年，我们习惯于用“天才”“创始人”“某个关键人物”来讲技术故事。但真正进入模型训练现场之后，你看到的也许不是英雄史诗，而是大量枯燥、细致、稳定、可验证的工作。

AI 时代当然需要想象力。但它同样需要一种朴素的能力：把简单的事做干净，把复杂的系统跑稳定，把每一个判断放回客观反馈里检验。

在姚顺宇看来，世界已经进入一个无法由单个英雄控制的 AI 时代。

而在这样的时代里，最值得信任的人，未必是最会讲宏大叙事的人。

而是那个真正靠谱的人。

本文根据《张小珺Jùn｜商业访谈录》第140期《对姚顺宇的4小时访谈：请允许我小疯一下！在Anthropic和Gemini训模型、技术预测、英雄主义已过去》及公开文字节选整理。