姚顺宇:AI 没有英雄,只有把简单事做干净的人
在硅谷 AI 圈,“Yao Shunyu”这个名字容易让人混淆。
一个是姚顺雨,计算机背景,长期做 Agent 研究;另一个是姚顺宇,物理出身,从清华物理系到斯坦福理论高能物理,再从物理转向 AI,先后在 Anthropic 和 Google DeepMind 工作,参与过 Claude 3.7、Claude 4.5、Gemini 3 等关键模型相关工作。 这次张小珺对姚顺宇的长访谈,不是典型的天才科学家叙事。
姚顺宇说话很直接,但他对自己的贡献又异常克制。他一边会说,AI 个人英雄主义时代已经过去;另一边又反复强调,自己只是幸运地在一个关键时间进入了关键项目。
一、从物理到 AI:不是逃离学术,而是逃离没有反馈的世界
姚顺宇本科在清华学物理,后来去斯坦福做理论高能物理。按照传统意义上的履历,这是一条非常漂亮的学术路线。
但他对这段经历的评价并不浪漫。
他认为自己在博士阶段确实学到了很多,也成长很多,但如果问那些研究对世界产生了多大影响,他的答案很简洁:几乎没有。
这不是说理论物理不重要,而是他意识到,高能理论发展到某个阶段后,实验追不上理论,很多问题缺少足够客观的验证标准。一个领域如果缺少明确反馈,判断“谁做得好”就可能越来越依赖小圈子的主观评价。
这件事让他不舒服。
他后来给自己的方向重新设了一个标准: 要做有客观评价标准的事; 要做能对世界产生真实影响的事。
AI 对他的吸引力正在这里。
在他看来,AI 很像早期物理:理论和实验并没有完全分家。你有一个想法,可以马上做实验;实验失败了,可以继续改;一个训练结果、一个 benchmark、一个产品反馈,都会让研究者更快接近问题本身。
这也是他后来反复强调的一点:AI 不一定已经被真正理解,但它可以被不断试出来。
二、他怎么看“黑盒”:世界本来就是黑盒
很多人谈大模型,第一反应是“黑盒”。
姚顺宇的观点是:黑盒不是 AI 独有的问题。物理学在很多层面也是对黑盒行为的描述。我们未必知道最底层的微观动力学是什么,但这并不妨碍我们总结规律、做预测、推动工程。
他把 Scaling Law 看成一种经验规律。它未必已经是成熟科学定律,但经验规律和科学规律之间并不是截然分开的。历史上的热力学定律,在早期也是经验性的;后来人们逐渐理解微观机制,它们才变成更坚实的科学框架。
所以对他来说,大模型暂时不可完全解释,并不等于不可研究、不可推进。
相反,真正重要的是: 能不能找到足够稳定的反馈; 能不能设计可验证的实验; 能不能把系统里的细节处理干净。
这也解释了他为什么后来会进入大规模强化学习和 coding 训练方向。
三、加入 Anthropic:在 underdog 之地赌一把
姚顺宇加入 Anthropic 时,公司还没有今天这样的声量。
他进入的是 Horizon 团队,一个围绕大规模强化学习展开工作的团队。按照他的说法,团队当时的核心目标,是用大规模强化学习提升 coding 能力。
这段经历有几个关键词:
第一,coding。
在姚顺宇看来,coding 重要不只是因为程序员市场大,而是因为它是模型“使用工具并与环境交互”的一个好抽象。
代码任务有两个非常适合训练的特点: 反馈清晰; 数据充足。
代码能不能跑,bug 在哪里,结果是否正确,通常比很多开放式语言任务更容易被判断。这使得 coding 成为训练模型长期任务能力、工具使用能力和环境交互能力的理想场景。
第二,强化学习。
他加入 Anthropic 时,工业级语言模型训练对他来说并不是完全熟悉的领域。他知道 pre-train、post-train 的大致流程,但并不真正了解大模型公司内部如何训练前沿模型。于是他重新补课、做作业、自己手搓项目,最后进入了这个方向。
第三,组织速度。
姚顺宇对 Anthropic 的一个重要评价是:执行力非常强。
在他的观察里,Anthropic 是一个偏 top-down 的组织。一旦公司捕捉到某个信号,并判断这件事值得做,就会非常快地集中资源扑上去。Coding 就是这样的 bet。
他认为,这种机制成立有一个关键前提:技术决策人必须真的能服众,同时也要能在公司层面承担责任。换句话说,前沿 AI 公司不是简单地靠“聪明人很多”取胜,而是要靠技术判断、组织决策和执行力形成闭环。
四、Claude 3.7:不是个人英雄故事,而是集体工程
访谈中,主持人多次追问姚顺宇在 Claude 3.7 中做了什么。
他的回答很克制。
他说自己很幸运,在那个时间点加入了一个重要项目,做了一些事情。
这其实是他整场访谈里最重要的底层判断之一:今天的前沿 AI 模型,不再是单个天才的作品,而是巨大的集体工程。
他认为,在 Transformer 这种关键范式出现之前,确实可能存在个人英雄或小团队英雄。因为那时真正关键的是“找到那个技术”。但当范式进入 scale up 阶段后,事情就变了。
模型训练变成了一套复杂系统: 数据要处理; 环境要搭建; 基础设施要稳定; 算法要调; 训练过程要监控; 评估体系要设计; 产品反馈要吸收。
任何一个环节出问题,模型都可能无法达到预期。
所以在这个阶段,重要的不是某个人有没有一个漂亮 idea,而是整个团队能不能围绕同一个目标长期、稳定、细致地工作。
这也是姚顺宇为什么会反复说:AI 个人英雄主义时代已经过去了。
五、“技术 tips”没有想象中重要,系统理解才重要
很多人听这种访谈,最想听的是“内幕”:Anthropic 到底怎么训练 Claude?Gemini 到底用了什么技巧?有没有一个别人不知道的秘密方法?
姚顺宇对这类问题很警惕。
他的意思是,很多所谓技术 tips,看上去很诱人,但脱离具体基础设施和系统环境,其实没什么可迁移性。
同一个算法,在不同公司的训练架构下可能完全不是一回事。采样机器和训练机器是否同步,基础设施能否稳定支撑,数据如何流动,训练过程如何监控,这些都会改变算法选择。
所以他认为,现代 AI 训练是一个大系统。 你不能只问“某个技巧有没有用”。 你要问:这个技巧在什么系统条件下有用?为什么有用?它解决的是哪个瓶颈?它带来的副作用是什么?
这也是他所谓“把简单的事做干净”的含义。
不是追求炫技,而是把每个环节都理解清楚、处理稳定,让整个系统可靠地跑起来。
六、离开 Anthropic:不是否定,而是想学更多东西
姚顺宇后来从 Anthropic 离开,加入 Google DeepMind。
他在访谈里提到,离开的原因有几个层面。
一方面,他对 Anthropic CEO Dario Amodei 的一些涉华表态并不认同;另一方面,公司快速扩张后,文化也发生了变化。更重要的是,他自己想学更多不同的东西。
Anthropic 很专注,尤其适合学习语言模型、Agentic coding、工具使用等方向。但它也有很多不做的事情,比如多模态生成、更底层的大规模工程基础设施等。
而 Gemini 对他的吸引力,在于它有更大的研究自由、更广的技术版图,以及大量非常强的工程师和研究员。
他对这件事的判断是: 如果一个人想要的是明确 scope,想把自己的某个想法快速塞进模型,Google 未必是最好的地方; 但如果一个人想要的是探索自由、研究自由,以及向更广泛的人学习,Gemini 是非常强的地方。
这其实也是一个职业选择问题: 不要只看公司名气; 要先想清楚自己想要什么。
七、在 Gemini:ML coding 与 long horizon
加入 Google DeepMind 后,姚顺宇主要关注两个方向:ML coding 和 long horizon。
ML coding,可以理解为让 AI 更完整地参与 AI 研究流程。
不是只让模型写一段代码,而是让它能完成更长的闭环: 提出方案; 写代码; 跑实验; 看结果; 分析失败; 提出新假设; 再改代码; 继续实验。
姚顺宇认为,这条链条目前还没有完全闭合,但正在变得越来越完整。
Long horizon,则是长程任务能力。
他提出一个很有意思的说法:模型要能够“用有限上下文训练,但使用时像无限上下文”。
人类其实就是这样。人的即时记忆并不长,但人会选择性遗忘,也会在需要时检索重要信息。真正的长任务能力,不一定是把上下文窗口无限拉长,而是让模型学会管理信息:什么该忘,什么该保留,什么时候该检索,什么时候该调用工具。
这件事和 Agent、coding、AI research 都有关。
因为越是复杂任务,越不可能靠一次回答完成。模型必须能跨越更长时间、更复杂环境、更长链条,持续推进同一件事。
八、他怎么看 Google:OpenAI 某种意义上救了 Google
访谈中,姚顺宇对 Google 和 OpenAI 的关系也有很直接的判断。
他认为,OpenAI 某种意义上救了 Google。
原因是,OpenAI 先把聊天机器人做出来,让 Google 真正意识到搜索可能被威胁。但 OpenAI 又没有一口气把搜索彻底吃掉,这给了 Google 时间追赶。
在他看来,chatbot 当前形态不会完全替代搜索。 因为很多搜索需求非常简单,用户只是想快速找到一个结果,不需要长对话,也不需要模型慢慢生成答案。
这并不意味着聊天机器人不重要。它在复杂信息浓缩、追问、交互式任务上非常强。但它未必就是 AI 产品的终局形态。
所以他对“超级 App 争夺战”也持怀疑态度。现在大家争夺的,可能只是 chatbot 这个阶段性形态。如果未来出现新的交互方式,今天所谓超级 App 的很多功能,也许会变成新形态里的一个子集。
不要太早把阶段性形态当终局。
九、他怎么看 AI 安全:不要指望一家公司制定秩序
Anthropic 的创立与 AI 安全关系密切,但姚顺宇对“由一家前沿模型公司推动安全秩序”这件事并不乐观。
他认为,如果一家公司的逻辑是:我先做出世界上最强的模型,然后大家不得不听我的安全主张——这个想法过于天真。
因为现实更可能是: 不止一家机构会拥有强模型; 任何一家停下来,别人也会继续前进; 模型能力发展不是单个组织能阻止的。
他更倾向于认为,AI 安全最终可能需要多方制衡机制,而不是寄希望于某一家公司单方面制定规则。
这也是他整场访谈里很现实主义的一面: AI 发展不是某家公司推动世界前进,而是世界本身在推动所有人前进。
十、真正重要的特质:不是聪明,是靠谱
整场访谈最适合拿来做标题的观点,可能就是这一句:在今天的 AI 行业,真正重要的特质不是天才式聪明,而是靠谱。
姚顺宇认为,很多 AI 工作并不是高不可攀的智力题。真正难的是,你能不能把事情做细,能不能对自己的实验负责,能不能理解 AI 帮你做了什么,而不是把任务一股脑扔给 AI。
他设计过一道面试题:让候选人在 24 小时内从零到一完成一个强化学习项目。
在 AI 时代,这件事本身不再不可完成。AI 可以帮你写代码、搭框架、查资料、补实现。但真正的考点不是代码能不能跑,而是候选人有没有理解 AI 帮他做了什么。
如果一个人只是把任务交给 AI,最后自己讲不清楚系统如何运行、为什么这样设计、问题在哪里,那就说明他并没有真正和 AI 协作。
这其实是一个很重要的判断: 未来的工作能力,不是“会不会自己写所有代码”; 而是“能不能有效使用 AI,同时保持自己的判断力”。
结尾:AI 时代,也许更需要反神话
这场访谈最有价值的地方,不只是姚顺宇讲了 Anthropic、Gemini、Claude、coding 或 long horizon。
更重要的是,他提供了一种反神话的 AI 叙事:前沿 AI 是集体工程,是系统工程,是组织工程。
这可能是今天理解 AI 最重要的视角之一。
过去几年,我们习惯于用“天才”“创始人”“某个关键人物”来讲技术故事。但真正进入模型训练现场之后,你看到的也许不是英雄史诗,而是大量枯燥、细致、稳定、可验证的工作。
AI 时代当然需要想象力。 但它同样需要一种朴素的能力: 把简单的事做干净, 把复杂的系统跑稳定, 把每一个判断放回客观反馈里检验。
在姚顺宇看来,世界已经进入一个无法由单个英雄控制的 AI 时代。
而在这样的时代里,最值得信任的人,未必是最会讲宏大叙事的人。
而是那个真正靠谱的人。
本文根据《张小珺Jùn|商业访谈录》第140期《对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去》及公开文字节选整理。
夜雨聆风