姚顺宇,清华物理本科,斯坦福高能理论物理博士。2024年加入Anthropic,参与Claude 3.7、4.5训练。2025年跳槽Google DeepMind,参与Gemini 3开发。这是他接受的张小珺播客采访。以下是他对AI的核心观点。

"做AI不需要多少脑子。"
这是他最有冲击力的判断。理由:你可以在AI上做任何你能想到的实验。不像高能物理。你想验证某个理论,需要的能量尺度人类永远造不出来。AI不一样。你有想法,有数据,有算力,就能跑。没有"根本性的困难"。
所以他说,"AI不需要多少脑子。这个行业最重要的品质是靠谱、细心、对自己做的事情负责。"
他离开物理也是因为这一点。高能理论物理已经失去客观评价标准。没有实验验证你的理论,"谁做得好谁做得不好,取决于圈子里几个老人的主观判断"。他受不了这个。AI的反馈信号则是清楚的:模型跑分多少,用户用起来爽不爽,骗不了人。
"AI 目前是集体主义的产物,没有个人英雄。"
他认为AI目前是集体主义的产物。Transformer是一个小集体的成果,之后就没有英雄了。他对媒体报道点名表扬他的方式并不舒服:"我觉得我参与的每个项目,没有我都会一样发生。效果不会变差。"
他说每个人都是冲浪者,浪是AI本身。浪会自己往前推,你只是恰好站在了浪尖上。
这句话对普通人是有现实意义的:如果你指望靠某个"天才想法"在AI领域一鸣惊人,大概率会失望。现在重要的是系统化做事的能力。
"预训练没有到头,AI 并没有到达瓶颈"
这是对抗主流叙事的一个判断。他认为"Scaling Law已到头"的说法之所以流行,不是因为规律真的失效了,而是"大部分遇到瓶颈的人,是因为自己代码里有bug"。不是什么惊天大bug,就是系统性问题。
"很多人觉得预训练到头了,是因为他们不知道自己下一步该做什么。这不叫技术到头了,叫人类作为老师不知道该怎么教了。"
他说未来四个月内预训练还会有进步,但AI领域没有人能预测四个月之后的事。
"Coding会先爆发,是因为信号清楚。"
为什么Coding是AI第一个大规模落地的场景?两个原因。第一,反馈信号极其明确:代码编译通过就是通过,不通过就是不通过,不需要人来看。第二,GitHub积累了数十年的高质量数据和自然标注。
做Coding的人和做普通产品的思路完全不同。普通产品"好不好"没法客观定义,而优秀程序员对好代码的标准高度一致:简洁、清晰、可维护。正因如此,AI在这个场景上能系统性提高。
他自己的体验是90%以上代码由AI生成。不保守的话,99%甚至100%。
对程序员的预测:未来可能1/1000的程序员做现在所有人的工作。剩下的人,要么转型为AI协作架构师(拆解任务、分给不同的AI去做),要么被替代。他不认为这个过程是突然发生的,但已经在发生。
"AI是个系统问题,不是某个算法的问题。"
很多技术细节的"知道吗"在实际工作中并不重要。因为各公司的基础设施不同,算法设计高度依赖自己的训练架构。
"很多实验室的人想知道Anthropic怎么做、Google怎么做。我有时候不愿意回答,因为回答这个问题反而会误导他们。你需要理解整个系统的方方面面,而不是某个小技巧。"
他认为AI训练已经变成一个系统工程问题。一个人不可能靠一个"聪明点子"提升模型。真正重要的是系统化地排查每一种可能性,知道什么变了、什么没变、为什么。
"Chatbot不是终极形态。"
他对当前AI产品形态直言不讳:"很蠢"。模型已经有那么多能力,但所有人还是通过一个对话框跟它交互。"如果我已经知道终极形态是什么,我早就去做了。"他认为产品形态的革命还未到来,可能也不需要像OpenAI那样烧几百亿。
关于OpenClaw、Manus与wrapper的命运。
OpenClaw走红这件事,姚顺宇说行业内的人并没有那么惊讶。大公司内部早就有人做过类似的demo,只是没包装成产品发出来。从技术角度看,它不是一个重大突破,而是"模型能力的自然溢出"。
但他也承认,OpenClaw的价值在于让所有人意识到一件事:原来可以让模型做非常长链条的任务,控制不同模型,聚合结果,持续执行。这之前行业没有形成共识。
他还抛出了一个尖锐的问题:Manus和OpenClaw之间到底有什么本质区别?他没想明白。
更有趣的是他对wrapper生存的判断。Manus卖给了Meta(后被撤销),OpenClaw团队被OpenAI收购。为什么都选择了卖?因为他认为,在当前阶段,"护城河还在模型那边"。wrapper的逃逸速度不够快,跑不出模型公司的引力场。
他给出了wrapper的两种生存路径。一种是Cursor的模式:跑得足够快,在模型公司反应过来之前吃下大量用户和品牌心智,然后自己做模型。另一种是Midjourney的模式:市场足够小,模型公司看不上。除此之外,他认为绝大多数wrapper都会死。
Anthropic vs Google:两种截然不同的组织模式。
他在这两家公司的训练前线都待过,对此有直接的对比。
Anthropic是典型的top-down。技术负责人就是公司联合创始人(Jared Kaplan、Sam McCandlish),他们有决策权,也有技术信誉。一旦判断某个方向值得押注,就全公司压上去。姚顺宇认为这种模式很难复制。"需要技术第一人同时是公司决策者,两人之间还有充分的信任。"
Google则完全相反。传统上是非常bottom-up的组织,"你自己决定做什么"。但过去一年发生了变化。预训练变成了越来越确定的范式,Google把它做成了一个工程化项目。"谁负责什么,每个节点的负责人是谁,非常清楚。"姚顺宇说预训练已经进入了Google的舒适区。后训练不确定性更高,才保留了更多的自下而上空间。
他的总结:大公司有大公司的玩法,创业公司有创业公司的玩法。大公司靠资源储备和工程化能力追上来,创业公司靠快速下注打时间差。两种文化都能成功,只要你知道自己在做什么。

他对OpenAI的看法。
离开Anthropic之后,OpenAI和xAI都是他的选项。他没去OpenAI,原因是"对当时OpenAI的文化有很大顾虑。说白了,真正干活的人,不如Gemini多。"
但他也承认OpenAI在产品层面的优势。"如果你非要让我说OpenAI的护城河是什么,我觉得是产品和品牌。"不过他认为没有谁是安全的。"我觉得没人现在位置是安全的。AI的形态还有很长的路要走,我们远没有到终局。"
他对OpenAI和Google的竞争还有一个冷眼旁观的判断:他认为某种程度上,"OpenAI救了Google的命"。如果ChatBot没有被OpenAI做出来,而是某个公司直接用它吃掉搜索,Google会很危险。但OpenAI做了这件事,却没有走到底,没有彻底杀死搜索,反而让Google追了上来。
关于中国AI的观察。
他点出了"硬蒸"和"软蒸"的区别。"硬蒸"是直接拿其他模型的输出训练,他认为这么做不仅商业上不道德,技术上也很愚蠢。它反映出做这事的人根本不知道自己想要什么。
但"软蒸"在技术上是有意思的问题:用多Agent的方式,让不同模型的输出互相校验、生成训练数据。中国实验室某种程度上变成了多Agent训练的先驱。
他对字节跳动的评价最高。认为豆包的语音能力"全球最好",且产品团队对用户场景的理解远超美国同行。但原因也很现实:美国公司靠B2B赚钱太容易了,不需要把产品做那么细。中国在消费端的产品思维,比美国领先一个时代。
对年轻人的建议:不要做最热的事。
"如果你足够年轻,现在做最热门的事情可能不是正确选择。做没人做过的事情,可能更好。"
他说语言模型本身已经是一片红海。但多模态生成、机器人、AI辅助科学发现这些方向,还远远没有找到自己的路径。这些地方,可能还会有英雄出现。
夜雨聆风