姚顺宇:做AI不需要脑子

姚顺宇，清华物理本科，斯坦福高能理论物理博士。2024年加入Anthropic，参与Claude 3.7、4.5训练。2025年跳槽Google DeepMind，参与Gemini 3开发。这是他接受的张小珺播客采访。以下是他对AI的核心观点。

"做AI不需要多少脑子。"

这是他最有冲击力的判断。理由：你可以在AI上做任何你能想到的实验。不像高能物理。你想验证某个理论，需要的能量尺度人类永远造不出来。AI不一样。你有想法，有数据，有算力，就能跑。没有"根本性的困难"。

所以他说，"AI不需要多少脑子。这个行业最重要的品质是靠谱、细心、对自己做的事情负责。"

他离开物理也是因为这一点。高能理论物理已经失去客观评价标准。没有实验验证你的理论，"谁做得好谁做得不好，取决于圈子里几个老人的主观判断"。他受不了这个。AI的反馈信号则是清楚的：模型跑分多少，用户用起来爽不爽，骗不了人。

"AI 目前是集体主义的产物，没有个人英雄。"

他认为AI目前是集体主义的产物。Transformer是一个小集体的成果，之后就没有英雄了。他对媒体报道点名表扬他的方式并不舒服："我觉得我参与的每个项目，没有我都会一样发生。效果不会变差。"

他说每个人都是冲浪者，浪是AI本身。浪会自己往前推，你只是恰好站在了浪尖上。

这句话对普通人是有现实意义的：如果你指望靠某个"天才想法"在AI领域一鸣惊人，大概率会失望。现在重要的是系统化做事的能力。

"预训练没有到头，AI 并没有到达瓶颈"

这是对抗主流叙事的一个判断。他认为"Scaling Law已到头"的说法之所以流行，不是因为规律真的失效了，而是"大部分遇到瓶颈的人，是因为自己代码里有bug"。不是什么惊天大bug，就是系统性问题。

"很多人觉得预训练到头了，是因为他们不知道自己下一步该做什么。这不叫技术到头了，叫人类作为老师不知道该怎么教了。"

他说未来四个月内预训练还会有进步，但AI领域没有人能预测四个月之后的事。

"Coding会先爆发，是因为信号清楚。"

为什么Coding是AI第一个大规模落地的场景？两个原因。第一，反馈信号极其明确：代码编译通过就是通过，不通过就是不通过，不需要人来看。第二，GitHub积累了数十年的高质量数据和自然标注。

做Coding的人和做普通产品的思路完全不同。普通产品"好不好"没法客观定义，而优秀程序员对好代码的标准高度一致：简洁、清晰、可维护。正因如此，AI在这个场景上能系统性提高。

他自己的体验是90%以上代码由AI生成。不保守的话，99%甚至100%。

对程序员的预测：未来可能1/1000的程序员做现在所有人的工作。剩下的人，要么转型为AI协作架构师（拆解任务、分给不同的AI去做），要么被替代。他不认为这个过程是突然发生的，但已经在发生。

"AI是个系统问题，不是某个算法的问题。"

很多技术细节的"知道吗"在实际工作中并不重要。因为各公司的基础设施不同，算法设计高度依赖自己的训练架构。

"很多实验室的人想知道Anthropic怎么做、Google怎么做。我有时候不愿意回答，因为回答这个问题反而会误导他们。你需要理解整个系统的方方面面，而不是某个小技巧。"

他认为AI训练已经变成一个系统工程问题。一个人不可能靠一个"聪明点子"提升模型。真正重要的是系统化地排查每一种可能性，知道什么变了、什么没变、为什么。

"Chatbot不是终极形态。"

他对当前AI产品形态直言不讳："很蠢"。模型已经有那么多能力，但所有人还是通过一个对话框跟它交互。"如果我已经知道终极形态是什么，我早就去做了。"他认为产品形态的革命还未到来，可能也不需要像OpenAI那样烧几百亿。

关于OpenClaw、Manus与wrapper的命运。

OpenClaw走红这件事，姚顺宇说行业内的人并没有那么惊讶。大公司内部早就有人做过类似的demo，只是没包装成产品发出来。从技术角度看，它不是一个重大突破，而是"模型能力的自然溢出"。

但他也承认，OpenClaw的价值在于让所有人意识到一件事：原来可以让模型做非常长链条的任务，控制不同模型，聚合结果，持续执行。这之前行业没有形成共识。

他还抛出了一个尖锐的问题：Manus和OpenClaw之间到底有什么本质区别？他没想明白。

更有趣的是他对wrapper生存的判断。Manus卖给了Meta（后被撤销），OpenClaw团队被OpenAI收购。为什么都选择了卖？因为他认为，在当前阶段，"护城河还在模型那边"。wrapper的逃逸速度不够快，跑不出模型公司的引力场。

他给出了wrapper的两种生存路径。一种是Cursor的模式：跑得足够快，在模型公司反应过来之前吃下大量用户和品牌心智，然后自己做模型。另一种是Midjourney的模式：市场足够小，模型公司看不上。除此之外，他认为绝大多数wrapper都会死。

Anthropic vs Google：两种截然不同的组织模式。

他在这两家公司的训练前线都待过，对此有直接的对比。

Anthropic是典型的top-down。技术负责人就是公司联合创始人（Jared Kaplan、Sam McCandlish），他们有决策权，也有技术信誉。一旦判断某个方向值得押注，就全公司压上去。姚顺宇认为这种模式很难复制。"需要技术第一人同时是公司决策者，两人之间还有充分的信任。"

Google则完全相反。传统上是非常bottom-up的组织，"你自己决定做什么"。但过去一年发生了变化。预训练变成了越来越确定的范式，Google把它做成了一个工程化项目。"谁负责什么，每个节点的负责人是谁，非常清楚。"姚顺宇说预训练已经进入了Google的舒适区。后训练不确定性更高，才保留了更多的自下而上空间。

他的总结：大公司有大公司的玩法，创业公司有创业公司的玩法。大公司靠资源储备和工程化能力追上来，创业公司靠快速下注打时间差。两种文化都能成功，只要你知道自己在做什么。

他对OpenAI的看法。

离开Anthropic之后，OpenAI和xAI都是他的选项。他没去OpenAI，原因是"对当时OpenAI的文化有很大顾虑。说白了，真正干活的人，不如Gemini多。"

但他也承认OpenAI在产品层面的优势。"如果你非要让我说OpenAI的护城河是什么，我觉得是产品和品牌。"不过他认为没有谁是安全的。"我觉得没人现在位置是安全的。AI的形态还有很长的路要走，我们远没有到终局。"

他对OpenAI和Google的竞争还有一个冷眼旁观的判断：他认为某种程度上，"OpenAI救了Google的命"。如果ChatBot没有被OpenAI做出来，而是某个公司直接用它吃掉搜索，Google会很危险。但OpenAI做了这件事，却没有走到底，没有彻底杀死搜索，反而让Google追了上来。

关于中国AI的观察。

他点出了"硬蒸"和"软蒸"的区别。"硬蒸"是直接拿其他模型的输出训练，他认为这么做不仅商业上不道德，技术上也很愚蠢。它反映出做这事的人根本不知道自己想要什么。

但"软蒸"在技术上是有意思的问题：用多Agent的方式，让不同模型的输出互相校验、生成训练数据。中国实验室某种程度上变成了多Agent训练的先驱。

他对字节跳动的评价最高。认为豆包的语音能力"全球最好"，且产品团队对用户场景的理解远超美国同行。但原因也很现实：美国公司靠B2B赚钱太容易了，不需要把产品做那么细。中国在消费端的产品思维，比美国领先一个时代。

对年轻人的建议：不要做最热的事。

"如果你足够年轻，现在做最热门的事情可能不是正确选择。做没人做过的事情，可能更好。"

他说语言模型本身已经是一片红海。但多模态生成、机器人、AI辅助科学发现这些方向，还远远没有找到自己的路径。这些地方，可能还会有英雄出现。