腾讯AI下半场:汤道生对话姚顺雨,万字拆解8个核心信号

异曲同工 · 深度

腾讯AI下半场：汤道生对话姚顺雨
万字拆解8个核心信号

2026年6月6日 · 杨旭锋

这场对话没有PPT，没有演讲稿——腾讯集团高级执行副总裁汤道生与95后首席AI科学家姚顺雨，用一小时坦诚交锋，拆解了混元3重建之路、Agent时代的组织变革、以及腾讯AI"不装不躲不急躁"的底层逻辑。

2026年6月5日，北京国家会议中心，2026腾讯云AI产业应用大会。台上坐着两个人：一位是见证了中国互联网全波澜的"70后"产业领舵人——腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生；另一位是刚刚从OpenAI归来、出生于1998年的"95后"技术少帅——腾讯首席AI科学家、混元大模型及AI Infra负责人姚顺雨。

这是姚顺雨入职腾讯近半年后，首次在线下大型活动公开亮相。一场近一小时的对话，没有PPT，没有演讲稿，只有两个时代的人对AI下半场的坦诚交锋。从混元3的首秀到Agent的未来，从组织变革到第一性原理，这场对话不仅揭示了腾讯AI的底层逻辑，更勾勒出中国大模型产业从"追赶"到"定义"的转折轮廓。

···

一、AI下半场：从"找方法"到"找问题"

姚顺雨在对话中首先澄清了一个概念："下半场"这个词正在被滥用。这个概念源于他去年的一篇博客。在他看来，AI已经发展了几十年，过去几十年里，行业更关心的是"怎么解决问题、寻找好的方法"——比如为围棋发明AlphaGo，为翻译训练专门的翻译模型。每一个问题都需要一个定制化的解法。

但预训练和后训练的出现，改变了这个逻辑。"我们像有了一个万能的锤子，它可以去砸任何钉子。"姚顺雨说。通用方法论已经成熟，反而更困难的是"怎么寻找好的问题去解决"。

这也是他选择加入腾讯的核心原因。在OpenAI，他参与了Operator、Deep Research等前沿Agent产品的研发，提出了著名的ReAct框架。但当他站在2026年的节点回望，他发现：方法论不再是瓶颈，问题才是。而腾讯"有很多好问题、有很多产品"。好的产品能够回答：做完预训练和后训练之后，到底要把它应用在什么地方、产生什么价值。

汤道生对此深有共鸣。他回顾了自己从QQ空间、QQ秀到QQ音乐、腾讯云再到元宝的产品生涯，指出一个不变的底层逻辑："最终做产品还是本着用户到底有什么需求，我到底怎么去解决他的痛点。"但AI时代带来了全新的挑战——过去做产品是"预制菜"模式，用户从菜单里选；今天做产品是开放式服务，用户用自然语言提问，"你根本不知道用户会问什么"。

二、三角形组织：Foundation、Product、Frontier

姚顺雨提出了一个极具结构感的组织模型：一个均衡的"三角形"。

第一条边是Foundation（基础模型）。预训练和后训练是根基，必须做得非常solid。姚顺雨强调，预训练是一个相对"产品无关"（product-agnostic）的事情，它的最大特点是可泛化——预训练的进步可以带给各种各样下游任务持续的价值提升。但前提是：基础设施必须重建，数据体系必须变革，Eval必须回归真实。

第二条边是Product（产品应用）。技术必须为人和社会产生价值。姚顺雨认为，产品的重要性在AI时代"越来越重要"。这不仅是因为产品提供了应用场景，更因为产品提供了模型迭代最需要的养分——上下文（Context）。"模型越来越擅长把一个非常复杂的输入变成输出，很多时候你的竞争壁垒就在于你有没有最原始的输入，你知不知道这个人他到底在干什么。"腾讯的海量产品场景、交互数据和生态连接，既能为模型提供高质量上下文，也能让模型调用工具、连接系统，真正完成任务闭环。

第三条边是Frontier（前沿研究）。探索新的研究范式，寻找新的机会。姚顺雨坦言，中国今天所做的前沿探索还不够多，他希望把"frontier exploration"的精神更多地注入腾讯的组织中。

汤道生则用腾讯的"三个能力"回应了这个三角模型：第一是场景连接能力，通过微信、企业微信、元宝等高频触点，把大模型嵌到真实业务流；第二是工程驾驭能力，通过Harness体系让Agent稳定、可信、可持续运行；第三是模型驱动力，依托混元大模型与产品的Co-Design，兼顾实用性、性价比和ROI。

这三条边相互支撑，缺一不可。没有Foundation，Product就是无源之水；没有Product，Frontier就是空中楼阁；没有Frontier，整个组织就会失去未来的方向感。

···

三、混元3首秀：重建，而非修补

4月23日发布的混元Hy3 preview，是姚顺雨加入腾讯后的第一份作业，也是混元重建后训练的第一个模型。总参数295B，激活参数仅21B，最大支持256K上下文长度，采用快慢思考融合的MoE架构。这不是一次常规的版本迭代，而是一次从地基开始的重建。

姚顺雨在对话中揭示了混元3重建的三个核心维度：

第一，基础设施重建。无论是预训练还是强化学习，Infrastructure都被彻底重构。这是一种"磨刀不误砍柴工"的策略——与其在旧基座上小修小补，不如彻底重构底层，为下一代模型打好基础。

第二，数据与Eval的根本性变革。姚顺雨对国内AI圈"刷榜"文化提出了尖锐批评："中国大家有个不好的倾向是大家喜欢刷榜，但是我觉得更重要的是如何实事求是地基于产品、基于真正的应用，构造更加真实的Eval。"榜单非常容易过拟合（Overfitting）——提问规范、多为单轮标准化问题，而现实场景中用户的提问比较模糊，往往只有一两句话且需要多轮追问。混元3发布Preview版本的核心目的之一，就是通过真实世界的产品反馈来发现和修复Benchmark榜单无法覆盖的问题。

第三，模型尺寸的取舍。姚顺雨认为，"如何用一个更小的模型把更高的价值任务做好"，在今天的中国可能更有价值。Hy3 preview在大部分任务上实现了更强的鲁棒性（Robustness），这种"小模型、大性能"的路线，既降低了成本，又提升了实用性。

数据已经证明了这条路线的正确性。Hy3 preview上线以来，Token调用总量已是上一代Hy2的10倍，代码和智能体类场景的Token调用量增长超过16.5倍。在OpenRouter全球大模型API调用榜上，Hy3 preview连续三周拿下总量与市场占有率"双第一"。元宝侧Hy3 preview已覆盖超过80%的用户，活跃度和留存都在增长。

汤道生在对话中透露了一个细节：姚顺雨给元宝带来的最大价值，一是推动模型跟产品从"各自为战"转向以用户体验为北极星指标的Co-Design；二是大幅提升数据质量，"砍掉了大量看似能堆量、实则对模型训练无益甚至有害的数据"。

四、Co-Design：模型与产品的对齐难题

"模型的人，和产品的人出发点还不一样。"姚顺雨这句话，戳中了AI产业最隐秘的痛点。

做模型的人希望能力越强越好；做产品的人希望用户需求越满足越好。这两者天然存在不align（对齐）的部分。如何弥合这个裂缝？姚顺雨和汤道生的答案是：Co-Design（协同设计），但Co-Design的前提是建立Trust（信任）。

姚顺雨分享了一个关键细节：在混元自己的预训练还没有准备好的时候，他主动派遣后训练最强的骨干力量去帮助元宝把后训练做好。当时很多算法同学不理解——"我们自己的模型还没准备好，为什么要先去帮产品？"但姚顺雨坚持认为，维护元宝的产品DAU对接下来做模型非常重要，而且对于创新的合作非常重要。这个"逆向操作"让产品团队意识到：模型的同学是真的在为产品着想。这种信任的建立，为后续Hy3 preview在元宝上的成功上线起到了决定性作用。

汤道生则从产品侧补充了Co-Design的复杂性。在AI时代，产品不再是"功能清单"式的交付，而是开放式的服务形态。这带来了三个全新的挑战：

一是对齐（Alignment）问题。产品、模型、数据标注、Eval评测，多个角色需要对"什么是好的回答"达成一致。如果产品认为好的体验，评测体系不认同，产品行为就会不可预测。"怎么让多个角色能够对于一些开放式问题有比较好的对齐，如果没有做到这样一个对齐的话，你会发现产品的行为会不可预测。"

二是Eval体系的重建。传统的瀑布式研发有清晰的功能描述、设计、研发、测试流程。但AI产品需要"测试左移"——更前置地去想清楚各种案例的Eval、环境、开放式答案的要求，甚至用户风格的alignment。

三是角色融合。今年大部分代码已由AI生成，工程师花更多时间做架构设计，"写代码的工作都交给AI了"。每个工程师更像一个有想法的leader，驱动多个Coding Agent完成任务。同时，每个人都要参与评测、测试、质量保证和对齐工作。

汤道生坦言："今天时代做产品其实要求的能力更全面。"姚顺雨接话："更难了。"汤道生点头："更难了。"

五、Agent时代：Coding是必选项，想象是加分项

当被问及混元最重要的能力是什么时，姚顺雨毫不犹豫地回答："Coding是必须要做的，Agent是最重要的事情，还是体系是全面化。"

这并非偶然。姚顺雨的博士论文标题就是《Language Agent: From Next Token Prediction to Digital Automation》，写于2019年——GPT-2的时代。当时人们很难想象下一个Token预测会改变世界，但姚顺雨已经看到了更远的可能性："GPT是一个非常优美的东西，吐下一个Token是一个非常极简且非常通用的事情，它有一天潜力不仅仅在于吐出下一个Token，而在于把这个世界上所有的事情全部automate。"

他回忆了2022年7月的一个夜晚：当他第一次把PaLM 2的API和Wikipedia API连在一起，模型第一次可以基于网页回答问题并多轮交互时，"我感觉就像微弱电灯丝突然亮的感觉一样"。那是人类第一次把LLM和互联网连在一起做多轮交互。他当时预测这可能在5年或10年改变一些事情，"但可能比我想象中还要更快"。

今天，Agent技术最重要的两个方向确实是Web Agent和Coding Agent。姚顺雨认为，Coding Agent非常本质，因为它"有点像图灵完备的事情"——当你有能力去控制自己的file system，当你有一个container的时候，你是一个complete system。

但姚顺雨强调，做好Coding Agent需要远远不止Coding的数据，也需要聊天、推理、搜索、指令遵循等各种各样的能力。"大模型最重要的点是泛化性。"这种泛化性意味着，产品和模型必须形成一个"网络一样的体系"——元宝的Co-Design使模型产生很强的聊天和搜索能力，这样的能力又可以被迁移到ima和WorkBuddy，这些产品提供不同的数据，但这些数据之间又可以相互泛化。

汤道生则从产品侧描绘了Agent的落地路径：给模型提供工具（Tool）、提供记忆（Memory）、提供Skill。"重点是模型的触角越多越好。"在不同的Agent场景中，重要的是了解什么内容、什么信息是重要的、比较relevant的，能够跟模型配合好，让模型有它需要的信息，同时也发挥它的能力。

姚顺雨还提出了一个更具前瞻性的观点："需要想象部分，做好基础部分上，这个必须的。"无论是技术演进、产品演进，还是下一个范式演进，都需要探索性甚至不确定性的工作。他博士论文2024年写的future work——train models for Agent、safe and robust deployment、scientific discovery、help human——现在他幸运地正在做这些方向。但他也自嘲："可能想的还是不够大，我觉得已经觉得自己想的够大了，但是可能还是不够大。"

···

六、组织变革：3-5人小团队与快速迭代

AI时代的产品研发组织，正在发生一场静默的革命。

汤道生透露，他前阵子帮WorkBuddy做组织发文时，发现其组织架构"非常扁平化"，跟过去的产品组织架构有很大差异。更多是小团队，三个人、五个人，围绕某一个领域做攻坚。"有很多试验在里面，还要支持Infra做实验，让不同的小分队可以去探索然后再验证。"

这种组织形态有几个鲜明特征：

一是小团队、快速迭代。姚顺雨强调"小团队，快速迭代，快速做"。汤道生观察到，WorkBuddy背后很多小团队在快速迭代产品，"出现很多实验，WorkBuddy做得不错"。

二是包容试错。"试验大部分拿不到正向反馈，我们也要包容团队去试错。"汤道生认为，通过大量试验去提炼出对用户流程、对结果有正向帮助的路径，是今天做Agent、做原生AI产品必须的组织支撑。

三是角色融合。原来工程师花很多时间写代码，但今天这些工作可以交给AI。"我们会看到更多角色的融合，大家都是产品经理，都要去了解透彻用户需求，以及设计出我们想要的产品形态。每一个工程师更像一个有想法的leader，驱动多个Coding Agent。"

四是质量保证前置。"测试也要左移，更前置去想清楚针对我们各种案例Eval、环境，我们对于开放式答案的要求。"每个工程都有想法，质量保证工作和对齐工作要做到前面来。

姚顺雨补充了一个关键洞察："没有正向反馈也要支持。"在AI这个充满不确定性的领域，很多有价值的探索在初期并不会获得数据上的正向反馈，但如果组织只奖励短期胜利，就会扼杀长期创新。

七、快与慢：腾讯的节奏哲学

对话中最具张力的一刻，是汤道生向姚顺雨抛出了那个尖锐的问题："很多人都说腾讯慢了，说在AI上面我们没有及时抓住一些机会，你觉得我们真的慢了吗？"

姚顺雨没有回避。他用两个判断来回应：

第一个判断：短期游戏还是长期游戏？在硅谷，蔓延着一种情绪——"两年后所有人都要失业，AI要取代所有人的工作，我们要赶快赚两年钱退休。"但姚顺雨的判断截然相反："AI是一个长期游戏，其实我觉得AI刚开始，下半场才刚刚开始。"他不认为ChatGPT和Claude Code会是唯一的超级应用，"我觉得那是一个非常灰暗的世界，我觉得肯定会有源源不断新的机会诞生。可能今天就像是70年代PC刚刚产生的时候，我觉得还有很多很多事情需要做。"

第二个判断：更线性还是更多元？过去几年，行业沿着预训练、后训练、Agent、Coding Agent的清晰主线推进，所有人都在做一样的事情，都在copy。但姚顺雨认为未来会变得更多元：Coding Agent生产力会变得更加重要，但"这个世界还有很多空间没有被填满"——多模态、具身智能，很多很多新的事情都在发生或刚刚发生。

所以，"慢就是短期，长期就是不慢"。过去模型和产品做了很多探索，走了很多弯路，但"第一次做肯定有曲折"。更重要的是"能不能诚实面对自己，能不能Be Real，能不能够看到feedback然后去改变，能不能够保持耐心"。

汤道生对此回应得坦诚而务实："腾讯是一个非常多业态的公司，在这样一个复杂的组织里面有一些地方可能我们做得快了，有的地方做得慢了，有一些地方可能会做失败，在探索。"但他强调，AI是长跑、是马拉松。腾讯丰富的产品场景、过去的积累，"其实都是可以针对每一个场景去为模型提供有用的信息，提供这些Context来发挥价值"。

马化腾此前对腾讯AI发展的定调是："腾讯AI发展有自己的节奏，站稳了再求提速。"混元大模型没有急于追求参数和Benchmark分数，而是走了一条和腾讯海量产品场景深度Co-Design的务实路线。用户和时间最终给出了答案：Hy3 preview的Token调用量是上一代的10倍，在OpenRouter上稳居全球第一。

八、第一性原理：不变与变的辩证法

对话中，姚顺雨向汤道生抛出了一个哲学式的问题："你觉得你做产品的第一性原理是什么？你觉得哪些经验和价值是不变的？哪些东西是变的？"

汤道生的回答朴素而有力："最终做产品还是本着用户到底有什么需求，我到底怎么去解决他的痛点，怎么去给用户或者客户创造价值。在不同的时代，甚至不同的行业，你做一个产品还是需要能够给用户带来价值，他才会买单，才会使用。"

但AI时代确实改变了产品的形态。过去是"预制菜"，今天是开放式服务；过去是瀑布式研发，今天是Eval驱动；过去工程师写代码，今天工程师设计架构、驱动AI写代码。这些"变"的背后，是对产品人能力要求的全面升级。

姚顺雨则将这个问题推向了更深的维度。他提到了钱学森的理论框架：时间、空间、运动、矩阵、组织方式。今天，他加上了一条自己提出的洞察："一个产品或者工程，在一个过程中，不变的是什么，变化的是什么？"

这个问题本身就是对AI产业的一记警钟。在一个技术范式剧烈震荡的时代，很多企业追逐变化——追模型、追榜单、追风口，却忘了问自己：什么是不变的？

对于腾讯而言，不变的是"用户价值"这个终极坐标，是"扎根场景"的务实基因，是"基于trust而非基于metric运转"的组织文化。变的是产品形态、研发流程、组织方式、模型与产品的协作关系。

汤道生在对话中展现出的，正是这种"老派"与"新锐"的奇特融合。姚顺雨评价他："还是比较老登，但是执行力太好了，可以作为力量。他知道每个细节。知道腾讯成功做事地图，甚至这个地图就是汤道生绘制的一部分。"

这种对细节的掌控力，对地图的熟悉度，恰恰是"不变"的东西——无论技术如何迭代，把事情做对、做扎实、做到底的执行力，永远是组织的稀缺品。

···

结语：一张正在绘制的地图

对话的尾声，汤道生宣布启动"腾讯AI共创营（二期）"，并透露当天下午将围绕个人、企业提效多个场景设置平行论坛，"把20多个新产品、新能力介绍给大家"。

20多个演示，20多个新产品——这不是一个"慢"的公司能拿出的节奏。但腾讯显然不想用"快"来定义自己。在这场对话中，无论是汤道生还是姚顺雨，都在反复强调的是：耐心、真实、长期主义。

姚顺雨在对话中提到了一个令人动容的细节：他小学时最喜欢的产品，就是腾讯的产品。从QQ空间到QQ秀，从QQ音乐到元宝，腾讯的产品陪伴了一代人的成长。今天，这位曾经的用户坐在了腾讯最高技术负责人的位置上，与绘制了腾讯成功地图的人一起，重新绘制AI时代的地图。

这张地图上没有现成的路径。预训练、后训练、Agent、Coding、多模态、具身智能……每一个方向都是未知的疆域。但正如姚顺雨所说："模型越来越擅长把一个非常复杂的输入变成输出，很多时候你的竞争壁垒就在于你有没有最原始的输入。"

腾讯的"原始输入"，是二十多年来积累的产品场景、用户关系、工程能力和组织文化。这些不是Benchmark上的分数，却是真实世界中最难复制的Context。

AI的下半场，不是一场短跑，而是一场马拉松。在这场马拉松中，腾讯或许不是起跑最快的那一个，但它可能是准备最充分、地图最完整、补给最充足的那一个。汤道生与姚顺雨的这场对话，让我们看到了一家中国科技巨头在AI时代最珍贵的品质：不装、不躲、不急躁，老老实实面对问题，踏踏实实重建基础，认认真真寻找下一个值得解决的问题。

这，或许就是腾讯AI最大的希望所在。

— END —

曲同科技 · 关注军民融合、科技哲学、AI批评
微信公众号：曲同科技 / 异曲同工

腾讯AI下半场：汤道生对话姚顺雨万字拆解8个核心信号