异曲同工 · 深度
腾讯AI下半场:汤道生对话姚顺雨
万字拆解8个核心信号
2026年6月6日 · 杨旭锋
这场对话没有PPT,没有演讲稿——腾讯集团高级执行副总裁汤道生与95后首席AI科学家姚顺雨,用一小时坦诚交锋,拆解了混元3重建之路、Agent时代的组织变革、以及腾讯AI"不装不躲不急躁"的底层逻辑。
2026年6月5日,北京国家会议中心,2026腾讯云AI产业应用大会。台上坐着两个人:一位是见证了中国互联网全波澜的"70后"产业领舵人——腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生;另一位是刚刚从OpenAI归来、出生于1998年的"95后"技术少帅——腾讯首席AI科学家、混元大模型及AI Infra负责人姚顺雨。
这是姚顺雨入职腾讯近半年后,首次在线下大型活动公开亮相。一场近一小时的对话,没有PPT,没有演讲稿,只有两个时代的人对AI下半场的坦诚交锋。从混元3的首秀到Agent的未来,从组织变革到第一性原理,这场对话不仅揭示了腾讯AI的底层逻辑,更勾勒出中国大模型产业从"追赶"到"定义"的转折轮廓。
···
一、AI下半场:从"找方法"到"找问题"
姚顺雨在对话中首先澄清了一个概念:"下半场"这个词正在被滥用。这个概念源于他去年的一篇博客。在他看来,AI已经发展了几十年,过去几十年里,行业更关心的是"怎么解决问题、寻找好的方法"——比如为围棋发明AlphaGo,为翻译训练专门的翻译模型。每一个问题都需要一个定制化的解法。
但预训练和后训练的出现,改变了这个逻辑。"我们像有了一个万能的锤子,它可以去砸任何钉子。"姚顺雨说。通用方法论已经成熟,反而更困难的是"怎么寻找好的问题去解决"。
这也是他选择加入腾讯的核心原因。在OpenAI,他参与了Operator、Deep Research等前沿Agent产品的研发,提出了著名的ReAct框架。但当他站在2026年的节点回望,他发现:方法论不再是瓶颈,问题才是。而腾讯"有很多好问题、有很多产品"。好的产品能够回答:做完预训练和后训练之后,到底要把它应用在什么地方、产生什么价值。
汤道生对此深有共鸣。他回顾了自己从QQ空间、QQ秀到QQ音乐、腾讯云再到元宝的产品生涯,指出一个不变的底层逻辑:"最终做产品还是本着用户到底有什么需求,我到底怎么去解决他的痛点。"但AI时代带来了全新的挑战——过去做产品是"预制菜"模式,用户从菜单里选;今天做产品是开放式服务,用户用自然语言提问,"你根本不知道用户会问什么"。
二、三角形组织:Foundation、Product、Frontier
姚顺雨提出了一个极具结构感的组织模型:一个均衡的"三角形"。
第一条边是Foundation(基础模型)。预训练和后训练是根基,必须做得非常solid。姚顺雨强调,预训练是一个相对"产品无关"(product-agnostic)的事情,它的最大特点是可泛化——预训练的进步可以带给各种各样下游任务持续的价值提升。但前提是:基础设施必须重建,数据体系必须变革,Eval必须回归真实。
第二条边是Product(产品应用)。技术必须为人和社会产生价值。姚顺雨认为,产品的重要性在AI时代"越来越重要"。这不仅是因为产品提供了应用场景,更因为产品提供了模型迭代最需要的养分——上下文(Context)。"模型越来越擅长把一个非常复杂的输入变成输出,很多时候你的竞争壁垒就在于你有没有最原始的输入,你知不知道这个人他到底在干什么。"腾讯的海量产品场景、交互数据和生态连接,既能为模型提供高质量上下文,也能让模型调用工具、连接系统,真正完成任务闭环。
第三条边是Frontier(前沿研究)。探索新的研究范式,寻找新的机会。姚顺雨坦言,中国今天所做的前沿探索还不够多,他希望把"frontier exploration"的精神更多地注入腾讯的组织中。
汤道生则用腾讯的"三个能力"回应了这个三角模型:第一是场景连接能力,通过微信、企业微信、元宝等高频触点,把大模型嵌到真实业务流;第二是工程驾驭能力,通过Harness体系让Agent稳定、可信、可持续运行;第三是模型驱动力,依托混元大模型与产品的Co-Design,兼顾实用性、性价比和ROI。
这三条边相互支撑,缺一不可。没有Foundation,Product就是无源之水;没有Product,Frontier就是空中楼阁;没有Frontier,整个组织就会失去未来的方向感。
···
三、混元3首秀:重建,而非修补
4月23日发布的混元Hy3 preview,是姚顺雨加入腾讯后的第一份作业,也是混元重建后训练的第一个模型。总参数295B,激活参数仅21B,最大支持256K上下文长度,采用快慢思考融合的MoE架构。这不是一次常规的版本迭代,而是一次从地基开始的重建。
姚顺雨在对话中揭示了混元3重建的三个核心维度:
第一,基础设施重建。无论是预训练还是强化学习,Infrastructure都被彻底重构。这是一种"磨刀不误砍柴工"的策略——与其在旧基座上小修小补,不如彻底重构底层,为下一代模型打好基础。
第二,数据与Eval的根本性变革。姚顺雨对国内AI圈"刷榜"文化提出了尖锐批评:"中国大家有个不好的倾向是大家喜欢刷榜,但是我觉得更重要的是如何实事求是地基于产品、基于真正的应用,构造更加真实的Eval。"榜单非常容易过拟合(Overfitting)——提问规范、多为单轮标准化问题,而现实场景中用户的提问比较模糊,往往只有一两句话且需要多轮追问。混元3发布Preview版本的核心目的之一,就是通过真实世界的产品反馈来发现和修复Benchmark榜单无法覆盖的问题。
第三,模型尺寸的取舍。姚顺雨认为,"如何用一个更小的模型把更高的价值任务做好",在今天的中国可能更有价值。Hy3 preview在大部分任务上实现了更强的鲁棒性(Robustness),这种"小模型、大性能"的路线,既降低了成本,又提升了实用性。
数据已经证明了这条路线的正确性。Hy3 preview上线以来,Token调用总量已是上一代Hy2的10倍,代码和智能体类场景的Token调用量增长超过16.5倍。在OpenRouter全球大模型API调用榜上,Hy3 preview连续三周拿下总量与市场占有率"双第一"。元宝侧Hy3 preview已覆盖超过80%的用户,活跃度和留存都在增长。
汤道生在对话中透露了一个细节:姚顺雨给元宝带来的最大价值,一是推动模型跟产品从"各自为战"转向以用户体验为北极星指标的Co-Design;二是大幅提升数据质量,"砍掉了大量看似能堆量、实则对模型训练无益甚至有害的数据"。
四、Co-Design:模型与产品的对齐难题
"模型的人,和产品的人出发点还不一样。"姚顺雨这句话,戳中了AI产业最隐秘的痛点。
做模型的人希望能力越强越好;做产品的人希望用户需求越满足越好。这两者天然存在不align(对齐)的部分。如何弥合这个裂缝?姚顺雨和汤道生的答案是:Co-Design(协同设计),但Co-Design的前提是建立Trust(信任)。
姚顺雨分享了一个关键细节:在混元自己的预训练还没有准备好的时候,他主动派遣后训练最强的骨干力量去帮助元宝把后训练做好。当时很多算法同学不理解——"我们自己的模型还没准备好,为什么要先去帮产品?"但姚顺雨坚持认为,维护元宝的产品DAU对接下来做模型非常重要,而且对于创新的合作非常重要。这个"逆向操作"让产品团队意识到:模型的同学是真的在为产品着想。这种信任的建立,为后续Hy3 preview在元宝上的成功上线起到了决定性作用。
汤道生则从产品侧补充了Co-Design的复杂性。在AI时代,产品不再是"功能清单"式的交付,而是开放式的服务形态。这带来了三个全新的挑战:
一是对齐(Alignment)问题。产品、模型、数据标注、Eval评测,多个角色需要对"什么是好的回答"达成一致。如果产品认为好的体验,评测体系不认同,产品行为就会不可预测。"怎么让多个角色能够对于一些开放式问题有比较好的对齐,如果没有做到这样一个对齐的话,你会发现产品的行为会不可预测。"
二是Eval体系的重建。传统的瀑布式研发有清晰的功能描述、设计、研发、测试流程。但AI产品需要"测试左移"——更前置地去想清楚各种案例的Eval、环境、开放式答案的要求,甚至用户风格的alignment。
三是角色融合。今年大部分代码已由AI生成,工程师花更多时间做架构设计,"写代码的工作都交给AI了"。每个工程师更像一个有想法的leader,驱动多个Coding Agent完成任务。同时,每个人都要参与评测、测试、质量保证和对齐工作。
汤道生坦言:"今天时代做产品其实要求的能力更全面。"姚顺雨接话:"更难了。"汤道生点头:"更难了。"
五、Agent时代:Coding是必选项,想象是加分项
当被问及混元最重要的能力是什么时,姚顺雨毫不犹豫地回答:"Coding是必须要做的,Agent是最重要的事情,还是体系是全面化。"
这并非偶然。姚顺雨的博士论文标题就是《Language Agent: From Next Token Prediction to Digital Automation》,写于2019年——GPT-2的时代。当时人们很难想象下一个Token预测会改变世界,但姚顺雨已经看到了更远的可能性:"GPT是一个非常优美的东西,吐下一个Token是一个非常极简且非常通用的事情,它有一天潜力不仅仅在于吐出下一个Token,而在于把这个世界上所有的事情全部automate。"
他回忆了2022年7月的一个夜晚:当他第一次把PaLM 2的API和Wikipedia API连在一起,模型第一次可以基于网页回答问题并多轮交互时,"我感觉就像微弱电灯丝突然亮的感觉一样"。那是人类第一次把LLM和互联网连在一起做多轮交互。他当时预测这可能在5年或10年改变一些事情,"但可能比我想象中还要更快"。
今天,Agent技术最重要的两个方向确实是Web Agent和Coding Agent。姚顺雨认为,Coding Agent非常本质,因为它"有点像图灵完备的事情"——当你有能力去控制自己的file system,当你有一个container的时候,你是一个complete system。
但姚顺雨强调,做好Coding Agent需要远远不止Coding的数据,也需要聊天、推理、搜索、指令遵循等各种各样的能力。"大模型最重要的点是泛化性。"这种泛化性意味着,产品和模型必须形成一个"网络一样的体系"——元宝的Co-Design使模型产生很强的聊天和搜索能力,这样的能力又可以被迁移到ima和WorkBuddy,这些产品提供不同的数据,但这些数据之间又可以相互泛化。
汤道生则从产品侧描绘了Agent的落地路径:给模型提供工具(Tool)、提供记忆(Memory)、提供Skill。"重点是模型的触角越多越好。"在不同的Agent场景中,重要的是了解什么内容、什么信息是重要的、比较relevant的,能够跟模型配合好,让模型有它需要的信息,同时也发挥它的能力。
姚顺雨还提出了一个更具前瞻性的观点:"需要想象部分,做好基础部分上,这个必须的。"无论是技术演进、产品演进,还是下一个范式演进,都需要探索性甚至不确定性的工作。他博士论文2024年写的future work——train models for Agent、safe and robust deployment、scientific discovery、help human——现在他幸运地正在做这些方向。但他也自嘲:"可能想的还是不够大,我觉得已经觉得自己想的够大了,但是可能还是不够大。"
···
六、组织变革:3-5人小团队与快速迭代
AI时代的产品研发组织,正在发生一场静默的革命。
汤道生透露,他前阵子帮WorkBuddy做组织发文时,发现其组织架构"非常扁平化",跟过去的产品组织架构有很大差异。更多是小团队,三个人、五个人,围绕某一个领域做攻坚。"有很多试验在里面,还要支持Infra做实验,让不同的小分队可以去探索然后再验证。"
这种组织形态有几个鲜明特征:
一是小团队、快速迭代。姚顺雨强调"小团队,快速迭代,快速做"。汤道生观察到,WorkBuddy背后很多小团队在快速迭代产品,"出现很多实验,WorkBuddy做得不错"。
二是包容试错。"试验大部分拿不到正向反馈,我们也要包容团队去试错。"汤道生认为,通过大量试验去提炼出对用户流程、对结果有正向帮助的路径,是今天做Agent、做原生AI产品必须的组织支撑。
三是角色融合。原来工程师花很多时间写代码,但今天这些工作可以交给AI。"我们会看到更多角色的融合,大家都是产品经理,都要去了解透彻用户需求,以及设计出我们想要的产品形态。每一个工程师更像一个有想法的leader,驱动多个Coding Agent。"
四是质量保证前置。"测试也要左移,更前置去想清楚针对我们各种案例Eval、环境,我们对于开放式答案的要求。"每个工程都有想法,质量保证工作和对齐工作要做到前面来。
姚顺雨补充了一个关键洞察:"没有正向反馈也要支持。"在AI这个充满不确定性的领域,很多有价值的探索在初期并不会获得数据上的正向反馈,但如果组织只奖励短期胜利,就会扼杀长期创新。
七、快与慢:腾讯的节奏哲学
对话中最具张力的一刻,是汤道生向姚顺雨抛出了那个尖锐的问题:"很多人都说腾讯慢了,说在AI上面我们没有及时抓住一些机会,你觉得我们真的慢了吗?"
姚顺雨没有回避。他用两个判断来回应:
第一个判断:短期游戏还是长期游戏?在硅谷,蔓延着一种情绪——"两年后所有人都要失业,AI要取代所有人的工作,我们要赶快赚两年钱退休。"但姚顺雨的判断截然相反:"AI是一个长期游戏,其实我觉得AI刚开始,下半场才刚刚开始。"他不认为ChatGPT和Claude Code会是唯一的超级应用,"我觉得那是一个非常灰暗的世界,我觉得肯定会有源源不断新的机会诞生。可能今天就像是70年代PC刚刚产生的时候,我觉得还有很多很多事情需要做。"
第二个判断:更线性还是更多元?过去几年,行业沿着预训练、后训练、Agent、Coding Agent的清晰主线推进,所有人都在做一样的事情,都在copy。但姚顺雨认为未来会变得更多元:Coding Agent生产力会变得更加重要,但"这个世界还有很多空间没有被填满"——多模态、具身智能,很多很多新的事情都在发生或刚刚发生。
所以,"慢就是短期,长期就是不慢"。过去模型和产品做了很多探索,走了很多弯路,但"第一次做肯定有曲折"。更重要的是"能不能诚实面对自己,能不能Be Real,能不能够看到feedback然后去改变,能不能够保持耐心"。
汤道生对此回应得坦诚而务实:"腾讯是一个非常多业态的公司,在这样一个复杂的组织里面有一些地方可能我们做得快了,有的地方做得慢了,有一些地方可能会做失败,在探索。"但他强调,AI是长跑、是马拉松。腾讯丰富的产品场景、过去的积累,"其实都是可以针对每一个场景去为模型提供有用的信息,提供这些Context来发挥价值"。
马化腾此前对腾讯AI发展的定调是:"腾讯AI发展有自己的节奏,站稳了再求提速。"混元大模型没有急于追求参数和Benchmark分数,而是走了一条和腾讯海量产品场景深度Co-Design的务实路线。用户和时间最终给出了答案:Hy3 preview的Token调用量是上一代的10倍,在OpenRouter上稳居全球第一。
八、第一性原理:不变与变的辩证法
对话中,姚顺雨向汤道生抛出了一个哲学式的问题:"你觉得你做产品的第一性原理是什么?你觉得哪些经验和价值是不变的?哪些东西是变的?"
汤道生的回答朴素而有力:"最终做产品还是本着用户到底有什么需求,我到底怎么去解决他的痛点,怎么去给用户或者客户创造价值。在不同的时代,甚至不同的行业,你做一个产品还是需要能够给用户带来价值,他才会买单,才会使用。"
但AI时代确实改变了产品的形态。过去是"预制菜",今天是开放式服务;过去是瀑布式研发,今天是Eval驱动;过去工程师写代码,今天工程师设计架构、驱动AI写代码。这些"变"的背后,是对产品人能力要求的全面升级。
姚顺雨则将这个问题推向了更深的维度。他提到了钱学森的理论框架:时间、空间、运动、矩阵、组织方式。今天,他加上了一条自己提出的洞察:"一个产品或者工程,在一个过程中,不变的是什么,变化的是什么?"
这个问题本身就是对AI产业的一记警钟。在一个技术范式剧烈震荡的时代,很多企业追逐变化——追模型、追榜单、追风口,却忘了问自己:什么是不变的?
对于腾讯而言,不变的是"用户价值"这个终极坐标,是"扎根场景"的务实基因,是"基于trust而非基于metric运转"的组织文化。变的是产品形态、研发流程、组织方式、模型与产品的协作关系。
汤道生在对话中展现出的,正是这种"老派"与"新锐"的奇特融合。姚顺雨评价他:"还是比较老登,但是执行力太好了,可以作为力量。他知道每个细节。知道腾讯成功做事地图,甚至这个地图就是汤道生绘制的一部分。"
这种对细节的掌控力,对地图的熟悉度,恰恰是"不变"的东西——无论技术如何迭代,把事情做对、做扎实、做到底的执行力,永远是组织的稀缺品。
···
结语:一张正在绘制的地图
对话的尾声,汤道生宣布启动"腾讯AI共创营(二期)",并透露当天下午将围绕个人、企业提效多个场景设置平行论坛,"把20多个新产品、新能力介绍给大家"。
20多个演示,20多个新产品——这不是一个"慢"的公司能拿出的节奏。但腾讯显然不想用"快"来定义自己。在这场对话中,无论是汤道生还是姚顺雨,都在反复强调的是:耐心、真实、长期主义。
姚顺雨在对话中提到了一个令人动容的细节:他小学时最喜欢的产品,就是腾讯的产品。从QQ空间到QQ秀,从QQ音乐到元宝,腾讯的产品陪伴了一代人的成长。今天,这位曾经的用户坐在了腾讯最高技术负责人的位置上,与绘制了腾讯成功地图的人一起,重新绘制AI时代的地图。
这张地图上没有现成的路径。预训练、后训练、Agent、Coding、多模态、具身智能……每一个方向都是未知的疆域。但正如姚顺雨所说:"模型越来越擅长把一个非常复杂的输入变成输出,很多时候你的竞争壁垒就在于你有没有最原始的输入。"
腾讯的"原始输入",是二十多年来积累的产品场景、用户关系、工程能力和组织文化。这些不是Benchmark上的分数,却是真实世界中最难复制的Context。
AI的下半场,不是一场短跑,而是一场马拉松。在这场马拉松中,腾讯或许不是起跑最快的那一个,但它可能是准备最充分、地图最完整、补给最充足的那一个。汤道生与姚顺雨的这场对话,让我们看到了一家中国科技巨头在AI时代最珍贵的品质:不装、不躲、不急躁,老老实实面对问题,踏踏实实重建基础,认认真真寻找下一个值得解决的问题。
这,或许就是腾讯AI最大的希望所在。
— END —
曲同科技 · 关注军民融合、科技哲学、AI批评
微信公众号:曲同科技 / 异曲同工
夜雨聆风