27岁姚顺雨“交卷”!腾讯AI开始抢跑下半场
作者| 拂晓子
来源 | 具身之家产业观察(ID:zscy006)
27岁的姚顺雨,终于在腾讯交出了第一张答卷。
但这张答卷的分量,不只是一个年轻科学家的首秀,它更像是腾讯AI打法的一次重启。
4月23日,腾讯混元 Hy3 preview 正式上线并开源。这是姚顺雨归国加盟腾讯后,带队交出的第一个重要成果,也是混元团队在架构、基础设施重新出发后的首个版本。

从参数看,Hy3 preview 是一个快慢思考融合的 MoE 语言模型,总参数 295B,激活参数 21B,支持 256K 上下文。
更关键的是,它不是只停留在模型页面上,而是已经进入腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等产品,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等主线产品也在陆续上线。
这意味着,腾讯这次不是又发了一个模型,它是在重新回答一个更大的问题:
AI下半场,腾讯到底靠什么赢?
姚顺雨“重建混元”
如果说去年国内大模型竞争,重点还在“谁先卷出更强能力”,那么今年开始,问题已经变了。
市场不再只关心:
这个模型聪不聪明?这个模型会不会写诗?这个模型能不能拿高分?
大家开始关心的是:
它能不能完成一个真实任务?它能不能联网、搜集、比对、分析、输出?它能不能稳定调用工具?它能不能在产品里跑起来?它能不能在企业场景里创造效率?
这就是为什么腾讯这次反复强调两个词:重建、实用性。
Hy3 preview 是混元团队在架构、基础设施重新出发后的第一个版本。换句话说,这次不是常规意义上的“模型升级”,而是一次底层工程的重构。
这背后其实透露了一个非常重要的信号:腾讯已经不满足于做一个“可以回答问题”的模型,它想做的是一个可以被全产品线调用,并且真正进入工作流的智能底座。
这一点,对腾讯尤其关键,因为腾讯最强的从来不是单个模型,而是生态。
元宝、腾讯云、QQ、QQ浏览器、腾讯文档、腾讯乐享、微信公众号、腾讯新闻、腾讯客服、微信读书、和平精英、CodeBuddy、WorkBuddy……这些产品背后,本质上都在等待一个更统一、更稳定、更能执行复杂任务的AI引擎。
如果没有这样一个底座,腾讯AI就会变成“每个产品都有一点AI,但没有形成腾讯级AI能力”。
而Hy3 preview的出现,本质上就是在解决这个问题。
于是,从姚顺雨加入腾讯开始,就把评测重心从“考卷式能力”转向“真实任务式能力”,AI下半场,评估比训练更重要。

姚顺雨
今天通用大模型的基础配方,其实已经非常成熟。预训练、强化学习、算力扩展,这些大家都在做。继续在同一套题库上卷,当然还能进步,但很多时候投入巨大,提升却有限。
真正拉开差距的,不再是谁多刷了几分,而是谁定义了更接近现实世界的新任务,谁能更客观地衡量“这个模型到底能不能解决问题”。
在腾讯版 AI 办公助手 WorkBuddy 上,我们可以选择最新的混元模型,让它进行代码开发、深度研究、产品管理、数据分析等。

比如我们要求它联网获取联合国人口司数据,完成一项「全球人口结构变迁」可视化分析。
这是一个涉及数据获取、清洗、分析与可视化呈现的复合型任务,Hy3 preview 同样完成得较为顺畅,最终输出了直观的图表与分析文本。

腾讯这次就是直接把模型扔进工作流里,看看它到底能不能干活。
这件事,非常腾讯。
因为腾讯拥有中国互联网里最复杂的一批真实业务环境:社交、内容、搜索、广告、办公、云服务、游戏、金融信息、客服、开发者工具……这些场景天然就是“现实世界的测试场”。
所以,腾讯自建基准测试的真正价值,不是比别人多做了一套题库,而是它更容易把“真实业务痛点”直接变成评估环境。
这意味着,Hy3 preview 的评测逻辑已经不是“做更难的考卷”,而是在尝试回答一个更商业化的问题:AI到底能不能在复杂业务里,完成一件完整的事。
硬核看点:Agent能力
姚顺雨本身就是 ReAct 框架的重要提出者之一,ReAct 的关键价值,不是让模型说得更像人,而是让模型学会“推理 + 行动”——一边想,一边调用工具,一边不断修正。
这恰恰是AI下半场最重要的能力之一。
Hy3 preview 在腾讯版 AI 办公助手 WorkBuddy 里的表现,已经明显不是传统问答模型那一套了。
1)它开始能处理“深度研究型任务”
Hy3 preview 能够自主启动多步搜索,完成长链推理,并最终输出一份相对客观、中立、结构化的调查报告。
对于企业来说,这种能力的商业价值远比聊天更大。因为大量知识工作,本质上就是:搜信息 → 找差异 → 做判断 → 出报告。
如果模型能把这条链跑通,它就不只是AI助手,而是流程参与者。
2)它开始能处理“数据分析型任务”
Hy3 preview 最终能够输出较为直观的图表和分析文本,这说明它不只是“会写分析”,而是已经开始具备一定的“数据型任务执行能力”。
如果这个能力后续继续稳定,它进入企业分析、市场研究、咨询辅助、投研辅助、BI应用场景的空间会非常大。
3)它开始能处理“代码交付型任务”
腾讯手里已经有 CodeBuddy、WorkBuddy 这样的工具入口。如果底层模型在代码生成、调试、修复、产品协作等能力上持续增强,腾讯完全有机会把模型能力,往研发流程、办公流程和协作流程深度嵌入。
换句话说,模型的价值不只是写代码,而是开始影响交付效率。
腾讯的一次工业化取舍
Hy3 preview 选择的是 295B 总参数、21B 激活参数的 MoE 路线,这条路线背后的商业含义,其实非常明确:腾讯选择的不是“参数叙事”,而是“工业化可用性”。
如果只拼想象力,当然可以继续往更大模型走。但腾讯是一个拥有海量真实业务的公司,它必须考虑几个更现实的问题:
- 🔵推理成本
- 🔵并发吞吐
- 🔵服务稳定性
- 🔵部署复杂度
- 🔵上线效率
- 🔵多产品接入能力
从这个角度看,295B 并不是“保守”,而是一种很腾讯的工程选择,因为腾讯需要的不是实验室里最猛的模型。
它需要的是一个能在腾讯云、元宝、QQ、文档、办公、搜索、内容、客服、代码工具等多场景同时跑起来的模型。
这背后的逻辑,不是“把模型做到最大”,而是“把模型做到最能进入业务”。
混元团队把相当多精力都砸在了 infra 上——包括预训练、强化学习基础设施的重做,以及评估体系的加强。
这其实才是AI下半场真正的硬仗,因为今天真正能拉开差距的,不再是一个小的注意力机制创新,不再是一个漂亮的理论点,而是:谁能把模型训练、评估、部署、迭代、上线这一整套工程系统打牢。
性”上,而是放在了“实用性、稳定性、性价比”上。
这不是不够激进,恰恰相反,这是大公司真正开始进入工业化阶段的标志。
我们认为腾讯真正想做的,不是一个模型,而是“Agent化腾讯”。
不是给每个产品简单加一个对话框、不是让用户对着AI聊聊天,也不是只追求“会不会回答”,而是让AI逐步学会:
- 🔵读懂任务
- 🔵拆解任务
- 🔵调用工具
- 🔵获取信息
- 🔵处理数据
- 🔵生成结果
- 🔵在产品里完成闭环
一旦这件事跑通,腾讯的商业空间就会被彻底重写。
因为腾讯过去最强的是“连接能力”:连接人,连接内容,连接社交,连接交易,连接娱乐,连接企业。
而AI一旦进入下半场,腾讯就有机会从一家“连接型公司”,进一步变成一家“调度型公司”。
腾讯AI下半场靠什么?
说到底,AI竞争不是单靠技术热情就能打赢的。它需要两样东西:“真实场景”以及“持续投入能力”。
腾讯恰恰同时具备这两样。
从场景上看,腾讯拥有中国互联网最复杂的一批业务系统。微信、QQ、游戏、广告、办公、云服务、内容生态、金融信息服务,这些天然都是AI的落地场。
从财务上看,腾讯2025年总收入超过7500亿元,毛利超过4200亿元,Non-IFRS经营利润超过2800亿元,自由现金流超过1800亿元。
这意味着,腾讯做AI,不是靠融资故事,不是靠短期资本市场想象力,而是靠主业现金流去支撑长期投入。
这和很多AI创业公司的打法完全不同,创业公司要用模型证明估值,腾讯要用模型改造经营效率,改造产品体验,改造利润模型。
所以,Hy3 preview 对腾讯来说,从来不是一个“独立业务”,它更像一层新的基础设施。
眼下,Hy3 preview 只是开始。
腾讯后面至少还有三道硬题要继续回答:
1.开源之后,能不能真正形成开发者生态?2.Agent能力能不能在高频场景里稳定运行,而不是只在Demo里漂亮?3.混元能不能形成区别于阿里、字节、DeepSeek的差异化路径?
当姚顺雨加入腾讯,外界只看到“年轻”“天才”“OpenAI背景”。
但对腾讯来说,更重要的不是一个人的光环,而是一套新的组织逻辑:
用真实任务定义模型;用复杂场景训练模型;用评估体系反推能力建设;用产品入口放大模型价值;用工程化和基础设施把能力变成生产力……
AI上半场,腾讯看起来似乎慢了一步,但AI下半场,竞争规则已经变了。
当模型不再只是回答问题,而是开始调用工具、理解流程、进入产品、参与工作、重写效率,腾讯手里的微信、QQ、文档、云、广告、游戏、办公和内容生态,反而会重新变成一张大牌。
真正的AI巨头,不一定是最先把模型做出来的公司。
而是最先把模型,塞进每一条业务流程里的公司。
— 完 —
商务合作:15201337588(微信)
◆◆◆

一键关注 👇 点亮星标
锁定AI科技锐评极速推送

夜雨聆风