27岁姚顺雨“交卷”!腾讯AI开始抢跑下半场-夜雨聆风

27岁姚顺雨“交卷”!腾讯AI开始抢跑下半场

作者| 拂晓子

来源 | 具身之家产业观察（ID：zscy006）

27岁的姚顺雨，终于在腾讯交出了第一张答卷。

但这张答卷的分量，不只是一个年轻科学家的首秀，它更像是腾讯AI打法的一次重启。

4月23日，腾讯混元 Hy3 preview 正式上线并开源。这是姚顺雨归国加盟腾讯后，带队交出的第一个重要成果，也是混元团队在架构、基础设施重新出发后的首个版本。

从参数看，Hy3 preview 是一个快慢思考融合的 MoE 语言模型，总参数 295B，激活参数 21B，支持 256K 上下文。

更关键的是，它不是只停留在模型页面上，而是已经进入腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等产品，微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等主线产品也在陆续上线。

这意味着，腾讯这次不是又发了一个模型，它是在重新回答一个更大的问题：

AI下半场，腾讯到底靠什么赢？

姚顺雨“重建混元”

如果说去年国内大模型竞争，重点还在“谁先卷出更强能力”，那么今年开始，问题已经变了。

市场不再只关心：

这个模型聪不聪明？这个模型会不会写诗？这个模型能不能拿高分？

大家开始关心的是：

它能不能完成一个真实任务？它能不能联网、搜集、比对、分析、输出？它能不能稳定调用工具？它能不能在产品里跑起来？它能不能在企业场景里创造效率？

这就是为什么腾讯这次反复强调两个词：重建、实用性。

Hy3 preview 是混元团队在架构、基础设施重新出发后的第一个版本。换句话说，这次不是常规意义上的“模型升级”，而是一次底层工程的重构。

这背后其实透露了一个非常重要的信号：腾讯已经不满足于做一个“可以回答问题”的模型，它想做的是一个可以被全产品线调用，并且真正进入工作流的智能底座。

这一点，对腾讯尤其关键，因为腾讯最强的从来不是单个模型，而是生态。

元宝、腾讯云、QQ、QQ浏览器、腾讯文档、腾讯乐享、微信公众号、腾讯新闻、腾讯客服、微信读书、和平精英、CodeBuddy、WorkBuddy……这些产品背后，本质上都在等待一个更统一、更稳定、更能执行复杂任务的AI引擎。

如果没有这样一个底座，腾讯AI就会变成“每个产品都有一点AI，但没有形成腾讯级AI能力”。

而Hy3 preview的出现，本质上就是在解决这个问题。

于是，从姚顺雨加入腾讯开始，就把评测重心从“考卷式能力”转向“真实任务式能力”，AI下半场，评估比训练更重要。

姚顺雨

今天通用大模型的基础配方，其实已经非常成熟。预训练、强化学习、算力扩展，这些大家都在做。继续在同一套题库上卷，当然还能进步，但很多时候投入巨大，提升却有限。

真正拉开差距的，不再是谁多刷了几分，而是谁定义了更接近现实世界的新任务，谁能更客观地衡量“这个模型到底能不能解决问题”。

在腾讯版 AI 办公助手 WorkBuddy 上，我们可以选择最新的混元模型，让它进行代码开发、深度研究、产品管理、数据分析等。

比如我们要求它联网获取联合国人口司数据，完成一项「全球人口结构变迁」可视化分析。

这是一个涉及数据获取、清洗、分析与可视化呈现的复合型任务，Hy3 preview 同样完成得较为顺畅，最终输出了直观的图表与分析文本。

腾讯这次就是直接把模型扔进工作流里，看看它到底能不能干活。

这件事，非常腾讯。

因为腾讯拥有中国互联网里最复杂的一批真实业务环境：社交、内容、搜索、广告、办公、云服务、游戏、金融信息、客服、开发者工具……这些场景天然就是“现实世界的测试场”。

所以，腾讯自建基准测试的真正价值，不是比别人多做了一套题库，而是它更容易把“真实业务痛点”直接变成评估环境。

这意味着，Hy3 preview 的评测逻辑已经不是“做更难的考卷”，而是在尝试回答一个更商业化的问题：AI到底能不能在复杂业务里，完成一件完整的事。

硬核看点：Agent能力

姚顺雨本身就是 ReAct 框架的重要提出者之一，ReAct 的关键价值，不是让模型说得更像人，而是让模型学会“推理 + 行动”——一边想，一边调用工具，一边不断修正。

这恰恰是AI下半场最重要的能力之一。

Hy3 preview 在腾讯版 AI 办公助手 WorkBuddy 里的表现，已经明显不是传统问答模型那一套了。

1）它开始能处理“深度研究型任务”

Hy3 preview 能够自主启动多步搜索，完成长链推理，并最终输出一份相对客观、中立、结构化的调查报告。

对于企业来说，这种能力的商业价值远比聊天更大。因为大量知识工作，本质上就是：搜信息 → 找差异 → 做判断 → 出报告。

如果模型能把这条链跑通，它就不只是AI助手，而是流程参与者。

2）它开始能处理“数据分析型任务”

Hy3 preview 最终能够输出较为直观的图表和分析文本，这说明它不只是“会写分析”，而是已经开始具备一定的“数据型任务执行能力”。

如果这个能力后续继续稳定，它进入企业分析、市场研究、咨询辅助、投研辅助、BI应用场景的空间会非常大。

3）它开始能处理“代码交付型任务”

腾讯手里已经有 CodeBuddy、WorkBuddy 这样的工具入口。如果底层模型在代码生成、调试、修复、产品协作等能力上持续增强，腾讯完全有机会把模型能力，往研发流程、办公流程和协作流程深度嵌入。

换句话说，模型的价值不只是写代码，而是开始影响交付效率。

腾讯的一次工业化取舍

Hy3 preview 选择的是 295B 总参数、21B 激活参数的 MoE 路线，这条路线背后的商业含义，其实非常明确：腾讯选择的不是“参数叙事”，而是“工业化可用性”。

如果只拼想象力，当然可以继续往更大模型走。但腾讯是一个拥有海量真实业务的公司，它必须考虑几个更现实的问题：

🔵推理成本
🔵并发吞吐
🔵服务稳定性
🔵部署复杂度
🔵上线效率
🔵多产品接入能力

从这个角度看，295B 并不是“保守”，而是一种很腾讯的工程选择，因为腾讯需要的不是实验室里最猛的模型。

它需要的是一个能在腾讯云、元宝、QQ、文档、办公、搜索、内容、客服、代码工具等多场景同时跑起来的模型。

这背后的逻辑，不是“把模型做到最大”，而是“把模型做到最能进入业务”。

混元团队把相当多精力都砸在了 infra 上——包括预训练、强化学习基础设施的重做，以及评估体系的加强。

这其实才是AI下半场真正的硬仗，因为今天真正能拉开差距的，不再是一个小的注意力机制创新，不再是一个漂亮的理论点，而是：谁能把模型训练、评估、部署、迭代、上线这一整套工程系统打牢。

性”上，而是放在了“实用性、稳定性、性价比”上。

这不是不够激进，恰恰相反，这是大公司真正开始进入工业化阶段的标志。

我们认为腾讯真正想做的，不是一个模型，而是“Agent化腾讯”。

不是给每个产品简单加一个对话框、不是让用户对着AI聊聊天，也不是只追求“会不会回答”，而是让AI逐步学会：

🔵读懂任务
🔵拆解任务
🔵调用工具
🔵获取信息
🔵处理数据
🔵生成结果
🔵在产品里完成闭环

一旦这件事跑通，腾讯的商业空间就会被彻底重写。

因为腾讯过去最强的是“连接能力”：连接人，连接内容，连接社交，连接交易，连接娱乐，连接企业。

而AI一旦进入下半场，腾讯就有机会从一家“连接型公司”，进一步变成一家“调度型公司”。

腾讯AI下半场靠什么？

说到底，AI竞争不是单靠技术热情就能打赢的。它需要两样东西：“真实场景”以及“持续投入能力”。

腾讯恰恰同时具备这两样。

从场景上看，腾讯拥有中国互联网最复杂的一批业务系统。微信、QQ、游戏、广告、办公、云服务、内容生态、金融信息服务，这些天然都是AI的落地场。

从财务上看，腾讯2025年总收入超过7500亿元，毛利超过4200亿元，Non-IFRS经营利润超过2800亿元，自由现金流超过1800亿元。

这意味着，腾讯做AI，不是靠融资故事，不是靠短期资本市场想象力，而是靠主业现金流去支撑长期投入。

这和很多AI创业公司的打法完全不同，创业公司要用模型证明估值，腾讯要用模型改造经营效率，改造产品体验，改造利润模型。

所以，Hy3 preview 对腾讯来说，从来不是一个“独立业务”，它更像一层新的基础设施。

眼下，Hy3 preview 只是开始。

腾讯后面至少还有三道硬题要继续回答：

1.开源之后，能不能真正形成开发者生态？2.Agent能力能不能在高频场景里稳定运行，而不是只在Demo里漂亮？3.混元能不能形成区别于阿里、字节、DeepSeek的差异化路径？

当姚顺雨加入腾讯，外界只看到“年轻”“天才”“OpenAI背景”。

但对腾讯来说，更重要的不是一个人的光环，而是一套新的组织逻辑：

用真实任务定义模型；用复杂场景训练模型；用评估体系反推能力建设；用产品入口放大模型价值；用工程化和基础设施把能力变成生产力……

AI上半场，腾讯看起来似乎慢了一步，但AI下半场，竞争规则已经变了。

当模型不再只是回答问题，而是开始调用工具、理解流程、进入产品、参与工作、重写效率，腾讯手里的微信、QQ、文档、云、广告、游戏、办公和内容生态，反而会重新变成一张大牌。

真正的AI巨头，不一定是最先把模型做出来的公司。

而是最先把模型，塞进每一条业务流程里的公司。

— 完 —

商务合作：15201337588（微信）

◆◆◆

一键关注 👇 点亮星标

锁定AI科技锐评极速推送

文章好看就点这里