乐于分享
好东西不私藏

27岁姚顺雨“交卷”!腾讯AI开始抢跑下半场

27岁姚顺雨“交卷”!腾讯AI开始抢跑下半场

作者| 拂晓子

来源 | 具身之家产业观察(ID:zscy006

27岁的姚顺雨,终于在腾讯交出了第一张答卷。

但这张答卷的分量,不只是一个年轻科学家的首秀,它更像是腾讯AI打法的一次重启。

423日,腾讯混元 Hy3 preview 正式上线并开源。这是姚顺雨归国加盟腾讯后,带队交出的第一个重要成果,也是混元团队在架构、基础设施重新出发后的首个版本。

从参数看,Hy3 preview 是一个快慢思考融合的 MoE 语言模型,总参数 295B,激活参数 21B,支持 256K 上下文。

更关键的是,它不是只停留在模型页面上,而是已经进入腾讯云、元宝、imaCodeBuddyWorkBuddyQQQQ浏览器、腾讯文档、腾讯乐享等产品,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等主线产品也在陆续上线。

这意味着,腾讯这次不是又发了一个模型,它是在重新回答一个更大的问题:

AI下半场,腾讯到底靠什么赢?

姚顺雨“重建混元”

如果说去年国内大模型竞争,重点还在谁先卷出更强能力,那么今年开始,问题已经变了。

市场不再只关心:

这个模型聪不聪明?这个模型会不会写诗?这个模型能不能拿高分?

大家开始关心的是:

它能不能完成一个真实任务?它能不能联网、搜集、比对、分析、输出?它能不能稳定调用工具?它能不能在产品里跑起来?它能不能在企业场景里创造效率?

这就是为什么腾讯这次反复强调两个词:重建实用性

Hy3 preview 是混元团队在架构、基础设施重新出发后的第一个版本。换句话说,这次不是常规意义上的模型升级,而是一次底层工程的重构。

这背后其实透露了一个非常重要的信号:腾讯已经不满足于做一个可以回答问题的模型,它想做的是一个可以被全产品线调用,并且真正进入工作流的智能底座。

这一点,对腾讯尤其关键,因为腾讯最强的从来不是单个模型,而是生态。

元宝、腾讯云、QQQQ浏览器、腾讯文档、腾讯乐享、微信公众号、腾讯新闻、腾讯客服、微信读书、和平精英、CodeBuddyWorkBuddy……这些产品背后,本质上都在等待一个更统一、更稳定、更能执行复杂任务的AI引擎。

如果没有这样一个底座,腾讯AI就会变成每个产品都有一点AI,但没有形成腾讯级AI能力

Hy3 preview的出现,本质上就是在解决这个问题。

于是,从姚顺雨加入腾讯开始,就把评测重心从考卷式能力转向真实任务式能力AI下半场,评估比训练更重要。

姚顺雨

今天通用大模型的基础配方,其实已经非常成熟。预训练、强化学习、算力扩展,这些大家都在做。继续在同一套题库上卷,当然还能进步,但很多时候投入巨大,提升却有限。

真正拉开差距的,不再是谁多刷了几分,而是谁定义了更接近现实世界的新任务,谁能更客观地衡量这个模型到底能不能解决问题

在腾讯版 AI 办公助手 WorkBuddy 上,我们可以选择最新的混元模型,让它进行代码开发、深度研究、产品管理、数据分析等。

比如我们要求它联网获取联合国人口司数据,完成一项「全球人口结构变迁」可视化分析。

这是一个涉及数据获取、清洗、分析与可视化呈现的复合型任务,Hy3 preview 同样完成得较为顺畅,最终输出了直观的图表与分析文本。

腾讯这次就是直接把模型扔进工作流里,看看它到底能不能干活。

这件事,非常腾讯。

因为腾讯拥有中国互联网里最复杂的一批真实业务环境:社交、内容、搜索、广告、办公、云服务、游戏、金融信息、客服、开发者工具……这些场景天然就是现实世界的测试场

所以,腾讯自建基准测试的真正价值,不是比别人多做了一套题库,而是它更容易把真实业务痛点直接变成评估环境。

这意味着,Hy3 preview 的评测逻辑已经不是做更难的考卷,而是在尝试回答一个更商业化的问题:AI到底能不能在复杂业务里,完成一件完整的事。

硬核看点:Agent能力

姚顺雨本身就是 ReAct 框架的重要提出者之一,ReAct 的关键价值,不是让模型说得更像人,而是让模型学会推理 + 行动”——一边想,一边调用工具,一边不断修正。

这恰恰是AI下半场最重要的能力之一。

Hy3 preview 在腾讯版 AI 办公助手 WorkBuddy 里的表现,已经明显不是传统问答模型那一套了。

1)它开始能处理“深度研究型任务”

Hy3 preview 能够自主启动多步搜索,完成长链推理,并最终输出一份相对客观、中立、结构化的调查报告。

对于企业来说,这种能力的商业价值远比聊天更大。因为大量知识工作,本质上就是:搜信息 → 找差异 → 做判断 → 出报告。

如果模型能把这条链跑通,它就不只是AI助手,而是流程参与者。

2)它开始能处理“数据分析型任务”

Hy3 preview 最终能够输出较为直观的图表和分析文本,这说明它不只是会写分析,而是已经开始具备一定的数据型任务执行能力

如果这个能力后续继续稳定,它进入企业分析、市场研究、咨询辅助、投研辅助、BI应用场景的空间会非常大。

3)它开始能处理“代码交付型任务”

腾讯手里已经有 CodeBuddyWorkBuddy 这样的工具入口。如果底层模型在代码生成、调试、修复、产品协作等能力上持续增强,腾讯完全有机会把模型能力,往研发流程、办公流程和协作流程深度嵌入。

换句话说,模型的价值不只是写代码,而是开始影响交付效率。

腾讯的一次工业化取舍

Hy3 preview 选择的是 295B 总参数、21B 激活参数的 MoE 路线,这条路线背后的商业含义,其实非常明确:腾讯选择的不是参数叙事,而是工业化可用性

如果只拼想象力,当然可以继续往更大模型走。但腾讯是一个拥有海量真实业务的公司,它必须考虑几个更现实的问题:

  • 🔵推理成本
  • 🔵并发吞吐
  • 🔵服务稳定性
  • 🔵部署复杂度
  • 🔵上线效率
  • 🔵多产品接入能力

从这个角度看,295B 并不是保守,而是一种很腾讯的工程选择,因为腾讯需要的不是实验室里最猛的模型。

它需要的是一个能在腾讯云、元宝、QQ、文档、办公、搜索、内容、客服、代码工具等多场景同时跑起来的模型。

这背后的逻辑,不是把模型做到最大,而是把模型做到最能进入业务

混元团队把相当多精力都砸在了 infra ——包括预训练、强化学习基础设施的重做,以及评估体系的加强。

这其实才是AI下半场真正的硬仗,因为今天真正能拉开差距的,不再是一个小的注意力机制创新,不再是一个漂亮的理论点,而是:谁能把模型训练、评估、部署、迭代、上线这一整套工程系统打牢。

上,而是放在了实用性、稳定性、性价比上。

这不是不够激进,恰恰相反,这是大公司真正开始进入工业化阶段的标志。

我们认为腾讯真正想做的,不是一个模型,而是“Agent化腾讯

不是给每个产品简单加一个对话框、不是让用户对着AI聊聊天,也不是只追求会不会回答,而是让AI逐步学会:

  • 🔵读懂任务
  • 🔵拆解任务
  • 🔵调用工具
  • 🔵获取信息
  • 🔵处理数据
  • 🔵生成结果
  • 🔵在产品里完成闭环

一旦这件事跑通,腾讯的商业空间就会被彻底重写。

因为腾讯过去最强的是连接能力:连接人,连接内容,连接社交,连接交易,连接娱乐,连接企业。

AI一旦进入下半场,腾讯就有机会从一家连接型公司,进一步变成一家调度型公司

腾讯AI下半场靠什么?

说到底,AI竞争不是单靠技术热情就能打赢的。它需要两样东西:“真实场景”以及“持续投入能力”

腾讯恰恰同时具备这两样。

从场景上看,腾讯拥有中国互联网最复杂的一批业务系统。微信、QQ、游戏、广告、办公、云服务、内容生态、金融信息服务,这些天然都是AI的落地场。

从财务上看,腾讯2025年总收入超过7500亿元,毛利超过4200亿元,Non-IFRS经营利润超过2800亿元,自由现金流超过1800亿元。

这意味着,腾讯做AI,不是靠融资故事,不是靠短期资本市场想象力,而是靠主业现金流去支撑长期投入。

这和很多AI创业公司的打法完全不同,创业公司要用模型证明估值,腾讯要用模型改造经营效率,改造产品体验,改造利润模型。

所以,Hy3 preview 对腾讯来说,从来不是一个独立业务,它更像一层新的基础设施。

眼下,Hy3 preview 只是开始。

腾讯后面至少还有三道硬题要继续回答:

1.开源之后,能不能真正形成开发者生态?2.Agent能力能不能在高频场景里稳定运行,而不是只在Demo里漂亮?3.混元能不能形成区别于阿里、字节、DeepSeek的差异化路径?

当姚顺雨加入腾讯,外界只看到年轻”“天才”“OpenAI背景

但对腾讯来说,更重要的不是一个人的光环,而是一套新的组织逻辑:

用真实任务定义模型;用复杂场景训练模型;用评估体系反推能力建设;用产品入口放大模型价值;用工程化和基础设施把能力变成生产力……

AI上半场,腾讯看起来似乎慢了一步,但AI下半场,竞争规则已经变了。

当模型不再只是回答问题,而是开始调用工具、理解流程、进入产品、参与工作、重写效率,腾讯手里的微信、QQ、文档、云、广告、游戏、办公和内容生态,反而会重新变成一张大牌。

真正的AI巨头,不一定是最先把模型做出来的公司。

而是最先把模型,塞进每一条业务流程里的公司。

— 完 —

商务合作:15201337588(微信)

◆◆◆

一键关注 👇 点亮星标

锁定AI科技锐评极速推送

文章好看就点这里