对话姚顺雨:腾讯在AI上半场走了弯路,即将在AI下半场翻身

腾讯AI下半场全面爆发：混元登顶+微信超级智能体+全栈Agent布局

2026年6月，全球AI产业迎来决定性的范式转移。过去两周，Google I/O、Microsoft Build与腾讯云AI产业应用大会接连召开，三大巨头不约而同将战略重心从"模型能力竞赛"转向"软件入口争夺战"。正如行业观察所言：模型仍然是发动机，但真正决定AI能否进入现实世界的，是入口、权限、数据、工作流和软件秩序。

在这场关乎未来十年科技格局的竞赛中，腾讯以"实用、好用、可规模化"为核心，打出了一套组合拳：连续数周登顶全球大模型API调用榜单的混元Hy3、国内DAU最高的桌面智能体WorkBuddy，以及即将接入14亿用户与800万小程序的微信超级智能体。

2026年6月5日，腾讯正式发布效率智能体工具集，并同步发布官方全景架构图，构建起从用户入口到基础设施的七层完整AI技术栈。更具里程碑意义的是，腾讯率先实现了智能体原生支付，打通了从意图识别到交易执行的最后一公里，标志着腾讯AI从技术积累阶段全面进入规模化落地阶段。

一、AI下半场：腾讯的战略判断与组织变革

1.1 姚顺雨定义AI下半场：寻找问题比解决问题更难

作为"AI下半场"概念的提出者，腾讯AI首席科学家姚顺雨在对谈中明确指出：AI上半场是方法论成熟的阶段，下半场是寻找真实问题的阶段。

"过去我们发明AlphaGo这样的方法去下围棋，为翻译做专门的模型，但有了预训练和后训练之后，我们像有了一个万能锤子，可以砸任何钉子。反而更困难的是怎么寻找好的问题去解决。"

姚顺雨认为，AI下半场的核心竞争壁垒不再是算法本身，而是上下文(Context)。"很多时候你的竞争壁垒就在于你有没有最原始的输入，你知不知道这个人到底在干什么，你知不知道这个企业各种各样的信息。这一点腾讯有非常强的优势。"这一判断与全球AI产业"从模型到入口"的转向高度契合——入口正是获取最原始上下文的唯一通道。

1.2 三大核心目标：实用、好用、可规模化

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生明确提出腾讯做AI的三个关键词：

- 实用：扎根真实场景，解决用户和企业的实际痛点

- 好用：产品体验流畅，降低AI使用门槛

- 可规模化：能够在多个场景复制推广，实现商业闭环

"腾讯做AI最核心的经验，就是扎根场景。真实场景里有用户需求，也有模型迭代最需要的数据。"汤道生强调，腾讯丰富的产品场景、交互数据和生态连接，既能为模型提供高质量上下文，也能让模型调用工具、连接系统，真正完成任务闭环。

1.3 组织变革：构建均衡的AGI三角形

姚顺雨提出，腾讯正在构建一个"基础模型-产品应用-前沿探索"均衡发展的三角形组织：

1. 基础模型层：投入充足资源，建立正确的做事方式

2. 产品应用层：发挥腾讯产品优势，将技术转化为用户价值

3. 前沿探索层：注入探索精神，研究新的范式和机会

在Agent时代，腾讯的组织形态也在发生深刻变化。汤道生透露，WorkBuddy等AI原生产品采用了非常扁平化的组织架构，"更多小团队三个人五个人，围绕某一个领域来做攻坚，通过大量试验去提炼出对用户有正向帮助的结果"。

二、混元大模型：Co-Design驱动的技术突破

2.1 混元Hy3 Preview：实用性与性价比的胜利

2026年初发布的混元大模型Hy3 Preview，是姚顺雨加入腾讯后的首秀。该模型以实用性和性价比著称，发布以来连续数周登顶全球大模型API调用榜单OpenRouter周榜首位。

实测性能数据：接入WorkBuddy后，混元Hy3 Preview使产品首次响应速度提升54%，任务平均完成时间缩短47%，任务成功率高达99.99%。

姚顺雨透露，混元3的核心突破来自三个方面：

1. 基础设施重建：全面升级了预训练和强化学习的基础设施

2. 数据与评估体系革新：定义更真实的问题，丰富数据分类，提高数据质量

3. 决策驱动的研发：在招人、模型节奏、技术取舍等方面坚持"品味驱动"

2.2 多模态矩阵：从文本到世界的全面覆盖

腾讯混元已形成完整的多模态模型体系，覆盖文本、图像、三维世界三大核心领域：

- Hy3 preview：旗舰文本大模型，聚焦任务执行与性价比

- Hy Image 3.0：图像生成与理解模型，支持文生图、图生图、图像编辑

- Hy World 2.0：世界模型，具备三维场景理解与生成能力，为具身智能和数字孪生提供基础

2.3 Co-Design：模型与产品相互成就的核心方法论

腾讯AI最独特的优势在于其"Co-Design"（协同设计）理念。姚顺雨和汤道生一致认为，模型和产品不是上下游关系，而是相互成就的伙伴。

Co-Design的三大核心原则：

1. 模型基础要扎实：预训练是产品无关的，其进步可以带给所有下游任务持续的价值提升

2. 实用性大于刷榜价值：建立基于真实产品场景的评估体系，而非单纯追求外部榜单分数

3. 数据泛化形成网络效应：不同产品提供的数据可以相互迁移，形成体系化优势

"我们和元宝的Co-Design使模型产生很强的聊天和搜索能力，这样的能力又可以被迁移到IMA和WorkBuddy等其他产品。"姚顺雨解释道，"这些产品能够提供不同的数据，但是这些数据之间又可以相互泛化，形成一个像网络一样的体系。"

2.4 真实世界反馈比榜单更重要

针对行业普遍存在的"刷榜"现象，姚顺雨直言："外部benchmark有它的价值，但非常容易过拟合。基于真实世界的数据对模型研发更有帮助。"

真实世界反馈的三大价值：

- 发现榜单中没有的底线问题

- 了解真实的用户Prompt分布

- 启发新的研究方向

"我们先发Preview模型最主要的目的之一，就是希望能够获得真实世界反馈，修复各种各样榜单中没有发现的问题。"姚顺雨透露，这些反馈将在混元3正式版中带来巨大改进。

三、七层全栈AI架构：从用户入口到基础设施

腾讯效率智能体工具集采用了清晰的七层架构设计，从顶层的用户连接到底层的基础设施，形成了完整的AI技术闭环。

3.1 第一层：用户连接——七大超级入口全覆盖

腾讯拥有国内最丰富的高频用户入口，将数十亿级触点转化为Agent的服务入口：

- 社交入口：QQ、微信、企业微信

- 内容入口：元宝、QQ浏览器

- 服务入口：小程序

- 输入入口：搜狗输入法（新增核心入口，覆盖全场景文本输入）

这些入口不仅是用户访问AI的通道，更是获取用户上下文的核心来源。特别是搜狗输入法，作为国内市场份额第一的输入法，能够在用户输入的第一时间获取意图，为Agent提供最及时的上下文支持。

3.2 第二层：效率智能体——全场景覆盖个人与企业

效率智能体是腾讯AI产品体系的核心，分为个人提效和企业提效两大板块，覆盖20多个垂直场景。

3.2.1 个人提效：打造专属AI助手矩阵

- 通用助手：元宝（全能AI助手）、Qclaw（个人AI助手，首创微信直连模式）、ima（AI工作台，支持创建专属Agent）

- 专业助手：

- WorkBuddy：AI智能体桌面工作台，国内DAU最高的效率智能体

- CodeBuddy：AI代码助手，支持插件、IDE、CLI三种形态

- Miora：全场景创意智能体工作室

- Ardot：交互设计智能体

- LearnBuddy：教育学习智能体

- 行业助手：腾讯出行全场景Agent、AI健康管理助手、医保智能助手

3.2.2 企业提效：构建全生命周期智能体体系

平台级产品：

- ADP 4.0：企业级AgentOps平台，覆盖Agent构建、连接、分发与治理

- WorkBuddy企业版：企业AI智能体工作台，支持7×24小时专家数字员工

- ClawPro：智能体全生命周期管理平台

职能场景智能体：

- 营销：MAGIC Agent 2.0

- 风控：全栈风控引擎

- 研发：CodeBuddy Security（代码安全智能体）

- 数据分析：DataBuddy、TCDataAgent

- 运维：DatabaseClaw（数据库智能运维平台）、MigraQ（云迁徙Agent）、CloudQ（多云管理Agent）

- 客服：AndonQ智能客服Agent

行业场景智能体：

- 金融：天御反诈Agent

- 传媒：AI全能赛事制播Agent

- 医疗：AI健康管理助手、医保智能助手

- 教育：LearnBuddy

- 出行：腾讯出行全场景Agent

3.3 第三层：生态互联——打通技能、连接与套件

生态互联层是腾讯AI开放能力的核心，通过三大模块实现与外部系统的无缝对接：

1. SkillHub技能平台：已沉淀7.7万+Skills，支持零代码原生构建和企业级安全审计。分为产品Skill（腾讯文档、腾讯会议、腾讯地图等）和行业Skill（医疗报告解读、零售选址分析、金融股票分析等）。

2. 连接器Connector：打通腾讯全系产品矩阵，包括腾讯文档、腾讯会议、腾讯乐享、ima、TAPD、电子签、QQ邮箱、腾讯网盘等，实现数据与能力的无缝流转。

3. 套件Plugin：提供角色化的智能体套件，如高级开发工程师、内容创作专家、投资银行专家、私募股权专家、UI设计师等，开箱即用。

3.4 第四层：Harness引擎——智能体运行的核心动力

Harness引擎是腾讯效率智能体工具集的核心技术底座，为所有智能体提供统一的运行环境和安全保障：

1. 企业知识库：

整合腾讯乐享、日志服务CLS、资源图谱、CDP、RAG等能力，为智能体提供结构化的企业知识。

2. Agent运行时：

- 核心组件：Sandbox（沙箱）、CBS、Bucket、Memory（内存服务）、Gateway（网关）

- 开发托管：EdgeOne Makers一站式托管服务

- 身份管理：oneID统一身份认证

3. 全生命周期安全：

构建从基础设施到Agent管理的整体防御体系，包括AI Agent安全中心、AI Agent安全网关、腾讯iOA、腾讯电脑管家，确保Agent"看得见、可追溯、管得住、审得清"。

3.5 第五层：模型服务——多元模型统一调度

TokenHub大模型服务平台是腾讯AI的模型中枢，实现了多元模型的统一供给与调度：

- 多元模型供给：同时支持自研模型（混元Hy3、Hy Image 3.0、Hy World 2.0）和第三方模型（GLM、Kimi、DeepSeek等）

- 统一接入调度：提供标准API、网关计费、智能路由功能

- Agent场景优化：面向任务链路进行模型选择与调度优化，提升执行效率

3.6 第六层：基础设施——支撑规模化运行的云底座

腾讯云全面重构了AI基础设施，为海量Agent的运行提供强大支撑：

- 异构计算：支持多种芯片架构，优化算力利用率

- 存储：高性能分布式存储系统，满足大模型训练与推理需求

- Lighthouse：轻量应用服务器，为开发者提供便捷的部署环境

- TI平台：腾讯云智能钛机器学习平台，支持模型训练与部署

- ClawPro：智能体基础设施管理平台

3.7 内部实践：AI重塑腾讯研发与协作范式

基于效率智能体工具集，腾讯内部已经实现了显著的效率提升：

- 研发提效：CodeBuddy覆盖超95%的腾讯工程师，整体编码时间缩短40%

- 代码安全：CodeBuddy Security结合自研静态分析引擎Xcheck，形成AI深度审计+规则扫描双引擎协同方案

- 敏捷迭代：WorkBuddy实现人和AI的混编开发，小团队仅用两天即可完成初始版本，上市后保持每2天一个版本的迭代速度

- 上线周期：全面升级的Agent Infra将智能体的上线周期从季度压缩至周级

- 开发效率：EdgeOne Makers将Agent上线周期从数周压缩至分钟级，整体开发效率提升80%

3.8 生态开放：联合23家伙伴启动Buddy AI生态共创计划

大会现场，腾讯宣布全面开放智能体能力，并联合23家生态伙伴，包括DeepSeek、KIMI、MiniMax、百望云、携程、中国移动等，正式启动「腾讯AI共创营-Buddy AI生态共创计划」。

腾讯将携手千行百业的合作伙伴，依托效率智能体工具集，共同打造跨终端、跨场景的便捷Agent产品服务，构建开放共赢的AI产业生态。

3.9 王炸产品：微信AI智能体即将登场

比效率智能体工具集更具颠覆性的，是即将上线的微信内嵌AI智能体。据可靠消息，该产品最快将于2026年6月启动合规审批流程，第三季度逐步扩大测试范围。

这款由张小龙直接领导、腾讯最高战略优先级的产品，将彻底重构微信14亿用户与800万小程序的交互方式：

- 极简入口：微信主界面右滑即可调出专属对话窗口

- 全场景任务执行：一句话完成点餐、打车、订票、缴费等复杂多步骤任务

- 多模型混合架构：同时测试混元3.0、智谱AI、通义千问等多个主流大模型

- 四大核心模块：意图识别、服务发现、参数提取、执行监控

"帮我从最近的川菜馆点一份微辣的宫保鸡丁和米饭，同时预约下午1:30去公司的滴滴快车，费用从我的微信钱包扣除"——这样的复杂指令将在微信中一键完成。

3.10 核心突破：AI专属卡实现智能体原生支付闭环

腾讯成为全球首个实现智能体原生支付的厂商，这一突破彻底打通了Agent从"信息处理"到"交易执行"的最后一公里，是AI从工具走向生产力的里程碑事件。

3.10.1 功能演示：WorkBuddy自动完成Q币购买

实测显示，用户只需向WorkBuddy发送指令："绑定后告诉我，我来轮询支付状态并完成这10个Q币的购买"，智能体即可自动完成全流程：

1. 状态轮询：自动检查订单支付状态，实时反馈交易进度

2. 工具调用：当检测到支付异常时，自动重新调用AI支付工具生成新的确认链接

3. 用户确认：引导用户在微信中完成最终支付确认

4. 交易闭环：支付完成后自动通知用户，完成整个任务

整个过程无需用户手动跳转多个应用，所有操作都在同一个对话窗口内完成，真正实现了"一句话搞定交易"。

3.10.2 微信AI专属卡：安全可控的智能体支付账户

为保障资金安全，微信专门推出了AI专属卡，这是智能体专用的独立支付账户：

- 账户隔离：AI专属卡与用户主钱包完全隔离，智能体无法直接访问用户微信钱包

- 预充值模式：用户需提前向AI专属卡转入资金，智能体只能使用卡内余额进行支付

- 单笔确认：每一笔支付都必须经过用户手动确认，智能体无法自动扣款

- 权限管理：用户可以随时查看智能体的支付记录，冻结或解绑AI专属卡

3.10.3 战略意义：开启万亿级Agent交易市场

AI支付能力的落地，将彻底改变Agent的商业模式：

- 交易佣金：智能体可以直接参与交易，向商家收取一定比例的佣金

- 服务订阅：推出高级支付功能订阅，如免密支付、批量支付等

- 生态分成：向接入AI支付的第三方智能体开发者收取技术服务费

这一能力是腾讯独有的核心优势，其他AI厂商如字节跳动、阿里巴巴虽然也在布局智能体，但都没有像微信支付这样覆盖14亿用户的国民级支付工具。一旦微信AI智能体全面接入AI支付，腾讯将迅速占据国内Agent交易市场的主导地位。

四、全球AI竞争范式转移：从模型能力到软件入口

4.1 核心转变：模型是发动机，入口才是道路系统

过去两年，AI的中心叙事几乎一直围绕模型展开：谁的模型更强，谁的上下文更长，谁的多模态更自然。但随着模型能力的普遍提升，一个更现实的问题浮出水面：模型到底要被放在哪里？

聊天框式的AI有天然边界：它离真实工作流太远，用户需要主动打开、描述背景、上传文件、复制结果，AI本身并不知道用户正在处理什么任务。真正的Agent不能一直站在门外，它必须进入软件本身，知道用户的上下文、拥有相应的权限、可以调用工具、参与完整流程。

这就是AI下半场的核心转变：竞争从"谁的模型更聪明"转向"谁的模型在更重要的位置"。模型像发动机，但入口、权限、数据和工作流，才是让发动机跑起来的道路系统。

4.2 全球三巨头的入口争夺战

当前，Google、Microsoft、腾讯基于各自的传统优势，正在三条不同的赛道上展开入口争夺：

厂商	核心赛道	核心入口	战略目标	支付能力
Google	信息入口	Search、Chrome、Android、Workspace	从"组织网页"到"组织任务"，接管用户意图	尚未实现原生支付
Microsoft	工作入口	Windows、Microsoft 365、GitHub、Azure	打造Agent运行平台，承载真实工作执行	仅支持企业级有限支付
腾讯	国内协作入口	微信、企业微信、腾讯文档、腾讯会议	附着于已有高频场景，重构国内软件协作秩序	已实现个人级原生支付

- Google：拥有全球最强的信息入口，其战略是把Gemini放进每一个高频触点，让AI从"回答问题"升级为"完成行动"。搜索不再只是返回网页，而是帮用户完成比较、筛选、购买、预约；浏览器不再只是打开页面，而是理解内容、跨页面操作。

- Microsoft：拥有全球最完整的工作生态，其战略是把Windows重新定义为Agent的运行平台。Build 2026上发布的Foundry全栈智能体平台，解决了Agent的安全运行、权限管理、工具调用等核心问题，让Agent能够安全地触碰文件、代码、企业数据和云端资源。

- 腾讯：拥有国内最独特的协作生态和唯一的国民级支付工具，其战略不是重新创造入口，而是把AI附着在已有的高频场景上。一个国内企业的日常协作，很多时候从微信群、腾讯会议、企业微信开始，腾讯的Agent路线就是让AI直接进入这些流程，解决企业最实际的痛点。

4.3 国内市场竞争格局

在国内市场，腾讯正与字节跳动、阿里巴巴等展开激烈竞争：

厂商	产品	最新月活	核心优势	智能体进展	支付能力
字节跳动	豆包	3.45亿	中文理解顶尖，抖音生态联动	已上线在线购物等智能体功能	依赖支付宝/微信支付跳转
阿里巴巴	通义千问	1.2亿	开源生态完善，电商服务整合	核心服务全面接入APP	依赖支付宝
腾讯	元宝	1.1亿	微信生态优势，社交关系链	发布效率智能体工具集，微信智能体即将上线	已实现原生AI支付
月之暗面	Kimi	8500万	超长上下文能力	测试文档处理类智能体	无支付能力

效率智能体工具集的发布，标志着腾讯在企业级AI市场已经建立起完整的产品体系。而AI支付能力的突破，更是让腾讯在个人消费级AI市场建立了难以撼动的优势。一旦微信AI智能体成功落地，腾讯将凭借14.18亿月活用户、800万小程序和原生支付能力，迅速成为中国最大的AI助手平台。

4.4 腾讯面临的三大挑战

尽管优势明显，腾讯AI仍面临三大核心挑战：

1. 算力与成本压力：腾讯计划2026年将AI投资翻倍至360亿元，但微信智能体全面铺开后，每年仅推理成本就将超过100亿元

2. 产品质量与安全要求：AI支付涉及金融交易，需要最严格的安全测试，任何失误都可能引发巨大的信任危机

3. 监管合规风险：作为国民级应用，微信AI智能体和AI支付需要经过多个监管部门的严格审批，上线时间存在不确定性

五、未来展望：从数字自动化到软件秩序重构

姚顺雨在对谈中表示："AI才刚刚开始，下半场才刚刚开始。我不认为ChatGPT和Claude Code会是唯一的超级APP，肯定会有源源不断新的机会诞生。"

未来，AI产业将在以下方向发生深刻变革：

1. 深化Agent技术：重点突破Coding Agent和长时任务能力，提升智能体的自主性和可靠性。Anthropic最新数据显示，AI已经能完成人类12小时的工作任务，未来这一数字还将持续增长。

2. 统一世界模型：借鉴李飞飞提出的渲染器、模拟器、规划器三大功能分类，构建能够理解物理世界的统一世界模型，实现从数字自动化到物理世界自动化的跨越。腾讯Hy World 2.0已经在这一方向迈出了重要一步。

3. 软件秩序重构：未来的软件将同时服务两类使用者：人和Agent。人看界面，Agent看结构。一个优秀的软件，不再只是让人觉得好用，还要让Agent能安全、稳定、可控地使用。

4. 交易生态爆发：随着AI支付能力的普及，智能体将成为新的交易入口，催生万亿级的Agent交易市场。腾讯凭借微信支付的优势，有望成为这一市场的主导者。

对个人和企业而言，AI下半场最重要的启示是：Agent不会自动解决混乱，它只会放大已有结构。结构清楚，它放大效率；结构混乱，它放大混乱。无论是个人还是企业，都需要把任务、数据、权限和流程整理成AI可以进入的结构，才能真正发挥AI的价值。

"这是一个长跑，是一个马拉松。"汤道生在对谈最后表示，"腾讯有非常丰富的场景，模型会不断迭代，用户的需求也在不断变化，会有新的产品形态出现。我们正在长跑中，也请各位多给我们提醒和建议。"

随着混元多模态大模型的持续迭代、七层全栈效率智能体工具集的全面发布、AI支付能力的突破和微信超级智能体的即将上线，腾讯已经在AI下半场占据了有利位置。这场关乎未来十年科技格局的竞赛，才刚刚进入最精彩的阶段。