腾讯AI下半场全面爆发:混元登顶+微信超级智能体+全栈Agent布局
2026年6月,全球AI产业迎来决定性的范式转移。过去两周,Google I/O、Microsoft Build与腾讯云AI产业应用大会接连召开,三大巨头不约而同将战略重心从"模型能力竞赛"转向"软件入口争夺战"。正如行业观察所言:模型仍然是发动机,但真正决定AI能否进入现实世界的,是入口、权限、数据、工作流和软件秩序。
在这场关乎未来十年科技格局的竞赛中,腾讯以"实用、好用、可规模化"为核心,打出了一套组合拳:连续数周登顶全球大模型API调用榜单的混元Hy3、国内DAU最高的桌面智能体WorkBuddy,以及即将接入14亿用户与800万小程序的微信超级智能体。
2026年6月5日,腾讯正式发布效率智能体工具集,并同步发布官方全景架构图,构建起从用户入口到基础设施的七层完整AI技术栈。更具里程碑意义的是,腾讯率先实现了智能体原生支付,打通了从意图识别到交易执行的最后一公里,标志着腾讯AI从技术积累阶段全面进入规模化落地阶段。

一、AI下半场:腾讯的战略判断与组织变革
1.1 姚顺雨定义AI下半场:寻找问题比解决问题更难
作为"AI下半场"概念的提出者,腾讯AI首席科学家姚顺雨在对谈中明确指出:AI上半场是方法论成熟的阶段,下半场是寻找真实问题的阶段。
"过去我们发明AlphaGo这样的方法去下围棋,为翻译做专门的模型,但有了预训练和后训练之后,我们像有了一个万能锤子,可以砸任何钉子。反而更困难的是怎么寻找好的问题去解决。"
姚顺雨认为,AI下半场的核心竞争壁垒不再是算法本身,而是上下文(Context)。"很多时候你的竞争壁垒就在于你有没有最原始的输入,你知不知道这个人到底在干什么,你知不知道这个企业各种各样的信息。这一点腾讯有非常强的优势。"这一判断与全球AI产业"从模型到入口"的转向高度契合——入口正是获取最原始上下文的唯一通道。
1.2 三大核心目标:实用、好用、可规模化
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生明确提出腾讯做AI的三个关键词:
- 实用:扎根真实场景,解决用户和企业的实际痛点
- 好用:产品体验流畅,降低AI使用门槛
- 可规模化:能够在多个场景复制推广,实现商业闭环
"腾讯做AI最核心的经验,就是扎根场景。真实场景里有用户需求,也有模型迭代最需要的数据。"汤道生强调,腾讯丰富的产品场景、交互数据和生态连接,既能为模型提供高质量上下文,也能让模型调用工具、连接系统,真正完成任务闭环。
1.3 组织变革:构建均衡的AGI三角形
姚顺雨提出,腾讯正在构建一个"基础模型-产品应用-前沿探索"均衡发展的三角形组织:
1. 基础模型层:投入充足资源,建立正确的做事方式
2. 产品应用层:发挥腾讯产品优势,将技术转化为用户价值
3. 前沿探索层:注入探索精神,研究新的范式和机会
在Agent时代,腾讯的组织形态也在发生深刻变化。汤道生透露,WorkBuddy等AI原生产品采用了非常扁平化的组织架构,"更多小团队三个人五个人,围绕某一个领域来做攻坚,通过大量试验去提炼出对用户有正向帮助的结果"。
二、混元大模型:Co-Design驱动的技术突破
2.1 混元Hy3 Preview:实用性与性价比的胜利
2026年初发布的混元大模型Hy3 Preview,是姚顺雨加入腾讯后的首秀。该模型以实用性和性价比著称,发布以来连续数周登顶全球大模型API调用榜单OpenRouter周榜首位。
实测性能数据:接入WorkBuddy后,混元Hy3 Preview使产品首次响应速度提升54%,任务平均完成时间缩短47%,任务成功率高达99.99%。
姚顺雨透露,混元3的核心突破来自三个方面:
1. 基础设施重建:全面升级了预训练和强化学习的基础设施
2. 数据与评估体系革新:定义更真实的问题,丰富数据分类,提高数据质量
3. 决策驱动的研发:在招人、模型节奏、技术取舍等方面坚持"品味驱动"
2.2 多模态矩阵:从文本到世界的全面覆盖
腾讯混元已形成完整的多模态模型体系,覆盖文本、图像、三维世界三大核心领域:
- Hy3 preview:旗舰文本大模型,聚焦任务执行与性价比
- Hy Image 3.0:图像生成与理解模型,支持文生图、图生图、图像编辑
- Hy World 2.0:世界模型,具备三维场景理解与生成能力,为具身智能和数字孪生提供基础
2.3 Co-Design:模型与产品相互成就的核心方法论
腾讯AI最独特的优势在于其"Co-Design"(协同设计)理念。姚顺雨和汤道生一致认为,模型和产品不是上下游关系,而是相互成就的伙伴。
Co-Design的三大核心原则:
1. 模型基础要扎实:预训练是产品无关的,其进步可以带给所有下游任务持续的价值提升
2. 实用性大于刷榜价值:建立基于真实产品场景的评估体系,而非单纯追求外部榜单分数
3. 数据泛化形成网络效应:不同产品提供的数据可以相互迁移,形成体系化优势
"我们和元宝的Co-Design使模型产生很强的聊天和搜索能力,这样的能力又可以被迁移到IMA和WorkBuddy等其他产品。"姚顺雨解释道,"这些产品能够提供不同的数据,但是这些数据之间又可以相互泛化,形成一个像网络一样的体系。"
2.4 真实世界反馈比榜单更重要
针对行业普遍存在的"刷榜"现象,姚顺雨直言:"外部benchmark有它的价值,但非常容易过拟合。基于真实世界的数据对模型研发更有帮助。"
真实世界反馈的三大价值:
- 发现榜单中没有的底线问题
- 了解真实的用户Prompt分布
- 启发新的研究方向
"我们先发Preview模型最主要的目的之一,就是希望能够获得真实世界反馈,修复各种各样榜单中没有发现的问题。"姚顺雨透露,这些反馈将在混元3正式版中带来巨大改进。

三、七层全栈AI架构:从用户入口到基础设施
腾讯效率智能体工具集采用了清晰的七层架构设计,从顶层的用户连接到底层的基础设施,形成了完整的AI技术闭环。
3.1 第一层:用户连接——七大超级入口全覆盖
腾讯拥有国内最丰富的高频用户入口,将数十亿级触点转化为Agent的服务入口:
- 社交入口:QQ、微信、企业微信
- 内容入口:元宝、QQ浏览器
- 服务入口:小程序
- 输入入口:搜狗输入法(新增核心入口,覆盖全场景文本输入)
这些入口不仅是用户访问AI的通道,更是获取用户上下文的核心来源。特别是搜狗输入法,作为国内市场份额第一的输入法,能够在用户输入的第一时间获取意图,为Agent提供最及时的上下文支持。
3.2 第二层:效率智能体——全场景覆盖个人与企业
效率智能体是腾讯AI产品体系的核心,分为个人提效和企业提效两大板块,覆盖20多个垂直场景。
3.2.1 个人提效:打造专属AI助手矩阵
- 通用助手:元宝(全能AI助手)、Qclaw(个人AI助手,首创微信直连模式)、ima(AI工作台,支持创建专属Agent)
- 专业助手:
- WorkBuddy:AI智能体桌面工作台,国内DAU最高的效率智能体
- CodeBuddy:AI代码助手,支持插件、IDE、CLI三种形态
- Miora:全场景创意智能体工作室
- Ardot:交互设计智能体
- LearnBuddy:教育学习智能体
- 行业助手:腾讯出行全场景Agent、AI健康管理助手、医保智能助手
3.2.2 企业提效:构建全生命周期智能体体系
平台级产品:
- ADP 4.0:企业级AgentOps平台,覆盖Agent构建、连接、分发与治理
- WorkBuddy企业版:企业AI智能体工作台,支持7×24小时专家数字员工
- ClawPro:智能体全生命周期管理平台
职能场景智能体:
- 营销:MAGIC Agent 2.0
- 风控:全栈风控引擎
- 研发:CodeBuddy Security(代码安全智能体)
- 数据分析:DataBuddy、TCDataAgent
- 运维:DatabaseClaw(数据库智能运维平台)、MigraQ(云迁徙Agent)、CloudQ(多云管理Agent)
- 客服:AndonQ智能客服Agent
行业场景智能体:
- 金融:天御反诈Agent
- 传媒:AI全能赛事制播Agent
- 医疗:AI健康管理助手、医保智能助手
- 教育:LearnBuddy
- 出行:腾讯出行全场景Agent
3.3 第三层:生态互联——打通技能、连接与套件
生态互联层是腾讯AI开放能力的核心,通过三大模块实现与外部系统的无缝对接:
1. SkillHub技能平台:已沉淀7.7万+Skills,支持零代码原生构建和企业级安全审计。分为产品Skill(腾讯文档、腾讯会议、腾讯地图等)和行业Skill(医疗报告解读、零售选址分析、金融股票分析等)。
2. 连接器Connector:打通腾讯全系产品矩阵,包括腾讯文档、腾讯会议、腾讯乐享、ima、TAPD、电子签、QQ邮箱、腾讯网盘等,实现数据与能力的无缝流转。
3. 套件Plugin:提供角色化的智能体套件,如高级开发工程师、内容创作专家、投资银行专家、私募股权专家、UI设计师等,开箱即用。
3.4 第四层:Harness引擎——智能体运行的核心动力
Harness引擎是腾讯效率智能体工具集的核心技术底座,为所有智能体提供统一的运行环境和安全保障:
1. 企业知识库:
整合腾讯乐享、日志服务CLS、资源图谱、CDP、RAG等能力,为智能体提供结构化的企业知识。
2. Agent运行时:
- 核心组件:Sandbox(沙箱)、CBS、Bucket、Memory(内存服务)、Gateway(网关)
- 开发托管:EdgeOne Makers一站式托管服务
- 身份管理:oneID统一身份认证
3. 全生命周期安全:
构建从基础设施到Agent管理的整体防御体系,包括AI Agent安全中心、AI Agent安全网关、腾讯iOA、腾讯电脑管家,确保Agent"看得见、可追溯、管得住、审得清"。
3.5 第五层:模型服务——多元模型统一调度
TokenHub大模型服务平台是腾讯AI的模型中枢,实现了多元模型的统一供给与调度:
- 多元模型供给:同时支持自研模型(混元Hy3、Hy Image 3.0、Hy World 2.0)和第三方模型(GLM、Kimi、DeepSeek等)
- 统一接入调度:提供标准API、网关计费、智能路由功能
- Agent场景优化:面向任务链路进行模型选择与调度优化,提升执行效率
3.6 第六层:基础设施——支撑规模化运行的云底座
腾讯云全面重构了AI基础设施,为海量Agent的运行提供强大支撑:
- 异构计算:支持多种芯片架构,优化算力利用率
- 存储:高性能分布式存储系统,满足大模型训练与推理需求
- Lighthouse:轻量应用服务器,为开发者提供便捷的部署环境
- TI平台:腾讯云智能钛机器学习平台,支持模型训练与部署
- ClawPro:智能体基础设施管理平台
3.7 内部实践:AI重塑腾讯研发与协作范式
基于效率智能体工具集,腾讯内部已经实现了显著的效率提升:
- 研发提效:CodeBuddy覆盖超95%的腾讯工程师,整体编码时间缩短40%
- 代码安全:CodeBuddy Security结合自研静态分析引擎Xcheck,形成AI深度审计+规则扫描双引擎协同方案
- 敏捷迭代:WorkBuddy实现人和AI的混编开发,小团队仅用两天即可完成初始版本,上市后保持每2天一个版本的迭代速度
- 上线周期:全面升级的Agent Infra将智能体的上线周期从季度压缩至周级
- 开发效率:EdgeOne Makers将Agent上线周期从数周压缩至分钟级,整体开发效率提升80%
3.8 生态开放:联合23家伙伴启动Buddy AI生态共创计划
大会现场,腾讯宣布全面开放智能体能力,并联合23家生态伙伴,包括DeepSeek、KIMI、MiniMax、百望云、携程、中国移动等,正式启动「腾讯AI共创营-Buddy AI生态共创计划」。
腾讯将携手千行百业的合作伙伴,依托效率智能体工具集,共同打造跨终端、跨场景的便捷Agent产品服务,构建开放共赢的AI产业生态。
3.9 王炸产品:微信AI智能体即将登场
比效率智能体工具集更具颠覆性的,是即将上线的微信内嵌AI智能体。据可靠消息,该产品最快将于2026年6月启动合规审批流程,第三季度逐步扩大测试范围。
这款由张小龙直接领导、腾讯最高战略优先级的产品,将彻底重构微信14亿用户与800万小程序的交互方式:
- 极简入口:微信主界面右滑即可调出专属对话窗口
- 全场景任务执行:一句话完成点餐、打车、订票、缴费等复杂多步骤任务
- 多模型混合架构:同时测试混元3.0、智谱AI、通义千问等多个主流大模型
- 四大核心模块:意图识别、服务发现、参数提取、执行监控
"帮我从最近的川菜馆点一份微辣的宫保鸡丁和米饭,同时预约下午1:30去公司的滴滴快车,费用从我的微信钱包扣除"——这样的复杂指令将在微信中一键完成。
3.10 核心突破:AI专属卡实现智能体原生支付闭环
腾讯成为全球首个实现智能体原生支付的厂商,这一突破彻底打通了Agent从"信息处理"到"交易执行"的最后一公里,是AI从工具走向生产力的里程碑事件。

3.10.1 功能演示:WorkBuddy自动完成Q币购买
实测显示,用户只需向WorkBuddy发送指令:"绑定后告诉我,我来轮询支付状态并完成这10个Q币的购买",智能体即可自动完成全流程:
1. 状态轮询:自动检查订单支付状态,实时反馈交易进度
2. 工具调用:当检测到支付异常时,自动重新调用AI支付工具生成新的确认链接
3. 用户确认:引导用户在微信中完成最终支付确认
4. 交易闭环:支付完成后自动通知用户,完成整个任务
整个过程无需用户手动跳转多个应用,所有操作都在同一个对话窗口内完成,真正实现了"一句话搞定交易"。

3.10.2 微信AI专属卡:安全可控的智能体支付账户
为保障资金安全,微信专门推出了AI专属卡,这是智能体专用的独立支付账户:
- 账户隔离:AI专属卡与用户主钱包完全隔离,智能体无法直接访问用户微信钱包
- 预充值模式:用户需提前向AI专属卡转入资金,智能体只能使用卡内余额进行支付
- 单笔确认:每一笔支付都必须经过用户手动确认,智能体无法自动扣款
- 权限管理:用户可以随时查看智能体的支付记录,冻结或解绑AI专属卡
3.10.3 战略意义:开启万亿级Agent交易市场
AI支付能力的落地,将彻底改变Agent的商业模式:
- 交易佣金:智能体可以直接参与交易,向商家收取一定比例的佣金
- 服务订阅:推出高级支付功能订阅,如免密支付、批量支付等
- 生态分成:向接入AI支付的第三方智能体开发者收取技术服务费
这一能力是腾讯独有的核心优势,其他AI厂商如字节跳动、阿里巴巴虽然也在布局智能体,但都没有像微信支付这样覆盖14亿用户的国民级支付工具。一旦微信AI智能体全面接入AI支付,腾讯将迅速占据国内Agent交易市场的主导地位。
四、全球AI竞争范式转移:从模型能力到软件入口
4.1 核心转变:模型是发动机,入口才是道路系统
过去两年,AI的中心叙事几乎一直围绕模型展开:谁的模型更强,谁的上下文更长,谁的多模态更自然。但随着模型能力的普遍提升,一个更现实的问题浮出水面:模型到底要被放在哪里?
聊天框式的AI有天然边界:它离真实工作流太远,用户需要主动打开、描述背景、上传文件、复制结果,AI本身并不知道用户正在处理什么任务。真正的Agent不能一直站在门外,它必须进入软件本身,知道用户的上下文、拥有相应的权限、可以调用工具、参与完整流程。
这就是AI下半场的核心转变:竞争从"谁的模型更聪明"转向"谁的模型在更重要的位置"。模型像发动机,但入口、权限、数据和工作流,才是让发动机跑起来的道路系统。
4.2 全球三巨头的入口争夺战
当前,Google、Microsoft、腾讯基于各自的传统优势,正在三条不同的赛道上展开入口争夺:
| 厂商 | 核心赛道 | 核心入口 | 战略目标 | 支付能力 |
| 信息入口 | Search、Chrome、Android、Workspace | 从"组织网页"到"组织任务",接管用户意图 | 尚未实现原生支付 | |
| Microsoft | 工作入口 | Windows、Microsoft 365、GitHub、Azure | 打造Agent运行平台,承载真实工作执行 | 仅支持企业级有限支付 |
| 腾讯 | 国内协作入口 | 微信、企业微信、腾讯文档、腾讯会议 | 附着于已有高频场景,重构国内软件协作秩序 | 已实现个人级原生支付 |
- Google:拥有全球最强的信息入口,其战略是把Gemini放进每一个高频触点,让AI从"回答问题"升级为"完成行动"。搜索不再只是返回网页,而是帮用户完成比较、筛选、购买、预约;浏览器不再只是打开页面,而是理解内容、跨页面操作。
- Microsoft:拥有全球最完整的工作生态,其战略是把Windows重新定义为Agent的运行平台。Build 2026上发布的Foundry全栈智能体平台,解决了Agent的安全运行、权限管理、工具调用等核心问题,让Agent能够安全地触碰文件、代码、企业数据和云端资源。
- 腾讯:拥有国内最独特的协作生态和唯一的国民级支付工具,其战略不是重新创造入口,而是把AI附着在已有的高频场景上。一个国内企业的日常协作,很多时候从微信群、腾讯会议、企业微信开始,腾讯的Agent路线就是让AI直接进入这些流程,解决企业最实际的痛点。
4.3 国内市场竞争格局
在国内市场,腾讯正与字节跳动、阿里巴巴等展开激烈竞争:
| 厂商 | 产品 | 最新月活 | 核心优势 | 智能体进展 | 支付能力 |
| 字节跳动 | 豆包 | 3.45亿 | 中文理解顶尖,抖音生态联动 | 已上线在线购物等智能体功能 | 依赖支付宝/微信支付跳转 |
| 阿里巴巴 | 通义千问 | 1.2亿 | 开源生态完善,电商服务整合 | 核心服务全面接入APP | 依赖支付宝 |
| 腾讯 | 元宝 | 1.1亿 | 微信生态优势,社交关系链 | 发布效率智能体工具集,微信智能体即将上线 | 已实现原生AI支付 |
| 月之暗面 | Kimi | 8500万 | 超长上下文能力 | 测试文档处理类智能体 | 无支付能力 |
效率智能体工具集的发布,标志着腾讯在企业级AI市场已经建立起完整的产品体系。而AI支付能力的突破,更是让腾讯在个人消费级AI市场建立了难以撼动的优势。一旦微信AI智能体成功落地,腾讯将凭借14.18亿月活用户、800万小程序和原生支付能力,迅速成为中国最大的AI助手平台。
4.4 腾讯面临的三大挑战
尽管优势明显,腾讯AI仍面临三大核心挑战:
1. 算力与成本压力:腾讯计划2026年将AI投资翻倍至360亿元,但微信智能体全面铺开后,每年仅推理成本就将超过100亿元
2. 产品质量与安全要求:AI支付涉及金融交易,需要最严格的安全测试,任何失误都可能引发巨大的信任危机
3. 监管合规风险:作为国民级应用,微信AI智能体和AI支付需要经过多个监管部门的严格审批,上线时间存在不确定性
五、未来展望:从数字自动化到软件秩序重构
姚顺雨在对谈中表示:"AI才刚刚开始,下半场才刚刚开始。我不认为ChatGPT和Claude Code会是唯一的超级APP,肯定会有源源不断新的机会诞生。"
未来,AI产业将在以下方向发生深刻变革:
1. 深化Agent技术:重点突破Coding Agent和长时任务能力,提升智能体的自主性和可靠性。Anthropic最新数据显示,AI已经能完成人类12小时的工作任务,未来这一数字还将持续增长。
2. 统一世界模型:借鉴李飞飞提出的渲染器、模拟器、规划器三大功能分类,构建能够理解物理世界的统一世界模型,实现从数字自动化到物理世界自动化的跨越。腾讯Hy World 2.0已经在这一方向迈出了重要一步。
3. 软件秩序重构:未来的软件将同时服务两类使用者:人和Agent。人看界面,Agent看结构。一个优秀的软件,不再只是让人觉得好用,还要让Agent能安全、稳定、可控地使用。
4. 交易生态爆发:随着AI支付能力的普及,智能体将成为新的交易入口,催生万亿级的Agent交易市场。腾讯凭借微信支付的优势,有望成为这一市场的主导者。
对个人和企业而言,AI下半场最重要的启示是:Agent不会自动解决混乱,它只会放大已有结构。结构清楚,它放大效率;结构混乱,它放大混乱。无论是个人还是企业,都需要把任务、数据、权限和流程整理成AI可以进入的结构,才能真正发挥AI的价值。
"这是一个长跑,是一个马拉松。"汤道生在对谈最后表示,"腾讯有非常丰富的场景,模型会不断迭代,用户的需求也在不断变化,会有新的产品形态出现。我们正在长跑中,也请各位多给我们提醒和建议。"
随着混元多模态大模型的持续迭代、七层全栈效率智能体工具集的全面发布、AI支付能力的突破和微信超级智能体的即将上线,腾讯已经在AI下半场占据了有利位置。这场关乎未来十年科技格局的竞赛,才刚刚进入最精彩的阶段。
夜雨聆风