
在桌面 AI Agent 这个赛道,无论国外还是国内竞争都非常激烈,今年国内算是跑出了头部选手 WorkBuddy,我们学员的公司已经要求全员安装了:

今年 3 月,OpenClaw 小龙虾爆火,各个公司都在跟进:

也是在这个月,腾讯正式推出了 WorkBuddy,上线当天就因为访问过载导致服务崩溃,立即扩容 10 倍才得以缓解,这个事件引发了我强烈的好奇心,于是下载体验了一番,没有 Codex APP 好用,随后我选择了立即卸载!
三个月后,这个产品给出的成绩单着实让我有点意外:
DAU在国内效率类AI智能体排名第一,领先第二名2.6倍; 月访问量885万,环比增速831%。
3个月时间迭代了43个版本,差不多平均2天出一个新版本,6月5号,又发布了企业版,并且开始涨价,从78元涨到了198元/月。
这些现象让我放下了之前的态度,重新下载了WorkBuddy,经过一段时间的深度体验后发现,这玩意儿确实还有点东西!
这篇文章,我会从工程实现视角回归使用者视角,把WorkBuddy的真实心得整理出来,分享给大家。
定位
在讨论 WorkBuddy 的功能之前,我们先回答一个问题:WorkBuddy到底解决的是什么问题?他的用户人群是谁?
像DeepSeek、豆包、ChatGPT这类聊天式AI,只能你问它答,但真实的工作场景不只是纯文字表达,而是要落地到操作层面,比如打开文件、编辑内容、发送邮件、与系统交互等等。
那WorkBuddy就是在解决执行层面的事情,构建一套能干活的能力体系,我们只需要描述需求,它负责自主规划和任务执行,并交付可以验收的结果。
其次,WorkBuddy主要是面向办公职能角色的AI Agent,它的核心场景是处理文档、写报告、做PPT、数据分析、编辑邮件、批量文件处理、深度研究等。因此,它的交互方式对非技术背景的用户非常友好。

但这里需要注意的是与 CodeBuddy 的区分,这是腾讯内部两条不同的产品路线,CodeBuddy 是AI编程助手,面向开发者,用来写代码的;
而 WorkBuddy 是办公助手,服务的是职场办公人员,比如HR、行政、财务、销售、运营、设计、产品经理等。
只不过他们都是共享的同一套 AI Agent 架构底座,这套底座是腾讯从 2023 年开始研发的,经过了 CodeBuddy 三年的内部验证和 QClaw 百万用户的外部验证,已经非常成熟和稳定了。
了解了这些基本信息之后,下面我们具体来看WorkBuddy的使用方法和感受。
空间与任务管理
WorkBuddy 是非常经典的三栏布局:左侧是任务列表,中间是对话窗口,右侧是多功能区域。
其中任务列表非常的简单好用,可以很方便的添加多个项目和任务,并观察每个任务的运行状态,还能高效地在多个任务之间自由地切换。
首先我们要理解的是,在WorkBuddy的逻辑里,左边这栏分为两层:

第一层是空间
可以把它理解成一个个项目文件夹,或者一个个主题工作区,比如项目A、项目B、项目C。
第二层是任务
点开某个空间,会看到里面一条条对话,这些对话记录叫线程,每一条线程就是一个独立的任务。
所以整体关系是,一个项目空间里可以有很多个任务,每个任务是在同一个工作空间里,围绕一个明确的目标推进。
如果新开一个会话任务,不选择任何工作空间,这种就相当于是一次性任务,这个任务会被收录到任务列表里面。
我一般用它做调研、做规划和一些零碎的问答性小任务。如果是复杂或者长期要做的事项,就创建一个单独的空间。

三种模式
了解完WorkBuddy项目空间和任务的管理逻辑之后,还需要知道WorkBuddy有三种工作模式,Ask、Plan、Craft。
其中,Ask模式,只回答问题,不会修改文件,跟用DeepSeek聊天类似的效果。这种模式适合用来查资料、讨论方案、技术咨询这类场景。
Plan模式,是先做计划然后再执行,比如:
帮我把桌面上的工作日志文件夹整理成本周周报,包含完成项目、数据成果、问题改进三个部分它会先列出计划:
1. 读取工作日志文件夹下的所有.md文件2. 提取本周的记录3. 按模版整理4. 生成Word文档然后等待我们确认,这时候我们可以修改、调整,确认没有问题了才让它开始执行。这种模式就非常适合复杂任务,不确定AI理解是否正确的场景,先把需求对齐后才开始干活。
Craft模式,其实就是Agent模式,二话不说,直接开干,等待交付结果就行,这种模式非常适合需求清晰、上下文信息足够的任务。
我日常高频使用的还是Ask模式和Plan模式,主要用Ask模式做各种探索,复杂任务用Plan模式。

也建议新手同学从Ask和Plan开始,别一上来就放手用Craft模式,一旦AI理解错误,执行就会发生偏差,把我们的文件改得面目全非,又得手动恢复,错误成本是真实的,还不如先慢一点把需求跟AI对齐,在让它做执行,这样或许更高效。
其实从产品设计的角度去看,会发现这是一套信任梯度设计,WorkBuddy把这套信任梯度做成了三个模式,让用户从Ask开始,逐步建立信心,最终放手让AI执行。从Ask到Plan到Craft,AI的自主权越来越大,我们介入的程度越来越低:

但是要让WorkBuddy把任务执行得更好,还得依靠Skills。
Skills商店
我们都知道通用AI能力很强,上知天文,下知地理,但是在垂直领域都还差点意思,那么Skills就是对这个问题的产品级回答。Skills提供的是行业经验、标准化操作流程(SOP)、专业工具和指令模版等,让Agent成为某个领域的专家:

当然现在所有的Agent都支持添加Skill,这个没啥稀奇的,只不过很多产品在安装Skill这件事情上体验非常糟糕,尤其是对于非技术同学很不友好。WorkBuddy把这个体验做到了最低门槛,在技能市场里面提供了大量的Skill,几乎能够覆盖90%以上的场景,并且支持一键安装。
除了官方提供的内置Skill之外,主要依靠腾讯自己打造的skillhub,上面收录了大约7.5万个Skills,这个是腾讯在今年初就开始布局了,当时OpenClaw爆火,国内用户对Skill的安装需求旺盛,但是官方技能社区ClawHub服务器架设在海外,导致中国用户下载速度非常慢,并且中文搜索体验很差。
腾讯在2026年3月初,火速推出了SkillHub,其实技能数据大部分都来源于ClawHub,它相当于是一个为国内用户量身定制的“技能应用商店”,提供秒级下载体验,并从海量的技能中筛选出官方认证榜单,降低用户选择的门槛,还提供技能安全扫描,满足国内AI安全监管要求。
通过SkillHub解决中国用户在AI落地中的实际痛点,迅速抢占用户心智,争夺流量入口,同时也为自家WorkBuddy、QClaw、CodeBuddy等Agent产品服务。
因此,WorkBuddy在Skill生态这块做得非常的厚实,几乎能够覆盖绝大部分办公场景需求。

连接器
我们在看WorkBuddy中的连接器又是什么呢?它的技术语言其实叫MCP,官方为了降低用户理解成本,换了一个叫法而已:

那么连接器的作用是啥呢?
举一个简单的例子说明,我要让AI帮我整理资料,但是原始的资料放在腾讯文档里面,那我首先得把文件资料下载到本地,然后上传给AI,AI处理完成以后,我在下载回来,然后上传到腾讯文档。
这个搬运的过程就很费事,那么链接器就是解决这件事情的。
我只需要安装好腾讯文档的链接器,授权完成之后,WorkBuddy就可直接去读取我的文档资料,整理完成后在自动写入腾讯文档,整个过程不需要我们手动操作了。
WorkBuddy内置了很多高频使用的连接器,比如QQ邮箱、IMA知识库、乐享知识库、腾讯文档、腾讯会议、企业微信、飞书、钉钉、腾讯问卷、Github等。除此之外,我们也可以自定义连接器,腾讯云提供的MCP Hub上有上千个MCP服务,足以覆盖我们的主要需求。
因此,连接器它其实是WorkBuddy和各个外部应用系统之间通信的桥梁,让WorkBuddy不仅能操作本地文件,还可以访问外部服务读写各种数据,触达半径能扩展到整个企业的数字基础设施上。

专家和专家团
在让AI能更好的做事情这件事情上,WorkBuddy团队是花了不少功夫的,专家中心提供上了百个行业专家,覆盖14个核心领域:OPC、腾讯专区、产品设计、技术工程、金融投资、游戏空间、数据智能、营销增长、内容创作、销售商务、运营人力、项目质量、法务安全、行业顾问等:

每个专家Agent都是经过官方精选设计,包含完整的行业领域经验、做事方法论和工具链以及交付标准。比如数据分析专家,它能理解什么叫业务洞察,知道哪些数字才是关键指标,清楚用什么样的图表最能说明问题,这些是通用大模型没法做到的,而是需要专业领域知识沉淀才能达成。
每个专家的背后都对应一个岗位角色的KnowHow,我们在做任务执行时,召唤对应的专家,WorkBuddy 就会按照这个专家角色的专业视角和方法去完成任务。
而专家团模式是更进一步的设计,前面介绍的专家Agent负责的是某个专业的领域,但是一个复杂的任务通常会涉及到多个领域的岗位协同,而专家团就是专门来解决这个问题的,它由多位不同领域的专家组成,分工协作,由团长拆解任务、分派给领域专家并行执行,最后在整合交付。

因此,我们在使用的使用的时候,如果是明确的单点问题,可以选择使用专家Agent;如果是涉及多个角色的复杂任务,就选择专家团。
其实这些专家Agent和专家团队,不是新鲜概念了,在Claude Code中早已存在,对应的其实就是子Agent和多Agent协作,只不过在Claude Code中需要我们自己创建子Agent或者去编排这些Agent的调用关系,使用门槛颇高。而WorkBuddy把这些功能具象化了,降低了使用门槛,并且把我们日常需要用到的专家Agent以及高频使用的专家团都封装好,点击一下就能用。
如果这些专家Agent不满足我们的需求,我们也可以自定义,核心就是给他设定角色、编写行业经验、配置能够使用的工具链,配置完成后,最终的目录结构大致如下:

助理
助理是 WorkBuddy 的远程控制功能,让我们可以通过手机上的即时通讯软件远程控制电脑上的 WorkBuddy 执行任务,目前支持微信、微信小程序、企业微信、QQ、钉钉、飞书等。其中微信和微信小程序绑定非常简单,扫码即可绑定,然后就能在手机上通过微信向电脑上的WorkBuddy发送指令,电脑端执行完成后,结果就推送到微信:

这意味着我们不需要坐在电脑面前,也能让 WorkBuddy 帮忙处理工作,相当于是一个24小时在线的私人秘书,随时待命。
其中手机端的小程序支持两种模式,一种是云端工作,一个是本地工作。
云端工作,是指任务在云端沙箱中跑,不需要我们电脑开机,但它是没法访问电脑本地资源的。
而本机工作,需要电脑是开机的,并保持网络连接正常,才能正常执行,这种模式是可以访问到我们电脑目录文件的,适合需要读取电脑里面的文件的任务。
举个实际的场景,比如我人在外面,急需把电脑中的PPT发送给同事,要是以前的话,我就只能赶回去才能发,那现在只需要在手机上用本地模式给Workbuddy说一句,帮我把桌面上的xxx.ppt文件发送给我。
但是需要注意的是,在使用助理时,同一时间只能有一个会话在进行中,必须把一件事做完了,你才能让它做另外一件事。所有的对话记录都保存在同一个会话中,也不能清空。
总结
以上就是我对WorkBuddy这段时间实践的一部分认识,整体感受还是很不错,相比Codex APP来说,WorkBuddy核心亮点在于,它把使用门槛做得足够低、生态衔接得非常扎实。之前想用Codex APP但是没有用上的同学可以试试WorkBuddy,除了模型能力不同,其它非常相似。
最后可以预料的是,在国内面向办公场景的桌面Agent这条赛道会更加激烈,而最终比拼的,还是看谁的生态更加厚实:

夜雨聆风