在接连推出数十款AI Agent产品之后,腾讯悄然开启了新一轮的战略卡位。这一次,战场不再是某个垂直场景或应用插件,而是整个操作系统的底层。5月21日,腾讯正式发布操作系统级AI助手Marvis(马维斯),面向所有用户开放下载,无需邀请码。这意味着,你电脑里的文件管理、系统设置、应用调用、网络诊断等原本需要手动操作的一切,如今都可以通过一句自然语言来完成。Marvis的定位并非又一个对话式聊天机器人,而是“操作系统层级的中枢”——它会像一位指挥官那样理解你的模糊需求,自动拆解任务,并调度六个不同职能的Agent并行工作。从某种程度上说,这是腾讯将AI能力从应用层向下沉到芯片与系统层的一次关键尝试,也让“对话即操作”从概念走向了日常。

理解Marvis最直观的方式,是把整台电脑想象成一个可以随时对话的智能体。你不必再逐级点击菜单查看电脑配置、电池健康度或网络状态,也不用在搜索引擎里翻教程来优化开机启动项、清理冗余文件。直接对Marvis说一句话,它就能读取系统信息、执行调整指令,甚至主动给出优化建议。比如,你可以问“我这台电脑能流畅运行《黑神话:悟空》吗”,Marvis会调用系统Agent检测硬件参数、比对游戏推荐配置,然后给出明确结论。这种能力的根本突破在于系统层级的打通——Marvis不仅能看到各个应用窗口的内容,还能直接读写操作系统的底层接口与文件系统。据腾讯方面介绍,这一功能的实现得益于公司在芯片层与操作系统层的双重深耕。芯片层面,腾讯与英特尔深度合作,基于OpenVINO工具套件对端侧模型进行推理优化,使性能提升超过20%,在中小模型场景下,GPU或NPU的运算效率相比CPU可提升2到10倍。操作系统层面,腾讯与微软协同,利用WinML等框架让大模型在本地高效运行,同时通过系统级文件服务,让用户直接用自然语言完成文件的移动、重命名、搜索甚至批量处理——这已经超出了传统应用层AI的能力边界。
在运行机制上,Marvis提供了两种模式,兼顾效率与安全。“效率模式”采用端云协同:云端的大模型负责复杂任务的理解与拆解,本地的轻量模型负责执行具体的系统操作和数据处理;而“隐私模式”则完全运行在端侧,所有数据不离设备,适合处理敏感文档或涉及隐私的系统信息。值得一提的是,效率模式下调用的云端模型并非腾讯自研一家,而是同时采用了混元Hy3 preview和DeepSeek-V4等顶尖模型;隐私模式则基于阿里的Qwen端侧模型运行。腾讯马维斯团队负责人明确表示:“我们保持开放心态,计划后续接入更多优秀的开源模型,供用户选择。”这种不把模型绑定在单一技术路线上的做法,既是对不同场景的务实响应,也反映了腾讯在AI战略上愈发强调“拿来主义”与自主创新并行的姿态。

Marvis最大的亮点之一,是出厂即预置了一套完整的Agent协作体系,而非让用户像搭积木一样手动配置工作流。系统内置了六个Agent组成的“AI团队”:主Agent负责任务拆解与调度,其余五个分别专职处理文件(File)、系统(Computer)、应用(App)、网页(Browser)和搜索(Search)任务。当你提出一个综合性需求,比如“帮我找一下上周下载的关于新能源的PDF,总结后发给微信同事”,主Agent会判断需要用到File Agent定位文件、Browser Agent(如果需要联网搜索补充信息)、App Agent调用微信发送消息,并在后台并行执行这些步骤。整个过程不需要你逐个切换工具或复制粘贴中间结果。这种多Agent并行协作的机制,比传统的大模型单次问答更接近人类助理的工作方式——把一个模糊指令拆解成可执行的子任务,再合并结果。腾讯之所以能做到这一步,并非一日之功。从今年年初开始,腾讯已累计上线数十款通用和垂直场景的Agent,其中三月底推出的WorkBuddy以日活计已成为中国最受欢迎的AI智能体,元宝、ima、QQ浏览器等产品也在加速Agent能力的升级。这些产品积累的调度经验和用户反馈,为Marvis这种操作系统级中枢的诞生提供了实战基础。
与市面上其他AI助手相比,Marvis最独特的竞争壁垒在于它依托了腾讯应用宝长达14年的应用商店积累和4年的跨端生态建设。据腾讯相关负责人介绍,Marvis不仅能直接操控电脑上的EXE软件,还能在电脑上直接操作手机App——这正是其他同类产品目前无法做到的。比如,用户可以对Marvis说“在电脑上打开同花顺看看自选股”,或者“在飞常准上查一下我明天航班的实时状态”,Marvis会调用App Agent,通过应用宝的跨端能力在电脑上拉起对应的手机App界面并模拟操作。汽车之家、唯品会等应用也已有合作意向。这种“一云多端”的体验,把PC变成了一个可以操控移动生态的超级终端,也让Marvis的应用场景从系统管理扩展到了跨端服务调度。考虑到腾讯在应用分发和跨端生态上的长期投入,这条护城河短期内很难被对手复制。
当然,强大的能力背后是同样显著的算力消耗。Agent产品的工作方式决定了它的Token消耗量远高于传统的聊天助手型AI——后者通常只需要一轮问答,而Agent为了完成一个复杂任务,可能需要多次调用模型进行推理、拆解、执行和汇总。

腾讯官方数据也印证了这一点:自今年密集推出Agent产品以来,自研大模型Hy3 preview的Token调用量已连续多周登顶第三方平台OpenRouter的周榜,截至5月21日,周调用量达到2.85万亿Token。如此巨大的算力成本,让Marvis的免费模式注定难以长久维持。目前Marvis虽然向所有用户免费开放,并每天提供基础Token配额,但腾讯马维斯团队负责人坦言“长期完全免费不现实”。这呼应了此前腾讯高管在一季报电话会上的判断:中国的C端订阅模式很难成为主流变现方式,对比音乐、视频等成熟数字服务,国内付费渗透率与单价水平显著低于海外市场;而AI服务存在刚性的算力成本,无法复制互联网时代零边际成本的扩张路径。广告与小程序生态会是更长期、更可行的补充,但行业尚处早期。因此,Marvis未来的收费策略很可能会采用“基础用量免费+超出部分按量计费”或“自带API Key”的灵活方式,同时通过持续优化端侧模型,将大部分常规操作消化在本地,从而大幅降低用户需要支付的云端Token消耗。用腾讯的话说,“高价值使用场景”才是他们真正寻找的变现锚点。
从更宏观的视角看,腾讯今年在AI Agent上的密集布局已经带来了实质性的商业回报。2026年第一季度,腾讯实现营收1964.6亿元,同比增长9%;Non-IFRS经营利润756.3亿元,同比增长9%。若剔除新AI产品带来的投入影响,Non-IFRS经营利润同比增长17%至844亿元。这意味着AI业务虽然仍在投入期,但并未拖累整体盈利能力。而Marvis的推出,可以视为腾讯试图把AI助手从“辅助工具”升级为“操作系统默认入口”的关键一步。过去,无论是元宝还是WorkBuddy,都需要用户主动打开应用、输入需求;而Marvis一旦嵌入操作系统层,它就能常驻在系统后台,随时响应,甚至主动感知用户情境。这种“默认入口”的争夺,远比发布十几个独立Agent更为重要。如果Marvis能够证明自己确实提高了用户操作电脑的效率、降低了使用复杂软件的门槛,那么它就有机会像当年的鼠标或触屏一样,成为人机交互的一次底层变革。
当然,挑战同样明显。首先是隐私与安全的平衡:一个可以读写文件、修改系统设置、调用所有应用的AI,如果被恶意利用或出现漏洞,后果将远比传统软件严重。腾讯为此设计了完全离线的隐私模式,并在效率模式中对敏感操作增加二次确认,但实际使用中能否让企业和个人用户放心,仍需时间检验。其次是模型能力的天花板:即使是目前最先进的混元Hy3 preview或DeepSeek-V4,在处理极其复杂或带有歧义的系统指令时仍可能出现理解偏差,而一旦操作失误(例如误删文件或改错注册表),用户对“AI管家”的信任就会大打折扣。最后是生态博弈:微软自身也在将Copilot不断整合进Windows,苹果有Apple Intelligence,谷歌的Gemini也在向桌面端渗透。腾讯Marvis虽然是基于Windows开发,但与微软自家AI助手的关系是互补还是竞争,尚不明朗。可以确定的是,操作系统级别的AI化浪潮已经不可逆转。腾讯凭借其在应用宝跨端生态上的独特积累,以及从芯片到操作系统再到多Agent调度的全栈能力,率先在国内迈出了这一步。至于Marvis能否真正成为每个人电脑里的“默认管家”,答案不仅取决于技术,更取决于用户是否愿意把操作系统的钥匙,交给一个会说话的人工智能。
夜雨聆风