重磅!腾讯AI大动作!

在接连推出数十款AI Agent产品之后，腾讯悄然开启了新一轮的战略卡位。这一次，战场不再是某个垂直场景或应用插件，而是整个操作系统的底层。5月21日，腾讯正式发布操作系统级AI助手Marvis（马维斯），面向所有用户开放下载，无需邀请码。这意味着，你电脑里的文件管理、系统设置、应用调用、网络诊断等原本需要手动操作的一切，如今都可以通过一句自然语言来完成。Marvis的定位并非又一个对话式聊天机器人，而是“操作系统层级的中枢”——它会像一位指挥官那样理解你的模糊需求，自动拆解任务，并调度六个不同职能的Agent并行工作。从某种程度上说，这是腾讯将AI能力从应用层向下沉到芯片与系统层的一次关键尝试，也让“对话即操作”从概念走向了日常。

理解Marvis最直观的方式，是把整台电脑想象成一个可以随时对话的智能体。你不必再逐级点击菜单查看电脑配置、电池健康度或网络状态，也不用在搜索引擎里翻教程来优化开机启动项、清理冗余文件。直接对Marvis说一句话，它就能读取系统信息、执行调整指令，甚至主动给出优化建议。比如，你可以问“我这台电脑能流畅运行《黑神话：悟空》吗”，Marvis会调用系统Agent检测硬件参数、比对游戏推荐配置，然后给出明确结论。这种能力的根本突破在于系统层级的打通——Marvis不仅能看到各个应用窗口的内容，还能直接读写操作系统的底层接口与文件系统。据腾讯方面介绍，这一功能的实现得益于公司在芯片层与操作系统层的双重深耕。芯片层面，腾讯与英特尔深度合作，基于OpenVINO工具套件对端侧模型进行推理优化，使性能提升超过20%，在中小模型场景下，GPU或NPU的运算效率相比CPU可提升2到10倍。操作系统层面，腾讯与微软协同，利用WinML等框架让大模型在本地高效运行，同时通过系统级文件服务，让用户直接用自然语言完成文件的移动、重命名、搜索甚至批量处理——这已经超出了传统应用层AI的能力边界。

在运行机制上，Marvis提供了两种模式，兼顾效率与安全。“效率模式”采用端云协同：云端的大模型负责复杂任务的理解与拆解，本地的轻量模型负责执行具体的系统操作和数据处理；而“隐私模式”则完全运行在端侧，所有数据不离设备，适合处理敏感文档或涉及隐私的系统信息。值得一提的是，效率模式下调用的云端模型并非腾讯自研一家，而是同时采用了混元Hy3 preview和DeepSeek-V4等顶尖模型；隐私模式则基于阿里的Qwen端侧模型运行。腾讯马维斯团队负责人明确表示：“我们保持开放心态，计划后续接入更多优秀的开源模型，供用户选择。”这种不把模型绑定在单一技术路线上的做法，既是对不同场景的务实响应，也反映了腾讯在AI战略上愈发强调“拿来主义”与自主创新并行的姿态。

Marvis最大的亮点之一，是出厂即预置了一套完整的Agent协作体系，而非让用户像搭积木一样手动配置工作流。系统内置了六个Agent组成的“AI团队”：主Agent负责任务拆解与调度，其余五个分别专职处理文件（File）、系统（Computer）、应用（App）、网页（Browser）和搜索（Search）任务。当你提出一个综合性需求，比如“帮我找一下上周下载的关于新能源的PDF，总结后发给微信同事”，主Agent会判断需要用到File Agent定位文件、Browser Agent（如果需要联网搜索补充信息）、App Agent调用微信发送消息，并在后台并行执行这些步骤。整个过程不需要你逐个切换工具或复制粘贴中间结果。这种多Agent并行协作的机制，比传统的大模型单次问答更接近人类助理的工作方式——把一个模糊指令拆解成可执行的子任务，再合并结果。腾讯之所以能做到这一步，并非一日之功。从今年年初开始，腾讯已累计上线数十款通用和垂直场景的Agent，其中三月底推出的WorkBuddy以日活计已成为中国最受欢迎的AI智能体，元宝、ima、QQ浏览器等产品也在加速Agent能力的升级。这些产品积累的调度经验和用户反馈，为Marvis这种操作系统级中枢的诞生提供了实战基础。

与市面上其他AI助手相比，Marvis最独特的竞争壁垒在于它依托了腾讯应用宝长达14年的应用商店积累和4年的跨端生态建设。据腾讯相关负责人介绍，Marvis不仅能直接操控电脑上的EXE软件，还能在电脑上直接操作手机App——这正是其他同类产品目前无法做到的。比如，用户可以对Marvis说“在电脑上打开同花顺看看自选股”，或者“在飞常准上查一下我明天航班的实时状态”，Marvis会调用App Agent，通过应用宝的跨端能力在电脑上拉起对应的手机App界面并模拟操作。汽车之家、唯品会等应用也已有合作意向。这种“一云多端”的体验，把PC变成了一个可以操控移动生态的超级终端，也让Marvis的应用场景从系统管理扩展到了跨端服务调度。考虑到腾讯在应用分发和跨端生态上的长期投入，这条护城河短期内很难被对手复制。

当然，强大的能力背后是同样显著的算力消耗。Agent产品的工作方式决定了它的Token消耗量远高于传统的聊天助手型AI——后者通常只需要一轮问答，而Agent为了完成一个复杂任务，可能需要多次调用模型进行推理、拆解、执行和汇总。

腾讯官方数据也印证了这一点：自今年密集推出Agent产品以来，自研大模型Hy3 preview的Token调用量已连续多周登顶第三方平台OpenRouter的周榜，截至5月21日，周调用量达到2.85万亿Token。如此巨大的算力成本，让Marvis的免费模式注定难以长久维持。目前Marvis虽然向所有用户免费开放，并每天提供基础Token配额，但腾讯马维斯团队负责人坦言“长期完全免费不现实”。这呼应了此前腾讯高管在一季报电话会上的判断：中国的C端订阅模式很难成为主流变现方式，对比音乐、视频等成熟数字服务，国内付费渗透率与单价水平显著低于海外市场；而AI服务存在刚性的算力成本，无法复制互联网时代零边际成本的扩张路径。广告与小程序生态会是更长期、更可行的补充，但行业尚处早期。因此，Marvis未来的收费策略很可能会采用“基础用量免费+超出部分按量计费”或“自带API Key”的灵活方式，同时通过持续优化端侧模型，将大部分常规操作消化在本地，从而大幅降低用户需要支付的云端Token消耗。用腾讯的话说，“高价值使用场景”才是他们真正寻找的变现锚点。

从更宏观的视角看，腾讯今年在AI Agent上的密集布局已经带来了实质性的商业回报。2026年第一季度，腾讯实现营收1964.6亿元，同比增长9%；Non-IFRS经营利润756.3亿元，同比增长9%。若剔除新AI产品带来的投入影响，Non-IFRS经营利润同比增长17%至844亿元。这意味着AI业务虽然仍在投入期，但并未拖累整体盈利能力。而Marvis的推出，可以视为腾讯试图把AI助手从“辅助工具”升级为“操作系统默认入口”的关键一步。过去，无论是元宝还是WorkBuddy，都需要用户主动打开应用、输入需求；而Marvis一旦嵌入操作系统层，它就能常驻在系统后台，随时响应，甚至主动感知用户情境。这种“默认入口”的争夺，远比发布十几个独立Agent更为重要。如果Marvis能够证明自己确实提高了用户操作电脑的效率、降低了使用复杂软件的门槛，那么它就有机会像当年的鼠标或触屏一样，成为人机交互的一次底层变革。

当然，挑战同样明显。首先是隐私与安全的平衡：一个可以读写文件、修改系统设置、调用所有应用的AI，如果被恶意利用或出现漏洞，后果将远比传统软件严重。腾讯为此设计了完全离线的隐私模式，并在效率模式中对敏感操作增加二次确认，但实际使用中能否让企业和个人用户放心，仍需时间检验。其次是模型能力的天花板：即使是目前最先进的混元Hy3 preview或DeepSeek-V4，在处理极其复杂或带有歧义的系统指令时仍可能出现理解偏差，而一旦操作失误（例如误删文件或改错注册表），用户对“AI管家”的信任就会大打折扣。最后是生态博弈：微软自身也在将Copilot不断整合进Windows，苹果有Apple Intelligence，谷歌的Gemini也在向桌面端渗透。腾讯Marvis虽然是基于Windows开发，但与微软自家AI助手的关系是互补还是竞争，尚不明朗。可以确定的是，操作系统级别的AI化浪潮已经不可逆转。腾讯凭借其在应用宝跨端生态上的独特积累，以及从芯片到操作系统再到多Agent调度的全栈能力，率先在国内迈出了这一步。至于Marvis能否真正成为每个人电脑里的“默认管家”，答案不仅取决于技术，更取决于用户是否愿意把操作系统的钥匙，交给一个会说话的人工智能。