腾讯推出操作系统级AI助手Marvis:定位系统层智能中间件

腾讯应用宝团队近日发布了一款面向PC端的新产品——Marvis（马维斯）。产品命名基于农历马年背景，吉祥物设计融合了牛马形象与腾讯企鹅的视觉基因。

该产品的核心定位可概括为：在操作系统与用户之间构建一层AI中间件。传统操作逻辑下，用户需要主动定位文件、进入系统设置、启动各类应用来完成具体任务。Marvis试图通过自然语言指令，替代用户完成上述路径的跳转与执行。

从产品形态来看，Marvis并非首创。字节跳动的豆包、OpenAI的ChatGPT等产品均提供类似的对话式交互能力。但经过实际使用测试，Marvis在以下维度展现出差异化特征。

一、本地知识库：端侧解析与自动分类

在Mac版测试中，完成授权后，Marvis自动扫描了本地存储空间，并按照文档类型与主题进行了无监督分类：

会议资料自动归集
电子书资源统一整理
PDF文档独立归档

该过程无需用户手动干预，实现了存储内容的自动化组织。

搜索能力方面，Marvis支持全文穿透检索。以关键词“思考”为例，系统不仅匹配文件名，还能检索文档正文内容，并按匹配类型（标题匹配、内容匹配）进行细分展示。

图库管理采用了类似的本地处理逻辑：自动完成人脸识别、地理位置标记、时间轴聚类。这一功能模式与iPhone原生相册接近，但完全在本地运行，不涉及云端上传。用户可通过设置精确控制可访问的系统目录，对敏感文件的隐私保护提供了实质性保障。

二、自动化任务：从信息推送到系统操作

Marvis预置了若干自动化模板，如定时提醒、多邻国任务辅助等。经测试，自定义提醒任务能够按时触发并正常执行。需要指出的是，当前版本的任务设置尚不支持文档上传，仅能完成相对简单的定时动作，后续版本有待迭代。

与ChatGPT的Tasks功能对比，二者存在本质差异。ChatGPT的Tasks本质上是定时执行预设Prompt，到点输出文本结果。而Marvis的自动化能力，根据产品经理的现场演示，能够直接调用目标应用、跳过广告页面、自动触发按钮点击——即完成实际的操作行为，而非仅仅生成文本响应。这一区别具有显著的实用价值。

三、技能广场（Skills）：降低用户使用门槛

技能商店在AI产品中并不罕见。Marvis的主要改进在于交互设计的极简化：界面采用类似小红书的双列信息流模式，左侧为封面图，右侧为图文简介，底部设有一键安装按钮。用户无需访问GitHub或进行任何配置操作，即可完成技能的部署。这一设计有效降低了对普通用户的技术门槛。

四、交互细节中的情绪价值设计

Marvis的对话界面采用了一个虚拟办公室场景：多个Agent以小牛马的形象呈现，分别处于“工作中”“休息中”“空闲中”等状态。用户下发任务后，对应的Agent会开始执行动作，界面中会显示“正在处理”“暂停”“模拟互动”等状态标识。

该设计并无功能性价值，但提供了情绪价值——在长期使用中，这类细节可能对用户留存产生积极影响。

五、产品定位与竞争格局分析

5.1 现状：缺少差异化杀手锏

在实际使用中，Marvis的各项功能表现良好，部分细节甚至优于同类产品。但当被问及“是否存在不可替代的核心功能”时，产品经理给出了坦诚的回答：

“目前我们确实没有杀手锏级的功能。”

这一判断与当前AI助手的行业现状一致。以豆包为例，其日活跃用户接近2亿，但用户难以明确说出其不可替代的功能。模型能力并非行业最强，交互设计也未带来颠覆性体验。豆包的竞争优势在于高下限的综合体验：用户在使用过程中不会感到明显不适，能够完成多数通用对话任务。但这种能力，在元宝、千问等产品上也基本可以实现。

行业整体仍处于“通用AI助手”的同质化竞争阶段。

5.2 与主流路线的对比

当前市场上存在三条主流技术路线：

路线	代表产品	核心逻辑	中国市场落地情况
办公生态延伸	微软Copilot	以Office为起点，向操作系统渗透	受监管与本地化限制，基本未落地
硬件系统嵌入	苹果Apple Intelligence	AI直接集成于操作系统底层	受政策与生态限制，进展缓慢
对话入口扩张	豆包、元宝	先做好通用对话，逐步叠加工具功能	铺量最快，但始终是App层级

Marvis选择了第四种路径：自底向上的系统级嵌入。

5.3 Marvis的发展路径

根据产品经理的说明，Marvis的研发时间线如下：

2024年：行业普遍采取“概念先行”策略。Marvis逆向操作，从最底层的基础能力做起，包括文件解析、格式转换、本地搜索等工具性功能。
2025年：建设MCP商店，开发系统操作能力。
2025年底：开始搭建Agent框架。

产品经理表示：“到那个阶段，我们已经无法回头。整套系统均为自研，没有使用OpenAI的任何组件。”

自底向上的策略虽然在初期不够性感，但带来了实质性的技术壁垒。以文档处理为例，大多数AI产品采用云端解析方案：将PDF上传至云端大模型，由其提取文本、图片、表格等内容。对于包含复杂元素（多表头Excel、混合公式、图文混排）的PDF，通用方案的解析准确率仅约30%。Marvis用超过一年的时间专门优化本地解析工具，将精度提升至80%–90%。这种工程能力的积累，是竞争对手难以短期复制的。

六、战略卡位：填补中国市场空白

Marvis的长期目标是成为PC端所有应用的总调度层。其能力边界涵盖：

文件内容的理解与检索
已安装软件的管理与调用
系统设置的诊断与修改
移动端App的操作自动化（通过安卓虚拟化）

这一目标指向的生态位是操作系统与用户之间的AI中间层。在中国市场，该位置目前处于空白状态。微软Copilot受限于微软对中国市场的投入比例（约全球收入的1.5%），难以深度本地化；苹果Apple Intelligence则面临政策与生态的落地障碍。

产品经理对此的表述很直接：

“微软在中国市场的精力投入与其收入占比匹配——只有1.5%。但这里是我们的100%。决心不同，投入自然不同。”

七、团队基因带来的差异化能力

Marvis的某些能力源于腾讯应用宝团队的历史积累：

PC端生态运营：应用宝团队拥有十余年的PC端软件分发经验。这使得Marvis能够在PC上直接运行安卓应用（如微博、小红书、微信读书），该能力是其他团队从零开始难以快速复制的。
云游戏技术储备：团队曾从事云游戏研发，因此在云电脑设备的资源调度方案上具备成本与效率优势。产品经理转述研发负责人的原话：“这是市面上性价比最高的云设备调度方案，因为我们做过云游戏。”
微软战略合作：通过合作，Marvis能够获得操作系统底层的接口权限。例如，普通用户很难知道“关闭Windows锁屏广告”对应的设置项名称是“关闭Windows聚焦”。Marvis可以直接调用该对应关系，实现一句话配置。

产品经理的总结颇具深意：

“这就像一个人的童年经历，已经长在你身上了。其他团队能不能做到？花时间，一年也可以。但那一年里，你又在往前走了。”

八、经济模型的必然性：端云结合

Agent类产品的Token消耗量约为普通Chatbot的150倍。若达到豆包量级的日活用户，每日Token成本估算为200亿元人民币量级。这意味着大规模免费铺量的商业模式在经济上不可行——无法通过补贴让数亿用户每天使用Agent。

因此，Marvis选择端云结合、本地模型分担算力的策略，不仅仅是技术路线选择，更是一种经济上的必然。只有将能够在本地完成的任务留在本地执行，才能将云端的Token成本控制在可持续范围内。这也解释了团队为何在端侧模型优化上投入大量资源，与英特尔、高通等芯片厂商均建立了驻场联合优化团队。

九、阶段性总结：先到者的规则定义权

AI时代的产品迭代节奏远快于传统软件周期。以“打磨到90分再发布”的策略往往会错失窗口期。Marvis当前版本仍存在功能不完善之处，团队对此有清晰认知。

但核心问题依然存在：用户为什么要安装Marvis？

操作系统与用户之间，迟早需要一个智能中间层。该层需要具备文件理解、应用管理、系统诊断、操作自动化等综合能力。在中国市场，这一生态位目前没有竞争者真正占据。没有竞争者做到，不代表Marvis已经成功——它只是率先到达了这个位置。

在科技行业，先到者定义规则，后来者遵循规则。

📎 下载信息Windows版与Android版可访问官网 www.marvis.qq.com 获取。
欢迎读者自行体验。macOS版尚未正式上线。

扫描下方二维码

解锁更多惊喜~