
该产品的核心定位可概括为:在操作系统与用户之间构建一层AI中间件。传统操作逻辑下,用户需要主动定位文件、进入系统设置、启动各类应用来完成具体任务。Marvis试图通过自然语言指令,替代用户完成上述路径的跳转与执行。
从产品形态来看,Marvis并非首创。字节跳动的豆包、OpenAI的ChatGPT等产品均提供类似的对话式交互能力。但经过实际使用测试,Marvis在以下维度展现出差异化特征。
一、本地知识库:端侧解析与自动分类
在Mac版测试中,完成授权后,Marvis自动扫描了本地存储空间,并按照文档类型与主题进行了无监督分类:
会议资料自动归集 电子书资源统一整理 PDF文档独立归档
该过程无需用户手动干预,实现了存储内容的自动化组织。
搜索能力方面,Marvis支持全文穿透检索。以关键词“思考”为例,系统不仅匹配文件名,还能检索文档正文内容,并按匹配类型(标题匹配、内容匹配)进行细分展示。
图库管理采用了类似的本地处理逻辑:自动完成人脸识别、地理位置标记、时间轴聚类。这一功能模式与iPhone原生相册接近,但完全在本地运行,不涉及云端上传。用户可通过设置精确控制可访问的系统目录,对敏感文件的隐私保护提供了实质性保障。

二、自动化任务:从信息推送到系统操作
Marvis预置了若干自动化模板,如定时提醒、多邻国任务辅助等。经测试,自定义提醒任务能够按时触发并正常执行。需要指出的是,当前版本的任务设置尚不支持文档上传,仅能完成相对简单的定时动作,后续版本有待迭代。
与ChatGPT的Tasks功能对比,二者存在本质差异。ChatGPT的Tasks本质上是定时执行预设Prompt,到点输出文本结果。而Marvis的自动化能力,根据产品经理的现场演示,能够直接调用目标应用、跳过广告页面、自动触发按钮点击——即完成实际的操作行为,而非仅仅生成文本响应。这一区别具有显著的实用价值。
三、技能广场(Skills):降低用户使用门槛
技能商店在AI产品中并不罕见。Marvis的主要改进在于交互设计的极简化:界面采用类似小红书的双列信息流模式,左侧为封面图,右侧为图文简介,底部设有一键安装按钮。用户无需访问GitHub或进行任何配置操作,即可完成技能的部署。这一设计有效降低了对普通用户的技术门槛。

四、交互细节中的情绪价值设计
Marvis的对话界面采用了一个虚拟办公室场景:多个Agent以小牛马的形象呈现,分别处于“工作中”“休息中”“空闲中”等状态。用户下发任务后,对应的Agent会开始执行动作,界面中会显示“正在处理”“暂停”“模拟互动”等状态标识。
该设计并无功能性价值,但提供了情绪价值——在长期使用中,这类细节可能对用户留存产生积极影响。

五、产品定位与竞争格局分析
5.1 现状:缺少差异化杀手锏
在实际使用中,Marvis的各项功能表现良好,部分细节甚至优于同类产品。但当被问及“是否存在不可替代的核心功能”时,产品经理给出了坦诚的回答:
“目前我们确实没有杀手锏级的功能。”
这一判断与当前AI助手的行业现状一致。以豆包为例,其日活跃用户接近2亿,但用户难以明确说出其不可替代的功能。模型能力并非行业最强,交互设计也未带来颠覆性体验。豆包的竞争优势在于高下限的综合体验:用户在使用过程中不会感到明显不适,能够完成多数通用对话任务。但这种能力,在元宝、千问等产品上也基本可以实现。
行业整体仍处于“通用AI助手”的同质化竞争阶段。
5.2 与主流路线的对比
当前市场上存在三条主流技术路线:
Marvis选择了第四种路径:自底向上的系统级嵌入。
5.3 Marvis的发展路径
根据产品经理的说明,Marvis的研发时间线如下:
2024年:行业普遍采取“概念先行”策略。Marvis逆向操作,从最底层的基础能力做起,包括文件解析、格式转换、本地搜索等工具性功能。 2025年:建设MCP商店,开发系统操作能力。 2025年底:开始搭建Agent框架。

产品经理表示:“到那个阶段,我们已经无法回头。整套系统均为自研,没有使用OpenAI的任何组件。”
自底向上的策略虽然在初期不够性感,但带来了实质性的技术壁垒。以文档处理为例,大多数AI产品采用云端解析方案:将PDF上传至云端大模型,由其提取文本、图片、表格等内容。对于包含复杂元素(多表头Excel、混合公式、图文混排)的PDF,通用方案的解析准确率仅约30%。Marvis用超过一年的时间专门优化本地解析工具,将精度提升至80%–90%。这种工程能力的积累,是竞争对手难以短期复制的。
六、战略卡位:填补中国市场空白
Marvis的长期目标是成为PC端所有应用的总调度层。其能力边界涵盖:
文件内容的理解与检索 已安装软件的管理与调用 系统设置的诊断与修改 移动端App的操作自动化(通过安卓虚拟化)
这一目标指向的生态位是操作系统与用户之间的AI中间层。在中国市场,该位置目前处于空白状态。微软Copilot受限于微软对中国市场的投入比例(约全球收入的1.5%),难以深度本地化;苹果Apple Intelligence则面临政策与生态的落地障碍。

产品经理对此的表述很直接:
“微软在中国市场的精力投入与其收入占比匹配——只有1.5%。但这里是我们的100%。决心不同,投入自然不同。”
七、团队基因带来的差异化能力
Marvis的某些能力源于腾讯应用宝团队的历史积累:
PC端生态运营:应用宝团队拥有十余年的PC端软件分发经验。这使得Marvis能够在PC上直接运行安卓应用(如微博、小红书、微信读书),该能力是其他团队从零开始难以快速复制的。 云游戏技术储备:团队曾从事云游戏研发,因此在云电脑设备的资源调度方案上具备成本与效率优势。产品经理转述研发负责人的原话:“这是市面上性价比最高的云设备调度方案,因为我们做过云游戏。” 微软战略合作:通过合作,Marvis能够获得操作系统底层的接口权限。例如,普通用户很难知道“关闭Windows锁屏广告”对应的设置项名称是“关闭Windows聚焦”。Marvis可以直接调用该对应关系,实现一句话配置。
产品经理的总结颇具深意:
“这就像一个人的童年经历,已经长在你身上了。其他团队能不能做到?花时间,一年也可以。但那一年里,你又在往前走了。”
八、经济模型的必然性:端云结合
Agent类产品的Token消耗量约为普通Chatbot的150倍。若达到豆包量级的日活用户,每日Token成本估算为200亿元人民币量级。这意味着大规模免费铺量的商业模式在经济上不可行——无法通过补贴让数亿用户每天使用Agent。
因此,Marvis选择端云结合、本地模型分担算力的策略,不仅仅是技术路线选择,更是一种经济上的必然。只有将能够在本地完成的任务留在本地执行,才能将云端的Token成本控制在可持续范围内。这也解释了团队为何在端侧模型优化上投入大量资源,与英特尔、高通等芯片厂商均建立了驻场联合优化团队。

九、阶段性总结:先到者的规则定义权
AI时代的产品迭代节奏远快于传统软件周期。以“打磨到90分再发布”的策略往往会错失窗口期。Marvis当前版本仍存在功能不完善之处,团队对此有清晰认知。
但核心问题依然存在:用户为什么要安装Marvis?
操作系统与用户之间,迟早需要一个智能中间层。该层需要具备文件理解、应用管理、系统诊断、操作自动化等综合能力。在中国市场,这一生态位目前没有竞争者真正占据。没有竞争者做到,不代表Marvis已经成功——它只是率先到达了这个位置。
在科技行业,先到者定义规则,后来者遵循规则。
📎 下载信息Windows版与Android版可访问官网 www.marvis.qq.com 获取。
欢迎读者自行体验。macOS版尚未正式上线。
扫描下方二维码
解锁更多惊喜~


夜雨聆风