过去两年,AI产品的主战场只有一个地方——聊天框。用户提问,AI回答,然后呢?然后你需要自己去执行。
腾讯在5月21日上线的 Marvis(马维斯),想终结这个循环。它不是在聊天框里加功能,而是把整台电脑变成了AI可以直接操作的界面。
这不是又一个AI助手。这是一次交互范式层面的系统性升级。
一、核心架构:六大Agent组成的虚拟团队
Marvis 的技术架构可以用一句话概括:PM统筹,六个专项Agent并行执行。
PM Agent 负责理解用户意图、拆解复杂任务、调度其他Agent。它不直接干活,但决定了活怎么干。其余五个专项Agent各有明确分工:
File Agent负责本地文件的全生命周期管理。它支持的检索维度覆盖文件名、文档内容、图片内文字(OCR)甚至场景主题。实测中,用户描述"一个月前关于黑神话悟空的截图",Agent先按关键词和时间筛选1000张图片,再用脚本精筛到8张候选,第一张就是目标。
Computer Agent深入Windows系统底层,负责硬件检测、性能优化、系统配置修改。用户不需要知道"Windows聚焦"这个术语,只需要说"关掉锁屏广告",Agent就能精准定位并执行。
APP Agent负责操控电脑上的各类应用程序——查机票、电商比价、软件安装卸载,无需用户手动打开软件。
Search Agent和Browser Agent分别负责信息检索和网页交互,前者对接公开网络资源精准定位信息,后者处理网页数据抓取、表单填写等复杂操作。
关键在于:这六个Agent不是串行排队,而是并行工作。当你下达"检测游戏配置、优化开机速度、找本地游戏截图"这种复合指令,PM Agent会同时调度Computer Agent和File Agent并行执行,任务完成时间远超传统单线程方案。
二、端云双模式:效率与隐私的天平
Marvis 最被低估的设计,可能是它的双模式架构。
效率模式下,复杂推理任务走云端(调用DeepSeek V4或腾讯混元Hunyuan3等大模型),文件处理和系统执行在本地完成。每日2000万Token免费额度,日常使用足够覆盖。
隐私模式下,所有数据完全在本地端侧处理,断网也能用。文件解析、对话推理、任务执行全部不上云。硬件门槛较高——需要16核CPU、32GB内存、16GB显存——但对财务、法务、医疗等高敏感行业而言,这个门槛值得支付。
两种模式可在同一设备上按需切换,用户不必在"效率"和"安全"之间做二选一。这套设计直接回应了一个长期被忽视的需求:企业级AI落地最大的障碍不是技术不够强,而是合规和隐私。
三、跨端协同:手机接管电脑,电脑操控手机
依托腾讯应用宝团队14年的应用生态积累,Marvis的跨端能力有一个独家场景:在电脑上直接操控手机里的App。
目前已对接同花顺、飞常准等应用。手机端的体验同样实用——安装Marvis后,同一微信或QQ账号登录即可连接电脑,手机可实时查看电脑桌面并远程接管,电脑锁屏状态下也能正常操作。电脑断网时,手机端自动切换云端模式,确保任务不中断。
这套跨端能力解决的是一个真实痛点:给父母远程修电脑。传统方案需要视频通话、口头指导,效率极低。Marvis的方案是手机直接接管电脑桌面,扫一眼定位问题。
四、安全机制:AI不替你做决定
所有涉及系统配置修改、文件删除、权限变更的敏感操作,Marvis必须经用户确认后才会执行。
这个设计看似简单,实际上是一个重要的产品判断:在系统级权限面前,宁可多一步确认,也不能让AI自作主张。实测中,当用户要求关闭自启动程序时,Agent会先列出所有自启动项,配"人话版"说明每个程序的功能,建议哪些可以关闭,等用户确认后才执行。
五、与竞品的差异化
将Marvis放在当前的Agent产品格局中,它的差异化至少体现在三个层面。
权限深度:大多数AI助手停留在应用层,Marvis直接触达操作系统底层。这不是"帮你打开Word",而是"帮你找到三个月前的Word文档、提取关键数据、自动生成报表"。
开箱即用:用户不需要安装插件、配置环境、写自动化脚本。登录微信或QQ账号即可使用。这降低了Agent产品的使用门槛,让非技术用户也能享受AI自动化的红利。
生态壁垒:腾讯拥有应用分发渠道(应用宝)、社交连接(微信/QQ)、云服务基础设施。Marvis不是孤立产品,而是腾讯AI生态的一个节点。
六、当前局限
坦诚说,Marvis目前也有明显短板。
硬件门槛高:隐私模式需要16核CPU、32GB内存、16GB显存,这个配置远超普通办公电脑。大多数用户只能使用效率模式,意味着数据必然经过云端。
平台覆盖不完整:目前仅支持Windows PC端和安卓手机端,macOS和iOS尚未上线。对于国内大量Mac用户来说,这是一个硬伤。
深度控制的风险:系统级权限是一把双刃剑。即便有确认机制,Agent操控系统底层的复杂性意味着边缘情况下的风险依然存在。
七、行业信号:从"谁更聪明"到"谁更能干"
Marvis的发布释放了一个明确信号:AI产品的竞争正在从"谁更聪明"转向"谁更能干"。
过去两年,大模型赛道卷的是参数量、 benchmarks、跑分。这些指标当然重要,但对普通用户而言,它们远不如"AI能不能帮我干完这件事"来得直接。
腾讯2026年Q1财报中有一句话值得关注:AI正在从"回答者"变成"执行者"。Marvis正是这句话的产品化落地。
对AI行业从业者来说,这至少意味着两个趋势:第一,纯对话式AI产品的护城河在持续降低,开源模型的能力追赶速度超出预期;第二,能将AI能力嵌入真实工作流的产品,才有机会建立持久壁垒。
Marvis未必是最终答案,但它指出了一个方向——当AI真正"长出手脚",能替你打开文件、关掉弹窗、远程修电脑的时候,你才会发现,原来AI最大的价值不在对话,而在执行。
夜雨聆风