5月20号,腾讯悄没声地发布了一个叫马维斯的AI助手,英文名 Marvis。
定位四个字,操作系统层级。
不是聊天机器人,不是插件,是真正住进你电脑底层的那个东西。
我当时刷到这个消息第一反应是,又一个AI助手?这玩意儿现在满大街都是。
但往下看了会儿,发现事情没那么简单,这个软件真的实现了让操作者只动嘴不动手。

市面上叫AI助手的东西我确实看麻了。Claude、ChatGPT、Kimi、豆包,本质上都是同一个模式,你问它答,在应用层打转。
但马维斯想做的事情不一样。它要把整台电脑变成一个可以跟你对话的智能对象,直接触达系统底层,读你的文件、操控你的应用、调整系统设置、甚至让你用手机远程接管电脑。
这不是模拟点击,这是调用系统API。
效率天差地别。
架构也挺有意思。一个主管Agent带五个专家Agent,文件处理归 File Agent,系统运维归 Computer Agent,应用操控归 App Agent,网页交互归 Browser Agent,搜索归 Search Agent。
而且这五个小家伙有形象,戴企鹅围脖的小黑马,在虚拟办公室里搬砖的搬砖,喝咖啡的喝咖啡,状态实时显示。
坦率的讲我觉得这个设计有点骚。多Agent系统对普通用户太抽象了,但你给他看个小马搬砖的动画他就懂了,「哦它在帮我干活」。这种把复杂技术包装成人话的能力,比技术本身更难得。

最值得聊的是它的双模式设计。
效率模式走端云协同,用混元 Hunyuan3 和 DeepSeek V4,快且强。隐私模式走阿里 Qwen 端侧模型,所有推理本地完成,数据完全不上云,断网也能用。每人每天还送 1000万免费Token。
但真正让我觉得聪明的是它的任务拆解方式。效率模式不是把东西全丢给云端,而是分层处理。文件处理、图片识别、本地索引这些重活儿端侧自己干了,只有复杂意图理解才交给云端。能不传上云的尽量不传。
隐私模式就更极端了。财务报表校对、法务合同审查这些敏感场景直接切本地,连网都能断掉。与其让用户纠结信不信厂商的安全承诺,不如给他们一个「根本不用传」的选择。

跨端协同这块有个能力让我眼前一亮。手机连电脑,实时查看屏幕随时接管,电脑锁屏状态下手机还能远程解锁输入密码。官方说法是「打造可以随身携带的个人电脑」。
我自己 TeamViewer、ToDesk 都用过,能用但说不上好,延迟和操作精度都是问题。而马维斯依托应用宝14年的积累,PC端可以直接操控安卓App。微博超话签到、同花顺看行情、飞常准查航班,电脑上一句话搞定,反过来也一样。这个双向操控能力目前我没看到第二家能做到这个程度。
当然槽点也有。
Windows版要6核CPU加16GB内存加固态硬盘,8GB内存的老电脑直接劝退,因为隐私模式跑端侧大模型本身就吃资源。macOS只支持M1及以上,Intel版Mac用不了。
iOS版本还在审核,6月中旬才上线,缺了iPhone这个最大移动端入口体验不完整。而且桌面AI助手这条赛道已经挺挤了,阶跃AI桌面伙伴、各种开源方案都在做类似的事,差异化到底够不够还得看后续迭代速度。
但抛开这些不谈,我觉得马维斯代表了一个很明确的趋势。
AI正在从「对话式工具」变成「环境式存在」。
最早AI就是个网页对话框,后来变成嵌入应用的 Copilot,再到现在下沉到操作系统层面,成为计算环境的有机组成部分。路径很清晰。
最终的检验标准只有一个,用户愿不愿意每天都打开它。功能多不代表好用,Agent多不代表智能。
我们离真正的AI个人助理还有多远?不是那种问一句答一句的聊天机器人,而是真正了解你、理解你的工作流、在你开口之前就把事情办好的那个东西。
马维斯肯定还不是终极答案,但它指的方向是对的。AI不该悬浮在应用层的对话窗口里,该沉到操作系统底层去。
这条路难走,但总有人要走。

夜雨聆风