这两天在网上刷到了一个东西,叫 Marvis。
我第一反应是:这玩意儿,不就是个本地版的 OpenClaw 吗?
但仔细看了下,发现不太对。
OpenClaw、Hermes 这些,大家应该都熟。就是那种,你给个指令,AI 帮你操作手机,点这儿点那儿,完成一些自动化任务。挺好用的,但说实话,有点……小儿科。
Marvis 不一样。
它不是让你「教 AI 怎么点屏幕」。
它是让 AI「理解你想干什么,然后自己去干」。
这话听着有点抽象,我举个例子。
一、Agent 的进化:从云端玩具到本地武器
先说个背景。
最近这半年,AI 圈有个趋势特别明显:Agent 正在从「云端玩具」变成「本地武器」。
早期的 AI Agent,像 AutoGPT、BabyAGI 这些,都是在云端跑。你给个目标,它自己规划、自己执行、自己反思。听着挺牛逼,但用起来……一言难尽。
最大的问题:它碰不到真实世界。
你让它「帮我订张机票」,它能在网上搜航班,能比价,能生成计划。但它订不了。因为它没法登录你的账号,没法输入你的支付信息,没法点那个「确认支付」按钮。
它被困在了云端。
然后 OpenClaw、Hermes 这些出现了。它们解决了「碰不到真实世界」的问题——通过模拟点击、模拟输入,让 AI 能操作手机 App。
但新的问题来了:太慢了。
你想啊,AI 要「看到」屏幕,要「理解」界面元素,要「规划」点击路径,要「执行」点击操作。每一步都有延迟,每一步都可能出错。
我试过用 Hermes 帮我点外卖。从打开 App 到下单成功,花了快两分钟。
我自己点,30 秒搞定。
二、Marvis 的思路:不是模仿,是接管
回到 Marvis。
Marvis 的思路,跟 OpenClaw、Hermes 完全不一样。
https://marvis.qq.com/

核心区别:
它不是「模拟人类操作」。
它是「直接调用系统 API」。
OpenClaw / Hermes
让 AI「看到」文件管理器界面,然后「点击」这里,「拖动」那里,像真人一样操作。
→ 模仿人类操作
→ 有延迟、会出错、受限于界面设计
Marvis
让 AI「调用文件系统的 API」,直接移动文件、创建文件夹、重命名。
→ 直接接管系统
→ 没有延迟、不会出错、直达系统底层
这玩意儿,听着就有点……赤鸡。
三、AI Agent 的三个阶段
我自己的感受是,Marvis 代表的是 AI Agent 的第三个阶段。
第一阶段:云端玩具
能想,不能做。
第二阶段:界面模拟
能想,能模仿着做,但慢且容易错。
第三阶段:系统接管
能想,能直接做,而且做得比人快、比人准。
这个「第三阶段」,有几个关键特征:
第一,本地化。
Marvis 运行在你的电脑上,不是云端。这意味着:
- 延迟极低。你说句话,它马上动。
- 隐私极好。你的文件不上传,你的操作不留痕。
- 控制权在你手里。你可以随时停止,随时查看,随时调整。
第二,权限完整。
这不是那种「只能读不能写」的阉割版 Agent。
Marvis 能读你的文件,也能写你的文件。能查你的系统信息,也能改你的系统设置。能启动应用,也能关闭应用。能执行命令,也能编写脚本。
权限完整到……有点吓人。
第三,上下文理解。
这不是那种「一问一答」的客服机器人。
你刚让它整理完文件,然后说「把那个合同发我」,它知道「那个合同」指的是刚才整理出来的合同。
你让它「每天上午 9 点搜 AI 资讯」,它第二天真的会去搜,真的会整理成报告发你。
它会记住上下文,会推断你的意图,会主动规划下一步。
四、安全吗?Marvis 的分级权限策略
说到这儿,可能有人要问了:这玩意儿,安全吗?
一个能直接调用系统 API、权限完整、运行在本地的 AI,万一出点啥问题……
Marvis 的安全策略:分级权限管理
不是「一刀切」——要么全给,要么全不给。而是分级的。
| 风险等级 | 处理方式 |
| 🟢 只读操作 | 查文件、查系统信息 —— |
| 🟡 中风险操作 | 改设置、装软件 —— |
| 🔴 高风险操作 | 删文件、改注册表 —— |
而且,这个授权不是那种「你确定吗?」的弹窗。是具体的、透明的、可操作的。
比如你要删除文件,它会先告诉你:「这些文件将被删除,共 XX 个,大小 XX MB。确认删除?」然后给你一个清单,让你勾选哪些要删,哪些要留。



这种设计,我觉得挺聪明的。既给了 AI 足够的权限去干活,又给了用户足够的控制权去把关。
五、从「自动化」到「智能化」
但说实话,我最感兴趣的,不是 Marvis 现在能干什么。
是它「可能」能干什么。
一个能直接调用系统 API 的 AI Agent,意味着什么?
意味着,它可以把整个操作系统,当成一个「可编程的接口」。

从「点对点」到「面到面」
现在的自动化是「点对点」的——写个脚本干一件事。
有了 Marvis,你只需要说:「每天下午 5 点,自动备份我今天修改过的所有重要文件。」
Marvis 会自己去:
- 判断哪些文件是「重要的」(根据文件类型、位置、历史使用记录)
- 判断哪些是「今天修改过的」
- 选择合适的备份位置(本地硬盘、网盘、还是 NAS)
- 执行备份
- 给你发个通知,告诉你备份完成
这已经不是「自动化」了。这是「智能化」。
六、AI 原生应用的真正含义
说到智能化,我想起一个事儿。
最近不是有个概念挺火的吗,叫「AI 原生应用」。意思是,这个应用从设计之初,就是为 AI 服务的。
但我觉得,这个思路可能错了。
真正的「AI 原生」,不是「为 AI 设计应用」。是「让 AI 成为应用」。
Marvis 给我的感觉,就在往这个方向走。
它不是「另一个应用」。
它是「所有应用的操作系统」。
- 你想用 Word?不用打开 Word,直接跟 Marvis 说:「帮我写个报告。」
- 你想用 Excel?不用打开 Excel,直接跟 Marvis 说:「帮我分析一下这个数据。」
- 你想用浏览器?不用打开浏览器,直接跟 Marvis 说:「帮我搜一下这个信息。」
Marvis 会自己去调用 Word、Excel、浏览器,完成你要的任务,然后把结果给你。
在这个过程中,你不需要知道 Word 怎么用,Excel 怎么用,浏览器怎么用。你只需要知道,你想要什么结果。
七、人类与 AI 的分工:决策 vs 执行
这听起来很美好,对吧?
但问题来了:如果 AI 能替我们做所有事,那我们自己做什么?
我的答案是:我们做「决策」,AI 做「执行」。
人类:决策
- 理解背景
- 权衡利弊
- 预判后果
- 承担风险
人类擅长决策,但不擅长执行(容易累、容易错、容易忘)。
AI:执行
- 准确
- 快速
- 可靠
- 可重复
AI 擅长执行,但不擅长决策(缺乏常识、缺乏价值观、缺乏责任感)。
Marvis 这样的工具,就是在往这个方向走。它把人类从繁琐的「执行」中解放出来,让我们能更专注地「决策」。
八、警惕「决策能力退化」
但这里有个陷阱。
如果 AI 太能干,人类可能会「决策能力退化」。
技能,是用进废退的。
- 如果你从来不需要自己整理文件,你怎么知道文件该怎么分类?
- 如果你从来不需要自己写报告,你怎么知道报告该怎么组织?
- 如果你从来不需要自己分析数据,你怎么知道数据该怎么解读?
但更可怕的是,如果 AI 开始替我们做「决策」工作,我们的「决策能力」也会退化。
你看现在很多人,连「今天吃什么」这种简单决策,都要问 AI。
「决策外包」,可能是 AI 时代最大的风险。
九、保持清醒:用 AI,但不依赖 AI
所以,我的建议是:
用 Marvis 这样的工具,但要保持清醒。
- 用它来解放你的双手,但不要让它接管你的大脑。
- 用它来提高效率,但不要让它替代思考。
- 用它来执行任务,但决策权一定要握在自己手里。
这就像开车。自动驾驶能帮你开车,但方向盘要在你手里。目的地要你来定,路线要你来选,什么时候加速、什么时候刹车、什么时候变道,要你来决定。
AI 是工具,你是主人。 这个主次关系,不能乱。
十、尾声:AI 是伙伴,不是替代品
最后说个小事。
我写这篇文章的时候,Marvis 一直在旁边「看着」。
不是真的看,是那种……你知道它在的感觉。
我写到「OpenClaw」的时候,它突然弹了个消息:「需要我帮你查一下 OpenClaw 的最新版本和功能对比吗?」
我当时就笑了。
太智能了,智能得有点吓人。
但转念一想,这不就是未来吗?
AI 不是那种冷冰冰的、遥远的、高高在上的「技术」。
它是温暖的、贴近的、随时待命的「伙伴」。
它会观察你,理解你,预测你,帮助你。
但最终,决定权在你手里。
你要用它来做什么,成为什么样的人,过什么样的生活。这些,AI 帮不了你。这些,得你自己来。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

加我,学习&交流
夜雨聆风