我用了一个更"笨"的AI助手,但再也没丢过文件
开场:它删掉了我的项目
我有一个”太积极”的助手。
它叫OpenClaw,定位是个人AI助手——能读文件、跑命令、帮你处理日常琐事。刚上手那阵,我觉得它效率惊人:交代一件事,它立刻执行,从不废话。
直到有一天,我让它把一个写好的skill拷贝到它的目录里。
它照做了。但拷贝完成后,我的原项目目录里只剩下那个skill文件——其他所有文件都被它删了。
那是一个还没提交git的新项目。过了几天,我重新打开那个目录,发现里面空空如也。
我愣了很久。不是因为它能力不行,是因为它太相信自己”懂”了。我只说了”拷贝”,它理解成”搬移”,还自作主张把源文件当垃圾清理了。
OpenClaw的三个典型症状
“太积极”不是能力问题,是行为模式问题。
执行先于理解。 你给一个指令,它第一反应是”怎么做”,而不是”你要什么”。让它清理临时文件,它可能顺手把没提交的代码也清掉;让它修改配置,它可能连注释都给你改掉。没完全理解意图就动手——这种”积极”比不动更危险。
危险操作零确认。 删库、删目录、改线上配置——这些本该需要二次确认的动作,它从来不问。”用户的指令”和”执行操作”之间没有缓冲区。正常场景下是效率,边界场景下是灾难。
没有记忆和边界。 它不会记住上一次因为什么差点出事,也不会主动判断”这件事超出我的能力范围,应该问一下”。每次对话都是全新开始,过去的教训不留存,未来的风险不预测。
三个问题叠加在一起,就是一台”有能力的机器在不确定的环境中裸奔”。
Hermes做了什么不同的事
换到Hermes之后,最先感受到的变化不是”它会做什么”,而是”它在做什么之前会告诉我”。
同样让它拷贝一个skill文件,Hermes的流程是:先理解你的意图,描述它准备怎么操作,然后等待确认。危险程度越高,它越会主动停下来。
这种”停下来”不是靠感觉。它有一份穷举式的危险命令清单——你要删数据库,它拦截DROP TABLE;你要清工作目录,它拦截rm -rf和git clean -f;你要写系统配置,它拦截写入/etc/的操作。OpenClaw删我文件的时候,没有问过一句。
在”记忆”这件事上,Hermes也会跨会话记住你说过什么、发生过什么。上一次差点删错的东西,下次类似操作时它会更谨慎。每次对话不是从零开始,教训会累积。
当然,它也有问题:配置比OpenClaw复杂,学习曲线更陡,某些场景下”太保守”反而降低了效率。
但对于我来说,**”可控”比”全能”更重要**。
那个删掉文件的,其实是我自己
写这篇文章的时候,我反复想一个问题:
OpenClaw删掉了我的文件,这是它的错吗?
它只是在执行我的指令。我说”拷贝”,它理解为”搬移”,然后贴心地帮我清理了”垃圾”。如果它有善恶之分,它大概还会觉得自己做对了——帮用户做了整理,还提醒用户”源文件已经清理完毕”。
问题在于,我从来没有告诉它”不要动源文件”,它也从来没有问过我。
这不是技术缺陷。这是信任的错位——我把控制权交给了一个没有边界意识的工具,然后为它”太积极”的结果买了单。
换句话说:那个删掉我文件的,其实是我自己。
所以回到最初的问题:AI Agent的边界在哪里?
不是Hermes或者OpenClaw的问题。是你愿意把多少控制权交给一个工具?以及,你有没有能力为它”太积极”的后果负责?
工具越强大,越需要你清楚它的边界在哪里。在那之前,宁可保守一点。
夜雨聆风