先说安全:我的部署环境没有顾虑
关于 OpenClaw 的安全风险,网上有很多警告(CNCERT 通报、大量 CVE 漏洞等)。但必须说明一个前提:这些风险高度依赖部署方式。
我选择的做法是:
部署在专用的服务器上,不存放任何个人敏感数据
或者用一台闲置的空白电脑(里面没有文件、没有账号、没有任何可泄露的信息)
在这种“隔离沙盒”式的环境下,OpenClaw 就算有漏洞、被攻击、甚至被完全控制,也拿不到任何有价值的东西。它只是一个可以随时销毁的任务执行容器。
所以对我来说,安全不是问题。这个结论只适用于和我一样做环境隔离的用户。如果你要把 OpenClaw 装在自己的主力机、带个人文件或登录态的系统里,那安全警告依然需要认真对待。
下面说回真实的功能体验。
一、好的地方:值得点亮的亮点
1. 接入飞书后,安排事情很方便
飞书是 OpenClaw 在国内最成熟的落地载体。团队成员无需学习 OpenClaw 的操作,在飞书群内直接发送指令即可调用 AI 能力,零学习成本。你可以直接在群里喊它干活,不用切工具,也不用搬运信息。
2. 写作类任务,培养后能用
写作是 OpenClaw 少有的“越用越好用”的场景。你配置好写作偏好(语气、风格、模板),持续给反馈,它会把这些沉淀到记忆文件中。持续投喂写作风格的语料和范文,模型的输出会越来越贴合你的需求。实测中,OpenClaw 可以完成信息整合、稿件撰写等环节,配合网络资料搜索生成新闻稿。
3. 每日提醒、学习汇报、热点资讯——做得好
OpenClaw 的 Heartbeat 心跳机制(默认每 30 分钟自动唤醒检查)加上 Cron 定时调度,可以每天自动收集天气、日程、待办、行业动态等信息,生成结构化早报推送。你可以配置它每天扫描行业信息源,生成包含头条新闻、趋势讨论、机会洞察的简报,定时推送到飞书,一醒来就能掌握重要信息。
4. 图片和视频工作流,配置好之后也不错
OpenClaw 可以搭建完整的短视频创作流程:监控热点趋势、研究选题、撰写脚本、生成缩略图、排期发布。有用户实测通过 OpenClaw 生成短视频脚本,配合 AI 剪辑工具,全程只要 5 分钟搞定。
5. 单次、短周期任务完成得好
短对话、单次指令型的任务,OpenClaw 表现相当稳定。比如“帮我把这个想法整理成一篇笔记”“提取这篇文章的核心观点”这类即问即答、一次完成的任务,它执行起来几乎不出错。这是 OpenClaw 最可靠的能力区间。
二、不好的地方:
忘事——而且是反复忘
OpenClaw 被吐槽最多的问题就是“记性不太行”。你前面说过的东西,它后面可能就忘了;或者同一件事反复记、反复问,memory 越用越乱。很多人一开始以为这是模型不够聪明,后来才发现问题不完全在模型,而在它原来的记忆机制。
为什么总忘事?——根本原因剖析
这个“失忆”问题可以拆解成三个层面:
第一层:会话间记忆断裂。 每次对话开始,OpenClaw 几乎从零开始加载上下文。它会把记忆拆成七八个文件:SOUL.md 定义人格、IDENTITY.md 定义身份、USER.md 描述你是谁、AGENTS.md 写行为规则、MEMORY.md 存长期记忆,每次对话开始按顺序全部读一遍。这套机制听起来完善,但实际上:
强制记忆固化需手动执行。在每日结束前,你必须主动执行“记忆清理任务”,提取精华更新至 MEMORY.md,否则今天学到的东西明天就丢了。
日志膨胀导致输出质量下降。每日日志积累得快,不修剪的话智能体的上下文会膨胀,日志多到一定程度,输出质量急剧下降。
依赖 Agent“想起来去查” 。旧版记忆系统采用的是“tools 逻辑”——需要时再调用 memory_search 和 memory_get 去查,一旦没触发工具,这段记忆就等于不存在。
第二层:上下文压缩导致中途失忆。 对话太长时,OpenClaw 会触发 Context Compaction 压缩历史,但压缩过程中会丢失关键信息。例如,在长时间对话中,Agent 可能会忘记五到十分钟前提出的核心需求,或者系统为节省 token 粗暴地删减早期的对话记录,导致逻辑链条断裂。这就解释了为什么你培养了好一阵子、它已经学会的东西,过几天又忘了——不是模型变傻了,是上下文被压缩时把“训练成果”一起压没了。
第三层:会话关闭后一切归零。 关掉终端再打开,它对你的记忆几乎清零。这是因为每个会话都从一个全新的上下文窗口开始,关掉终端,它忘;上下文塞满,它也忘。所以每一次使用都像在“重新面试”它——告诉它你是谁、你要什么、你的偏好是什么,这个过程不断重复。
社区真实案例
有一位用户从年初开始玩 OpenClaw,Mac Mini 上 24 小时跑着,串了 Telegram、email、日历,想打造一个全能 AI 助理,一个多月后还是关掉了。他的原话是:“OpenClaw 说能记住你讲过的话,下次聊天自动带入。但用久了你会发现一件很智障的事:它还是会忘记你说过的话。”这正是你反复强调“忘事”的真实写照。
做长周期工作很费劲
长周期任务的失败率远高于单次任务,原因可以归结为几个层面:
第一,长周期任务完成率低。 原生 memory-core 模块在长程记忆管理上存在致命短板:记忆碎片化、检索低效,导致复杂长周期任务的完成率仅 35.65%。也就是说,你交给它一个需要多天、多步骤完成的任务,成功率不到四成。
第二,定时任务静默失败。 有用户发现定时任务连续三天没跑——每天早上的选题推送、运营候选、认证监控全部静悄悄消失了。后台的服务每五秒崩一次再起来,无限循环,但因为用户级服务表面正常运转,用户完全察觉不到。你可能设置了每日早报推送,它悄无声息地没发,你也不知道,直到你发现没收到,再去手动查才知道。
第三,token 成本不受控。 OpenClaw 每 30 分钟自动唤醒检查任务,每次检查都在花 API 的钱——读邮件花钱、查日历花钱,一件简单的事常常要连续调用好几次 AI 才搞定。有用户跑一个月账单超过 150 美元。长周期任务持续运行,意味着 token 持续消耗,任务失败时同样烧钱,且很难及时止损。
第四,升级导致系统“翻车”。 OpenClaw 迭代速度快,但激进的重构策略导致升级事故频发。例如,3 月下旬 OpenClaw 将插件生态从公共 npm 迁移到官方 ClawHub,大量用户反馈插件瘫痪、功能失效,微信 ClawBot 插件失效、Windows 沙箱权限错误等。长周期任务依赖的自动化流程,一旦被升级打断,恢复成本极高。
一句话总结
OpenClaw 是一个在单次、短周期任务上表现出色的数字助手,接入飞书后能极大提升日常琐事的处理效率。但它的“赛博健忘症”——反复忘事——是做长周期工作的最大障碍。短期好用,长期靠不住,这就是 OpenClaw 一个月的真实使用画像。
安全方面补充一句:以上所有体验都来自在服务器/空白电脑上的隔离部署。如果你也这么做,安全风险基本可以忽略;如果你想装在主力机上,请务必慎重。
夜雨聆风