乐于分享
好东西不私藏

OpenClaw 权限安全清单:哪些动作不能让 Agent 自动做?

OpenClaw 权限安全清单:哪些动作不能让 Agent 自动做?

这篇文章面向搜索 OpenClaw 权限安全、AI Agent 自动化权限、个人自动化助手风控清单的读者。很多人第一次用 Agent 会先改 prompt,但真正能长期跑起来的系统,靠的是工作流、权限、日志、验收和复盘。

1. 问题场景

一个人做内容、研究、数据和自动化时,最容易出现的问题不是“模型不会写”,而是 Agent 在错误时间做了错误动作:误删文件、误发外部消息、把未核验信息写进公开稿,或者在没有人工确认的情况下执行高风险操作。

所以 OpenClaw 这类长期在线的个人自动化助手,必须先划清权限边界。能自动做的,尽量自动;会影响外部世界、资金、账号、安全和隐私的动作,必须人工确认。

2. 必须人工确认的动作

以下动作不应该让 Agent 默认自动执行:

1. 正式发布公众号、微博、邮件群发、Discord 公告等公开外发。

2. 删除、覆盖、清空、迁移大量文件,尤其是不可恢复动作。

3. 真实资金相关动作:下单、转账、充值、提现、绑定银行卡。

4. 修改账号安全配置:密码、密钥、白名单、权限角色、登录设备。

5. 对第三方平台联系人发消息,尤其是代表用户表态或承诺。

6. 暴露内网地址、密钥、Cookie、浏览器登录态、私人聊天记录。

7. 关闭安全检查、绕过验证码、规避平台风控或审计。

这些动作不是不能做,而是要进入“准备—复核—人工确认—执行—留痕”的流程。

3. 可以自动做的动作

适合自动化的动作通常有三个特征:可回滚、内部可见、不会直接影响外部世界。

例如:读取公开资料、整理笔记、生成草稿、跑 lint/gate、做 dry-run、写本地日志、更新非敏感模板、把候选结果放进待审核队列。

这些动作可以提高效率,但也要保留输入、输出和失败原因,方便事后复盘。

4. 权限分层建议

我建议把 OpenClaw 权限分成四层:

1. 只读层:读取文件、网页、公开资料、历史日志。

2. 本地写入层:生成草稿、报告、结构化 JSON、备份文件。

3. 外部准备层:创建草稿箱、生成待发送内容、做 dry-run。

4. 外部执行层:发布、发送、删除、交易、转账、改安全配置。

前三层可以在明确规则下自动化;第四层必须要求人工确认。

5. 发布前检查清单

 这次动作会不会影响外部世界?

 失败后能不能回滚?

 有没有备份?

 是否涉及真实资金、账号安全或隐私?

 是否已经 dry-run?

 是否留下日志和记录文件?

 是否需要用户显式确认?

6. 我的经验

真正可靠的 Agent 不是“什么都敢自动做”,而是知道什么时候该停下来等人确认。权限边界不是降低智能,而是让智能可以长期运行。

后续我会继续精读 RAG、搜索、Agent 与大模型工程化相关论文/框架。如果你关心“论文里的方法到底怎么落到工程系统里”,欢迎关注 Alten观AI,也欢迎在评论区聊聊你遇到过的 RAG 难题。