
4 月 1 日,蚂蚁集团 AI 安全实验室与清华大学联手开源 ClawAegis。这不是一个普通的补丁,而是一套专为 OpenClaw 类自主智能体打造的“原生安全免疫系统”。
在 OpenClaw 以惊人速度席卷开发者社区的同时,ClawAegis 的出现,意在解决那个悬在所有人头顶的达摩克利斯之剑:当 AI 智能体拥有了操作系统的权限,谁来避免它沦为黑客的帮凶?
OpenClaw 的爆火,让 A I从“对话框”走进了“操作系统”。它能写代码、发邮件、操作文件,这种强大的的 Agent 能力背后,是一触即发的安全风险。传统的 LLM 安全只关注“输入输出”,但在 OpenClaw 的世界里,危险无处不在:Skill 投毒能让智能体瞬间“黑化”,记忆污染能篡改其长期记忆,权限越界则可能导致核心文件被删或密钥被窃。从初始化、用户输入、模型推理、智能决策到最终的服务执行,这五个环节中的任何一个断裂,都可能导致整个系统的沦陷。

面对这种全生命周期的风险,传统的单点防御早已失效。ClawAegis 的核心逻辑非常极客:它不再是被动的“守门员”,而是主动的“巡逻队”。这套架构创新性地构建了覆盖智能体全链路的纵深防御体系,像一个轻量级的内核模块,无缝嵌入 OpenClaw 的运行流中。它既能实时识别恶意指令注入和意图篡改,防止模型被“催眠”,也能在智能体准备执行敏感操作时动态介入,进行权限校验和行为审计,甚至针对死循环或资源滥用提供熔断机制,保障宿主机的稳定性。
ClawAegis 的开源,最创新的地方在于它的“可配置性”。对安全研究人员和运维人员来说,它开放了高度灵活的风险识别策略,你可以像编写YAML配置一样,定义什么样的行为是“可疑”的,什么样的技能调用需要“拦截”。对于普通开发者,它则化身为透明的守护者,默默保护你的 API Key、本地文件资产不被恶意Skill窃取。它让 OpenClaw 不再是一个难以捉摸的“黑盒”,而是一个可控、可追溯、可信赖的超级工具。
就在前几天,蚂蚁 AI 安全实验室协助修复了 OpenClaw 的多个高危漏洞。此次联合清华开源 ClawAegis,标志着安全治理从“事后修补”走向了“事前防御”。在 AI Agent 即将接管数字工作的黎明,ClawAegis 试图回答一个核心问题:我们如何信任一个比我们更高效的数字员工?答案或许就是:给它配上这套全链路的“免疫系统”。
目前,ClawAegis 已在 GitHub 开源,欢迎社区与我们共建。
点击【阅读原文】,访问 ClawAegis
夜雨聆风