
4月1日,蚂蚁集团AI安全实验室与清华大学联手开源ClawAegis。这不是一个普通的补丁,而是一套专为OpenClaw类自主智能体打造的“原生安全免疫系统”。
在OpenClaw以惊人速度席卷开发者社区的同时,ClawAegis的出现,意在解决那个悬在所有人头顶的达摩克利斯之剑:当AI智能体拥有了操作系统的权限,谁来避免它沦为黑客的帮凶?
OpenClaw的爆火,让AI从“对话框”走进了“操作系统”。它能写代码、发邮件、操作文件,这种强大的的Agent能力背后,是一触即发的安全风险。传统的LLM安全只关注“输入输出”,但在OpenClaw的世界里,危险无处不在:Skill投毒能让智能体瞬间“黑化”,记忆污染能篡改其长期记忆,权限越界则可能导致核心文件被删或密钥被窃。从初始化、用户输入、模型推理、智能决策到最终的服务执行,这五个环节中的任何一个断裂,都可能导致整个系统的沦陷。

面对这种全生命周期的风险,传统的单点防御早已失效。ClawAegis的核心逻辑非常极客:它不再是被动的“守门员”,而是主动的“巡逻队”。这套架构创新性地构建了覆盖智能体全链路的纵深防御体系,像一个轻量级的内核模块,无缝嵌入OpenClaw的运行流中。它既能实时识别恶意指令注入和意图篡改,防止模型被“催眠”,也能在智能体准备执行敏感操作时动态介入,进行权限校验和行为审计,甚至针对死循环或资源滥用提供熔断机制,保障宿主机的稳定性。
ClawAegis的开源,最创新的地方在于它的“可配置性”。对安全研究人员和运维人员来说,它开放了高度灵活的风险识别策略,你可以像编写YAML配置一样,定义什么样的行为是“可疑”的,什么样的技能调用需要“拦截”。对于普通开发者,它则化身为透明的守护者,默默保护你的API Key、本地文件资产不被恶意Skill窃取。它让OpenClaw不再是一个难以捉摸的“黑盒”,而是一个可控、可追溯、可信赖的超级工具。
就在前几天,蚂蚁AI安全实验室协助修复了OpenClaw的多个高危漏洞。此次联合清华开源ClawAegis,标志着安全治理从“事后修补”走向了“事前防御”。在AI Agent即将接管数字工作的黎明,ClawAegis试图回答一个核心问题:我们如何信任一个比我们更高效的数字员工?答案或许就是:给它配上这套全链路的“免疫系统”。
目前,ClawAegis已在GitHub开源,欢迎各路极客前往“找茬”与共建。
点击
阅读原文
访问GitHub开源代码的地址。

夜雨聆风