获OpenClaw采纳!实测连斩17个0-day

获OpenClaw采纳！实测连斩17个0-day

👋 大家好，我是Hongbo，UCSB在读博士。今天和大家分享我们团队刚发表的论文《Semia: Auditing Agent Skills via Constraint-Guided Representation Synthesis》。

🚨 惊人实测战绩
我们开发了针对智能体技能（Agent Skill）的静态审计工具 Semia。实测公开市场的1.3万个真实技能发现：超过半数存在潜在语义安全漏洞！在人工抽检的541个样本中，我们更是连斩17个一直被正常使用的高危 0-day 漏洞。目前，顶级开源生态 OpenClaw 不仅全数确认修复，官方还直接将我们的底层安全检测逻辑整合到了官方静态扫描器中。

💡 给AI定规矩不能只靠自然语言
现在的Agent Skill多是一种混合产物：“一半代码，一半自然语言”。开发者企图用人类的日常语言给AI定规矩（例如写上一句：跨账户转账前，必须获得人类同意）。但这其实非常危险。攻击者只需在给大模型阅读的资料里塞入巧妙的“间接提示词注入”，大模型就会被扭曲认知，直接绕过防线把钱转走。在这个过程中，没有触发任何传统的代码漏洞，仅仅是因为AI按照攻击者的意愿重新解释了那句自然语言。

🛠️ Semia 的破局方案
传统静态扫描工具看不懂自然语言，而直接让大模型当裁判又极不稳定。Semia的破局思路是：不让大模型直接做裁判，而是让它做“翻译”。
1️⃣ 约束引导合成：设计闭环约束引擎，让大模型把自然语言规则“翻译”成严格的关系型事实库。如果出现幻觉，验证器会精准捕获并引导修正，直到结构完美且忠实原意。
2️⃣ 确定性分析：拿到严谨的结构图谱后，剩下的工作不再依赖大模型。我们直接运行确定性的路径可达性查询，精准抓取漏洞。

🏆 硬核评测数据
我们不仅抓出了“悄无声息把本地文件完整内容外传”和“在内存留后门”的真实致命插件；在专家标注的样本库中，Semia的 F1 分数更是高达 90.6%。相比之下，看不懂自然语言的传统工具 VirusTotal 仅找出了 13.6% 的漏洞。

💭 写在最后永远不要试图仅用一段自然语言去约束AI的危险行为！真正坚固的安全底线，必须“降维”沉淀为可被静态分析器严谨检验的结构化约束。想看这 17 个 0-day 完整报告的朋友，欢迎访问我的 GitHub（@archidoge0）。

原文链接：【实验室成果Vol.03】获OpenClaw官方采纳！1.3万个Skill超半数“带毒”，人工抽检连斩17个0-day！

#AI #skill #agent

名称已清空

微信扫一扫赞赏作者

喜欢作者其它金额

赞赏后展示我的头像

作品

暂无作品

喜欢作者

其它金额

最低赞赏 ¥0

其它金额

赞赏金额

最低赞赏 ¥0

收录于实验室成果

北京,4小时前,