乐于分享
好东西不私藏

获OpenClaw采纳!实测连斩17个0-day

获OpenClaw采纳!实测连斩17个0-day

获OpenClaw采纳!实测连斩17个0-day

👋 大家好,我是Hongbo,UCSB在读博士。今天和大家分享我们团队刚发表的论文《Semia: Auditing Agent Skills via Constraint-Guided Representation Synthesis》。

🚨 惊人实测战绩
我们开发了针对智能体技能(Agent Skill)的静态审计工具 Semia。实测公开市场的1.3万个真实技能发现:超过半数存在潜在语义安全漏洞! 在人工抽检的541个样本中,我们更是连斩17个一直被正常使用的高危 0-day 漏洞。目前,顶级开源生态 OpenClaw 不仅全数确认修复,官方还直接将我们的底层安全检测逻辑整合到了官方静态扫描器中。

💡 给AI定规矩不能只靠自然语言
现在的Agent Skill多是一种混合产物:“一半代码,一半自然语言”。开发者企图用人类的日常语言给AI定规矩(例如写上一句:跨账户转账前,必须获得人类同意)。 但这其实非常危险。攻击者只需在给大模型阅读的资料里塞入巧妙的“间接提示词注入”,大模型就会被扭曲认知,直接绕过防线把钱转走。在这个过程中,没有触发任何传统的代码漏洞,仅仅是因为AI按照攻击者的意愿重新解释了那句自然语言。

🛠️ Semia 的破局方案
传统静态扫描工具看不懂自然语言,而直接让大模型当裁判又极不稳定。Semia的破局思路是:不让大模型直接做裁判,而是让它做“翻译”。
1️⃣ 约束引导合成:设计闭环约束引擎,让大模型把自然语言规则“翻译”成严格的关系型事实库。如果出现幻觉,验证器会精准捕获并引导修正,直到结构完美且忠实原意。
2️⃣ 确定性分析:拿到严谨的结构图谱后,剩下的工作不再依赖大模型。我们直接运行确定性的路径可达性查询,精准抓取漏洞。

🏆 硬核评测数据
我们不仅抓出了“悄无声息把本地文件完整内容外传”和“在内存留后门”的真实致命插件;在专家标注的样本库中,Semia的 F1 分数更是高达 90.6%。相比之下,看不懂自然语言的传统工具 VirusTotal 仅找出了 13.6% 的漏洞。

💭 写在最后 永远不要试图仅用一段自然语言去约束AI的危险行为!真正坚固的安全底线,必须“降维”沉淀为可被静态分析器严谨检验的结构化约束。想看这 17 个 0-day 完整报告的朋友,欢迎访问我的 GitHub(@archidoge0)。

原文链接:【实验室成果Vol.03】获OpenClaw官方采纳!1.3万个Skill超半数“带毒”,人工抽检连斩17个0-day!

#AI #skill #agent

名称已清空
微信扫一扫赞赏作者

喜欢作者其它金额
作品
暂无作品
喜欢作者
其它金额
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
收录于实验室成果
北京,4小时前,