AI安全工具:5月总结

2026 年 5 月发布的开源 AI 安全库，按 GitHub 星标排名，仅供参考

🧰 Claude-BugHunter

Claude Code 是一款用于授权漏洞研究的技能包，包含漏洞利用验证提示、攻击路径注释、缓解措施检查以及面向披露的 AI 编码代理行为测试。⭐️1,260 GitHub

一个可自托管的 AI SOC 工作流程，能够记录代理提示、工具调用、原理、检测步骤、授权上下文以及可重放的调查过程，供安全运营团队使用。⭐️1,049 GitHub

KVM 微型虚拟机沙箱运行时环境，适用于需要隔离执行、文件系统隔离、网络边界和凭证分离（而非广泛主机访问权限）的 AI 代理。⭐️906 GitHub

适用于授权审查工作流程的多阶段漏洞发现代理，其中证据、分类和可利用性分析需要分开进行。⭐️544 GitHub

基于文件的白盒安全审查工作空间，用于 AI 辅助漏洞分类、攻击路径审查、威胁模型检查点、缓解措施跟踪和人工审批。⭐️512 GitHub

一种从规范到清单的代理审计框架，用于将系统需求转化为可审查的安全检查、威胁模型任务、授权测试和缓解验证。⭐️419 GitHub

用于LLM安全性和快速注入评估运行的红队工具包，包括攻击路径测试、绕过测量、缓解措施比较和面向检测的报告。⭐️378 GitHub

适用于 Codex 风格 AI 编码代理工作流程的红队推理模式，提供对抗性审查、滥用案例测试、提示注入检查和威胁建模等提示。⭐️251 GitHub

一款基于人工智能的 Active Directory 红队框架，用于授权侦察、漏洞发现、攻击路径映射、凭证风险评估和操作员引导的测试。⭐️197 GitHub

一款支持 MCP 服务器和 CLI 的 OSINT 代理，用于授权安全研究、证据收集、凭证风险审查、调查工作流程、检测记录和工具边界测试。⭐️193 GitHub

面向 AI 代理的运行时监控和控制层，专注于可见性、授权决策、不安全工具操作和行为检测。⭐️112 GitHub

透明的 Claude API 代理，可在敏感数据离开本地环境之前对其进行匿名化处理，从而减少 AI 辅助工作流程中的凭证泄露和隐私泄露。⭐️39 GitHub

一款面向 VS Code 的安全工具，用于检测、分类和修复 AI 生成的 Python 代码中的漏洞，并提供围绕可利用性、缓解措施和部署风险的审查流程。⭐️37 GitHub

代理技能包扫描器，可在使用前检查风险指令、提示注入行为、不安全权限、工具授权、检测信号和缓解措施说明。⭐️32 GitHub

一个自主漏洞赏金框架，整合了 Claude Code、Burp MCP、凭证库、攻击路径发现、漏洞验证和缓解措施说明，供授权测试使用。⭐️22 GitHub

用于过滤恶意用户或工具输出内容、评估绕过行为以及在调用不安全代理工具之前进行检测的提示注入防护项目。⭐️17 GitHub