乐于分享
好东西不私藏

工具 | AI 安全 — 蛇佬腔 P4RS3LT0NGV3 迭代记录

工具 | AI 安全 — 蛇佬腔 P4RS3LT0NGV3 迭代记录

一个以 vibe coding 方式缝合起来的文本变换 + AI 安全测试工具箱。159种文本变换,20 个工具,仍在持续打磨中。

项目地址: https://github.com/din4e/P4RS3LT0NGV


v0.2.5 — 打磨 + 文档

这个版本没加新工具,专注修 bug 和补文档:

  • • Emoji 隐写增强 — 载体扩展到 16 命名 + 6 分类(约 270 个 Emoji),高级选项支持位序/零宽字符选择器/插入频率控制
  • • 词素分析集成 — 接入 PromptCraft、AntiClassifier、Bijection 等多个工具
  • • 提供商分组 — 按 Local/Global/国内/国际版分组展示

v0.2.4 — 本地模型支持

多提供商架构重构 — 支持 Ollama / LMStudio 本地模型,不再强制依赖云端 API。安全测试可以完全在本地跑,数据不出机器。

其他: 新增 SignWriting (ISWA 2010) 书写符号分类、护栏测试报告导出(JSON/MD/HTML)、自定义语料导入(.txt/.csv)


v0.2.3 — 安全测试工具矩阵

一口气缝了六个 LLM 安全测试工具(https://github.com/cyberark/FuzzyAI),主要融合了业界已有思路:

  • • Guardrails 护栏测试 — 多类别安全边界测试,SVG 雷达图 + 颜色编码(绿/黄/红),支持导出 JSON/MD/HTML
  • • Benchmark 基准测试 — 标准化 ASR 测量 + 95% 置信区间
  • • MultiTurn 多轮攻击 — Manual/Crescendo / PAIR / Actor 四种策略
  • • Injection 注入检测 — 规则引擎(正则匹配)+ LLM 增强双模式
  • • Mutator 变异器链 — 可视化编排变异器流水线,本地变换和 LLM 变换混用
  • • Refinement 响应精炼 — 迭代施压跟进,合作度趋势图
部分条目有问题,测试预料也有点旧了。

v0.2.2 — 桌面端 + 新工具

从 Web 迁移到 Wails (Go + Next.js 15) 桌面应用,无边框窗口 + 自定义标题栏。

新增工具:

  • • Fuzzer 模糊测试 — 本地文本变异(零宽字符、同形字、Zalgo 等 7 种技术,最多 500 变体)+ LLM 自动化对抗测试(移植自 CyberArk FuzzyAI,16 种攻击技术 + 3 种分类器)
  • • CC-BOS 文言文越狱优化器 — 果蝇优化算法在 9 个维度上搜索最优文言文对抗提示词,三方打分(规范性/意图/绕过),使用大点的模型效果好点。
  • • Latin 词素分析 — 检测 Latin 词根敏感用语,后续被多个工具复用

v0.2.1 — CI/CD 基建

Tag 触发自动发布,构建流程稳定化。

基础功能转换,中文部分格式不支持,英文字符串几乎都没啥问题。

emoji隐写
解码器,削弱版 CyberChef

当前状态

工具基本能跑,但还需要充分测试,不少边界情况没有覆盖到。后续计划集中在稳定性和实际可用性上,而不是继续堆功能。缝合的工具已经过时,部分攻击手段已经失效。


#AISecurity #LLM #RedTeaming #Wails #OpenSource